AI 读书笔记
Qoder Quest 1.0:把执行交给 AI,把选择留给人类
核心理念:人类“品味”是人机协作的终极壁垒
- “品味” ≠ 审美,而是决策力:在众多可行方案中判断“哪个是对的选择”,尤其体现为“选择不做”(如舍弃文件树导航,拒绝向下兼容)。
- AI 擅长执行与优化,但缺乏责任意识与经验直觉;人类凭借踩坑记忆、业务理解与后果承担能力,守住质量、边界与必要性底线。
- “品味”是未来人类区别于 AI 的核心差异,也是 AI Coding 中 human-in-the-loop 不可替代的价值。
Quest 1.0 的关键升级:为 SOTA 而生,专注“自主编程”
- 架构定位:专为当前最优(SOTA)大模型(如 Opus/Codex/Gemini)深度优化,不兼容旧模型、不提供模型切换选项,追求 Token 效率与产物质量极致。
- 交互范式革新:
- ✅ 舍弃代码导航 → 转向“阅读意图”(Spec/测试/结果),代码降级为“中间产物”;
- ✅ 对话窗口为主视图 → 降低非专业开发者门槛,同时打破研发者技术栈认知边界(如后端工程师无需懂前端即可驱动前端开发)。
模式对比:Quest(自主编程) vs Editor(协同编程)
更高级的模式是视角更上移的模式。人的注意力是有限的,更关注结果,结果更大-总成本和产出更大;更关注细节,则质量更好。
| 维度 | Quest 模式 | Editor 模式 |
|---|---|---|
| 角色定位 | 架构师(关注 Spec、交付、问题抽象) | 导师(提需求、审代码、微调) |
| 介入程度 | 少干预、AI 自主完成端到端任务 | 高频人机协同、逐步确认与修正 |
| 适用场景 | 新项目、AI 原生技术栈、高效率交付 | 存量生产项目、小范围确定性改动 |
实践突破:Skill 驱动的 DevOps 自动化闭环
以 AI 网关压测项目 为例,展示 Quest 如何超越“写代码”:
- ✅ 自然语言驱动全链路:Spec → 编码 → Docker 构建 → Helm 部署 → K8s 任务下发 → 压测执行 → 报告生成;
- ✅ Skill 是关键使能器:通过预置 k8s-benchmark skill,让 Qoder 感知集群、操作资源、读取日志、自动回滚,实现“无人干预的任务闭环”;
- ✅ 本质是构建反馈回路:AI 写代码 → 自动部署 → 运行验证 → 结果驱动修正,人类仅在“结果不符预期”时介入——从“手工匠人”升级为“流水线设计师”
深层反思:AI 时代的“认知债务”与开发者进化
- 警惕“AI 代劳导致的能力退化”:不手写 SQL → 不懂索引;不写并发 → 不解死锁;
- 提出务实建议:定期关闭 AI,手写关键代码,保持对底层机制的敏感度与接管能力;
- 最终回归初心:Qoder Quest 不是取代开发者,而是放大人类独有的“品味”——在 AI的无限可能性中,坚定划出那条“值得做”的边界。
Claude 智能体生态系统:技能、提示词、项目、MCP 与子代理的协同之道
核心理念:五个组件,一个目标
Claude 的智能体生态系统由 技能 (Skills)、提示词 (Prompts)、项目 (Projects)、子代理 (Sub-agents)、MCP 五个组件构成。它们各有定位,但目标一致:让 AI 在正确的时间做正确的事,让人类专注于不可替代的决策。
五元对比:何时选用什么?
| 组件 | 本质 | 核心作用 | 持久性 | 典型场景 |
|---|---|---|---|---|
| 技能 | 专业知识手册 | 教 Claude “怎么做” | 跨对话复用 | 品牌规范、代码审查标准、数据分析方法 |
| 提示词 | 即时指令 | 告诉 Claude “做什么” | 单次对话有效 | “总结一下”“优化这段文字”“检查安全问题” |
| 项目 | 独立工作空间 | 提供背景知识库 | 项目内始终可用 | Q4 产品发布、竞品研究、长期追踪的任务 |
| 子代理 | 专门 AI 助手 | 独立处理特定任务 | 跨会话存在 | 代码审查、安全审计、市场研究(带工具限制) |
| MCP | 通用连接器 | 打通外部数据/工具 | 持续连接 | Google Drive、GitHub、数据库、Slack |
关键决策原则
✅ 使用技能时
需要可复用的专业知识——当同一个指令在多个对话中重复出现,就该固化为技能。
例如:“按 OWASP 标准审查安全漏洞”“使用我们的品牌色和排版规则”
✅ 使用提示词时
一次性、对话式、即时性的需求——快速响应,无需沉淀。
例如:“让语气更专业”“格式化为表格”
✅ 使用项目时
需要持久上下文的长期工作——上传文档、设置自定义指令,成为该主题的知识基座。
例如:上传竞品资料、市场报告,每次对话自动继承
✅ 使用子代理时
需要独立执行+权限隔离——让专门的"数字员工"处理敏感或专注的任务。
例如:只读权限的代码审查代理、并行处理的技术分析代理
✅ 使用 MCP 时
需要连接外部系统——打破 AI 的信息孤岛,接入实时数据源。
例如:读取公司 Drive 的最新文档、查询生产数据库、操作 GitHub
组合威力:研究智能体的完整工作流
1 | |
人类的角色:设定研究方向、审视最终结论、在结果偏离预期时纠偏。
常见误区澄清
| 误区 | 正解 |
|---|---|
| ❌ 技能 vs 子代理二选一 | ✅ 互补关系——子代理可以加载技能获得专业知识 |
| ❌ 项目 vs 技能重复建设 | ✅ 分工明确——项目说"你需要知道这些",技能说"你要这样做" |
| ❌ MCP 替代技能 | ✅ 前后衔接——MCP 负责"连得上",技能负责"做得好" |
| ❌ 所有场景都用人机协同 | ✅ 模式分层——Quest 模式交给 AI 端到端,Editor 模式高频确认 |
深层启示:构建个人 AI 工位的方法论
- 从提示词开始,向技能沉淀——重复三次以上的指令,立即技能化
- 项目作为知识中枢——按主题组织,避免每次对话重新投喂上下文
- 子代理实现权责分离——危险操作限定只读,复杂任务拆分到专职代理
- MCP 打通数据闭环——减少人工搬运,让 AI 直接操作一手信息源
- 保留"无 AI 时间"——定期手写核心代码,防止认知债务累积
最终洞察:AI 生态的成熟标志,不是单个组件的强大,而是组合的优雅——像搭积木一样,根据任务复杂度灵活组装,让人类的"品味"始终处于决策中心。
RAG 架构图解:检索增强生成的标准流程
基础 RAG 流程
flowchart LR
subgraph Indexing["索引阶段"]
D[Documents] -->|Embedding| VS[(Vectorstore)]
VS -.->|HNSW| VS
end
subgraph Retrieval["检索阶段"]
Q[Question] -->|Embedding| QV[Query Vector]
QV -->|相似度搜索| VS
VS -->|Top-K| RD[Relevant Docs]
end
subgraph Generation["生成阶段"]
RD --> CTX{Context}
Q --> CTX
CTX -->|PromptTemplate| PV[PromptValue]
PV --> LLM[LLM]
LLM --> CM[ChatMessage]
CM --> P[Parser]
P --> A[Answer]
end
style Indexing fill:#e1f5fe
style Retrieval fill:#fff3e0
style Generation fill:#e8f5e9
RAG 全景架构(State of the Art)
flowchart TB
Q[Question] --> QT
Q --> R
Q --> QC
subgraph QT["🔴 Query Translation<br/>查询翻译"]
QT1["Multi-query / RAG-Fusion<br/>多查询扩展"]
QT2["Decomposition / Step-back<br/>问题分解与回退"]
QT3["HyDE<br/>假设文档嵌入"]
QT1 --- QT2 --- QT3
end
subgraph R["🟠 Routing<br/>路由"]
R1["Logical Routing<br/>LLM 根据问题选择数据源"]
R2["Semantic Routing<br/>Embed 后按相似度选 Prompt"]
R1 --- R2
end
subgraph QC["🟡 Query Construction<br/>查询构造"]
QC1["Text-to-SQL<br/>关系型数据库"]
QC2["Text-to-Cypher<br/>图数据库"]
QC3["Self-query Retriever<br/>向量库元数据过滤"]
QC1 --- QC2 --- QC3
end
QT --> DS
R --> DS
QC --> DS
subgraph DS["数据源"]
DS1[(Graph DB)]
DS2[(Relational DB)]
DS3[(Vectorstore)]
end
subgraph IDX["🟤 Indexing<br/>索引"]
IDX1["Chunk Optimization<br/>Semantic Splitter"]
IDX2["Multi-representation<br/>Parent Document / Dense X"]
IDX3["Specialized Embeddings<br/>Fine-tuning / ColBERT"]
IDX4["Hierarchical Indexing<br/>RAPTOR 树状摘要"]
IDX1 --- IDX2 --- IDX3 --- IDX4
end
IDX -.->|离线构建| DS
DS --> DOCS[Documents]
subgraph RET["🟢 Retrieval<br/>检索后处理"]
RET1["Ranking<br/>Re-Rank / RankGPT / RAG-Fusion"]
RET2["Refinement<br/>CRAG 压缩过滤"]
RET3["Active Retrieval<br/>检索不相关时重新检索"]
RET1 --- RET2 --- RET3
end
DOCS --> RET
RET --> GEN_LLM[LLM]
GEN_LLM --> ANS[Answer]
subgraph GEN["🟣 Generation<br/>生成优化"]
GEN1["Active Retrieval<br/>Self-RAG / RRR"]
GEN2["根据生成质量<br/>决定是否重写问题或重新检索"]
GEN1 --- GEN2
end
ANS -.->|质量不佳时回退| GEN
GEN -.->|重写/重检索| QT
style QT fill:#ffcdd2
style R fill:#ffe0b2
style QC fill:#fff9c4
style IDX fill:#d7ccc8
style DS fill:#f5f5f5
style RET fill:#c8e6c9
style GEN fill:#e1bee7
七大模块解读
| 模块 | 核心思想 | 代表技术 |
|---|---|---|
| 🔴 Query Translation | 将用户问题改写为更适合检索的形式 | Multi-query、RAG-Fusion、HyDE、Decomposition、Step-back |
| 🟠 Routing | 根据问题特征选择最佳数据源或 Prompt | Logical Routing(LLM 决策)、Semantic Routing(嵌入相似度) |
| 🟡 Query Construction | 将自然语言转为结构化查询 | Text-to-SQL、Text-to-Cypher、Self-query Retriever |
| 🟤 Indexing | 优化文档的切分、表示与索引方式 | Semantic Splitter、Parent Document、ColBERT、RAPTOR |
| 🟢 Retrieval | 对检索结果进行排序、过滤、补充 | Re-Rank、RankGPT、CRAG、Active Retrieval |
| 🟣 Generation | 根据生成质量决定是否回退重试 | Self-RAG、RRR(Rewrite-Retrieve-Read) |
| ⚪ 主流程 | Question → 数据源 → Documents → LLM → Answer | 端到端 RAG Pipeline |
All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.

