谁在记住你:Hermes、OpenClaw、Claude Code 等主流智能体的记忆架构深度横评
2026 年的 AI 智能体赛道已经走过了"谁能调用工具"的初赛阶段。Hermes Agent(Nous Research,150k stars)把封闭学习回路做成了开源 agent 的标志性功能;OpenClaw(Peter Steinberger,371k stars)用 20+ 消息平台网关拿到了当前最大的开源智能体用户基数;Claude Code(Anthropic,123k stars)以绑定自家模型的编程工具身份卡住了 IDE 赛道的头部位置;Crush(Charmbracelet,24k stars)在模型无关的编程智能体方向建立了自己的生态位。需要区分的是,它承接的是早期已归档的 opencode-ai/opencode 代码线,并不是当前 opencode.ai / anomalyco/opencode 这一活跃 OpenCode 项目的继任者。 这几类方案在功能清单上有大量重叠——都能读写文件、执行命令、调用外部工具。但把视角从功能清单转向记忆架构,差异立刻变得不可调和:有的方案每次会话结束就失忆,有的靠用户手写配置文件维持上下文,有的让 ...
当任务里藏着一个巨大的搜索子问题——RLMs、LLM Wiki、RAG 的降本提精路线图
很多看起来是「推理任务」的 LLM 工作,其实骨子里是搜索任务。问一份 10M token 的代码库里某个 bug 何时引入,问一份万字 PDF 的第 17 页和第 184 页的数字是否一致,问一段"最近三个月里所有和 Symphony 架构有关的 commit 和 blog"——这些题目的共同点是,答案必须从一个远超模型上下文窗口的语料里找出来,推理只是最后一公里,前面 99% 的距离是检索。 这篇文章围绕一个具体问题展开:当任务里藏着一个巨大的搜索子问题,当前 LLM 社区在「降低搜索成本」和「提高搜索精度」两条线上各自走到了哪一步? 选取三个互相咬合的锚点:递归语言模型(Recursive Language Models, RLMs)、LLM Wiki 范式、以及 RAG 家族自身在 2024–2026 年的演进。三者并列,不是因为它们属于同一层,而是因为它们从三个不同的抽象层次攻击同一个搜索成本问题。 一张图先把坐标系摆好 一个 LLM 应用要处理超出单次上下文窗口的知识,历史上只有四条路: 参数化记忆:把知识预训练或微调进模型权重里。代价是更新贵、...
Superpowers 的 skill 体系:规则引擎、流程编排与纪律约束
Superpowers 的 skill 体系:规则引擎、流程编排与纪律约束 Superpowers 是 Jesse Vincent 为各类 coding agent(Claude Code、Codex、Cursor、Gemini CLI 等)开发的一套方法论插件。它不是一组工具,也不是一个框架,而是一套通过 skill 组合出来的软件工程流程。 初次翻阅 README.md 会产生一个直觉:using-superpowers 看起来像所有 skill 的入口,是不是应该由它渐进式地调度其余 skill?深入读完全部 skill 文档后,这个直觉只说对了一半。 一个更根本的问题是:skill 到底是什么?从文件系统看,每个 skill 就是一个目录,目录里有一份 SKILL.md,最多再带几个 reference 或工具脚本。从运行时看,skill 是一段被 agent 按需加载进上下文的 prompt。但这都不是重点。Superpowers 在 AGENTS.md 里用了一个更准确的说法——skill 是 behavior-shaping content,它是写给 agent 看...
OpenAI Symphony 深度研究,一次从「监督 Agent」到「管理工作」的编排改造
2026 年 3 月初,OpenAI 在 GitHub 上公开了 openai/symphony 仓库。这个仓库很容易被误读成「一份 SPEC 加一点示例代码」,因为根目录 README 把第一个选项写成了「让你喜欢的 coding agent 按 SPEC.md 自己实现一版」。但真正打开目录看,仓库里有三块东西:根目录的 SPEC.md,一套可以构建和运行的 elixir/ 参考实现,以及 .codex/、.github/media/ 这类围绕 Codex workflow、演示视频和工程素材组织起来的配套内容。elixir/README.md 里的启动命令不是伪代码,而是完整的本地构建链路:mise exec -- mix setup、mise exec -- mix build,最后用 ./bin/symphony ./WORKFLOW.md 启动服务 [Symphony Elixir README]。 所以 Symphony 首先不是一篇规范文档,而是一个被拆成两层发布的工程项目:SPEC.md 说明什么叫 Symphony,elixir/ 证明这套东西能作为一个长驻服...
Warp:从终端到 ADE 的五年深研
2026 年 4 月 28 日,Warp 把客户端源码扔到了 GitHub 上,AGPL 许可,OpenAI 作为 founding sponsor,配套的云端 agent 编排平台 Oz 由 GPT 系列模型驱动。这家公司累计公开融资约 $73M,接近 100 万活跃开发者,在 SWE-bench Verified 和 Terminal-Bench 上挤进过前列,现在把"怎么造自己"这件事交给社区和 agent 一起做。 开源是一个分水岭事件,但理解这件事的意义需要往前拉。Warp 这条产品线已经走了五年,从 2020 年一个 Rust + GPU 渲染的 macOS 终端开始,一步步变成今天的 Agentic Development Environment(ADE)——包含终端、原生代码编辑、多 agent 协同、云端编排。要看懂 2025-2026 年这个窗口爆出来的所有动作,得从它 2020 年的起点开始看。 下面是一次完整的横纵深研:纵向追 Warp 从 2020 到现在的发展线,横向对齐 Cursor / Claude Code / Windsur...
印度民主深度研究,一个七十八岁的「不可能」还在运行
中文网络上流传着一个说法,流传得相当广。每到印度大选季,总有人言之凿凿地说,那边光是因为选举暴力死的人,就有两万之数。 这个数字要是真的,就意味着在一个十四亿人口的国度,一次选举会在六个星期里、几百个选区中抬出两万具尸首。那已经不是什么「民主失灵」,是一场半内战。这种规模的死亡,但凡是真的,便不该是中文互联网角落里的谈资,而该是路透、BBC、半岛每一天头版的血色头条。 但把 V-Dem、Freedom House、ACLED、印度选举委员会(ECI)、印度内政部、ADR 这几家机构自 1984 年以来历次大选的数据一家一家对齐着看一遍,在任何一份一手来源里都找不到「两万」这个数字的出处。 这个说法有意思的地方,就在它错得并不彻底。它把数量级夸大了五十倍到一千倍,错得离谱;可它想指的那件事本身,却并非空穴来风。印度民主确确实实生着病,而且病灶触目惊心——只是病不长在「大选死人」这桩看得见的伤口上,病长在更深的地方,长在骨头缝里,长在肌理中间,寻常人一眼看不见,掀开皮来才知道疼得厉害。 下面这篇长文先从头到尾把印度民主这套东西梳一遍,看它是怎么在一片文盲率极高、种姓四裂、十几种语言、...
从 Skill 到 Skills 2.0:Anthropic 这半年怎么把 Agent Skills 做进软件工程
为什么需要 Skills 用 Claude Code 或者 Cursor 写一段时间代码,总会碰到同一种场景:模型通用能力很强,但一旦要求按公司内部流程办事,比如按团队的 commit 规范写一条 commit message、按固定模板出一份项目周报、按财务系统的字段填一份报销单,它立刻变回一个刚入职三天的实习生——不会写倒不是主要问题,它只是不知道这边是怎么干这件事的。 Anthropic 2025 年 10 月开始填这个坑,做出来的东西叫 Agent Skills。 时间线 2025 年 10 月 16 日:Skills 诞生 Anthropic 工程博客发了《Equipping agents for the real world with Agent Skills》,署名 Barry Zhang、Keith Lazuka、Mahesh Murag,文末缀了一句 “who all really like folders”。 文章对 Skill 的定义很朴素:一个 Skill 就是一个文件夹,里面有一个 SKILL.md,外加可选的脚本、参考文档和资源文件。SKILL.md ...
Karpathy 视角下的 LLM 编码缺陷:四条行为准则的深度解析
LLM 编码的自作主张 长期用 Claude Code、Cursor、Copilot 写代码的人大概都熟悉一种感觉:模型并不是不会写,而是写得太多、太聪明、太自作主张。让它修一个 bug,它顺手把无关代码风格也改了;让它加一个简单功能,它给你抽象出三层接口和一套配置系统;让它重构 X,它没问清楚 X 的边界就开始动手。 Andrej Karpathy 在 X 上发过一段对这类问题的精炼归纳,forrestchang 把它整理成了一个 GitHub 仓库 andrej-karpathy-skills,提供一份 60 多行的 CLAUDE.md,外加 Claude Code Plugin 的安装方式。这个仓库的内容可以同时用于 Claude Code、Cursor 以及任何支持 CLAUDE.md 形态的 LLM 编码工具。 这篇文章想讨论三件事:Karpathy 到底诊断出了哪四个偏差、对应的四条行为准则怎么用、以及一个更实际的问题——这套准则到底应该装成 skill 还是直接写进 CLAUDE.md。 Karpathy 观察到的四个系统性偏差 仓库 README 引用了 Karp...
共和党还剩几个派系?——MAGA、Freedom Caucus 与特朗普的党内权力
一个流行的说法是:共和党已经不是原来那个共和党了,它是"MAGA 党"。 这个说法一半对、一半不对。从 2016 年到 2025 年,共和党在党纲、人事、候选人提名、外交立场上都被特朗普翻了个底朝天,2024 年党代会通过的新党纲整篇读下来像是他本人的竞选演讲。但共和党并没有"合并"成一个 MAGA 整体,它内部的派系其实比民主党还多、还乱。特朗普不是消灭了派系,而是压过了派系,所有派系都必须围绕他重新定义自己的位置。 几个绕不开的问题:共和党现在到底有哪些派系?"MAGA 党"这个说法成立到哪一步?特朗普对党的控制力深到什么程度?那个动不动就上新闻的 Freedom Caucus(自由连线/自由党团)到底是干什么的? 一、先搞清一个常识:美国国会的"党"不是铁板一块 和很多东亚国家的政党不同,美国两党都没有党中央、没有党纪处分,也没有"开除党籍"这回事。国会山上真正在运作的不是"党",而是一堆自愿组成的党团(caucus)。一个议员同时加入三四个 caucu...
美国警察暴力与大规模监禁深度调查
每当 George Floyd、Tyre Nichols 这样的名字登上头条,一个老问题就会被重新提起:美国警察每年到底打死多少人?其中多少死于枪杀? 这个问题听起来应该有标准答案。美国是世界上数据最透明的国家之一,但联邦政府长期拿不出一份准确的官方数字。真正可靠的数据来自《华盛顿邮报》、《卫报》和一群志愿者搭起来的民间数据库,它们与 CDC 官方统计之间的鸿沟,是这个国家在公共安全治理上最尴尬的一道伤口。 本文用多个独立来源交叉核对,回答两个核心问题:一年死多少?多少死于枪?顺带解释,为什么这个看似简单的数字,在美国是一道几十年没解决的统计难题。 讨论警察暴力绕不开它的另一头——监狱。前端是警察在街头打死公民,后端是国家把公民关到老,两件事共享同一套刑事司法系统、同一套政治激励。所以本文分成两部分:前七节谈警察致死,后九节谈大规模监禁。只写一半,就永远只看到了半张脸。 第一部分 · 警察暴力 一、每年约 1,300 人死于警察之手 根据 Mapping Police Violence(MPV,由 Campaign Zero 维护)的 《2024 Police Violence...
