欧尔班败选与世界大国态度
背景 2026年4月12日,匈牙利总理欧尔班在议会选举中败给了反对党Tisza党领袖Péter Magyar,结束了自2010年以来长达16年的执政。Magyar在新一届国会199席中斩获约135-138席,欧尔班当天承认败选。 这场选举超出了匈牙利一国的范畴。欧尔班长期以欧盟内部的"异类"自居,在移民、对俄制裁、对华关系、民主制度等议题上与布鲁塞尔屡屡冲突,同时与特朗普、内塔尼亚胡等全球右翼领导人建立了紧密个人纽带。他的下台,搅动了多方势力的神经,各方反应构成了观察当前国际格局的一面棱镜。 特朗普:从高调背书到冷淡切割 特朗普是欧尔班选前最重量级的外部背书人,整个背书行动分为四波推进: 2026年2月5-6日,特朗普首次在社交媒体上为欧尔班站台,称其为"真正强大有力的领导者(a truly strong and powerful Leader)"。3月23-24日,他在布达佩斯CPAC会议上发表视频讲话,当众确认背书。3月24日,又在Truth Social发表正式声明: “Election Day is Sunday, April ...
《地下》——一场没有人愿意醒来的婚礼
Mesečina, mesečina, 月光啊月光,你怎么把我的花园照得这么乱? ——《地下》主题曲 Mesečina,Goran Bregović 曲 《地下》(Underground,1995)是那种片尾曲放完以后座位上站不起来的电影。它不是让人"沉浸"进去的——它是一场把人硬拖进去的婚礼,吉普赛铜管吹得震天响,新娘子哭,公鸡叫,小孩撞翻桌子,几杯酒下肚还没搞清楚到底是谁娶谁,就被推到地下室里去了,然后二十年没人告诉地下室里的人,仗其实早打完了。 这就是库斯图里卡。说他是"导演"实在是过誉了——他更像一个收不住场的乐队领班。这人后来果然正儿八经改行去做音乐,组了一支叫 No Smoking Orchestra 的乐队到处巡演,这事一点都不意外:他从拍《地下》开始就已经对电影失了兴趣,电影无非是搭台的借口,真正想吹的是那支破喇叭。 唉,要讲这部电影,总得先讲讲它的"外壳"——虽然在这种片子里,所谓的"剧情"最后都是要被撕掉的——《地下》的故事大概是这么个事:1941 年贝尔格莱德被德军轰炸那一...
Hermes 方案深度研究:一种面向长程自主智能体的编排与 Harness 架构
2026 年 2 月 25 日,Nous Research 在 GitHub 上开源了 NousResearch/hermes-agent,MIT 协议,定位是「a self-improving AI agent」。两个月后,仓库从不到 5,000 stars 一路推到 126k 左右,增速超过了过去两年多数开源 agent 项目;v0.11.0(2026-04-23)的发布说明在一个版本跨度里塞进了 1,556 commits、761 个 merged PR、29 位核心贡献者 [NousResearch/hermes-agent GitHub Releases]。在这个开源 agent 工具普遍把热度变现为 SaaS 的阶段,Hermes 选择了一条反向道路:把自己设计成一个运行在用户自己服务器上的长期驻留 agent,它的核心卖点不是对话质量,而是在时间维度上持续积累能力——从每次任务里蒸馏出 skill,自己维护记忆,跨平台、跨会话保持同一个"自己"。 与此同时,Anthropic 在 2024 年 12 月至 2026 年 3 月之间陆续发布了四篇 ...
当任务里藏着一个巨大的搜索子问题——RLMs、LLM Wiki、RAG 的降本提精路线图
很多看起来是「推理任务」的 LLM 工作,其实骨子里是搜索任务。问一份 10M token 的代码库里某个 bug 何时引入,问一份万字 PDF 的第 17 页和第 184 页的数字是否一致,问一段"最近三个月里所有和 Symphony 架构有关的 commit 和 blog"——这些题目的共同点是,答案必须从一个远超模型上下文窗口的语料里找出来,推理只是最后一公里,前面 99% 的距离是检索。 这篇文章围绕一个具体问题展开:当任务里藏着一个巨大的搜索子问题,当前 LLM 社区在「降低搜索成本」和「提高搜索精度」两条线上各自走到了哪一步? 选取三个互相咬合的锚点:递归语言模型(Recursive Language Models, RLMs)、LLM Wiki 范式、以及 RAG 家族自身在 2024–2026 年的演进。三者并列,不是因为它们属于同一层,而是因为它们从三个不同的抽象层次攻击同一个搜索成本问题。 一张图先把坐标系摆好 一个 LLM 应用要处理超出单次上下文窗口的知识,历史上只有四条路: 参数化记忆:把知识预训练或微调进模型权重里。代价是更新贵、...
Superpowers 的 skill 体系:规则引擎、流程编排与纪律约束
Superpowers 的 skill 体系:规则引擎、流程编排与纪律约束 Superpowers 是 Jesse Vincent 为各类 coding agent(Claude Code、Codex、Cursor、Gemini CLI 等)开发的一套方法论插件。它不是一组工具,也不是一个框架,而是一套通过 skill 组合出来的软件工程流程。 初次翻阅 README.md 会产生一个直觉:using-superpowers 看起来像所有 skill 的入口,是不是应该由它渐进式地调度其余 skill?深入读完全部 skill 文档后,这个直觉只说对了一半。 一个更根本的问题是:skill 到底是什么?从文件系统看,每个 skill 就是一个目录,目录里有一份 SKILL.md,最多再带几个 reference 或工具脚本。从运行时看,skill 是一段被 agent 按需加载进上下文的 prompt。但这都不是重点。Superpowers 在 AGENTS.md 里用了一个更准确的说法——skill 是 behavior-shaping content,它是写给 agent 看...
OpenAI Symphony 深度研究,一次从「监督 Agent」到「管理工作」的编排改造
2026 年 3 月初,OpenAI 在 GitHub 上公开了 openai/symphony 仓库,附带一份 Apache 2.0 授权的 SPEC.md、一套 Elixir 写成的参考实现,以及 README 首页那句把自己定位说得很克制的话:“a low-key engineering preview for testing in trusted environments” [openai/symphony README]。将近两个月之后,OpenAI 官方博客 An open-source spec for Codex orchestration: Symphony 与 InfoWorld 2026 年 4 月 28 日那篇 OpenAI’s Symphony spec pushes coding agents from prompts to orchestration 把仓库里的一组内部数据放大到了企业读者面前——“some internal teams seeing landed pull requests rising 500% in the first thre...
Warp:从终端到 ADE 的五年深研
2026 年 4 月 28 日,Warp 把客户端源码扔到了 GitHub 上,AGPL 许可,OpenAI 作为 founding sponsor,配套的云端 agent 编排平台 Oz 由 GPT 系列模型驱动。这家公司累计公开融资约 $73M,接近 100 万活跃开发者,在 SWE-bench Verified 和 Terminal-Bench 上挤进过前列,现在把"怎么造自己"这件事交给社区和 agent 一起做。 开源是一个分水岭事件,但理解这件事的意义需要往前拉。Warp 这条产品线已经走了五年,从 2020 年一个 Rust + GPU 渲染的 macOS 终端开始,一步步变成今天的 Agentic Development Environment(ADE)——包含终端、原生代码编辑、多 agent 协同、云端编排。要看懂 2025-2026 年这个窗口爆出来的所有动作,得从它 2020 年的起点开始看。 下面是一次完整的横纵深研:纵向追 Warp 从 2020 到现在的发展线,横向对齐 Cursor / Claude Code / Windsur...
印度民主深度研究,一个七十八岁的「不可能」还在运行
中文网络上流传着一个说法,流传得相当广。每到印度大选季,总有人言之凿凿地说,那边光是因为选举暴力死的人,就有两万之数。 这个数字要是真的,就意味着在一个十四亿人口的国度,一次选举会在六个星期里、几百个选区中抬出两万具尸首。那已经不是什么「民主失灵」,是一场半内战。这种规模的死亡,但凡是真的,便不该是中文互联网角落里的谈资,而该是路透、BBC、半岛每一天头版的血色头条。 但把 V-Dem、Freedom House、ACLED、印度选举委员会(ECI)、印度内政部、ADR 这几家机构自 1984 年以来历次大选的数据一家一家对齐着看一遍,在任何一份一手来源里都找不到「两万」这个数字的出处。 这个说法有意思的地方,就在它错得并不彻底。它把数量级夸大了五十倍到一千倍,错得离谱;可它想指的那件事本身,却并非空穴来风。印度民主确确实实生着病,而且病灶触目惊心——只是病不长在「大选死人」这桩看得见的伤口上,病长在更深的地方,长在骨头缝里,长在肌理中间,寻常人一眼看不见,掀开皮来才知道疼得厉害。 下面这篇长文先从头到尾把印度民主这套东西梳一遍,看它是怎么在一片文盲率极高、种姓四裂、十几种语言、...
从 Skill 到 Skills 2.0:Anthropic 这半年怎么把 Agent Skills 做进软件工程
为什么需要 Skills 用 Claude Code 或者 Cursor 写一段时间代码,总会碰到同一种场景:模型通用能力很强,但一旦要求按公司内部流程办事,比如按团队的 commit 规范写一条 commit message、按固定模板出一份项目周报、按财务系统的字段填一份报销单,它立刻变回一个刚入职三天的实习生——不会写倒不是主要问题,它只是不知道这边是怎么干这件事的。 Anthropic 2025 年 10 月开始填这个坑,做出来的东西叫 Agent Skills。 时间线 2025 年 10 月 16 日:Skills 诞生 Anthropic 工程博客发了《Equipping agents for the real world with Agent Skills》,署名 Barry Zhang、Keith Lazuka、Mahesh Murag,文末缀了一句 “who all really like folders”。 文章对 Skill 的定义很朴素:一个 Skill 就是一个文件夹,里面有一个 SKILL.md,外加可选的脚本、参考文档和资源文件。SKILL.md ...
Karpathy 视角下的 LLM 编码缺陷:四条行为准则的深度解析
LLM 编码的自作主张 长期用 Claude Code、Cursor、Copilot 写代码的人大概都熟悉一种感觉:模型并不是不会写,而是写得太多、太聪明、太自作主张。让它修一个 bug,它顺手把无关代码风格也改了;让它加一个简单功能,它给你抽象出三层接口和一套配置系统;让它重构 X,它没问清楚 X 的边界就开始动手。 Andrej Karpathy 在 X 上发过一段对这类问题的精炼归纳,forrestchang 把它整理成了一个 GitHub 仓库 andrej-karpathy-skills,提供一份 60 多行的 CLAUDE.md,外加 Claude Code Plugin 的安装方式。这个仓库的内容可以同时用于 Claude Code、Cursor 以及任何支持 CLAUDE.md 形态的 LLM 编码工具。 这篇文章想讨论三件事:Karpathy 到底诊断出了哪四个偏差、对应的四条行为准则怎么用、以及一个更实际的问题——这套准则到底应该装成 skill 还是直接写进 CLAUDE.md。 Karpathy 观察到的四个系统性偏差 仓库 README 引用了 Karp...










