Posted on 2026-03-24 :: Source Code :: agentic-coding

现代编程新范式

很早之前（2025年9月份）就写过一篇文章来介绍所谓的“氛围编程”或者是当今的“代理式编程”，当时还处在claude code刚刚流行，还在研究Augment Code的阶段

vibecoding工具

要玩vibecoding，最重要的无非是“大模型”、“agent基座”

大模型

大模型早期还是御三家的统治阶段（claude、GPT、gemini），不过现在国产模型也赶上来了，差距已经非常小了，而且国内模型走开源方案，尤其是Qwen系列，像Qwen3.6-27B这类小模型，本地PC也有了玩上大模型的机会

最先起头的 AI-first 编辑器，由 Anysphere 开发。Cursor 用 Tab 自动补全、Composer（现已升级为 Composer 2）和 Agent 模式重新定义了 AI 编程体验。截至 2025 年 8 月已有 4 万付费用户，NVIDIA CEO 黄仁勋公开表示"4 万工程师全部在用"。Karpathy 本人也是 Cursor 用户，他评价 Cursor 提供了一个"自主性滑块"——从 Tab 补全到 Cmd+K 定点编辑，再到完全自主的 agent 模式，开发者可以自由控制交给 AI 的自主程度。

Cursor 在早期引领了这一波 AI 编程浪潮，但随着后续 agent 基础设施（如 MCP、Skills、长时间自主运行）成为核心战场，Cursor 在这方面的跟进速度不如 Claude Code 等 CLI 工具。

Claude Code

Anthropic 的官方 CLI Agent，可以说是当前 vibecoding 生态的核心基础设施提供者。Claude Code 率先在工程层面整合了 MCP（Model Context Protocol）来标准化工具与外部系统的接入，同时引入了 Skills 机制让 agent 能力模块化和可复用。它支持终端、VS Code、JetBrains、桌面应用、Web 浏览器等多种使用场景。

Claude Code 的设计理念偏向"安全自主"——它在工具编排上非常完备（支持子 agent 并行工作、GitHub Actions 集成、定时任务等），但同时对高风险操作（如 git push --force、rm -rf 等）有明确的确认机制。这种"框架内的自主"让它成为很多专业开发者的首选：你可以在它的框架里放心 vibe，因为它会在你快要搞砸的时候停下来问你。

目前 Claude Code 支持通过 MCP 连接 Google Drive、Jira、Slack 等外部系统，支持 CLAUDE.md 项目级指令文件、自动记忆和 Git 工作流深度集成。

Codex CLI

OpenAI 的官方终端编码代理，使用 Rust 构建，轻量且高效。截至 2026 年 5 月 GitHub 约 80.8k Star。Codex 与 ChatGPT 账号体系打通，ChatGPT Plus/Pro 用户可直接使用。支持终端 CLI、VS Code/Cursor 扩展、桌面应用（codex app）和 Web 端（chatgpt.com/codex）。

Codex 的设计哲学偏向"协作感"——它强调频繁的进度同步（commentary 机制），鼓励 agent 主动推进任务而不是被动等待指令。和 Claude Code 的"谨慎代理"风格不同，Codex 更像一个持续结对、主动推进的工程搭档。它的提示词明确鼓励"先读代码再动手"、"默认直接落地"、"遇到障碍先自行解决"。

Codex 目前支持沙箱模式（workspace-write）、权限升级请求机制、skills 系统和 MCP 集成。对于已经使用 ChatGPT 生态的用户来说，它是接入成本最低的终端 agent 方案。

OpenCode

开源界的黑马，由 anomalyco 团队开发，GitHub 约 157k Star。100% 开源（MIT 协议），不绑定任何模型供应商——可以使用 Claude、OpenAI、Google 乃至本地模型。支持终端 TUI、桌面应用（Beta）和 client/server 架构，可以远程驱动。

OpenCode 的理念是"少提问、直接执行"，把规则压得很薄，追求极简高效。它内置两个 agent 模式：build（全权限，日常开发）和 plan（只读，分析和代码探索）。它的终端界面设计友好（毕竟团队也是 neovim 用户和 terminal.shop 的创造者），对开发者体验的把控非常出色。

模型无关的设计让 OpenCode 在模型快速迭代的当下有独特的优势——你可以随时切换到最新的最强模型，而不被某个供应商锁定。

Augment Code

针对大型项目的差异化选手，由 Augment Code 公司开发。核心卖点是 ACE（Augment Context Engine）——通过实时、语义化的代码库索引来做上下文精选，而不是暴力 dump 整个代码库。在 SWE-Bench Pro Leaderboard 上的 Agent 模式得分 51.80%（使用 Opus 4.5），领先于 Cursor 的 50.21% 和 Claude Code 的 49.75%。

Augment 的上下文引擎不只是简单的 grep 或关键词匹配，而是对代码进行语义索引和关系理解——知道哪些服务互相依赖、哪条调用链经过哪些模块、哪些代码已经废弃、哪些模式是团队重复使用的。这在百万行级别的项目中尤其有价值，因为大型项目的第一问题从来不是"模型不够强"，而是"上下文不够准"。

Augment 最近还推出了 Cosmos 平台——一个跨人类、agent、代码、工具、策略和记忆的工程操作系统级产品。如果你在维护体量庞大、依赖复杂的企业级项目，Augment 的上下文质量可能比其他工具好一个档次。

OpenClaw

定位独特的个人 AI 助手，由 Peter Steinberger 和社区开发，GitHub 约 370k Star。和前面的硬核 coding agent 不同，OpenClaw 更像一个"让不会编程的人也能自动化日常事务"的平台。

它支持 WhatsApp、Telegram、Slack、Discord、Signal、iMessage、微信、QQ 等 20+ 消息通道，可以直接在聊天里指挥 agent 干活。支持 Voice Wake + Talk Mode（macOS/iOS/Android）、Live Canvas、浏览器自动化、定时任务等。通过 skills 机制（ClawHub 注册表）可以扩展能力。

OpenClaw 的定位让它在 vibecoding 生态里占据了一个特殊位置——它处理的不是"写代码"，而是"用 agent 替代重复性劳动"。适合自动化、脚本化、日常工具类的 vibe 场景。它的安全模型也很完善：DM 默认需要配对码验证，非主会话可以放在 Docker 沙箱里运行。

Hermes Agent

由 Nous Research 开发，最独特的地方在于它用 AI 来优化 AI。Hermes Agent 使用 DSPy + GEPA（Genetic-Pareto Prompt Evolution，遗传-帕累托提示进化）算法，自动进化优化 agent 自身的 skills、提示词、工具描述甚至代码——通过反思性进化搜索（reflective evolutionary search）产出可量化更好的版本。

它的工作方式是：读取当前 skill/prompt/tool → 生成评估数据集 → GEPA 优化器读取执行追踪（不只是知道"失败了"，还知道"为什么失败"）→ 提出针对性改进 → 生成候选变体 → 评估筛选 → 通过约束门（测试必须 100% 通过、skill 文件不能超过 15KB 等）→ 最终以 PR 形式提交到主仓库。

整个过程不需要 GPU 训练，全部通过 API 调用完成——变异文本、评估结果、选择最优变体，单次优化运行成本约 $2-10。GEPA 算法已在 ICLR 2026 获得 Oral 论文接收。

Hermes Agent 代表了一个很有想象力的方向：当 agent 基础设施足够成熟后，agent 是否能够自我改进？ 如果 vibecoding 的终极目标是"你只需要说清楚想要什么"，那么 Hermes Agent 试图回答的就是"agent 能不能自己不断变得更擅长理解你的需求"。

最后

回到起点——什么是 vibecoding？Karpathy 说"fully give in to the vibes"，Simon Willison 说"接受代码而不完全理解"，而我更愿意把它理解成当 agent 基础设施足够成熟后，编程自然会浮现出来的一种新工作方式。

它不是要取代传统编程，而是在传统编程之上增加了一个新的抽象层。这个抽象层的厚度，取决于前面几篇文章讲过的东西：提示词工程把行为边界写清楚，上下文工程把信息密度做高，MCP 把工具接稳，Skills 把能力模块化，通讯协议把协作理顺。

vibecoding 能不能靠谱，最终不取决于模型有多聪明，而取决于这一整套基础设施能给你多大的安全放手空间。

下一篇，聊 agent workflow。