我的征尘是星辰大海。。。
The dirt and dust from my pilgrimage forms oceans of stars...
-------当记忆的篇章变得零碎,当追忆的图片变得模糊,我们只能求助于数字存储的永恒的回忆
作者:黄教授
手机视频列表
外显规划显式调用与反思闭环
视频
音频
原始脚本
外显规划、显示调用与反思闭环,Cloud Code 工程范式全解析。 大模型编程从即兴写代码走向工程化交付,是行业从玩具走向生产力的关键分水岭。 Anthropic 公开的 Claude Code 规范并非简单的提示词技巧,而是一套完整的 AI 编程工程范式。 把思考外显,把执行标准化,把反思制度化。 本文将完整拆解这套范式的构成设计意图,公开背后的生态逻辑。 以及对国内模型与开发者的真实价值。 一、 Cloud Code 核心范式从模糊对话到工程化交付。 Cloud Code 彻底抛弃想到哪写到哪的对话式编程。 用一套结构化流程把大模型的不确定性关进工程框架,核心由四大模块构成。 一、外显规划。 Plan mode 与只读前置探索规划是 Cloth Code 的起点。 通过斜杠 plan 命令进入只读规划模式,禁止任何文件写入,只做三件事遍历项目结构、理解需求边界、输出可执行方案。 他强制模型先看全再动手,避免因信息不全导致的反攻与幻觉。 配套 claude plans 目录,把计划文本化留存。 既是执行依据,也是后续复盘的基准,相当于大模型的需求说明书与排期表。 二、显示工具调用。 结构化指令替代自然语言,摒弃自由自然语言指令,采用程序化工具调用 p t c 与固定命令集 l s。 git grab 做代码检索, init 初始化项目规则,斜杠 code review 做评审, build gun fix 完成编译修复。 所有操作可追踪、可复现,如同传统编程的 Makefile 与 Shell 脚本。 把大模型的随性发挥转化为确定性工程行为,彻底解决无 IDE 环境下的交互混乱问题。 三、反思闭环。 自我校验与迭代修正反思是 claude code 最易被忽视却最核心的设计。 每完成代码编写修改后。 模型必须主动做三件事,校验逻辑一致性、检查边界条件、对比计划偏差,发现问题立即回滚修正。 这不是简单的检查错误,而是内置的质量门禁。 直接把代码正确率从百分之六十到百分之七十提升至百分之九十以上,适配金融、法律、工业等高容错成本场景。 四、配置化规则。 Claude 的点 md 与项目契约在项目根目录创建 claude md 作为模型必须遵守的项目宪法。 统一编码规范、接口约束、安全规则、注释标准,配合斜杠 in net 自动初始化,让模型每次启动都读取规则。 无需重复提示。 本质是大模型与代码库的接口协议,如同 package dot json c m a k e lists dot txt,实现即开即用,规则统一。 二、范式的深层用意。 解决大模型编程的原生缺陷,这套规范并非为了复杂而复杂,而是精准针对 llm 编程的三大致命痛点。 一、解决上下文遗忘与逻辑跳步。 长文本多文件项目中,模型极易丢失上下文,省略关键逻辑。 外显规划把任务拆解为线性步骤。 反思机制,每步校验,从流程上杜绝断片式编码。 二、降低幻觉与错误交付规划阶段,只读探索,确保模型理解真实项目结构。 反思闭环强制自检,把错误拦截在交付前,大幅减少人工修正成本。 三、无 IDE 环境下的工程化兜底,脱离 VS Code JetBrains 等成熟 IDE 的实时校验。 索引与调试能力,纯对话编程极易失控。 这套范式用结构化流程替代 IDE 实时能力,成为无本地集成场景下的唯一可行方案。 三, Anthropic 公开核心范式,为何不怕泄露竞争力?很多人疑惑,这套范式是 claude 编程体验领先的关键。 为何主动公开?背后是清晰的技术与商业逻辑,完全印证行业共识。 一、范式易复制,对其能力不可复制,流程、命令、目录结构谁都能抄。 但 claude 从训练阶段就对其这套范式偏好长文本结构化思考,多步反思,稳定工具调用。 其他模型即便照搬流程,思考习惯不匹配,也会出现跳步、计划虚浮、执行跑偏,天然弱于 Claude 二、范式无护城河。 早公开早定标准规划、执行、验证、反思的逻辑,是所有 Code Agent 团队都能想到的基础框架,毫无保密价值。 与其等待行业各自造轮子,不如主动输出规范,把 Cloud 目录、 MCP 协议打造成 AI 编程行业标准。 三、生态卡位。 定义大模型时代的 Makefile。 Anthropic 的目标是从模型厂商升级为生态定义者。 这套范式相当于 AI 编程的配置文件标准。 工具、插件、提示词、生态都会优先兼容 claude 其他模型必须适配这套规范,才能获得良好体验,形成生态壁垒。 四、训练推理一体化,放大工具、插件、提示词生态都会优先兼容 claude 其他模型必须适配这道规范,才能获得良好体验。 形成生态壁垒。 四,训练推理一体化,放大原生优势,公开范式,等于引导全行业按 claude 的训练逻辑使用模型。 进一步放大其长上下文稳定性、反思深度的优势,形成范式使用习惯模型偏好的正向循环。 四、范式的可行性与行业价值。 从技巧到基础设施,这套规范的价值远超工具层面,已成为 AI 编程的事实基础设施。 一、工程可行性,复杂项目的必备底线,实测证明。 无这套范式,大模型仅能完成单文件小脚本,套用后可稳定交付数千行至数万行的中型项目,支持持续迭代与重构。 是工程级编程的生存底线。 二、行业通用性。 所有无 IDE 编程的通用模板不仅适用于 Cloud GPT Code 通义灵码、 GLM 4、 Deepseek 等模型。 脱离 IDE 做自主编程时,必须遵循这套结构,否则无法保证稳定性与交付质量。 三、协作价值。 多智能体协作的基础语言规范,统一了任务拆分、计划表述、工具调用的语法,让不同模型、不同智能体之间可高效协作,打破各自为战的协作壁垒。 五、国内模型套用范式能达到什么水平?正如我们此前判断,模型裸能力差距在缩小,工程化引导决定最终上线。 一、简单任务完全平替 Cloud CRUD 脚本编写、小功能开发。 国产模型宽三点六、 GLM 四点七、 kimi 等。 套用规范后,效果与 Cloud 无差异,性价比更高。 二、中型项目接近 Cloud 的水平,多文件业务开发、接口对接、简单重构。 国产模型加完整范式可达到 claude 百分之九十到百分之九十五的能力,差距仅在计划严谨性与反思深度。 三、复杂工程。 百分之八十到百分之八十五,Cloud 的能力数万行架构设计,深度调试,多服务协同。 国产模型受限于训练。 对其与超长上下文稳定性仍有差距,但已能满足绝大多数企业级需求。 四、核心结论。 工程化大于模型本身。 弱模型加强工程大于强模型加野路子。 国产模型裸能力已位居全球第一梯队,套用 claude 范式后快速缩小与头部的差距。 一到二年内有望在主流场景全面平替。 六、总结与行业启示。 Claude Code 公开的这套范式本质是大模型编程从手工作坊走向工业化生产的标准手册。 Anthropic 公开它不是放弃竞争力,而是用标准构建生态壁垒,用范式放大模型训练优势。 对开发者而言,这套规范是提升 AI 编程效率的核心工具。 对国内厂商而言,它是低成本追赶头部的捷径,无需从零设计流程,直接套用成熟范式,把精力投入模型对齐与稳定性优化。 未来,大模型能力会持续趋同,工程化范式与训练对齐能力才是真正的护城河。 而 claude 给出的答案已经很清晰。 把思考外显,把执行规范,把反思固化,让 AI 编程像传统工程一样可靠、可复现、可规模化。
修正脚本
back to top