我的征尘是星辰大海。。。
The dirt and dust from my pilgrimage forms oceans of stars...
-------当记忆的篇章变得零碎,当追忆的图片变得模糊,我们只能求助于数字存储的永恒的回忆
作者:黄教授
手机视频列表
智能协作当AI成为自己的开发者2
视频
音频
原始脚本
第四章,循环驱动的开发,手眼与大脑的协作。 管家收到卢克的批准后,立刻执行了 Gemini 给出的安装命令。 终端里滚动着安装日志,管家实时把进度反馈给 Gemini。 正在安装 OpenCV 库,进度30%。 安装完成,正在安装围棋规则库,进度70%。 安装完成,接下来是启用摄像头权限。 执行了 Sudo Cmd 666 slash d dot v slash video 0。 然后用 ls 杠 l dev video 0验证。 确认摄像头已正常启用,随即把结果告知 Gemini,摄像头权限已启用,可开始开发。 Gemini 的回复很快,请创 创建项目目录 GoChess,我将生成棋盘检测模块的核心代码。 管家执行 make dir GoChess,然后等待 gemini 的代码。 几分钟后,一段 C 加加代码出现在交互窗口里,管家自动把代码保存为 board detect CPP,接着执行编译命令。 G 加加,Board, Detect, CPP, O, Board, Underscore, Detect, PKG, Config, Key, Flags, Libs, OpenFevia, 4. 编译报错,未定义引用,CV, VideoCapture, VideoCapture, Int. 管家把终端里的报错信息原封不动的反馈给 Gemini 是 OpenCV 版本适配问题,将代码中的 OpenCV 4改为 OpenCV 即可。 Gemini 很快给出了修正方案。 管家按照指示修改代码,重新编译。 这一次终端显示编译成功,他运行程序,调用摄像头,屏幕上出现了棋盘的实时画面,边缘检它的线条清晰可见。 棋盘检测模块测试通过,可进入下一阶段开发。 管家向 Gemini 汇报。 接下来的几天里,这样的循环不断重复。 Gemini 生成代码,管家执行编译、测试、反馈结果,Gemini 修正优化。 鲁克成了真正的甩手掌柜,每天只需要查看管家发来的进度摘要,已完成棋子识别模块开发,正在调 调试落子记录功能,落子记录存在延迟问题,正在优化算法。 复盘报告生成模块已完成,可进行整体测试。 期间也遇到过麻烦,Gemini 需要调用一个第三方的围棋评分接口,却发现系统没有网络访问权限。 管家把问题反馈给卢克,卢克 简单配置了网络权限后,开发又顺利推进。 还有一次,Gemini 提出要安装一个未经过安全验证的库,管家直接拦截,并提示 Gemini,该库存在安全风险,请更换替代方案。 最终,Gemini 选择了另一个安全的替代库,问题迎刃而解。 卢克看着屏幕上不断更新的代码和测试结果,突然觉得这才是 AI 开发该有的样子。 管家像一双勤劳的手,执行所有机械操作。 Gemini 像一个聪明的大脑,专注于解决复杂问题。 而他自己终于可以从重复劳动中解脱出来。 第五章,任务闭环。 当 AI 交出最终答卷第10天,管家发来的进度摘要显示,开发已完成,可进行整体测试。 卢克打开测试界面,管家正在执行 Gemini 生成的测试脚本。 摄像头对准棋盘,黑白棋子落下,屏幕上实时显示着落子坐标部署,每局结束后自动生成一份包含胜率分析一,关键落子点评的复盘报告。 测试通过,所有功能正常。 管家的反馈出现在屏幕上,紧接着他向卢克发送了最终报告。 围棋棋谱识别程序开发完成,总工期10天,未出现重大问题。 程序已保存至 Go 杠 Chess 目录,可直接运行。 卢克点开程序亲自测试了一局,摄像头精准的捕捉到棋盘画面,落子记录没有丝毫误差,复盘报告的分析也十分专业。 他想起30多天前自己卡壳的窘境,再看看眼前这个由 AI 自主开发完成的程序,不禁感慨万千。 管家似乎看穿了他的心思,主动发起询问是否需要将程序打包备份,是否启动新的开发任务。 卢克笑着回复先备份吧,接下来我们可以试试让它支持多语言复盘报告。 屏幕上,管家立刻把新任务传递给 Gemini,新一轮的开发循环又将开始。 而鲁克知道,他创造的不仅仅是一个能识别围棋棋谱的程序,更是一种全新的 AI 协作模式。 当管家的勤恳遇上开发者的智慧,智能终将真正落地为生产力,而人类只需要做那个掌控方向的领航员。 第六章,简单背后的拷问, Agent 公司的生存迷局,卢克看着管家和开发者自动启动了多语言复盘报告的开发循环,手指轻轻敲击着桌面,一个念头越来越清晰,这套双模型协同流程实在太简单了。 整个核心逻辑不过是 Shell Agent 执行加大模型决策,驱动它的 while loop 脚本只有几十行代码,安全规则和拷问模板也都是模块化的配置。 他粗略估算了一下,就算是刚入门的开发者,只要熟悉 Shell 命令和大模型接口,最多一个月就能打好完整闭环。 既然这么简单,那些专门做 Agent 框架的公司还有存在的必要吗?卢克喃喃自语。 他想起之前研究过的 langchain,那套框架里层层叠叠的抽象概念,Chat Prompt Template,L C E L 语法。 当初看得他头疼,可现在用自己的这套模式,根本不需要这些复杂的封装,管家直接执行命令,开发者直接生成方案,中间 没有任何多余的环节。 他打开电脑里的笔记,里面记着之前的疑惑。 Agent 公司总爱把简单问题复杂化,仿佛只有堆砌足够多的功能、包装足够深奥的概念,才能卖出几十万甚至上百万的授权费。 可如果用户发现,只要几行脚本就能实现类似的效果,谁还会为昂贵的框架买单?卢克想到了模型公司的未来。 现在的大模型已经具备了极强的规划和编程能力,只要再内置一个简化版的 shell agent 模块,预训练好本地系统的适配规则,用户拿到手后稍微做些本地验证,就能实现大模型加本地管家的自主开发。 到那时,垂直整合的模型公司几乎能包揽所有工作, A 镇的公司又该何去何从?也许只剩下一些细分领域了。 卢克翻着笔记,里面有他之前的思考,自然语言转 SQL 查询可能是 A 镇的公司最后的蓝海。 毕竟不同行业的数据库结构千差万别,需要专门的适配和优化,这不是模型公司能轻易覆盖的。 但至于流程控制,Agent 公司的价值实在有限。 机票订购、酒店预定这些场景,原有平台只需要接入大模型接口,就能实现智能交互,根本不需要额外的 Agent 框架。 他看着屏幕上管家和开发者的交互日志,突然觉得 Agent 行业的泡沫或许正在悄然破裂。 当复杂的框架被几行脚本替代,当模型公司完成垂直整合,那些靠复杂化解决方案生存的 Agent 公司终将面临被淘汰的命运。 而真正有价值的,永远是能解决实际问题的简单逻辑,就像他眼前这两个默默协作的 AI,一个管执行,一个管思考,却完成 成了曾经让他焦头烂额的开发任务。 卢克关掉笔记,重新将目光投向屏幕。 新的开发循环还在继续,管家刚反馈完多语言模块的测试结果,开发者就给出了优化方案。 他知道,不管 Agent 的公司的未来如何,这种让 AI 自主协作的模式已经为他打开了一扇新的大门。
修正脚本
第四章,循环驱动的开发,手眼与大脑的协作。 管家收到卢克的批准后,立刻执行了 Gemini 给出的安装命令。 终端里滚动着安装日志,管家实时把进度反馈给 Gemini。 正在安装 OpenCV 库,进度30%。 安装完成,正在安装围棋规则库,进度70%。 安装完成,接下来是启用摄像头权限。 执行了 Sudo Cmd 666 slash d dot v slash video 0。 然后用 ls 杠 l dev video 0验证。 确认摄像头已正常启用,随即把结果告知 Gemini,摄像头权限已启用,可开始开发。 Gemini 的回复很快,请创建项目目录 GoChess,我将生成棋盘检测模块的核心代码。 管家执行 make dir GoChess,然后等待 gemini 的代码。 几分钟后,一段 C 加加代码出现在交互窗口里,管家自动把代码保存为 board detect CPP,接着执行编译命令。 G 加加,Board, Detect, CPP, O, Board, Underscore, Detect, PKG, Config, Key, Flags, Libs, OpenCV, 4. 编译报错,未定义引用,CV, VideoCapture, VideoCapture, Int. 管家把终端里的报错信息原封不动地反馈给 Gemini,Gemini指出是 OpenCV 版本适配问题,将代码中的 OpenCV 4改为 OpenCV 即可。 Gemini 很快给出了修正方案。 管家按照指示修改代码,重新编译。 这一次终端显示编译成功,他运行程序,调用摄像头,屏幕上出现了棋盘的实时画面,边缘检测的线条清晰可见。 棋盘检测模块测试通过,可进入下一阶段开发。 管家向 Gemini 汇报。 接下来的几天里,这样的循环不断重复。 Gemini 生成代码,管家执行编译、测试、反馈结果,Gemini 修正优化。 卢克成了真正的甩手掌柜,每天只需要查看管家发来的进度摘要,已完成棋子识别模块开发,正在调试落子记录功能,落子记录存在延迟问题,正在优化算法。 复盘报告生成模块已完成,可进行整体测试。 期间也遇到过麻烦,Gemini 需要调用一个第三方的围棋评分接口,却发现系统没有网络访问权限。 管家把问题反馈给卢克,卢克简单配置了网络权限后,开发又顺利推进。 还有一次,Gemini 提出要安装一个未经过安全验证的库,管家直接拦截,并提示 Gemini,该库存在安全风险,请更换替代方案。 最终,Gemini 选择了另一个安全的替代库,问题迎刃而解。 卢克看着屏幕上不断更新的代码和测试结果,突然觉得这才是 AI 开发该有的样子。 管家像一双勤劳的手,执行所有机械操作。 Gemini 像一个聪明的大脑,专注于解决复杂问题。 而他自己终于可以从重复劳动中解脱出来。 第五章,任务闭环。 当 AI 交出最终答卷的第10天,管家发来的进度摘要显示,开发已完成,可进行整体测试。 卢克打开测试界面,管家正在执行 Gemini 生成的测试脚本。 摄像头对准棋盘,黑白棋子落下,屏幕上实时显示着落子坐标标注,每局结束后自动生成一份包含胜率分析、关键落子点评的复盘报告。 测试通过,所有功能正常。 管家的反馈出现在屏幕上,紧接着他向卢克发送了最终报告。 围棋棋谱识别程序开发完成,总工期10天,未出现重大问题。 程序已保存至 Go 杠 Chess 目录,可直接运行。 卢克点开程序亲自测试了一局,摄像头精准地捕捉到棋盘画面,落子记录没有丝毫误差,复盘报告的分析也十分专业。 他想起30多天前自己卡壳的窘境,再看看眼前这个由 AI 自主开发完成的程序,不禁感慨万千。 管家似乎看穿了他的心思,主动发起询问是否需要将程序打包备份,是否启动新的开发任务。 卢克笑着回复先备份吧,接下来我们可以试试让它支持多语言复盘报告。 屏幕上,管家立刻把新任务传递给 Gemini,新一轮的开发循环又将开始。 而卢克知道,他创造的不仅仅是一个能识别围棋棋谱的程序,更是一种全新的 AI 协作模式。 当管家的勤恳遇上开发者的智慧,智能终将真正落地为生产力,而人类只需要做那个掌控方向的领航员。 第六章,简单背后的拷问, Agent 公司的生存迷局,卢克看着管家和开发者自动启动了多语言复盘报告的开发循环,手指轻轻敲击着桌面,一个念头越来越清晰,这套双模型协同流程实在太简单了。 整个核心逻辑不过是 Shell Agent 执行加大模型决策,驱动它的 while loop 脚本只有几十行代码,安全规则和拷问模板也都是模块化的配置。 他粗略估算了一下,就算是刚入门的开发者,只要熟悉 Shell 命令和大模型接口,最多一个月就能搭好完整闭环。 既然这么简单,那些专门做 Agent 框架的公司还有存在的必要吗?卢克喃喃自语。 他想起之前研究过的 langchain,那套框架里层层叠叠的抽象概念,Chat Prompt Template,L C E L 语法。 当初看得他头疼,可现在用自己的这套模式,根本不需要这些复杂的封装,管家直接执行命令,开发者直接生成方案,中间没有任何多余的环节。 他打开电脑里的笔记,里面记着之前的疑惑。 Agent 公司总爱把简单问题复杂化,仿佛只有堆砌足够多的功能、包装足够深奥的概念,才能卖出几十万甚至上百万的授权费。 可如果用户发现,只要几行脚本就能实现类似的效果,谁还会为昂贵的框架买单?卢克想到了模型公司的未来。 现在的大模型已经具备了极强的规划和编程能力,只要再内置一个简化版的 shell agent 模块,预训练好本地系统的适配规则,用户拿到手后稍微做些本地验证,就能实现大模型加本地管家的自主开发。 到那时,垂直整合的模型公司几乎能包揽所有工作,Agent 公司又该何去何从?也许只剩下一些细分领域了。 卢克翻着笔记,里面有他之前的思考,自然语言转 SQL 查询可能是 Agent 公司最后的蓝海。 毕竟不同行业的数据库结构千差万别,需要专门的适配和优化,这不是模型公司能轻易覆盖的。 但至于流程控制,Agent 公司的价值实在有限。 机票订购、酒店预定这些场景,原有平台只需要接入大模型接口,就能实现智能交互,根本不需要额外的 Agent 框架。 他看着屏幕上管家和开发者的交互日志,突然觉得 Agent 行业的泡沫或许正在悄然破裂。 当复杂的框架被几行脚本替代,当模型公司完成垂直整合,那些靠复杂化解决方案生存的 Agent 公司终将面临被淘汰的命运。 而真正有价值的,永远是能解决实际问题的简单逻辑,就像他眼前这两个默默协作的 AI,一个管执行,一个管思考,却完成了曾经让他焦头烂额的开发任务。 卢克关掉笔记,重新将目光投向屏幕。 新的开发循环还在继续,管家刚反馈完多语言模块的测试结果,开发者就给出了优化方案。 他知道,不管Agent公司的未来如何,这种让 AI 自主协作的模式已经为他打开了一扇新的大门。
back to top