没有人类编写代码,也没有人类审查代码,软件依然能够顺利交付?这在2026年2月成为了现实。
一家专注于基础设施安全的公司StrongDM,展示了其“软件黑灯工厂”式的生产线成果。在这个生产线里,人类不再直接写代码或进行代码审查,而是将spec(规格说明)和场景输入系统,由Agent自动生成代码、运行测试/评测harness,并在反馈回路中反复迭代,直到结果收敛、可以交付。
StrongDM AI还开源了其核心项目,其中一个仓库是:https://github.com/strongdm/attractor。这个仓库没有一行代码,只有三份描述软件规格说明的Markdown文件。另一个仓库https://github.com/strongdm/cxdb则包含1.6万行Rust、9500行Go和6700行TypeScript,是他们的“AI Context Store”。
在Hacker News的讨论中,有开发者实际跑了一遍这套流程,并表示按照Attractor仓库中的文档和StrongDM提供的规范,让Claude基于spec构建了一个完整应用。最终生成的是一个可以直接使用Claude API Key的AI代理,其整体质量“明显好于让模型自由发挥时生成的结果”。
让他印象最深的,是这套规格说明的体量和细节程度:整套spec大约6000–7000行,覆盖了行为约束、接口语义以及系统边界。他认为这次实验“非常激进”,但也“非常令人兴奋”。
当然,这次开源并不是一个“打磨完毕”的展示版本。代码一经放出,就有开发者迅速上手检查,指出其中存在疑似bug、Rust反模式等问题。对此,StrongDM AI团队成员Jay Taylor在评论区回应称,这批项目“是最近几天才决定开源的”,尚未经过充分的技术优化。
这套实践也得到了学界的关注。沃顿商学院研究AI与组织变革的教授Ethan Mollick在转发StrongDM的公开内容时直言,这是一次“真正激进的软件开发方式”。在他看来,真正有价值的进步,不是“多加一点AI”,而是围绕AI,把流程本身重做一遍。
StrongDM是一家专注于基础设施访问与身份安全的公司。其AI团队成立于半年前,在团队成立的第一个小时,他们就明确了一组必须遵守的约束条件:代码不得由人类编写和审查。
代码不得由人类编写。
代码不得由人类审查。
如果你今天在每位人类工程师身上花费的token成本还不到1000美元,那么你的软件工厂还有很大的改进空间。
这一决定并非一时冲动,其背景可以追溯到2024年末。随着Claude 3.5在2024年10月的第二次修订发布,团队开始观察到一个变化:在长时序的Agentic编程任务中,结果开始叠加正确性。这一变化在Cursor的YOLO模式下变得更加清晰。
在“不允许手写代码”的前提下,团队遇到了新的问题:如何确保代码能正常运行?他们提出了“场景测试”的概念,并引入了“满意度”来量化验证结果。
在StrongDM的软件工厂里,spec(规格说明)是整个系统启动、纠偏和收敛的核心输入。在传统开发流程中,spec更多是“对齐工具”,而在StrongDM的设定下,当“人不写代码、人不看代码”成为前提时,spec的角色被彻底前移。
“验收”本身也被重写了。spec与场景(scenario)一起,构成一个不断运行的评测基准:模型生成的行为是否符合规范,不是靠人去读代码判断,而是靠它在这些场景中跑出来的结果是否持续满足预期。
这次实验也暴露了一个无法回避的现实问题:成本。有开发者提到,按照StrongDM提供的spec让Claude构建完整应用时,TypeScript路线的token消耗极高。这个反馈并非个例。
StrongDM团队曾提出过一个颇具冲击力的衡量标准:如果你今天在每位人类工程师身上花费的token成本还不到1000美元,那么你的软件工厂还有很大的改进空间。这句话一旦落到现实,更像是一个商业模式的探讨:你能否打造出一条足够盈利的产品线?
尽管成本高昂,但这一实践依然有很多值得思考的地方。对程序员个人而言,真正的问题或许不只是“现在贵不贵”,而是:当算力成本持续下降几乎成为共识时,你是否已经开始为新的角色和分工做技能投资?
本文由主机测评网于2026-07-03发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260748551.html