独家揭秘:GPT-5研发历程充满波折!
据智东西8月4日报道,今日,OpenAI CEO Sam Altman在X平台上公开了GPT-5的对话记录,提前让外界窥见了GPT-5的使用体验。
在对话中,Altman请求GPT-5推荐几部以AI为主题且引人深思的电视剧。GPT-5迅速列出了一部片单,而位列榜首的正是Altman本人所推荐的美剧《万神殿(Pantheon)》。
Altman还发表推文称,SaaS行业即将迈入“快时尚”时代,这或许预示着即将发布的GPT-5将对软件开发流程产生深远影响,有望显著提升软件迭代速度并降低开发成本。
然而,众多网友对GPT-5的表现并不买账。在回答中,GPT-5大量使用了破折号,这一行为被用户普遍批评为“AI味儿”过重。
此外,GPT-5未能展现出推理能力,导致推荐的第二部剧偏离了最初的请求范围,与AI无关,反而与量子计算扯上了关系。
评论区中,一条获得超过2万阅读量的帖子或许反映了网友们的共同心声:“GPT-5看起来和GPT-4没什么区别啊。”
这位发帖的网友进一步吐槽,GPT-5的用词过于夸张和花哨,语言怪癖与GPT-4一模一样。
Altman近期虽在多个场合高调宣传了GPT-5的能力,称“GPT-5在几乎所有方面都比我们聪明”。但网友们的质疑反映了已曝出的GPT-5表现与用户预期之间的明显差距。
近日,外媒The Information披露了GPT-5“难产”背后的诸多细节,揭示了OpenAI在技术开发、团队管理及与合作方博弈中所面临的重重挑战。
事实上,GPT-5的发布已经严重延期。原本这一模型应在数月前发布,但因能力提升有限而被降档为GPT-4.5。研究人员发现,适用于较小模型的微调技术并不适用于超大规模模型;此外,在将推理模型转化为适合聊天、API使用的“学生模型”时,其性能出现明显下降。
据知情人士透露,OpenAI下一代旗舰模型GPT-5在编程和数学任务方面相较现有模型有所提升,生成的代码更注重用户体验和美观性;在支持AI智能体执行复杂任务时也更加高效,所需的人工干预更少。
然而,也有知情人士认为,其进步幅度难以与GPT-3到GPT-4那样的代际飞跃相提并论。
GPT-5的问题自2024年底便开始显现。
当时,OpenAI正开发一款内部代号为“Orion”的模型,原计划将其作为GPT-5发布。据参与者透露,Orion未能实现预期性能,OpenAI最终于2025年2月将其作为GPT-4.5发布。除了惊人的定价外,这一模型并未给用户留下深刻印象。今年7月,OpenAI决定将GPT-4.5的API服务下线。这一模型也成为OpenAI史上最短命的模型之一。
部分失败原因在于预训练阶段的局限性。在这个阶段,模型会处理来自网络和其它来源的数据以学习概念之间的关联。研究人员发现高质量网页数据的供给正在枯竭,而且他们对小规模模型的调优手段在模型变大后不再奏效。
据参与OpenAI研发的知情人士透露,截至今年6月,OpenAI还没有开发出一款能被称之为“GPT-5”的模型。
面对推理模型范式在实际应用中出现的意外情况,OpenAI的研究人员采用了一些业内常见的办法来维持模型的性能提升。
OpenAI一直在开发被称为“通用验证器”的工具。据知情人士称,这项技术可自动化验证模型在强化学习过程中的回答质量。
通用验证器的核心是让一个模型来检查并评分另一个模型的答案。前者会借助多个来源来查证答案的正确性。
在实现AGI的路上,技术并非唯一的挑战。作为当前最受瞩目的AI创企,OpenAI时时刻刻面临着竞争对手的挖角。
最近,Meta挖走了十多位OpenAI研究员。这些研究员中包括参与了OpenAI近期核心技术进展的人员。Meta给这些研究员开出了顶级薪酬方案。
这波离职和随之而来的人员重组给OpenAI的高级员工带来了压力。上周,研究副总裁Jerry Tworek在公司内部Slack中向研究负责人Mark Chen表达了对团队调整的不满。
本文由主机测评网于2026-04-20发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260438855.html