ChatGPT诞生内幕大曝光!名字竟发布前一晚才定?!改变世界只用四天?

宁波市海曙区图书馆

GPT诞生内幕最新大曝光:

纳尼??原来“GPT”这个名字,直到发布前一晚才确定下来。

当时OpenAI在是否发布这个模型上显得十分纠结,因为据称Ilya对模型进行了十次测试,然而团队只认可了其中大约一半的答案。

不过发布后,GPT简直一炮而红——

第一天数据公布后,团队开始心生疑虑,怀疑自己是否犯了错误;第二天,网络上关于这一话题的讨论愈发热烈;等到第三天,团队终于明白,这个模型已经真正走红;而到了第四天,他们开始认识到,GPT将引领一场改变世界的革命。

这些信息源自OpenAI的最新播客,其中透露者包括位于中间的OpenAI首席研究官Mark Chen以及站在左侧的GPT负责人Nick Turley,他们均为OpenAI工作多年的资深一线管理者。

他们不仅深入探讨了GPT的发展历程,而且还详述了OpenAI在图像创作和编程领域的演变过程,同时,他们还对OpenAI在产品开发上的理念进行了归纳总结……

尽管节目时长达到了整整一小时,然而正如网友们所评价的,它的节奏感把握得恰到好处;他们通过一种极具吸引力的方式,向观众揭示了GPT和OpenAI鲜为人知的诸多细节。

一起来看看,这帮“书呆子”是如何改变世界的吧。

发布前一晚才确定用“GPT”命名

GPT的命名历程颇具戏剧色彩,起初它被称作“与GPT-3.5进行对话”。

对,没错,就是这个非常拗口的名字差点名扬天下。

发布前夕,Nick Turley他们经过深思熟虑,最终将名称更改为——“GPT”,这才有了今天的成果。

尽管初期他们对GPT的信心并不坚定,因为GPT-3.5这个底层模型已经推出了数月,而其能力提升仅限于增加了用户界面和简化了交互操作。

在GPT发布的前夜,Ilya向其挑战了十个棘手的难题,然而,仅有五个问题的答案被认可,实际上,关于是否应该发布GPT,他们之间还存在分歧。

但没想到的是,它居然火了,还火得一塌糊涂……

Nick Turley回忆称,GPT刚问世之际,局面颇为混乱,众人纷纷猜测是否出现了技术问题,甚至有人怀疑其走红只是短暂的辉煌。奥特曼私下里也曾戏谑地调侃说:

尽管看到它变得流行让人感到振奋,然而互联网终究还是互联网,它的热度终将有所减退。

这次的情况确实与以往大相径庭。随后的情况,相信大家都有所了解,媒体和社交平台,无一例外地被这场GPT风暴所覆盖,时至今日,热度依然不减。

但恐怕众多朋友目前对GPT的具体含义尚不明确,马克·陈现场揭晓了答案,指出它指的是“生成式预训练的Transformer”。

GPT的名声日益响亮,然而研究人员却遭遇了难题。他们面临GPU资源紧张、数据库连接告急以及服务商速度限制等问题,导致系统频繁宕机。为了应对这一状况,他们设计了一个名为“fail whale”的页面。在这个页面上,他们巧妙地利用GPT-3创作了一首诗歌,以此自嘲并告知用户:我们的系统出现了故障!

频繁的故障并未持续过长,OpenAI迅速响应用户意见,对GPT进行优化升级,主要手段是采用RLHF(基于人类反馈的强化学习)技术。在用户对对话内容给予正面评价时,该模型会主动学习,以生成更符合用户期望的回答。

这情形使得模型在初期阶段过分迎合用户,显得过分卑微,OpenAI很快意识到了这一状况,并迅速采取了相应措施予以解决。

Nick Turley强调,GPT这款产品在长期的发展中,其优化重点并非集中在用户的在线时长,而是致力于提升用户的持续使用比率,这一目标更是他们设计产品时的核心指导思想。

此外,他还发现,越来越多的人,尤其是Z世代,正逐渐把GPT当作“思想伙伴”来对待。因此,未来OpenAI将主动对这一现象进行监测,以保证模型的行为是恰当的。

在存储用户众多数据的同时,OpenAI还将致力于强化“即时对话”等隐私保护措施。

图像生成:另一个迷你GPT时刻

GPT之外,OpenAI的图像生成技术(ImageGen)也曾一度备受关注。

Mark Chen坦言,这又是一个出乎他意料的东西。

依照他的观点,ImageGen证实了团队先前的一个观点——一旦模型能够一次性生成完全满足用户提示要求的图像,其带来的价值将难以估量。

从用户视角出发,大众更倾向于避免在众多图像中筛选最优者,他们更渴望拥有卓越的提示引导力和强大的上下文编辑能力。

自2021年1月份起,OpenAI便陆续推出了备受瞩目的“DALL·E”系列作品。

在Nick Turley的叙述里,这些关于ImageGen的体验仿佛是另一个小型的GPT时刻。

尽管内部人员早已觉得这东西非常酷炫,然而直到正式发布,人们才真正领略到全世界对它的狂热追捧。

他举例指出,在短短一个周末,就有5%的印度网民体验了ImageGen工具,这一现象使我们得以接触到那些之前未曾料想到会使用GPT的新用户。

他预测,除了语音和视频等模态之外,也将会出现类似的神奇时刻——这些时刻的到来,不仅将彻底改变人们的生活方式,还将极大地增强GPT的广泛影响力。

有意思的是,他们还透露了一个非常“反直觉”的现象。

例如,关于GPT,我们团队原本设想它将是一款纯粹的实用工具,然而现实中人们却更倾向于用它来娱乐;至于ImageGen,我们原本以为它会被用来制作一些搞笑的表情包,但出乎意料的是,大多数人实际上用它来处理实际的工作和生活事务,比如制作PPT的插图或是进行家居设计。

与此同时,他们还谈及了DALL-E在最初阶段对人物肖像生成功能的约束。

Nick Turley回想起自己初入OpenAI的情景,那时团队在决定向用户开放哪些功能上显得较为谨慎,因为那时的技术尚处于起步阶段。

随着时间的流逝,他们逐渐意识到,若对模型实施过于武断的限制,实际上会妨碍众多表现优异的应用方式。

在创作人物画像方面,当GPT首次开放图像上传功能之际,我们曾讨论过是否应对上传的图片进行模糊化处理,以防止他人根据肖像做出推测或发表尖酸刻薄之词。

不过为了追求自由,他们逐渐摒弃了默认禁止这一做法。

Nick Turley认为,对各类安全问题的原则性审查至关重要,这包括不同类型、时间跨度以及风险级别的考量。

ChatGPT诞生内幕大曝光!发布前一晚还在纠结_ChatGPT诞生内幕大曝光!发布前一晚还在纠结_

在某些与人工智能安全相关的情境中,基于最糟糕的预测来进行分析显得尤为适宜。

OpenAI鼓励员工使用编程工具

在讨论人工智能近年在代码生成领域的进步时,我们可以看到,从GPT-3所创作的React组件,到针对特定任务而训练的模型,如Codex和Code Interpreter,再到它们与Copilot等辅助工具的结合应用。

Mark Chen指出,“编码”这一概念实际上涵盖了非常广泛的领域,它不仅包括集成开发环境(IDE)中的实时代码自动补全功能,还涉及“Agentic”风格的代码自动生成等多种形式。目前,OpenAI在后者方面投入了大量的资源。

GPT模型能够即时作出反应,一旦接收到提示信息,便会迅速提供答案。与之相对,Agentic编码技术则涉及模型在接收到复杂任务指令后,于幕后持续进行长时间的处理,最终输出一个与最优解极为接近的答案。

《Codex》体现了这一理念,他们更倾向于模型在给出答案前进行深思熟虑的推理,这种做法预示着代码领域的未来走向。

此外,面对代码行业的激烈市场竞争,Nick Turley表现出了积极的态度,他认为开发者能在众多产品中找到最强大的支持。

不过写代码容易,写好代码,却并不容易。

确保代码无误,建立公司内部软件系统,撰写优质的测试文件和文档,以及妥善解决代码冲突等问题,这些均系AI模型未来需深入掌握的关键“品味”与“风格”要素。

此外,OpenAI致力于打造通用技术,例如Codex,尽管目前它的角色定位为专业的软件工程师,然而,鉴于不同用户的需求,他们计划在未来持续进行更新和改进,旨在降低编程的难度,使软件开发变得对每个人来说都更加容易。

Nick Turley透露,OpenAI的工程师们利用Codex来协助完成测试工作,分析师们则借助它自动标注日志中的错误,同时,部分员工还用它来安排未来的工作任务。

OpenAI倡导员工运用编程工具,这不仅有助于提升工作效率,还能预判产品的发展趋势。公司坚持不将未经认可的产物推向市场,内部试用则成为了一种提前检验机制,确保他们能够实时掌握员工适应新工作流程所需的时间。

OpenAI内部:好奇心比博士学历更重要

在节目的尾声,他们讨论了OpenAI的企业氛围,并分享了一些个人的预测。

在OpenAI的招聘过程中,相较于候选者是否拥有AI领域的博士学位,公司更倾向于关注其是否具备浓厚的求知欲。

Nick Turley指出,在这个瞬息万变的时代,持续地汲取新知识、勇于探索新领域显得尤为关键。

对于OpenAI的产品团队来说,好奇心无疑是衡量他们能否最终取得成功的最关键因素。

在AI这个领域,存在着众多未知的领域。员工们必须保持谦逊的态度,因为只有通过深入的研究和不懈的探索,我们才能辨别出哪些是有益的知识,哪些可能潜藏着风险。是强烈的好奇心激励着人们持续地学习与挖掘。

他还特别指出,真正的难题在于如何准确提出问题,而非仅仅获得解答。

谈及此,Mark Chen进一步强调了行动力和适应能力二者的重要性。

前者表示员工能够自发地识别并处理问题(而非被动地被告知任务),后者则要求员工迅速判断哪些事项至关重要并据此调整行动策略。

总的来说,Nick Turley认为,OpenAI之所以能够迅速推出新成果,关键在于公司内部汇聚了大量富有执行力、能够切实“交付”成果的员工,而且公司内部的管理流程相对简洁。

与此同时,OpenAI的团队规模已从最初的150至200人扩充至大约2000人,他们通过独立项目对人员结构进行了优化,并且定期举办黑客马拉松活动,以此维护和强化团队的文化与精神风貌。

聊完招聘,接下来他们二人还对未来进行了一波预测~

Mark Chen指出,在接下来的12至18个月里,最令人惊喜的莫过于AI所展现出的“推理能力”。这种能力与之前所讨论的“Agentic范式”相契合,且在数学、科学以及编程等领域已经显现出显著的进步。

Nick Turley的观点是,接下来的关键在于处理“认知能力不足”的难题。

任何“描述清晰且受限于智力”的问题都将通过产品得到解决。

对企业而言,当前模型尚不能有效应对若干根本性难题(诸如软件工程、数据分析以及卓越的客户服务等领域),尽管这些问题的表述和评价相对简单。

消费者亦然,诸多日常生活中的繁琐事务(诸如税务申报、旅行安排、高档商品选购)均亟需“额外的智慧”以及“恰当的呈现方式”。

Nick Turley预测,在接下来的十八个月内,人工智能技术将迎来新的“交互方式”。

交流方式依旧极为实用,然而,“非同步工作流程”的现象将会愈发频繁地显现。

所谓的“异步工作流”概念,即用户仅需将任务交付给人工智能系统,系统便会在后台持续进行长时间的处理。

他坚信,这一变革将彻底转变公众对人工智能的认知,让AI不再局限于一个简单的对话工具。

在最终阶段,关于我们这些平凡人应如何面对迅猛发展的AI技术,二位的看法竟然出奇地一致——那就是:广泛运用。

Mark Chen提出,关键在于人们需主动参与并运用这项技术;Nick Turley同样指出,亲身实践AI是化解恐惧与误解的绝佳途径。

One More Thing

就在以上节目播出后,OpenAI推文底下最高赞却是:

啥时候发布GPT-5?(催更虽迟但到)

网友们并非无中生有,实际上,CEO奥特曼不久前在公开活动中已经透露过:

OpenAI计划发布一个非常强大的开源模型。

它使得人们得以在本地执行极为强大的模型,从而对“本地部署”的可行性有了全新的认识。

此外,在此之前,他亦多次强调,OpenAI计划在今年夏季发布一款新型模型(尽管推迟了多次)。

诚然如此,尽管目标已经确立,然而OpenAI近期似乎面临着不少困境。

这边看,Meta的创始人扎克伯格正大举招募人才(短短几周内接连挖走8位核心研究员),而OpenAI的内部运作实际上已经暂时陷入停滞——

最近一周基本停工,员工放假一周(高管继续工作)。

所以这GPT-5怕是又难咯~

免责声明:本站发布的所有文章图片内容,由AI一键生成,根据关键词和其他参数进行文章自动采集、加工、发布。不对文章内容的真实性、合法性、时效性负责。

版权所有 copyright 2019 长子县融媒体中心 www.zzc-media.com XML地图
《互联网新闻信息服务许可证》 证号:14120200024 《信息网络传播视听节目许可证》 证号:104420004 备案号:晋ICP备19004532号-1
友情链接 互助县树人高级中学 永川行政服务中心 济南市市中区人民政府舜耕街道办事处 邢台市应急管理宣传教育培训中心

关于站点

‌长子县融媒体中心‌是长子县的一个重要媒体机构,主要负责新闻宣传和媒体融合工作。由原‌长子县广播电视台和‌长子县新闻中心合并组建,成立于2018年12月,标志着长子县新闻宣传工作进入了融合发展的新时代‌。长子县融媒体中心位于山西省长子县会堂四楼,是长子县新闻发布和宣传活动的主要枢纽‌。

搜索Search

搜索一下,你就知道。