OpenAI揭秘GPT-4.5训练 10万块GPU全员上阵

3周前 游戏 4观看
摘要 近日,在 OpenAI 史上最贵模型 GPT-4.5 发布 1 个多月后,OpenAI 联合创始人兼 CEO 萨姆・阿尔特曼(Sam Altman)与 GPT-4.5 的 3 位核心技术人员进

近日,在 OpenAI 史上最贵模型 GPT-4.5 发布 1 个多月后,OpenAI 联合创始人兼 CEO 萨姆・阿尔特曼(Sam Altman)与 GPT-4.5 的 3 位核心技术人员进行了一场 45 分钟的高信息量对谈,首次披露了这款模型研发耗时严重超期、计算集群频繁故障、提升路径难以预测等诸多不为人知的细节。kAa喜好网-记录每日喜好的科技时尚娱乐生活

kAa喜好网-记录每日喜好的科技时尚娱乐生活

GPT-4.5 项目启动于两年前,是 OpenAI 迄今为止最周密的计划,涉及数百人团队协作,阿尔特曼称 OpenAI 为了这一项目几乎是“全员上阵”。kAa喜好网-记录每日喜好的科技时尚娱乐生活

研发过程中,OpenAI 团队遇到了不少“灾难性问题”。10 万卡集群暴露了基础设施的隐藏的小概率、深层次故障,为了权衡时效与性能,OpenAI 的系统团队不得不“边修边训”。其中,有一个隐藏的小 bug 让集群频繁报错,直到训练进度条走过约 40% 才被揪出。kAa喜好网-记录每日喜好的科技时尚娱乐生活

kAa喜好网-记录每日喜好的科技时尚娱乐生活

不过,这也帮助 OpenAI 打造了更为强大的技术栈:如今可以仅用 5-10 人便复刻出 GPT-4 级别的大模型。GPT-4 至 GPT-4.5 的性能提升约为 10 倍,获得了“难以量化但全方位增强的智能”,这点让 OpenAI 员工们都感到意外。kAa喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 团队已经意识到,要实现下一个 10 倍乃至百倍的性能提升,算力已不是瓶颈,关键在于数据效率,即开发出能够利用更多算力,从同样数量的数据中学到更多知识的方法。kAa喜好网-记录每日喜好的科技时尚娱乐生活

同时,系统正从单集群转向多集群架构,未来的训练可能涉及 1000 万块 GPU 规模的协作学习,其容错能力需要进一步提升。kAa喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
非线性悬疑侦探新作《心灵警探》现已登陆PC、PS5和Switch

非线性悬疑侦探新作《心灵

2024年11月15日,法国·蒙彼利埃 – 发行

11-19 70阅读
Steam传播仇恨指控引人质疑:青蛙表情包占一半以上

Steam传播仇恨指控引人质

在海外的许多网友都喜欢用一个名为“P

11-19 60阅读
不能现实换钱的新型NFC?《宝可梦卡牌P》再创新热潮

不能现实换钱的新型NFC?《

近期《宝可梦卡牌P》APP正式推出,引发

11-19 60阅读
饥荒无消耗驯服猪人的详细操作方法

饥荒无消耗驯服猪人的详细

猪人是饥荒游戏里面的特殊生物,因为数量

11-19 66阅读
饥荒超全影怪封印方法一览

饥荒超全影怪封印方法一览

在饥荒游戏的设定里面,玩家san值掉到0之

11-19 63阅读
广应科新增新能源汽车工程、智能科学与技术、数字媒体艺术专业

广应科新增新能源汽车工程

近日,教育部正式

04-23 22阅读
《寻找詹天佑》口述采访荟萃在广州铁职院首发

《寻找詹天佑》口述采访荟

4月23日下午,为

04-26 15阅读
西湖大学本科新增临床医学专业,本科招生专业增至8个

西湖大学本科新增临床医学

教育部于今日公布了2024年度普通高等

04-26 16阅读
这群大学生带着农民写了200多首诗

这群大学生带着农民写了20

“我们将以‘春

04-27 17阅读
父亲为女儿庆生将货车改造成“童话城堡”,孩子母亲:只花了500多元

父亲为女儿庆生将货车改造

四米二的货车,打

04-27 15阅读
全场景NOA全国开城 长城汽车闪耀广州车展

全场景NOA全国开城 长城汽

11月15日消息,11月15日,2024广州车展长城

11-19 61阅读
试驾乐道L60,这车真的能挑战特斯拉Model Y吗?

试驾乐道L60,这车真的能挑

11-19 66阅读
改装大师John Sarkisyan推出狂野版梅赛德斯-奔驰SLR McLaren

改装大师John Sarkisyan推

几年前,一个名不见经传的改装品牌S

11-19 63阅读
小米智能底盘预研技术发布 为完全自动驾驶做好准备

小米智能底盘预研技术发布

近日,雷军正式发布了小米汽车智能底

11-19 60阅读
广州车展:长安凯程品牌战略全面焕新

广州车展:长安凯程品牌战略

广州车展中,长安凯程发布全新品牌战

11-19 59阅读