谷歌新研究:合成数据助力大模型数学推理能力飙升,八倍提升震惊业界

4个月前 科技 21观看
摘要 标题:谷歌新研究:合成数据助力大模型数学推理能力飙升,八倍提升震惊业界随着人工智能技术的迅猛发展,大型模型训练对训练数据的需求呈指数级增长。近日,来自谷歌、卡内基梅隆大学和MultiOn的联合研究团队发表

标题:谷歌新研究:合成数据助力大模型数学推理能力飙升,八倍提升震惊业界dkP喜好网-记录每日喜好的科技时尚娱乐生活

随着人工智能技术的迅猛发展,大型模型训练对训练数据的需求呈指数级增长。近日,来自谷歌、卡内基梅隆大学和MultiOn的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究,引起了业界广泛关注。该研究为我们揭示了合成数据在增强大模型逻辑推理能力方面的巨大潜力。dkP喜好网-记录每日喜好的科技时尚娱乐生活

首先,我们来看看当前训练数据面临的挑战。尽管全球约有300万亿个公开可用的高质量文本训练标记,但随着类似ChatGPT等大模型的迅猛发展,对训练数据的需求日益增长,预计到2026年之前,这些数据将被耗尽。因此,合成数据成为了至关重要的替代方案。dkP喜好网-记录每日喜好的科技时尚娱乐生活

在这个背景下,研究人员主要探索了两种合成数据类型:正向数据和负向数据。正向数据是由高性能大模型(如GPT-4和Gemini 1.5 Pro)生成的正确问题解决方案,为模型提供解决数学问题的示例。然而,仅依靠正向数据进行训练存在局限性。一方面,这种方法可能无法完全揭示问题解决过程背后的逻辑,模型可能会通过模式匹配来学习,而缺乏真正的理解。另一方面,随着训练数据量的增加,模型可能会学到虚假的相关性,导致在处理新问题时泛化能力下降。dkP喜好网-记录每日喜好的科技时尚娱乐生活

为了解决这些问题,研究人员引入了负向数据,即经过验证为错误的问题解决步骤。这有助于模型识别并避免错误,从而增强其逻辑推理能力。尽管使用负向数据存在挑战,因为错误的步骤可能包含误导性信息,但研究人员通过直接偏好优化(DPO)方法成功地使模型能够从错误中学习。dkP喜好网-记录每日喜好的科技时尚娱乐生活

直接偏好优化(DPO)方法为每个问题解决步骤分配一个优势值,反映其相对于理想解决方案的价值。研究表明,高优势步骤是正确解决方案的关键,而低优势步骤可能表明模型推理中存在问题。利用这些优势值,模型可以在强化学习框架内动态调整其策略,从而更高效地从合成数据中学习和改进。dkP喜好网-记录每日喜好的科技时尚娱乐生活

为了验证合成数据的有效性,研究团队使用DeepSeek-Math-7B和LLaMa2-7B等模型,在GSM8K和MATH数据集上进行了全面测试。结果显示,经过正向和负向合成数据预训练的大模型在数学推理任务上的性能实现了八倍的提升。这一结果无疑充分展示了合成数据在增强大模型逻辑推理能力方面的巨大潜力。dkP喜好网-记录每日喜好的科技时尚娱乐生活

这一突破性研究的成果不仅震惊了业界,也为我们揭示了人工智能发展的新方向。合成数据作为一种重要的替代方案,有望解决训练数据短缺的问题,为大型模型的训练提供了新的可能性。未来,我们期待看到更多的研究团队探索合成数据的潜力,推动人工智能技术的进一步发展。dkP喜好网-记录每日喜好的科技时尚娱乐生活

总的来说,谷歌等研究团队的新研究为我们展示了合成数据在大型模型训练中的重要作用。通过正向和负向数据的结合,研究人员成功地提高了大模型的逻辑推理能力,并在数学推理任务上实现了显著的提升。这一研究成果将为人工智能领域的发展注入新的活力,值得我们期待和关注。dkP喜好网-记录每日喜好的科技时尚娱乐生活

dkP喜好网-记录每日喜好的科技时尚娱乐生活

dkP喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
智己汽车携手Momenta联合打造“一段式端到端直觉智驾大模型”

智己汽车携手Momenta联合打造“

【锋巢网】10月28日,在品牌智能驾

11-19 125阅读
努比亚 Z70 Ultra 手机更多参数曝光,后置 50Mp 35mm 大底主摄

努比亚 Z70 Ultra 手机更多参数

11 月

11-19 110阅读
电池容量大了iPhone快一倍 今年国产手机咋突然悟了

电池容量大了iPhone快一倍 今年

不知道为

11-19 113阅读
华为强机皇!Mate 70系列关键信息汇总:外观/性能/影像揭秘

华为强机皇!Mate 70系列关键信息

华为Mate

11-19 116阅读
大厂离职博主,卷向海外

大厂离职博主,卷向海外

离开

11-19 123阅读
曾经家喻户晓的19位童星,现状却已今非昔比,可谓有人欢乐有人愁

曾经家喻户晓的19位童星,现

11-19 118阅读
林青霞谢娜同框, 竟是为了张杰?

林青霞谢娜同框, 竟是为了

张杰的首部舞台剧《曾经如是》正

11-19 106阅读
《藏海花之暗巢汹涌》定档11月14日 古穴探险再寻迷踪嗜血凶怪惊悚升级

《藏海花之暗巢汹涌》定档

  改编自南派三叔原著小说《藏海花

11-19 113阅读
魔兽世界年卡来了 送筋肉鱼人 兔年坐骑,怀旧服幽冥幼龙(魔兽世界年卡来了)

魔兽世界年卡来了 送筋肉

暴雪今天早晨发布了魔兽世界最新的

11-19 98阅读
文化输出第一人!网红博主李子柒回归 时隔三年更新视频

文化输出第一人!网红博主李

11月12日消息,今

11-19 117阅读
三国群英传3秘籍大全_三国群英传3秘籍代码及使用方法一览

三国群英传3秘籍大全_三国

给大家分享三国群英传3秘籍大全,里面包

11-19 108阅读
原子之心所有会说话的动物尸体所在位置分享

原子之心所有会说话的动物

在原子之心游戏里面,玩家可以通过找到所

11-19 106阅读
界面设计全面升级 NVIDIA app实际体验:五大靓点堪称N卡必备搭档

界面设计全面升级 NVIDIA

11-19 118阅读
硬件情报站第156期:AMD锐龙9800X3D黄牛价翻倍 网友14900K送保被拒

硬件情报站第156期:AMD锐龙

11-19 130阅读
原神5个战斗性隐藏成就攻略

原神5个战斗性隐藏成就攻

5个战斗性成就是原神须弥地区的隐藏任

11-19 115阅读