AI推理模型崛起:挑战与成本飙升之战

3周前 科技 7观看
摘要 AI推理模型崛起的挑战与成本飙升之战随着人工智能(AI)技术的不断发展,AI推理模型已成为研究热点。这些模型能够像人类一样逐步思考问题,并在特定领域展现出强大的能力,如物理学。然而,随着这些模型的崛起,其测试

AI推理模型崛起的挑战与成本飙升之战CRi喜好网-记录每日喜好的科技时尚娱乐生活

随着人工智能(AI)技术的不断发展,AI推理模型已成为研究热点。这些模型能够像人类一样逐步思考问题,并在特定领域展现出强大的能力,如物理学。然而,随着这些模型的崛起,其测试成本也相应飙升,给研究者带来了新的挑战。CRi喜好网-记录每日喜好的科技时尚娱乐生活

首先,让我们了解一下AI推理模型的工作原理。这些模型能够理解和分析输入的信息,并根据已有的知识库进行推理,得出相应的结论。在某些领域,如物理学中,这种推理能力被认为比非推理模型更具优势。然而,这种优势的代价是高昂的测试成本。CRi喜好网-记录每日喜好的科技时尚娱乐生活

据第三方AI测试机构“人工智能分析”(Artificial Analysis)的数据显示,评估OpenAI的o1推理模型在七个流行的AI基准测试中的表现,需要花费高达2767.05美元。而评估Anthropic的Claude 3.7 Sonnet这一“混合”推理模型的成本也达到了1485.35美元。相比之下,测试OpenAI的o3-mini-high只需344.59美元。尽管有些推理模型的测试成本相对较低,但从整体来看,推理模型的测试成本仍然较高。CRi喜好网-记录每日喜好的科技时尚娱乐生活

那么,为什么推理模型的测试成本如此之高呢?主要原因在于它们生成了大量的token。Token代表原始文本的片段,例如将单词“fantastic”拆分为音节“fan”、“tas”和“tic”。据“人工智能分析”称,在该公司的基准测试中,OpenAI的o1生成了超过4400万个token。这不仅意味着需要大量的计算资源,还使得评估成本容易累积。CRi喜好网-记录每日喜好的科技时尚娱乐生活

此外,现代基准测试通常会从模型中引出大量token,因为它们包含涉及复杂、多步骤任务的问题。这不仅是因为基准测试现在更加复杂,而且每个基准测试的问题数量总体有所减少。它们通常试图评估模型执行现实世界任务的能力,例如编写和执行代码、浏览互联网以及使用计算机。CRi喜好网-记录每日喜好的科技时尚娱乐生活

然而,这并不是推理模型测试成本飙升的唯一原因。随着时间的推移,模型的性能和复杂性不断提高,但达到给定性能水平的成本并没有相应大幅下降。相反,随着竞争加剧和研发投入的增加,每个token的成本也在增加。例如,Anthropic在2024年5月发布的Claude 3 Opus是当时最昂贵的模型,每百万输出token的成本为75美元。而OpenAI今年早些时候推出的GPT-4.5和o1-pro,每百万输出token的成本分别为150美元和600美元。CRi喜好网-记录每日喜好的科技时尚娱乐生活

尽管随着时间的推移,模型的性能有所提高,达到给定性能水平的成本也确实大幅下降了,但如果你想在任何特定时间评估最大最好的模型,你仍然需要支付更多。这也意味着难以复制和比较不同实验室的研究结果,给学术界和研究机构带来了新的挑战。CRi喜好网-记录每日喜好的科技时尚娱乐生活

尽管面临这些挑战和成本飙升,AI推理模型的发展仍具有重要意义。它们为特定领域的科研和应用提供了强大的工具,有望推动科学和技术的进步。因此,我们需要继续研究和开发这些模型,同时也要寻找降低测试成本的方法,以便更广泛地应用这些模型。这可能包括改进基准测试方法、优化模型生成过程和使用更经济高效的计算资源。CRi喜好网-记录每日喜好的科技时尚娱乐生活

最后,虽然推理模型的测试成本高昂,但我们必须认识到这只是技术发展过程中的一个暂时问题。随着科研人员的努力和技术的进步,我们相信会有更多的解决方案出现,帮助我们克服这些挑战并加速AI技术的发展。CRi喜好网-记录每日喜好的科技时尚娱乐生活

CRi喜好网-记录每日喜好的科技时尚娱乐生活

CRi喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
戴森设计大奖国际20强名单出炉

戴森设计大奖国际20强名单出炉

【锋巢网】首次有两支中国大陆赛

11-19 64阅读
华为Mate 70已经到店:数量有限 抢到赚到

华为Mate 70已经到店:数量有限 抢

11月19日

11-19 65阅读
大模型公司们创业未半,技术主心骨们却先弃船回大厂了?

大模型公司们创业未半,技术主心骨

2024

11-19 61阅读
轻云鲸裕完成数千万元的Pre-A轮融资

轻云鲸裕完成数千万元的Pre-A轮

近期,

11-19 59阅读
高端餐饮的苦日子还在后头

高端餐饮的苦日子还在后头

近日,

11-19 66阅读
太太太灵了吧,这是什么「好东西」

太太太灵了吧,这是什么「好

作者 / 西贝偏北运营 / 狮子座还记得

11-19 61阅读
“骗”来30+喜剧人,《大话大话西游》好一场内容共创|Talk专访蒋龙

“骗”来30+喜剧人,《大话大

作者 / 张   特采访、编辑 / 朱 

11-19 62阅读
贾乃亮帮清购物车, 网友没胆安利给自家老板!

贾乃亮帮清购物车, 网友没

今天双十二,大家剁手了吗!小编是没

11-19 60阅读
THE BOYZ金善旴遭私生殴打 警方已经逮捕私生

THE BOYZ金善旴遭私生殴打

  11月14日,据韩媒报道称,男

11-19 58阅读
2024东方卫视跨年首发阵容,胡歌唐嫣代表《繁花》剧组亮相

2024东方卫视跨年首发阵容

12月25日,2024东方卫视跨年首发阵

11-19 58阅读
和平精英灵敏度怎么调最稳?和平精英灵敏度设置2024最新版

和平精英灵敏度怎么调最稳

《和平精英》是一款全民枪战竞技手游,采

11-19 89阅读
在360安装目录创建exe文件提示目标文件夹访问被拒绝的解决方法

在360安装目录创建exe文件

最近有网友反映,自己想要在360安全卫士

11-19 90阅读
原子之心展览园地下区域死者位置介绍

原子之心展览园地下区域死

原子之心游戏里面玩家可以与所有死者对

11-19 62阅读
原神已然来临的花神诞祭任务攻略

原神已然来临的花神诞祭任

原神已然来临的花神诞祭是原神须弥地区

11-19 60阅读
饥荒超详细驯服牦牛技巧分享

饥荒超详细驯服牦牛技巧分

在饥荒游戏里面玩家可以驯服牦牛,而且根

11-19 63阅读