Deep Cogito 推出混合型 AI "推理"模型

4个月前 科技 22观看
摘要 一家名为 Deep Cogito 的新公司近期揭开面纱,推出了一系列可以在"推理"和非推理模式之间切换的开放 AI 模型。像 OpenAI 的 o1 这样的推理模型在数学和物理等领域展现出巨大潜力,这要归功于它

一家名为 Deep Cogito 的新公司近期揭开面纱,推出了一系列可以在"推理"和非推理模式之间切换的开放 AI 模型。S9F喜好网-记录每日喜好的科技时尚娱乐生活

像 OpenAI 的 o1 这样的推理模型在数学和物理等领域展现出巨大潜力,这要归功于它们能够通过逐步解决复杂问题来进行自我验证的能力。然而,这种推理能力是有代价的:更高的计算成本和延迟。这就是为什么像 Anthropic 这样的实验室正在追求"混合"模型架构,将推理组件与标准的非推理元素相结合。混合模型可以快速回答简单问题,同时在处理更具挑战性的问题时投入更多时间思考。S9F喜好网-记录每日喜好的科技时尚娱乐生活

Deep Cogito 的所有模型(称为 Cogito 1)都是混合模型。该公司声称,这些模型的性能优于同等规模的最佳开放模型,包括来自 Meta 和中国 AI 初创公司 DeepSeek 的模型。S9F喜好网-记录每日喜好的科技时尚娱乐生活

该公司在博客文章中解释道:"每个模型都可以直接回答问题,或在回答前进行自我反思(类似推理模型)。所有这些都是由一个小团队在大约 75 天内开发完成的。"S9F喜好网-记录每日喜好的科技时尚娱乐生活

Cogito 1 模型的参数规模从 30 亿到 700 亿不等,该公司表示,在未来几周和几个月内,将会推出参数规模达到 6710 亿的模型。参数数量大致对应于模型的问题解决能力,通常参数越多越好。S9F喜好网-记录每日喜好的科技时尚娱乐生活

需要说明的是,Cogito 1 并非从零开始开发。Deep Cogito 是在 Meta 的开源 Llama 和阿里巴巴的 Qwen 模型基础上构建的。该公司表示,他们应用了新颖的训练方法来提升基础模型的性能,并实现可切换的推理能力。S9F喜好网-记录每日喜好的科技时尚娱乐生活

根据 Cogito 的内部基准测试结果,最大的 Cogito 1 模型——启用推理功能的 Cogito 70B,在某些数学和语言评估中的表现优于 DeepSeek 的 R1 推理模型。在禁用推理功能的情况下,Cogito 70B 在通用 AI 测试 LiveBench 上的表现也超过了 Meta 最近发布的 Llama 4 Scout 模型。S9F喜好网-记录每日喜好的科技时尚娱乐生活

所有 Cogito 1 模型都可以通过 Fireworks AI 和 Together AI 这两家云服务提供商的 API 下载或使用。S9F喜好网-记录每日喜好的科技时尚娱乐生活

"目前,我们仍处于扩展曲线的早期阶段,仅使用了传统大语言模型后期/持续训练所需计算资源的一小部分,"Cogito 在其博客文章中写道。"展望未来,我们正在研究互补的后期训练方法来实现自我提升。"S9F喜好网-记录每日喜好的科技时尚娱乐生活

根据加利福尼亚州的文件显示,总部位于旧金山的 Deep Cogito 成立于 2024 年 6 月。该公司的 LinkedIn 页面列出了两位联合创始人:Drishan Arora 和 Dhruv Malhotra。Malhotra 此前是 Google AI 实验室 DeepMind 的产品经理,负责生成式搜索技术。Arora 曾是 Google 的高级软件工程师。S9F喜好网-记录每日喜好的科技时尚娱乐生活

根据 PitchBook 的信息,Deep Cogito 的投资方包括 South Park Commons,该公司雄心勃勃地致力于构建"通用超级智能"。公司创始人将这个术语理解为能够比大多数人更好地完成任务,并"发现我们尚未想象到的全新能力"的 AI。S9F喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
护眼的2K旗舰!Redmi K80是行业唯一支持全亮度DC的2K屏手机

护眼的2K旗舰!Redmi K80是行业唯

11月18日

11-19 120阅读
睿蓝8七座纯电MPV上市,起售价13.78万元

睿蓝8七座纯电MPV上市,起售价13.7

11-19 106阅读
李子柒:反商业化「顶流」

李子柒:反商业化「顶流」

沉寂1

11-19 104阅读
大佬喊话,AI寒冬已来?

大佬喊话,AI寒冬已来?

OpenA

11-19 109阅读
洋咖啡,为何卖不动了?

洋咖啡,为何卖不动了?

近日,

11-19 111阅读
千古玦尘凤染和是凤焰什么关系?白烁是月弥的转世吗?

千古玦尘凤染和是凤焰什么

《千古诀尘》中凤染和是凤焰什么

11-19 112阅读
释彦能:银幕硬汉,反派巅峰——正邪交锋,票房破亿传奇!

释彦能:银幕硬汉,反派巅峰—

  在当今动作电影的舞台上,释彦能以

11-19 120阅读
陈学冬终于有剧要播了,新剧《漂洋过海再爱你》与宋轶搭档

陈学冬终于有剧要播了,新剧

陈学冬好久没有出新作品了,12月24

11-19 103阅读
苦等七年终于来了!《白夜破晓》长丰集结海报出炉:潘粤明主演

苦等七年终于来了!《白夜破

11月17日消息,时

11-19 98阅读
童年女神归来!《猫眼三姐妹》动画将迎来重制

童年女神归来!《猫眼三姐妹

根据海外情报师

11-19 119阅读
《如龙8外传 夏威夷海盗》演员采访视频:谷田步篇

《如龙8外传 夏威夷海盗》

世嘉公开了《人中之龙8外传Pirates in

11-19 122阅读
非线性悬疑侦探新作《心灵警探》现已登陆PC、PS5和Switch

非线性悬疑侦探新作《心灵

2024年11月15日,法国·蒙彼利埃 – 发行

11-19 139阅读
索尼正在开发自动检测游戏BUG的AI系统:简化测试流程

索尼正在开发自动检测游戏

根据 Tech4Gamer 报道,根据索尼目前发

11-19 112阅读
烟雨江湖千机遗迹怎么开启?烟雨江湖千机遗迹攻略流程

烟雨江湖千机遗迹怎么开启

《烟雨江湖》是一款开放世界武侠冒险手

11-19 208阅读
以撒的结合全结局及其达成条件详细介绍

以撒的结合全结局及其达成

以撒的结合是一款剧情和玩法都非常精彩

11-19 141阅读