Mistral AI 推出新型高性能轻量级模型

1个月前 科技 17观看
摘要 总部位于巴黎的人工智能初创公司 Mistral AI 今天宣布开源其新的轻量级 AI 模型 Mistral Small 3.1,声称其性能超越了 OpenAI 和 Google LLC 开发的类似模型。这一举措可能会加剧开发高性能低

总部位于巴黎的人工智能初创公司 Mistral AI 今天宣布开源其新的轻量级 AI 模型 Mistral Small 3.1,声称其性能超越了 OpenAI 和 Google LLC 开发的类似模型。46K喜好网-记录每日喜好的科技时尚娱乐生活

这一举措可能会加剧开发高性能低成本大语言模型的竞争。Mistral Small 3.1 仅使用 240 亿参数就能处理文本和图像,虽然规模仅为目前最先进模型的一小部分,但仍能与它们竞争。46K喜好网-记录每日喜好的科技时尚娱乐生活

在一篇博客文章中,Mistral 解释说,与其前身 Mistral Small 3 相比,Mistral Small 3.1 提供了"更好的文本处理性能、多模态理解能力,以及扩展到 128,000 个 token 的内容窗口"。46K喜好网-记录每日喜好的科技时尚娱乐生活

该公司补充说,新模型可以以每秒约 150 个 token 的速度处理数据,这使其非常适合需要快速响应的应用场景。从各方面来看,这都是一个令人印象深刻的技术成就,突显了 Mistral AI 的另类战略。与竞争对手简单地投入更多计算资源不同,该公司的许多进步源于对算法改进和训练优化技术的关注。这种方法使其能够最大化小型模型架构的性能。46K喜好网-记录每日喜好的科技时尚娱乐生活

Mistral AI 的这种方法的主要优势在于使 AI 更容易获取。通过构建能在相对普通硬件上运行的强大新模型 - 在本例中是单个 RTX 4090 显卡或配备 32GB 内存的 Mac 笔记本电脑 - 它使更先进的 AI 能够部署在更小的远程设备上。46K喜好网-记录每日喜好的科技时尚娱乐生活

与简单增加 AI 模型规模相比,Mistral 的方法最终可能更具可持续性。随着中国的 DeepSeek Ltd. 也采用类似策略,其资金更充足的竞争对手最终可能别无选择,只能走上同样的道路。46K喜好网-记录每日喜好的科技时尚娱乐生活

这家法国公司由来自 Google DeepMind 部门和 Meta Platforms Inc. 的前 AI 研究人员于 2023 年创立,现已成为欧洲顶级 AI 公司。迄今为止,该公司已筹集超过 10.4 亿美元资金,估值约为 60 亿美元。这确实是一笔巨额资金,但与 OpenAI 据报道的 800 亿美元估值相比却显得微不足道。46K喜好网-记录每日喜好的科技时尚娱乐生活

Mistral Small 3.1 是该公司最近一系列发布的最新产品。上个月,它推出了专注于阿拉伯语言和文化的新模型 Saba,本月又推出了 Mistral OCR。Mistral OCR 是一个专门使用光学字符识别将 PDF 文档转换为 Markdown 文件的模型,使其更容易被大语言模型访问。46K喜好网-记录每日喜好的科技时尚娱乐生活

这些专业产品丰富了公司更广泛的 AI 模型组合,其中包括公司当前的旗舰产品 Mistral Large 2、多模态模型 Pixtral、代码生成模型 Codestral,以及用于边缘设备的高度优化模型系列 Les Ministraux。46K喜好网-记录每日喜好的科技时尚娱乐生活

这个多样化的产品组合突显了 Mistral AI 如何根据市场需求调整其创新,创建各种专用系统以满足不断增长的需求,而不是直接与 OpenAI 和 Google 正面竞争。46K喜好网-记录每日喜好的科技时尚娱乐生活

该公司对开源的承诺也是一个独特的战略选择,在由封闭、专有模型主导的行业中脱颖而出。这种策略在某种程度上也取得了成效,其轻量级前身 Mistral Small 3 已经衍生出"几个出色的推理模型"。这表明开放合作有潜力使 AI 发展的速度远超任何单个公司独自工作的速度。46K喜好网-记录每日喜好的科技时尚娱乐生活

通过开源其模型,Mistral 还受益于更广泛的 AI 社区提供的扩展研发能力,使其能够与资金更充足的竞争对手竞争。46K喜好网-记录每日喜好的科技时尚娱乐生活

然而,Mistral 的开源策略也使其更难产生收入,因此必须寻求提供专业服务、企业部署和利用其基础技术的独特应用,以提供其他类型的优势。46K喜好网-记录每日喜好的科技时尚娱乐生活

Mistral 选择的道路是否正确仍有待观察,但目前显然 Mistral Small 3.1 是一个重要的技术成就,强化了强大的 AI 模型可以以更小、更高效的包装形式实现的理念。46K喜好网-记录每日喜好的科技时尚娱乐生活

Mistral Small 3.1 可通过 Huggingface 下载,也可以通过 Mistral 的 AI 应用程序接口或 Google Cloud 的 Vertex AI 平台访问。在未来几周内,它还将通过 Nvidia Corp. 的 NIM 微服务和 Microsoft Corp. 的 Azure AI Foundry 提供。46K喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
《无限暖暖》12月5日全球公测

《无限暖暖》12月5日全球公测

11-19 66阅读
焦虑的开发者,涌向“纯血鸿蒙”培训班

焦虑的开发者,涌向“纯血鸿蒙”培

有两

11-19 64阅读
收到500万份垄断诉讼,谷歌要被拆分?

收到500万份垄断诉讼,谷歌要被拆

谷歌

11-19 67阅读
投中的播客栏目,叫“大北窑14F”

投中的播客栏目,叫“大北窑14F”

投中

11-19 65阅读
东方树叶们的「备胎上位史」

东方树叶们的「备胎上位史」

中国

11-19 68阅读
抖音短剧《大话·大话西游》开播 33位喜剧人出演

抖音短剧《大话·大话西游

11月8日消息,据抖音集团官方公众号透露,

11-19 71阅读
“嫖娼门”王全安:前任个个赛西施,花800元睡站台女,终遭报应

“嫖娼门”王全安:前任个个

11-19 68阅读
千古玦尘凤染和是凤焰什么关系?白烁是月弥的转世吗?

千古玦尘凤染和是凤焰什么

《千古诀尘》中凤染和是凤焰什么

11-19 65阅读
《芝麻胡同》郭秉惠人设崩了?她竟嫌弃起杏儿的出身

《芝麻胡同》郭秉惠人设崩

《芝麻胡同》中郭秉惠前期是一个

11-19 61阅读
火热气氛拉满!超级音雄·巨星演唱会-汕头站12/22重磅来袭

火热气氛拉满!超级音雄·巨

  在全国收获无数好评、演出场场爆

11-19 66阅读
卧龙苍天陨落武将韩当解锁方法详细介绍

卧龙苍天陨落武将韩当解锁

韩当是三国历史上孙吴阵营的名将,在卧龙

11-19 72阅读
原子之心巴浦洛夫综合体区域死者位置分享

原子之心巴浦洛夫综合体区

原子之心游戏中的巴浦洛夫综合体区域里

11-19 69阅读
饥荒猪皮怎么获得?饥荒猪皮获得方法详细介绍

饥荒猪皮怎么获得?饥荒猪

饥荒猪皮怎么获得?猪皮是饥荒游戏里面的

11-19 68阅读
饥荒饥饿腰带制作方法及制作材料分享

饥荒饥饿腰带制作方法及制

饥饿腰带是饥荒游戏里面的一件魔法物品

11-19 69阅读
原神训练有素的考古学家隐藏成就任务攻略

原神训练有素的考古学家隐

训练有素的考古学家是须弥沙漠地区的隐

11-19 71阅读