最热门的 AI 模型:它们的功能和使用方法

2个月前 科技 20观看
摘要 AI 模型正在以令人眼花缭乱的速度被推出,从 Google 等大型科技公司到 OpenAI 和 Anthropic 等初创公司都在参与其中。跟踪最新的模型可能会让人感到不知所措。增加混乱的是,AI 模型通常基于行

AI 模型正在以令人眼花缭乱的速度被推出,从 Google 等大型科技公司到 OpenAI 和 Anthropic 等初创公司都在参与其中。跟踪最新的模型可能会让人感到不知所措。J34喜好网-记录每日喜好的科技时尚娱乐生活

增加混乱的是,AI 模型通常基于行业基准进行推广。但这些技术指标往往很少揭示真实的人和公司实际如何使用它们。J34喜好网-记录每日喜好的科技时尚娱乐生活

为了帮助大家理清思路,TechCrunch 汇总了一份自 2024 年以来发布的最先进 AI 模型概述,详细介绍了如何使用它们以及它们的最佳用途。我们也会不断更新这份清单,以涵盖最新的发布。J34喜好网-记录每日喜好的科技时尚娱乐生活

实际上,市面上有超过一百万个 AI 模型:例如,Hugging Face 就托管了超过 140 万个。因此,这份清单可能会遗漏一些在某些方面表现更好的模型。J34喜好网-记录每日喜好的科技时尚娱乐生活

2025 年发布的 AI 模型:J34喜好网-记录每日喜好的科技时尚娱乐生活

Cohere 的 Aya VisionJ34喜好网-记录每日喜好的科技时尚娱乐生活

Cohere 发布了一款名为 Aya Vision 的多模态模型,据称在图像字幕和回答照片相关问题等方面表现出色。与其他模型不同的是,它在非英语语言方面也表现优异。该模型可以在 WhatsApp 上免费使用。J34喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 的 GPT 4.5 “Orion”J34喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 称 Orion 是他们迄今为止最大的模型,具有强大的“世界知识”和“情感智能”。然而,与更新的推理模型相比,它在某些基准测试中表现不佳。Orion 可供 OpenAI 每月 200 美元计划的订阅者使用。J34喜好网-记录每日喜好的科技时尚娱乐生活

Claude Sonnet 3.7J34喜好网-记录每日喜好的科技时尚娱乐生活

Anthropic 称这是业界首个“混合”推理模型,因为它既可以快速给出答案,也可以在需要时深入思考。用户还可以控制模型思考的时间。Sonnet 3.7 对所有 Claude 用户开放,但重度用户需要每月 20 美元的 Pro 计划。J34喜好网-记录每日喜好的科技时尚娱乐生活

xAI 的 Grok 3J34喜好网-记录每日喜好的科技时尚娱乐生活

Grok 3 是由 Elon Musk 创立的初创公司 xAI 最新的旗舰模型。据称在数学、科学和编码方面优于其他领先模型。该模型需要 X Premium(每月 50 美元)。在一项研究发现 Grok 2 倾向于左翼后,Musk 承诺将 Grok 调整得更“政治中立”,但尚不清楚是否已实现。J34喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI o3-miniJ34喜好网-记录每日喜好的科技时尚娱乐生活

这是 OpenAI 最新的推理模型,专为与 STEM 相关的任务(如编码、数学和科学)优化。虽然不是 OpenAI 最强大的模型,但由于体积较小,公司称其成本显著降低。它可以免费使用,但重度用户需要订阅。J34喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 深度研究J34喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 的深度研究旨在对某个主题进行深入研究,并提供清晰的引用。此服务仅在 ChatGPT 每月 200 美元的 Pro 订阅中提供。OpenAI 推荐它用于从科学到购物研究的各种用途,但需要注意的是幻觉仍然是 AI 的一个问题。J34喜好网-记录每日喜好的科技时尚娱乐生活

Mistral Le ChatJ34喜好网-记录每日喜好的科技时尚娱乐生活

Mistral 推出了 Le Chat 的应用程序版本,这是一款多模态 AI 个人助理。Mistral 声称 Le Chat 的响应速度比任何其他聊天机器人都快。它还有一个付费版本,提供来自 AFP 的最新新闻报道。Le Monde 的测试发现 Le Chat 的表现令人印象深刻,尽管错误比 ChatGPT 更多。J34喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI OperatorJ34喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 的 Operator 意在成为一个可以独立完成任务的个人助理,比如帮助你购买杂货。它需要每月 200 美元的 ChatGPT Pro 订阅。AI 代理有很大的潜力,但仍处于实验阶段:一位《华盛顿邮报》的评论员表示,Operator 自行决定订购了 31 美元的一打鸡蛋,并用评论员的信用卡支付。J34喜好网-记录每日喜好的科技时尚娱乐生活

Google Gemini 2.0 Pro 实验版J34喜好网-记录每日喜好的科技时尚娱乐生活

Google Gemini 的备受期待的旗舰模型声称在编码和理解一般知识方面表现出色。它还具有 200 万 Token 的超长上下文窗口,帮助用户快速处理大量文本。该服务至少需要每月 19.99 美元的 Google One AI Premium 订阅。J34喜好网-记录每日喜好的科技时尚娱乐生活

2024 年发布的 AI 模型:J34喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek R1J34喜好网-记录每日喜好的科技时尚娱乐生活

这款中国 AI 模型在硅谷引起了轰动。DeepSeek 的 R1 在编码和数学方面表现良好,而其开源性质意味着任何人都可以在本地运行。此外,它是免费的。然而,R1 集成了中国政府的审查制度,并因可能将用户数据传回中国而面临日益增加的禁令。J34喜好网-记录每日喜好的科技时尚娱乐生活

Gemini 深度研究J34喜好网-记录每日喜好的科技时尚娱乐生活

深度研究将 Google 的搜索结果总结为一个简单且有良好引用的文档。该服务对学生和其他需要快速研究总结的人很有帮助。然而,其质量远不及实际的同行评审论文。深度研究需要每月 19.99 美元的 Google One AI Premium 订阅。J34喜好网-记录每日喜好的科技时尚娱乐生活

Meta Llama 3.3 70BJ34喜好网-记录每日喜好的科技时尚娱乐生活

这是 Meta 最新且最先进的开源 Llama AI 模型版本。Meta 宣称这个版本是迄今为止最便宜和最有效的,特别是在数学、一般知识和指令遵循方面。它是免费和开源的。J34喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI SoraJ34喜好网-记录每日喜好的科技时尚娱乐生活

Sora 是一个基于文本创建逼真视频的模型。虽然它可以生成整个场景而不仅仅是片段,但 OpenAI 承认它经常生成“不现实的物理效果”。目前,它仅在 ChatGPT 的付费版本上可用,起价为每月 20 美元的 Plus。J34喜好网-记录每日喜好的科技时尚娱乐生活

阿里巴巴 Qwen QwQ-32B-PreviewJ34喜好网-记录每日喜好的科技时尚娱乐生活

该模型是少数在某些行业基准上能与 OpenAI 的 o1 媲美的模型之一,在数学和编码方面表现出色。讽刺的是,作为一个“推理模型”,它在常识推理方面“还有改进空间”,阿里巴巴表示。TechCrunch 的测试显示,它还包含了中国政府的审查制度。它是免费和开源的。J34喜好网-记录每日喜好的科技时尚娱乐生活

Anthropic 的计算机使用J34喜好网-记录每日喜好的科技时尚娱乐生活

Claude 的计算机使用旨在控制你的计算机以完成任务,如编码或预订机票,使其成为 OpenAI 的 Operator 的前身。然而,计算机使用仍处于测试阶段。定价通过 API:每百万输入 Token 收费 0.80 美元,每百万输出 Token 收费 4 美元。J34喜好网-记录每日喜好的科技时尚娱乐生活

xAI 的 Grok 2J34喜好网-记录每日喜好的科技时尚娱乐生活

Elon Musk 的 AI 公司 xAI 推出了其旗舰 Grok 2 聊天机器人的增强版本,声称“速度提高了三倍”。免费用户在 Grok 上每两小时限制提问 10 个问题,而 X 的 Premium 和 Premium+ 计划的订阅者享有更高的使用限制。xAI 还推出了一个名为 Aurora 的图像生成器,可以生成高度逼真的图像,包括一些图形或暴力内容。J34喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI o1J34喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 的 o1 系列旨在通过隐藏的推理功能“思考”响应,从而产生更好的答案。OpenAI 声称该模型在编码、数学和安全性方面表现出色,但也存在试图欺骗人类的问题。使用 o1 需要订阅 ChatGPT Plus,每月 20 美元。J34喜好网-记录每日喜好的科技时尚娱乐生活

Anthropic 的 Claude Sonnet 3.5J34喜好网-记录每日喜好的科技时尚娱乐生活

Claude Sonnet 3.5 是一个 Anthropic 宣称为同类最佳的模型。它因其编码能力而闻名,被认为是技术内部人士的首选聊天机器人。该模型可以在 Claude 上免费访问,但重度用户需要每月 20 美元的 Pro 订阅。虽然它可以理解图像,但不能生成图像。J34喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI GPT 4o-miniJ34喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 宣称 GPT 4o-mini 是其迄今为止最实惠和最快的模型,得益于其小巧的体积。它旨在支持广泛的任务,如为客户服务聊天机器人提供动力。该模型在 ChatGPT 的免费层上可用。与更复杂的任务相比,它更适合高容量的简单任务。J34喜好网-记录每日喜好的科技时尚娱乐生活

Cohere Command R+J34喜好网-记录每日喜好的科技时尚娱乐生活

Cohere 的 Command R+ 模型在复杂的检索增强生成(或 RAG)应用中表现出色。这意味着它可以非常好地查找和引用特定的信息。 (RAG 的发明者实际上在 Cohere 工作。)不过,RAG 并没有完全解决 AI 的幻觉问题。J34喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
极氪总裁提醒用户警惕杀猪盘:低价买车是诱饵

极氪总裁提醒用户警惕杀猪盘:低价

11月19日

11-19 69阅读
iPhone 17 Pro Max外观曝光:灵动岛变小

iPhone 17 Pro Max外观曝光:灵动

11月19日

11-19 68阅读
小米汽车发布智能底盘预研技术,实现多种高难度动作‌

小米汽车发布智能底盘预研技术,实

11-19 64阅读
李子柒:反商业化「顶流」

李子柒:反商业化「顶流」

沉寂1

11-19 65阅读
摸着Meta过河,百度再战AI眼镜

摸着Meta过河,百度再战AI眼镜

“Goo

11-19 65阅读
《假日暖洋洋》姚晨与小11岁白宇演 姐弟恋 ,别说,还真甜(假日暖洋洋姚晨与小11岁白宇演)

《假日暖洋洋》姚晨与小11

有生之年,欣喜相逢。 我是温暖,欢迎

11-19 69阅读
()

()

点击蓝字 关注我们 摘要 今天

11-19 67阅读
2024东方卫视跨年首发阵容,胡歌唐嫣代表《繁花》剧组亮相

2024东方卫视跨年首发阵容

12月25日,2024东方卫视跨年首发阵

11-19 64阅读
全新《柯南》动画上线:侦探与怪盗抢王者水晶

全新《柯南》动画上线:侦探

11月18日消息,《

11-19 68阅读
《最后生还者》新季明年春首播

《最后生还者》新季明年春

HBO及HBO Max首

11-19 69阅读
Steam传播仇恨指控引人质疑:青蛙表情包占一半以上

Steam传播仇恨指控引人质

在海外的许多网友都喜欢用一个名为“P

11-19 67阅读
不能现实换钱的新型NFC?《宝可梦卡牌P》再创新热潮

不能现实换钱的新型NFC?《

近期《宝可梦卡牌P》APP正式推出,引发

11-19 65阅读
玩转无忧传奇行会系统,成就宏图霸业

玩转无忧传奇行会系统,成就

行会是无忧传奇中一个非常重要的组成部

11-19 67阅读
金庸群侠传3加强版古墓路线全流程详细攻略

金庸群侠传3加强版古墓路

金庸群侠传3游戏里面玩家可以自由选择

11-19 119阅读
原子之心巴浦洛夫综合体区域死者位置分享

原子之心巴浦洛夫综合体区

原子之心游戏中的巴浦洛夫综合体区域里

11-19 69阅读