Meta发布Llama 4,新一代旗舰AI模型

4个月前 科技 19观看
摘要 Meta发布了Llama系列的新一代AI模型集合Llama 4——而且选在了周六这一天。这次共发布了四个新模型:Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。Meta表示,所有模型都经过

Meta发布了Llama系列的新一代AI模型集合Llama 4——而且选在了周六这一天。GSP喜好网-记录每日喜好的科技时尚娱乐生活

这次共发布了四个新模型:Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。Meta表示,所有模型都经过了"大量无标签文本、图像和视频数据"的训练,使它们具备"广泛的视觉理解能力"。GSP喜好网-记录每日喜好的科技时尚娱乐生活

据报道,中国AI实验室DeepSeek开源模型的成功(其性能与Meta之前的旗舰Llama模型相当甚至更优)促使Llama开发进入加速模式。据说Meta组建了紧急工作组,以破解DeepSeek如何降低R1和V3等模型的运行和部署成本。GSP喜好网-记录每日喜好的科技时尚娱乐生活

Scout和Maverick已在Llama.com和Meta合作伙伴(包括AI开发平台Hugging Face)上公开提供,而Behemoth仍在训练中。Meta表示,其AI助手Meta AI已在40个国家的WhatsApp、Messenger和Instagram等应用中更新为使用Llama 4。多模态功能目前仅限美国地区使用英语。GSP喜好网-记录每日喜好的科技时尚娱乐生活

一些开发者可能会对Llama 4的许可条款有异议。GSP喜好网-记录每日喜好的科技时尚娱乐生活

"居住"或"主要营业地"在欧盟的用户和公司被禁止使用或分发这些模型,这可能是由于该地区AI和数据隐私法律施加的治理要求所致(Meta过去曾抨击这些法律过于繁重)。此外,与之前的Llama版本一样,月活跃用户超过7亿的公司必须向Meta申请特殊许可,而Meta可自行决定是否授予。GSP喜好网-记录每日喜好的科技时尚娱乐生活

"这些Llama 4模型标志着Llama生态系统新时代的开始,"Meta在博客文章中写道。"这仅仅是Llama 4系列的开始。"GSP喜好网-记录每日喜好的科技时尚娱乐生活

Meta表示,Llama 4是该公司首批使用混合专家(MoE)架构的模型系列,这种架构在训练和回答查询方面更具计算效率。MoE架构基本上将数据处理任务分解为子任务,然后将它们分配给较小的、专业化的"专家"模型。GSP喜好网-记录每日喜好的科技时尚娱乐生活

例如,Maverick拥有4000亿总参数,但在128个"专家"中只有170亿活跃参数(参数大致对应于模型的问题解决能力)。Scout有170亿活跃参数、16位专家和1090亿总参数。GSP喜好网-记录每日喜好的科技时尚娱乐生活

根据Meta的内部测试,Maverick(该公司表示最适合"通用助手和聊天"用例,如创意写作)在某些编码、推理、多语言、长上下文和图像基准测试上超过了OpenAI的GPT-4o和Google的Gemini 2.0等模型。然而,Maverick在能力上尚不及Google的Gemini 2.5 Pro、Anthropic的Claude 3.7 Sonnet和OpenAI的GPT-4.5等更强大的最新模型。GSP喜好网-记录每日喜好的科技时尚娱乐生活

Scout的优势在于文档摘要和大型代码库推理等任务。其独特之处在于拥有非常大的上下文窗口:1000万个token("token"代表原始文本的片段,例如"fantastic"被分割为"fan"、"tas"和"tic")。简单来说,Scout可以处理图像和多达数百万字的文本,使其能够处理和使用极长的文档。GSP喜好网-记录每日喜好的科技时尚娱乐生活

根据Meta的计算,Scout可以在单个Nvidia H100 GPU上运行,而Maverick需要Nvidia H100 DGX系统或同等设备。GSP喜好网-记录每日喜好的科技时尚娱乐生活

Meta尚未发布的Behemoth将需要更强大的硬件。据该公司介绍,Behemoth拥有2880亿活跃参数、16位专家和近2万亿总参数。Meta的内部基准测试显示,Behemoth在衡量数学问题解决等STEM技能的多项评估中优于GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro(但不及2.5 Pro)。GSP喜好网-记录每日喜好的科技时尚娱乐生活

值得注意的是,Llama 4模型系列中没有一个是类似OpenAI的o1和o3-mini那样的真正"推理"模型。推理模型会对其回答进行事实检查,通常对问题的回应更可靠,但因此比传统的"非推理"模型需要更长时间来提供答案。GSP喜好网-记录每日喜好的科技时尚娱乐生活

有趣的是,Meta表示它调整了所有Llama 4模型,使其拒绝回答"有争议"问题的频率降低。据该公司称,Llama 4会回应之前Llama模型不会回答的"有争议的"政治和社会话题。此外,该公司表示,Llama 4在处理它完全不会回应的提示方面"平衡性大大提高"。GSP喜好网-记录每日喜好的科技时尚娱乐生活

"你可以依靠[Llama 4]提供有帮助、基于事实且不带判断的回应,"Meta发言人告诉TechCrunch。"我们继续让Llama更具响应性,使其能够回答更多问题,能够回应各种不同的观点[...],不偏向某些观点。"GSP喜好网-记录每日喜好的科技时尚娱乐生活

这些调整正值一些白宫盟友指责AI聊天机器人在政治上过于"觉醒"之际。GSP喜好网-记录每日喜好的科技时尚娱乐生活

唐纳德·特朗普总统的许多亲密伙伴,包括亿万富翁埃隆·马斯克和加密货币与AI"沙皇"大卫·萨克斯,都曾指责流行的AI聊天机器人审查保守派观点。萨克斯历来将OpenAI的ChatGPT视为"被编程为觉醒派",并在政治主题上不诚实。GSP喜好网-记录每日喜好的科技时尚娱乐生活

实际上,AI中的偏见是一个难以解决的技术问题。马斯克自己的AI公司xAI也一直在努力创建一个不会支持某些政治观点胜过其他观点的聊天机器人。GSP喜好网-记录每日喜好的科技时尚娱乐生活

这并没有阻止包括OpenAI在内的公司调整其AI模型,使其回答比以前更多的问题,特别是与争议主题相关的问题。GSP喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
董宇辉终究难逃宿命

董宇辉终究难逃宿命

直播带货业已进入到一场深度洗牌

11-19 133阅读
小米手机下次相机版本更新增加水印颜色选项,老机型也会版本迭代

小米手机下次相机版本更新增加水

11 月

11-19 113阅读
小鹏汇天“陆地航母”2024 广州车展完成全球公开载人首飞

小鹏汇天“陆地航母”2024 广州

11-19 116阅读
一家城配自动驾驶服务商,融了7个亿丨投融周报

一家城配自动驾驶服务商,融了7个

大家

11-19 125阅读
炒过Labubu,再也忘不掉日入2万的滋味

炒过Labubu,再也忘不掉日入2万的

“家

11-19 125阅读
味道研究所 | 橘黄变棕红 这口Q糯甜香深深烙印在你心间(味道研究所橘黄变棕红)

味道研究所 | 橘黄变棕红

© |菜头 遂昌乡村有着独特的

11-19 109阅读
2024东方卫视跨年首发阵容,胡歌唐嫣代表《繁花》剧组亮相

2024东方卫视跨年首发阵容

12月25日,2024东方卫视跨年首发阵

11-19 106阅读
我们都在等待,等待钟声响起的那一刻。那是我生命最后的一刻,那也是最好的时刻

我们都在等待,等待钟声响起

  一段民族不可遗忘的历史,一个隐蔽

11-19 106阅读
吐槽黄焖鸡不要点的博主被禁言:自称不是骑手 作品都是段子

吐槽黄焖鸡不要点的博主被

11月19日消息,据

11-19 111阅读
肖战演郭靖!新《射雕》能复兴徐克的武侠梦吗 网友:肩负文化出海重任

肖战演郭靖!新《射雕》能复

11月18日消息,由

11-19 105阅读
《暗喻幻想: ReFantazio》发布最新宣传片 “剧情预告片2”

《暗喻幻想: ReFantazio》

《暗喻幻想: ReFantazio》发布最新宣传

11-19 112阅读
真人互动恋爱影游《欢迎光临!心动咖啡厅》Steam页面开放 发行日期待定

真人互动恋爱影游《欢迎光

今日(11月16日),真人互动恋爱影游《欢迎

11-19 119阅读
CS1.6怎么加机器人?CS1.6加机器人方法

CS1.6怎么加机器人?CS1.6

《CS1.6》也就是大家都玩过的反恐精英

11-19 192阅读
原子之心动物谜题答案_动物谜题解谜教程

原子之心动物谜题答案_动

原子之心游戏中玩家会碰到一个动物谜题

11-19 137阅读
饥荒龙心怎么获得?饥荒快速获得龙心的技巧分享

饥荒龙心怎么获得?饥荒快

龙心是饥荒游戏里面的重要材料,可以从龙

11-19 109阅读