Gemini 2.5 Flash 登陆 Gemini 应用,谷歌致力于改进 “动态思考”

1周前 科技 1观看
摘要 谷歌的 Gemini AI 或许起步较慢,但到了 2025 年,它的表现可谓是势不可挡。几乎每周都会有新的模型在 Gemini 应用或开发者工具(例如 AI Studio)中亮相,而今天,应用程序迎来了一次重大更新。谷歌宣

谷歌的 Gemini AI 或许起步较慢,但到了 2025 年,它的表现可谓是势不可挡。几乎每周都会有新的模型在 Gemini 应用或开发者工具(例如 AI Studio)中亮相,而今天,应用程序迎来了一次重大更新。谷歌宣布,其更快、更高效的 Gemini 2.5 Flash 模型已在预览中广泛推出。同时,开发者现在可以利用公司新公布的 API 定价开始使用 2.5 Flash 构建应用,谷歌称该价格远低于竞争产品。9mH喜好网-记录每日喜好的科技时尚娱乐生活

一堆 Gemini 模型9mH喜好网-记录每日喜好的科技时尚娱乐生活

Gemini 应用中的模型下拉菜单稍显复杂,尤其是随着 Veo 2 和 Personalization 等产品的陆续出现。谷歌发布了如此众多的预览模型以及 Gemini 的各种新用法,让人难以判断在特定任务中应该选择哪种方案。公平而言,在这一问题上,谷歌并非唯一面临困境的主要 AI 玩家。9mH喜好网-记录每日喜好的科技时尚娱乐生活

Tulsee Doshi 是谷歌 Gemini 产品管理总监,负责领导构建这些模型的团队。我们询问 Doshi 自己更常使用哪一版本的 Gemini,不出所料,她更青睐功能更强大的选项。Doshi 表示:“目前我一般使用 2.5 Pro。我在日常工作中,会在若干关键环节(比如撰写文档或制作幻灯片)中全面采用 Gemini,无论是供内部使用还是对外分享,我都发现 2.5 Pro 在创意写作上非常有帮助。”9mH喜好网-记录每日喜好的科技时尚娱乐生活

新模型比 Gemini 2.5 Pro 稍小,大小与 2.0 Flash 大致相同,但性能预期会更好。Doshi 称之为“较 2.0 Flash 有显著提升”。至少这一点上,Gemini 2.5 Flash 不会增加应用内的混乱。该模型将在应用程序和网站上以 “2.5 Flash (Experimental) ” 的名称出现,取代原有的 “2.0 Thinking (Experimental) ” 选项。事实上,2.0 Thinking 模型连实验阶段都未能走出,这足以证明如今谷歌 Gemini 团队推进项目的速度有多快。9mH喜好网-记录每日喜好的科技时尚娱乐生活

与 2.0 Thinking 模型不同,新发布的 2.5 Flash 将首先支持谷歌用于处理文本或代码的 Canvas 功能。据谷歌发言人介绍,对该模型进行更深入研究的支持将于后续推出。9mH喜好网-记录每日喜好的科技时尚娱乐生活

Gemini 2.5 Pro 依然存在并处于实验阶段,使得 2.0 Flash 成为了目前唯一非实验状态的聊天机器人,但该模型并不具备推理能力。9mH喜好网-记录每日喜好的科技时尚娱乐生活

开思考,关思考9mH喜好网-记录每日喜好的科技时尚娱乐生活

与谷歌 2.5 系列及以后的所有模型一样,Gemini 2.5 内置了模拟推理功能,谷歌称之为“思考”。这意味着模型在生成输出时会实时核实其事实,因而能够提供更准确的结果。然而,这也使得模型的运行速度变慢且成本更高。鉴于并非所有查询都需要这种持续的分析过程,谷歌为 Flash 模型提供了部分工具,帮助开发者根据实际使用场景对其进行调优。9mH喜好网-记录每日喜好的科技时尚娱乐生活

您或许还记得,谷歌本月初已开始与开发者接触,推出 Gemini 2.5 Flash。尽管该模型尚未完全完善,谷歌已经选择在 Vertex AI 和 AI Studio 中以可变 API 定价的方式将其全面开放。9mH喜好网-记录每日喜好的科技时尚娱乐生活

Gemini 2.5 Flash 允许开发者为“思考”设置 Token 限制,或干脆完全禁用“思考”。谷歌为输入定价为每百万 Token 美元 0.15,而输出则分为两种情况:不启用“思考”的情况下为美元 0.60,但启用“思考”则价格上升至美元 3.50。这一“思考预算”选项使开发者能够以愿意支付的费用来精细调控模型的行为。Doshi 表示,随着 Token 预算的增加,基准测试中可以明显看到推理能力的提升。9mH喜好网-记录每日喜好的科技时尚娱乐生活

2.5 Flash 的输出效果会随着加入更多推理 Token 而得到改善。9mH喜好网-记录每日喜好的科技时尚娱乐生活

与 2.5 Pro 相似,该模型支持动态思考功能,能够根据输入的复杂程度自动调整生成输出所需的工作量。新推出的 Flash 模型则更进一步,允许开发者主动控制“思考”的过程。Doshi 指出,谷歌此时推出该模型,部分原因在于收集开发者关于模型在哪些方面达到预期、何时思考不足或过度的反馈,以便在“动态思考”功能上不断迭代改进。9mH喜好网-记录每日喜好的科技时尚娱乐生活

不过,目前不必期望在面向消费者的 Gemini 产品中立即实现如此精细的控制。Doshi 指出,开发者希望通过切换“思考”功能或设置预算,主要是为了更好地控制成本和响应延迟。谷歌则希望通过预览阶段的反馈,更好地理解用户和开发者对模型的期待。Doshi 表示:“我们的目标是在为消费者打造简单易用的 Gemini 应用体验的同时,依旧为开发者提供灵活的调节空间。”9mH喜好网-记录每日喜好的科技时尚娱乐生活

随着产品发布节奏的加快,Gemini 2.5 的最终版本似乎指日可待。虽然谷歌目前尚未就此分享任何具体信息,但结合新推出的开发者选项以及 Gemini 应用中的可用性,Doshi 告诉我们,团队希望能尽快将 2.5 系列推向全面发布。9mH喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
纯电210km 奇瑞风云T9超长续航版上市:限时国补14.89万元

纯电210km 奇瑞风云T9超长续航版

11月19日

11-19 63阅读
消息称抖音正推进“V”项目,包括直播游戏互动、AI 分身功能等

消息称抖音正推进“V”项目,包括

11 月

11-19 66阅读
焦虑的开发者,涌向“纯血鸿蒙”培训班

焦虑的开发者,涌向“纯血鸿蒙”培

有两

11-19 60阅读
李子柒:反商业化「顶流」

李子柒:反商业化「顶流」

沉寂1

11-19 60阅读
并购重组大潮AB面:有的“做大做强”有的“拉高出货”

并购重组大潮AB面:有的“做大做强

自证

11-19 62阅读
斗鱼第一土豪落天神身份曝光, 花钱如流水居然是这样的身份!

斗鱼第一土豪落天神身份曝

如果很早就看直播的网友,想必都听

11-19 59阅读
戈壁和江百丽结局,男方不爱女方,女生到最后一无所有

戈壁和江百丽结局,男方不爱

《暗恋橘生淮南》中江百丽和戈壁

11-19 147阅读
中国电影出海专业书刊《走向世界:华语电影的跨国流通与市场策略》正式发布

中国电影出海专业书刊《走

  在首届广州电影产业博览交易会上

11-19 55阅读
马斯克赌大赢大 部分广告商准备重返推特

马斯克赌大赢大 部分广告

多位媒体高管透

11-19 64阅读
时隔3年正式回归连更2条作品 李子柒:还有存货正在剪

时隔3年正式回归连更2条作

11月12日消息,时

11-19 54阅读
索尼正在开发自动检测游戏BUG的AI系统:简化测试流程

索尼正在开发自动检测游戏

根据 Tech4Gamer 报道,根据索尼目前发

11-19 61阅读
不能现实换钱的新型NFC?《宝可梦卡牌P》再创新热潮

不能现实换钱的新型NFC?《

近期《宝可梦卡牌P》APP正式推出,引发

11-19 60阅读
TGA:DLC、拓展包、新赛季、重制版等均可提名所有奖项

TGA:DLC、拓展包、新赛季、

今日(11月16日),TGA主创Geoff Keighley与

11-19 69阅读
和平精英灵敏度怎么调最稳?和平精英灵敏度设置2024最新版

和平精英灵敏度怎么调最稳

《和平精英》是一款全民枪战竞技手游,采

11-19 89阅读
功耗低+性能强 双十一AMD锐龙9000处理器省钱游戏套装推荐

功耗低+性能强 双十一AMD

11-19 57阅读