GPT-4.5发布:比GPT-4提升10倍 但"并非前沿模型"

5个月前 科技 45观看
摘要 2月28日消息,美国时间周四,OpenAI宣布推出GPT-4.5,这是其最新、最强大的大语言模型(LLM)的研究预览版,专为聊天应用设计。不过,这也是OpenAI迄今为止最昂贵的模型。不过,GPT-4.5仍然是一款传统的大型语言模型,而非

2月28日消息,美国时间周四,OpenAI宣布推出GPT-4.5,这是其最新、最强大的大语言模型(LLM)的研究预览版,专为聊天应用设计。不过,这也是OpenAI迄今为止最昂贵的模型。oXR喜好网-记录每日喜好的科技时尚娱乐生活

不过,GPT-4.5仍然是一款传统的大型语言模型,而非“推理模型”。此前,OpenAI、DeepSeek、Anthropic等公司都推出了推理模型,这些模型能够生成“思维链”或类似意识流的文本,通过反思自身的假设和结论,尝试在向用户提供响应或输出之前捕捉错误。oXR喜好网-记录每日喜好的科技时尚娱乐生活

尽管如此,OpenAI联合创始人兼首席执行官山姆·奥特曼(Sam Altman)在社交平台上表示,GPT-4.5是“第一个让我感觉像是在与一个有思想的人交谈的模型。我曾多次靠在椅背上,惊讶于AI能给出真正有用的建议。”oXR喜好网-记录每日喜好的科技时尚娱乐生活


oXR喜好网-记录每日喜好的科技时尚娱乐生活

奥特曼还提醒道,由于GPU供应紧张,OpenAI不得不限制对GPT-4.5的访问。他指出:“坏消息是:这是一个庞大且昂贵的模型。我们本打算同时向Plus和Pro用户推出,但用户量大幅增长导致GPU资源不足。我们计划下周增加数万颗GPU,并随后向Plus订阅用户开放。(很快还会有数十万颗GPU到位,我相信大家会充分利用我们部署的每一颗GPU。)这并不是我们理想的运作方式,但很难完美预测导致GPU短缺的需求激增。”oXR喜好网-记录每日喜好的科技时尚娱乐生活

从美国时间周四开始,GPT-4.5将向OpenAI的最昂贵订阅服务ChatGPT Pro(每月200美元)的用户开放,并向所有付费API层级的开发者提供访问权限。OpenAI还计划在下周将其扩展至价格相对较低的Plus和Team层级(每月20/30美元)。oXR喜好网-记录每日喜好的科技时尚娱乐生活

GPT-4.5支持搜索功能和画布模式,用户还可以上传文件和图像,但目前还不支持其他多模态功能,如语音模式、视频和屏幕共享——至少暂时不支持。oXR喜好网-记录每日喜好的科技时尚娱乐生活

通过无监督学习推动AI进步oXR喜好网-记录每日喜好的科技时尚娱乐生活

GPT-4.5代表了人工智能训练领域的显著进步,尤其是在无监督学习方面,这大大提升了模型识别模式、建立联系以及生成创造性见解的能力。oXR喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI的研究人员提到,GPT-4.5通过基于较小人工智能模型生成的数据进行训练,这有助于提升其“世界模型”。他们还表示,该模型同时利用多个数据中心进行预训练,这意味着它采用了一种类似于竞争对手Nous Research的去中心化方法。oXR喜好网-记录每日喜好的科技时尚娱乐生活

这种训练方式显然帮助GPT-4.5学会了生成更自然、更直观的交互,同时更准确地遵循用户意图,并展现出更高的情商。该模型在OpenAI此前关于人工智能扩展的工作基础上取得了突破,进一步验证了“增加数据和计算能力有助于提升人工智能性能”的理念。oXR喜好网-记录每日喜好的科技时尚娱乐生活

与前代模型及其他同类产品相比,GPT-4.5预计能够显著减少幻觉现象(幻觉率为37.1%,相比之下GPT-4为61.8%),从而使其在处理广泛话题时更加可靠。oXR喜好网-记录每日喜好的科技时尚娱乐生活

GPT-4.5的突出特点oXR喜好网-记录每日喜好的科技时尚娱乐生活

根据OpenAI的说法,GPT-4.5旨在创造亲切自然、直观流畅的对话。它对语义细微差异和上下文有更强的把握能力,能够实现更像人类之间的互动,并更有效地与用户协作。oXR喜好网-记录每日喜好的科技时尚娱乐生活

GPT-4.5通过扩展的知识库和敏锐的细微线索解读能力,在多个领域展现出色表现,包括:oXR喜好网-记录每日喜好的科技时尚娱乐生活

——写作辅助:优化内容、提升清晰度、激发创意oXR喜好网-记录每日喜好的科技时尚娱乐生活

——编程支持:调试、提出代码改进建议、自动化工作流程oXR喜好网-记录每日喜好的科技时尚娱乐生活

——问题解决:提供详细解释,并协助做出实际决策oXR喜好网-记录每日喜好的科技时尚娱乐生活

此外,GPT-4.5还采用了新的对齐技术,增强了其对人类偏好和意图的理解能力,进一步提升了用户体验。oXR喜好网-记录每日喜好的科技时尚娱乐生活

如何访问GPT-4.5?oXR喜好网-记录每日喜好的科技时尚娱乐生活

从美国当地时间周四开始,ChatGPT Pro用户可以在网页、移动端和桌面端的模型选择菜单中选择GPT-4.5。OpenAI计划在下周将该模型扩展到Plus和Team用户。oXR喜好网-记录每日喜好的科技时尚娱乐生活

对于开发者,GPT-4.5将通过OpenAI的API提供,包括Chat Completions API、Assistants API和Batch API。它支持函数调用、结构化输出、流式传输、系统消息和图像输入等关键功能,使其成为多种人工智能驱动应用的通用工具。不过,GPT-4.5目前尚不支持语音模式、视频或屏幕共享等多模态功能。oXR喜好网-记录每日喜好的科技时尚娱乐生活

定价及对企业决策者的影响oXR喜好网-记录每日喜好的科技时尚娱乐生活

企业和团队领导者可以充分利用GPT-4.5带来的各种功能。凭借较低的幻觉率、增强的可靠性和自然流畅的对话能力,GPT-4.5能够支持广泛的业务功能:oXR喜好网-记录每日喜好的科技时尚娱乐生活

——改善客户互动:企业可以将GPT-4.5集成到支持系统中,以实现更快、更自然的互动,同时减少错误oXR喜好网-记录每日喜好的科技时尚娱乐生活

——增强内容生成:营销和传播团队可以高效地制作高质量、符合品牌的内容oXR喜好网-记录每日喜好的科技时尚娱乐生活

——精简运营:人工智能驱动的自动化可以帮助调试、优化工作流程并支持战略决策oXR喜好网-记录每日喜好的科技时尚娱乐生活

——可扩展性和定制化:API允许企业进行量身定制,构建符合其特定需求的人工智能解决方案oXR喜好网-记录每日喜好的科技时尚娱乐生活

然而,对于希望通过GPT-4.5构建应用的第三方开发者来说,GPT-4.5的API定价高得惊人,每百万输入/输出token的价格为75美元/180美元,而GPT-4o的定价仅为2.50美元/10美元。oXR喜好网-记录每日喜好的科技时尚娱乐生活

随着其他竞争对手模型的发布——如Anthropic的Claude 3.7、Google的Gemini 2 Pro,以及OpenAI自家的推理“o”系列(o1、o3-mini High、o3)——GPT-4.5的性能提升是否足以抵消其高昂成本,特别是在通过API使用时,将成为一个值得关注的问题。oXR喜好网-记录每日喜好的科技时尚娱乐生活

AI研究人员与资深用户的早期反应两极分化oXR喜好网-记录每日喜好的科技时尚娱乐生活

GPT-4.5的发布在社交平台上引发了人工智能研究人员和技术爱好者的广泛讨论,尤其是在该模型的“系统卡”(即概述其训练和评估的技术文档)提前泄露后,文档中包含了一系列官方公告前的基准测试结果。oXR喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI在泄露后发布的最终版系统卡与泄露版本存在显著差异,删除了泄露版中“GPT-4.5并非前沿模型,但它是OpenAI最大的LLM,比GPT-4的计算效率提高了10倍以上”的表述。OpenAI的发言人表示,这一说法并不准确。oXR喜好网-记录每日喜好的科技时尚娱乐生活

人工智能模型提供商Nous Research的联合创始人Teknium(化名)对OpenAI的新模型表示失望,指出在多语言理解(MMLU)和实际编码基准测试中,GPT-4.5相比其他领先的大语言模型(LLM)的改进微乎其微。Teknium质疑道:“距离GPT-4发布已经过去2年多,OpenAI投入的资金投入规模扩大上千倍……究竟发生了什么?”oXR喜好网-记录每日喜好的科技时尚娱乐生活

此外,有人认为,GPT-4.5在软件工程基准测试中表现逊于o3-mini,这让人质疑此次发布是否代表了真正的技术进步。oXR喜好网-记录每日喜好的科技时尚娱乐生活

然而,也有部分用户为GPT-4.5的潜力辩护,认为其价值不应仅仅依赖于基准测试的结果。oXR喜好网-记录每日喜好的科技时尚娱乐生活

软件开发人员Haider(@slow_developer)强调,GPT-4.5相比GPT-4在计算效率上提升了10倍,并且其在综合任务处理能力上优于OpenAI专注于STEM领域的o系列模型。oXR喜好网-记录每日喜好的科技时尚娱乐生活

AI新闻发布者Andrew Curran(@AndrewCurran_)则从定性角度出发,预测GPT-4.5将在写作和创造性思维领域树立新标准,并称其为OpenAI的“杰作”。oXR喜好网-记录每日喜好的科技时尚娱乐生活

这些讨论凸显了人工智能领域一个更广泛的争论:技术进步是否应单纯通过基准测试来衡量,还是应更侧重于推理能力、创造力和拟人化交互等定性方面的改进?oXR喜好网-记录每日喜好的科技时尚娱乐生活

仍处于研究预览阶段oXR喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI将GPT-4.5定位为研究预览版,以深入了解其优势与局限性。该公司表示,将继续探索用户与模型的互动方式,并挖掘非常规应用场景。oXR喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI称:“我们发布GPT-4.5作为研究预览版,以更好地了解其优势与局限性。扩展无监督学习将继续推动人工智能的进步,提升准确性、流畅性和可靠性。”oXR喜好网-记录每日喜好的科技时尚娱乐生活

随着OpenAI不断改进其模型,GPT-4.5为未来的人工智能进步奠定了基础,尤其是在推理和工具使用代理方面。尽管GPT-4.5已经展示了令人印象深刻的能力,OpenAI仍在积极评估其在生态系统中的长期作用。oXR喜好网-记录每日喜好的科技时尚娱乐生活

凭借更广泛的知识库、更高的情商和更自然的对话能力,GPT-4.5将为各个领域的用户带来显著改进。OpenAI期待看到开发者、企业和团队如何将该模型集成到他们的工作流程和应用中。oXR喜好网-记录每日喜好的科技时尚娱乐生活

随着人工智能技术的不断进步,GPT-4.5标志着OpenAI在追求更强大、更可靠、更符合用户需求的语言模型道路上迈出了重要的一步,为企业领域的创新带来了新的机遇。(小小)oXR喜好网-记录每日喜好的科技时尚娱乐生活

oXR喜好网-记录每日喜好的科技时尚娱乐生活

oXR喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
疑遭猎杀 泰海域发现无头“美人鱼”:只因毫无科学依据的传说

疑遭猎杀 泰海域发现无头“美人

11月19日

11-19 127阅读
苹果打算明年带来AirTag 2,或与M4 MacBook Air一起发布

苹果打算明年带来AirTag 2,或与M4

在202

11-19 129阅读
超美小直屏!OPPO Reno13外观赏析

超美小直屏!OPPO Reno13外观赏析

“长得好

11-19 124阅读
睿蓝8七座纯电MPV上市,起售价13.78万元

睿蓝8七座纯电MPV上市,起售价13.7

11-19 108阅读
一家早期科技基金,今年投了10个亿

一家早期科技基金,今年投了10个亿

周期

11-19 108阅读
龙波 始终亲力亲为,哪个岗位有需要就扑在哪里 优秀新闻工作者 编辑⑨(龙波始终亲力亲为)

龙波 始终亲力亲为,哪个岗

为激励全市新闻战线认真践行“四向

11-19 109阅读
章子怡人称国际章, 被巩俐压了这么多年却被称心机婊!

章子怡人称国际章, 被巩俐

今年国际章章子怡可以说是从一众

11-19 116阅读
百部青少年教育公益微电影《星光好少年之少年王维》开机仪式在北京顺利举行

百部青少年教育公益微电影

  2024年11月9日,由泰安东升公益慈

11-19 104阅读
扁鹊归宿地的怅惘(扁鹊归宿地的怅惘)

扁鹊归宿地的怅惘(扁鹊归宿

关键词:神医扁鹊 气死回生 讳疾忌医

11-19 108阅读
苦等七年终于来了!《白夜破晓》长丰集结海报出炉:潘粤明主演

苦等七年终于来了!《白夜破

11月17日消息,时

11-19 99阅读
《最终幻想7》重制版最终章剧情已敲定 已开始制作

《最终幻想7》重制版最终

在韩国举行的G-STAR讨论会上,《最终幻

11-19 121阅读
Skinseed怎样上传到我的世界?Skinseed皮肤导入方法

Skinseed怎样上传到我的世

《Skinseed》是一款专为游戏《我的世界

11-19 116阅读
大掌门2最强阵容_大掌门2最新最强阵容

大掌门2最强阵容_大掌门2

大掌门2是一款以武侠为背景的RPG动作手

11-19 129阅读
饥荒存档在哪个文件夹?饥荒存档位置一览

饥荒存档在哪个文件夹?饥

饥荒存档在哪个文件夹?饥荒游戏里面玩家

11-19 230阅读
原神痼疾任务图文攻略|原神痼疾全流程攻略

原神痼疾任务图文攻略|原

痼疾是原神须弥地区魔神主线任务的第三

11-19 103阅读