阿里云通义开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini

6个月前 科技 37观看
摘要 1月27日凌晨,阿里云通义重磅开源支持100万Tokens上下文的Qwen2.5-1M模型,推出7B及14B两个尺寸,均在处理长文本任务中稳定超越GPT-4o-mini;同时开源推理框架,在处理百万级别长文本输入时可

1月27日凌晨,阿里云通义重磅开源支持100万Tokens上下文的Qwen2.5-1M模型,推出7B及14B两个尺寸,均在处理长文本任务中稳定超越GPT-4o-mini;同时开源推理框架,在处理百万级别长文本输入时可实现近7倍的提速。ITS喜好网-记录每日喜好的科技时尚娱乐生活

图片1.jpg ITS喜好网-记录每日喜好的科技时尚娱乐生活

百万Tokens长文本,可换算成10本长篇小说、150小时演讲稿或3万行代码。两个月前, Qwen2.5-Turbo 升级了百万Tokens的上下文输入能力,广受开发者和企业欢迎。如今,开源社区可基于全新的 Qwen2.5-1M 系列模型,进行长篇小说或多篇学术论文的解析,或是探索仓库级代码的分析和升级。ITS喜好网-记录每日喜好的科技时尚娱乐生活

图片2.jpg ITS喜好网-记录每日喜好的科技时尚娱乐生活

Qwen2.5-1M拥有优异的长文本处理能力。在上下文长度为100万 Tokens 的大海捞针(Passkey Retrieval)任务中,Qwen2.5-1M 能够准确地从 1M 长度的文档中检索出隐藏信息,仅有7B模型出现了少量错误。在RULER、LV-Eval等基准对复杂长上下文理解任务测试中,Qwen2.5-14B-Instruct-1M 模型不仅击败了自家闭源模型 Qwen2.5-Turbo,还稳定超越 GPT-4o-mini,为开发者提供了一个现有长上下文模型的优秀开源替代。ITS喜好网-记录每日喜好的科技时尚娱乐生活

大模型的长文本训练需要消耗大量的计算资源,通义团队通过逐步扩展长度的方法,从预训练到监督微调再到强化学习等多个阶段,高效地将 Qwen2.5-1M 的上下文长度从 4K 扩展到 256K;再通过长度外推的技术,创新引入Dual Chunk Attention机制,在无需额外训练的情况下,将上下文长度高性能地稳定扩展到1M,从而在较低成本下实现了 Qwen2.5-1M 模型。ITS喜好网-记录每日喜好的科技时尚娱乐生活

图片3.jpg ITS喜好网-记录每日喜好的科技时尚娱乐生活

同时,为了加快推理速度,通义团队在vLLM推理引擎基础上,引入基于Minference的稀疏注意力机制,并在分块预填充、集成长度外推方案和稀疏性优化等多环节创新改进。基于这些改进的推理框架有效地加快了模型推理速度,在不同模型大小和 GPU 设备上,处理 1M 长度输入序列的预填充速度提升了 3.2 倍到 6.7 倍。ITS喜好网-记录每日喜好的科技时尚娱乐生活

据了解,Qwen2.5-1M已经在魔搭社区ModelScope和HuggingFace等平台开源,开发者可前往下载或直接体验模型;相关推理框架也已在GitHub上开源,帮助开发者更高效地部署Qwen2.5-1M模型。开发者和企业也可通过阿里云百炼平台调用 Qwen2.5-Turbo 模型API,或是通过全新的Qwen Chat平台体验模型性能及效果。ITS喜好网-记录每日喜好的科技时尚娱乐生活

附链接:ITS喜好网-记录每日喜好的科技时尚娱乐生活

演示Demo:https://www.modelscope.cn/studios/Qwen/Qwen2.5-1M-DemoITS喜好网-记录每日喜好的科技时尚娱乐生活

Modelscope:https://www.modelscope.cn/organization/QwenITS喜好网-记录每日喜好的科技时尚娱乐生活

Huggingface:https://huggingface.co/QwenITS喜好网-记录每日喜好的科技时尚娱乐生活

开源框架地址:https://github.com/QwenLM/vllm/tree/dev/dual-chunk-attnITS喜好网-记录每日喜好的科技时尚娱乐生活

Qwen Chat体验:https://chat.qwenlm.ai/ITS喜好网-记录每日喜好的科技时尚娱乐生活

ITS喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
首发1999元 华硕ROG新款25寸显示器上市:FHD 310Hz屏

首发1999元 华硕ROG新款25寸显示

11月19日

11-19 111阅读
辽宁省40+高校升级5.5G:上传提升2倍 下载快4.2Gbps

辽宁省40+高校升级5.5G:上传提升2

11月18日

11-19 109阅读
‌OPPO Reno13系列及IoT生态新品发布会定于11月25日

‌OPPO Reno13系列及IoT生态新品

11-19 120阅读
宝马全新纯电动BMW i4上市,eDrive40售46.99万

宝马全新纯电动BMW i4上市,eDrive

11-19 129阅读
徐工集团CVC基金备案成功

徐工集团CVC基金备案成功

2024

11-19 113阅读
ENHYPEN的第二张正规专辑后续《ROMANCE:UNTOLD-daydream-》刷新了历代K-POP后续专辑中创下了最高初动销量新纪录

ENHYPEN的第二张正规专辑

18日,据Hanteo Chart榜单数

11-19 104阅读
高燃励志电影《倒数回击》定档11月20日 甜妹热辣“爆改”逆袭浴火人生

高燃励志电影《倒数回击》

  由洪子烜导演,温贞菱、丁宁主演的

11-19 98阅读
不愧是中国第一网红!李子柒油管日收入预估超8万:停更期间单月广告分成超78万

不愧是中国第一网红!李子柒

11月14日消息,据

11-19 102阅读
《角斗士2》横扫国际票房

《角斗士2》横扫国际票房

《角斗士2》在欧

11-19 106阅读
苦等七年终于来了!《白夜破晓》长丰集结海报出炉:潘粤明主演

苦等七年终于来了!《白夜破

11月17日消息,时

11-19 99阅读
非线性悬疑侦探新作《心灵警探》现已登陆PC、PS5和Switch

非线性悬疑侦探新作《心灵

2024年11月15日,法国·蒙彼利埃 – 发行

11-19 144阅读
帝国时代2秘籍大全_帝国时代2征服者/高清版秘籍(含隐藏秘籍)

帝国时代2秘籍大全_帝国时

帝国时代2秘籍是很多玩帝国时代2游戏玩

11-19 238阅读
僵尸生活2逃离僵尸岛全流程全角色超详细攻略分享(1.62版)

僵尸生活2逃离僵尸岛全流

僵尸生活2逃离僵尸岛是《僵尸生活》游

11-19 111阅读
卧龙苍天陨落在哪强化装备?卧龙苍天陨落强化装备位置介绍

卧龙苍天陨落在哪强化装备

卧龙苍天陨落在哪强化装备?卧龙苍天陨落

11-19 119阅读
原神训练有素的考古学家隐藏成就任务攻略

原神训练有素的考古学家隐

训练有素的考古学家是须弥沙漠地区的隐

11-19 114阅读