阶跃星辰与吉利联合开源,多模态实力领跑开源大模型

2个月前 生活 23观看
摘要2025年2月18日,阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款Step 系列多模态大模型向全球开发者开源。其中,包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃Step-Video-T2V,以及行业内首款产品级

2025年2月18日,阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款Step 系列多模态大模型向全球开发者开源。其中,包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃Step-Video-T2V,以及行业内首款产品级开源语音交互大模型阶跃Step-Audio。即日起可在跃问APP内体验。r31喜好网-记录每日喜好的科技时尚娱乐生活

阶跃星辰是吉利汽车集团的科技生态战略合作伙伴。双方深度合作,在算力算法、场景训练等领域优势互补,显著增强了多模态大模型的性能表现。此次联合开源的行动,旨在促进大模型技术的共享与创新,推动人工智能的普惠发展。这一举措也将为开源世界贡献最强的多模态大模型能力,形成大模型开源世界的又一股中国力量。r31喜好网-记录每日喜好的科技时尚娱乐生活

吉利汽车集团CEO淦家阅表示:“吉利致力成为智能汽车AI科技的引领者和普及者,早在2021年,吉利就围绕芯片、软件操作系统、数据和卫星网搭建了端到端的自研体系和生态联盟,构建了完善的‘智能吉利科技生态网’,驱动用户在智能驾驶、智能座舱上的体验不断进化。目前,吉利全栈自研的星睿AI大模型已经与阶跃Step-Video-T2V、Step-Audio等大模型完成了深度融合,将为用户带来更智能、更高阶的座舱交互与智驾出行体验,推动AI科技在智能汽车领域的普及。”r31喜好网-记录每日喜好的科技时尚娱乐生活

据了解,这也是阶跃星辰首次开源其Step系列基座模型。阶跃星辰创始人、CEO姜大昕博士表示:“阶跃星辰一直以实现 AGI 为目标坚持研发基座大模型。我们深知 AGI 的实现离不开全球开发者的共同努力,开源的初心,一方面是希望跟大家分享最新技术成果,为开源社区贡献一份力量;另一方面,我们相信多模态模型是实现 AGI 的必经之路,但目前尚处于早期阶段,期待与社区开发者集思广益,共同拓展模型技术边界,并推动产业落地。”r31喜好网-记录每日喜好的科技时尚娱乐生活

阶跃Step-Video-T2V:性能领跑全球开源视频生成大模型r31喜好网-记录每日喜好的科技时尚娱乐生活

阶跃Step-Video-T2V是目前全球范围内参数量最大、性能最好的开源视频生成大模型。阶跃Step-Video-T2V模型的参数量达到 300 亿,可以直接生成204帧、540P分辨率的高质量视频,这意味着能确保生成的视频内容具有极高的信息密度和强大的一致性。r31喜好网-记录每日喜好的科技时尚娱乐生活

从生成效果来看,阶跃Step-Video-T2V在复杂运动、美感人物、视觉想象力、基础文字生成、原生中英双语输入和镜头语言等方面具备强大的生成能力,且语义理解和指令遵循能力突出,能够高效助力视频创作者实现精准创意呈现。用户可以在跃问网页端和跃问App上体验阶跃Step-Video-T2V的视频生成能力 。r31喜好网-记录每日喜好的科技时尚娱乐生活

为了对开源视频生成模型的性能进行全面评测,阶跃星辰还发布并开源了针对文生视频质量评测的新基准数据集Step-Video-T2V-Eval。该测试集包含128条源于真实用户的中文评测问题,旨在评估生成视频在运动、风景、动物、组合概念、超现实、人物、3D动画、电影摄影等11个内容类别上质量。r31喜好网-记录每日喜好的科技时尚娱乐生活

imager31喜好网-记录每日喜好的科技时尚娱乐生活

Step-Video-T2V-Eval评测结果

评测结果显示,阶跃Step-Video-T2V的模型性能在指令遵循、运动平滑性、物理合理性、美感度等方面的表现,均显著超过市面上既有的效果最佳的开源视频模型。r31喜好网-记录每日喜好的科技时尚娱乐生活

据了解,目前在跃问网页端和跃问App上,都可以体验阶跃Step-Video-T2V的视频生成能力 。r31喜好网-记录每日喜好的科技时尚娱乐生活

阶跃Step-Audio:业内首款产品级开源语音交互模型r31喜好网-记录每日喜好的科技时尚娱乐生活

阶跃Step-Audio是行业内首个产品级的开源语音交互模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地高质量对话。模型生成的语音具有超自然、高情商等特征,同时也能实现高质量的音色复刻并进行角色扮演,满足影视娱乐、社交、游戏等行业场景下应用需求。r31喜好网-记录每日喜好的科技时尚娱乐生活

imager31喜好网-记录每日喜好的科技时尚娱乐生活

在 LlaMA Question、Web Questions等5大主流公开测试集中,阶跃Step-Audio模型性能均超过了行业内同类型开源模型,位列第一。阶跃Step-Audio在HSK-6(汉语水平考试六级)评测中的表现尤为突出,是最懂中国话的开源语音交互大模型。r31喜好网-记录每日喜好的科技时尚娱乐生活

imager31喜好网-记录每日喜好的科技时尚娱乐生活

StepEval-Audio-360基准测试

此外,由于目前行业内语音对话测试集相对缺失,阶跃星辰自建并开源了多维度评估体系 StepEval-Audio-360 基准测试,从角色扮演、逻辑推理、生成控制、文字游戏、创作能力、指令控制等 9 项基础能力的维度对开源语音模型进行全面测评。通过人工横评后的结果显示,阶跃Step-Audio 的模型能力十分均衡,且在各个维度上均超过了此前市面上效果最佳的开源语音模型。r31喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
这一次,美国人还是没能投出一位女总统

这一次,美国人还是没能投出

11-19 62阅读
乔布斯留下的遗憾要实现了?知名爆料人:苹果牌电视机正在酝酿中 或将配备机器人手臂

乔布斯留下的遗憾要实现了

《科创板日报》11月18日讯(编辑 朱凌)电

11-19 61阅读
千呼万唤始出来,华为Mate 70系列开启预订!黑科技、原生鸿蒙有望“非凡”亮相

千呼万唤始出来,华为Mate 7

《科创板日报》11月18日讯(记者 黄心怡)

11-19 59阅读
数字科技赋能 首架C919与亚冬号助力 中国东航参展2024珠海航展

数字科技赋能 首架C919与

2024年11月12日,第十五届中国国际航空

11-19 64阅读
递四方亮相进博会高峰论坛,共探国际物流新机遇

递四方亮相进博会高峰论坛

在第七届中国国际进口博览会(以下简称

11-19 58阅读
打造照片的油画电影感修图教程

打造照片的油画电影感修图

11-19 65阅读
XIAOLI筱李25SS|“Under The Lemon Trees”

XIAOLI筱李25SS|“Under Th

XIAOLI筱李25春夏系列以“Under The

11-19 63阅读
第三届栩栩华生时尚文化大赏成功举办 ——集众人所长,踏上远见之路

第三届栩栩华生时尚文化大

(9月13日,秦皇岛)近日,由栩栩华生内容集

11-19 64阅读
全球独家XVII型重组胶原蛋白,珀莱雅源力精华3.0重磅升级

全球独家XVII型重组胶原蛋

2024年9月20日,珀莱雅于杭州良渚文化

11-19 63阅读
%Amber:9000万年的等待 只为此刻的相遇

%Amber:9000万年的等待 只

未暇倾巾漉,还应染指尝。醍醐惭气味,琥

11-19 62阅读
受贿数额特别巨大!中石油原董事长王宜林被公诉

受贿数额特别巨大!中石油原

正义

11-19 63阅读
科技赋能 生态更美 百姓安乐——南水北调东、中线一期工程沿线见闻

科技赋能 生态更美 百姓安

南水北调工程,旨在破解

11-19 69阅读
以数字技术赋能实体经济高质量发展

以数字技术赋能实体经济高

作者:陈应武、李恒全(分

11-19 57阅读
八角的功效与作用

八角的功效与作用

功效与作用促进肠胃蠕动、增加白细胞、

11-19 64阅读
花菜的功效与作用

花菜的功效与作用

功效与作用抗癌防癌、降低胆固醇、解毒

11-19 62阅读