元宇宙推出支持36种语言的"智慧"即时语音翻译模型

3个月前 科技 26观看
摘要 Meta 开发出一款机器学习模型,其研究人员称该模型可以在近乎实时的情况下在约 36 种语言之间进行语音到语音的翻译。这个名为 SEAMLESSM4T 的基础模型让人联想到《银河系漫游指南》中的巴别鱼

Meta 开发出一款机器学习模型,其研究人员称该模型可以在近乎实时的情况下在约 36 种语言之间进行语音到语音的翻译。GM4喜好网-记录每日喜好的科技时尚娱乐生活

这个名为 SEAMLESSM4T 的基础模型让人联想到《银河系漫游指南》中的巴别鱼,它通过利用互联网音频片段,巧妙地避开了繁琐的数据标注过程,在 450 万小时的人类语音记录上进行训练。GM4喜好网-记录每日喜好的科技时尚娱乐生活

Facebook 母公司的研究团队今天在《自然》杂志上发表论文称,这个相对开放的模型可以作为其他应用程序的基础,支持"在各种场景下实现多语言即时交流"。GM4喜好网-记录每日喜好的科技时尚娱乐生活

爱沙尼亚塔林理工大学语音处理教授 Tanel Alumae 在随附文章中表示,该模型在包含 450 万小时多语言口语音频的海量数据集上进行预训练,以帮助建立数据模式,"这使得模型可以在无需大量定制训练数据的情况下,更容易针对特定任务进行微调"。GM4喜好网-记录每日喜好的科技时尚娱乐生活

研究团队还使用了一种新的自动化技术来避免标注大量训练数据。GM4喜好网-记录每日喜好的科技时尚娱乐生活

Alumae 解释说:"SEAMLESS 团队最巧妙的策略之一是从互联网上'挖掘'跨语言对齐的训练数据对 — 比如一种语言的音频片段与另一种语言的字幕相匹配。从一些已知可靠的数据开始,作者训练模型识别两个内容片段(如视频片段和相应字幕)在含义上是否真正匹配。"GM4喜好网-记录每日喜好的科技时尚娱乐生活

这种技术帮助 Meta 的无缝通信团队收集了约 443,000 小时带有匹配文本的音频,并对齐了约 30,000 小时的语音对,然后用于进一步训练模型。Alumae 赞扬了 Meta 对模型的开放程度 - 这与可用于创建其他应用程序的 Llama 系列大语言模型类似。"对于缺乏从头构建这些模型所需大量计算资源的研究人员来说,这种开放程度是巨大的优势。"GM4喜好网-记录每日喜好的科技时尚娱乐生活

然而,也有人批评 LLaMA-3 的"明显非开放使用限制"。GM4喜好网-记录每日喜好的科技时尚娱乐生活

据称,Meta 的新模型还可以将语音翻译成多达 100 种语言的文本。Alumae 指出,虽然这个数字令人印象深刻,但与世界上约 7,000 种语言相比还相差甚远。GM4喜好网-记录每日喜好的科技时尚娱乐生活

他说:"该工具在人类相对容易处理的许多情况下仍然存在困难 — 例如在嘈杂环境中的对话或口音很重的人之间的对话。不过,作者利用真实世界数据的方法将为开发能够媲美科幻作品的语音技术开辟一条有前途的道路。"GM4喜好网-记录每日喜好的科技时尚娱乐生活

康奈尔大学信息科学系的 Allison Koenecke 在第二篇随附文章中指出,虽然这一突破可能代表着比人工更高效和更具成本效益的转录和翻译方法,但"必须要理解这些技术失效的方式 — 对某些群体的影响尤其不成比例"。GM4喜好网-记录每日喜好的科技时尚娱乐生活

她说:"未来的工作必须确保语音技术研究人员能够改善性能差异,并让用户充分了解这些模型相关的潜在利益和危害。"在论文中,Meta 描述了如何衡量语言的"毒性"和性别偏见。GM4喜好网-记录每日喜好的科技时尚娱乐生活

研究人员还表示,自然语音"包含一系列韵律 — 节奏、重音、语调或声调 — 和情感成分,这些都值得进一步研究。"GM4喜好网-记录每日喜好的科技时尚娱乐生活

他们补充说:"要创建感觉自然和有机的语音到语音翻译系统,应该将更多研究投入到保留表现力的输出生成中。此外,要完全实现巴别鱼的愿景,需要在低延迟语音翻译研究方面进行更深入的投入。开发能够流式处理的系统(即在输入句子呈现时进行增量翻译)可能会增加这些系统在各种机构环境中的采用率。我们希望 SEAMLESSM4T 能为这两个研究领域开辟新的可能性。"GM4喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
抖音电商拐点已至,从美妆行业开始跌落?

抖音电商拐点已至,从美妆行业开始

前几日,抖音首次公布了“双11”大

11-19 64阅读
男子为骗保开车撞树不慎当场身亡 系团伙自导自演:已骗90多万

男子为骗保开车撞树不慎当场身亡

11月19日

11-19 70阅读
小米第三季度研发费用60亿 雷军:小米坚持技术为本的铁律

小米第三季度研发费用60亿 雷军:

11月19日

11-19 64阅读
护眼的2K旗舰!Redmi K80是行业唯一支持全亮度DC的2K屏手机

护眼的2K旗舰!Redmi K80是行业唯

11月18日

11-19 79阅读
OpenAI“杀死”在线教育巨头

OpenAI“杀死”在线教育巨头

文章来源:智东西图片来源:由无界AI

11-19 66阅读
2012年,“非诚勿扰”女高朋王佳暴虐杀害丈夫,如今快要出狱了

2012年,“非诚勿扰”女高朋

11-19 69阅读
贾乃亮帮清购物车, 网友没胆安利给自家老板!

贾乃亮帮清购物车, 网友没

今天双十二,大家剁手了吗!小编是没

11-19 62阅读
扁鹊归宿地的怅惘(扁鹊归宿地的怅惘)

扁鹊归宿地的怅惘(扁鹊归宿

关键词:神医扁鹊 气死回生 讳疾忌医

11-19 65阅读
浪胃仙IP创始人“游絮”犯职务侵占罪被判8年:罚100万 归还账号

浪胃仙IP创始人“游絮”犯

11月13日消息,据

11-19 66阅读
时隔3年正式回归连更2条作品 李子柒:还有存货正在剪

时隔3年正式回归连更2条作

11月12日消息,时

11-19 58阅读
《战神:诸神黄昏》6.001补丁发布 优化手柄和显卡支持

《战神:诸神黄昏》6.001补

《战神:诸神黄昏》6.001更新版本着重解

11-19 73阅读
三国群英传3秘籍大全_三国群英传3秘籍代码及使用方法一览

三国群英传3秘籍大全_三国

给大家分享三国群英传3秘籍大全,里面包

11-19 65阅读
原子之心激光模块解谜攻略

原子之心激光模块解谜攻略

原子之心游戏里面有一个被动安保激光模

11-19 73阅读
饥荒无消耗驯服猪人的详细操作方法

饥荒无消耗驯服猪人的详细

猪人是饥荒游戏里面的特殊生物,因为数量

11-19 70阅读
饥荒辣椒酱制作方法及制作材料分享

饥荒辣椒酱制作方法及制作

辣椒酱是饥荒游戏里面的一个特殊食物,不

11-19 70阅读