Tavus 推出系列 AI 模型,实现实时人脸交互技术突破

5个月前 科技 38观看
摘要 Tavus Inc.,一家致力于开发能模拟真人对话体验的实时 AI 技术的人工智能研究初创公司,今天宣布发布了一系列突破性的 AI 模型。该公司表示,正在通过其"对话视频界面"构建一个人机交互操作系统,使

Tavus Inc.,一家致力于开发能模拟真人对话体验的实时 AI 技术的人工智能研究初创公司,今天宣布发布了一系列突破性的 AI 模型。j2g喜好网-记录每日喜好的科技时尚娱乐生活

该公司表示,正在通过其"对话视频界面"构建一个人机交互操作系统,使 AI 能够自然地感知、理解和回应。这种体验就像在 Zoom 或 FaceTime 通话中与真人交谈一样。Tavus 的使命是让 AI 不仅能理解面部表情、语气和肢体语言及其含义,还能通过自身的表情和语气来传达意义。j2g喜好网-记录每日喜好的科技时尚娱乐生活

"人类在进化过程中形成了面对面交流的方式。因此,我们希望教会机器如何实现这一点,"首席执行官 Hassaan Raza 在接受 SiliconANGLE 采访时表示。"如果我们相信未来会出现 AI 同事、朋友和助手,我们就需要为此构建相应的接口。"j2g喜好网-记录每日喜好的科技时尚娱乐生活

此次发布包含三个模型:Phoenix-3,首个能传达细微表情的全脸 AI 渲染模型;Raven-0,一个突破性的 AI 感知模型,能像人类一样观察和推理;以及 Sparrow-0,一个先进的对话轮替模型,为对话增添"生命火花"。j2g喜好网-记录每日喜好的科技时尚娱乐生活

Phoenix-3 是公司的旗舰基础模型,旨在创建"数字分身"——个人的高度真实再现,并具备 AI 驱动的人类表情能力。现在的第三代版本提供全脸动画,能够克隆人物并准确表现脸部每块肌肉,这对模仿细微表情至关重要。Raza 表示,大多数商用面部动画模型无法处理完整的面部,导致上下半部分不匹配,破坏了沉浸感。j2g喜好网-记录每日喜好的科技时尚娱乐生活

"Phoenix-3 是一个全脸表情模型,具有情感控制功能,是首个无需大量数据就能实现这一功能的模型,"Raza 说。j2g喜好网-记录每日喜好的科技时尚娱乐生活

最重要的是,Phoenix-3 的高保真度和面部肌肉控制意味着它能准确模拟"微表情"——那些短暂、不由自主的面部表情,它们是情感反应的结果。通过添加这一功能,该模型创造了一个生动的视频模型体验,比简单的动画面孔更加真实,更具情感和表现力。j2g喜好网-记录每日喜好的科技时尚娱乐生活

为了使 Phoenix-3 能像人类一样做出响应,Raven-0 赋予了 AI 观察和理解场景的能力。它不是拍摄单独的快照,而是持续观察和理解视频中事件的上下文,包括识别用户的面部情绪和检测环境变化。j2g喜好网-记录每日喜好的科技时尚娱乐生活

例如,AI 辅导员可以通过监控学生的表情来识别他们是否感到困惑或沮丧,并相应地调整解释方式。同样,支持助手可以观察客户使用产品的过程,并就如何解决问题提供指导。j2g喜好网-记录每日喜好的科技时尚娱乐生活

Raza 表示,Sparrow-0 试图解决许多 AI 都会犯的错误。自然对话有一种流动感,参与者之间有一种给予和接受的关系,一方等待另一方停止说话后再接话。j2g喜好网-记录每日喜好的科技时尚娱乐生活

然而,AI 有时会过早插话——有时甚至会打断对方。这种突然性发生是因为 AI 模型的思考速度比人类快,而 AI 模型开发者非常努力地降低延迟,即 AI 模型响应所需的时间。但如果 AI 响应太快,就会显得不自然。j2g喜好网-记录每日喜好的科技时尚娱乐生活

Sparrow 模型通过理解语言节奏来让对话感觉自然,知道何时暂停、何时说话和何时倾听。它不会对"呃"这样的填充词做出反应,也不会等待长时间的沉默,而是根据语气、节奏和上下文进行调整。j2g喜好网-记录每日喜好的科技时尚娱乐生活

"如果它确定你正在进行快节奏的友好对话,它会快速回应,"Raza 解释道。"但如果你说'让我想想',AI 会给你空间。这样就使对话更自然。"j2g喜好网-记录每日喜好的科技时尚娱乐生活

与其他将技术拼凑在一起的公司不同,Raza 表示,Tavus 开发了一个集成系统来整合这些模型。结果是一种高度沉浸式的体验,更像是在与真人交谈,比其他人形化 AI 系统更自然。j2g喜好网-记录每日喜好的科技时尚娱乐生活

Raza 表示,模型功能还有提升空间,这意味着需要持续改进 AI 感知和理解人类的能力。j2g喜好网-记录每日喜好的科技时尚娱乐生活

"现在还不是完美的,但它是同类最佳,"Raza 补充道。"然而,我们未来的目标是开发出一个如此深入理解人类的模型,除非你特意询问,否则你不会知道它是一个模型。"j2g喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
丰田公开搭载氢发动机的混合动力车,加氢一次续航约 250 公里

丰田公开搭载氢发动机的混合动力

11 月

11-19 117阅读
比亚迪造出的第一款实车“316”亮相,王传福称第二天就砍掉了

比亚迪造出的第一款实车“316”

11 月

11-19 128阅读
一家早期科技基金,今年投了10个亿

一家早期科技基金,今年投了10个亿

周期

11-19 107阅读
割不动贵妇,燕窝盯上男总裁

割不动贵妇,燕窝盯上男总裁

消费

11-19 136阅读
叮咚买菜上岸、巨头加码火拼,前置仓大战重启

叮咚买菜上岸、巨头加码火拼,前置

近年

11-19 113阅读
一夜新娘袁昊年龄, 袁昊扮演的秦尚城和花溶在一起了吗

一夜新娘袁昊年龄, 袁昊扮

网剧《一夜新娘》热播,男主袁昊圈

11-19 107阅读
小舍得原著结局是什么?南俪和夏君山的结局好不好?

小舍得原著结局是什么?南俪

《小舍得》是一根据鲁引弓的同名

11-19 102阅读
千古玦尘凤染和是凤焰什么关系?白烁是月弥的转世吗?

千古玦尘凤染和是凤焰什么

《千古诀尘》中凤染和是凤焰什么

11-19 112阅读
电视剧《三大队》今日开播,秦昊演刑警队长程兵

电视剧《三大队》今日开播

由张译领衔主演,王骁、曹炳琨、魏

11-19 124阅读
我们都在等待,等待钟声响起的那一刻。那是我生命最后的一刻,那也是最好的时刻

我们都在等待,等待钟声响起

  一段民族不可遗忘的历史,一个隐蔽

11-19 107阅读
传索尼正在研究如何在PS5主机上原生运行PS3游戏

传索尼正在研究如何在PS5

据最新传闻,索尼目前正在致力于让PS3游

11-19 124阅读
CS1.6怎么加机器人?CS1.6加机器人方法

CS1.6怎么加机器人?CS1.6

《CS1.6》也就是大家都玩过的反恐精英

11-19 192阅读
原子之心展览园死者位置_展览园全部死者位置一览

原子之心展览园死者位置_

原子之心游戏的展览园区域中一共拥有11

11-19 112阅读
原神流转存续的花神诞祭主线任务攻略

原神流转存续的花神诞祭主

流转存续的花神诞祭是原神须弥地区魔神

11-19 132阅读
饥荒体温过高怎么办?饥荒所有降低体温的方法分享

饥荒体温过高怎么办?饥荒

饥荒体温过高怎么办?饥荒游戏里面拥有体

11-19 113阅读