Palabra AI筹集了840万欧元,以挑战Google和Microsoft在真实的人声翻译上

真正的 – 时间人声翻译是技术初创公司和巨人之间的下一个对抗领域之一。在不到两年的时间里,能够在没有明显延迟的情况下恢复对话的解决方案正在增加。 Google Meet加入了2024年通过双子AI的同时翻译功能,而Microsoft正在为具有投票声音的团队的自动解释器做准备,计划于2025年初。在这种情况下,一些年轻的拍摄依赖于他们的技术敏捷性来赢得胜利。

其中,英国Palabra AI声称已经跨越了其声音引擎的技术课程,该过程在句子期间开始翻译,这要归功于上下文预测系统的结尾。结果:潜伏期不到800毫秒,足以维持讨论的流动性。该公司还开发了一个人声克隆所有者,该主人恢复了邮票,节奏和语调。

差异化也尊重隐私,因为与该行业的巨人不同,Palabra强调了一种“设计隐私”方法。没有音频存储,处理以连续流动进行。一个关键的论点虽然欧美法规越来越多地监督声音数据的使用。进行投资的七个六(776)基金的创始人亚历克西斯·奥纳尼亚人(Alexis Ohanian)认为,“帕拉布拉是唯一的市场解决方案,它是真正的时间翻译的承诺。潜伏期足够低以允许自然对话,而声音克隆则是如此精确,以至于我们立即认识到谁讲话。”

在法国,格拉迪亚(Gladia)实时将自己确立为音频转录的参与者之一,强烈着重于整合到专业工作流程和API的可扩展性中。该公司已经赢得了视频会议和教育领域的几个客户,并以通用音频基础架构的逻辑定位。帕拉布拉(Palabra)在邻近的土地上演变,但具有明显的声音忠诚度和演讲者身份的繁殖。这两种方法反映了一种欧洲动态,声音成为企业的新战略界面。

面对他们,其他专业竞争对手(例如Kudo)或Interprefy已经为活动和视频会议提供了即时的人声翻译。但是这些解决方案通常依赖于人工智能和人类解释的结合,并努力达到Palabra声称的流动水平。在美国,Ezdubs或Camb.ai之类的初创公司也会前进,但没有提供相同的低延迟和先进的人声克隆的组合。

市场仍在出现,但是神经模型的演变,对移动用途的优化以及教育,流媒体或商业协作的需求不断增长,为大规模采用带来了条件。对于语言多样性仍然是一个结构性挑战的欧洲,诸如Palabra或Gladia之类的解决方案正在为新一代的即时交流工具铺平道路。

Palabra AI宣布,它已筹集了840万欧元的预资助,由美国基金七七(776)领导,由创作者风险投资和几个商业天使参加,包括Max Mullen,Max Mullen,Anne Lee Skates,Mehdi Ghissassi和Namat Bahram。该公司由Artem Kukharenko在伦敦创立,计划使用这些资金来加强其在欧洲和北美的技术和商业团队,并加速其已在国际会议和广播中使用的公共API的开发。