克隆,翻译,抄写,欧洲希望在音频世界大战中发表声音

控制数字演讲的战斗是开放的。在声乐助理的背后,自动加倍的视频和对话代理人,对声音应用的人工智能行业的结构是结构化的。声带综合,真实的时间转录,语音克隆,多语言配音…声音变成了 战略向量 在IA接口的概括中。

在这次世界大战中 欧洲试图不保持沉默

声音作为声音的接口作为力量

在生成技术的宇宙中,声音占据了一个单一的位置,它是人与机器之间的自然界面。与文本或图像不同,它具有情感,语调,节奏。它将交换变成关系。声音也是AI代理,媒体平台和专业应用程序的下一个扩展领域。

从这个角度来看,专业演员能够以前所未有的精度来改变人类的声音或模拟它。在这浪的头部, Elevenlabs 现在被确立为语音AI的全球参考。

Elevenlabs,具有全球影响力的技术冠军

由两位波兰工程师Mati Staniszewski和PiotrdąBkowski于2022年创立,Elevenlabs现在安装在纽约。它的野心是提供 现实的人声合成,能够在 29种语言,用精致的执行方式引诱了出版商,视频游戏工作室和创意平台。

这家初创公司刚刚完成了筹款活动 1.65亿欧元 (1.8亿美元) C系列,领导 Andreessen Horowitz(A16Z)ICONIQ增长在NEA的支持下,Salesforce Ventures,红杉资本,Lunate等。 估值达到33亿美元,哪个放置Elevenlabs 在世界顶部声音AI部门

Gladia,PaperCup,Acapela:欧洲的回应变得越来越清晰

面对这种加速,欧洲不会保持不活跃。几家本地创业公司(在技术上都不明显,但在技术上都稳定,都投资于人声AI领域,每个领域都在其他细分中:

  • 格拉迪亚 (法国)发展了一个API 实时多语言转录,带有扬声器检测,情感分析和自动翻译。它的所有者引擎, Solaria,显示一个延迟 270毫秒 和精度 94%。格拉迪亚抚养长大 1450万欧元 2024年10月,Xange,Financial Illumina和XTX Ventures。
  • PaperCup (英国)提供了一种解决方案 自动配音 视频,特别是由Sky News,Insider或Bloomberg使用的视频。它位于媒体和电子学习市场上。
  • Acapela组 (法国/比利时)是一位历史参与者 个性化的语音综合,具有工业,医疗和机构用途(SNCF,健康,障碍)。
  • Voxisgen (法国)设计 裁缝 – 制作合成声音 用于运输,公共服务或板系统。

迈向欧洲人声主权?

Elevenlabs的崛起突出了 欧洲的结构延迟 在人声技术的投资和协调方面。存在技术砖,用例是真实的,但是资金仍然分散。在声音变成一个的市场中 战略主动, 对于可访问性,培训,客户关系或智能代理商,这种分裂提出了问题。

欧洲的反应可能会通过一个工业联盟,将转录,综合和配音围绕主权基础设施进行汇总。否则,公共服务,媒体内容或教育平台中使用的语音服务将取决于欧洲的演员。一个好的听力。