人工智能包括单词。很少有人知道如何听。 Pyannoteai打算通过几乎没有被利用的技术来跨越的边界即可:演讲者情报。
该公司由HervéBredin,培训研究员和前CNR在巴黎建立,该公司希望将声音定位为丰富的信号,具有身份,情感和上下文的信息范围,而不是口头内容。
声带智慧,超越言语
十年来,Pyannoteai一直在发展专业知识 “人声诊断”,这种能够识别说话,何时和意图的能力。与传统的转录解决方案不同,该技术可以实时地在复杂的对话中识别说话者,即使以不同的语言表达了几个人,也可以识别出几个人。
承诺: 使AI“说话者意识到”也就是说,能够根据演讲者的身份,语调和对话中的角色来调整其语言待遇。对于公司而言,它不再只是“理解”的问题,而是 上下文化。
语音应用程序的关键基础架构
这种类型的技术砖在许多领域都至关重要。在客户服务中,这是一个问题,即在几个对话者之间进行对话而不会混淆。在健康方面,分析患者和护理人员之间的交流。在视听中,在尊重原始话语的语气和节奏的同时,自动化多语言配音。
因此,声音的分析成为新一代声音应用的结构基础,包括创建合成声音。在其他人致力于语言流动性或产生情感的地方,Pyannoteai专注于分配的准确性:知道谁说话并以忠诚度反映这一点。
从开源到工业化
pyannoteai并非从零开始。它的技术基础可在开源中获得,已经为一个社区提供了更多 100,000个开发人员 并记录 每月下载4500万。这种采用深度使其在人声AI世界中罕见的技术合法性。
现在的目标是将这一进步转换为 公司产品。推出了针对北美和欧洲市场的交钥匙解决方案,集成到业务人声管道中:这家初创公司正在进入其开发的新阶段。
筹款以结构国际部署
Pyannoteai宣布已举起 810万欧元的种子 和 起重机风险合作伙伴 和 Serena,随着两个基准商业天使参与欧洲AI: 朱利安·乔蒙德(Julien Chaumond) (拥抱面的首席执行官)和 Alexis Conteau (前,前奥奈)