AI Accent Converter引发辩论,“实时成为美国人”

人工智能正在推动我们交流的界限,现在,我们的声音。 AI驱动的通信软件公司KRISP的一种新工具正在网上在网上引起Waves的实时重音转换技术,该技术有望使非美国英语口音,尤其是印度人的口音,听起来更“中性”,或者更确切地说,更恰当地是美国人。

在印度呼叫中心代理商Manoj上分享的最近的演示视频中,展示了Krisp的“语音保存模式”的工作方式。他说:“清晰的沟通对我和我的客户至关重要,但重音障碍有时会使它具有挑战性。”随着开关的翻转,该软件将其标识为他的口音的“具有挑战性”部分。结果:Manoj听起来仍然像他自己一样,但带有软化的口音,倾向于更普遍的美国语气。据他说,该工具使对话更加顺畅,并“提高了通话两边的满意度”。随着200ms的延迟,这种转变会无缝和立即发生。

Krisp的联合创始人Arto Minasyan坚持认为这一举动并不源于偏见。他解释说:“这与偏见无关,而只是沟通的现实。”尽管如此,推出仍引起了尖锐的批评,并激发了关于追求清晰度的损失的辩论。该工具已经在呼叫中心进行了测试,在呼叫中心,通常期望代理会适应西部耳朵的声音。该产品的免费用户每天获得60分钟的重音转换,而每月15美元的订阅购买“无限文化统一性”。

在线响应已被划分。一些用户为该工具辩护,认为诸如客户支持之类的角色的沟通效率至关重要,如果删除口音有助于更快,更清晰地介绍点,那是一个实用的解决方案。一个人写道:“如果您要说一种语言,如果适用于通信职业,则需要有效地完成。”另一位用户指出:“我们中有些人不能说另一种语言,并欣赏其他具有这种能力的人,但是对那种才能的敬畏并不意味着我突然能够理解口音,尤其是当听力挑战变得更加困难的时候。”

尽管如此,许多人还是在问:这里正在推广哪种美国口音? “那么,这是豪华的新英格兰口音,北部缅因州的口音,布朗克斯口音,德克萨斯州的绘画,阿巴拉契亚山麓丘陵口音,路易斯安那州的cajun口音还是大约50个其他“美国”口音之一?“询问头脑都想知道……”一位用户写道。

有些人将其视为完全自动化的垫脚石。另一位评论指出:“有了AI,我们将不需要得克萨斯州的Josh或BLR的Jay。”其他人则表示他们已经付诸实践的努力。一个人说:“我花了很多时间来学习平庸,荒谬的美国口音。这一切都是无所不能的,”一位人士说,反映了为了适应全球业务生存的非本地英语说话者的普遍情绪。

最终,KRISP的AI Accent Converter开展了关于清晰度和文化擦除之间平衡的急需对话。随着企业变得越来越全球化,像这样的工具成为主流,挑战不仅仅在于彼此了解,这将是确保我们不会在此过程中失去自己。