Openai周一宣布了一系列重大改进 高级语音时尚,标志着将Chatgpt转换为完整的对话者的新步骤。在明显技术更新的背后 – 减少人声性格的中断和调整 – 更重要的转折点: AI进入对话阶段的逻辑。
一个不那么侵入性,更具体现的声音
到目前为止,基于人工智能的人声助手有一个良好的缺陷:他们 削减言语的趋势在丝毫休息或用户呼吸时触发。有了这个新版本,Openai纠正了镜头。 AI学会了等待,呼吸,中止干预。简短的, 它采用了人类言语的守则。
但是更新超出了简单的延迟调整。付费订户 – 更多公式,团队,业务,EDU和Pro的用户 – 现在受益于想要成为的助手 更直接,更具吸引力,更简洁,更具体,更具创造力根据Openai发言人接受采访的发言人 TechCrunch。语气是完善的,分布是平衡的,声音变得性能。
从语音命令到脚本对话者
这 语音模式不再是简单的人声听写工具,而是一个共同主持设备。 Openai似乎受到脱口秀或播客的动态的启发,在这些动态中,聆听,复兴和音调之间的平衡产生了一种情感附着的形式。通过这些调整,AI助手不再仅响应命令,他 共同构建了叙事序列。
直接回应竞争的兴起
这一公告是在基于LLM的声乐助理市场上越来越大的压力的背景下。创业 芝麻,由安德森·霍洛维茨(Andreessen Horowitz)支持,由Oculus的前儿子Brendan Iribe创立,最近以他的声音创建了该活动 玛雅 和 英里,他们因其令人惊叹的自然而受到欢迎。就其本身而言,亚马逊正在准备具有扩展生成能力的新版本的Alexa。
面对这种动态的Openai,不仅试图提高其系统的性能,而且还试图提高 安装关系语法,声音不再仅限于传递答案,但是 体现姿势。