阿里巴巴云通过揭示其人工智能策略的工业化。 qwen2.5-omni-7b,一种新一代模型,专为板上使用。这种能够治疗文本,图像,音频和视频的多模式的模型已优化,可在没有性能降解的情况下在边缘终端(例如手机)上执行。
通过关注本地执行,而不是云基础架构的唯一能力,阿里巴巴希望在AI应用程序中越来越需要对自治和响应能力的需求。该模型可以实时产生文本和声音响应,这使其特别适合具有高时间或上下文约束的用例。
根据该公司的说法,QWEN2.5-OMNI-7B是开发低成本智能代理的相关技术基础。在提到的集成示例中:作为本周扩展的合作伙伴关系的一部分,用于视觉障碍或集成到未来的宝马车辆中的真实时间 – 人声帮助。
这种技术方法是开放逻辑的一部分:该模型可在“拥抱面和github”的开源中获得,就像DeepSeek R1模型在中国发起的动态一样。阿里巴巴声称迄今为止有200多个生成模型开放了三年,因此巩固了有利于快速采用的生态系统策略。
当然,这种变化是随着中国生成AI的竞争加剧。 Baidu最近介绍了自己的多模式模型和面向LLM的推理,而阿里巴巴乘以迭代:其夸克助手的新版本,QWEN系列的更新以及Apple Universe中的集成项目。该公司还宣布在三年内投资530亿美元的云和人工智能,这是该小组级别的前所未有的努力。