多模式 +边缘计算：阿里巴巴的土地AI食谱

阿里巴巴云通过揭示其人工智能策略的工业化。 qwen2.5-omni-7b，一种新一代模型，专为板上使用。这种能够治疗文本，图像，音频和视频的多模式的模型已优化，可在没有性能降解的情况下在边缘终端（例如手机）上执行。

通过关注本地执行，而不是云基础架构的唯一能力，阿里巴巴希望在AI应用程序中越来越需要对自治和响应能力的需求。该模型可以实时产生文本和声音响应，这使其特别适合具有高时间或上下文约束的用例。

根据该公司的说法，QWEN2.5-OMNI-7B是开发低成本智能代理的相关技术基础。在提到的集成示例中：作为本周扩展的合作伙伴关系的一部分，用于视觉障碍或集成到未来的宝马车辆中的真实时间 – 人声帮助。

这种技术方法是开放逻辑的一部分：该模型可在“拥抱面和github”的开源中获得，就像DeepSeek R1模型在中国发起的动态一样。阿里巴巴声称迄今为止有200多个生成模型开放了三年，因此巩固了有利于快速采用的生态系统策略。

当然，这种变化是随着中国生成AI的竞争加剧。 Baidu最近介绍了自己的多模式模型和面向LLM的推理，而阿里巴巴乘以迭代：其夸克助手的新版本，QWEN系列的更新以及Apple Universe中的集成项目。该公司还宣布在三年内投资530亿美元的云和人工智能，这是该小组级别的前所未有的努力。