Microsoft MAI-Image-1 挑战 Gemini Nano Banana、ChatGPT 和 Grok AI 图像生成器:所有详细信息请参见此处

展示生成式人工智能能力的一个好方法是发布一个文本到图像生成器——谷歌和 OpenAI 等巨头在过去几个月中利用这一公式让 Gemini 和 ChatGPT 迅速走红。微软在依赖 OpenAI 的模型之后,终于发布了自己的图像生成人工智能模型。不过,这个名字并不容易拼写——MAI-Image-1。我们希望它能在 Z 世代和 Alpha 世代中流行起来。

MAI-Image-1 是“MAI”品牌人工智能工具大家族的一部分,通过在基准测试工具中排名靠前,展示了其实力。微软的新闻发布会证实,其第一个生成式人工智能模型跻身 LMArena 的前 10 名之列,表现优于更成熟的竞争对手。对于专业人士和学生来说,这可能是个好消息。

与一些优先考虑艺术或风格效果的竞争对手不同,微软的模型专为极其精确的照片写实而设计,有望生成栩栩如生的风景和自然照明效果。 “MAI-Image-1 擅长生成逼真的图像,如照明(例如,反射光、反射)、风景等等,”该博客表示。

Microsoft MAI-Image-1 发布,作为最新的 AI 图像生成器

微软表示,人工智能图像生成器的开发涉及与创意专业人士的密切合作,这对于确保该模型能够消除通常与人工智能生成的内容相关的重复性和外观普通的质量是必要的。此外,据说 MAI-Image-1 资源效率更高,能够比笨重的替代模型更快地提供高质量图像。

MAI-Image-1 加入了 Microsoft 不断扩大的 AI 工具系列,其中还包括语音生成器 MAI-Voice-1 和聊天机器人 MAI-1-preview。微软人工智能部门负责人 Mustafa Suleyman 表示,这些产品是“庞大的五年路线图”的一部分,旨在构建独立于 OpenAI 技术运行的基础设施。

微软在其博客中写道:“我们很高兴很快就能在 Copilot 和 Bing Image Creator 中提供 MAI-Image-1”,并要求用户等待 Copilot 应用程序和 Bing Image Creator 的更新。目前,新模型将可在 LMArena 中访问。

MAI-Image-1 的到来紧随谷歌病毒式传播的 2.5 Flash Image (Nano Banana) 的到来,该图像在社交媒体上掀起了一股潮流。尽管 Nano Banana 模型已经存在了一段时间,但谷歌的图像生成器工具继续鼓励用户使用人工智能来编辑真实照片,并无缝应用各种真实感元素。