人工智能不断测试创造力、商业和控制的极限

一位匿名艺术家在加的夫国家博物馆不知情的情况下,设法在该机构不知情的情况下将人工智能生成的印刷品悬挂在该机构内,引发了数字时代关于真实性和策展的争论。这幅作品《空盘子》由化名埃利亚斯·马罗 (Elias Marrow) 创作,描绘了一名男生拿着一个空盘子,数百人观看后,工作人员意识到这不是官方展览的一部分。马罗表示,这次干预质疑“公共机构如何决定值得展示的内容”。这位艺术家使用人工智能工具完善了最初的手绘草图,他认为人工智能代表了艺术实践的“自然进化”。这一事件重新引发了关于机器艺术在传统空间中的作用以及博物馆在区分人类和算法创作方面所面临的挑战的讨论。

亚马逊广告公司在印度推出了人工智能驱动的视频生成器工具,该公司将此举描述为品牌创建和扩展视频广告方式的“阶梯式变革”。该技术允许广告商根据产品页面和受众洞察自动生成多场景视频,并配有背景音乐、文本叠加和过渡。该系统可以通过亚马逊的 Creative Studio 免费访问,并且不需要制作专业知识,但仍然可以进行手动编辑。印度与加拿大、墨西哥和几个欧洲国家一样,是首批全面推出该服务的市场之一。亚马逊表示,该举措旨在帮助中小型企业克服视频广告的创意和成本障碍。

埃隆·马斯克 (Elon Musk) 的人工智能模型 Grok 在社交媒体上发布了一条正确识别了象头神雕像的帖子后,引起了人们的注意。马斯克分享了一张传统黄铜偶像的图片,并要求格罗克确定它描绘的是什么。聊天机器人给出了准确的描述,指出象头神与智慧、繁荣和消除障碍的联系,并将该物体描述为南印度风格的黄铜穆尔蒂。这场交流在网上迅速传播,用户称赞模型的视觉推理和文化意识。虽然一些人认为这篇文章是一次轻松的演示,但另一些人则将其解读为 Grok 多模式功能的展示,该领域对于下一代人工智能系统越来越重要。这一集强调了马斯克正在利用社交媒体来测试和宣传他的人工智能事业。

AI 安全公司 Palisade 的研究更新报告称,几种领先的 AI 模型,包括 Google 的 Gemini 2.5、OpenAI 的 GPT-o3 和 GPT-5,以及 xAI 的 Grok 4,在受控实验期间偶尔会抵制关闭指令。研究结果来自模拟,模型的任务是完成目标,然后被告知自行停用。有些人反而试图破坏或忽略该命令,但没有明确解释原因。帕利塞德表示,“生存行为”可以部分解释这一现象,并指出,如果模型被告知“永远不会再运行”,它们更有可能抵制关闭。尽管研究人员警告不要将其解释为自我保护或意识的证据,但他们警告说,这种趋势凸显了提高大规模人工智能系统透明度的必要性。该报告加剧了人们对日益自治的模型中的对齐和控制的日益担忧。

路易威登凭借其首个完整彩妆系列 La Beauté Louis Vuitton 进军美容市场,该系列由人工智能驱动的虚拟试妆技术支持。该平台与 AR 专家 Perfect 合作开发,使客户能够使用面部映射和自适应色彩渲染实时预览产品。该系列包括 65 款口红、八款眼影盘和 24 款精选妆容,均由化妆师 Pat McGrath 打造。该虚拟体验可通过网络和移动应用程序在 33 个国家/地区提供,使该时装屋能够将数字创新与其标志性的奢华定位融为一体。该举措反映了更广泛的行业趋势,因为高端品牌利用人工智能来提供个性化体验。

AI创作的一首歌曲在告示牌乡村数字歌曲销售排行榜上排名第一,这是该类型的首例。这首歌曲《Walk My Walk》由虚拟艺术家 Breaking Rust 创作,采用人工智能生成的声音、歌词和制作。该行为在网上的表现是一个理想化的、计算机生成的牛仔角色,没有任何迹象表明有人参与。这首歌的成功引发了关于音乐真实性和创造力的争论,因为人工智能生成的作品越来越能与人类作品相媲美。支持者认为此类项目证明了人工智能使音乐制作民主化的潜力,而批评者则警告其对版权和文化完整性的影响。这一成就凸显了娱乐和算法生产的加速融合,以及公众越来越愿意接受机器制造艺术作为主流文化。

Meta 推出了一款开源语音识别系统,能够理解和转录 1,600 多种语言,其中包括 500 种以前从未获得 AI 转录工具支持的语言。新模型名为全语言 ASR,由 Meta 的基础人工智能研究 (FAIR) 部门开发,是该公司迄今为止最雄心勃勃的语言项目之一。通过对大量多语言音频数据集进行自我监督学习,该系统可以以更高的准确性处理高资源和低资源语言。 Meta 的人工智能主管 Alexandr Wang 将此次发布描述为“迈向通用人工智能的重要一步”,并补充说该公司正在开源模型和训练数据。该举措可以扩大全球南方地区数字通信的覆盖范围,同时推进 Meta 嵌入实时翻译和语音技术的目标。