下一个AI战场:记忆

长期以来,人工智能一直基于计算能力和获取大量数据的访问。从现在开始,内存就以第一个率的战略杠杆脱颖而出。在AI模型离开数据中心以在用户设备上运行的上下文中,存储,访问和处理信息的能力变得果断。

十年来,AI行业一直围绕一个简单的假设结构:性能的提高取决于计算能力的线性增加。 NVIDIA,通过捕获大多数对模型培训的GPU需求,都体现了这种逻辑。对基础模型的大规模培训需要成千上万个专业芯片的集群,这些芯片包含在高刻度计算中心中。

但是,这种集中式建筑显示了它的局限性。现在,能源成本,潜伏期,个性化要求和主权限制现在鼓励演员将情报转移到外围。转弯本地推论 :直接在电话,计算机和连接的对象上执行模型。

约束的新层次结构

这种倾斜重新定义了技术优先事项。当语音助手使用用户数据而不质疑云时,不再是GPU决定性能,而是 本地可用的内存能力,其带宽及其访问速度。内存成为IA基础架构中的关键链接。

在这种情况下,记忆制造商(长期以来一直降级为供应商的等级)找到了核心作用。三星,SK Hynix和Micron处于工业,战略和地缘政治问题的十字路口。它们的组件,无论是DRAM还是高带宽内存(HBM),都可以调节ON -Board AI的可行性。

推断飞机,新的AI边境

模型的本地执行不仅符合技术要求。它允许:

    • 为了保留数据机密性,
    • 为了减少对云基础架构的依赖,
    • 增加系统的响应能力。

此进化恢复了卡。这些模型变得更加紧凑,架构必须在板内存上进行优化,而操作系统(尤其是Android)比苹果的封闭生态系统提供了更多的开放土地。在这个动态中 内存不再仅用于存储:它成为上下文推理的基础

记忆参与者的战略性重估

循环AI(云驱动器,设备上的推断)的重新配置为价值链中的决定性位置提供了内存。随着模型成为居民,性能取决于加载,保留和使用本地数据的能力:电子邮件,照片,文档,导航历史,音频文件等。

尽管有美国出口限制,但微米还是有利的定位。通过其地缘政治灵活性,SK Hynix可以将自己确立为板模型崛起的主要受益者之一。反过来, 三星正在努力将其工业力量转变为战略优势,受到较重的治理和防御性方向的阻碍。

朝向居民和上下文的AI

智力向该设备的置换揭开了一个新时代:上下文AI的时代。一个了解其用户的AI,该AI在本地保留其历史,偏好和例程。该居民AI远离通才,通用,遥远的AI,固定在设备的记忆中。它适应,预期甚至没有永久连接。

这意味着对系统体系结构的完整修订,硬件工程师的回报以及对板上资源的良好管理的新关注。 能源效率,记忆力和访问速度成为商业差异的要素。

AI的历史首先是算法的所有历史。然后是计算。今天,它变成了记忆。

接近用户的距离越近,记忆越多,在游戏中心恢复记忆的越多 – 技术,经济,地缘政治。对于欧洲而言,生产自己的记忆芯片不再是一种选择,而是战略上的必要性。没有他们,就没有主权AI,没有能源自治,也没有面对美国或亚洲巨人的竞争行业。