“与AI互动会感到熟悉”:Sarvam AI开发印度的首个本土LLM,具有推理能力

总部位于班加罗尔的AI初创公司Sarvam AI已由该中心根据Indiaai Mission选出,以建立该国的首个主权大型语言模型(LLM)。该计划将为Sarvam提供完全从头开始开发基础模型所需的计算资源。该模型将具有推理,语音功能和流利的多种印度语言。它还设计用于在一系列应用程序中进行安全的大规模部署。

“我们对建立印度主权模式的承担的责任使我们感到谦卑,我们准备建立到达国家每个角落的AI。这是朝着建立关键的国家AI基础设施迈出的至关重要的一步。我们的目标是从SCRATCH中建立多模式,多模式的基础模型。他补充说,对于公民来说,“与人工智能互动会感到熟悉,而不是外国人”,对于企业而言,这将使他们“在不发送其数据之外的数据的情况下解锁智能”。

主权模型将使用当地基础设施在印度制定,部署和优化,并非常重视培养印度人才。更广泛的印度特派团旨在实现战略自治,并鼓励国内创新,以使印度在未来几年中能够在AI领域的运动。

“为印度建立AI生态系统一直是萨尔瓦姆任务的核心,我们的研究,技术和模型使构建者能够为国家创建解决方案。作为主权LLM建议的一部分,我们正在开发三个模型变体:Sarvam-large:Sarvam-Large,用于先进的推理和高级推理,代表Sarvam-Small,用于实时互动应用程序,以及其他sarvam-sarvam co co in of Sarvam-dred of Sarvam-drecect of Sarvam-decect of Derice consect of Derice consect of Derice nesding” Pratyush Kumar。他还提到,萨尔瓦姆(Sarvam)正在与印度语言研究的公认领导者IIT Madras与AI4Bharat合作,以使这些模型栩栩如生。他补充说:“驱动这项工作是萨尔瓦姆(Sarvam)一流的团队,它像其他人一样了解AI开发的深度和复杂性。”

Sarvam AI已经证明了其在建立针对印度语言的基础模型方面的专业知识。最初的研究计划现在已经演变为支持政府,非营利组织和企业的主权AI平台。该公司的模型旨在具有成本效益,可扩展性,并针对印度环境进行了特殊优化。

工会电子技术部长Ashwini Vaishnaw说:“我们有信心Sarvam的模型将与全球模式具有竞争力。”