Sarvam.ai 将于明年初推出印度首个法学硕士课程

Sarvam.ai 联合创始人 Vivek Raghavan 表示，将在未来几个月内推出印度第一个基础大型语言模型。

Raghavan 补充道，本土开发的大型语言模型将包含在超过 17 万亿个令牌上训练的 1200 亿个参数，其中 15-20% 的训练数据来自印度。他补充说，印度来源数据的高度集中将是与当前开源模型的重大飞跃，目前印度数据所占比例不到 1%。

印度人工智能使命早些时候选择 Sarvam 作为第一家构建印度基础人工智能模型的初创公司。此次发射是印度发展主权人工智能能力的一个重要里程碑。

拉格万是谁？

Raghavan 是一位企业家和技术专家，此前曾与 AI4Bharat 的 Infosys 联合创始人 Nandan Nilekani 一起参与了印度数字堆栈的建设，包括 Aadhaar，他强调从头开始构建基础模型对于印度具有重要的战略意义。 “这项技术非常重要，如果你不知道这项技术的核心是如何工作的，从头开始，你就有完全被抛在后面的风险，”他说。

Sarvam.AI 上的 Raghavan

Raghavan 表示，Sarvam 还将与印度企业合作，利用其数据共同开发特定领域的人工智能模型，满足特定行业需求，同时维护数据主权。