Sarvam.ai 联合创始人 Vivek Raghavan 表示,将在未来几个月内推出印度第一个基础大型语言模型。
Raghavan 补充道,本土开发的大型语言模型将包含在超过 17 万亿个令牌上训练的 1200 亿个参数,其中 15-20% 的训练数据来自印度。他补充说,印度来源数据的高度集中将是与当前开源模型的重大飞跃,目前印度数据所占比例不到 1%。
印度人工智能使命早些时候选择 Sarvam 作为第一家构建印度基础人工智能模型的初创公司。此次发射是印度发展主权人工智能能力的一个重要里程碑。
拉格万是谁?
Raghavan 是一位企业家和技术专家,此前曾与 AI4Bharat 的 Infosys 联合创始人 Nandan Nilekani 一起参与了印度数字堆栈的建设,包括 Aadhaar,他强调从头开始构建基础模型对于印度具有重要的战略意义。 “这项技术非常重要,如果你不知道这项技术的核心是如何工作的,从头开始,你就有完全被抛在后面的风险,”他说。
Sarvam.AI 上的 Raghavan
Raghavan 表示,Sarvam 还将与印度企业合作,利用其数据共同开发特定领域的人工智能模型,满足特定行业需求,同时维护数据主权。