尽管印度AI初创公司Sarvam正在采用最新的大型语言模型(LLM)Sarvam-M的旗舰店扩大运营,但并没有避免避免强烈反对。因此,Zoho首席执行官Sridhar Vembu本周末来了该公司的营救。
正如Sarvam AI的Sarvam-M的评论一样,建立在Mistral Small的基础上的240亿参数的开放式混合语言模型继续涌入社交媒体上,因此裁定是国际技术人员不完全加入。尽管该公司以印度为重点的游戏计划,但与OpenAI或DeepSeek的比较试图质疑其在全球主流上的地位。
Sarvam-M在X上的强烈反弹
该公司为其新发展而感到自豪,联合创始人Vivek Raghavan说:“ Sarvam-M代表了我们为印度建造主权AI的旅程中的重要垫脚石。”但是,Menlo Ventures的投资者Deedy Das在将进步作为“尴尬”之后引起了激烈的辩论,它与开源模式绘制了Stark的相似之处,该模型是由两名韩国大学生开发的。
“印度最大的AI初创公司,$ 1B Sarvam,刚刚推出了其旗舰LLM。这是一个24B Mistral小型帖子,在推出2天后仅在23个下载的指示数据培训,”他在周六早些时候(IST)上发了推文。 “相比之下,2韩国大学培训了上个月大约200k的开源车型。”
根据他的观察,印度的AI场景似乎更多地是在做“酷酷的人AI的酷事”,而不是“让我们解决重要的困难问题”。他在一条后续推文中补充说:“没有人要求使用一个更好的24B指示模型。显然。”
没有足够的人关心指示语言并具有传统的指示性LLM。
告诉我上次我们写并输入区域语言的时候。大多数拥有任何购买能力的人甚至都不愿意阅读指示脚本。
我认为没有足够的… https://t.co/pxmw01kggf
– Arpit Bhayani(@ARPIT_BHAYANI) 2025年5月24日
总结在X上的评论轰炸线程时,他终于说,他对模型的批评被误解了,因为他本质上不是“反对反对……反对萨尔瓦姆”,甚至印度建立了AI。他为自己的立场辩护,并补充说:“这些是荒谬的事情,我对他们的方向感到失望,并希望他们能够用资源来实现更多。”
Zoho首席执行官捍卫Sarvam AI,其他人加入
Zoho的Sridhar Vembu翻转了对话,并指出在这个领域中,即时病毒性是不可能的,不一定是头等大事。 “为了捍卫sarvam.ai,我将指出,我们没有立即建造的产品。”
他以自己一方的榜样为例,继续在X帖子中说:“即使我们是新市场上的第一批推动者,而且我们做了很多技术工作,我们也只会慢慢吸引。”他鼓励萨尔瓦姆团队“继续战斗”,他认为即时成功“既不是必要的也不足以长期取得成功”。
为了捍卫https://t.co/tyqr5lmkuz,我将指出,没有我们建造的产品曾经是即时的热门单曲。即使我们是新市场上的第一批推动者,并且我们做了很多技术工作,我们也只会变得缓慢。即时成功既不是必要的……
– Sridhar Vembu(@svembu) 2025年5月25日
Sarvam AI自己的Harveen Singh Chadha指出,尽管许多人选择在其社交媒体平台上针对该模型发射diaTribes,但大部分派系甚至没有尝试在自己尝试模型之后跟进反馈。 “有90k关注的人会在星期六早上在Twitter上发布很多Gyaan。但是不会花10分钟尝试模型并分享反馈。这就是为什么不足的人关心的原因,如果您只是使用您的追随者即使不尝试就批评您也是问题的一部分。”
也来自Sarvam AI的Aashay Sachdeva也支持该模型,称其为“不仅是一个好的指示模型”,还称其为“具有思维模式的总体24B模型”。直接回到迪迪·达斯(Deedy Das)的批评中,他还写道:“是的,我们想为此而在ML中做一些很酷的事情。”
我们昨晚发布了它,所以不是2天
HF数字需要一段时间才能更新
而且我们绝对没有$ 1B的重视是的,我们想为此而在ML中做冷静的事情
它也是一个不错的指示模型,它始终是具有思维模式的总体24B模型。 https://t.co/ubblunqoec
– Aashay Sachdeva(@aashaysachdeva) 2025年5月24日
Sarvam AI将其新的Sarvam-M的介绍描述为“用于印度语言,数学和编程的混合模型模型”。该网站的官方博客文章详细介绍了该模型通过涉及,监督微调(SFT),具有可验证奖励(RLVR)(RLVR)的强化学习和推理优化的三步过程得到了增强。 Sarvam-M目前可通过Sarvam的API获得。可以从拥抱的脸上下载。