小语言模型获得了巨大的吸引力

尽管GPT-4和Gemini等大型语言模型(LLM)捕捉了全球头条新闻,并吸引了主要的机构投资(包括来自政府,最近利用四家初创公司来开发它们),这是一个更安静但更有力的转变。小型语言模型(SLM)在印度迅速获得了吸引力,这是由于其负担能力,效率和现实世界中的相关性在资源受限的环境中。

这是有原因的。与较大的对应物不同,SLMS紧凑,节能,并且设计用于直接在本地设备上运行,而无需连续的云访问。初创公司的创始人说,这使其非常适合印度用例,尤其是在Internet连接有限或可变计算基础架构的地区。

“ SLM的需求是建立负担得起的,节能且对隐私友好的AI解决方案的理想选择,” Corover的创始人兼首席执行官Ankush Sabharwal说。 “它们可以直接在设备上运行,而无需云服务器,保护敏感数据并降低成本和能源的使用情况。”

为了满足这一不断增长的需求,Corover于2024年12月推出了Bharatgpt Mini,这是一个紧凑的SLM。在不到五个月的时间里,该平台的18,000名用户中,大多数用户(跨越企业,研究人员和开发人员)都采用了该模型。该公司现在预计,明年的项目量将增加60-70%,目标是超过100万个实施。

萨巴瓦尔指出:“ Bharatgpt Mini在本机应用程序,语音界面,IoT设备和制造系统中无缝集成。” “它即使在离线模式下也可以确保可靠的性能,并提供了依赖云依赖性LLM的实用,具有成本效益的替代品。”

像GPT-4和Gemini这样的LLM具有很高的能力,但具有巨大的基础设施需求。这正是SLM找到其优势的地方。 Sima.ai的首席执行官兼创始人Krishna Rangasayee说:“ SLM是因为它们为LLM无法轻易服务的环境带来了精确,隐私和绩效的吸引力,尤其是在像印度这样的多元化和充满活力的国家。”

Sima.ai最近推出了Modalix,这是一个机器学习系统片(MLSOC)平台,旨在支持SLMS等紧凑型高性能模型。 Modalix可以使Llama,Llava,Gemma和DeepSeek等AI模型直接在无人机,监视系统,工业机器人和医疗设备等设备上运行 – 无需云连接。

创业公司在SLM上加倍的另一个原因是它们在特定于任务的应用中的优势。与旨在成为通才的广泛的LLM不同,SLM在狭窄范围范围内进行典范和深入优化时表现出色。

Fractal首席AI研究与平台官Suraj Amonkar说:“小型模型非常适合特定领域的需求。” “我们还看到这些模型变得更加复杂,并从’语言模型’转变为“推理模型”,这些模型可以对复杂的查询进行更深入的思考。”

分形已推出了一系列特定领域的模型,例如kalaido.ai用于图像生成,vaidya.ai用于医疗和健康查询。它也最近开放为FATHOM-R1-14B,这是一个对今年IIT JEE高级数学考试测试的数学推理模型。 “它能够解决所有问题,”阿蒙卡说。在发布后的几天内,该模型下载了数千个下载量,比同一时期的印度竞争模型高出50%。

印度的语言多样性进一步促进了SLM的相关性。它们的尺寸较小和较低的培训成本使他们更容易为低资源的印度语言微调。

Gnani.ai是上周政府为开发基础AI模型而选择的四家初创公司之一,他建立了对数十亿个语言对话和数百万个小时的音频进行培训的语音优先SLM。 Gnani.ai的联合创始人兼首席执行官Ganesh Gopalan表示:“我们的SLM帮助一家领先的银行恢复了超过10亿美元的逾期EMI,显示了现实世界的影响。”

Gnani的Enterprise AI业务同比增长超过130%。它的实时语音代理解决方案Assist365现在每月处理超过5000万次对话。其自动化平台Automate365在去年的使用情况下增加了两倍,而语音生物识别工具Armour365则在金融机构采用的收养中增长了90%。该公司现在准备启动Inya.ai,这是一个无代码平台,允许企业在几分钟内部署智能的语音代理。 Gopalan补充说:“企业不再对AI进行实验,而是正在为其进行操作。”

同样,对话式AI独角兽Gupshup也参加了SLM比赛,推出了一套针对不同成本和性能需求的紧凑型型号。这些模型集成到其核心平台中,正在跨零售,BFSI,物流和白话内容等部门部署。 Gupshup预计SLM的采用率将在来年上升60-80%。

随着人们对云基础设施成本,数据隐私以及对本地嵌入情报的需求的关注日益加剧,行业专家预测,小型和中型企业采用SLM将在26财年至少增长五倍。

尽管LLM可能会继续占据头条新闻,但SLM的安静效用和适应能力在地面上转向地面,塑造了印度AI的未来。