大型语言模型(LLM)和变形金刚的出现导致全球人们敏锐地在日常生活中采用诸如Chatgpt之类的工具。但是,大量能源消耗,对云的高依赖性,来自大型数据库和数据所有权相关的偏见的输出导致了寻找解决方案和识别LLM的替代方案的努力。智能手机,物联网设备和变形金刚库的可用性的扩散是小语言模型(SLM)的催化剂。从构建域特异性SLM和离线模型中,重点现在旨在构建多模型代理SLM。
印度是最早开始从事LLMS替代品的国家之一,专注于白话语言和成本效率。就像印度一样,其他发展中国家也在试图建造SLM。印度尼西亚,菲律宾和秘鲁正在培养语言助手,以支持这些国家使用的各种语言。尼日利亚和肯尼亚正在为农业咨询支持建立SLM。
印度AI堆栈的目的
巴希尼(Bhashini)是由政府主导的开放式体系结构设计的国家平台,可在多种印度语言中启用基于AI的语言翻译和语音识别。正在努力为教育,健康,农业和就业创建农村特定的SLM。印度AI堆栈的目的是减少对外国训练模型的依赖,并与印度社会文化的敏感性保持一致,并使它们适合于低连通性领土的设备。 Sarvam AI专注于不同语言的语音到文本,而Gram Vaani则使用SLMS在印地语和Bhojpuri中提供农村新闻和一种申诉的模式。
SLM将在小城镇促进创新,并将AI包含在内。通过在设备上托管SLM,公民有可能访问诸如天气公告,作物咨询,财务信息和政府计划等服务。一个很大的问题是个人数据被搬到印度以外的地方。 SLM允许政府,银行,医院和其他法人实体在当地保留数据并确保其隐私。
大语模型(LLM)的优势
在SLM的帮助下,教育质量的交付和访问质量可能会大大充满活力。可以在各自的语言中为学生提供个性化的学习途径和咨询。根据工作的可用性和人才的要求,每个位置都需要以本地语言的方式交付每个位置的技能,并使其负担得起。
SLM的成功还取决于如何将数据标记和分类为数据建模。每个领域都需要进行仔细的计划和长期思考,其中有多个参与该计划的利益相关者创造一个强大的基础,这是成功部署SLM的先决条件。由于印度在低成本和获得大型,可扩展的AI人才库方面具有优势,因此,一旦我们在各个部门的部署方面取得进展,其他国家就为不同领域,设备和语言建立SLM的专业知识将受到人们的追捧。