自1月以来,全球技术领域的活动量表明,人工智能种族(AI)至高无上的肤色变化。中国人工智能公司DeepSeek(DS)在唐纳德·特朗普(Donald Trump)上任的那天正式发布了其超级聊天机器人DeepSeek-R1(DS-R1)。 DS-R1融合了高推理能力,低计算成本和零应用程序编程接口费用,已成为一种全球感觉,向在生成AI(Genai)领域运作的美国科技巨头发动了震颤。
印度很快宣布了其在年底推出“土著,负担得起和安全的AI模型”的目标。支持该计划的激励软件包包括“最先进的”计算设施(靠在18,693个图形处理单元或GPU的库存上)和向开发人员授予40%的计算机补贴。后者旨在使印度本地AI模型的每小时计算成本降低到全球平均水平的三分之一。
尽管印度和中国在两个亚洲大国之间被广泛认为是一场追捕比赛,但就吉奈而言,印度和中国正在朝着不同的方向发展。尽管中国正在积极针对国际市场的模型,但印度的Genai Push着重于将其本土的AI模型部署在国家重要性的关键领域,例如农业,健康和教育。
管理贸易折扣
尽管进行了不懈的研究工作,但世界领先的AI公司尚未开发出将强大的性能与高效率相结合的Genai模型。即使是像GPT-4这样的高级推理模型也遭受了潜伏期和缓慢的响应时间,这使得它们的效率低于小语言模型(SLM),尽管后者滞后大语言模型(LLMS)在性能方面。
蒸馏型(DMS)介于两者之间。尽管它们解决了复杂的多步问题,但它们的效率比SLM的效率较低。
印度规模和多样性的国家不仅限于单一的AI模型类型。印度需要基金会模型和LLM来进行国防,国家安全和大气研究的高级研究。为了预测复杂性质的不利自然现象,例如Mizoram中Kurz Bamboo物种的质量开花,可以使用DMS。另一方面,正如E Bhashini体验所显示的那样,当用母语回答米佐拉姆农民的查询时,一种中小型的自然语言处理模型效果最好。
鉴于与Genai模型的开发相关的高资本成本,因此必须适当部署AI模型以确保最佳结果。使用像GPT-4这样的模型来寻找出售手术口罩的医疗商店,这将是GPU加工能力的浪费。
开源或开放重量
LLMS,例如Llama 2和DS-R1遵循“开放重量”(OW)披露系统。 OW系统允许这些模型的用户微调父模型以满足自定义要求。 OW还使研究人员能够测试模型的公平和安全特征。
与OW AI模型不同,诸如Mistral和Falcon之类的开源(OS)模型不仅披露了权重和代码,还披露了有关数据集的信息。这些模型允许用户对父模型进行无限修改并创建新模型。
印度的AI4Bharat通过免费提供广泛的数据集,它证明了“纯” OS模型如何创造广泛的公共良好影响。印度AI数据集平台也以开放访问原则为前提。因此,除非这些模型与专有数据相关联,否则印度即将到来的土著人工智能公司即将到来的土著AI公司有一个令人信服的环境。
安全性,透明性和偏见
DS模型因窃,偏见,违反用户安全和选择性信息过滤而受到批评。 DS还被指控不打开其模型的培训数据进行外部审查。 DS模型的OW特征无疑使研究人员可以测试它们是否有潜在的算法偏差。但是,由于DS模型不是操作系统,因此该公司可以对披露培训数据的需求进行阻止。这可能会导致在海外市场上采取报复性行动面临的DS模型。
相比之下,印度的本土(和自制)的Genai模型将主要遵守全国制定的AI安全标准,尤其是在最近的巴黎AI行动峰会委员会审议之后,这似乎将安全责任转移到了国家机构。
迅速的质量
巴黎峰会还提高了AI系统的可持续性。尽管低能计算可以确保LLM的可持续性,但在用户方面也要求采取行动,以最大程度地减少“令牌浪费”提示,而“浪费”提示是不可持续的。提高用户技能以迅速制作,应该成为印度任务的重中之重。
评估指针
对印度需求量身定制的土著AI模型至关重要。这将确保这些模型可最佳地部署和可持续使用。易于隐藏的模型促进了质量问题解决,从而改善了关键公共服务的交付。确实,这种模型的改进版本可能会刺激次要创新,并对经济产生深远的影响。
作家是IIM班加罗尔IIM教师和艾哈迈达巴德大学的客座教授。