Edtech公司PhysicsWallah(PW)已推出Aryabhata 1.0,这是一种开源小语言模型(SLM),专门为支持准备JEE Main考试的数学部分的学生而构建。 Aryabhata 1.0具有70亿个参数,以提供针对竞争性考试形式的专注,高临界的响应。
该模型以古代印度数学家Aryabhata的名字命名,反映了该国在数学思想和创新方面的遗产。 PW已将该模型免费提供给教育者,开发人员和研究人员,将其定位为教育技术进一步创新的资源。
在JEE数学上的表现优于GPT
初始基准测试表明性能令人印象深刻。 Aryabhata 1.0在JEE Main 2025年4月的论文中得分90.2%,表现优于OpenAI的GPT-4O和GPT-4.1,分别得分为43.55%和80.44%。在标准推理和数学评估数据集(如Math 500和GSM8K)上,该模型分别达到83.6%和94.84%。尽管Aryabhata比大型语言模型(LLMS)小(LLMS)在2,000个代币之内有效地运行,与大型模型通常所需的8,000个to窗相比。
该模型的培训涉及从PW的内部数据库中绘制的130,000个高质量的提问对。它利用了监督的微调,加强学习和拒绝抽样的结合,将其输出与基于考试的学习的结构和逻辑保持一致。根据PW的说法,这种针对性的方法为学生熟悉的教育实践的推理奠定了基础,可能会提高相关性和理解力。
路线图前方
Aryabhata 1.0是更广泛的路线图的第一步。 PhysicsWallah计划在今年晚些时候发布Aryabhata 2.0,扩大了物理和化学的覆盖范围,并为JEE Advanced,NEET和基础学术水平提供支持。
此次发布与PW与Microsoft Research India的持续合作保持一致,Microsoft Research India是Microsoft耗资30亿美元旨在开发全国AI基础设施的计划的一部分。他们的共同努力集中在建立教育优化的AI模型上,以提高辅导系统和学习援助工具的准确性。
Aryabhata的发布也越来越多,因为人们对AI在竞争性教育中的作用越来越兴趣。来自Bytedance的一份报告强调了AI模型(例如Google的Gemini 2.5 Pro)如何开始在IIT-JEE Advanced等考试中的表现,这表明AI在学术领域中所能实现的情况发生了变化。