PhysicsWallah揭开针对性考试准备的Aryabhata AI模型

Edtech公司PhysicsWallah（PW）已推出Aryabhata 1.0，这是一种开源小语言模型（SLM），专门为支持准备JEE Main考试的数学部分的学生而构建。 Aryabhata 1.0具有70亿个参数，以提供针对竞争性考试形式的专注，高临界的响应。

该模型以古代印度数学家Aryabhata的名字命名，反映了该国在数学思想和创新方面的遗产。 PW已将该模型免费提供给教育者，开发人员和研究人员，将其定位为教育技术进一步创新的资源。

在JEE数学上的表现优于GPT

初始基准测试表明性能令人印象深刻。 Aryabhata 1.0在JEE Main 2025年4月的论文中得分90.2％，表现优于OpenAI的GPT-4O和GPT-4.1，分别得分为43.55％和80.44％。在标准推理和数学评估数据集（如Math 500和GSM8K）上，该模型分别达到83.6％和94.84％。尽管Aryabhata比大型语言模型（LLMS）小（LLMS）在2,000个代币之内有效地运行，与大型模型通常所需的8,000个to窗相比。

该模型的培训涉及从PW的内部数据库中绘制的130,000个高质量的提问对。它利用了监督的微调，加强学习和拒绝抽样的结合，将其输出与基于考试的学习的结构和逻辑保持一致。根据PW的说法，这种针对性的方法为学生熟悉的教育实践的推理奠定了基础，可能会提高相关性和理解力。

路线图前方

Aryabhata 1.0是更广泛的路线图的第一步。 PhysicsWallah计划在今年晚些时候发布Aryabhata 2.0，扩大了物理和化学的覆盖范围，并为JEE Advanced，NEET和基础学术水平提供支持。

此次发布与PW与Microsoft Research India的持续合作保持一致，Microsoft Research India是Microsoft耗资30亿美元旨在开发全国AI基础设施的计划的一部分。他们的共同努力集中在建立教育优化的AI模型上，以提高辅导系统和学习援助工具的准确性。

Aryabhata的发布也越来越多，因为人们对AI在竞争性教育中的作用越来越兴趣。来自Bytedance的一份报告强调了AI模型（例如Google的Gemini 2.5 Pro）如何开始在IIT-JEE Advanced等考试中的表现，这表明AI在学术领域中所能实现的情况发生了变化。