Google Gemini 2.5 Pro Beats Tops IIT JEE Advanced 2025:与全印度礼帽相比

AI比人聪明吗?根据最近的一个实验,似乎大多数付费的AI聊天机器人都比最聪明的学生具有优势,而Google的双子座都具有优势。

在开创性的发展中,Google的Gemini 2.5 Pro已成为2025年IIT联合入学考试(IIT JEE)高级表现的最佳表现,这是印度最艰难的大学入学考试之一。 AI模型在360中获得了令人印象深刻的336.2,超过了得分最高的人类候选人Rajit Gupta,后者获得了332分。

结果本周由Bytedance悄悄发布,突出了AI功能的重要里程碑。 IIT JEE Advanced是一项两阶段的考试,在其初始阶段吸引了100万以上的候选人,并在第二阶段前进了前25万名候选人。该考试由两个三个小时的部分组成,测试了数学,物理和化学的熟练程度,为正确答案提供了3分,并为错误的答案扣除了1分。

Gemini 2.5 Pro的性能包括数学的119.6分数,物理学108.6,化学的分数为108,将其确保了第一名。在后面,种子1.6认为得分为329.6(排名第4),克劳德·奥普斯(Claude Opus 4)获得了314.4(排名第13),而Openai的O4-Mini-High Mand-High Manag Manage则以308.4(排名第18)。

相比之下,由IIT德里地区的拉吉特·古普塔(Rajit Gupta)取得的最高人类得分为332,将他置于AI领导人的后面。

该分数是从五个样本中平均的,突出了这些大语言模型(LLMS)的高级推理能力。在如此严格的考试中,AI的出现优于人类的出现引发了各种反应。虽然有些人将其称为技术进步,但另一些人则指出了准备的差异 – AI模型,在庞大的数据集中训练而没有时间限制。相比之下,像古普塔这样的人类候选人在一次尝试中完成了巨大压力。

随着学术界消化这一消息,呼吁在其他挑战性考试(例如UPSC)中测试这些模型,以进一步探索其潜力。