6月24日,极客公园高考新课标Ⅰ卷全科目大模型评测报告出炉。数据显示,GPT-4o以562分排名文科总分第一,字节跳动旗下的豆包成绩是542.5分,其后依次是百度文心一言4.0的537.5分,以及百川智能“百小应”的521分。
本次大模型高考评测与河南省考卷完全相同。根据当天公布的河南高考录取分数线,文科本科一批录取分数线为521分,GPT-4o超出41分,豆包等三款国产AI也成功冲上一本线。
而根据最新河南高考分数段统计数据,GPT-4o的562分在文科考生中排名8811名,相当于人类考生的前2.45%,豆包则处于前4.27%的位置。在过去一年多时间里,国产AI技术能力取得了长足进步,目前已经接近国际顶尖大模型的水平。