您好,欢迎来到报告网![登录] [注册]

AI周报| 大模型测不出9.11和9.9哪个大;OpenAI发布轻量化模型GPT-4o mini

  大模型测不出9.11和9.9哪个大

  一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,7月17日,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9。

  点评:失误背后,大模型数学能力较差是长期存在的问题,有行业人士认为,生成式的语言模型从设计上就更像文字思维而不是数字思维。不过,针对性的语料训练或许能在未来逐步提升模型的理科答题能力。

我要投稿 版权投诉
  1. 标签 模型
  2. 机构、内容合作请点这里: 寻求合作>>
模型行业标签

凉薄**空城

该用户很懒,什么也没介绍!

关注 私信

报告咨询

  • 400-817-8000全国24小时服务
  • 010-5824-7071010-5824-7072北京热线 24小时服务
  • 059-2533-7135059-2533-7136福建热线 24小时服务

如您想投稿,请将稿件发送至邮箱

seles@yuboinfo.com,审核录用后客服人员会联系您

机构入驻请扫二维码,可申请开通机构号

Copyright © 2026 baogao.com 报告网 All Rights Reserved. 版权所有

闽ICP备09008123号-13