您好，欢迎来到报告网！[登录] [注册]

AI周报| 大模型测不出9.11和9.9哪个大；OpenAI发布轻量化模型GPT-4o mini

2024-07-21 11:02:15上传人：凉薄**空城
Aa 小中大

分享到：

　　大模型测不出9.11和9.9哪个大

　　一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大？就此问题，7月17日，第一财经记者测试了12个大模型，其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对，但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了，错法各有不同。大部分大模型在问答中都错误地比较了小数点后的数字，认为9.11大于9.9。

　　点评：失误背后，大模型数学能力较差是长期存在的问题，有行业人士认为，生成式的语言模型从设计上就更像文字思维而不是数字思维。不过，针对性的语料训练或许能在未来逐步提升模型的理科答题能力。