传媒行业:国产大模型专题:被低估的大模型“腾讯混元”
- 2024-04-24 16:11:17上传人:pu**单纯
-
Aa 小 中 大
摘要一、基础能力测试:混元VSClaude3VSMistral1、数学能力:Claude3>混元>Mistral。测试3道高数题、1道线代题、1道概率题,Claude3正确率为80%,混元正确率为60%,Mistral正确率为40%。2、编程能力:混元>Claude3Mistral。测试数据分析、编写应用程序、贪吃蛇、爬虫,共5道编程题。编程1次运行成功率混元为80%,Claude
报告网所有机构报告是由用户上传分享,未经用户书面授权,请勿作商用!