手机版设为首页收藏本站

开启辅助访问

扫码登录更安全

登录立即注册找回密码

澳洲同城网»论坛 › 澳洲生活 › 新闻中心 › 全球新闻 › 12个国产大模型大战高考数学意外炸出个大bug(组图)

查看: 5416|回复: 0

上一主题

下一主题

12个国产大模型大战高考数学意外炸出个大bug(组图)

32万主题	19 金豆	25万积分

Rank: 8 Rank: 8

性别: 保密
积分: 256690
金豆: 19
鲜花: 0
主题: 327738
帖子: 327739
注册时间: 2019-12-26

发消息

电梯直达

跳转到指定楼层

楼主

发表于 2024-6-9 05:31:01 | 只看该作者回帖奖励

回帖奖励

|倒序浏览 |阅读模式来自： INNA

马上注册，结交更多同城好友，享用更多功能！

您需要登录才可以下载或查看，没有帐号？立即注册

x

继国产大模型挑战高考作文之后，是时候再战一下高考数学了。数学高考Ⅰ卷的题目，目前已经陆陆续续在网上有所公布（图片格式）。

那么现在，是时候考验国产大模型们的数学能力了。有请“选手们”登场—— Kimi、通义千问、文心一言、豆包、智谱清言、百小应、讯飞星火、商量、腾讯元宝、天工、海螺AI、万知。

国产大模型 vs 高考数学选择题根据数学题目类型的不同，我们先来小试牛刀一下选择题。测评的方式是将题目（图片格式）“喂”给国产大模型们，要求它们给出相应题目的答案：查看题目，给出第1题到第8题的答案。接下来，我们就来一同看下国产大模型们的表现。 Kimi

通义千问

豆包

智谱清言

百小应

讯飞星火

商量

腾讯元宝

海螺AI

万知

不难看出，很多国产大模型还未做数学题，先败在了AI识图这个步骤，无法生成答案。（PS：有几位选手测试时因为无法识别，未能完成答题，因此没有放出结果。）那么我们最后来看下“踢馆选手”——GPT-4o。

国产大模型 vs 数学大题鉴于一些国产大模型AI识图有点困难，我们这次直接先把这次高考的大题题目文字给copy出来，再让它们作答：设n为正整数，数列 ( a1, a_2, cdots, a{4m+2} ) 是公差不为0的等差数列。若从中抽去项 ( ai ) 和 ( a_j ) (i 接下来，我们再来看下国产大模型们的表现。 Kimi

通义千问

文心一言

豆包

智谱清言

百小应

讯飞星火

商量

腾讯元宝

天工

海螺AI

万知

最后，还是有请“踢馆选手”——GPT-4o。

那么，你觉得国产大模型们，识图+解数学题，哪家比较好一点呢？最后，关于AI智能助手，这里也有一份最新用户数据分析报告供你参考： https://mp.weixin.qq.com/s/sYxbvown5qLBnEs7zIR6Bg

支持0 反对0

免责声明
澳洲同城网是一个免费的公共信息平台，网站内容由网友自由发布，发布者拥有所发布信息的版权同时承担相应责任; 若所发布信息侵犯了您的权利，请反馈给澳洲同城网，我们核实后将进行相应处理！

回复

使用道具举报

外汇平台

金牌家政

汽车网

wuliu

个人中心

你想了解我们吗？

关于我们同城版规隐私条款
免责声明帮助手册意见反馈商家认证
Copyright © 2024 tongchengau.com. All Rights Reserved

联系我们

广告合作
 联系我们
 加入我们

关注我们

微信关注

官方微信公众号

官方微信服务号

官方公众号客服微信

Web Analytics

快速回复 返回顶部 返回列表