免费发布商务信息

媒体实测7款AI数手指:几乎全翻车 仅一款正确 原因其实很简单

   2025-08-16 10:51 IP属地 河南安阳 电信快科技秋白10

8月16日消息,近日,凤凰科技发布了一则测试7款AI产品的视频。

据视频画面显示,大部分AI产品都犯了同一个低级错误:数不清手指。

视频以一张有6根手指的照片测试,结果大部分AI都“非常自信”的回答5根。

据测试的7款AI产品,结果是豆包、kimi, 腾讯元宝、文小言、通义以及马斯克称之为最强AI——Gork的回答都是5根。

只有GPT的回答是6根。没错!只有GPT答对了,其余全翻车。

那么,AI为何会犯这种看似低级的错误呢?其实,这和AI特殊的看图方式密切相关。

与人类直观地观察图片不同,AI处理图片时,会先将图片转化为文字含义。

例如,给它一张狗的照片,它脑海中浮现的不是具体的影像,而是“至少是一只狗”这样的文字描述。

这一过程有个专业术语叫“模态对齐”。具体而言,AI会借助图片编码器将照片转换为数字向量,同时用“文字编码器”把文字也变成数字向量,然后努力让狗的照片和“狗”这个词在同一个语义空间里“靠近”。

这种处理方式有其优势,它能让AI大致了解图片中的物体类别。但弊端也十分明显,图片中的细节很容易被遗漏。

就像在AI的文字描述里,手就是“有5根手指”,它不会像人类一样认真去逐一计数。

这就好比你跟朋友说“我家有条小狗”,朋友能想象到狗,却很难猜到狗耳朵是竖着还是垂着。

所以,数手指这种对人类轻而易举的事,对AI来说却是与生俱来的短板。

除非为它专门安装一个数手指的插件,否则它可能会一直活在“默认5根”的“快乐世界”里。

总结来说,AI数不清手指并非因为它“愚笨”,而是其看图方式天然地忽略了细节,它关注的是图片所传达的意思,而非具体的像素信息。

对此,你怎么看?

rame align="middle" id="kkj_video_play_iframe1" class="lazy-iframe" loading="lazy" data-src="https://blog.mydrivers.com/news/showvideo.aspx?tid=1068636&ac=img&k=1&url=https://www.douyin.com/video/7538779253068877066" frameborder="0" width="600px" height="400px" scrolling="no">rame>

 
反对 0举报收藏 0打赏 0评论 0
 
更多>同类资讯
推荐图文
推荐资讯
点击排行