
文|浅黑科技
今天刷到一个帖子,有网友发了一张乱到窒息的房间照片,杂物堆得满地都是,桌面乱得连下脚的地方都没有,然后@Grok,发了一句指令:“打扫房间,但不要带走任何东西!”

Grok直接回复了打扫后的房间图片,整体感觉还不错,乍一看应该是没带走东西。如果真少了什么,也许都给偷偷塞到了塑料袋里了,真是个大聪明。
不过仔细看,它其实有偷偷扔掉一些大件,比如没有显示全的梳妆台,3个枕头变成了2个,地毯也和原来不是一样的了。另外,它改变了房间的格局,原始房间应该更大一些,它偷偷给缩小了,直接让柜子靠墙了。

不过整体还不错,反正看完后,我只有一个想法:要是现实生活里有这种一秒把房间收拾干净的神仙AI就好了!
感慨完,我突发奇想,决定搞个“AI打扫大赛”——用同样的脏房原图、同样的指令,测试一下国内国外几个热门AI,不知道会出现什么情况。
第一个上场的是豆包,毕竟平时用得最多,期待值拉满!
一开始我用的是豆包的通用模型,没特意选图像生成模式,结果表现还挺惊喜。乍一看,床上还是有些乱,但仔细看发现,这背后恰好藏着它的巧思。
没有改变房间的整体布局,床、柜子、风扇都在原来的位置,重点收拾了地毯和茶几处,把杂乱的东西放进了收纳盒。
整体视觉上也是干净的,而且更容易相信它没有带走任何东西。

接下来,我切换到了豆包的图像生成模式。
不知为何,这次反而不如通用模型,直接把地上的物品全给扔了。。。。也许是随即便差吧。

接下来是千问,整体表现不太好。
第一次是通用模型,基本没什么变化,只有一张看起来收拾了那么一丢丢,主打一个“敷衍式打扫”。

不死心的我又切换到它的图像生成模型,这下更离谱了。不知道是不是AI嫌桌子太乱,要么直接把桌子给扔了,要么把桌子上的东西给扔了。

如果说千问是敷衍,那么,文心就是“答非所问界的天花板”!
同样的图片和指令,我试了几次,文心都跟没看见似的,直接生成了一个全新的、一尘不染的房间,跟我给的脏房原图毫无关系。


接下来是智谱。
看起来是个喜欢简约风的AI,床上用品全换成了黑白色调,收拾的衣服也都换成黑白色系,之前的花花绿绿全被扔了,就连地毯也被扔了。。。。只能说,太有自己的审美风格了。

重点来了!
元宝直接把我看懵了,堪称“断舍离天花板”!我千叮万嘱“不带走任何东西”,结果它倒好,直接把房间里所有脏乱的杂物全清没了,只留下一张床、一个茶几和一块地毯,主打一个“眼不见为净”。

试完国内这5个AI,我又找了两个国外的AI——gemeni和grok,再来对比一下。
先试gemeni。整洁度上不如Grok,但没有更换格局,这个算加分项。
另外,它还自己邀功呢,告诉我它都干了什么,那些可能被看不见的东西不是被扔了,而是放在不同的收纳容器了。

最后我自己也试了下Grok。这一次格局没变,但偷偷把包换了,也是有随机偏差。

大家也可以拿着自己家的脏房图,去试试这些AI,看看是不是和我的体验一样。
我们总说AI越来越智能,但从这次体验来看,AI离真正“读懂人心”还有一段距离。
最后,想和大家一起讨论讨论:你们觉得这些AI的表现,能反映出它们的计算能力吗?出现“答非所问”“偷扔东西”的情况是模型本身的问题,还是我们的指令不够清晰?欢迎留言分享。
嘉正网配资提示:文章来自网络,不代表本站观点。