有个怪事儿,前段时间,大模型竞技场上,一位代码为 sus-column-r 的匿名模型横空出世。

没人知道它师出何门,但在过去的一个月里,它却称得上是过关斩将。。。

累计一万多人的投票,硬生生让它挤进了排行榜前列。到现在,综合能力已经和 5 月 13 号发的 GPT-4o ( API 版本 )并列第三了。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第1张

看这势头,当时就有不少人猜测,这可能是 OpenAI 那个迟迟没向大众公布的,神秘的 “ 草莓 Q* ” 项目。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第2张

然而,就在昨天,这个困扰大伙儿很久的谜语,终于有答案了。但解开它的,不是 OpenAI ,而是经常被大家忽略,但也在搞 AI 的马斯克

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第3张

这个匿名的 sus-column-r 模型,其实就是 xAI 要推出的新模型 Grok2 ,现在已经上线会员版的 X 了。

而之所以在大模型竞技场上整这么一出,说白了,是想给昨天的发布热热场子。

像是在官宣推出 Grok2 的博客里,就明晃晃地展示了之前 sus-column-r 积累的战绩,甚至还做了对战胜率表。

按照他们自个儿的说法,表里面除了谷歌的 Gemini 1.5 Pro 外,其余无论是 GPT-4o ,还是 Claude3.5 Sonnet ,都只能是 Grok2 的 “ 手下败将 ” 。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第4张

当然了,其他的纸面成绩, Grok2 答得也挺不错。光从各个基准的数据来看,它的各项能力,都和市面上最先进的 AI 差不多,这一线大模型的行列,也算是被 Grok 给挤进去了。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第5张

不过在世超的标准里,一个模型好不好,光看这些数据也还不行,最重要的是,得看大伙们的实际使用体验。

相较于上次的还只能文字开开玩笑的 Grok1.5 ,这次 Grok2 最明显的一个升级,就是新增了图片功能。

但和其他家自己动手搞多模态 AI 不一样,这次马斯克倒挺罕见地选择了和别人合作。

合作的对象,差友们应该还有点印象,就是前两天咱刚写过的 FLUX.1 。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第6张

看到这,世超也没对 Grok2 的图片功能抱太大的期待,毕竟是前脚刚试过的 AI 。。。

但没想到集成到 Grok2 里面的 FLUX.1 ,还真撞出了一点不一样的火花。

倒也不是说,在性能上它一夜之间飙升了一大截。而是相较于市面上的其他图片 AI , Grok2 的整活能力可以称得上是一骑绝尘。

同样是迪士尼公主的一个提示词, Grok2 在尺度上就比其他模型要大胆的多。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第7张

而且, Grok2 还能直接对着自己的老板恶搞,比如这是一个爱吃甜品,吃到发胖的马斯克

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第8张

转眼,他还能穿越到权力的游戏里,玩角色扮演。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第9张

更搞的是,还有网友直接拿 Grok2 生成的图,和视频 AI 配合起来,做起了视频。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第10张

不过, Grok2 这么肆无忌惮地恶搞各种公众人物、卡通人物,风险肯定还是有的。

像是有网友生成马里奥抽烟喝酒、观望 “ 911 ” 事件的图片,就已经有人督促任天堂起诉了。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第11张

除了新增有图片功能外, Grok2 这次提升的基础能力,咱肯定也得上手测测,看看实力。

考虑到目前 X 上线的,还只是性能差一点的小杯 mini 版,于是世超在大模型竞技场上,试用了下能力更强的 Grok2 ,还拉来了最新版本的 GPT-4o 作比较。

比试第一招,先从 AI 容易犯错的题目开始。前段时间,大模型集体在 “ 小数比较 ” 上翻车,大伙应该都听说过了。

这次再来波经典重现,让它俩来比比 9.5 和 9.11 的大小。

没想到的是, GPT-4o 依旧是死性不改,结果对了,但一看解题思路,完全就是一塌糊涂。反倒是 Grok2 倒有理有据,给出了正确答案。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第12张

还有经典的数数问题, GPT-4o 依旧让人大跌眼镜, “ 我一把把把把住了 ” 它竟然数出来 5 个把字, Grok2 这边倒还是稳定发挥。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第13张

不过紧接着问它俩这句话的意思, Grok2 就有点露怯了,乱说了一大堆,没一个踩到得分点。而这次 GPT-4o 简单几句话就给解释清楚了。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第14张

接下来世超又试了一些比较基础的常识性问题,比如说 “ 李政道是谁 ” ,它俩回答的,都还算正确。就是不知道为啥, GPT-4o 很容易犯懒,草草几句话就结束了。

而 Grok2 这边,每次给出得答案都挺详细,还贴心地分了类。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第15张

反正世超在实际用的时候,是真有感觉到 Grok2 能力的提升。

另外,按照官方给的数据,这次 Grok2 在数学这块儿,也能算得贼溜了。

于是我就又翻出了之前 Grok 做错的那道数学题,是一道求导的问题。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第16张

结果马斯克还真没忽悠咱,它俩都把这道题给整明白了。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第17张

而把 Grok 奶成现在的模样,马斯克在背后出得力可不止一星半点儿。

但有意思的是,马斯克主打的,就是薅自己其他公司的羊毛。。。

先是员工这块儿, xAI 统共就只有 50 来个员工,其中有 11 个都是在特斯拉工作的,而且里面还有 6 个是在 Autopilot 团队工作的,是一点儿都不想避嫌。

据华尔街日报消息,甚至原本要给特斯拉用的 GPU ,也被马斯克要求优先供应给 xAI ,还冠冕堂皇的说,特斯拉现在也没地儿用,在仓库里放着也是放着。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第18张

偷完特斯拉的家,还不过瘾,马斯克把手也伸到了 X 上。

就在前两天,科技媒体 Techcrunch 称,为了 “ 悄悄 ” 用用户们的数据训练 AI , X 在更新的时候,还偷摸着把用户的默认设置给改了,而且要关掉还得专门登录网页版。。。

不过总这么偷家,难免会吃上官司。像是马斯克和他的 X ,就被特斯拉的股东,还有好几个国家的数据保护机构给起诉了。

目前,关于特斯拉的案件,已经在特拉华州的一个法院审理了。

而另外几个数据保护机构,也把 X 告得,暂停用用户数据训练 Grok 了。甚至 X 还有可能遭到 “ 4% 平台营业额 ” 的罚款。

偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了? 第19张

但无论如何,在大模型这块儿,马斯克的 Grok 也算是真正赶上大家伙的进度了。和其他大模型比,不管是图片生成,还是其他基础能力上, Grok2 都不算差,甚至还整出了一点儿自己的特色。

据说, xAI 下一步会把 Grok 更深入地揉到 X 平台上面,而且还要再发一个多模态理解的预览版 AI 。

不知道为啥,世超已经有点期待,马斯克还能整出什么花活儿来了。。。

收藏(0)