电脑知识网1月27日消息,近一周,来自中国的深度求索(DeepSeek)全球爆红,尤其让美国硅谷极为震撼和恐慌。
其最新发布的R1大模型不仅在性能上比肩甚至超越了OpenAI的o1,并完全开源,且以对手3%的超低成本实现了这一突破。
近日,一篇在匿名平台teamblind上发布的文章遭疯传,有一位自称是Meta员工称公司内部因DeepSeek模型而进入恐慌模式,并提到DeepSeek-V3在基准测试中,已经让(Meta推出的)Llama 4相形见绌,而更让人难堪的是一家“仅用550万美元训练预算的中国公司”就做到这一点。
该文称,Meta工程师正争分夺秒分析DeepSeek,试图复制其中的一切可能技术,而DeepSeek-R1的出现,也让情况更加严峻。
另据The Information爆料,Meta生成AI小组和基础设施团队的经理和工程师已开设了四个作战室来学习DeepSeek的工作原理。
其中两个动员起来的小组正在试图了解High-Flyer如何降低训练和运行DeepSeek的成本。第三个Meta研究小组正在试图弄清楚High-Flyer可能使用哪些数据来训练其模型。第四作战室正在考虑基于DeepSeek模型属性重构Meta模型的新技术。
AI科技初创公司Scale AI创始人亚历山大·王(Alexandr Wang)接受电视媒体公开采访时表示,中国人工智能公司DeepSeek的AI大模型性能大致与美国最好的模型相当。过去十年来,美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。
Meta创始人兼CEO扎克伯格表示,DeepSeek非常先进,并认为中美之间的AI差距非常小。
扎克伯格还表示,中国正在全力冲刺,如果将来有一个开源模型能被全世界广泛使用,我们希望它是一个美国模型。