短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型:DeepSeek-V3和DeepSeek-R1。这两款模型成本低廉,性能与OpenAI相当,让硅谷震惊,并引发了Meta内部的恐慌,工程师们开始连夜尝试复制DeepSeek的成果。
Scale AI创始人Alexander Wang在采访中表示,DeepSeek在他们的测试里表现最好,与美国最好的模型相当。他还提到,DeepSeek-V3是中国科技界带给美国的一个教训,中国以更低的成本、更快的速度和更强的实力追赶上来。
中国AI的新进展引起了国外媒体的广泛关注,被视为对硅谷的一次警钟。尤其是在5000亿美元的“星际之门”计划公布之际,DeepSeek以极低的价格建立了一个突破性的AI模型,而且没有使用尖端芯片,这引发了人们对于巨额资本投入是否有效的质疑。
一名匿名Meta员工透露,公司内部因DeepSeek的模型进入了恐慌模式。DeepSeek-V3在基准测试中已经超越了Llama 4,而其训练预算仅为550万美元。工程师们正在争分夺秒地分析DeepSeek,试图复制其中的技术。管理层则为GenAI研发部门的巨额投入感到焦虑,高管薪资甚至超过了训练整个DeepSeek V3的成本。