当硅谷仍在为GPU万卡集群投入巨额资金时,来自杭州的一群年轻人用557.6万美元证明,AI大模型的竞争并不只依赖规模,更看重使用效率。一款上架不到半个月的应用程序DeepSeek在1月27日登顶苹果应用商店排行榜,击败了ChatGPT。
最近几天,AI领域最火的大语言模型不是ChatGPT或文心一言,而是杭州AI公司深度求索推出的DeepSeek。从去年12月26日发布的DeepSeek-V3到1月20日的DeepSeek-R1,这家公司以OpenAI三十分之一的价格实现了与o1模型相当甚至超越的成绩,给美国AI行业带来了不小的冲击。
经过同题问答测试,DeepSeek-R1通过步步推理生成了具有逻辑性的回答,用户可以看到其思考过程。IT从业者刘鸿博表示,这种体验与第一次使用ChatGPT 3.5相似,甚至更加震撼。他认为DeepSeek对高语境内容和中文网络梗的理解能力更强,达到了脱口秀文本的水平。
DeepSeek-R1发布后,不少美国AI从业者在社交平台上表达了内心的震撼。面对成本仅为“零头”但性能优秀的大模型,许多人发现传统的高投入模式已无法阻止用户的选择。北京时间1月27日,DeepSeek在美国、中国和英国的App Store免费应用下载榜上名列前茅。