DeepSeek-R1 并不是在 scale law 的老路上追赶上了,而是探索出了一条新的提升模型智力的技术路线。RL 这条上限更高(其次才是更经济)的路被走通了,这才是 AI 大厂既惊喜又惊吓的原因。
Share this post
DeepSeek-R1 技术报告的非技术解读
Share this post
DeepSeek-R1 并不是在 scale law 的老路上追赶上了,而是探索出了一条新的提升模型智力的技术路线。RL 这条上限更高(其次才是更经济)的路被走通了,这才是 AI 大厂既惊喜又惊吓的原因。