成本降低,AI需求为何反而增加?
春节期间,DeepSeek的AI模型发布引发了国内外AI圈的广泛关注。英伟达的股价波动也成为全球瞩目的焦点。DeepSeek近期发布的DeepSeek-V3和DeepSeek-R1两款模型,以更低的成本实现了与OpenAI同类模型相当的性能,这使得市场开始担忧未来对英伟达高端芯片的需求可能会减少。
与此同时,关于DeepSeek技术创新的讨论也日益增多。许多人认为,DeepSeek在硬件资源有限的情况下,另辟蹊径,通过技术创新来降低模型对算力的需求,同时实现性能的提升。DeepSeek的这一成就得到了包括Sam Altman在内的行业领袖的肯定。
OpenAI回应:算力投入依然重要
针对DeepSeek的突破,OpenAI首席研究官Mark Chen发文表示,DeepSeek确实独立发现了一些OpenAI也在使用的核心理念,但这并不意味着OpenAI在算力上的高投入是不合理的。他认为,AI模型优化存在两个维度(预训练和推理),而不仅仅是降低成本。OpenAI计划在这两个维度都积极投入算力。
Mark Chen还强调,随着蒸馏研究的成熟,降低成本和提升能力逐渐解耦。以更低成本提供服务并不等同于能产生更好的能力。OpenAI将继续提升模型服务的低成本能力,并对未来的研究路线图保持乐观,承诺将在本季度和今年推出更好的模型。
为了更好地解读Mark Chen的言外之意,我们请DeepSeek-R1进行了分析。
总而言之,Mark Chen的回应与Sam Altman的观点一致,旨在重塑外界对OpenAI的信心,并预告今年会推出更强大的模型。
此外,OpenAI研究科学家Noam Brown也试图弱化外界对OpenAI和DeepSeek的对比,但似乎未能获得广泛认可。
成本之争:训练与推理的平衡
关于DeepSeek-v3训练成本仅为558万美元的说法,引发了诸多讨论。DeepSeek的技术报告原文指出,该成本仅包括正式训练,不包含前期研究和实验成本。图灵奖得主、Meta AI首席科学家Yann LeCun也认为,市场对DeepSeek成本的反应并不合理。他指出,巨额投资不仅用于训练模型,还包括维持AI服务稳定运行,随着AI能力的增强,服务运行成本也会更高,关键在于用户是否愿意为这些功能付费。
许多网友赞同LeCun的观点,认为训练和推理成本更低的AI技术能更快普及,从而创造更大的市场。从这个角度来看,DeepSeek在降低推理成本方面的贡献可能比降低训练成本更值得关注。
AI未来:算力与创新并举
面对未来可能激增的推理需求,OpenAI和Meta等公司都在积极准备,例如OpenAI的“星际之门”项目以及Meta新一年的600亿美元AI投资。2025年,AI市场的竞争预计将更加激烈。DeepSeek在新的发展阶段将会有怎样的表现,仍需持续关注。
总的来说,DeepSeek的出现,为AI领域带来了新的思考,引发了关于算力、成本以及技术路线的广泛讨论。如何在算力投入和技术创新之间找到平衡,将成为未来AI发展的重要议题。