DeepSeek-R1开源模型横空出世,引爆AI圈
近日,DeepSeek-R1模型的开源发布,在人工智能领域掀起了一股热潮。这款模型凭借卓越的性能和完全开源的特性,迅速在AI社区走红。其GitHub论文在短短一天内就收获了5000多的收藏,相关讨论在各大平台也达到了上万的互动量。目前,DeepSeek-R1已在Web和App端提供免费使用,且模型完全开源,其多领域性能被认为可以比肩OpenAI的GPT-4。
英伟达资深科学家Jim Fan高度评价DeepSeek-R1,称其不仅开源了正式版和6款蒸馏模型,还分享了详细的训练过程和方法。他认为该项目可能是首个充分展示强化学习(RL)飞轮效应并持续增长的开源项目。
实测表明,DeepSeek-R1在解决高考压轴题方面表现出色,只需80多秒就能得出答案;在代码生成方面也毫不逊色,仅用9分钟就能编写出一段能够生动演示量子力学概念的动画代码,且具备“开箱即用”的特性。此外,它在文科领域也展现出不俗的能力,能够快速解答脑筋急转弯,并对历史细节进行深入分析。
DeepSeek-R1的思考方式也十分自然,其语言风格活泼,还会使用“Yeah, that works!”等口语化表达。与DeepSeek-V3相比,DeepSeek-R1的推理能力更强,能够提供更加全面、详实且论证充分的回答。它通常采用结构化的方式进行回复,并在思考和回答过程中补充大量背景信息。
DeepSeek官方数据显示,该模型在数学、代码、自然语言推理等任务上的表现与OpenAI的GPT-4正式版不相上下。更令人惊叹的是,DeepSeek-R1在无监督的情况下,通过大规模强化学习,自然涌现出了强大的推理能力。
虽然DeepSeek-R1表现亮眼,但仍存在一些挑战。据官方介绍,该模型在通用性、多语言能力、提示工程和软件工程能力这四大领域还需提升,导致其在函数调用、复杂角色扮演等任务上的表现尚未达到预期。
DeepSeek-R1采取了“发布即上线”的策略,用户可以在DeepSeek官网和App上免费体验该模型,也可通过API接口使用,价格仅为OpenAI GPT-4的3.7%,每百万tokens输出仅需16元。
DeepSeek-R1实测:理科、文科表现不俗,仍有提升空间
理科能力:83秒解答高考压轴题,动画演示量子力学
DeepSeek-R1在理科领域表现出色。面对2024年高考全国甲卷理科数学压轴题,它在83秒内给出了正确答案。虽然其解题过程并非完全符合评分标准,但这一速度和准确性仍令人印象深刻。同时,有海外用户利用DeepSeek-R1生成了量子电动力学原理的动画,代码生成仅耗时9分钟,且实现效果接近“开箱即用”的水平。
不过,DeepSeek-R1并非无所不能。面对美国2024年AIME数学邀请赛真题和2006年IMO国际数学奥林匹克竞赛难题时,它未能给出正确的答案。这表明该模型在处理高难度数学问题时仍存在能力上限。总体而言,DeepSeek-R1在理科方面的能力已达到优秀大学生的水平。
文科能力:推理能力增强,信息丰富度提升
DeepSeek-R1在自然语言推理方面也表现出色。它在斯坦福自然语言推理数据集的测试中,基本能在10秒内给出正确答案。在中文脑筋急转弯测试中,它也能快速给出正确答案,并且在思考过程中还会分析其他可能性。例如,当被问到“什么东西有四只脚,早上只能跑两步”时,它不仅给出了最常见的答案,还分析了水蛭、跳蚤等动物。DeepSeek-R1对于“古埃及是否有常备军”这类复杂历史问题,也能给出条理清晰且基本准确的回答,且对非洲原住民的历史也进行了详细分析。
与DeepSeek-V3相比,DeepSeek-R1的推理能力给模型带来的主要增益体现在信息丰富度、文字逻辑等方面。即使在不具备推理能力的情况下,DeepSeek-V3也能在很多问题上给出正确答案,这表明推理能力主要是增强了回答的质量和深度。
模型短板:外文思考速度慢,少样本提示可能失效
DeepSeek-R1也存在一些短板。例如,当用德语提问时,它会先将问题翻译成中文或英文,然后再作答,这显著降低了思考速度。此外,少样本提示(Few-Shot Prompt)在DeepSeek-R1上的效果可能会适得其反,导致其思考时间增加。这可能是由于模型“想太多了”,导致推理效率下降。
DeepSeek-R1的论文中还提到,该模型在通用能力和软件工程任务方面还有待提高。未来,他们计划通过长思维链技术、异步评估等手段来提升模型的整体表现。
结语:中国开源AI力量的崛起
DeepSeek-R1的发布受到了全球AI开发者的广泛关注和高度赞扬。其开源协议采用MIT协议,允许商业使用,并允许通过模型蒸馏等方式训练其他模型。这有望使其在全球AI领域产生深远影响,并促进全球开源社区的共同进步。DeepSeek-R1的出现,也展示了中国在开源AI领域的强大实力,未来可期。
DeepSeek-R1 AI工具地址:【点击登陆】