拥抱开源:DeepSeek爆火后的冷静思考
当DeepSeek成为热门话题,开源依旧是值得深入探讨的核心议题。
长期以来,国内的“开源”讨论总显得有些尴尬。
它代表着理想主义。“开源”所蕴含的自由、开放精神,被视为互联网精神的体现——源代码公开共享,并允许使用者在特定协议下自由使用、修改和再发布。
著名的开源项目“Linux”是操作系统内核,催生了无数开源软件,构成了互联网的基石。
然而,随之而来的问题是:为何要开源?如何实现开源后的商业化?即便在DeepSeek爆火的当下,也很难找到完美答案。
开源中国董事长马越,见证了国内开源发展的历程,他对此有着深刻的理解。
2008年,马越从硅谷归国创业,创立了“恒拓开源”,旨在通过开源软件帮助企业摆脱传统数据库、ERP等大型软件的限制。
但他很快意识到,这种模式难以摆脱To B项目制的高投入,容易沦为外包公司。
随后,马越选择收购“开源中国”社区,开启了一段充满挑战的创业之路。“开源中国”历经多次转型,从开源社区拓展到代码托管、代码工具链,在探索商业化过程中,经历了从母公司剥离独立发展,2019年被百度战略控股,最终,又在中美竞争和国产替代的浪潮中决定重新独立发展,寻求上市。
运营开源社区需要大量的资源和资金投入。在开源中国最困难的时期,马越个人负债高达1.8亿元。
1972年出生的马越,坦率而真诚。他并没有刻意卖惨,但从他的叙述中,人们可以感受到经历过无数坎坷后的幽默。他认为,在中国做To B业务就是“城市包围农村”,企业软件是管理者智慧的固化。在企业发展初期,“很难要求大家在温饱尚未解决的情况下,去做开源。”
现在,开源中国已经探索出了一条更适合自身发展的、具有中国特色的开源道路。
目前,开源中国已成为全球第二大代码托管平台,汇聚了超过1800万开发者。其自主研发的DevOps工具链已在金融、军工等关键领域占据80%的市场份额。2024年,开源中国的营收超过2亿元。
《智能涌现》了解到,「开源中国」近期完成了数亿元C轮融资,由北京信息产业发展投资基金领投,深报一本股权投资基金及北京上河动量私募股权基金跟投。
至此,开源中国累计获得超过16亿元的战略投资。
△开源中国董事长马越 图源:开源中国
马越认为,即使在全球范围内,开源也并非易事。他以GitHub为例,从2008年成立到被微软收购,直到2022年ChatGPT爆发后推出Copilot,才真正证明了商业化的潜力。
“开源是强者和富人的游戏。”他说,上一代人成长在物质匮乏的年代,商业社会也是如此,企业要先赚到足够的钱,才能考虑开源,做一些利他的事情。“吃饱了饭,才能有力气谈开源。”
因此,即使DeepSeek的爆火给中国打了一针强心剂,马越的观点仍然是冷静的。他认为,DeepSeek很难从根本上改变国内软件生态的问题,这受到时代局限。
要在开源领域取得成功,需要新一代开发者从一开始就走向海外,像DeepSeek一样参与全球市场竞争。
如果说DeepSeek改变了什么,更多的是文化和价值观层面。“十年前,人们普遍不理解开源,认为开源是草根的行为,现在全社会都认识到,开源等于创新。”马越说。
以下是《智能涌现》与开源中国董事长马越的对话,经过编辑:
DeepSeek不是国运级产品,年轻人才是关键
《智能涌现》:开源中国现在是第二大代码托管平台,国内最大的开源社区。DeepSeek的崛起,对你们的直接影响是什么时候开始的?
马越:大概在App Store登顶的时候。先是V3,然后是R1发布,一下子就火了。春节期间我们一直在加班,让DeepSeek首先在中国生产的GPU上运行,这需要大量工作,我们是第一个在沐曦芯片上部署的。
我们开玩笑说,春节就两件事:DeepSeek、哪吒。DeepSeek就是开源圈的哪吒。
《智能涌现》:现在有一种说法:DeepSeek是一个国运级的产品。但你似乎不太认同这一点。
马越:首先,大模型离不开英伟达的GPU吧?其次,离不开Transformer架构;第三,采用了蒸馏的思路,这些都不是国内原创的。
DeepSeek本质上是在现有路线上做得最好,实现了弯道超车,这值得尊敬。
但DeepSeek能够不依赖外部资金支持,也不做任何公关,靠技术就能做到全球顶尖——以梁文锋为代表的年轻人的崛起,这才是国运级的现象。
《智能涌现》:那什么才是国运级的产品?
马越:完全原创的技术创新。谁说Transformer就是算法的终局?如果有人用非Transformer方案做出比DeepSeek强十倍的成果,那才是真正的突破,那是人类级别的进步。
《智能涌现》:DeepSeek给开源生态最大的启示是什么?
马越:让全社会认识到:开源等于创新。
DeepSeek最令人唏嘘的是,在国内默默无闻两年,还不如那些大肆宣传的大模型公司,直到2024年才因为技术和开源受到美国的关注——尽管有些人非常支持,有些人极力贬低,这种关注反而激发了国内的爱国情怀。
《智能涌现》:以前大家不相信这个观点吗?
马越:以前很多人认为开源就是一帮草根,很难与大厂的正规军相比。
事实上,我二十年前就在说:开源约等于创新能力,创新能力与国力息息相关。正是因为我们有钱了、富足了,才会有DeepSeek这样的企业出现。
以前没人听,现在有人听了。
第二点很重要,就是要对年轻人保持敬畏。不只是尊重,而是要信任他们。每一代人都有自己的时代使命和局限性。
《智能涌现》:这群年轻人,或者新一代开源贡献者,为什么能够成长起来?
马越:这种质变是建立在之前充分的量变基础上的。
这十年要感谢走在前面的互联网大厂,国内的主要开源力量集中在这些有实力的企业上。包括百度、阿里、腾讯等组织的开源项目,还有华为的鸿蒙、欧拉等等。他们都是领着工资的员工,在从事这些开源工作,并非完全出于兴趣。
《智能涌现》:DeepSeek证明了一件事:通过底层技术突破,就能吸引大量用户,并赢得尊重。
马越:现在中国最应该做两件事:一是牵头开发中国的CUDA;二是让所有国产GPU都能快速支持这些模型。
说到生态,生态就是要更多人参与,而且大家有高度共识。现在最大的问题不是芯片卡脖子,而是CUDA生态的制约。中国完全可以开发一套类似CUDA的系统,就像我们有自己的GPU一样。
开源是富人和强者的游戏
《智能涌现》:DeepSeek爆火后,找你讨论的人多吗?大家最关心什么?
马越:有人问我,DeepSeek是否会给中国To B市场带来新生机?不可能这么快。
IT外包的人天价格,20年来的涨幅还不如按摩师。现在外包人天均价一千就算高的了,还有五六百的。你去按摩,现在一小时都要一两百块钱。十年前,IT的外包时薪就比不上按摩了,现在差距更大,因为按摩价格涨得快。
中国软件没人愿意花钱,这是行业发展不行的核心原因。要等这一代年轻人变成决策者,好时代才会来。
《智能涌现》:本质还是因为国内企业发展阶段还比较早。
马越:开源本质上是强者和富人的游戏。正是因为我们吃饱喝足了,才会有DeepSeek这样的企业出现。上一代互联网用户普遍不愿意为软件和知识付费,腾讯会议掉线了就重连,也不愿意买会员。
但这一代年轻人生活富足,你们会改变这个局面。
《智能涌现》:DeepSeek会给上一代To B创业者带来什么启示?
马越:我觉得他们给创业者带来两个重要的启示。第一是要对钱保持敬畏。创业的目的就是为了挣钱,谈理想和情怀没意义。
DeepSeek不太需要考虑商业化的问题,是因为幻方已经解决了这个问题。
上一代软件创业者有个致命问题,一心想着烧钱,通过标准化产品打市场,这不是中国市场的运行逻辑,中国最有钱的金主都是大型企业,在中国想要赚钱,不做定制化是不现实的。
中国软件行业是城市包围农村,而美国是农村包围城市,腰部企业数量很多。
《智能涌现》:DeepSeek会改变大家对商业化的看法吗?开源如何考虑商业化,是这个领域的“天问”。
马越:如果要开源做创业项目,技术必须过硬。就像DeepSeek一样,一开始就走向海外,否则在中国太难赚钱了,时代还不够成熟。
大家总是会举例,比如红帽的模式也能商业化,但想用这种方式在中国做一个上市公司,还不是这个时代的事。
《智能涌现》:你们自己也经历过很长的商业化探索时期,是什么时候想明白该怎么做的?
马越:2020年是一个重要的转折点。我们那年决定从百度独立出来,重新谋求IPO。那段时间,因为美国开始在很多尖端技术上断供,我们想抓住这个机会,真正成为一个独立的开源平台。
想要做真正的本土开源平台,必须是彻底中立的第三方,这是选择重新独立发展的核心原因。
《智能涌现》:想明白之后,都做了什么?
马越:我们现在从社区发展出了三大产品线。
开源中国社区(OSChina)现在已经完全进化成一个AI教育平台。我们是中国最大的开源社区,有1000多万用户。现在我们24人的团队能创造约5000万收入,还有净利润,这在社区团队中很少见。
第二块是代码托管和研发效能平台Gitee,现在平台有3600万个代码仓库,服务36万家企业。主要提供代码托管私有化仓库服务,确保很多中小团队的代码安全,客单每年3000块左右。
从2020年到现在,我们已经能够提供DevOps全生命周期国产替代方案,在满足开发者需求的同时,也建立起一个自主创新、安全可信的本土开源软件工具与生态。
第三块是AI大模型平台“模力方舟”,提供模型体验、推理训练到应用部署等服务。
《智能涌现》:为什么会从社区拓展到后来的DevOps,以及AI大模型基座?
马越:一个开源公司想要成功,单靠社区是不够的,我们需要找到一个闭环的商业模式,像GitHub的模式——社区、代码托管是没法达到这个目标的。GitHub也是在大模型浪潮来临之后,推出Copilot,才把营收做起来。
以后没有净利润的公司很难在国内上市,所以我一直强调看毛利率和人效,这两个指标高了,自然会有净利润。
《智能涌现》:你们现在的主要收入来自哪里?
马越:我们主要收入来自100家左右的银行、券商、军工、制造业客户,都采用大型私有部署形式。中小客户主要靠SaaS服务。
2024年我们全国订单超过2亿,这是一个突破。前年过1亿,2024年翻了一倍,还实现了盈亏平衡,这很不容易。
《智能涌现》:主要模式靠服务大型企业的话,怎么避免走到项目制的老路?
马越:我们的产品设计得很复杂,是因为中国大型企业的应用场景复杂。我们的流程引擎、角色引擎、交互界面、流水线都是可定制的,还能做各种插件,目的是保证灵活性。
我们会帮助客户做定制化配置,但不做二次开发。我们现在330多人,其中200多人负责这块业务,但真正进行定制化开发和交付的不到10%。
第二是我们坚决不卖算力,只做第三方,比如给云厂商导流。
我们现在的路线很清晰:前端社区承载大流量,做开发者工具卖给企业,先To C,再To B,这也可以说是一种产品驱动增长(Product-Driven Growth)模式。
合作共赢,胜过单打独斗
《智能涌现》:企业是否选择开源,关键的考量因素是什么?
马越:现在大模型不开源很难。苹果为什么至今不开源iOS?因为硬件生态已经形成垄断。如果没有类似的护城河,不开源,凭什么在市场立足?
就像我十几年来一直强调的,开源是创新的最佳方法论,也是市场竞争的方法论,是反强权的方法论。你做得好,我们就开源来和你竞争。当年有Unix和Windows,所以有了Linux;有iOS,后来就有了Android,道理是一样的。
《智能涌现》:你做过很多并购,DeepSeek的成功会改变投资人对开源项目的看法吗?开源项目的出路会变得更宽吗?
马越:这也是我想问所有投资人和创业者的问题:投资的目的是什么?到底希望如何盈利?
上市、被收购、分红都是退出方式。但目前在国内,要么IPO,要么破产,这很残酷。
中国的开源生态很分散,很多创业者缺乏一种共识,即合作共赢比单打独斗更有效。很多人把创业当成获取情绪价值的途径,只想当老大,宁愿公司倒闭也不愿意卖给别人。觉得卖了就是投降,这个心理障碍难以克服。
如果放不下自己的执念,最终会害了自己,也害了客户和投资人。
《智能涌现》:DeepSeek大获成功之后,你如何评估我们目前所处的AI发展阶段?
马越:如果类比互联网时代,我们仍处于大时代的开端,类似于早期的拨号上网阶段。我从1997年开始上网,下载一张照片需要四五天,网速只有28K。但即使如此,我们也觉得非常神奇。
现在就像出海探索新大陆,所以创业者只要准备好干粮,登上船,不被淹死,就一定会有收获。
《智能涌现》:DeepSeek将如何改变国内的创业格局?你认为更有利于大厂还是创业公司?
马越:很难说,可能还是大厂更有优势。
首先,DeepSeek不是一家创业公司,它不需要外部资金就能购买一万张显卡,某种程度上也可以算作一家小型的“大厂”了。
我认为DeepSeek给创业者带来了两个重要的启示。第一是要对金钱保持敬畏。创业的目的是为了赚钱,谈论理想和情怀没有实际意义。
初创公司除非在算法、技术底层取得突破,否则在工程层面很难与大厂竞争数据和流量,这是最终商业化的两个关键因素。
《智能涌现》:目前大模型初创公司的转型方向都很明显,专注于底层技术。
马越:这就是开源的魅力所在。
我前年就说过,预训练是大厂的游戏,创业公司应该专注于垂直领域的训练,将更多精力放在推理上,不应该在烧钱的事情上浪费资源。
历史上有很多例子,当年开源领域有很多做容器的公司,比如Docker刚问世时只是各种容器运行时技术中的一种。结果K8s生态兴起后,任何容器技术只要实现K8s兼容性,就可以融入云原生技术栈,这种强大的生态整合能力最终使其他技术方案逐渐边缘化,相当于之前的努力都白费了。
因此,我给大家的建议,包括我们自身的策略,是产品功能要紧跟发展趋势,但要轻量投入,商业模式也要尽可能轻量化。
《智能涌现》:对开源中国来说,未来的目标是什么?
马越:开源中国在过去十几年中积累了用户流量的护城河和良好的客户品牌声誉,现在通过信创找到了快速增长的收入模式。
在本轮融资后,我们将继续寻求上市,希望成为A股人工智能开源第一股。
DeepSeek AI大模型地址:【点击登录】