AI编码:程序员的危机还是机遇?
“程序员创造的AI,最先替代的是程序员。” 这句话并非玩笑,而是正在发生的现实。
阿里云通义灵码负责人丁宇表示,“大模型的编码能力,现在已经达到高阶程序员的水平(月薪数万元)。” 这意味着AI不再仅仅是辅助工具,而是具备了独立完成复杂任务的能力。
AI代码工具并非横空出世,早在上一波人工智能浪潮中已初见端倪。如今,商汤科技小浣熊家族技术负责人张涛指出:“AI代码产品已从辅助工具发展为可执行复杂项目、进行长上下文本编辑、并独立完成简单代码任务的工程级‘协同’编码工具。”
这种进化推动企业利用AI代码工具降低开发成本、提升效率。更甚者,AI有可能在2025年后取代部分中级程序员。
Meta创始人扎克伯格也表示:“2025年,AI将达到中级软件工程师的编程水平。” Meta计划在2025年开始实现中级软件工程师工作自动化,并最终将应用程序的所有编程工作外包给AI。
这一趋势并非空穴来风。当前,AI生成的代码在企业中的渗透率已达到惊人的水平。谷歌超过25%的新代码由AI生成;科大讯飞内部AI生成代码采纳率从2023年10月的30%飙升至2024年6月的52%,单元测试行覆盖率也从30%提升至50%。
丁宇认为,“AI Coding(人工智能编程)是大模型应用落地中最高频刚需、最具确定性的场景,是经过PMF(产品市场匹配度)验证的领域。” 这也是AI编码赛道成为大模型应用最热门赛道的原因。
微软、谷歌、AWS、阿里、百度等领先科技公司纷纷布局AI编码赛道。然而,大量同质化产品的出现也带来了激烈的竞争。未来,如何成功突围并实现大规模商业化落地是关键。
AI助手进化:从“打辅助”到“协同作战”
2024年8月,Cloudflare副总裁Ricky Robinett的8岁女儿仅用45分钟就开发出一款聊天机器人,引发广泛关注。她使用的AI代码编辑器Cursor也随之爆红,再次将AI编码推向风口浪尖。
PitchBook数据显示,全球约有250家初创公司推出了AI编码助手。国内,阿里巴巴、百度、腾讯、字节跳动等互联网巨头,科大讯飞、商汤科技等独角兽企业,以及智谱AI等AI大模型创业公司也纷纷推出相关产品。
大模型的发展为AI代码工具带来了实质性的进化。早期AI代码工具仅能执行简单的代码补全和错误提示等任务。
但随着大模型能力的提升,AI代码工具能够解决的问题越来越多。例如,能够基于存量工程进行维护升级工作,“已经能够自主实现某些研发任务了。”丁宇说道。
大语言模型能够以自然语言理解人类指令,并根据工程上下文,自动完成复杂编码任务,包括同时修改前后端多个文件、执行脚本、编写测试、部署代码等。
丁宇介绍,通义灵码最初以编码助手的形态出现,主要提供代码自动补全。 2024年底,通义灵码升级到2.0的AI程序员形态,成为协同编码助手,能够与人类程序员协同工作,感知整个工程,并根据场景任务进行批量文件修改,实现能力的跃迁。
从AI代码工具助手升级为AI程序员,意味着代码生成的主力从人转向AI,人类则主要负责监测和确认。
张涛表示:“此前主要由人写代码,AI辅助完成一些简单的、可预测性强的、重复性的工作。现在,则可以通过需求描述,让AI理解并帮助程序员完成一些中等难度的代码开发工作。”
多模态大模型和深度推理大模型的进化也在不断完善AI代码工具的能力。
商汤小浣熊家族的“办公小浣熊”产品不仅可以进行基于大模型的数据处理、数据分析和文档创作,还能够支持生成数据图片和PPT文件,体现了多模态能力输出。
多模态输入同样重要。张涛认为,仅通过语言描述交互很难准确实现需求,因为文本描述存在信息损失。同时,大模型自身在语义理解能力上的不足和幻觉问题也限制了AI代码工具的能力边界。直接以图像或视频等视觉方式输入至大模型,能够更高效地完成任务。
多模态大模型能够让AI代码工具实现从文生图到生代码的端到端全栈功能。例如,设计师可以通过文生图的方式设计前端视觉稿,然后直接交给Coding大模型,将视觉稿翻译成前端界面,并由大模型根据前端界面功能自动生成后端代码。
丁宇表示:“目前,AI编码可以完成复杂任务,消除知识技能的不对称,比如从前端到后端一体化生成,打破了以前前端、后端人员和能力的分离协作模式,大幅提效。” AI编码还可以在生成代码后自动生成测试,并返回修改后的结果。
尽管AI能够自主生成一些代码,但实际运行中仍可能存在bug。浙江大学AI方向在读博士生陈荣表示:“复杂点的代码都会有Bug,基本上很难一遍过,从技术逻辑上来说,模型其实把coding当作翻译任务一样来做,输出的是一串代码序列,可能没考虑好代码的运行环境等。”
这主要是因为:一方面,人类很难准确描述实际需求;另一方面,大模型自身在语义理解能力上存在不足,并存在幻觉问题,限制了AI代码工具的能力边界。张涛认为,“在模型上下文窗口允许的范围,大模型可达到万行级代码的理解,但AI代码的能力边界仍然较难界定。”
就像人类程序员需要反复修改测试代码一样,AI生成代码过程中也可以通过多轮交互来减少代码bug的存在。
丁宇表示:“AI编码并非一次性生成最终结果,而是与大模型进行多轮交互迭代。在联合编码过程中,存在持续思考和推理探索的过程。在多轮交互修改结果正确后,还可以自主进行测试验证,并对代码进行部署使用,全生命周期完成任务。”
尽管当前AI代码工具产品仍存在一些问题,但越来越多的企业开始引入,利用其“便宜活儿好”的优势提高程序员编程效率,并实现降本增效。
AI是“螺丝钉”,为程序员提效10%以上
大模型给AI代码工具带来的进化降低了编程门槛。
目前,AI能够独立实现自主编程的场景主要有三类:小产品(如个人生活类APP助手);以内容为主的网站(代码量和难度适中);办公产品(如Excel表格编辑、数据汇总)。
这些场景的代码量不高,开发难度不大,对编程知识要求也不高。AI代码工具降低了编程门槛,让更多无代码能力的人能够接触代码编程,并自主开发一些产品功能。
但是,AI代码工具在降低编程门槛的同时,也需要程序员提升自身编程能力的上限,尤其是在更复杂的软件开发和大型企业级系统软件开发中。
金融科技行业的程序员肖肖表示:“对于一个公司的工程化项目,很难直接全盘交给AI,工程化项目要求的流程多,也需要多部门协作,而AI没办法看到全局。”
AI更多地承担“脏活累活”,全局性和创新性的工作仍需人类程序员完成。张涛认为,“程序员的工作并不仅仅只是生成一个小型项目,其面对的生产代码,整个项目文件上下文非常复杂,代码关系也很繁杂,而程序员也对代码质量有自己的要求。”
这意味着AI代码工具更多是辅助性角色,但也间接拉高了程序员工作能力的下限,毕竟简单重复性的工作AI基本已经能够搞定。
丁宇坦言:“如果让AI直接生成一家银行所有业务的10万个代码文件,它目前肯定是做不到的。” 在企业大型项目中,AI编码通常从小任务入手,如实现一个功能模块,或在百万工程代码中寻找安全漏洞,AI能够做得非常准确且快速。
对于大型企业项目来说,最怕出现系统的不确定性,系统bug可能带来巨大的资源和经济损失。
因此,丁宇认为:“大型工程仍需要人类程序员来掌握软件开发过程中的不确定性,比如架构设计、领域建模等,把已经确定性的内容拆解开来,比如模块开发、找安全漏洞、补充测试用例等,并交付给AI,让其根据人类的指令做这些确定性的工作。”
即使只是辅助,AI代码工具也能带来实实在在的效率提升。以阿里云为例,目前所有技术人员都在使用通义灵码,月活占比超82%,每天AI生成的代码占总提交代码量的30%以上。基于这个数据大致能够算出来,AI对开发者提升效率大概是17.5%,打个折扣也会在10%-15%之间。
丁宇表示,通义灵码能够给工程师团队提效10%以上。这意味着,如果一家企业有100个工程师在使用通义灵码,就能额外产出10个工程师的产能。
此外,AI代码工具还能帮助程序员快速学习各种语言平台的研发知识,快速上手。丁宇表示:“以前做一个项目可能花两三周预研,现在两三天就能完成任务,让员工实现1-N的能力增长。”
AI还可以帮助程序员完成更多重复性工作,如编写测试代码。AI代码工具可以根据程序员的代码作为提示词,自动生成单元测试,解放开发者,让他们将精力投入更具创造性的工作。
对于企业来说,AI代码工具除了显性价值提升外,还具有隐性价值,即更容易保持软件系统的高质量和长期稳定,不仅能做单元测试的补全,还能自主发现安全漏洞并给出修复建议,提升质量的同时缩短项目交付周期。
商汤小浣熊底层模型通过加强代码解释器能力,让模型能够实现自主代码调试迭代,现阶段AI的编码能力借助外部工具使用已经逐渐赶超中级程序员。 张涛表示:“在复杂项目中,单纯依靠大模型推理生成代码,一次性通过率不高,一般不超过20%。而办公小浣熊基于代码解释器方案,在日常图表等能力上,代码通过率已经接近80%。”
AI编码赛道分化:细化场景的创新是关键
AI编码已通过PMF验证,众多玩家涌入导致同质化产品层出不穷。 阿里云的通义灵码、百度的文心快码、字节跳动的豆包 MarsCode、腾讯云AI代码助手、智谱AI的CodeGeeX等产品功能差别不大。张涛认为,“目前市场中同质化比较严重,功能实际上差不多,毕竟编程产品希望能够解决用户的问题是一样的。”
但随着大模型技术迭代升级,AI编码赛道已迈入“分化”中期。张涛表示,“从当前AI代码赛道来讲,已经开始分化出不同的实现方式。”
Cursor能够基于自己改造的开源IDE做完整的任务编程;Bolt.new以线上工具的形式使用,用户描述需求,AI完成网页开发,但仅限于前端技术栈。 各个产品已经开始寻找细分场景并构建自己的产品优势,实现差异化发展,例如网页开发、已有项目代码修改、小工具开发或低代码工作等。
丁宇也认为:“软件研发存在非常多场景,有很多细分领域,企业可以从不同的切入点切入,做细分场景的创新或产品形态的创新。”
各家AI代码工具产品在功能场景上的细分也会带来商业上的差异,不同企业的商业化侧重点也不同。 商汤科技小浣熊家族中办公小浣熊产品主要聚焦办公工具类赛道,C端和B端同步进行。C端主要以付费订阅为主,B端以企业进行私有化部署为主,“目前私有化部署客户接近40家,包含体量比较大的互联网厂商等。” 张涛同样看好C端赛道的市场潜力,现阶段C端产品的推广超预期。
从场景功能到商业化落地方向,AI编码赛道已经开始出现分化,但这并非AI代码行业发展的终局。 随着大模型技术能力持续迭代,下一步AI代码将实现“自主编程”,即不仅仅辅助程序员开发项目,而是能够自主接受独立的需求,完成完整的项目任务。 丁宇表示:“未来一定会走向AI 自主编程,这也意味着将为企业和开发者带来10倍的IT生产力提升。”
更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html