Kimi k1.6模型崭露头角,编程能力超越GPT-3
最近,全球知名的动态基准测试平台LiveCodeBench传来消息,Kimi新发布的k1.6模型在编程能力方面表现超厉害,把OpenAI的GPT-3(像o3mini和o1等版本)都比下去了,在性能排行榜上拿了第一名。这消息一出来,科技圈都沸腾了,大家都特别期待。
据月之暗面的研究员Flood说,k1.6是在k1.5的基础上训练优化出来的,而且现在性能还在不断提升呢。月之暗面的联合创始人张予彤也在社交平台分享了这个好消息,他说虽然k1.6还没正式发布,但看到测试成绩这么好,特别开心,盼着智能模型能一直进步。这也能看出,业界对Kimi k1.6那是相当重视。
Kimi k1.6强大的编程能力,在AI领域一下子就突出了,好多开发者和企业都关注上了。在现在这技术环境下,编程能力强就意味着开发过程能更高效,应用场景也能更多。Kimi k1.6的出现,说不定能给开发者们打开更多创作空间。而且,它在自然语言处理和机器学习这些领域,以后的应用潜力也特别让人期待。
Kimi k1.6可不只是技术升级了,更是朝着未来智能化发展迈出的重要一步。咱有理由相信,随着Kimi不断进化,以后的人工智能肯定会更智能,更能满足咱老百姓的需求。
Kimi AI工具地址》》》详情查看
中国牵头制定的养老机器人国际标准发布
央视新闻报道,国际电工委员会(IEC)最近正式发布了一个养老机器人国际标准,而且是咱中国主导制定的。这可不得了,标志着养老机器人行业进入了一个新的发展阶段。这个标准编号是IEC63310 ,名字叫《互联家庭环境下使用的主动辅助生活机器人性能准则》。它是按照老年人的生理和行为特点制定的,给各种养老机器人在产品设计、制造、测试和认证这些方面,都提供了特别重要的依据。
为啥要发布这个养老机器人标准呢?就是为了满足老年人在日常生活和健康护理等方面的各种需求。这个标准想得可细了,不光考虑到老年人需要辅助支持,还把养老机器人的功能和性能类别都细分了。它提出了一堆技术要求,像可用性、可靠性、无障碍设计、能耗控制还有噪声水平这些通用标准。而且,养老机器人在健康状况监测、紧急情况响应、家庭沟通支持、做家务和娱乐活动辅助等方面,也都得符合相应的技术标准。
现在全球老龄化越来越严重了,预计到2050年,全球60岁以上的人能达到21亿,其中80岁以上的就有4.26亿。老年人身体机能、认知能力啥的都可能衰退,养老机器人出现后,能帮着减轻社会和家庭照顾老人的压力,还能让老年人在家里高质量地独立生活。
这个国际标准一发布,养老机器人制造商就能更好地了解老年人的生理和心理特点,在设计和开发产品的时候更精准,产品质量也能提高,让老年人更好地融入社会,最后全球的老年人都能受益。
脉脉接入DeepSeek-R1模型,招聘效率大提升
职场社区平台脉脉最近宣布,已经成功接入了DeepSeek-R1模型。这么做,就是为了把人岗匹配的效率再优化优化,让招聘流程变得更智能。听说,脉脉在今年2月初就开始部署这个模型了,而且相关测试工作也都完成了。
现在,AI技术已经全面融入脉脉的招聘工作流了。在求职信号捕捉、投递过滤、自动追问、智能打招呼这些关键环节,效果都有明显提升。在评估人才的时候,系统能跟踪用户行为,分析多维数据,通过算法优化做到精准匹配。投递简历之后,系统能自动完成智能初筛,还能触发追问,补充关键信息。同时,它还能根据兴趣图谱,生成个性化的沟通方案。
2024年10月,脉脉的猎头Agent服务上线了,这个服务能帮招聘人员在人才匹配、和候选人沟通还有约面试这些环节,大大提高效率。有用过这个服务的猎头说,接入脉脉猎头Agent才3周,和候选人沟通的效率就达到行业前10%的水平了。
据了解,脉脉平台现在有1.2亿用户,超过140万家企业入驻。平台上那些月薪30万元以上的中高端人才特别多,互联网、人工智能、新能源汽车等好多重点行业的人才都有。
这次DeepSeek-R1模型的接入,是脉脉在智能招聘领域的又一个大突破,以后企业和求职者在平台上找工作、招人的时候,匹配服务会更精准、更高效。
百度文心4.5预计3月中旬发布,能力大幅提升
路透社消息,百度公司正忙着准备发布下一代人工智能模型呢,估计3月中旬就能正式推出文心4.5版本。据内部知道情况的人说,新版本在推理等核心领域,能力会有很明显的提升,这可是百度在AI技术上的又一个重要进展。
文心4.5有个特别厉害的地方,就是多模态能力变强了。它能高效处理和融合文本、视频、图像、音频这些不同类型的数据,还能在不同格式之间轻松转换,这样用户就能享受到更丰富、更多元化的智能体验了。
百度在这个月初就对外透露,文心4.5系列会在接下来几个月分阶段和大家见面,还定好了6月30日全面开源。这么做,就是为了让AI技术能更普及,应用得更广泛。
百度CEO李彦宏在最近的财报电话会议上说,文心4.5会是百度到目前为止做出来的最强的模型。他还说,DeepSeek的成功让百度加快了开源的步伐,想通过开放合作,把AI技术的应用范围扩大,推动整个行业健康发展。
B站推出IndexTTS,文本转语音更智能
B站发布了一款基于XTTS和Tortoise的GPT风格文本转语音(TTS)模型IndexTTS。这个系统在处理中文文本的时候,有个特别牛的功能,就是能用拼音纠正汉字发音,还能通过标点符号在任意位置精准控制停顿。这么一来,文本转语音的效果就更自然、更流畅了,受到了很多人的关注。
IndexTTS系统经过几万小时的数据训练,性能在业内都领先了,比现在流行的XTTS、CosyVoice2、Fish - Speech和F5 - TTS这些TTS系统都厉害。系统的好几个模块都加强了,尤其是在扬声器条件特征表示和音频质量优化方面,改进得特别深入。通过采用混合建模的方式,IndexTTS能很快纠正读错的汉字,用户用起来体验更好了。
这个模型用了最新的条件编码器和基于BigVGAN2的语音解码器,训练的时候更稳定了,声音音色的相似性和音质也都增强了。团队说,他们已经在arXiv上提交了相关论文,还打算在未来几周发布模型参数和代码。而且,IndexTTS还提供了好多测试集,有多音节词汇测试集,还有主观和客观评测集,方便研究者深入分析。
在很多评测里,IndexTTS表现都特别好,尤其是在字词错误率(WER)和扬声器相似性(SS)方面,比好多同行模型都强。比如说,在普通话测试里,IndexTTS的字词错误率才1.3%,比其他模型低多了,准确性和稳定性特别突出。在音质评测里,IndexTTS的MOS评分达到4.01,音质和音色都特别棒。
随着技术不断进步,应用场景越来越多,IndexTTS的发布,标志着文本转语音技术又上了一个新台阶。要是用户想了解更多关于这个系统的信息,可以联系相关团队,获取详细的使用体验和技术支持。
阿里巴巴2026届春招开启,AI岗位超过3000个
阿里巴巴官方宣布,2026届春季实习生招聘正式启动啦,这次开放的岗位超过3000个,其中人工智能(AI)相关的岗位占了快50%。在有些业务部门,AI岗位的比例更高,像高德差不多有65%,阿里云更是超过了80%。这就能看出,阿里巴巴对AI技术越来越重视了。
这次春招,阿里巴巴控股集团、阿里云、高德、通义实验室、饿了么和灵犀互娱等好多部门都参与了。后面淘天、阿里国际和菜鸟等部门也会陆续开始招聘。和去年相比,阿里在春招的时候还是很关注技术类岗位,不过这次明显更侧重AI领域的招聘了。
据了解,早在2月19日,阿里巴巴的AI To C业务就开始大规模招人了,相关岗位有好几百个,其中90%都是AI技术和产品研发类岗位。这些新招来的员工,以后会专注于文本、多模态大模型和AI Agent等前沿技术的开发和应用。阿里AI To C业务体系下的产品有夸克和天猫精灵等,这也能看出公司在面向消费者的AI技术应用方面,野心可不小。
豆包APP推出“照片动起来”功能,让老照片活起来
字节跳动旗下的AI智能助手豆包APP最近上线了一个超有意思的功能——“照片动起来”。这个功能就是为了满足大家想把老照片变成动态的想法,让那些以前定格的瞬间重新有了生机。
“照片动起来”这个功能操作特别简单,用户只要打开豆包APP,找到这个功能,上传一张老照片,然后说说照片里人物或者物体想做什么动作。等一小会儿,豆包APP就能用先进的AI技术,把静态的照片变成一段生动的动态视频。
有了这个功能,用户就能让老照片“活”过来,记忆也变得更鲜活了。不管是家庭聚会时的欢乐场景,还是个人成长过程中的点点滴滴,都能以全新的动态形式展现出来。
豆包APP说,希望“照片动起来”这个功能能见证更多的爱和温暖,帮用户和过去的自己来一场跨越时空的对话。在现在这个快节奏的时代,咱们也能借助科技的力量,把那些稍纵即逝的美好瞬间留住,跟过去的自己道一声“好久不见”。
豆包AI工具地址》》》详情查看
DeepSeek开源第四天,推出了算法DualPipe、均衡器EPLB、计算-通信重叠机制的深度优化
今天,国内人工智能的头部企业DeepSeek公开了开源计划第四天的成果——Optimized Parallelism Strategies(优化并行策略),重点推出了双向管道并行算法DualPipe、专家并行负载均衡器EPLB,还对计算 - 通信重叠机制进行了深度优化。这次技术升级可太关键了,直击大规模语言模型训练的核心难题,给超万卡级集群的高效运行提供了新办法。
先说DualPipe,这是专门为V3/R1架构设计的双向管道并行算法。它通过创新的双向数据流管道,让计算和通信能高度重叠。和传统单向流水线比起来,这个技术能大大提高计算吞吐量,对千亿至万亿参数规模的模型训练特别有用。从GitHub代码库能看到,DualPipe在反向传播阶段能同步执行前向计算,通过智能调度,让硬件利用率提高了大概30% 。
项目链接:https://github.com/deepseek-ai/DualPipe
再讲讲EPLB,它是用来解决混合专家(MoE)模型训练中“热点专家”问题的。以前传统方法因为专家任务分配不均匀,经常导致有些计算卡忙不过来,而EPLB通过实时监控和自适应分配,能让万卡级集群的整体利用率达到92%以上,有效避免资源闲置。
项目链接:https://github.com/deepseek-ai/EPLB DeepSeek
还基于V3/R1架构的通信重叠分析工具,构建了3D并行(数据/流水线/张量并行)的时空效率模型。通过开源的分析数据集,开发者能精准找到计算与通信的冲突节点,给超大规模模型训练提供调优的基准。测试显示,这么做能减少大概15%的端到端训练时间。
项目链接:https://github.com/deepseek-ai/profile-data
这次技术发布在业界引起了很大关注。专家说,DualPipe和EPLB的创新组合,直接解决了当前大模型训练的两大难题:一是随着模型规模越来越大,传统并行策略扩展性不行了;二是混合专家模型普及后,动态负载均衡成了急需解决的问题。有云计算厂商技术负责人评价说,这些工具能大大降低千亿级模型训练的硬件门槛,估计能让训练成本降低20%-30% 。
DeepSeek CTO在技术文档里强调,这次开源的策略已经在内部多个千亿参数模型训练中验证过了,以后还会继续优化。现在这三项技术都在GitHub上开源了,开发者能根据自己的硬件环境定制使用。
在全球AI竞赛进入“规模决胜”阶段的时候,DeepSeek通过连续四天的关键技术开源,不仅展示了中国AI企业的技术实力,还给行业提供了能用的基础设施。这场由“开放协作”推动的技术革新,说不定会改变大模型训练的产业生态呢。
DeepSeek AI工具地址》》》详情查看
更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html