每日AI资讯 - 03月06日-AITOP100,AI资讯

即梦AI“大师模式”上线，数字人活灵活现！

即梦 AI 搞了个大事情，全量上线了超厉害的数字人 - 大师模式（OmniHuman-1）。现在，咱普通人也能轻松玩转数字人创作啦！只要拿出一张照片，再配上一段音频，就能自动生成动作、表情都特别逼真的高阶数字人，都不用费劲去想提示词，创作门槛一下子就降低了好多，就跟坐滑梯似的。

这个 “大师模式” 简直太牛了！以前的数字人，动作僵硬得很，看着特别尴尬，就像木头人一样。但现在不一样了，新一代数字人那动效，逼真到让人惊掉下巴，把那些老掉牙的 “僵硬” 模型远远甩在后面。它还突破了传统数字人只能动脑袋的局限，能让数字人全身的动作都自然生成。这意味着，数字人不再是傻乎乎的 “大头娃娃”，而是能像真人一样，用肢体语言来表达想法。从社区用户的反馈来看，不管是演讲、唱歌，还是跳舞这些复杂场景，这个功能都表现得相当出色。

小编自己也测试了一下，上传了一张哪吒的照片，再加上一段音频，出来的效果那叫一个棒！动作流畅自然，表情也特别鲜活，要是用来制作对口型动画，或者弄个数字讲师啥的，都非常合适。不过目前这个模式最多只能上传 15 秒长的音频，要是以后能更长就更完美啦！这个功能对于短视频创作者、虚拟主播还有广告制作者来说，简直就是效率提升的超级法宝，既能省成本，又能做出更吸引人的内容，真的太实用了！

即梦AI工具地址》》》详情查看

即梦AI“大师模式”上线，数字人活灵活现！

腾讯混元新招：图生视频模型HunyuanVideo-I2V来啦！

腾讯又有新动作，开源了新研发的图像转视频生成框架 ——HunyuanVideo-I2V 。这可是在成功开源 HunyuanVideo 之后的又一重要成果，对开放源代码社区来说，是个大大的好消息。

HunyuanVideo-I2V 运用了先进的视频生成技术，能把静态图片变成生动的视频。使用方法特别简单，用户只要上传一张图片，再简单说说希望画面怎么动，就能生成一段五秒的短视频。而且，这个模型可不只是让图片 “动起来” 这么简单，还会自动配上背景音效，让视频变得更有趣、更吸引人。

它能这么厉害，是因为用了预训练的多模态大语言模型作为文本编码器，这让模型对输入图像的语义内容理解得更透彻。输入的图像通过模型生成语义图像标记，再和视频潜在标记结合，进行全面的全注意力计算，这样生成的视频内容就更连贯、更真实。

现在，混元 AI 视频官网已经上线，大家可以直接上去体验。企业和开发者也能通过腾讯云申请 API 接口，把这个技术用到自己的应用里。这个图生视频模型是混元文生视频模型开源工作的延续，模型总参数量达 130 亿，不管是写实视频、动漫角色，还是 CGI 角色等各种类型的角色和场景，它都能轻松生成。

使用的时候，用户还能上传人物图片，输入想让人物 “对口型” 的文字或音频，图片里的人物就能 “说话” 或者 “唱歌” 了。混元还推出了 “动作驱动” 功能，一键就能生成舞蹈视频，创作变得更多样、更有趣。这次开源的图生视频模型已经在 Github 和 HuggingFace 等主流开发者社区发布，开发者可以下载相关内容去试验、开发，说不定能搞出更多好玩的东西呢！

腾讯混元AI视频工具地址》》》详情查看

全球首款通用AI智能体Manus入驻微博，网友求码热情高！

今天中午，全球首款通用 AI 智能体 Manus 正式在微博安家，一下子就吸引了超多网友的目光，大家都在热烈讨论。

微博 AI 官微介绍说，Manus 可不只是个普通的智能助手，简直就是个超级厉害的 “同事”，它特别聪明，不用你说一堆复杂指令，只要一句话，它就能帮你搞定好多事，像筛选简历、规划旅行、分析数据、制作 PPT，甚至写代码部署网页游戏都不在话下，不管你是职场白领、学生，还是创业的人，有了它，效率能蹭蹭往上涨。

Manus 作为通用 AI 代理，能把思想和行动连接起来，它不光会思考，还能实实在在地给出结果。官方说，它特别擅长处理工作和生活里的各种任务，你休息的时候，它都能帮你把活儿干完，真的做到了知行合一。Monica 联合创始人、首席科学家季逸超也说，Manus 和一般的聊天机器人或者工作流不一样，它是真正能自主做事的，能把想法和执行之间的差距给补上，别的人工智能可能就只会想，Manus 可是能直接把事儿办成。所以，大家都觉得 Manus 代表了下一代人机协作的新方式，说不定还能让我们提前看到 AGI（通用人工智能）的未来呢。

不过现在想试用 Manus 得要邀请码，这可太难得了，邀请码一码难求，都被炒到 5 万天价了。Manus 中国官微上线后，网友们都在评论区疯狂求邀请码，就盼着能赶紧体验一下这个真正能帮忙干活的 AI 智能体。Manus AI 合伙人张涛也回应了邀请码炒作这事，说感谢大家支持，公司没搞过付费获取邀请码的渠道，也没花推广钱，内测期间系统容量有限，会先保证现有用户体验，再慢慢放出邀请码。以后肯定会有更多人能体验到 Manus 的强大功能。

Manus AI智能体地址》》》详情查看

全球首款通用AI智能体Manus入驻微博，网友求码热情高

国产AI新品Manus邀请码炒翻天，高达5万！

最近，国产出海的人工智能产品 Manus 在科技圈那是火得一塌糊涂，成了大家热议的焦点。

Manus 是中国创业公司 Monica 推出的全球首款通用型 AI 智能体。官方说，它在 GAIA 基准测试里成绩特别好，性能比 OpenAI 的同类大模型还厉害。作为通用型智能体，Manus 可厉害啦，不再只干单一的任务，能理解复杂指令，还能自己解决问题。不过现在 Manus 的体验版本还没完全开放，得有邀请码才能试用。

新快报报道说，这一情况催生了邀请码的二手交易市场，价格从 999 元到 5 万元不等，有的卖家还很傲娇，坚决不还价，这就看出这个产品有多稀缺了。从实际案例来看，在人力资源这块，Manus 筛选简历又快又专业；要是你想买房，它能结合你的预算，整合各种信息，给你出一份详细报告；当股票分析师，它还能分析公司股票价格，生成可视化数据，帮你做决策。

另外，Manus 在旅行规划、教育内容创建、保险政策比较等方面也能大显身手，功能特别多。它的创始人肖弘是个 “90 后” 创业者，之前就推出过好多 AI 助手，积累了不少经验和用户。Manus 的出现，说明他在 AI 领域又有了新突破。不过大家可别去买高价邀请码，还是得通过正规渠道申请，说不定哪天就能用上这个超牛的 AI 啦。

国产AI新品Manus邀请码炒翻天，高达5万

Prime Video试水AI配音，影视作品多语种化不是梦！

亚马逊旗下的 Prime Video 最近在搞一个新试验，用 AI 辅助配音技术，让一些之前没有配音的影视作品能被更多人看到。这个技术把人工智能和专业本地化团队结合起来，就是为了保证配音的质量和准确性。

这个项目一开始选了 12 部之前没配音的影片做试点，涉及英语和拉丁美洲西班牙语两种语言。像西班牙动画片《埃尔西德：传奇》和家庭剧情片《我妈妈的罗拉》都在其中。Prime Video 这么做，就是想通过 AI 配音技术，打破语言障碍，让更多观众能欣赏到各种各样的影视内容，扩大受众群体。

这几年，AI 配音技术在娱乐行业越来越流行，好多流媒体平台都开始用。比如 Deepdub 公司专门搞 AI 配音，Paramount + 就是它的客户；YouTube 也在这方面花了不少钱，最近还推出了自动配音功能，创作者能把视频翻译成多种语言。

除了配音，Prime Video 还有一些其他 AI 功能，能让观众看得更爽。像 “X-Ray Recaps” 功能，可以把整季和单集内容总结一下，方便观众快速回顾；“Dialogue Boost” 能让对话的声音更清楚，那些不容易听清的对话也能听明白了。随着技术不断进步，AI 辅助配音的前景特别广阔，Prime Video 这次尝试说不定会改变影视作品配音行业的格局，让全球的影视内容能更好地共享和交流，以后我们看国外影视可能会更方便啦。

Prime Video试水AI配音

智源开源多模态向量模型BGE-VL，检索领域新突破！

2025 年 3 月 6 日，北京智源人工智能研究院干了件大事，开源了多模态向量模型 BGE-VL，这在多模态检索领域可是个重大突破。

BGE-VL 模型在图文检索、组合图像检索等多模态检索任务里，表现特别出色，把多模态检索的性能提升了一大截。它能这么厉害，多亏了大规模合成数据集 MegaPairs。这个数据集结合了多模态表征模型、多模态大模型和大语言模型，从海量图文语料库里高效挖出多模态三元组数据。这种方法扩展性特别好，能花很少的成本，不断生成各种各样高质量的数据，还把数据质量大大提高了。和以前人工标注的数据比起来，MegaPairs 只用 1/70 的数据量，就能达到更好的训练效果。

在技术实现上，MegaPairs 的构造分两步。第一步，用多种相似度模型从图像数据集中找出各种不同的图像对；第二步，利用开源的多模态大模型和大语言模型合成开放域检索指令。这样，不用人工参与，就能大规模、高质量、多样化地生成多模态检索指令数据集。这次发布的版本有 2600 万条样本，给多模态检索模型的训练提供了超多数据支持。

基于 MegaPairs 数据集，智源 BGE 团队训练了 3 款不同大小的多模态检索模型，分别是 BGE-VL-Base、BGE-VL-Large 和 BGE-VL-MLLM。这些模型在好多任务上，都比以前的方法强太多了。在 Massive Multimodal Embedding Benchmark（MMEB）的 36 个多模态嵌入评测任务中，BGE-VL 不管是零样本性能，还是有监督微调后的性能，都是最好的，泛化能力特别强。在组合图像检索任务里，BGE-VL 在 CIRCO 评测集上刷新了纪录，把谷歌的 MagicLens 系列和英伟达的 MM-Embed 等对比基线远远甩在后面。而且，MegaPairs 数据集可扩展性和高效性都很好，随着数据规模增加，BGE-VL 模型的性能也越来越好。和在 37M 闭源数据上训练的 SOTA 模型 Google MagicLens 比，MegaPairs 只用 1/70 的数据规模（0.5M），性能就有很大优势，真的太牛了！

智源开源多模态向量模型BGE-VL

90后AI新星肖弘，Manus创始人身份曝光！

昨天，一款名为Manus的通用AI代理产品火遍了全球科技圈，其背后的创始人肖弘也成为了备受瞩目的焦点人物。这位90后创业者，以敏锐的洞察力和卓越的执行力，在AI领域崭露头角。

肖弘的创业之路起步于2015年，他创立的夜莺科技推出了两款热门产品，吸引了腾讯、真格基金等知名机构的数亿元投资。2022年，他抓住人工智能浪潮，创立“蝴蝶效应”公司，推出AI浏览器插件Monica。如今，他推出的Manus更是延续了Monica的产品理念，定位为全球首款通用自主AI代理。

肖弘不仅继承了中国AI创业者的技术基因，还展现出超越前辈的全球化视野和产品哲学。现在，Manus处于内测阶段，邀请码在全球范围内的热捧凸显其潜力。未来，肖弘还计划开源部分模型，推动AI技术普惠化。这位90后创始人正用“手脑并用”的理念，书写属于自己的传奇！

90后AI新星肖弘，Manus创始人身份曝光！

更多AI行业最新资讯新闻信息请关注AI 人工智能网站--AITOP100平台--AI资讯专区：https://www.aitop100.cn/infomation/index.html