即梦AI“大师模式”上线,数字人活灵活现!
即梦 AI 搞了个大事情,全量上线了超厉害的数字人 - 大师模式(OmniHuman-1) 。现在,咱普通人也能轻松玩转数字人创作啦!只要拿出一张照片,再配上一段音频,就能自动生成动作、表情都特别逼真的高阶数字人,都不用费劲去想提示词,创作门槛一下子就降低了好多,就跟坐滑梯似的。
这个 “大师模式” 简直太牛了!以前的数字人,动作僵硬得很,看着特别尴尬,就像木头人一样。但现在不一样了,新一代数字人那动效,逼真到让人惊掉下巴,把那些老掉牙的 “僵硬” 模型远远甩在后面。它还突破了传统数字人只能动脑袋的局限,能让数字人全身的动作都自然生成。这意味着,数字人不再是傻乎乎的 “大头娃娃”,而是能像真人一样,用肢体语言来表达想法。从社区用户的反馈来看,不管是演讲、唱歌,还是跳舞这些复杂场景,这个功能都表现得相当出色。
小编自己也测试了一下,上传了一张哪吒的照片,再加上一段音频,出来的效果那叫一个棒!动作流畅自然,表情也特别鲜活,要是用来制作对口型动画,或者弄个数字讲师啥的,都非常合适。不过目前这个模式最多只能上传 15 秒长的音频,要是以后能更长就更完美啦!这个功能对于短视频创作者、虚拟主播还有广告制作者来说,简直就是效率提升的超级法宝,既能省成本,又能做出更吸引人的内容,真的太实用了!
即梦AI工具地址》》》详情查看
腾讯混元新招:图生视频模型HunyuanVideo-I2V来啦!
腾讯又有新动作,开源了新研发的图像转视频生成框架 ——HunyuanVideo-I2V 。这可是在成功开源 HunyuanVideo 之后的又一重要成果,对开放源代码社区来说,是个大大的好消息。
HunyuanVideo-I2V 运用了先进的视频生成技术,能把静态图片变成生动的视频。使用方法特别简单,用户只要上传一张图片,再简单说说希望画面怎么动,就能生成一段五秒的短视频。而且,这个模型可不只是让图片 “动起来” 这么简单,还会自动配上背景音效,让视频变得更有趣、更吸引人。
它能这么厉害,是因为用了预训练的多模态大语言模型作为文本编码器,这让模型对输入图像的语义内容理解得更透彻。输入的图像通过模型生成语义图像标记,再和视频潜在标记结合,进行全面的全注意力计算,这样生成的视频内容就更连贯、更真实。
现在,混元 AI 视频官网已经上线,大家可以直接上去体验。企业和开发者也能通过腾讯云申请 API 接口,把这个技术用到自己的应用里。这个图生视频模型是混元文生视频模型开源工作的延续,模型总参数量达 130 亿,不管是写实视频、动漫角色,还是 CGI 角色等各种类型的角色和场景,它都能轻松生成。
使用的时候,用户还能上传人物图片,输入想让人物 “对口型” 的文字或音频,图片里的人物就能 “说话” 或者 “唱歌” 了。混元还推出了 “动作驱动” 功能,一键就能生成舞蹈视频,创作变得更多样、更有趣。这次开源的图生视频模型已经在 Github 和 HuggingFace 等主流开发者社区发布,开发者可以下载相关内容去试验、开发,说不定能搞出更多好玩的东西呢!
腾讯混元AI视频工具地址》》》详情查看
全球首款通用AI智能体Manus入驻微博,网友求码热情高!
今天中午,全球首款通用 AI 智能体 Manus 正式在微博安家,一下子就吸引了超多网友的目光,大家都在热烈讨论。
微博 AI 官微介绍说,Manus 可不只是个普通的智能助手,简直就是个超级厉害的 “同事”,它特别聪明,不用你说一堆复杂指令,只要一句话,它就能帮你搞定好多事,像筛选简历、规划旅行、分析数据、制作 PPT,甚至写代码部署网页游戏都不在话下,不管你是职场白领、学生,还是创业的人,有了它,效率能蹭蹭往上涨。
Manus 作为通用 AI 代理,能把思想和行动连接起来,它不光会思考,还能实实在在地给出结果。官方说,它特别擅长处理工作和生活里的各种任务,你休息的时候,它都能帮你把活儿干完,真的做到了知行合一。Monica 联合创始人、首席科学家季逸超也说,Manus 和一般的聊天机器人或者工作流不一样,它是真正能自主做事的,能把想法和执行之间的差距给补上,别的人工智能可能就只会想,Manus 可是能直接把事儿办成。所以,大家都觉得 Manus 代表了下一代人机协作的新方式,说不定还能让我们提前看到 AGI(通用人工智能)的未来呢。
不过现在想试用 Manus 得要邀请码,这可太难得了,邀请码一码难求,都被炒到 5 万天价了。Manus 中国官微上线后,网友们都在评论区疯狂求邀请码,就盼着能赶紧体验一下这个真正能帮忙干活的 AI 智能体。Manus AI 合伙人张涛也回应了邀请码炒作这事,说感谢大家支持,公司没搞过付费获取邀请码的渠道,也没花推广钱,内测期间系统容量有限,会先保证现有用户体验,再慢慢放出邀请码。以后肯定会有更多人能体验到 Manus 的强大功能。
Manus AI智能体地址》》》详情查看
国产AI新品Manus邀请码炒翻天,高达5万!
最近,国产出海的人工智能产品 Manus 在科技圈那是火得一塌糊涂,成了大家热议的焦点。
Manus 是中国创业公司 Monica 推出的全球首款通用型 AI 智能体。官方说,它在 GAIA 基准测试里成绩特别好,性能比 OpenAI 的同类大模型还厉害。作为通用型智能体,Manus 可厉害啦,不再只干单一的任务,能理解复杂指令,还能自己解决问题。不过现在 Manus 的体验版本还没完全开放,得有邀请码才能试用。
新快报报道说,这一情况催生了邀请码的二手交易市场,价格从 999 元到 5 万元不等,有的卖家还很傲娇,坚决不还价,这就看出这个产品有多稀缺了。从实际案例来看,在人力资源这块,Manus 筛选简历又快又专业;要是你想买房,它能结合你的预算,整合各种信息,给你出一份详细报告;当股票分析师,它还能分析公司股票价格,生成可视化数据,帮你做决策。
另外,Manus 在旅行规划、教育内容创建、保险政策比较等方面也能大显身手,功能特别多。它的创始人肖弘是个 “90 后” 创业者,之前就推出过好多 AI 助手,积累了不少经验和用户。Manus 的出现,说明他在 AI 领域又有了新突破。不过大家可别去买高价邀请码,还是得通过正规渠道申请,说不定哪天就能用上这个超牛的 AI 啦。
Prime Video试水AI配音,影视作品多语种化不是梦!
亚马逊旗下的 Prime Video 最近在搞一个新试验,用 AI 辅助配音技术,让一些之前没有配音的影视作品能被更多人看到。这个技术把人工智能和专业本地化团队结合起来,就是为了保证配音的质量和准确性。
这个项目一开始选了 12 部之前没配音的影片做试点,涉及英语和拉丁美洲西班牙语两种语言。像西班牙动画片《埃尔西德:传奇》和家庭剧情片《我妈妈的罗拉》都在其中。Prime Video 这么做,就是想通过 AI 配音技术,打破语言障碍,让更多观众能欣赏到各种各样的影视内容,扩大受众群体。
这几年,AI 配音技术在娱乐行业越来越流行,好多流媒体平台都开始用。比如 Deepdub 公司专门搞 AI 配音,Paramount + 就是它的客户;YouTube 也在这方面花了不少钱,最近还推出了自动配音功能,创作者能把视频翻译成多种语言。
除了配音,Prime Video 还有一些其他 AI 功能,能让观众看得更爽。像 “X-Ray Recaps” 功能,可以把整季和单集内容总结一下,方便观众快速回顾;“Dialogue Boost” 能让对话的声音更清楚,那些不容易听清的对话也能听明白了。随着技术不断进步,AI 辅助配音的前景特别广阔,Prime Video 这次尝试说不定会改变影视作品配音行业的格局,让全球的影视内容能更好地共享和交流,以后我们看国外影视可能会更方便啦。
智源开源多模态向量模型BGE-VL,检索领域新突破!
2025 年 3 月 6 日,北京智源人工智能研究院干了件大事,开源了多模态向量模型 BGE-VL,这在多模态检索领域可是个重大突破。
BGE-VL 模型在图文检索、组合图像检索等多模态检索任务里,表现特别出色,把多模态检索的性能提升了一大截。它能这么厉害,多亏了大规模合成数据集 MegaPairs。这个数据集结合了多模态表征模型、多模态大模型和大语言模型,从海量图文语料库里高效挖出多模态三元组数据。这种方法扩展性特别好,能花很少的成本,不断生成各种各样高质量的数据,还把数据质量大大提高了。和以前人工标注的数据比起来,MegaPairs 只用 1/70 的数据量,就能达到更好的训练效果。
在技术实现上,MegaPairs 的构造分两步。第一步,用多种相似度模型从图像数据集中找出各种不同的图像对;第二步,利用开源的多模态大模型和大语言模型合成开放域检索指令。这样,不用人工参与,就能大规模、高质量、多样化地生成多模态检索指令数据集。这次发布的版本有 2600 万条样本,给多模态检索模型的训练提供了超多数据支持。
基于 MegaPairs 数据集,智源 BGE 团队训练了 3 款不同大小的多模态检索模型,分别是 BGE-VL-Base、BGE-VL-Large 和 BGE-VL-MLLM。这些模型在好多任务上,都比以前的方法强太多了。在 Massive Multimodal Embedding Benchmark(MMEB)的 36 个多模态嵌入评测任务中,BGE-VL 不管是零样本性能,还是有监督微调后的性能,都是最好的,泛化能力特别强。在组合图像检索任务里,BGE-VL 在 CIRCO 评测集上刷新了纪录,把谷歌的 MagicLens 系列和英伟达的 MM-Embed 等对比基线远远甩在后面。而且,MegaPairs 数据集可扩展性和高效性都很好,随着数据规模增加,BGE-VL 模型的性能也越来越好。和在 37M 闭源数据上训练的 SOTA 模型 Google MagicLens 比,MegaPairs 只用 1/70 的数据规模(0.5M),性能就有很大优势,真的太牛了!
90后AI新星肖弘,Manus创始人身份曝光!
昨天,一款名为Manus的通用AI代理产品火遍了全球科技圈,其背后的创始人肖弘也成为了备受瞩目的焦点人物。这位90后创业者,以敏锐的洞察力和卓越的执行力,在AI领域崭露头角。
肖弘的创业之路起步于2015年,他创立的夜莺科技推出了两款热门产品,吸引了腾讯、真格基金等知名机构的数亿元投资。2022年,他抓住人工智能浪潮,创立“蝴蝶效应”公司,推出AI浏览器插件Monica。如今,他推出的Manus更是延续了Monica的产品理念,定位为全球首款通用自主AI代理。
肖弘不仅继承了中国AI创业者的技术基因,还展现出超越前辈的全球化视野和产品哲学。现在,Manus处于内测阶段,邀请码在全球范围内的热捧凸显其潜力。未来,肖弘还计划开源部分模型,推动AI技术普惠化。这位90后创始人正用“手脑并用”的理念,书写属于自己的传奇!
更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html