谷歌DeepMind开发新AI,可为视频生成配乐和对白
来源:36氪
6月17日,Google的人工智能研究实验室DeepMind表示,它正在开发为视频生成配乐的人工智能技术。DeepMind 在其官方博客上发表文章称,它认为 V2A("视频到音频"的缩写)技术是人工智能生成媒体拼图中必不可少的一部分。虽然包括 DeepMind在内的许多机构已经开发出了视频生成人工智能模型,但这些模型无法在生成视频时同步生成音效。(第一财经)
Hedra的 Character-1开放使用
来源:站长之家
Hedra的Character-1开放使用,为创作者提供了通过文本和图片生成说话和唱歌视频的神器,开启了创作革命。它不仅是工具,更是一个全新的创作平台,让每个人都能拥有无限的视频创作机会。
地址:https://www.hedra.com/
Deepmind视频转音频技术V2A:实现自动为视频配乐、配音
来源:站长之家
谷歌Deepmind发布了V2A技术,利用视频像素和文本提示生成丰富的音轨,实现同步视听生成。用户可通过文字描述引导音频输出,系统采用自回归和扩散方法生成音频,确保与视频内容完美同步。训练过程中使用AI生成的注释帮助模型理解音频事件与视觉场景关联。尽管存在唇形同步挑战,V2A技术将接受严格评估测试后向公众开放。
地址:https://deepmind.google/discover/blog/generating-audio-for-video/
百度曦灵数字人平台升级 支持文生 3D 数字人、音色克隆等功能
来源:站长之家
百度智能云曦灵数字人平台即将迎来重大升级,提供高效低成本的2D/3D数字人生成,全面打通直播、短视频、对话等多个场景,大幅提升用户体验。曦灵平台展现出令人瞩目的数字人生成能力,快速精准地生成逼真的数字人,为企业、文旅、娱乐等领域带来全新IP创造可能。
谷歌推字母表生成器GenType 可用于创作封面艺术字体
来源:站长之家
GenType是谷歌推出的实验性产品,通过Imagen2模型驱动,用户可以创造个性化的字母形式,用于书写各种内容,特别适合制作标题或封面艺术。该工具提供了简单直观的操作界面,让用户快速上手,激发创造力和想象力。用户可以分享保存生成的字母表图片,并在在线画廊中浏览其他用户的作品,获取灵感和创意。
苹果宣布推出新的人工智能功能后 为开发者推出“AI 培训”
来源:站长之家
苹果公司宣布推出新的人工智能培训课程,面向开发者学院的学生、导师以及校友等。这标志着苹果在AI技术领域的开放态度和重视程度逐渐增加。
Luma AI的Dream Machine生成作品被指涉嫌抄袭迪士尼IP
来源:站长之家
Luma发布的Dream Machine视频生成工具引发了关于模型透明度和数据来源的质疑,特别是涉嫌抄袭迪士尼作品。这引发了人们对这类模型最大的关注点之一,缺乏透明度。
AI画师接单被“抓包” 小红书博主“鉴Ai”视频获赞2.9万
来源:站长之家
小红书博主“天线嫂嫂(内裤大王)”在约画时发现画师使用AI技术,引发社交媒体关注。画师未提供线稿,博主怀疑作品为AI制作,揭露画稿盗图。AI绘画技术逼真度提高,难以区分人类和AI作品。AI技术发展带来版权和真实性挑战。 AITOP100平台资讯专区: https://www.aitop100.cn/infomation/index.html