每日AI资讯--6月20日-AITOP100,AI资讯

谷歌DeepMind开发新AI，可为视频生成配乐和对白

来源：36氪

6月17日，Google的人工智能研究实验室DeepMind表示，它正在开发为视频生成配乐的人工智能技术。DeepMind 在其官方博客上发表文章称，它认为 V2A（"视频到音频"的缩写）技术是人工智能生成媒体拼图中必不可少的一部分。虽然包括 DeepMind在内的许多机构已经开发出了视频生成人工智能模型，但这些模型无法在生成视频时同步生成音效。（第一财经）

Hedra的 Character-1开放使用

来源：站长之家

Hedra的Character-1开放使用，为创作者提供了通过文本和图片生成说话和唱歌视频的神器，开启了创作革命。它不仅是工具，更是一个全新的创作平台，让每个人都能拥有无限的视频创作机会。

地址：https://www.hedra.com/

Deepmind视频转音频技术V2A：实现自动为视频配乐、配音

来源：站长之家

谷歌Deepmind发布了V2A技术，利用视频像素和文本提示生成丰富的音轨，实现同步视听生成。用户可通过文字描述引导音频输出，系统采用自回归和扩散方法生成音频，确保与视频内容完美同步。训练过程中使用AI生成的注释帮助模型理解音频事件与视觉场景关联。尽管存在唇形同步挑战，V2A技术将接受严格评估测试后向公众开放。

地址：https://deepmind.google/discover/blog/generating-audio-for-video/

百度曦灵数字人平台升级支持文生 3D 数字人、音色克隆等功能

来源：站长之家

百度智能云曦灵数字人平台即将迎来重大升级，提供高效低成本的2D/3D数字人生成，全面打通直播、短视频、对话等多个场景，大幅提升用户体验。曦灵平台展现出令人瞩目的数字人生成能力，快速精准地生成逼真的数字人，为企业、文旅、娱乐等领域带来全新IP创造可能。

谷歌推字母表生成器GenType 可用于创作封面艺术字体

来源：站长之家

GenType是谷歌推出的实验性产品，通过Imagen2模型驱动，用户可以创造个性化的字母形式，用于书写各种内容，特别适合制作标题或封面艺术。该工具提供了简单直观的操作界面，让用户快速上手，激发创造力和想象力。用户可以分享保存生成的字母表图片，并在在线画廊中浏览其他用户的作品，获取灵感和创意。

苹果宣布推出新的人工智能功能后为开发者推出“AI 培训”

来源：站长之家

苹果公司宣布推出新的人工智能培训课程，面向开发者学院的学生、导师以及校友等。这标志着苹果在AI技术领域的开放态度和重视程度逐渐增加。

Luma AI的Dream Machine生成作品被指涉嫌抄袭迪士尼IP

来源：站长之家

Luma发布的Dream Machine视频生成工具引发了关于模型透明度和数据来源的质疑，特别是涉嫌抄袭迪士尼作品。这引发了人们对这类模型最大的关注点之一，缺乏透明度。

AI画师接单被“抓包” 小红书博主“鉴Ai”视频获赞2.9万

来源：站长之家

小红书博主“天线嫂嫂（内裤大王）”在约画时发现画师使用AI技术，引发社交媒体关注。画师未提供线稿，博主怀疑作品为AI制作，揭露画稿盗图。AI绘画技术逼真度提高，难以区分人类和AI作品。AI技术发展带来版权和真实性挑战。 AITOP100平台资讯专区： https://www.aitop100.cn/infomation/index.html