视频大模型Vidu进展曝光:时长延至32秒,首次支持音视频合成
来源:36氪
36氪获悉,在北京举办的CCF大模型论坛线下专题活动上,清华大学人工智能研究院副院长、生数科技首席科学家朱军教授放出了Vidu的最新进展:目前Vidu可以一键生成32s视频;支持音视频合成;支持4D生成,可以从单一视频生成时空一致的4D内容。
快手视频生成大模型“可灵”亮相,对标Sora
来源:阿杰与AI
近日,快手正式上线了视频生成大模型“可灵”的官网。该模型由快手AI团队自主研发,基于多年的视频技术积累,采用与Sora相似的技术路线,并结合自研技术创新,效果对标Sora。可灵大模型具备强大的概念组合能力和想象力,能够生成高达1080p分辨率、最长2分钟(30fps)的合理运动和模拟物理世界特性的高质量视频,并支持自由的宽高比。目前,可灵大模型已在快影App上开放邀测体验。
Meta使用用户数据训练AI引发争议
来源:阿杰与AI
Meta计划使用Facebook和Instagram上的公开帖子和图像来训练其AI工具,引发数字权利组织Noyb的批评。新隐私政策将于6月26日生效,适用于用户在这些平台上公开分享的内容,但不包括私人消息。Noyb认为这是“滥用个人数据”,并已向11个欧洲数据保护机构提出投诉,要求立即采取行动阻止Meta的计划。Meta表示其方法符合隐私法律,与其他科技公司使用数据的方式一致。然而,用户需通过复杂的程序才能选择退出,这一过程被批评为繁琐且可能阻止用户反对。爱尔兰数据保护委员会已确认收到投诉,正在调查此事。
百度推出大模型升级版高考服务
来源:阿杰与AI
百度搜索在今年高考季全面升级高考服务,利用AI大模型和海量大数据为考生提供全周期一站式服务。通过百度APP搜索“高考”即可直达高考服务页面,涵盖在线查分、志愿填报、院校专业、录取查询等功能。新增的Ai志愿助手通过智能分析提供志愿预测和录取概率,用户可与智能体对话简化填报流程。百度还整合了权威的院校专业数据,并联合OPPO和知名脱口秀演员徐志胜、茶百道等,为考生提供更多互动和祝福。百度还启动了高考护航计划,邀请双一流大学招生办主任为学子送祝福,帮助考生了解大学环境和生活。
DuckDuckGo 推出匿名AI聊天服务
来源:阿杰与AI
DuckDuckGo 推出新的“AI Chat”服务,用户可以在保持隐私的同时与来自OpenAI、Anthropic、Meta和Mistral的四个中等规模的大型语言模型(LLM)进行互动。该服务无需注册账户,通过DuckDuckGo搜索引擎或直接链接访问,并匿名化用户数据,包括IP地址。提供的模型包括OpenAI的GPT-3.5 Turbo、Anthropic的Claude 3 Haiku、Meta的Llama 3和Mistral的Mixtral 8x7B。尽管有隐私措施,安全专家提醒,数据发送到远程服务器处理可能仍存在识别风险。DuckDuckGo的隐私政策确保聊天数据不会用于AI模型训练,并在30天内删除。然而,由于模型可能存在不准确性,该服务的实用性受到质疑。
字节推语音生成模型Seed-TTS 擅长感情控制,声音与真人无异
来源:站长之家
字节跳动团队提出的新型语音生成模型Seed-TTS,该模型基于自回归Transformer架构,具有极高的语音质量和表现力,难以区分与人类语音的差异。它在情感控制、小说配音和跨语言内容创作等方面表现出色,通过自我蒸馏和强化学习技术提升了发音的自然性和可控性。Seed-TTS在语音合成领域带来了显著进展,为未来的语音合成技术开辟了新的可能性。
Stability AI发布AI音频模型Stable Audio Open
来源:站长之家
Stable Audio Open是Stability AI推出的开源文本转音频模型,可生成长达47秒的音频样本和音效,适用于音乐制作和声音设计。用户可以创建鼓点、乐器乐段、环境声音等音频元素,支持音频变化和风格转换。模型提供了稳定的音频生成质量和长度,用户可根据自定义音频数据微调模型,提高生成音频的质量和可控性
Suno新功能被Udio抢跑 上传任意音频Udio自动帮延长创作
来源:站长之家
Suno原本计划推出的新功能被竞争对手Udio抢先发布的情况。Udio推出了一系列更新,帮助用户上传音频片段并自动解析旋律和和弦,创作出美妙的音乐,并提供了多项便利功能。 AITOP100平台资讯专区: https://www.aitop100.cn/infomation/index.html