马斯克发出警报:现实世界AI训练数据资源即将枯竭
埃隆·马斯克在最新的直播中警示,现实世界用于人工智能训练的数据资源已几近枯竭。这位特斯拉和SpaceX的掌门人与Stagwell的马克·佩恩讨论时指出,人类知识积累的数据已近乎用尽,这一情况主要发生在去年。他的看法与伊利亚·苏茨克弗的“数据峰值”理论不谋而合,预示着AI行业将面临数据短缺的挑战。
面对这一困境,马斯克看好合成数据作为解决方案。他认为,通过AI自我生成训练数据,可以补充现实世界的不足。与此同时,微软、Meta等公司已开始使用合成数据训练AI模型。据Gartner预测,到2024年,合成数据将占AI和数据分析项目数据的60%。
尽管合成数据能降低开发成本,但马斯克和其他专家提醒,其风险不容忽视。研究表明,合成数据可能导致模型性能下降,缺乏创新,并可能携带偏见,这些问题将直接影响最终模型的输出质量。
WeWalk 推出 Smart Cane 2 智能手杖,为视障人士提供升级出行体验
WeWalk 在CES2025上推出革命性产品——Smart Cane 2智能手杖,专为视障人士打造,融合了传统盲杖与先进的人工智能技术。联合创始人Kursat Ceylan,一位自幼失明的视障人士,带领团队设计了这款提升出行安全与便捷性的工具。
Smart Cane 2集成了逐向导航和障碍物检测功能,并与ChatGPT语音助手完美结合,为用户实时提供周边信息。新版手杖握柄更细,手感提升,重量与传统盲杖相似,操作更加简便,配有触觉按钮,并具备防雨功能,适应各种天气。
内置扬声器和麦克风,搭配运动传感器,Smart Cane 2提供精准导航,让用户无需手持手机即可获取行走信息,实现了出行自由。现已在接受预购,首批产品即将发货。购买选项包括850美元加月订阅费或一次性支付1150美元。
WeWalk Smart Cane 2的问世,标志着科技在助残领域的深入应用,为视障人士带来了更多出行可能,期待其带来的积极变化。
Stability AI 革命性创新:SPAR3D 技术实现仅需一秒,从单张图像快速转换至3D模型
Stability AI 在CES展会上震撼亮相,推出革命性技术SPAR3D,实现从单张图片快速生成3D对象。这一技术仅需不到一秒,便能为游戏开发、产品设计等领域带来高效的3D原型设计新体验。
SPAR3D技术的亮点在于其能够同时捕捉物体可见与不可见部分的细节,生成精确的3D模型,并提供全方位的360度视角。用户还能实时编辑3D对象,如增删点云、拉伸或重新着色,极大地提升了创作的灵活性和创意空间。
SPAR3D的工作流程分为两阶段:首先,利用轻量级点扩散模型快速生成3D点云;其次,结合点云和输入图像,构建高精度网格模型。这一流程不仅提升了计算效率,还确保了模型质量,超越了传统单图像3D重建的局限。
在性能测试中,SPAR3D在GSO和Omniobject3D数据集上展现了卓越性能,优于当前多种先进算法。通过显式点云中间表示,SPAR3D在图像遮挡和细节重建方面表现优异,使用户能够进一步精细调整3D模型。
SPAR3D的主要功能包括:
实时生成:从单张图像快速构建完整的3D对象。
高效编辑:点云编辑后快速转换为网格,仅需0.3秒。
先进编辑功能:直接操作点云,支持重新着色等。
精确结构预测:提供完整几何形状和隐藏区域细节。
高分辨率输出:通过三平面变换器捕捉纹理和光照。
SPAR3D采用开放使用政策,支持商业和非商业用途,用户可在多平台获取和使用。开发者可通过Hugging Face下载权重,GitHub获取代码,或通过API访问。
了解更多,请访问官方介绍:https://stability.ai/news/stable-point-aware-3d
巨量引擎推出全新AIGC工具‘即创’正式版,实现智能制作与爆款内容裂变
巨量引擎发布AIGC工具“即创”正式版,带来智能成片和爆款裂变等创新功能。这款工具利用深度学习技术,用户输入主题即可快速生成文本和视频内容。智能成片技术能够一键转换脚本为视频,并创建数字人增强互动性,简化创作流程。
“即创”的特色功能包括爆款裂变,它基于市场数据和用户反馈,推荐热门内容主题,助力自媒体快速把握市场动态,提高点击率和收益。此外,一键过审功能确保内容合规,减轻创作者的审核负担。
该工具已帮助用户在短时间内完成产品宣传视频制作,展现了其高效的内容生成和处理能力。
通义万相2.1视频生成模型正式推出,支持文字特效生成
通义万相2.1视频生成模型于2025年1月9日震撼推出,相较于前版,其在大幅度复杂运动、物理规律遵循及艺术表现上均实现显著提升。尤为突出的是,该模型成为首个同时支持中英文文字生成及特效生成的视频生成模型。
用户仅需输入简短文字描述,如“小猫电脑前打字,跳出‘不工作就没饭吃’”,通义万相2.1即可生成小猫敲键盘、屏幕弹出动态宠物主题文字的电影级视频,极大提升视频趣味性和互动性。此功能完美契合广告设计和短视频创作需求,支持特效字体、海报字体及真实场景字体展示,助力用户轻松实现创意构思,提高视频制作效率。
此外,通义万相2.1采用自研高效变分自编码器(VAE)和深度佳传播(DiT)架构,显著增强时空上下文关系建模能力。在生成复杂运动和精确肢体旋转场景视频时,模型能保持肢体协调性与自然运动轨迹,避免肢体扭曲和物理规律违规。
目前,通义万相2.1模型已全面开放,用户可直接在官网免费使用。这一开放策略展现了技术的开放性,为开发者提供了创新与创业机遇。随着AI技术的飞速发展,通义万相2.1模型将在视频生成领域发挥愈发重要的作用,引领未来内容生成与创作的变革潮流,为用户带来更多惊喜和可能。
通义万相AI工具官网:【点击登录】
微软响应用户投诉,Bing AI图像生成器撤回升级回归旧版DALL-E模型
微软近日针对用户反馈,撤回了Bing AI图像生成器的最新DALL-E3模型升级,重新启用旧版模型。自12月18日升级以来,用户普遍反映新模型生成的图像质量下降,尤其是在细节表现和对提示的理解上。社交媒体和论坛上涌现了大量用户的不满声音。微软搜索部门负责人Jordi Ribas在推特上确认了这些问题,并宣布将恢复旧版DALL-E模型,以提升用户体验,尽管这一过程可能需数周。
升级后的Bing图像生成器在细节和质量上的缺陷,通过用户在OpenAI社区论坛上的对比图得到了直观展示。新模型在处理特定领域,如动漫角色服装材质时,表现不佳,引发了用户的严格审视。这些反馈表明,AI生成艺术品的品质不仅关乎技术,更关乎用户的情感体验,微软或需借鉴艺术家经验,更好地管理用户期望。
2024胡润榜单揭晓:寒武纪领衔中国人工智能企业50强,科大讯飞、商汤科技紧随其后
《2024胡润中国AI企业50强》新鲜出炉,AI芯片巨头寒武纪以2380亿估值领跑,位居第一。智能语音领军企业科大讯飞以1160亿估值位居次席,而机器视觉专家商汤科技以500亿估值排名第三。榜单显示,北京以20家企业成为AI企业最多的城市,上海和深圳分别有9家和8家企业上榜,广州则有4家。
榜单中,视觉识别企业占13席,自动驾驶类企业有11家,内容生成类企业8家,数据分析决策类7家,语音识别类6家,算力硬件类5家。胡润指出,这些企业分别代表了AI技术在“脑、眼、耳、手、腿”五大领域的应用。
寒武纪等代表“脑”,机器视觉公司如旷视科技等象征“眼”,科大讯飞等智能语音企业为“耳”,AIGC大模型公司如月之暗面等是“手”,而自动驾驶企业如滴滴自动驾驶等则是“腿”。值得注意的是,榜单仅涵盖非具身智能企业,且AI非核心业务的企业未被纳入评选。
更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html