美图MT Lab与北交大合作研发高效自然图像抠图技术,成果亮相AAAI 2025
美图影像研究院(MT Lab)携手北京交通大学,共同研发了一项创新的自然图像抠图技术——MEMatte,该技术已荣获2025年人工智能顶级会议AAAI的青睐。MEMatte技术以其内存高效的特点,大幅降低了高清图像抠图过程中的计算负担,使得在显存受限的环境中,如商用显卡和边缘设备,也能轻松实现精细抠图。
在图像处理技术飞速发展的今天,抠图技术在视频制作、VR和AR等多个领域扮演着重要角色。传统抠图方法的高计算需求限制了其在资源有限场景的应用,而MEMatte技术的出现打破了这一瓶颈,提升了处理效率同时保证了图像质量。
值得一提的是,研究团队还公开发布了UHR-395数据集,这是一个专为超高分辨率自然图像抠图设计的数据集。这一开源举措不仅为模型训练和评估提供了宝贵资源,也促进了技术的进一步发展。研究团队期待通过此举吸引更多研究者和开发者加入,共同推进图像抠图技术的进步。
智谱GLM-PC电脑智能体盛大开放体验,基于CogAgent的创新升级
2025年1月23日,引领行业潮流的智谱GLM-PC电脑智能体面向公众开放体验,这一基于CogAgent的多模态大模型引发了业界瞩目。GLM-PC能够模拟人类对计算机的“观察”与“操作”,助力用户高效处理电脑任务。
自去年11月29日内测以来,GLM-PC不断进化,最新推出的“深度思考”模式,加强了逻辑推理和代码生成能力,使其在处理复杂任务时更显卓越。同时,支持Windows系统,应用场景更加广泛。
GLM-PC的设计融合了模型能力提升与协作架构优化。它能够处理文字、图像、视频、音频等多种信号,具备逻辑思维、任务规划以及灵活的操作能力。模拟人类大脑的分工,GLM-PC将逻辑推理与感知认知完美结合,实现了功能性与创造性的平衡。
在实际应用中,GLM-PC的“左脑”负责逻辑推理,能够自动执行复杂任务,如商品信息提取和购物流程自动化。而“右脑”则专注于深度感知,精准识别界面元素,提升数据整理和信息提取效率。
GLM-PC的左右脑协作展现了其处理复杂任务和开放性问题的强大能力,为用户提供高效的解决方案。智谱正与PC厂商合作,推动AIPC的创新,旨在通过AI智能体为用户带来更智能的工作与生活体验。
》》》详情查看
字节跳动全力推进AGI研究:豆包大模型打造'Seed Edge'团队,追寻AI的未来
近日,字节跳动在人工智能领域的投入再加码,其旗下的豆包大模型团队内部成立了名为“Seed Edge”的先进通用智能(AGI)研究团队。该团队致力于探索AI领域的长远课题,展现了字节跳动在AI基础研究上的坚定战略意图。
“Seed Edge”团队已经明确了五个主要研究方向,涵盖了推理、感知能力的极限探索,以及下一代软硬一体化模型设计、AI学习范式和scaling方向的研究。这显示出字节跳动在AGI领域的布局已深入到基础理论和核心技术层面。
尽管AI预训练和基础研究的价值备受争议,字节跳动依然决定大力投入,提供强大算力资源,广纳研究精英,并营造长期研究氛围。去年5月,豆包大模型团队启动了“Top Seed人才计划”,吸引了全球顶尖博士毕业生。
成立以来,豆包大模型团队在ICLR、CVPR、NeurIPS等顶级会议上发表了57篇论文,成果包括下载量超百万的开源项目和GitHub上的热门项目。同时,团队与包括清华AIR、北大在内的近20所高校建立了合作关系。这些成就充分体现了字节跳动在AI基础研究领域的实力和远见。
字节跳动的举措表明,其志在不仅在应用AI领域有所作为,更致力于推动AI技术的根本性突破,为AGI的发展奠定坚实基础。
OpenAI即将推出升级版GPT-3模型及首批AI智能体工具,提升交互体验
OpenAI的产品官Kevin Weil在1月22日宣布,公司计划在2月至3月期间推出更为先进的GPT-3模型。同时,OpenAI还准备在第一季度推出首批AI智能体工具,这将增强ChatGPT的实际应用能力,使其能在用户电脑上执行具体任务,例如帮助完成足球报名表的填写与提交。
这一消息激起了AI爱好者的极大兴趣。Weil指出,新版GPT-3模型不仅会在语言处理上有所提升,还将显著优化用户体验。ChatGPT将变得更智能、更高效,成为更出色的虚拟助手。
与此同时,Anthropic的CEO Dario Amodei在21日的访谈中预测,未来两到三年内可能出现超越人类智能的AI。Weil对此表示赞同,并暗示这一目标可能在2027年之前达成,这一预测引发了关于AI伦理和社会影响的广泛讨论。
OpenAI的新工具预计将改变人们与技术互动的方式,简化复杂操作。无论是为孩子报名活动还是专业人士处理日常工作,ChatGPT的智能体功能都将有效提升效率,减轻用户工作负担。
OpenAI的最新动向体现了其在推动AI技术进步方面的决心和潜力。随着新模型和工具的即将问世,未来的智能助手将更加贴合用户需求,成为日常生活和工作的重要辅助。
》》》详情查看
ChatGPT每月排放260吨二氧化碳,AI技术对环境的影响引人关注
一项由KnownHost进行的最新研究揭示了人工智能工具ChatGPT的环境影响,其每月产生的二氧化碳排放量高达260吨,相当于260次纽约至伦敦航班的排放量。这一数据突出了AI技术在迅速发展的同时,对环境带来的巨大压力。
AI的广泛应用导致数据中心能源需求激增。根据伯克利实验室的研究,美国数据中心能源需求在2017年至2023年间增长了一倍多。国际能源署预测,未来数据中心和其他技术进步的能源消耗将再次翻倍。为此,美国政府正在寻求使用清洁能源运营数据中心的解决方案。
ChatGPT的日常耗电量超过50万千瓦时,相当于1.7万户美国家庭的日常用电。预计到2027年,AI行业每年的电力消耗将达到85至134太瓦时。特斯拉CEO埃隆·马斯克警告,电力短缺可能在未来两年内成为AI发展的主要限制因素。
AI的高能耗问题被视为行业的“肮脏秘密”。微软技术顾问莱斯利·麦莉指出,生成式AI的能耗超过了传统云服务。哈佛大学和UCLA的研究显示,自2018年以来,美国数据中心的碳排放量增加了三倍,占美国总排放量的2.18%,并消耗了大约4.59%的全国能源。
》》》工具地址
阶跃星辰推出Step-Video V2视频生成模型,实现精准基础文字嵌入
2025年1月22日,上海阶跃星辰智能科技有限公司宣布推出Step-Video视频生成模型的升级版V2。这一新版模型在技术上取得重大进展,增强了视频生成的真实感。
Step-Video V2通过采用更高效的VAE模型和深度优化的DiT架构,提升了视频生成的效率和细节表现。结合强化学习算法和多模态理解大模型,V2版能够更精确地捕捉视频内容和镜头语言。在应用中,模型能够流畅展现复杂运动场景,并在人物表情捕捉上表现卓越。
新版模型的一个亮点是新增了基础文字生成功能,使得文字能够自然融入视频,提升了生成效果。Step-Video V2支持多种镜头语言,丰富了视频创作的多样性。
目前,Step-Video V2已在跃问网页端开放试用申请,为创作者带来了更先进的技术工具。这一升级不仅是阶跃星辰技术进步的体现,也预示着视频创作领域的新篇章。
》》》工具地址
抖音母公司布局新领域,注册系列'Aily'品牌商标
近日,北京字跳网络技术有限公司,抖音的母公司,已向知识产权部门提交了多个含有“Aily”字样的商标注册申请。这些商标包括“Aily”、“艾莉同学”和“飞书 Aily”,覆盖了科学仪器、网站服务、通讯服务等多个类别,目前正处于实质审查阶段。
成立于2018年的字跳网络,由李英担任法定代表人,注册资本达1亿美元,为抖音集团(香港)有限公司全资控股。该公司致力于开发智能应用,提供企业级的高效解决方案。
“Aily”作为飞书智能伙伴创建平台,是一款基于大语言模型(LLM)的企业级智能应用开发平台。它提供AI技能编排、知识数据处理、效果调优以及持续运营支持等服务,旨在助力企业通过人工智能技术提升工作效率和数据管理能力。商标注册动作预示着公司在智能应用领域的进一步扩张。
更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html