每日AI资讯-01月23日-AITOP100,AI资讯

美图MT Lab与北交大合作研发高效自然图像抠图技术，成果亮相AAAI 2025

美图影像研究院（MT Lab）携手北京交通大学，共同研发了一项创新的自然图像抠图技术——MEMatte，该技术已荣获2025年人工智能顶级会议AAAI的青睐。MEMatte技术以其内存高效的特点，大幅降低了高清图像抠图过程中的计算负担，使得在显存受限的环境中，如商用显卡和边缘设备，也能轻松实现精细抠图。

在图像处理技术飞速发展的今天，抠图技术在视频制作、VR和AR等多个领域扮演着重要角色。传统抠图方法的高计算需求限制了其在资源有限场景的应用，而MEMatte技术的出现打破了这一瓶颈，提升了处理效率同时保证了图像质量。

值得一提的是，研究团队还公开发布了UHR-395数据集，这是一个专为超高分辨率自然图像抠图设计的数据集。这一开源举措不仅为模型训练和评估提供了宝贵资源，也促进了技术的进一步发展。研究团队期待通过此举吸引更多研究者和开发者加入，共同推进图像抠图技术的进步。

美图MT Lab与北交大合作研发高效自然图像抠图技术，成果亮相AAAI 2025

智谱GLM-PC电脑智能体盛大开放体验，基于CogAgent的创新升级

2025年1月23日，引领行业潮流的智谱GLM-PC电脑智能体面向公众开放体验，这一基于CogAgent的多模态大模型引发了业界瞩目。GLM-PC能够模拟人类对计算机的“观察”与“操作”，助力用户高效处理电脑任务。

自去年11月29日内测以来，GLM-PC不断进化，最新推出的“深度思考”模式，加强了逻辑推理和代码生成能力，使其在处理复杂任务时更显卓越。同时，支持Windows系统，应用场景更加广泛。

GLM-PC的设计融合了模型能力提升与协作架构优化。它能够处理文字、图像、视频、音频等多种信号，具备逻辑思维、任务规划以及灵活的操作能力。模拟人类大脑的分工，GLM-PC将逻辑推理与感知认知完美结合，实现了功能性与创造性的平衡。

在实际应用中，GLM-PC的“左脑”负责逻辑推理，能够自动执行复杂任务，如商品信息提取和购物流程自动化。而“右脑”则专注于深度感知，精准识别界面元素，提升数据整理和信息提取效率。

GLM-PC的左右脑协作展现了其处理复杂任务和开放性问题的强大能力，为用户提供高效的解决方案。智谱正与PC厂商合作，推动AIPC的创新，旨在通过AI智能体为用户带来更智能的工作与生活体验。

》》》详情查看

智谱GLM-PC电脑智能体盛大开放体验，基于CogAgent的创新升级

字节跳动全力推进AGI研究：豆包大模型打造'Seed Edge'团队，追寻AI的未来

近日，字节跳动在人工智能领域的投入再加码，其旗下的豆包大模型团队内部成立了名为“Seed Edge”的先进通用智能（AGI）研究团队。该团队致力于探索AI领域的长远课题，展现了字节跳动在AI基础研究上的坚定战略意图。

“Seed Edge”团队已经明确了五个主要研究方向，涵盖了推理、感知能力的极限探索，以及下一代软硬一体化模型设计、AI学习范式和scaling方向的研究。这显示出字节跳动在AGI领域的布局已深入到基础理论和核心技术层面。

尽管AI预训练和基础研究的价值备受争议，字节跳动依然决定大力投入，提供强大算力资源，广纳研究精英，并营造长期研究氛围。去年5月，豆包大模型团队启动了“Top Seed人才计划”，吸引了全球顶尖博士毕业生。

成立以来，豆包大模型团队在ICLR、CVPR、NeurIPS等顶级会议上发表了57篇论文，成果包括下载量超百万的开源项目和GitHub上的热门项目。同时，团队与包括清华AIR、北大在内的近20所高校建立了合作关系。这些成就充分体现了字节跳动在AI基础研究领域的实力和远见。

字节跳动的举措表明，其志在不仅在应用AI领域有所作为，更致力于推动AI技术的根本性突破，为AGI的发展奠定坚实基础。

字节跳动全力推进AGI研究：豆包大模型打造'Seed Edge'团队，追寻AI的未来

OpenAI即将推出升级版GPT-3模型及首批AI智能体工具，提升交互体验

OpenAI的产品官Kevin Weil在1月22日宣布，公司计划在2月至3月期间推出更为先进的GPT-3模型。同时，OpenAI还准备在第一季度推出首批AI智能体工具，这将增强ChatGPT的实际应用能力，使其能在用户电脑上执行具体任务，例如帮助完成足球报名表的填写与提交。

这一消息激起了AI爱好者的极大兴趣。Weil指出，新版GPT-3模型不仅会在语言处理上有所提升，还将显著优化用户体验。ChatGPT将变得更智能、更高效，成为更出色的虚拟助手。

与此同时，Anthropic的CEO Dario Amodei在21日的访谈中预测，未来两到三年内可能出现超越人类智能的AI。Weil对此表示赞同，并暗示这一目标可能在2027年之前达成，这一预测引发了关于AI伦理和社会影响的广泛讨论。

OpenAI的新工具预计将改变人们与技术互动的方式，简化复杂操作。无论是为孩子报名活动还是专业人士处理日常工作，ChatGPT的智能体功能都将有效提升效率，减轻用户工作负担。

OpenAI的最新动向体现了其在推动AI技术进步方面的决心和潜力。随着新模型和工具的即将问世，未来的智能助手将更加贴合用户需求，成为日常生活和工作的重要辅助。

》》》详情查看

OpenAI即将推出升级版GPT-3模型及首批AI智能体工具，提升交互体验

ChatGPT每月排放260吨二氧化碳，AI技术对环境的影响引人关注

一项由KnownHost进行的最新研究揭示了人工智能工具ChatGPT的环境影响，其每月产生的二氧化碳排放量高达260吨，相当于260次纽约至伦敦航班的排放量。这一数据突出了AI技术在迅速发展的同时，对环境带来的巨大压力。

AI的广泛应用导致数据中心能源需求激增。根据伯克利实验室的研究，美国数据中心能源需求在2017年至2023年间增长了一倍多。国际能源署预测，未来数据中心和其他技术进步的能源消耗将再次翻倍。为此，美国政府正在寻求使用清洁能源运营数据中心的解决方案。

ChatGPT的日常耗电量超过50万千瓦时，相当于1.7万户美国家庭的日常用电。预计到2027年，AI行业每年的电力消耗将达到85至134太瓦时。特斯拉CEO埃隆·马斯克警告，电力短缺可能在未来两年内成为AI发展的主要限制因素。

AI的高能耗问题被视为行业的“肮脏秘密”。微软技术顾问莱斯利·麦莉指出，生成式AI的能耗超过了传统云服务。哈佛大学和UCLA的研究显示，自2018年以来，美国数据中心的碳排放量增加了三倍，占美国总排放量的2.18%，并消耗了大约4.59%的全国能源。

》》》工具地址

ChatGPT每月排放260吨二氧化碳，AI技术对环境的影响引人关注

阶跃星辰推出Step-Video V2视频生成模型，实现精准基础文字嵌入

2025年1月22日，上海阶跃星辰智能科技有限公司宣布推出Step-Video视频生成模型的升级版V2。这一新版模型在技术上取得重大进展，增强了视频生成的真实感。

Step-Video V2通过采用更高效的VAE模型和深度优化的DiT架构，提升了视频生成的效率和细节表现。结合强化学习算法和多模态理解大模型，V2版能够更精确地捕捉视频内容和镜头语言。在应用中，模型能够流畅展现复杂运动场景，并在人物表情捕捉上表现卓越。

新版模型的一个亮点是新增了基础文字生成功能，使得文字能够自然融入视频，提升了生成效果。Step-Video V2支持多种镜头语言，丰富了视频创作的多样性。

目前，Step-Video V2已在跃问网页端开放试用申请，为创作者带来了更先进的技术工具。这一升级不仅是阶跃星辰技术进步的体现，也预示着视频创作领域的新篇章。

》》》工具地址

阶跃星辰推出Step-Video V2视频生成模型，实现精准基础文字嵌入

抖音母公司布局新领域，注册系列'Aily'品牌商标

近日，北京字跳网络技术有限公司，抖音的母公司，已向知识产权部门提交了多个含有“Aily”字样的商标注册申请。这些商标包括“Aily”、“艾莉同学”和“飞书 Aily”，覆盖了科学仪器、网站服务、通讯服务等多个类别，目前正处于实质审查阶段。

成立于2018年的字跳网络，由李英担任法定代表人，注册资本达1亿美元，为抖音集团（香港）有限公司全资控股。该公司致力于开发智能应用，提供企业级的高效解决方案。

“Aily”作为飞书智能伙伴创建平台，是一款基于大语言模型（LLM）的企业级智能应用开发平台。它提供AI技能编排、知识数据处理、效果调优以及持续运营支持等服务，旨在助力企业通过人工智能技术提升工作效率和数据管理能力。商标注册动作预示着公司在智能应用领域的进一步扩张。

抖音母公司布局新领域，注册系列'Aily'品牌商标

更多AI行业最新资讯新闻信息请关注AI 人工智能网站--AITOP100平台--AI资讯专区：https://www.aitop100.cn/infomation/index.html