Meta与联合国教科文组织合作:推动AI语言技术发展
Meta 近期宣布与联合国教科文组织 (UNESCO) 展开合作,共同推出一项全新的语言技术伙伴计划。该计划的核心目标是收集各种语言的语音录音及相应的文字记录,以此推动未来开放且可用的人工智能 (AI) 技术的发展。尤其值得关注的是,该计划将重点关注那些在数字环境中经常被忽视的少数民族语言,力求打破语言壁垒。
根据 Meta 官方的介绍,该计划旨在吸引更多的合作伙伴加入,共同提供至少 10 小时以上的语音录音及其精准的转录内容,以及丰富的书面文本资源和翻译句子的集合。Meta 希望通过与合作伙伴的紧密协作,能够将这些珍贵的语言资源整合到其 AI 语音识别和翻译模型中,最终形成的成果将以开源的形式向社会公开,实现技术的共享与进步。
关注服务不足语言,提升智能系统理解能力
目前,已经确认的合作伙伴包括加拿大北部的努纳武特地区政府。该地区的居民部分使用一种名为因纽特语的语言。Meta 在其官方博客中强调:“我们的努力将特别聚焦于服务不足的语言,旨在全力支持联合国教科文组织的相关工作。我们最终的目标是创建更加智能的系统,使其能够理解并回应复杂的人类需求,不论其语言或文化背景如何。”
发布开源机器翻译基准,评估模型性能
为了更好地配合这一宏伟计划,Meta 还将同步发布一个开源的机器翻译基准。该基准的主要作用是评估各种语言翻译模型的性能表现。这个基准由专业的语言学家精心设计,目前支持七种不同的语言,并且可以通过 AI 开发平台 Hugging Face 进行访问和贡献,鼓励更多的开发者参与其中,共同提升翻译技术的水平。
慈善行动与技术升级并存
Meta 将这两项举措视为具有重要意义的慈善行动。但与此同时,公司也将从中受益,实现其语音识别和翻译模型的进一步升级。Meta 正在不断扩展其 AI 助手 Meta AI 所支持的语言种类数量,并积极测试诸如 Instagram Reels 中的语音翻译功能,该功能允许创作者对其语音进行便捷的配音和自动同步,极大地提升了内容创作的效率和传播范围。
应对内容审核挑战,提升翻译质量
尽管 Meta 在语言处理领域所做的努力值得肯定,但该公司在处理非英语内容方面也曾受到不少批评。有相关报告显示,Facebook 在处理意大利语和西班牙语的 COVID-19 虚假信息时,约有 70% 的内容未被及时标记,而英语内容的未标记比例仅为 29%。此外,泄露的文件还显示,阿拉伯语内容经常被错误地标记为仇恨言论。Meta 对此表示,公司正在积极采取有效措施,努力改善其翻译和内容审核技术,以更好地应对这些严峻的挑战,确保信息传播的准确性和公正性。
更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html