2025年7月11日,腾讯AI向善语料库开放发布会在北京举行,这次发布会的主题是“AI时代没有旁观席,AI普惠一个不能少”。发布会上,腾讯与百余家社会组织公益共创的AI向善语料库(老年文本库)正式面向公益组织和非营利性研究机构开放申请,这是国内外首个通过社会公益共创构建,又面向公益组织开放的老年语料库,在一定程度上开创了公共语料库构建与开放的新范式。
尽管人工智能技术的迅猛发展使产业效能得到了很大的提升,但也有一个迫切的社会议题逐渐浮现:AI如何才能为更多普通人提供实实在在的帮助和赋能?众所周知,高质量的语料在AI训练和产品创新中扮演着至关重要的角色,然而与老年人、残障朋友、留守儿童等社会困弱群体相关的语料却非常少,如此一来,为他们服务的AI产品就不容易做好。长此以往,“弱者恒弱”在AI时代下愈加显著,本就隐形、边缘的社会困弱群体,在AI时代下难以享受到平等的科技赋能。
社会共创+公益共享,打造中文公共语料库新范式
2024年8月始,腾讯与数百家专业的社会组织共同发起了一项名叫“AI向善语料库”的社会共创计划,通过公益共创合力打造了一个面向社会困弱群体的专家级问答语料库。腾讯可持续社会价值创新事业部负责人陈菊红女士在连线发布会现场时指出,AI时代下如果人类不在前期做更多的事情,就可能造成“弱者恒弱”的局面,通过公益共创的方式与社会各界一起构建面向社会困弱人群的AI训练语料库是一个不错的尝试。AI向善语料库在推进中有一句被公益组织口口相传的“口号”——“先共创,再共享,先爱,再AI”,诠释了这一行动在中文公共语料库构建上的路径——通过公共协作,回归公益初心,将一线专家们的“人文关怀”收录到“AI向善语料库”中,再应用在公益事业上,助力更多服务这些社会困弱人群的公益组织提升AI能力。
积极应对老龄化,为AI养老免费提供“第一桶金”
人口老龄化是社会发展的重要趋势,是人类文明进步的重要体现,也是我国今后较长一个时期的基本国情。预计到2035年左右,我国60岁及以上老年人口将突破4亿人,占比超过30%,进入重度老龄化阶段。养老服务业既是涉及亿万群众福祉的民生事业,也是具有巨大发展潜力的朝阳产业,然而,许许多多养老福利领域的公益组织,虽然也想探索科技创新,但是苦于没有数据资源,也没有孵化AI助手的经验。腾讯AI向善语料库的首个主题正是聚焦于此,本次开放申请的语料库主题是老年人日常生活,包含8047组老年人日常生活常见问题的问答对,含有健康、心理、关系等多个方面,公益组织与非营利性研究机构不仅可免费申请全量数据,还可依托腾讯益仔平台得到一站式AI服务。腾讯集团高级副总裁郭凯天先生与发布会现场视频连线时也提出了期待,他希望未来能在老年人真实的生活场景中把AI向善语料库用起来,推动涌现出更多帮助社会困弱人群的AI产品和服务。
没有全能的AI训练语料库,但有无限的AI向善未来
本次发布会上,清华大学未来实验室的何丽雯女士代表实验室研究团队对AI向善语料库进行了使用方法的介绍,并进行了专业系统的评估,她指出,搭载了AI向善语料库后,大模型并非在所有维度上都得到了显著提升,但是在对老年人情感支持和文化适应性方面有了明显的提升。腾讯SSV产品经理周滢垭和复旦大学老龄研究院申琦教授分别介绍了公益组织和研究机构申请AI向善语料库的流程。北京邮电大学张为威老师和AI4GOOD公益产品经理孙心怡,分别作为AI向善语料库的学者使用方、公益机构使用方,介绍了自己的使用经验和AI作品。
本次AI向善语料库开放发布会不仅是AI训练公共语料素材的展示与讨论,更是一场关于科技向善、AI普惠的探索实验,它汇聚了产学研各界力量,共同讨论如何为技术注入人情味,让科技发展的红利惠及每一位社会成员,真正实现“AI普惠一个不能少”的愿景。