国双知识智能平台:让知识真正成为力量

互联网
2022
08/11
14:06
分享
评论

英国的哲学家弗朗西斯·培根的名言“知识就是力量”大家耳熟能详。这句话告诉我们,当我们获得知识,再通过思考就能解决以前所不知道的很多问题。然而,随着数据量的爆炸性增长,如何从浩如烟海的各种知识中获得真正需要的成为一件非常困难的事情。同时,把已有的知识汇聚和保存起来也越来越困难。在此背景下,人们不得不借助各种工具。国双知识智能平台正是用来解决类似的问题。国双知识智能平台借助自然语言处理、知识图谱、深度学习等各种人工智能技术,大大提升了知识沉淀、搜索、应用的效率和效果,真正让知识成为企业向智能化转型的驱动力,以助力企业业务创新与发展。

知识获取难度不断攀升,大量隐形知识遗失

明知公司有相关数据和资料,但是却不知道到哪里去找?这是很多人常常面对的难题,越是大型企业这个问题就越突出。因此,为了找到需要的数据和资料,人们不得不花大量时间和精力。随着知识增长速度加快,知识密集领域工作强度、难度日益加大,业务创新越来越困难,知识获取难已成为重要的制约因素之一。这主要体现在以下几个方面:

第一, 收集、对比资料占用时间越来越多,工作繁重。众所周知,企业经过多年发展,通常会建立起多个系统,信息散布在这些系统中,要从中查询、比对非常费时。同时,日常工作需要用到的规范、指南等常年积累也成为工作中不可忽视的“耗时”任务。据全球知名学术出版集团爱思唯尔一份名为《科研的信任》的研究报告称,全球研究人员搜索期刊文献的时间几乎和他们阅读文献的时间一样多。研究人员每周搜索研究文献的时间超过4个小时,而阅读这些文献的时间则超过5个小时。随着时间的推移,查找文献的时间还在逐年增加。

第二, 特定领域的宝贵经验没有被推广、传承,难以复用,隐形知识遗失。当今企业员工流动性加快,随着员工离职和退休,特别是专家离任,很多经验没有传承下来。

第三, 不同项目、不同部门、不同业务线、不同成员之间的知识和经验没有共享和复用。新员工加入,学习成本高。

“我们很多知识智能平台的客户一个常见痛点是,很多资料分散在个人电脑和网盘里,没有归纳和总结,分享也很困难。” 国双知识图谱产品技术总监刘飞欧表示。

国双知识图谱产品技术总监刘飞欧

当下市场竞争日趋激烈,新成果、新技术出现频率明显加快。同时,各种规范、标准的更新也越来越频繁,这一切都进一步增加了信息量,增加了检索和利用的难度。

刘飞欧用“收集难、检索难、使用难”来形容当下知识工作者面临的挑战。为了应对这些挑战,有些企业也做了努力。比如,对现有系统进行集成,并基于此构建门户、搜索引擎,从而大大减少资料查找时间。然而,这种解决办法依然具有很大局限性:其一是不够智能,不能准确找到所需资料。一个典型例子就是如输入“苹果”,返回的结果很可能既有作为水果的苹果也有手机苹果,其无法理解使用者到底要找什么。其次,没有解决隐形知识的收集问题。第三,缺乏专门的工具,知识更新困难。

知识图谱等AI技术破解知识获取难题

人工智能的进步让人们看到了解决问题的希望,特别是知识图谱、自然语言处理等技术的成熟,可以帮助人们比较容易地实现数据知识化、结构化、标准化,并为后面的共享和复用打下基础。

知识图谱是Google于2012年提出的一种用图模型来描述知识的技术,用于表示世界万物的关联关系。它可以描述客观形态,如设备与设备、数据与数据之间的关联等;也可以表示客观事实,比如空气的成分中有氧气;还可以用来表示流程性逻辑,比如工作流程、实施步骤等。知识图谱可以沉淀显性知识,也可以通过知识编辑沉淀隐性知识。

“知识图谱是一种非常好的技术,一方面是可以很方便地让人们找到所需要的信息;另一方面是可以很容易地把知识汇集并很好地组织起来,通过这种方式让碎片化的知识沉淀下来。”刘飞欧表示。

当然,一个真正好用的知识智能平台不仅有知识图谱技术,还涉及其他人工智能技术。比如,国双知识智能平台就应用了包括NLP、知识图谱、机器学习、深度学习等在内的诸多人工智能技术,基于它们形成模型构建、数据标准、知识抽取、计算和应用的完整工具链,实现了从数据到知识、到应用、再到优化的全生命周期管理。

国双知识智能平台的构建最早开始于2017年左右,刚开始从司法领域起步,用于对司法文书和案例的汇集和整理,在此期间打磨出了自然语言处理的一些工具集,包括标注、抽取等,并形成了一个文书解析的平台。后来,这个平台经过了油气行业的锤炼,用以对生产数据(主要是数值数据)进行分析和处理,不久这个平台又经过了政府大数据项目的历练,对知识图谱的应用得到进一步完善。等到2021年,国双知识智能平台落地某勘探设计研究院进一步打磨,不管是平台本身还是周边的工具都已经趋于成熟。

国双知识智能平台的打磨过程中,其背后一支高水平的数据科学团队尤为值得一提。这个团队成员来自于清华大学、北京大学、哥本哈根大学等国内外重点高校,精通机器学习、深度学习、自然语言处理等人工智能技术,在数据挖掘及智能分析、知识图谱及智能应用构建等方面积累了丰富经验,他们先后研发出了600多项人工智能专利,为国双产品的技术领先性提供了可靠保障。

国双的人工智能技术也得到了行业的广泛认可。2018年,在由中国司法大数据研究院(最高人民法院智慧法院重点实验室)联合多方举办的 “中国法研杯”司法人工智能挑战赛上,国双荣获第一名,并于2019年被邀约为大赛评委。2019年12月,国双还荣获信通院知识图谱基础能力测评第一名。另外,国双还荣获2020年“中国智能科技最高奖”吴文俊人工智能科技进步奖。这些成绩也进一步证明了国双知识图谱、自然语言处理、深度学习等技术的领先性。

经过行业验证的国双知识智能平台

背靠国双数据科学团队的国双知识智能平台内置了7大类70多种算法,为业务创新和知识深度挖掘提供了充分支撑。一方面,平台提供一条面向业务人员的、完整的知识获取、构建、管理、运维工具链,使得知识沉淀更加高效、规范;同时,平台还提供一条完整的模型构建、训练、发布、管理工具链,加速知识从样本到规模化落地的进程。

“依托业务专家构建的知识图谱,无论是检索还是问答都能高效、优质地得到高度贴合业务需求的信息,满足检索需求。” 刘飞欧介绍到。

刘飞欧还谈到,国双知识智能平台的价值主要体现在以下几个方面:第一,结合知识图谱在知识汇聚方面的天然优势,利用国双知识智能平台,信息检索的效率提升10倍以上。其次,知识沉淀效率能得到百倍以上的提升。因为知识图谱能够便捷地沉淀各类隐形、显性知识,而国双知识智能平台拥有完整的图谱构建、模型构建工具链进一步加速了知识沉淀。另外,国双知识智能平台还改变了传统的知识构建与应用方式,可以形成知识的共筹共建。既能统一标准,又能满足个性化需求。

相对目前市场上类似的平台,国双上述的优势显得非常突出。刘飞欧表示,除了这些显性优势之外,国双知识智能平台的完整工具链和经过验证的产业落地能力是很多平台所不具备的。

比如,在工具链方面,从各种数据的标注、模型的训练和发布、知识的抽取和存储、再到知识的分析和应用,国双知识智能平台都有专门的辅助业务创新的算法和配套工具,从而能够深层次的挖掘知识价值。而在行业落地上,国双知识智能平台从一开始就是在用户需求驱动下和用户一起打磨出来的,凝结了大量行业专家知识,在场景适应能力上具有先天优势。尤其是通过在司法、油气、智慧能源、政府以及科研等领域的诸多项目落地验证,其价值已经得到充分认可。

实际上,懂行业、面向行业一直是国双对各条产业线的共同要求。刘飞欧介绍,在知识图谱构建过程中分为两条线,一条是与行业专家、领域专家对话,从理论到行业自上而下来进行规划;另一条是与信息专家对话,自下而上进行验证,这里的验证一个是基于事实的数据,另一个是基于上层的应用场景,看它后续要做哪些分析。两者结合进行才能构建出一个好用的知识图谱来。也正是基于这些前期的工作,使得国双知识智能平台目前已经在油气、智慧能源、司法、制造、政府、大交通等领域得到广泛应用,并得到用户高度认可。

对于国双知识智能平台的下一步发展,刘飞欧表示会从两个方面发力。在行业方面会进一步做实,并往周边行业渗透,争取3-5年拓展出四到五个新领域;在产品方面,会对人工智能理论和算法效率上持续研究和优化,同时,还要进行国产适配,支持“信创”。

“过去这些年大部分企业已经基本完成了数据资产化,目前已经进入数据知识化阶段,接下来将向知识决策化方向发展,并逐渐向细分领域渗透,国双知识智能平台拥有非常好的市场前景。我们现在要做的是,继续打磨产品,使之更好地满足客户,赋能客户数智化转型。”刘飞欧表示。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3