知识图谱属于自然语言处理么?
不属于。知识图谱是在NLP的基础上发展而来的。它的核心是知识库。
一般来讲,知识图谱主要目标是用来描述真实世界中存在的各种实体和概念,以及他们之间的关系,通过这种关系来描述实体之间的关联。目前,知识图谱在自然语言处理领域有两大类的应用:1)搜索和问答领域。2)自然语言理解类的场景,比如在具体的机器翻译领域,句法分析相关的工作。
知识库和知识图谱区别?
知识库和知识图谱区别:知识图谱本质上是一种语义网络。其结点代表实体;知识库是知识工程中重中之重结构化,易操作,易利用,全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。
知识图谱为什么可表示大数据?
我们迎来了大数据时代,大数据具有规模性、多样性、快速性和真实性等特点。大数据正在改变我们的生活、工作和思考方式。在这样的背景下,大数据对智能服务的需求已经从单纯的搜集获取信息,转变为自动化的知识提供服务,这也给知识工程提出了很多挑战性的问题。我们梳理了
1.知识工程的42年发展历程,总结知识工程的演进过程、技术进展以及为机器智能所做的贡献
第一阶段从1950-1970年代的图灵测试;第二阶段,1970-1990年代的专家系统;第三阶段1990-2000年代的Web1.0万维网;第四阶段,2000-2006年代 Web2.0 群体智能;第五阶段,2006年至今的知识图谱。2006以后,对维基百科进行结构化,例如DBpedia、YAGO和Freebase等。Google的知识图谱(knowledge graph)就是收购了Freebase之后产生的大规模知识图谱。除了通用的大规模知识图谱,各行各业也在建立行业和领域的知识图谱和广泛应用,包括语义搜索、问答系统与聊天、大数据语义分析以及智能知识服务等,更多知识图谱的创新应用还有待开发。
2.知识工程与大数据机器学习的结合
随着信息技术进步和大数据时代的到来,大数据机器学习也得到快速发展,已经成功应用于语音识别、图像识别和机器翻译等。目前的大数据机器学习能够给予一些决策支持,但用户不会满足于只给推荐结果,用户希望的习得的模型解释给出的模型为何成功何时成功等。这就是可解释的人工智能,这就需要与人的认知进行结合。比如机器自动识别出一张图片中的物体是猫,它还需要告诉我们为什么判断为猫,如应为猫有毛、有胡须有爪子等毛的特征,也就是告诉人们机器做决策的依据是什么。由此可见,大数据深度学习学到的是事物底层特征空间,人能理解的对应的是事物语义空间,这当中存在语义鸿沟,而知识图谱可以用来弥合这个鸿沟。在大数据环境下,我们可以采用自动或者半自动方法利用大数据机器学习方法从大数据中获得知识,由此建立大数据环境下智能系统。
3.大数据环境下知识图谱的研究和挑战
当前知识驱动和数据驱动的人工智能方法,以符号表示为代表的知识驱动方法表示的知识明确、可以举一反三、进行解释和推理。而大数据深度学习为代表的数据驱动方法可以进行感知和记忆,进行关联计算,但是难以解释其推理计算过程。因此两种方法的融合为我们研究基于知识的智能技术提供了契机。
同时,两种方法的融合也带来许多挑战性问题。下面从组成知识工程生命周期的知识建模、知识获取、知识存储和计算、以及知识重用的四个阶段看每个阶段所面临的挑战。
①知识表示方面,主要是研究大数据知识表示的理论与方法,使知识既具有显式的语义定义,又便于大数据环境下的知识计算与推理。②知识获取与融合方面,主要研究知识获取和语义关联技术。目前符号表示的知识是稀疏的,如何在知识稀疏和大数据环境下研究知识引导的知识获取方,获得大规模和高精度的知识是我们面临的挑战。
③知识计算和推理方面,当前基于符号的推理虽然有一些很好的推理工具,但是大规模知识推理效率还很受约束。深度学习或概率的推理方法方便计算但是难以解释。大数据环境下知识计算和推理需要研究深度学习和逻辑规则相结合的知识推理和演化方法,以提升新知识发现的能力。
④知识工程的最终目标是实现知识驱动的个性化智能服务。以知识图谱关联和分析用户行为,通过情景感知分析用户需求,以提供不同形式的个性化服务如知识导航、语义搜索和问答等。知识工程发展趋势可以归纳为四个方面。