知识图谱的评价指标?

bdqnwqk1年前基础18

一、Mean Rank

方法:

对于每个评测三元组(h,r,t),移去头部实体(迭代的方式替换尾部实体)、轮流替换成词表中的其他实体,构建错误的三元组实体({h}',r,t)。利用关系函数f_r(h,t)计算头部实体和尾部实体的相似度。对于这个相似度来讲,正确的三元组的值应该比较小,而错误样本的相似度值会比较大。用关系函数对所有的三元组(包括正确的三元组和错误的三元组)进行计算,并按照升序排序。并找出所有正确三元组在该排序中的排名位置做平均。对于一个好的知识图谱表示来说,正确三元组的得分(即头部实体和尾部实体的关系函数值)会小于错误三元组的得分,排名会比较靠前。所以可以用Mean Rank的方式衡量知识图谱表示向量的好坏。

二、hist@10

还是按照上述进行关系函数值进行排列,然后看每个评测三元组的正确三元组是否排在排名的前10,如果在前10的话就技术+1,最终hist@10=排在前10的数量/总数量

知识图谱与知识地图有什么区别?

关于知识地图和知识图谱这两个概念,我们一般都较为熟悉的是知识地图,这是一种描述知识之间在语法及业务约束等层面上关联关系的图模型,并作为主流知识管理系统的核心模块可通过有效支撑知识搜素、知识导航和知识推送等功能来辅助业务系统提升用户对服务的满意度。

而知识图谱的概念可以描述为“将显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系”。其通俗的含义可理解为在知识地图的基础上,对知识点及知识点间关系的动态演化过程进行数据挖掘,并将挖掘结果以符合业务组织的方式提供知识可视化服务。其中,较为著名的就是GoogleKnowledge Graph,作为一种搜素模式,在Google传统搜索列表右侧,添加了与搜索关键词相关的人物、地点和事物相关的事实,即“知识图谱”。相比传统搜索结果页这种搜索模式下的搜索页面,并不与Google用户进行搜索的关键词直接匹配,而是提供与词汇所描述的“实体”或概念匹 配的页面。

可见,所谓的知识图谱也是目前大数据发展大环境中的一项技术,在知识地图为企业建立起自身知识概览和物理结构关系的基础上,结合知识自身更新、企业对知识的管理、用户对知识的访问和使用等知识应用上下文和动态演化过程,创建并提取知识间逻辑关系的元数据,并在此基础上结合业务对元数据进行关联分析和校验,形成知识之间关系特征和规律,从而能够将隐藏在知识内部的、复杂的、抽象的语义以直观的可视化方式呈现给用户,为用户直观、方便获取、过滤、理解大规模数据、信息和知识提供了有效途径。

对此,我建议搭建知识管理的朋友,在建立基本的知识地图的基础上不要停步,要进一步结合系统业务思考知识图谱的搭建,这将是你的业务系统提升的一个方向。