知识库说明
1.知识库怎么建
知识库建设是知识管理实施中的一项重要内容,有效的知识库建设必须遵循以下的五个步骤。该步骤也可以用来分析和评估企业知识库建设的问题与解决方案。
第一步:确定要管理的知识。
在任何一个企业内部,都有各种各样的知识,而在知识管理的实践中,并非每类类型知识都需要去管理。所以在知识库建设的初期必须明确要管理的知识类型、其价值在何处,这样才不至于眉毛胡子一把抓,导致核心知识和外围知识都无法很好管理的状况出现。
第二步:确定知识的来源和动力。
人是知识的载体,也是知识产生、组织、利用、创新的源泉。在知识库建设中,必须明晰知识的来源:谁应该产生何种知识,他为什么要产生。如果不能结合组织内的每个岗位、流程去分析,那么就很难要求知识共享,在这种情况下即便产出了“知识”,就类似于案例中展示的知识的价值也不能保证。还有一个问题就是员工为什么要共享,这是知识管理的动力问题。
第三步:知识的组织。
如何将产生出来的知识进行整理、系统化、合理的分类和提供检索工具才能方便人们自如的获取?在工作中产生出来的知识我们经常称作“知识碎片”,大都是不系统、零散的,在知识的组织阶段也需要做“知识碎片”的系统化工作。在案例中,论坛产生的信息和“知识碎片”到底有多少可用性,是一个值得考虑的问题。在知识管理中心的咨询实践中,我们的方法是:对于社区、论坛等产出的“碎片”需要先进行第一步的处理,类似于BBS的精华区分类、整理,然后再经过知识的入库流程,加入审核、标准化的工作才能加入知识库。知识的分类在下面会详细的说明。
第四步:知识的利用。
知识本身没有价值,只有被利用的知识才能发挥作用。我们经常见到有许多“宏伟”的知识库,但是从来没有人去用。在案例中导致知识不能被充分利用的原因,除了知识本身是“知识碎片”外,还有一个重要的原因是这些知识根具体的业务是无关的、分离的、“两张皮”的,要解决这个问题需要在第二步做知识的产出分析的同时做知识的利用分析,从知识使用者的角度去分析他们的具体需求:为完成某个工作,需要哪些知识、这些知识该如何表达和传递。
第五步:知识的创新。
创新并不神秘,只有创新才能赢得持续的竞争优势,而所有的业务、管理、技术创新第一步都是先要有知识创新。在知识原料的基础上,根据需求做知识分析和推理。
2.知识库子系统的定义
知识的获得、利用和管理是知识库系统的三个方面,知识的获得就是取得新的知识信息并使其体系化。
知识获得也称为机器学习,知识的利用就是推理。所以知识库、推理机及存贮器是知识库系统的三个组成要素。
其中推理机构能模拟决策者的思维过程,并根据决策者的需求,通过提问会话与分析问题,应用有关规则引导决策者选择合适的模型。知识库系统也是一种软件系统,与通常的软件一样,需要像程序设计语言、编辑与编程序等系统开发支援环境,但知识库系统又与一般的科学计算和事务处理软件不一样,它是一种智能软件系统,所以需要人工智能领域所特有的支援环境,知识表示语言就是这种支援工具之一。
3.知识有什么特性
经过国内外学者的共同努力,目前已经有许多知识表示方法得到了深入的研究,目前使用较多的知识表示方法主要有:谓词逻辑表示法,产生式表示法、框架表示法、语义网络表示法、面向对象表示法、基于本体的知识表示法等。
本文将介绍这些知识表示方法的特征和优缺点,进行一些分析和比较。 (1)词逻辑表示法。
谓词逻辑表示法是指各种基于形式逻辑(ormalogic)知识表示方式,用逻辑公式描述对象、性质、状况和关系,例如“宇宙飞船在轨道上”可以描述成:(npaceshiporbit)它是人工智能领域中使用最早和最广泛的知识表示方法之一。其根本目的在于把数学中的逻辑论证符号化,能够采用数学演绎的方式,证明一个新语句是从哪些已知正确的语句推导出来的,那么也就能够断定这个新语句也是正确的。
在这种方法中,识库可以看成一组逻辑公式的集合,识库的修改是增加或删除逻辑公式。使用逻辑法表示知识,将以自然语言描述的知识通过引入谓词、函数来加以形式描述,得有关的逻辑公式,而以机器内部代码表示。
在逻辑法表示下可采用归结法或其它方法进行准确的推理。 谓词逻辑表示法建立在形式逻辑的基础上,有下列优点:①谓词逻辑表示法对如何由简单说明构造复杂事物的方法有明确、统一的规定,且有效地分离了知识和处理知识的程序,构清晰;②谓词逻辑与数据库,别是与关系数据库有密切的关系;一阶谓词逻辑具有完备的逻辑推理算法;逻辑推理可以保证知识库中新旧知识在逻辑上的一致性和演绎所得结论的正确性;逻辑推理作为一种形式推理方法,依赖于任何具体领域,具有较大的通用性。
但是,词逻辑表示法也存在着下列缺点:①难于表示过程和启发式知识;②由于缺乏组织原则,得知识库难于管理;③由于是弱证明过程,当事实的数目增大时,证明过程中可能产生组合爆炸;④表示的内容与推理过程的分离,理按形式逻辑进行,容所包含的大量信息被抛弃,样使得处理过程加长、工作效率低。 谓词逻辑适合表示事物的状态、属性、概念等事实性的知识,及事物间确定的因果关系,是不能表示不确定性的知识,及推理效率很低。
(2)生式规则表示法。产生式知识表示法是常用的知识表示方式之一。
它是依据人类大脑记忆模式中的各种知识之间的大量存在的因果关系,以“IFHEN”的形式,产生式规则表示出来的。这种形式的规则捕获了人类求解问题的行为特征,通过认识———行动的循环过程求解问题。
一个产生式系统由规则库、综合数据库和控制机构三个基本部分组成。 产生式规则表示法具有非常明显的优点:①自然性好,产生式表示法用“If-THEN”的形式表示知识,这种表示形式与人类的判断性知识基本一致,直观,自然,便于推理;②除了对系统的总体结构、各部分相互作用的方式及规则的表示形式有明确规定以外,对系统的其它实现细节都没有具体规定,这使设计者们在开发实用系统时具有较大灵活性,可以根据需要采用适当的实现技术,特别是可以把对求解问题有意义的各种启发式知识引入到系统中;③表示的格式固定,形式单一,规则间相互独立,整个过程只是前件匹配,后件动作。
匹配提供的信息只有成功与失败,匹配一般无递归,没有复杂的计算,所以系统容易建立;④由于规则库中的知识具有相同的格式,并且全局数据库可以被所有的规则访问,因此规则可以被统一处理;⑤模块性好,产生式规则是规则中最基本的知识单元,各规则之间只能通过全局数据库发生联系,不能互相调用,增加了规则的模块性,有利于对知识的增加、删除和修改;⑥产生式表示法既可以表示确定的知识单元,又可以表示不确定性知识;既有利于表示启发式知识,又可方便地表示过程性知识;既可表示领域知识,又可表示元知识。 但是,产生式规则表示法也存在着下列缺点:①推理效率低下:由于规则库中的知识都有统一格式,并且规则之间的联系必须以全局数据库为媒介,推理过程是一种反复进行的“匹配———冲突消除———执行”的过程。
而且在每个推理周期,都要不断地对全部规则的条件部分进行搜索和模式匹配,从原理上讲,这种做法必然会降低推理效率,而且随着规则数量的增加,效率低的缺点会越来越突出,甚至会出现组合爆炸问题。②不直观:数据库中存放的是一条条相互独立的规则,相互之间的关系很难通过直观的方式查看;③缺乏灵活性:产生式表示的知识有一定的格式,规则之间不能直接调用,因此较难表示那些具有结构关系或层次关系的知识,也不能提供灵活的解释。
产生式方法是目前专家系统首选的知识表示方式。用于化工工业测定分子结构的DENDRAL系统,用于诊断脑膜炎和血液病毒感染的MYCIN系统,以及用于估计矿藏的PROSPECTOR系统等,都是用这种方法进行知识表示和推理的例子。
(3)语义网络表示法。语义网络是知识表示中最重要的方法之一,是一种表达能力强而且灵活的知识表示方法。
语义网络利用节点和带标记的边构成的有向图描述事件、概念、状况、动作及客体之间的关系。带标记的有向图能十分自然的描述客体之间的关系。
语义网络由于其自然性而被广泛应用。采用语。
4.知识库的更新案例分析
以质量事故分析知识库的创建和更新为例,来说明知识库的更新升级。建立基于web的整个建筑行业质量事故分析和学习体系,将有利于汇集和保存业内的知识,并促进知识的交流共享。
具体的实现过程如下:
①发生质量安全事故的企业通过internet将事故相关信息上报,同时,在企业与企业、企业与质量监督机构、企业与监理之间形成一种横向的学习交流;
②经过工程事故快报系统的处理,进入质量安全事故原因分析和事故处理、跟踪阶段,这两个阶段是在业内各企业、机构和行业质量事故分析知识库的支持下完成;
③事故处理结束后是事故的总结和后评价阶段,其中包括对事故处理方法的评价、取得效果的评价等;
④事故后评价中提炼出的结论将按所设计的规则支持行业质量事故知识库的更新,完成知识库的升级;
⑤知识库建立的重要目的之一就是促进行业知识的共享,提高行业整体素质水平。
因此,基于web的建筑行业质量事故分析和学习体系将以知识库的知识反馈到每个企业、质检机构内进行学习为终点并作为下一次循环的开始,从而形成整个行业知识学习、更新、共享的良性循环。
5.知识库管理系统的介绍
知识库管理系统(Knowledge base management system),又称数字资产管理系统(digital asset management system,),主要是用来管理我们常用的一些知识文档、图纸、视频和音频等信息内容。