2.5.2 对比
目前,国际上已有若干数据挖掘软件产品问世。如IBM公司的Intelligent Miner for Data能够建立归类和预测模式,发现大型数据库中的联系和后续模式,自动将数据库分为相关记录组,在特定时间序列中发现类似的行为模式,还集成了数据处理、统计分析和结果显示工具,寻找包含于传统文件、数据库、数据仓库和数据中心中的隐含信息,帮助用户充分利用传统数据库或普通文件中的结构化数据,其采集算法已成功应用于客户及贸易伙伴中,满足市场分析、诈骗行为监测、客户联系管理等业务领域的需求。SPSS公司的软件Clementine对商务活动有着较深的了解,能找到解决商务问题的有效方法,其交互式的数据挖掘过程结合有价值的经验,可产生强有力的预测模型,它能使Web站点更聪明,以改善电子商务的利润率,更有利地吸引客户,交叉销售适当的产品给适当的客户以使销售额最大,保留最好的客户而不是把他们留给竞争对手,减少欺诈避免损失,识别风险以便更有效地服务。ANGOSS公司的软件KnowledgeSTUDIO是该公司最新数据挖掘应用程序,其特点是在可视化的容易使用的界面中采用多个数据挖掘模型,它是新一代数据挖掘软件,将先进的数据挖掘技术集成到共同的环境中去,以便企业能够从他们在数据中的投资中获得最大的利益,它包括决策树、聚类分析和几种预测模型的功能,以便用户从很多不同的方面挖掘并理解他们的数据,它还包括强大的数据可视化工具,支持和解释所发现的知识。
与以上这些现有的软件产品相比,ICCKDSS具有如下的优势:
1) ICCKDSS以KDTICM理论(见下3中所论)为依托,以探索知识发现系统的潜在规律为着眼点。它使用了全新的模型、算法和方法,而不是对现有的模型和方法的集成。
2) ICCKDSS采用了组合构件式的设计方式。各组件功能独立,可以针对具体问题单独使用;而且组件之间接口明确,可以集成在一起共同解决复杂问题,易于功能的扩展和构件的重用。
3) ICCKDSS适用面广(涵盖了结构化、半结构化和非结构化数据挖掘),较其它软件产品更为灵活、应用范围更广,目前已成功地应用于农业、现代远程教育网、气象及国际商务等领域。
4) ICCKDSS还具有知识库中的知识发现(Knowledge Discovery in Knowledge Base, KDK)功能,即“在固有与发现的知识中发现知识”,极大地拓宽了原有KDD的发现知识的渠道。
2.5.3 评价
针对ICCKDSS,教育部组织的重点科技项目鉴定意见为“该项成果是集理论、软件(功能)与应用于一体的创新性研究;系统整体上达到国际先进水平”(见附件 )。已获得3项国家发明专利(经国际权威机构评估其无形资产总计为221万美元);通过国家软件评测中心的鉴定测评(见附件 );多次通过实际运行。ICCKDSS于2003年5月被国家科技部批准为国家级科技成果重点推广计划项目(2003EC000001),并获资助(见附件 )。《科学时报》撰文称:“软件系统ICCKDSS在北京科技大学的诞生,宣告着中国在远程教育领域开始处于世界先进水平。”
3. 原创性技术理论体系KDTICM的构造
3.1 KDTICM总体架构
综合集成上述研究成果,于2002年构造了基于内在认知机理的知识发现理论KDTICM,对知识发现的第一大核心问题,即缺乏基础理论,系统地给出了答案。KDTICM是以3个基本原理(机制)为贯穿红线与理论支柱;由5个彼此相互联系的层面-------基础理论层、内在认知机理层、过程模型层、技术方法层、智能系统层构成的(如图22所示)。经近几年连续五次查新证实:基于内在认知机理的KDTICM“在国内外已公开发表的文献中未见与本研究方向相关的报道”(见附件 ); KDTICM的提出对于知识发现主流的发展和实用智能系统的发展,都起着重要的推动作用。
图22 KDTICM总体架构
KDTICM的提出对于知识发现主流发展中的若干挑战性问题,提供了一定的整体解决方案。如:1) 先验知识与背景知识如何耦合到知识发现过程中;2) 固有知识库的实时维护;3) 知识库与数据库的同步进化;4) 如何克服领域专家的局限性;5) 动态挖掘进程中,被发现规则的演化、评价与可理解性问题;6) 如何提高认知自主性;7) 如何产生限制性搜索与挖掘;8) 如何在知识库中发现新知识(KDK);9) 如何利用信息扩张原理解决不完全信息的挖掘;10) 在复杂类型数据挖掘中,如何进一步解决特征提取与空间降维等。
KDTICM的提出对于实用智能系统的发展起到重要的推动作用。如:1) 有效地解决长期难于解决的知识匮乏问题;2) 知识获取这一瓶颈问题得到改进;3) 将“基于信息”改变为“基于知识”,大大提高其性能;4) 智能决策支持系统在新的发展阶段,不仅针对内部网(局域网),而且针对外部网,大大扩展其信息源;5) 有效地解决动态知识库的不断深化与实时维护;6) 有效地解决多任务、多信息的融合与多方法的集成问题。
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] 下一页
|