CORC  > 兰州理工大学  > 兰州理工大学
题名基于入侵杂草算法的数据挖掘聚类算法研究
作者周金虎
答辩日期2014
导师赵小强
关键词数据挖掘 入侵杂草算法 模糊C-均值聚类 混沌 差分进化 扩散映射 TE过程 可能性模糊聚类 核可能性模糊聚类
学位名称硕士
英文摘要随着计算机技术和信息技术的迅猛发展,人们的生活沉浸在了数据和信息的海洋,人类社会已步入数字时代。人们需要丰富的数据和信息引导社会活动和方便生活,尤其在商业领域、企业生产过程和诸多工程领域等要以大量的数据信息为基础,获取商业利润的决策信息,实现工业生产的在线监控、辨识、诊断,以及完成控制策略的构思。因此,数据挖掘的概念应运而生,它作为一种能够有效地从海量数据信息中挖掘潜在的有用的价值信息的技术手段,得到了诸多科研人员关注和许多工程领域的应用。入侵杂草算法(IWO)是一种能够有效模仿野草繁殖、生长、竞争过程的仿生学优化算法。由于其鲁棒性好、寻优能力强、收敛速度快、结构简单、易于实现,在许多优化问题上优于其他智能优化算法,受到了学术界的广泛关注。聚类算法作为数据挖掘的一种有效手段,成为了数据挖掘领域的热门工具,模糊C均值聚类算法(FCM)是软划分的一种方法,对样本类属没有确定的描述,符合人类认识事物的规律,已被广泛应用到各种工程和科学领域,但仍存在一些不足。本文主要围绕FCM算法展开分析与研究,主要研究内容包括如下:1.针对FCM算法对初始聚类中心敏感,容易局部收敛的问题,提出了一种基于IWO的模糊聚类数据挖掘算法(IWO-FCM),该方法引入IWO算法寻找最优初始解,保证了对解空问的全面搜索,然后再进行聚类分析,有效克服了FCM算法的缺陷,试验通过与使用遗传算法、粒子群算法分别优化FCM算法的结果对比,验证了IWO-FCM算法比FCM算法、GFCM算法、PSO-FCM算法的聚类效果更好。2.基于入侵杂草算法的FCM算法(IWO-FCM)比FCM算法全局寻优能力强,聚类精度高,但对高维和复杂数据集测试时,存在收敛变慢,精度不高的问题,因此提出了一种改进的IWO-FCM算法。该算法利用混沌序列初始化IWO-FCM算法的杂草初始种群,提高初始解(种子)的质量,将差分进化算法的交叉、变异和部分选择操作应用在IWO-FCM算法的空间分布和选择过程中,保持杂草群多样性,增强算法全局寻优能力。在多个高维数据集上进行测试,仿真结果表明该算法比FCM算法和IWO-FCM收敛速度更快,寻优精度更高。3.针对实际化工过程数据具有高维、非线性等特征而难以进行聚类分析的问题,提出基于扩散映射的IWO-FCM算法。该算法先利用扩散映射提取高维数据的低维流形特征,整合数据的局部特征使原始数据的几何信息得以保留,然后用IWO-FCM算法对低维流形数据进行聚类分析。试验通过对TE过程多个故障数据集进行测试,与使用基于扩散映射的FCM算法的结果相比,本文所提算法具有较强的稳定性和鲁棒性,比基于扩散映射的FCM算法具有更强的寻优能力和更好敛效果,聚类效果明显改善,能够快速有效地识别故障特征,验证了其有效性和优越性。4.针对FCM对噪声点和离群数据较为敏感,可能性模糊聚类算法(PFCM)较好地克服了这一缺点,当带噪声的数据集极不均衡时,PFCM算法存在对初始聚类中心敏感,聚类效果不好等问题。本文提出了改进的核可能性模糊聚类算法(IKPFCM),该算法在核可能性模糊聚类(KPFCM)的基础上使用IWO算法寻找最优解作为KPFCM算法的初始聚类中心,提高算法的鲁棒性和寻优能力,同时引入样本方差简化目标函数的参数,进一步增强聚类算法的有效性,将改进后的算法用于数据聚类。从UCI数据集和人造数据集上的测试结果表明,该算法的抗噪声能力更强,聚类精度更高,收敛速度更快。
语种中文
页码58
URL标识查看原文
内容类型学位论文
源URL[http://ir.lut.edu.cn/handle/2XXMBERH/90850]  
专题兰州理工大学
作者单位兰州理工大学
推荐引用方式
GB/T 7714
周金虎. 基于入侵杂草算法的数据挖掘聚类算法研究[D]. 2014.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace