> 硕士毕业论文 > 79200字硕士毕业论文复杂工业过程中数据挖掘方法的深入研究

79200字硕士毕业论文复杂工业过程中数据挖掘方法的深入研究

论文类型:硕士毕业论文
论文字数:79200字
论点:数据挖掘,工业,过程
论文概述:

摘要 数据分析方法是数据挖掘的基础任务。数据分析方法是数据挖掘中科学研究的基础,许多数据挖掘方法都是建立十不同的数据收集和分析方法基础上。相关向量机机器学习方法

论文正文:

复杂工业过程中数据挖掘方法的深入研究

简介:数据挖掘作为一门跨学科的技术,融合了统计学、数据库技术、人工智能、机器学习、可视化技术等多门学科,很难严格区分它与这些众多学科的区别。它是由本网站的硕士论文中心组织的。

第一章引言
新需求推动新技术的诞生和发展。随着信息科学数据库技术应用规模、范围和深度的不断扩大,海量数据已经成为现实。然而,这些数据中很少有对人们有直接意义的数据(知识)。人们逐渐希望能够对这些数据进行深层挖掘和提取,发现隐藏的规则,并为人们提供更高级别的数据分析功能。工业系统所处的环境复杂多变,尤其是在复杂的工业过程中。一般来说,控制的难点是使用知识或智能控制方法。获取知识或规则尤其重要。为了优化复杂工业过程的运行,本文研究了一种新的数据挖掘方法及其在复杂工业过程控制中的应用。

1.1复杂工业过程及其控制[/BR/]复杂工业过程和技术对复杂工业过程逐渐要求越来越高的控制技术。首先,新技术需要相应的先进控制方法与之相结合。其次,新的控制方法可以在原有工艺的基础上进行技术改造,不需要增加大量设备,模糊神经网络可以达到提高生产能力、降低各种消耗的目的。复杂工业过程控制技术的任何改进都会带来可观的经济和社会效益。因此,许多研究者试图寻找各种新的理论和技术来有效地控制复杂的工业过程。
随着社会科学技术的逐步进步,市场竞争在现实中加剧了。社会过度消费和对自然资源的依赖;它使人们更加关注生活环境。将流程工业发展成为一个大规模、综合性的复杂工业。因此,许多工业系统的结构和功能变得越来越复杂。如化工、冶金、钢铁、石油等加工行业也在不断扩大生产规模和品种。实际上,他们遇到了大量的技术和管理问题。过程工业系统显示出复杂工业过程不同于简单过程控制的新特征。有色金属冶炼和吹炼过程是一个非常常见的复杂工业过程,如铜琉球吹炼过程。
复杂工业过程控制有许多新特点:复杂的系统结构、多样的数据形式、庞大复杂的系统规模和众多的优化目标。复杂工业过程中明显的工业特征需要新的思路和方法来解决这些问题。计算机技术的快速发展为解决复杂的工业控制过程提供了强有力的工具。
在国民经济和人民生活中,复杂工业过程控制系统所在的大多数行业都占据着重要地位,如化工、石油、电力、有色冶金、钢铁等行业。这些支柱产业往往代表一个国家的技术水平;同时,这些核心产业的技术进步会影响许多方面,如节能、自然资源利用率、自然环境破坏等。因此,各国投入了大量的人力和物力来研究和开发复杂工业过程控制技术[} 2}
复杂工业过程系统具有明显的行业特征。复杂的工业过程控制通常适用于十种复杂和恶劣的环境以及危险的工厂环境。一般来说,生产中断会造成很大的损失,因为}fn对抗干扰、可靠性和可用性有较高的要求,与其他十种自动控制系统明显不同。
工业过程控制的自动化是复杂工业过程控制的目标。在DL/T701-1999《火力发电厂热工自动化术语标准》中,过程自动化被简单地定义为通过使用检测和控制系统而不是人工直接操作的生产过程的生产操作。自从瓦特首次利用自动控制技术成功地控制了蒸汽机的速度,给人类带来了一场工业革命以来,自动控制技术和自动控制理论一直主导着工业过程控制的发展进程[f2,3]。
控制方法和策略是复杂工业自动化过程控制的灵魂。自20世纪末以来,自动控制理论和方法的主要发展和研究方向是人工智能机器技术的应用和普及。过程自动化控制方法是从传统的经典控制(包括PID控制、串级控制、比例控制、前馈控制等)发展而来的。)到最优控制、自学习控制、自适应和自校正控制、非线性控制、多级递阶智能控制、专家控制、模糊逻辑控制、仿人智能控制、神经网络控制、基于10-模式识别的智能控制、基于多模式变结构的智能控制、混沌控制、鲁棒控制和基于10-扩展逻辑的智能控制等。可以大大提高特定领域的过程控制效果,产生经济效益。在经济全球化的浪潮中,随着市场竞争的进一步加剧和资源的短缺,先进的控制策略和技术将得到更广泛的应用和发展。形成有效控制系统的最佳途径是确定控制目标,综合运用各种先进的控制方法。
计算机技术的普及和应用为复杂工业过程控制的发展提供了强有力的工具。工业调节控制装置或系统是过程自动化的中心。它的发展从早期的基础调节器开始,经历了从气动和电动单一仪表组合到计算机直接数字控制系统(DDC)的发展。迄今为止,可编程控制器、分布式控制系统、工业以太网和现场总线控制系统得到了广泛的应用。随后开发的现场总线控制系统具有系统功能更强大、互操作性和功能分散、安装和配置简单、工程和运行维护成本更低、规模灵活性更高、测控精度更高等优点。它具有很强的实际应用能力。
1.2数据挖掘的提议和发展
数据挖掘是一种从十大业务信息处理中提取知识的方法。这是一个跨学科研究形成的研究领域。事实上,它是一种新的商业信息处理技术。为了满足人们日益增长的需求,数据处理将从低级的在线查询操作中进行。它被改进为高级操作,如分析和预测、规则挖掘和聚类,隐藏在数据集中的潜在知识规则从}fn中挖掘。这些知识规则可以用来有效地指导高级业务活动的过程。
数据挖掘是一门新技术、新学科,其理论来源有很多方面。目前,数据挖掘还没有统一的定义。数据挖掘的理论定义非常模糊。许多定义取决于十个定义者的观点和背景。一些文献给出了数据挖掘(DM)的不同定义,这里介绍了不同学者给出的数据挖掘的不同定义:
法耶兹:
定义1-1数据挖掘(Definition 1-1 Data mining)是一个不平凡的过程,它决定了数据中有效的、新颖的和可能有用的模式,最终可以被理解。
强调,开采的模式很新颖,可以理解。非平凡意味着在数据集中不一定是封闭的,但可以是图形、树或其他形式。
泽库林给出的定义是:
定义1-2数据挖掘是从大型数据库中提取以前未知的、可理解的和可执行的信息,并利用它做出关键业务决策的过程。
强调挖掘的模式是未知的、可理解的和可执行的。
Ferruzza将1-3数据挖掘定义为在知识发现过程中识别10个数据中未知关系和模式的一些方法。
强调数据挖掘是模式识别。
乔恩给出的定义是:定义1-4数据挖掘是在数据中发现有益模式的过程,强调数据挖掘是对有趣模式的识别。
parsaye给出了如下定义:定义1-5数据挖掘是我们为那些未知信息模式研究的大型数据集之一。决策支持过程强调数据挖掘是对未知模式的识别,这与定义1-3相同。
梅塔给出了以下定义:
定义1-6数据挖掘是决策树、神经网络、规则推理、最近邻法和遗传算法。
这个定义主要强调数据挖掘是模式识别算法的集合。
今天,随着信息技术的飞速发展,数据爆炸一词已经广为流传。从海量数据中提取“有用知识”的概念一出现,就受到了社会各界的高度重视。数据挖掘技术可以在零售、物流、医疗、认证、银行、互联网、银行、信息、资源探索、企业管理、自动控制,甚至美国的篮球运动员训练和比赛,以及文学作品的风格识别中找到。总体而言,数据挖掘发展迅速。
新需求推动新发明,需求是发明的推动力。随着计算机的普及和数据库技术的成熟,获取和存储数据不再困难。数据量正以惊人的速度增长。人们迫切需要将这些数据转化为有用的知识。然而,现有技术无法解决这些问题。因此,计算机软硬件的发展和需求使得数据挖掘技术应运而生。数据挖掘作为一门跨学科的技术,融合了统计学、数据库技术、人工智能、机器学习、可视化技术等多门学科,使得它很难与众多学科严格区分开来。
自从数据挖掘一词诞生以来,数据挖掘一词就与知识发现密切相关。“数据挖掘”过去是“数据库中的知识发现”的一部分,但现在两者之间一般没有严格的区别。在1989年第11届国际人工智能联席会议(美国底特律)的研讨会上,首先提出了“数据库中的知识发现”,随后相继召开了几次关于“知识发现和数据挖掘”的国际学术会议。在第一届知识发现和数据挖掘国际会议(蒙特利尔(加拿大)1995年)上,“数据挖掘”的概念首先由乌萨马·法耶兹(Usama Fayyad)提出。从那以后,每年都举行一次关于数据挖掘技术研究的国际会议。《知识发现与数据挖掘》专刊创刊(1997) [5期;这标志着新的数据挖掘学科已经走上了真正的发展道路。
数据挖掘新学科出现后,许多学者发表了研究论文,成立了相关学术组织,举办了相关学术研讨会,为数据挖掘的发展做出了巨大贡献。一些专门从事数据挖掘软件的公司和组织也相继开发和发布了一些数据挖掘软件产品,如dbminer (Simon Fraser)、clementine (SPSS Inc .)、enterprise miner (SAS institute)、intelligent miner (IBM)、silicon graphics Inc. (IBM)。在中国,国家自然科学基金会自1993年以来首次开始支持这一领域的研究项目。目前,国内从事数据挖掘的人员主要集中在高校、研究所和商业咨询公司,他们的研究方向和重点主要集中在十种数据挖掘算法和数据挖掘的实际应用上。数据挖掘在我国的应用仍处于十年的萌芽阶段。普通企业对数据挖掘技术的大规模应用仍不普及。有些企业或部门只是偶尔使用数据挖掘技术,并没有形成强大的整体力量。

1.3现有的常用数据挖掘方法
数据挖掘是一门跨学科的新兴学科。它结合了静力学、机器学习理论、人工智能、数据库理论、知识工程、信息检索、曲面I aJ对象方法、高性能计算、数据可视化等理论知识,结合了最新的研究成果。经过近o年的发展和研究,它产生了许多新概念和新方法,旨在成功运用十大实际生产生活领域,如啤酒和尿布之间最经典的关系。
根据不同的挖掘方法,现有的数据挖掘技术可以分为机器学习方法、数据库方法、神经网络方法、支持向量机方法、相关向量机方法、贝叶斯方法、遗传算法方法、粗糙集、模糊集、近似推理和不确定性推理、聚类方法等。这些分类仅从挖掘方法的角度描述了不同的数据挖掘研究策略和类别。它们相互补充,相互交叉。本文将介绍支持向量机方法、相关向量机方法、粒子群算法方法和粗糙集方法。

参考
[1]沈宏远(2009。有色冶金过程数据挖掘及其在铜精梳和吹炼中的应用研究:中南大学,长沙。
[2]中国矿业网。2002年[[有色金属生产综述。
[3]中国商业网。《2006年中国铜市场研究和行业研究预测报告》,[电子商务出版社。
[4]弗里德曼。《数据挖掘与统计:[有什么联系》。》。1997年,第1-7页。
[5]韩杰,坎伯,男。阿姆斯特丹;波士顿;加利福尼亚州旧金山:埃尔塞维尔;摩根·考夫曼。2006.
[6] Hand,D. J .,Mannila,h .,Smyth,p .数据挖掘原理[M]。马萨诸塞州剑桥。:麻省理工学院出版社。2001.
法耶兹,美国,皮亚特斯基-夏皮罗,G,史密斯,p .从数据挖掘到知识发现:[概述。美国加利福尼亚州门洛帕克:美国人工智能协会。1996.
摘要5-7[/Br/]摘要7-8
序言9-14
第1章序言14-20
1.1复杂工业过程及其控制14-15
1.2数据挖掘的呈现和发展15-17
1.3现有通用数据挖掘方法17-18[/ Br/] 1.4数据挖掘方法在复杂工业过程控制中的应用18-19
1.5内容和结构 2.2复杂工业过程中数据挖掘的任务和目的20-21
2.3数据挖掘过程模型21-24
2.3.1法耶兹数据挖掘过程模型21-22
2 . 3 . 2 Grip-DM数据挖掘过程模型22-23
2.3.3其他数据挖掘模型23
2.3.4复杂工业过程数据挖掘的一般过程23-24
2 3.2.1概率分布26-29
3.3最大似然估计29-30
3.4贝叶斯网络30-33
3.4.1贝叶斯网络30-31
3.4.2贝叶斯网络推理31
3.4.3 em学习理论31-32
3.4.4核函数方法32-33
3.5图论33-35 3.6.4最小结构风险37-38
3.6.5最优超平面38-39
3.6.6线性情况39-40
3.6.7非线性情况40-41
第4章相关向量机学习理论41-51[/br/ ] 4.1引言41-42
4.2相关向量机42-45
4.2.1相关向量机 4.4.2二维回归48-49[/ Br/] 4.4.3二维分类49-51
第5章粗糙集数据挖掘理论51-84
5.1粗糙集51-54
5.2粒子群优化算法54-57
5.2.1标准粒子群优化算法54-55
5.2.2离散粒子群优化(DPSO)55-55 5.6属性约简61-81
5.6.1基于粒子群优化的属性约简算法61-65[/ Br/] 5.6.2离散粒子群优化算法65-69
5.6.3离散差分进化算法69-75
5.6.4基于二分法的粗糙集属性约简算法75-78
5.6.5基于剪枝规则的粗糙集属性约简算法78-81
5 6.1简介84-85[/ Br/] 6.2相关向量机在铜转炉吹炼中的应用85-87
6.2.1训练样本的采集和预处理85
6.2.2训练样本和属性的选择85
6.2.3回归预测85-86
6.2.4结果分析86-87
6.3总结87-88
第7章结论和建议87 请到工程硕士学位论文频道选择:毛郭俊,段李娟,涂石,等.数据挖掘原理与算法(第二版)[M]。清华大学出版社。2007.
[9] Hand,d .,Mannila,h .,Smyth,p .数据挖掘原理[M]。张奎因,廖力,宋军等译:机械工业出版社,中信出版社。2003.
[10]巴特勒,过程掌握“系统的革命性变化[]。《现代制造业》,2005 (11),第36-37页。
[11]巴特勒。过程控制的革命性变化:知识系统提高用户的业务绩效。第一化学工业数字石油研究所,2006(z1),第71-72页。
[12]倪建军,马小平,屠蔡尧。数据挖掘技术在工业控制系统中的应用研究。工业掌握“系统一”计算机,2004。17(003),第5-5页。8.
[13]朱群雄,马德贤。过程工业的新热点--数据挖掘。数字化学,2003 (010)第38-39页。
[14]涂耀南,宋明。复杂工业系统的广义知识模型和智能建模。中南工业大学学报,2003.34 (004),第335-341页。
[15]张云涛。杨小丽。轻烃回收装置的数据挖掘和生产优化领域。计算机和应用化学,2005。22(7),第555-560页。
[16]丁延明,庞伟成。数据库知识发现技术在连铸生产探索领域的应用。铸造设备研究,2002 (1),第13115页。[/比尔/] [17]杨杰,叶晨洲。十点建模与优化。故障诊断中的数据挖掘技术。计算机集成制造系统,2000.6 (005),第72-76页。
[18]刘邓南,何光宇,吴梵等。异常港口的数据挖掘与负荷预测。电力系统自动化,2004.28 (003),第53-57页。
[19]康重庆,夏青,张伯明。电力系统负荷预测研究综述及发展方向探讨。尹。电力系统自动化,2004.28 (017),第1-11页。[/BR/] [20]吴亦凡,李翊君,欧阳树生,等。钢铁生产过程质量控制的动态数据挖掘方法。冶金自动化,2006。30(004)。第6-10页。
[22]杨于雪,宋小娟,顾何颖。数据挖掘在选煤厂过程控制中的应用。煤炭科学与技术,2004.32 (005),第21-24页。[/比尔/] [23]克利夫顿,c,图拉辛厄姆,b .数据挖掘的新兴标准[]。《计算机标准与接口》,2001.23(3),第187-193页。
[24]格罗斯曼,R. L .,霍尼克,M. F .,通讯,2002年。45(8),第59-61页。
[25]法耶兹,u .,皮亚特斯基-夏皮罗,G .,史密斯,p .知识发现和数据挖掘:走向一个新的框架[a]。论文发表于:proc.2nd int。
[知识发现和数据挖掘会议。(波特兰,o-help,1996.pp.8288.
[26]博泽,b.e .,guyon,i.m .,vapnik,V . n . a .最佳利润率分类的训练算法[a .)。(ACM) 1992。第144-152页。
[27]邓乃阳。数据挖掘中的一种新方法:支持向量机[。科学出版社,2004,
[28] vapnik。统计学习理论的本质[。斯普林格·弗拉格。2000.
[29]V . n . vapnik .统计学习理论[。纽约。1998.
[30]来,c,Vapnik,V支持向量网络[J]。机器学习,1995.20(3),第273-297页。
[31]苏亚肯斯,J .,范德瓦尔,J .最小二乘支持向量机分类器[.神经处理信件,1999。9(3),第293-300页。

[7]

[8]