一、粗糙集理论的一种新扩充模型(论文文献综述)
韩浪[1](2021)在《高速铁路调度集中系统硬件可靠性分析方法研究》文中指出调度集中系统作为铁路运输的核心技术装备,在保证列车安全、高速、正点运行方面发挥着举足轻重的作用。硬件设备是调度集中系统的重要组成部分,其可靠性水平直接决定着系统能否安全、可靠、平稳的运行,对硬件进行可靠性分析,研究硬件的故障模式和失效机理,对于提升调度集中系统的可靠性,保证高铁的客运服务质量十分重要。我国调度集中系统硬件组成结构复杂、种类及数量众多,利用既有可靠性数据分析方法对其进行建模研究时存在计算难度大、数据利用不充分等缺点。铁路数字化的发展,使得调度集中系统积累了大量的现场可靠性数据,为数据挖掘技术应用于硬件可靠性分析提供了数据支撑。论文主要工作如下:首先介绍调度集中系统的体系结构和硬件设备,阐述调度集中系统硬件结构复杂、设备种类及数量众多的特点;基于调度集中系统的硬件结构,阐述数据挖掘技术在调度集中系统硬件可靠性分析工作中的实现方案,设计调度集中系统硬件可靠性分析模块的功能和架构;结合数据挖掘的基本步骤和既有可靠性数据分析方法的基本流程,阐述基于数据挖掘的可靠性分析方法的基本流程。其次以车站自律机硬件设备为例,分析自律机硬件故障特性、失效因素特性以及两者之间的不确定性关系;基于调度集中系统体系结构和硬件组成特点,分析车站自律机硬件现场可靠性数据的采集方式;基于铁路大数据应用框架,设计并阐述现场可靠性数据的预处理逻辑框架;通过对比同一型号同一批次自律机硬件设备在京张高铁和京雄高铁上的不同故障表现情况,发现两条线路的自律机硬件设备在设计水平、制造工艺、运行设备状态、安装与调试人员等失效因素相似的条件下,在运行环境因素上存在巨大差异,因此构建了基于环境失效因素的自律机硬件现场可靠性数据集,为基于数据挖掘的自律机硬件故障失效因素分析提供数据支撑。最后根据聚类分析和基于近似不可分辨关系的粗糙集理论之间的联系,结合两者建立车站自律机硬件故障失效因素分析决策模型,选取环境失效因素作为条件属性集,自律机硬件故障次数作为决策属性,对基于环境失效因素的自律机硬件现场可靠性数据集进行等价类划分,从单一环境因素和耦合环境因素两个角度,验证分析环境失效因素与自律机硬件故障的部分近似依赖程度,并给出提升自律机硬件可靠性的施工建议;通过完成基于数据挖掘的可靠性分析方法的所有基本流程,验证基于数据挖掘的调度集中系统硬件可靠性分析方法的可行性和适用性。
吴炜[2](2021)在《基于混合数据处理方法的电力变压器状态评估方法研究》文中研究表明电力变压器是电力系统的核心部件,针对电力变压器的状态检修是维护电力系统安全稳定的重要环节,而状态检修工作的基础在于状态评估。变压器的状态评估实际上是依靠算法处理样本数据,来评估变压器健康状况的一个过程。然而,单一算法的特性与变压器状态评估工作并不够契合,本文针对变压器状态评估工作中存在的主客观方法比较片面、状态量之间相互干扰、数据量过多难以处理和评估过程需要满足模糊性和随机性问题,综合各类算法的优缺点,同时在少量和足量变压器样本数据的不同背景下,提出了两种混合算法来进行变压器状态评估。首先,本文综合考虑国网规程和相关文献中的研究经验,建立层次型状态评估体系,选取与变压器状态等级相关的影响因素作为中间层,并针对不同的中间层影响因素选取与其最为相关的状态量。然后,探究在少量样本数据情况下的状态评估。针对模糊层次分析法(Fuzzy Analytical Hierarchy Process,FAHP)计算变压器状态量权重时存在状态量之间相互干扰的问题,引入主观性方法决策与实验室法(Decision-making Trial and Evaluation Laboratory,DEMATEL)进行权重修正。针对单独的主、客观方法较为片面的问题,选取CRITIC法(Criteria Importance Though Intercriteria Correlation)计算客观权重值,再基于组合赋权法计算最优权重。而后,在最优权重的基础上,结合各状态量的状态评分得到综合状态评估结果。实例分析验证该混合方法的可靠性,并在MATLAB中对实验数据添加白噪声模拟干扰量,证明该方法具有更好的稳定性。最后,探究在足量数据情况下的状态评估。针对样本数据过于复杂的问题,综合模糊集和粗糙集在解决不确定问题上的互补能力,采用模糊聚类分析法(Fuzzy Cluster Analysis,FCA)对变压器样本数据进行聚类并结合粗糙集理论(Rough Set Theory,RST)计算状态量权重值;针对评估过程中需要维持模型的模糊性和随机性的问题,采用多维状态云模型理论计算变压器对各个状态评定等级的综合确定度。选取部分变压器样本数据进行综合等级评定示例,并采用正态随机数生成方法结合原始样本数据进行样本扩充,在足量数据的基础下使用多种方法进行对比,验证了该方法的有效性和高准确性。
王敬前[3](2021)在《覆盖粗糙集与模糊粗糙集及其在化工过程故障诊断中的应用》文中指出化工过程反应复杂,具有高度非线性、连续性和时变性等特点,一旦发生故障,将会给经济和生命安全带来严重的损失。因此,如何从海量工业数据中挖掘出有用信息,进行化工过程的故障诊断成为当前研究的热点。随着当今人工智能的发展,故障诊断技术也进入了一个新的时代。但对于多故障诊断和不完备信息下的故障诊断等问题,还有待进一步探索。粗糙集理论和模糊集理论是人工智能领域两种处理信息系统中不完备和不确定性数据的重要工具。目前,模糊集理论在故障诊断领域已得到了较为广泛的应用,而粗糙集理论在该领域中的应用还处在刚刚起步的阶段。本文通过融合覆盖粗糙集与模糊粗糙集,针对田纳西伊斯曼(TE)化工过程、化工汽轮机组和聚合釜三类化工过程的故障诊断,研究了覆盖粗糙集模型与模糊覆盖粗糙集模型中的相关不确定性问题,建立了相关数据分析与挖掘的理论体系,为解决化工过程故障诊断提供了更加智能的方法。本文的主要工作与贡献如下:1)针对不完备信息条件下的故障诊断问题,利用覆盖粗糙集提出了从不完备信息故障特征中剔除冗余信息的方法,从而提高了传统故障诊断的准确率,并将其应用在化工汽轮机组的故障诊断中。首先,从矩阵的角度研究了覆盖粗糙集中有关最大、最小描述的相关问题,并利用机器学习库中的公开数据集与传统的计算方法做比较,实验结果表明基于矩阵的计算方法节省了计算时间。借助于上述最大描述的矩阵计算方法,提出了计算不完备信息系统中极大相容块的矩阵计算方法,很好得解决了数据维数过高时,计算耗时的问题。接着,通过极大相容块,将原不完备决策表转化为极大相容块最全描述决策表。在新的决策表基础上,提出了基于分辨矩阵的属性约简计算方法。最后,基于所提出的基于极大相容块的属性约简方法,建立了“极大相容块+智能分类器”的故障诊断方法,为解决不完备信息条件下的故障诊断问题提供一种新方法。并针对不完备信息条件下化工汽轮机组的故障诊断问题,进行了仿真实验。实验结果表明,若智能分类器分别选择支持向量机(SVM)、随机森林和决策树,则所提出的“极大相容块+智能分类器”故障诊断方法的准确率均为87.5%,而只使用上述智能分类器的故障诊断准确率最高只有75%,准确率至少提高了 12.5%。2)针对完备信息条件下的故障诊断问题,利用模糊覆盖粗糙集提出了从完备信息故障特征中剔除冗余信息的方法,从而提高了传统故障诊断的准确率,并将其应用在TE化工过程的故障诊断中。理论方面:首先,作为模糊β-覆盖近似空间中已有可约元和约简概念的补充,提出了I-可约元和I-约简的概念。在此基础上,研究了模糊β-最小描述与β-约简之间的等价刻画、模糊β-最大描述与β-核之间的等价刻画等问题。然后,将上述一个模糊β-覆盖近似空间中的概念推广到了两个模糊β-覆盖近似空间中,得到了新的概念及相关性质。在上述所有结果的基础上,一个模糊β-覆盖与其诱导的七个模糊β-覆盖之间关系,及这些模糊β-覆盖的格结构被研究。应用方面:基于以上模糊覆盖粗糙集模型,提出了一种基于模糊β-邻域的属性约简方法。并在此基础上,建立了“模糊覆盖粗糙集+SVM”的智能故障诊断方法。最终,以TE化工过程为背景,针对以下4种状态:正常、阶跃故障(由过程变量的阶跃变化引起的故障)、漂移故障(化工反应动力学的缓慢漂移引起的故障)和阀门粘滞故障,建立了模糊覆盖信息系统,通过所提出的基于模糊β-邻域的属性约简方法,从53个故障征兆属性中确定出23个作为故障特征,然后通过建立的“模糊覆盖粗糙集+SVM”方法进行了故障诊断仿真实验,其准确率为86.57%,而只使用SVM的方法得到的准确率为72.50%,准确率提高了 14.07%。3)在前两部分的基础上,为更有效地表达故障诊断中的各种不确定性信息,建立了若干广义模糊覆盖粗糙集模型及相关故障决策方法,并研究了其在聚合釜的故障诊断中的应用。首先,基于已有的直觉模糊β-覆盖近似空间和直觉模糊β-邻域的概念,以及第一型直觉模糊覆盖粗糙集模型,主要研究了它们的性质,并给出了一些新的概念和第二型直觉模糊覆盖粗糙集模型。在此基础上,提出了单值中智β-覆盖和单值中智β-邻域等概念,并建立了单值中智覆盖粗糙集模型。为了解决多属性群决策的问题,将单值中智β-覆盖和单值中智覆盖粗糙集模型推广到了多粒度的情况,建立了三类多粒度单值中智覆盖粗糙集模型。在故障信息条件下,提出了基于直觉模糊覆盖粗糙集的群决策方法和基于单值中智覆盖粗糙集的群决策方法。针对聚合釜故障诊断问题,分别建立了故障类型为:聚合釜电机出现故障、聚合釜减速机出现故障、聚合釜机封中轴故障、聚合釜组件故障和聚合釜正常运行,以及故障特征为:聚合釜减速机振动值、操作压力、拌转速和减速机温度的直觉模糊信息系统与单值中智信息系统。并将上述决策方法应用于聚合釜的故障诊断中,所提出的方法最终决策结果基本都是聚合釜电机出现故障。这与其他已有决策方法的结果一致。因此,所提出的基于聚合釜故障信息的广义模糊覆盖粗糙集的决策方法是有效的。综上所述,本文以化工过程为背景,采用理论研究与实验验证相结合的方法,进一步研究了覆盖粗糙集、模糊覆盖粗糙集和广义模糊覆盖粗糙集相关问题(覆盖约简问题、属性约简问题等)。在此基础上,分别考虑了不完备故障信息和完备故障信息两种情况,利用基于覆盖粗糙集(用于提高不完备信息故障诊断的准确率)和模糊覆盖粗糙集(用于提高完备信息故障诊断的准确率)的属性约简方法解决了故障诊断中的特征选择问题,并结合智能分类器提高了故障诊断的准确度。最后,利用所建立的广义模糊覆盖粗糙集模型,建立多属性群决策方法,将其应用于化工过程的故障诊断中,为多专家故障决策提供了一种简便的方案。这些都为化工过程的智能故障诊断方法提供了理论及技术参考。
陈海兰[4](2021)在《面向聚类及预测的时间序列信息粒化方法研究》文中研究说明随着信息技术的发展,经济管理领域中产生并存储着大量的时间序列数据,运用数据挖掘算法可以挖掘出数据中潜在的、有价值的知识和信息以支持管理和决策活动。但这些时间序列数据通常都具有显着的高维性特征,若对其直接运用数据挖掘算法,会造成过高的计算复杂度,且数据挖掘结果也会受到影响。粒计算是一种模拟人类求解问题思维和解决大数据复杂任务的新方法,该理论的主要思想是将复杂问题抽象、划分转化为若干较为简单的问题(即粒化),从而有助于更好的分析和解决问题。本文将粒计算的粒化思想引入时间序列分析中,通过对时间序列进行信息粒化,将原始高维时间序列粒化为低维粒时间序列,构造的信息粒能够刻画和反映原始时间序列数据的结构特征,从而实现高效降维,为后续的数据挖掘工作奠定基础。本文针对时间序列的信息粒化问题,从时间轴和论域两个方面提出了三种不同的时间序列信息粒化方法:基于波动点的时间序列时间轴信息粒化方法、基于云模型的时间序列时间轴信息粒化方法和基于论域信息粒化的模糊时间序列预测方法,并应用于股票时间序列数据进行聚类和预测分析,为股票的投资选股问题及涨跌趋势的判断问题提供决策建议。主要研究内容和创新性研究成果如下:(1)在时间序列的时间轴方面,针对低频时间序列的结构特征,提出了基于波动点的时间序列信息粒化方法及粒时间序列相似性度量方法。首先,提出了基于波动点的时间序列信息粒化方法,通过识别波动点对原始时间序列进行信息粒划分,进而使用线性函数对划分后的信息粒进行描述得到粒时间序列,解决了传统时间序列降维方法中对于时间轴的硬划分问题,在降维的同时能更有效地提取时间序列的结构特征。其次,针对粒时间序列提出了相应的相似性度量方法。最后,在标准数据集上进行了聚类实验,实验结果表明运用所提出的信息粒化方法和相似性度量方法能够提高聚类结果的准确性;并在科创板股票数据集上进行了算法的实际应用研究,研究结果可以给投资者在科创板股票市场选股时提供参考。(2)在时间序列的时间轴方面,针对高频时间序列的结构特征,提出了基于云模型的时间序列信息粒化方法及粒时间序列相似性度量方法。首先,提出了基于云模型的时间序列信息粒化方法,在不需要事先指定信息粒划分个数的情况下,可以自适应地将时间序列粒化表示为若干个正态云,该方法针对高频时间序列具有更好的降维效果。其次,针对粒化后的云模型序列提出了相应的相似性度量方法。最后,在具有高频特征的标准数据集上进行了聚类实验,实验结果表明运用所提出的信息粒化方法和相似性度量方法能够提高聚类结果的准确性;并在具有高频震荡特征的沪深A股股票数据集上进行了算法的实际应用研究,研究结果可以给投资者在A股市场上选股投资时提供参考。(3)在时间序列的论域方面,提出了基于模糊C均值聚类和信息粒化的时间序列论域划分方法,并基于论域划分结果提出了时间序列预测方法。首先,运用模糊C均值聚类方法对时间序列的论域进行初始划分,然后提出了基于信息粒化的论域划分优化算法,该方法将聚类算法和信息粒化方法相结合来划分论域,提高了样本数据划分的准确性和可解释性。其次,针对时间序列信息粒化后的论域划分结果,给出了时间序列的模糊预测方法,该方法将精确的时间序列数据转化为符合人类认知形态的语义值构成的时间序列,通过对这些语义值构建模糊逻辑关系来描述时间序列的动态演变过程,得到其模糊变化规则并进行预测,提高了预测结果的可理解性。最后,在台湾加权股价指数(TAIEX)数据集上进行了预测实验,实验结果表明运用所提出的时间序列信息粒化方法进行时间序列预测能够提高预测结果的准确性;并在上海证券综合指数(SHCI)数据集上进行了算法的实际应用研究,研究结果可以帮助投资者了解未来股票市场的走向,为其调整投资策略时提供参考。
宁志杰[5](2020)在《基于机器学习理论的单沟泥石流危险性评价的相关问题研究》文中提出泥石流危险性评价工作的科学准确,不仅是对当前泥石流所处状态的评估及未来发展趋势的预测,更是防灾减灾工作顺利进行的重要保证。随着各学科理论的发展完善,各种新技术、新方法在泥石流危险性评价领域的交叉应用越来越广泛。虽然从总体上来看泥石流危险性评价工作取得了丰硕的研究成果,但是由于大多数的学者更关注预测结果的准确与否,以致对单沟泥石流危险性评价模型和评价指标体系确定方法的特征和适用性、泥石流数据样本的不均衡性和空间变异性等对模型预测精度和泛化能力的影响机理等关键问题的研究还不够清晰明确。因此,开展的基于机器学习的单沟泥石流危险性评价的相关问题的研究工作,不仅有助于实现各学科技术手段的交叉融合,还对泥石流危险性评价工作中涉及到的评价模型选取、样本数据选择和指标体系构建等问题的解决具有指导意义。以北川县、都江堰龙池地区、云南省和黄河积石峡水库区等地的单沟泥石流为研究样本,基于人工神经网络、支持向量机、灰色关联度、决策树、粗糙集、主成分分析、重采样、欠采样和Adaboost算法等理论,系统全面的分析了机器学习类预测模型的特征及适用性、评价指标体系构建方法的特征及适用性、泥石流样本数据不均衡问题的处理方法和泥石流系统的空间变异性对预测模型泛化能力的影响机制这四个关键问题,得出以下研究结果:(1)总结了基于机器学习理论的单沟泥石流危险性评价领域的四个关键问题,同时针对具体的问题,确定了的主要研究内容,制定了合理的研究方案。(2)灰色关联度模型可以作为单沟泥石流危险性评价的首选预测模型;神经网络与支持向量机模型差异化明显,神经网络模型预测结果的准确率受样本不均衡程度的影响较大,而受样本数量的影响较小,而支持向量机模型受样本数量的影响较大,受样本不均衡程度的影响较小;决策树模型在单沟泥石流危险性评价过程中准确率较低难以得到广泛的应用。(3)粗糙集理论可以作为评价指标构建方法的首选处理手段,评价指标间相关程度较低时采用灰色关联度确定的评价指标体系所反映的信息更全面,建模效果更好;而评价指标与评价结果密切相关,但评价指标间的相关程度较高时主成分分析则更具有优势。(4)重采样手段可以作为样本数据不均衡问题处理首选方案;欠采样手段采用的测试样本数量较少,受样本数量的影响,所建立的预测模型准确率在一定程度上有所降低;BP-Adaboost算法当测试样本数量较少时,误差和经常为1或0,导致模型无法正常运行;若测试样本数量较多,采用重采样和BP-Adaboost算法结合的方法处理样本数据不均衡问题可能有更好的应用前景。(5)空间变异性主要通过控制不同地区相同评价指标的灵敏度进而影响模型的泛化能力,采用主成分分析构建新的评价指标体系可以有效地解决空间位置改变而引起的评价指标灵敏度的变化。
侯文丽[6](2020)在《基于邻域粗糙集的增量属性约简算法研究》文中认为在科技时代背景下,信息技术时刻在高速率地发展着,各行各业中产生了大量的数据,据不完全统计,在互联网中每天有数万亿PB数据不断更新和增长。这不得不使得人们在收集大规模数据,以及储存处理数据的这些方面的技能迫切提升。在许多工业、教育以及医疗行业中都存在着大量多维的数据,针对于此类数据进行一定程度的数据分析,有利于人们从数据中挖掘出来隐藏在数据背后的有价值的信息,同时,也有利于预测出下一阶段数据的变化情况,这样,有利于针对于动态变化的数据提前做好应对之策。总之,数据挖掘和智能信息处理目前已经是研究工作者们近些年来重点关注的研究内容之一。粗糙集理论是用来处理模糊、不确定、不完备数据的一种有效的数学工具,它的优势在于很多时候仅仅需要利用生成的数据表中的信息本身,并不需要计算出其他的概率论的有关数学知识,如先验知识和其它附加信息等,通过简单的分析处理就可以很便利地分析数据表中的各项数据,进而发现隐藏在数据表中背后的有用的有研究意义的知识或者数据,粗糙集理论一定程度上,揭示潜在数学规律。就目前看来,粗糙集理论以及衍生出来的邻域粗糙集理论、变精度粗糙集理论、模糊粗糙集理论和覆盖粗糙集理论等理论,这些相关理论已经大量运用在数据挖掘、智能信息处理、模糊识别和知识约简等科学研究。属性约简是在保持属性区分能力不改变或者大方向不改变的情况下,去除掉数据中的无关或者不太重要的属性。近些年来,由于许多医疗、教育和工业领域中的数据通常都是在动态实时更新变化,每当数据的数据量増长到一定维度时候,从原始数据集中获取的属性约简和知识获取结果将不再适用,此时需对新生成的数据表,重新进行处理和分析。若使用静态的非增量式的属性约简方法来处理时,将导致属性约简算法的时间复杂度急剧增加,且较难寻找出新数据相较于原始数据的变化规律所在。因此,基于粗糙集理论围绕动态数据研究动态数据挖掘理论和方法具有很大的研究价值。本文的主要研究工作和创新工作如下:(1)基于邻域粗糙集模型和邻域条件熵的常规增量属性约简算法存在精度低,效率低。本文重新定义了一种新的邻域粗糙熵,并推导出邻域粗糙条件熵,分析了基于信息熵的属性约简算法相对于代数观下属性约简算法的优势,以属性的邻域粗糙条件熵为基础来计算属性重要度,提出了一种基于邻域粗糙条件熵的非增量属性约简算法,并且为了精确地确定邻域阈值,本文利用人工蜂群优化算法来搜寻本算法最优的邻域阈值。(2)针对决策表下样本的动态变化,研究探讨了如何快速地从动态决策表中提取关键的知识或规则。第一,完备决策表中独立样本的増加和删除进行分析,基于新的邻域粗糙条件熵动态更新机制,通过计算新的重要度和约简集,对于满足阈值要求的规则进行动态增加和删除。第二,再分析批增量下,多个对象增加和删除时,基于新的邻域粗糙条件熵动态更新机制,再重新确定新的约简结果。主要是分析了新增样本后邻域的变化规律,邻域粗糙条件熵的变化规律以及约简结果的变化规律,并做了详细的理论推导工作。(3)在(2)的基础上,提出了一种基于邻域粗糙集的増量式属性约简算法。在UCI标准数据集随机改变数据集中的10%,20%,30%,40%,50%样本中的数据值,重新计算新生成的数据集的约简结果,并通过与多种算法进行约简结果的对比实验和以十倍交叉验证方法在两种传统分类器下的精度分析对比实验,实验证明所提出的属性约简算法以及新定义的邻域粗糙条件熵的有效性和可行性,并证明了所提算法对混合多维数据有一定的应用价值。综上,本文以粗糙集理论作为数学理论支撑,以智能信息处理为目的,针对动态不完备决策表的属性约简和知识获取模型与增量属性约简算法进行了深入的分析和研究。针对动态数据中的样本集变化,导致的属性约简和知识获取需要实时更新问题,进行了较深入研究,设计一种新的增量属性约简算法,较好地解决了许多静态非增量算法未能描述数据更新变化的变化规律和算法运行效率较低等诸多问题,进而为更容易适应大数据环境下数据实时分析和挖掘。
彭莉莎[7](2019)在《面向不完备邻域数据的三支决策模型与属性约简算法研究》文中研究表明不完备、不精确和模糊数据大量存在于现实生活和实际应用中,经典粗糙集和概率粗糙集是处理这类数据的有效粒计算工具,随着粒计算理论的不断完善,一种新的信息计算范式三支决策被提出。三支决策继承了传统粗糙集理论的分类能力,又弥补了传统粒计算理论的容错性低等缺陷,其核心思想是“三分而治”,即通过基于贝叶斯风险决策最小化计算而来的一对阈值将论域划分成三个互不相交的域(正域、边界和负域),然后对这三个域中的对象采取对应的决策(接受、不承诺和拒绝)。三支决策分而治之的思想提高了人们分析数据和管理决策的效率,相比于只有接受和拒绝的二支决策,其边界域对应的延迟决策也降低了人们在决策问题中错误接受和错误拒绝的概率,从而一定程度减少了决策代价。由于在实际应用领域中不完备连续和不完备混合型数据等广泛存在,而三支决策对这些数据的研究相对较少,为进一步拓展三支决策模型及其应用领域,本文研究了面向不完备邻域数据的三支决策模型与属性约简算法,具体构建了面向邻域系统、不完备邻域系统和不完备混合邻域系统的三支决策模型,并鉴于现有的三支决策属性约简算法大多面向所有决策类,而对于单个决策类的研究较少,为此,本文还提出了面向特定类的三支概率属性约简算法。(1)在面向邻域系统的三支决策模型中,将邻域概念引入经典三支决策模型用于处理连续型数据。在该模型中,只计算某个对象包含于其所属对象集的条件概率,而不计算该对象包含于所有对象集的条件概率,从而一定程度提高了传统三支决策模型的运算效率。将该模型成功应用于学生综合素质评价体系中,进一步说明了该模型的有效性和实际意义。(2)在面向不完备邻域系统的三支决策模型中,提出邻域非对称相似关系用于求解不完备连续型数据的邻域粒度。实验对比面向不完备邻域系统的经典粗糙集、0.5概率粗糙集和邻域容差关系,验证了该模型能获得更高的划分准确率和更低的误划分损失,为三支决策对不完备邻域数据的处理提供了一种有效可行的方法。(3)在面向不完备混合邻域决策系统的三支决策模型中。针对不完备混合数据提出新的完备邻域容差关系和阈值计算公式,构建“乐观”、“折中”和“悲观”三支决策规则,通过理论分析和医疗诊断实例详细说明了算法的有效性和可解释性,并通过实验分析验证了所构模型比其他相关模型对不完备混合数据的分类过程更加合理,分类效果更优。(4)在面向特定类的三支概率属性约简算法中,基于相对依赖度和信息熵构建了代数论和信息论下的启发式属性约简算法。通过医疗诊断实例详细给出了算法在一致和不一致决策系统中的约简过程和运算步骤,合理解释了算法的约简结果,同时也说明了算法的有效性和可行性,扩充了三支属性约简的应用范围。
杨星星[8](2014)在《基于二进制可辨矩阵的知识获取算法研究》文中研究表明随着科学技术的迅猛发展,数据库中存储的数据量越来越大,并且由于数据搜集能力有限等原因常常使得大量的数据是不完备的不可分辨的,从这些大量的杂乱无章的数据中获取隐含的模式化的规律变得日益重要。这使得知识获取成为了一个热门的研究问题。随着知识获取技术的日趋成熟,针对数据中存在的不可分辨的、不相容的、模糊不确定的信息,很多的知识获取算法与粗糙集理论、二进制可辨矩阵相结合。研究工作以粗糙集理论与二进制可辨矩阵为基础来处理不完备的不相容的数据集合,主要包括以下几方面内容:1、提出一种广义二进制可辨矩阵的概念和定义。知识获取包括属性约简和规则提取。以往的属性约简重点在基于经典粗糙集理论的完备信息系统,对于不完备信息系统的处理,有各种不同的扩充粗糙集模型被提出,然而对于多种扩充粗糙集模型用来进行属性约简尚没有统一的定义以及相对较成熟的方法。广义二进制可辨矩阵修正了传统二进制可辨矩阵,适用于完备决策表的不可分辨关系和不完备决策表的多种扩充粗糙集模型,能够使算法更具灵活性,为后续的完备决策表、不完备决策表的属性约简和规则提取提供了实现方法。2、提出一种改进的基于广义二进制可辨矩阵的属性求核算法。研究分析了属性求核的各种算法,发现基于二进制可辨矩阵求取属性核时存在不合理不精确的问题。即将二进制可辨矩阵中行中1的总数作为衡量和确定属性核的唯一标准,在处理信息系统时难免会造成产生的属性核的误差。改进的属性求核算法针对每个求得的核属性,使用统一的阈值过滤掉那些成为核属性的概率相对较小的属性。求得的核属性可以直接加入属性约简结果,而被滤掉的未成为核属性的属性还需按照属性约简的步骤,符合条件的属性才可能加入约简结果中。实验证明,算法具有较好的约简性能,可以提高后续属性约简的合理性与精确度。3、提出一种基于广义二进制可辨矩阵的属性约简和规则提取算法。基于对粗糙集模型和二进制可辨矩阵的研究分析,完备决策表是经典粗糙集理论的理想处理对象,然而,数据对象的模糊不确定不相容现象却是很常见。广义二进制可辨矩阵用于完备、不完备决策表的属性约简和规则提取,将更加精确,更具灵活性。通过对UCI数据的实例仿真,分析验证了广义二进制可辨矩阵用于完备、不完备信息系统属性约简算法和规则提取算法的有效性。综上所述,对基于粗糙集理论和二进制可辨矩阵相结合的知识获取算法的研究,为处理知识获取算法中的不完备不相容的问题提供了有利的支持,具有很好的理论价值与意义。
陈小慧[9](2012)在《基于粗糙集和粒计算的不完备数据挖掘研究》文中研究表明不完备数据在现实世界的各个领域中广泛存在,如何正确分析不完备数据带来的不确定性,并从中获取对人们行为或决策有用的知识一直是数据挖掘领域的研究热点。粗糙集已被证明是一种能够有效处理不精确、不完备数据的数学工具,而粒计算作为一种新型的智能计算理论,可以从不同层次和视角对问题进行处理,为不确定数据的处理提供了有效的机制,但是目前基于粒计算理论的不完备数据挖掘研究成果相对较少。本文面向不完备数据挖掘问题,采用粗糙集和粒计算相结合的研究方法,在求核与属性约简等问题上进行了相关理论分析和实验验证,所做的工作主要有以下几方面:1、基于阈值的差别矩阵求核算法。首先基于不完备决策表,给出了新的差别矩阵定义,将差别矩阵元素中的属性分为两类;然后引入属性的综合分类能力的概念并设定阈值;最后从差别矩阵的单属性元素中分两步得到核属性集合。实验表明新的求核方法可以避免那些对决策表分类作用很小的属性被判定为核属性,因此更具有客观性,可以保证后续挖掘结果的可靠性。2、区间粒模型研究。对区间粒模型的粒子构造思想进行了分析,与粗糙集理论相结合,研究了区间粒模型的上近似、下近似和精度,并给出了相关的定义和性质;比较分析了粗糙集理论中主要扩充粗糙集模型的优缺点,综合阐述了区间粒模型对不完备数据处理的优势;面向不完备信息系统,研究了基于区间粒套序列的粒层结构和粗集逼近,进而对相关性质进行了实例验证。3、基于区间粒模型的属性约简。首先分析了基于容差关系模型的属性冗余性判定存在的不足,给出了基于区间粒模型的属性冗余性判定,通过分析区间粒上粒和下粒两方面的变化情况,综合判断得出客观结论,避免了容差关系等模型只能从单方向上作约简而导致的偏差。进而面向不完备决策表,给出了基于区间粒模型的属性约简算法。4、不完备数据挖掘实验。在UCI数据集上,结合开源数据挖掘软件orange,对本文基于区间粒模型的不完备决策表属性约简算法进行实验验证,实验选取多组数据同时进行,在不同的数据缺失率下,对应用属性约简算法的数据挖掘测试精度和未应用约简算法的挖掘测试精度进行对比分析,表明了基于区间粒模型的不完备决策表属性约简算法的有效性。综上所述,本文基于粗糙集和粒计算对不完备数据的挖掘问题进行了较为深入的研究,为不完备数据的决策问题提供理论依据和重要算法,研究成果可以为现实生活中的若干实际问题提供切实可行的解决方案,因而具有较好的理论意义和应用价值。
薛志远,张清华[10](2010)在《复合粒计算模型研究进展》文中研究说明粒计算(granular computing,GrC)是人工智能领域中的一种模拟人类思考和解决复杂问题的新理念和新方法,粗糙集理论、商空间理论和模糊集理论是3种主要的粒计算模型。首先回顾几种基本的粒计算模型,介绍了几个复合粒计算模型,最后探讨了粒计算模型的进一步发展方向。
二、粗糙集理论的一种新扩充模型(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、粗糙集理论的一种新扩充模型(论文提纲范文)
(1)高速铁路调度集中系统硬件可靠性分析方法研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究现状 |
1.2.1 调度集中系统硬件可靠性分析研究现状 |
1.2.2 数据挖掘可靠性分析研究现状 |
1.3 研究内容及技术路线 |
1.3.1 技术路线 |
1.3.2 研究内容 |
2 基于数据挖掘的调度集中系统硬件可靠性分析方法 |
2.1 调度集中系统的体系结构及硬件设备 |
2.2 调度集中系统的硬件可靠性分析方法 |
2.3 基于数据挖掘的可靠性分析方法的基本流程 |
2.4 本章小结 |
3 车站自律机硬件故障的失效因素和现场可靠性数据 |
3.1 车站自律机硬件故障的失效因素 |
3.1.1 硬件故障和失效因素 |
3.1.2 硬件故障可靠性问题说明 |
3.1.3 硬件故障和失效因素间的不确定性关系 |
3.2 车站自律机硬件现场可靠性数据 |
3.2.1 数据采集 |
3.2.2 数据预处理 |
3.3 基于环境失效因素的自律机硬件现场可靠性数据集 |
3.4 本章小结 |
4 基于聚类分析的自律机硬件故障失效因素分析决策模型 |
4.1 理论基础 |
4.1.1 聚类分析 |
4.1.2 粗糙集理论 |
4.1.3 基于近似不可分辨关系的粗糙集理论和聚类分析的联系 |
4.2 自律机硬件故障失效因素分析决策模型 |
4.2.1 基于聚类分析的等价类划分 |
4.2.2 基于近似不可分辨关系的粗糙集决策模型 |
4.3 环境失效因素分析 |
4.3.1 单一因素分析 |
4.3.2 耦合因素分析 |
4.3.3 验证分析 |
4.4 本章小结 |
5 结论与展望 |
5.1 研究结论 |
5.2 研究展望 |
参考文献 |
图索引 |
表索引 |
作者简历及攻读硕士学位期间取得的科研成果 |
学位论文数据集 |
(2)基于混合数据处理方法的电力变压器状态评估方法研究(论文提纲范文)
致谢 |
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 本文研究的目的和内容 |
1.3.1 本文研究的目的 |
1.3.2 本文研究的内容 |
1.4 本章小结 |
第二章 变压器状态量评估体系的构建 |
2.1 以故障类型为因素层的评估体系的建立 |
2.1.1 九种故障类型以及相应状态量 |
2.1.2 评估体系的构建 |
2.2 以实验类型为因素层的评估体系的建立 |
2.2.1 三种实验类型以及相应状态量 |
2.2.2 评估体系的构建 |
2.3 常用变压器状态评估方法 |
2.3.1 层次分析法 |
2.3.2 熵权法 |
2.3.3 神经网络法 |
2.4 本章小结 |
第三章 小样本下的混合评估算法 |
3.1 引言 |
3.2 基于FAHP-DEMATEL法计算主观权重 |
3.2.1 DEMATEL算法原理 |
3.2.2 FAHP算法原理 |
3.2.3 结合FAHP和 DEMATEL法求取状态量权重 |
3.3 基于CRITIC赋值法计算客观权重 |
3.3.1 CRITIC算法原理 |
3.3.2 CRITIC法计算客观状态量权重 |
3.4 主客观方法组合赋权下的状态评估 |
3.4.1 基于最小方差计算组合权重 |
3.4.2 变压器状态评估 |
3.5 白噪声下的稳定性对比 |
3.6 本章小节 |
第四章 大样本下的混合评估算法 |
4.1 引言 |
4.2 人工智能方法下的变压器状态量筛选 |
4.2.1 模糊聚类分析法 |
4.2.2 粗糙集理论 |
4.3 FCA-RST-多维状态云模型下的变压器状态评估 |
4.3.1 多维状态云模型 |
4.3.2 FCA-RST-多维状态云模型 |
4.4 实例分析 |
4.5 本章小结 |
第五章 总结和展望 |
5.1 本文工作总结 |
5.2 后续工作展望 |
参考文献 |
攻读硕士学位期间的学术活动及成果情况 |
(3)覆盖粗糙集与模糊粗糙集及其在化工过程故障诊断中的应用(论文提纲范文)
摘要 |
ABSTRACT |
符号说明 |
1 绪论 |
1.1 研究背景 |
1.2 研究现状分析 |
1.2.1 化工过程故障诊断 |
1.2.2 基于数据的化工过程故障诊断 |
1.2.3 粗糙集理论及属性约简 |
1.2.4 (模糊)覆盖粗糙集及其在故障诊断中应用 |
1.3 主要研究内容与组织结构 |
2 覆盖粗糙集最大、最小描述若干问题研究 |
2.1 引言 |
2.2 覆盖粗糙集理论预备知识 |
2.3 基于矩阵的最小、最大描述计算方法 |
2.4 基于最小、最大描述的覆盖近似空间约简方法 |
2.5 基于最小、最大描述的覆盖信息系统约简方法 |
2.5.1 基于最小描述的覆盖信息系统约简方法 |
2.5.2 基于最大描述的覆盖信息系统约简方法 |
2.6 本章小结 |
3 覆盖粗糙集的故障诊断方法及其在化工汽轮机组故障诊断中的应用 |
3.1 引言 |
3.2 预备知识 |
3.2.1 化工汽轮机组及常见故障类型 |
3.2.2 不完备决策表与极大相容块 |
3.3 极大相容块的矩阵计算方法 |
3.3.1 基于最大描述的极大相容块计算方法 |
3.3.2 基于容差类的极大相容块的矩阵计算方法 |
3.4 基于极大相容块的不完备信息系统属性约简方法 |
3.5 基于“极大相容块+智能分类器”的不完备信息故障诊断方法 |
3.6 不完备信息下化工汽轮机组的故障诊断应用 |
3.6.1 化工汽轮机组故障不完备决策信息系统 |
3.6.2 决策信息表预处理 |
3.6.3 化工汽轮机组的“极大相容块+智能分类器”故障诊断模型建立 |
3.6.4 化工汽轮机组故障样本诊断 |
3.7 本章小结 |
4 基于β-覆盖的模糊覆盖粗糙集 |
4.1 引言 |
4.2 预备知识 |
4.3 模糊β-覆盖近似空间中概念之间的关系 |
4.3.1 模糊β-最小描述与各类约简之间的关系 |
4.3.2 模糊β-最大描述与β-核、I-约简之间的关系 |
4.4 模糊β-覆盖近似空间之间的关系 |
4.4.1 生成的模糊β-覆盖近似空间 |
4.4.2 I-生成的模糊β-覆盖近似空间 |
4.5 七个诱导的模糊β-覆盖近似空间和相应的格结构 |
4.5.1 七个诱导的模糊β-覆盖的一些新的性质 |
4.5.2 一些导出模糊β-覆盖的格结构 |
4.6 本章小结 |
5 模糊覆盖粗糙集的故障诊断方法及其在TE化工过程故障诊断中的应用 |
5.1 引言 |
5.2 TE化工过程 |
5.3 基于模糊β-邻域的模糊覆盖信息系统属性约简方法 |
5.4 “模糊覆盖粗糙集+智能分类器”的故障诊断方法 |
5.5 基于“模糊覆盖粗糙集+SVM”的TE化工过程故障诊断实验 |
5.5.1 获取并初始化数据 |
5.5.2 基于模糊β-邻域的TE化工过程故障数据集的属性约简 |
5.5.3 基于TE化工过程的“模糊覆盖粗糙集+SVM”故障诊断模型建立 |
5.5.4 基于TE化工过程的“模糊覆盖粗糙集+SVM”故障诊断 |
5.6 本章小结 |
6 广义模糊覆盖粗糙集 |
6.1 引言 |
6.2 预备知识 |
6.2.1 直觉模糊集 |
6.2.2 单值中智集 |
6.3 两类直觉模糊覆盖粗糙集模型 |
6.3.1 直觉模糊β-邻域、直觉模糊β-邻域系统和β-邻域 |
6.3.2 两类直觉模糊覆盖粗糙集模型 |
6.3.3 直觉模糊覆盖粗糙集模型和其他粗糙集模型之间的关系 |
6.4 单值中智覆盖粗糙集模型 |
6.4.1 单值中智覆盖近似空间 |
6.4.2 三类单值中智覆盖粗糙集模型 |
6.5 多粒度单值中智覆盖粗糙集模型 |
6.5.1 多粒度单值中智β-覆盖近似空间 |
6.5.2 三类多粒度单值中智覆盖粗糙集模型 |
6.5.3 不同中智β-覆盖产生相同的多粒度单值中智覆盖近似算子的条件 |
6.6 本章小结 |
7 广义模糊粗糙集的决策方法及其在聚合釜故障诊断中的应用 |
7.1 引言 |
7.2 聚合釜反应过程与常见故障 |
7.3 基于直觉模糊覆盖粗糙集的群决策方法及其在故障诊断中的应用 |
7.3.1 乐观多粒度直觉模糊覆盖粗糙集模型 |
7.3.2 基于直觉模糊故障信息的多属性群决策问题 |
7.3.3 基于乐观多粒度直觉模糊覆盖粗糙集的故障信息群决策方法 |
7.3.4 直觉模糊决策方法在聚合釜故障诊断中的应用 |
7.4 基于多粒度单值中智覆盖粗糙集的群决策方法及故障诊断应用 |
7.4.1 基于单值中智故障信息的多属性群决策问题 |
7.4.2 基于多粒度单值中智覆盖粗糙集的故障信息群决策方法 |
7.4.3 单值中智决策方法在聚合釜故障诊断中的应用 |
7.4.4 对比分析 |
7.5 本章小结 |
8 总结与展望 |
8.1 全文工作总结 |
8.2 研究工作创新点 |
8.3 未来工作展望 |
致谢 |
参考文献 |
附录A: 最小、最大描述的集合计算Matlab程序(第二章) |
附录B: 最小、最大描述的矩阵计算Matlab程序(第二章) |
附录C: 本文应用的化工汽轮机组故障诊断数据(第三章) |
附录D: 基于不可分辨矩阵的不完备信息属性约简Matlab程序(第三章) |
附录E: SVM故障诊断Matlab程序(第三章) |
附录F: 基于模糊β-邻域的约简计算Matlab程序(第五章) |
附录G: TE化工过程部分数据(第五章) |
附录H: 单值中智覆盖粗糙集上、下近似计算Matlab程序(第七章) |
攻读博士学位期间发表的科研成果目录 |
(4)面向聚类及预测的时间序列信息粒化方法研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
1 引言 |
1.1 研究背景 |
1.2 研究意义 |
1.3 论文框架与研究内容 |
1.4 研究创新点 |
2 理论基础与文献综述 |
2.1 时间序列分析 |
2.1.1 时间序列及其结构特征 |
2.1.2 时间序列的降维表示方法 |
2.1.3 时间序列的相似性度量方法 |
2.1.4 时间序列的数据挖掘任务 |
2.2 粒计算 |
2.2.1 粒计算的基本组成 |
2.2.2 粒计算的基本问题 |
2.2.3 粒计算的理论模型 |
2.3 时间序列信息粒化 |
2.3.1 时间序列信息粒化的时间轴信息粒化方法 |
2.3.2 时间序列信息粒化的论域信息粒化方法 |
2.3.3 已有研究的不足 |
2.4 本章小结 |
3 基于波动点的时间序列时间轴信息粒化方法 |
3.1 本章研究思路 |
3.2 基于波动点的时间序列信息粒化 |
3.2.1 信息粒划分方法 |
3.2.2 信息粒描述方法 |
3.3 基于线性信息粒化的时间序列相似性度量 |
3.3.1 线性信息粒匹配 |
3.3.2 线性信息粒的相似性度量 |
3.4 实验及结果分析 |
3.4.1 UCR标准数据集实验 |
3.4.2 科创板股票数据集实验 |
3.5 本章小结 |
4 基于云模型的时间序列时间轴信息粒化方法 |
4.1 本章研究思路 |
4.2 基于云模型的时间序列信息粒化 |
4.2.1 云模型理论 |
4.2.2 基于云模型的自适应信息粒化算法 |
4.3 基于云模型信息粒化的时间序列相似性度量 |
4.3.1 云模型匹配 |
4.3.2 基于期望曲线的云模型相似性度量 |
4.4 实验及结果分析 |
4.4.1 UCR标准数据集实验 |
4.4.2 沪深A股股票数据集实验 |
4.5 本章小结 |
5 基于论域信息粒化的模糊时间序列预测方法 |
5.1 本章研究思路 |
5.2 基于模糊C均值聚类和信息粒化的时间序列论域划分 |
5.2.1 基于模糊C均值聚类的时间序列论域初始划分 |
5.2.2 基于模糊信息粒化的时间序列论域划分优化算法 |
5.3 基于论域信息粒化的时间序列预测 |
5.3.1 模糊时间序列 |
5.3.2 基于模糊逻辑关系的时间序列预测方法 |
5.4 实验及结果分析 |
5.4.1 台湾加权股价指数(TAIEX)数据集实验 |
5.4.2 上海证券综合指数(SHCI)数据集实验 |
5.5 本章小结 |
6 结论与展望 |
6.1 研究结论 |
6.2 研究展望 |
参考文献 |
作者简历及在学研究成果 |
学位论文数据集 |
(5)基于机器学习理论的单沟泥石流危险性评价的相关问题研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.1.1 课题研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 基于机器学习理论的预测模型的应用现状 |
1.2.2 评价指标体系选取手段的研究现状 |
1.2.3 石流样本数据不均衡问题处理方案的研究现状 |
1.2.4 泥石流系统的空间变异性与泛化能力响应关系的研究现状 |
1.3 研究内容与技术路线 |
1.3.1 研究内容 |
1.3.2 技术路线 |
第二章 单沟泥石流危险性评价的理论基础 |
2.1 机器学习理论 |
2.1.1 神经网络算法 |
2.1.2 支持向量机学习算法 |
2.1.3 关联度算法 |
2.1.4 决策树算法 |
2.2 评价指标体系的构建方法 |
2.2.1 主成分分析 |
2.2.2 粗糙集理论 |
2.3 理论的实现手段——MATLAB软件 |
2.4 本章小结 |
第三章 模型的特征及适用性研究 |
3.1 泥石流样本的选取 |
3.2 评价指标的确定 |
3.3 不同类别泥石流样本集的构建 |
3.4 预测结果分析 |
3.5 小结 |
第四章 评价指标体系构建方法的特征及适用性研究 |
4.1 泥石流样本的选取 |
4.2 评价指标体系的确定 |
4.2.1 基于灰色关联度确定的评价指标体系 |
4.2.2 基于粗糙集确定的评价指标体系 |
4.2.3 基于主成分分析确定的评价指标体系 |
4.3 泥石流训练及测试样本的构建 |
4.4 预测结果分析 |
4.5 小结 |
第五章 泥石流样本数据不均衡问题的处理方法研究 |
5.1 泥石流不均衡样本集及评价指标体系的确定 |
5.2 数据不均衡问题的处理 |
5.3 基于欠采样及重采样处理不均衡问题 |
5.4 基于BP-Adaboost处理不均衡问题 |
5.5 结果分析 |
5.6 小结 |
第六章 泥石流系统的空间变异性对预测模型泛化能力的影响机制研究 |
6.1 泥石流样本及评价指标的选取 |
6.2 模型泛化能力的影响机制研究 |
6.3 空间变异性问题的处理 |
6.4 小结 |
第七章 结论与展望 |
7.1 结论 |
7.2 展望 |
参考文献 |
致谢 |
作者简介 |
攻读硕士学位期间发表的论文和科研成果 |
(6)基于邻域粗糙集的增量属性约简算法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题应用背景及选题意义 |
1.1.1 课题应用背景 |
1.1.2 选题意义 |
1.2 论文国内外研究现状 |
1.2.1 粗糙集理论的研究现状 |
1.2.2 粗糙集理论在不完备信息系统中的研究现状 |
1.3 论文研究内容 |
1.4 论文的结构组成以及安排 |
第二章 理论综述 |
2.1 粗糙集理论的基本理论 |
2.2 邻域粗糙集的基本理论 |
2.3 属性约简 |
2.4 动态数据的约简方法 |
2.5 本章小结 |
第三章 基于邻域粗糙条件熵的非增量属性约简算法 |
3.1 邻域粗糙条件熵的相关理论 |
3.1.1 邻域粗糙熵的定义 |
3.1.2 邻域粗糙条件熵的定义 |
3.2 基于邻域粗糙条件熵属性约简算法 |
3.2.1 基于信息熵的属性约简算法的优势 |
3.2.2 算法设计 |
3.3 算法测试和结果分析 |
3.3.1 参数的确定 |
3.3.2 算法测试和结果分析 |
3.3.3 非增量属性约简算法的应用场景 |
3.4 本章小结 |
第四章 基于邻域粗糙条件熵的增量属性约简算法 |
4.1 增量式约简机制 |
4.1.1 增加样本后邻域的变化规律 |
4.1.2 增加样本后新的邻域粗糙条件熵的变化规律 |
4.1.3 增加样本后约简结果的变化规律 |
4.2 基于邻域粗糙条件熵的增量属性约简算法的设计 |
4.3 增量属性约简算法的测试和结果分析 |
4.3.1 实验环境 |
4.3.2 约简时间对比分析 |
4.3.3 精度对比分析 |
4.3.4 增量属性约简算法的应用场景 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
攻读学位期间取得的科研成果 |
致谢 |
(7)面向不完备邻域数据的三支决策模型与属性约简算法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 三支决策国内外研究现状 |
1.2.1 三支决策研究现状 |
1.2.2 邻域决策系统的相关研究 |
1.2.3 不完备单一型决策系统的相关研究 |
1.2.4 不完备混合型决策系统的相关研究 |
1.2.5 属性约简的相关研究 |
1.3 论文研究内容与结构安排 |
1.3.1 主要研究内容 |
1.3.2 本文结构安排 |
1.4 粗糙集理论 |
1.4.1 经典粗糙集理论 |
1.4.2 概率粗糙集理论 |
1.4.3 邻域粗糙集理论 |
1.5 三支决策理论 |
第二章 面向邻域系统的三支决策模型 |
2.1 引言 |
2.2 邻域三支决策模型 |
2.2.1 主要思想 |
2.2.2 算法描述 |
2.3 基于邻域三支决策的学生综合素质评价 |
2.3.1 算法描述 |
2.3.2 评价流程 |
2.3.3 实例分析 |
2.3.4 实验分析 |
2.4 本章小结 |
第三章 面向不完备邻域系统的三支决策模型 |
3.1 引言 |
3.2 基于邻域非对称相似关系的三支决策模型 |
3.2.1 邻域非对称相似关系 |
3.2.2 算法描述及时间复杂度分析 |
3.3 实验分析和对比 |
3.3.1 参数对划分结果的影响 |
3.3.2 与其他粒计算模型的实验比较 |
3.3.3 与容差关系下三支决策模型的实验比较 |
3.4 本章小结 |
第四章 不完备混合邻域系统的三支决策模型 |
4.1 引言 |
4.2 处理不完备混合数据的粒计算方法 |
4.2.1 邻域容差关系 |
4.2.2 限制邻域容差关系 |
4.2.3 完备邻域容差关系 |
4.3 新的完备邻域容差关系近似度量方法 |
4.4 不完备混合数据的三支决策阈值获取方法 |
4.5 不完备混合数据的三支决策模型 |
4.5.1 算法描述 |
4.5.2 实例分析 |
4.6 实验分析和对比 |
4.6.1 参数对本文方法的单调性影响 |
4.6.2 分类性能分析与比较 |
4.7 本章小结 |
第五章 面向特定类的三支概率属性约简算法 |
5.1 引言 |
5.2 面向特定类的经典三支决策属性约简 |
5.3 面向特定类的三支概率属性约简 |
5.3.1 代数观下特定类的三支属性约简 |
5.3.2 信息论下特定类的三支属性约简 |
5.4 医疗诊断实例分析 |
5.5 约简模型的普适性研究 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 本文总结 |
6.2 未来展望 |
参考文献 |
致谢 |
发表成果和学术经历 |
(8)基于二进制可辨矩阵的知识获取算法研究(论文提纲范文)
摘要 |
Abstract |
专用术语注释表 |
第一章 绪论 |
1.1 课题研究背景与意义 |
1.2 研究现状及发展 |
1.2.1 粗糙集理论的发展 |
1.2.2 决策表知识约简的发展 |
1.2.3 基于二进制可辨矩阵知识约简的发展 |
1.3 本文的研究内容 |
1.4 本文的结构组织 |
第二章 粗糙集相关理论 |
2.1 粗糙集理论原理 |
2.1.1 信息系统与决策表 |
2.1.2 集合的上下近似与粗糙集 |
2.1.3 区分矩阵 |
2.1.4 属性重要度 |
2.2 知识约简与核 |
2.3 决策表属性约简 |
2.4 决策表规则提取 |
2.5 本章小结 |
第三章 广义二进制可辨矩阵的构造 |
3.1 引言 |
3.2 二进制可辨矩阵 |
3.2.1 二进制可辨矩阵的描述 |
3.2.2 适用于完备信息系统的二进制可辨矩阵 |
3.3 经典粗糙集的扩充关系模型 |
3.3.1 容差关系模型 |
3.3.2 限制容差关系模型 |
3.3.3 完备容差关系模型 |
3.4 广义二进制可辨矩阵的提出 |
3.4.1 设计思想 |
3.4.2 基本定义 |
3.4.3 相关定理及证明 |
3.5 本章小结 |
第四章 决策表的求核算法研究 |
4.1 引言 |
4.2 常用的求核算法 |
4.2.1 基于正区域的求核算法 |
4.2.2 基于信息熵的求核算法 |
4.2.3 基于可辨矩阵的求核算法 |
4.2.4 基于二进制可辨矩阵的求核算法 |
4.3 一种改进的基于二进制可辨矩阵的求核算法 |
4.3.1 设计思想 |
4.3.2 算法原理 |
4.3.3 算法步骤 |
4.4 实例仿真与分析 |
4.5 本章小结 |
第五章 基于广义二进制可辨矩阵的知识约简算法研究 |
5.1 引言 |
5.2 完备决策表属性约简算法 |
5.2.1 算法思想描述 |
5.2.2 算法步骤 |
5.2.3 实例仿真分析 |
5.3 不完备决策表属性约简算法 |
5.3.1 算法思想描述 |
5.3.2 算法步骤 |
5.3.3 实例仿真 |
5.4 基于广义二进制可辨矩阵的规则提取算法 |
5.4.1 算法思想描述 |
5.4.2 算法步骤 |
5.4.3 实例仿真 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 本文研究工作总结 |
6.2 研究工作展望 |
参考文献 |
附录 1 程序清单 |
附录 2 攻读硕士学位期间撰写的论文 |
附录 3 攻读硕士学位期间参加的科研项目 |
致谢 |
(9)基于粗糙集和粒计算的不完备数据挖掘研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 论文研究的背景及意义 |
1.2 数据挖掘 |
1.2.1 数据挖掘的产生及概念 |
1.2.2 数据挖掘模型与任务 |
1.2.3 数据挖掘的一般过程及分类 |
1.2.4 数据挖掘的发展趋势 |
1.3 理论工具及处理对象简介 |
1.3.1 粗糙集理论 |
1.3.2 粒计算理论 |
1.3.3 不完备决策表 |
1.4 国内外研究现状 |
1.5 本文工作及创新点 |
1.5.1 本文的主要研究内容 |
1.5.2 论文的创新点 |
1.6 论文的组织结构 |
第二章 基于阈值的差别矩阵求核算法 |
2.1 引言 |
2.2 差别矩阵 |
2.2.1 差别矩阵的概念及表示 |
2.2.2 完备决策表中基于差别矩阵的求核 |
2.2.3 已有的基于不完备决策表的差别矩阵 |
2.2.4 改进的不完备决策表的差别矩阵 |
2.3 一种新的不完备决策表求核方法 |
2.3.1 新的核属性获取方法分析 |
2.3.2 算法分析 |
2.4 实例分析 |
2.5 小结 |
第三章 区间粒模型研究 |
3.1 引言 |
3.2 扩充粗糙集模型对比分析 |
3.2.1 容差关系模型 |
3.2.2 相似关系模型 |
3.2.3 限制容差关系模型 |
3.2.4 最大一致块模型 |
3.3 区间粒模型及其知识表示 |
3.4 基于区间粒的粒层结构 |
3.4.1 完备信息系统中的粗集逼近 |
3.4.2 不完备信息中基于容差关系的粒层结构 |
3.4.3 基于区间粒套序列的粒层结构 |
3.5 实例分析 |
3.6 小结 |
第四章 基于区间粒模型的属性约简 |
4.1 引言 |
4.2 完备信息系统属性约简 |
4.2.1 完备信息系统的属性冗余性判定 |
4.2.2 完备决策表属性约简 |
4.3 基于容差关系的属性约简 |
4.3.1 基于容差关系的属性冗余性判定 |
4.3.2 基于容差关系的不完备决策表属性约简 |
4.4 基于区间粒的属性约简 |
4.4.1 不完备信息系统的属性冗余性判定 |
4.4.2 不完备决策表属性约简算法 |
4.5 实例分析 |
4.6 小结 |
第五章 属性约简算法实验 |
5.1 引言 |
5.2 实验设计 |
5.2.1 设计思路 |
5.2.2 基于区间粒模型的属性约简算法 |
5.2.3 实验环境及数据预处理 |
5.3 实验具体步骤 |
5.4 结果分析及性能对比 |
5.5 小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读硕士学位期间取得的科研成果 |
(10)复合粒计算模型研究进展(论文提纲范文)
0 引 言 |
1 粒计算模型 |
1.1 词计算 (computing with words) 模型 |
1.2 粗糙集 (rough set) 理论模型 |
1.3 商空间 (quotient space) 理论模型 |
2 几种典型的复合粒计算模型 |
2.1 粗糙模糊集 (rough fuzzy set) 模型 |
2.2 模糊粗糙集 (fuzzy rough set) 模型 |
2.3 模糊商空间 (fuzzy quotient space) 模型 |
2.4 模糊概念格 (fuzzy concept) 模型 |
2.5 随机粗糙集 (random rough set) 模型 |
3 粒计算模型的展望 |
4 结束语 |
四、粗糙集理论的一种新扩充模型(论文参考文献)
- [1]高速铁路调度集中系统硬件可靠性分析方法研究[D]. 韩浪. 中国铁道科学研究院, 2021(01)
- [2]基于混合数据处理方法的电力变压器状态评估方法研究[D]. 吴炜. 合肥工业大学, 2021(02)
- [3]覆盖粗糙集与模糊粗糙集及其在化工过程故障诊断中的应用[D]. 王敬前. 陕西科技大学, 2021(01)
- [4]面向聚类及预测的时间序列信息粒化方法研究[D]. 陈海兰. 北京科技大学, 2021(02)
- [5]基于机器学习理论的单沟泥石流危险性评价的相关问题研究[D]. 宁志杰. 河北地质大学, 2020(05)
- [6]基于邻域粗糙集的增量属性约简算法研究[D]. 侯文丽. 太原理工大学, 2020(07)
- [7]面向不完备邻域数据的三支决策模型与属性约简算法研究[D]. 彭莉莎. 江西农业大学, 2019(03)
- [8]基于二进制可辨矩阵的知识获取算法研究[D]. 杨星星. 南京邮电大学, 2014(05)
- [9]基于粗糙集和粒计算的不完备数据挖掘研究[D]. 陈小慧. 鲁东大学, 2012(09)
- [10]复合粒计算模型研究进展[J]. 薛志远,张清华. 重庆邮电大学学报(自然科学版), 2010(05)