一、一种新型决策树属性选择标准(论文文献综述)
孟祥飞[1](2021)在《基于机器学习的电力系统静态电压稳定评估及实时经济调度研究》文中提出实现“碳达峰、碳中和”已成为世界各国的共同目标,并且是未来的能源大趋势,提升可再生能源发电比例则是持续推进碳减排的重要方式和决定性因素。而高比例可再生能源的快速发展给电力系统带来历史性机遇的同时也带来了全新的问题与挑战:一方面,能源消费结构的不断优化升级对可再生能源发电的预测精度提出了更高的要求,风能、太阳能等一次能源自身所固有的间歇性、随机性和波动性极大的增加了电力系统经济调度的复杂性;另一方面,在现阶段大规模储能技术尚不完善的情况下,加强大电网建设以及鼓励交互式用能设备的使用,仍是推动可再生能源发展的必要手段,而网架结构的愈加复杂以及负荷特性的改变使电力系统静态电压稳定问题突显,经济调度在寻求经济性最优的同时,应先维持系统电压的稳定以确保电网安全稳定运行。因此,如何在可再生能源发电快速发展以及电压稳定问题突显的双重背景下实现实时经济调度,已成为现阶段需要重点研究解决的问题。虽然“双碳”新形势下高比例可再生能源的大规模并网给电力系统带来了新的挑战,但是以深度学习、集成学习等为代表的新兴机器学习技术的涌现为电力系统实际工程问题的解决提供了新方法和新思路。基于以上背景,本文首先研究基于深度学习的集中式光伏功率超短期预测方法,并将所得结果与负荷预测结果相结合以构建实时经济调度优化模型的功率平衡方程;然后,研究基于机器学习的静态电压稳定裕度评估方法,并以此为基础研究基于集成学习的静态电压稳定裕度可靠评估方法,利用离线分析所生成的静态电压稳定评估规则,构建实时经济调度优化模型的静态电压稳定约束条件;最后,研究基于深度学习的电力系统实时经济调度问题,将实时经济调度由优化问题转换为学习问题进行建模求解。本文具体工作内容如下:(1)为了构建更精细化的经济调度优化模型功率平衡方程,以便降低可再生能源并网给经济调度带来的不确定性,本文针对集中式光伏功率的超短期预测问题,提出了一种基于注意力机制的精准预测方法。首先,利用Spearman相关系数法和灰色关联分析技术对关键气象因素、时间相关性以及空间关联性等光伏功率基本特性进行分析;然后,基于光伏功率特性分析结果,对长短期记忆(Long Short Term Memory,LSTM)网络整体结构进行自适应设计,并提出了一种基于自适应LSTM的光伏功率超短期预测模型;最后,根据光伏功率序列基本特征将其归类为具有空间关联性的时间序列数据,并在预测模型构建的特征选择、时空特性分析等环节中引入注意力机制,构建了基于多层嵌套时空注意力网络(Multi-level Nesting Spatial Temporal-Attention Network,MNST-AN)的光伏功率超短期精准预测模型,突破了现有利用机器学习技术求解光伏功率预测问题必须预先进行特性分析的固有流程,有效避免了人为因素的影响并切实提升了预测精度。利用中国北方某省集中式光伏电站实际数据,验证了所提出的光伏功率超短期预测模型的可行性和预测精度。(2)为了构建经济调度优化模型的静态电压稳定约束条件,以便在保证系统安全稳定运行的前提下实现经济性目标,本文针对电力系统静态电压稳定问题,提出了一种基于决策树的静态电压稳定裕度评估方法。首先,利用P-V曲线分析技术对系统电压稳定裕度状态进行了划分(正常、预警、紧急),并根据划分区间对训练样本进行了选取;然后,利用参与因子分析技术对表征电压稳定的特征变量从物理意义层面进行了初选;其次,为了有效解决漏警问题,对Relief-F算法进行适用性改进,提出了一种考虑惩罚因子的Relief-F-P特征选择算法,从数据分类能力层面对特征变量进一步筛选;最后,基于C4.5算法构建了面向静态电压稳定裕度的决策树评估模型。利用中国南方某大负荷中心实际数据,验证了所提方法可以实现对系统电压稳定裕度状态的有效评估。(3)在前述研究的基础上,为了进一步提高评估精度,本文提出了一种基于随机森林的静态电压稳定裕度可靠评估新方法。首先,为了兼顾基决策树的多样性和学习能力,提出了一种基于P-V曲线随机抽取的训练样本子集构建方法;其次,为了保证引入扰动的可控性,提出了一种基于信息增益率的基决策树分裂属性选择方法;在此基础上,利用C4.5算法生成了具有差异性特点的基决策树,并采用绝对多数投票集成策略,构建了基于随机森林的静态电压稳定裕度可靠评估模型;最后,提出了一种综合考虑规则覆盖度和可靠度的规则评分方法,实现了对电压稳定裕度关键评估规则的提取。案例分析以中国南方某大负荷中心实际数据为基础,验证了所提出的基于随机森林的静态电压稳定裕度可靠评估方法的可行性和准确性。(4)针对电力系统实时经济调度问题,本文提出了一种基于深度学习的实时经济调度建模求解新思路。首先,利用光伏功率预测结果和静态电压稳定裕度关键评估规则,分别构建实时经济调度优化模型的功率平衡方程和静态电压稳定约束条件;然后,基于完美调度理念,利用海量历史数据通过经济调度优化模型生成学习模型的训练目标,实现了经济调度由优化问题到学习问题的转变;其次,分别利用层次聚类技术和矩阵相关性分析技术构建了差异化训练样本集;在此基础上,针对门控循环单元(Gated Recurrent Unit,GRU)网络的基本结构进行了自适应设计,并提出了基于自适应GRU的实时经济调度学习模型,模型一旦构建完成,输入调度时刻预测数据,即可得到相应的调度方案。利用IEEE-39节点测试系统验证了所提方法的可行性和调度方案精度,并利用IEEE-118节点测试系统进一步验证了其在大系统中的适用性和有效性。本文研究丰富了电力系统调度运行理论,相关研究成果有助于提升电网调度运行自动化、智能化水平,促进电力行业碳减排,助力我国“双碳”承诺的实现。
蒋天伦[2](2021)在《网络化协同制造系统的跨层生产优化调度》文中研究说明网络化协同制造系统是一种信息高度集成的智能制造模式,其协同层具有大数据集成的知识库以及知识推理、数据挖掘、信息交互等服务功能,而目前大部分能效调度优化方法在优化过程使用的运算资源局限于企业层、车间层等边缘层,对于利用系统的协同层知识库与服务进一步提高能效的优化调度的研究较为缺乏,此外,网络化协同制造系统的生产过程具有有柔性制造、多工厂协同生产等特征,这使得能效分析与优化变得极其困难,因此,网络化协同制造系统跨越协同层与边缘层生产优化调度的研究具有极其重要的意义。本文针对在网络化协同制造系统中单作业车间与分布式多工厂的能效优化问题展开研究,提出了相应的算法,取得了良好的优化调度效果,主要工作如下:(1)对网络化协同制造系统的信息流和能量流特征、主控因素、外部干扰进行分析,面向能效优化控制目标,针对边缘层独立制造车间的实时调度,及云端网络化分布式多工厂协同制造的虚拟资源优化调度问题,分别建立其对应的优化模型和跨层协同机制。(2)针对单作业车间能效优化问题,提出了一种融合案例推理与混合群智能的调度优化方法。该方法在粒子群优化算法框架下,融合了遗传算法交叉变异算子,并基于调度问题的特征采用三元表示法将协同层知识库中的历史调度案例信息资源转化为数字表示形式,以此进行相似度运算,将其引入到调度优化算法种群筛选后的补充个体生成过程,提高后期迭代过程中的多样性。通过仿真与分析验证了该方法的有效性。(3)针对分布式多工厂能效优化的问题,提出一种融合了ID3决策树的高斯粒子群优化嵌套寻优算法,该算法将异地工厂看做独立的加工单元,把加工单元订单分配寻优作为作为嵌套寻优的外层,调度优化作为内层,多个单元寻优决策结果与云端外部寻优交互反馈,同时还引入了精英保留策略,并将ID3决策树技术融入外层寻优粒子生成过程,降低外层寻优过程中的随机性。最后,通过仿真对比实验验证方法的有效性。(4)根据以上的理论研究以及工厂的实际需求,使用Thymeleaf等前端技术搭建了前台可视化页面,同时,使用Spring Boot、Mybatis、Hadoop等大数据微服务信息技术对后台应用模块的逻辑功能进行了开发,并将开发后的系统应用于无锡某机床股份有限公司,实现了良好调度优化效果。
潘霞[3](2021)在《基于Google Earth Engine云平台下地物覆被类型的遥感影像智能分类方法研究》文中进行了进一步梳理以全球土地覆被产品MCD12Q1 Version 6、Landsat-8 OLI及Sentinel-2 L1C为主要遥感影像数据源,结合SRTM V4.1数据集及专题指数的计算,构建光谱、纹理、地形多维分类特征集,对研究区内丰富且繁杂的独立性较弱的多种混合地物覆被类型进行自动且准确的识别和提取,即Landsat-8 OLI和Sentinel-2 L1C遥感影像从全球土地覆被产品MCD12Q1 Version 6 IGBP_LC_Type1分类系统里详细的类别标签中自动采集各地物覆被类型下的训练样本,实现大型训练样本数据集的自动创建,并通过利用空间过滤、同质像素筛选及质量控制措施降低Landsat-8 OLI和Sentinel-2 L1C遥感影像地物覆被类型的潜在错误分类,以提高大型训练样本数据集自动创建的准确性。此外,采用卷积神经网络中的深层次残差网络ResNet-101分类器学习上述已给定类别的训练数据的分类规则,以对未知数据进行分类,并同调参优化后传统分类器中最常用的随机森林、分类回归树、支持向量机进行对比分析,通过定量精度评价验证大型训练样本数据集自动采集方法和新型深层次残差网络ResNet-101分类器的可靠性,提出了一种快速、高效、准确、精细的高精度遥感影像智能分类方法,以期减弱地物覆被智能分类中人为因素对分类结果的干扰,极大地简化分类流程,并丰富遥感影像中土地利用与覆盖信息的提取理论、分类算法及分析处理的技术平台,提高土地利用与覆盖的分类精度和更新速度,为土地资源的有效利用与实时监测提供参考依据。该方法的主要步骤都是在谷歌地球引擎Google Earth Engine云平台中实现,目的是通过自主编写代码实时提取遥感影像和在线分析地物覆盖信息,集数据获取和分析处理于一体,促进运行程序自动化,有效解决传统遥感影像地物覆被信息提取和分类流程耗时费力等问题。以下为主要研究工作和结论:(1)提出了以参数调整为基础的传统多分类器的遥感影像分类优化系统根据遥感影像的光谱特征,就常用的核函数、核参数选择方法对传统多分类器进行优化研究,提出了以随机森林、分类回归树及支持向量机分类器的核函数、核参数调整为基础的遥感影像分类优化系统,并通过网络搜索法分别论证了调参优化后传统多分类器的适用性和优越性,同时能够挣脱分类指标函数的搜索局限性。两种Landsat-8 OLI和Sentinel-2 L1C影像数据的研究结果表明,本文提出的优化后的传统分类器参数均能获得较优的分类性能,有助于提高分类精度。(2)构建了基于TensorFlow的深层次残差网络ResNet-101分类器通过引入残差注意力机制,实现消除网络冗余及增强显着特征的目的。为了避免深层次残差网络ResNet-101分类器中因网络层数增加而产生的梯度消失现象,在前馈神经网络中增加一个以不同步长跳过多个层与主径汇合的捷径来实现,并通过增加线性投影来保证输入和输出的维度相同。通过超参数设置使残差网络ResNet-101分类器在训练数据集时的训练时间和收敛精度均达到最优值。最后,基于TensorFlow将深层次残差网络ResNet-101运行过程以流程图的形式表达,并提出了对计算链路进行完整构建和优化的具体实施途径,其中使用Re LU激活函数提高收敛速度,并增加1×1卷积模块改变维度,从而提高分类精度。(3)实现了基于MCD12Q1的地物覆被类型大型样本数据集的自动创建通过土地覆被产品MCD12Q1 Version 6 IGBP_LC_Type1实现大型训练样本数据集的自动创建,即Landsat-8 OLI和Sentinel-2 L1C遥感影像从现有已分类的土地覆被产品MCD12Q1 Version 6 IGBP_LC_Type1分类系统里详细的类别标签中自动采集各地物覆被类型下的训练样本,并通过空间过滤、同质像素筛选及质量控制措施降低Landsat-8 OLI和Sentinel-2 L1C遥感影像地物覆被类型的潜在错误分类,以提高大型训练样本数据集自动创建的准确性,实现了对研究区内丰富且繁杂的独立性较弱的多种混合地物覆被类型进行自动、详细且准确的识别和提取,减弱了人为因素对分类结果的干扰,并极大地简化了分类流程,提出了一种快速、高效、准确、精细的高精度遥感影像大型样本数据集的自动创建方法。(4)通过定量精度评价验证了地物覆被智能分类方法的可靠性对传统分类器中的随机森林、分类回归树、支持向量机及新型残差网络ResNet-101分类器下地物覆被智能分类结果的可靠性进行定量精度评价。定量精度评价是将分类结果与验证样本进行基于混淆矩阵的定量精度分析。基于所产生的混淆矩阵,分别对生产精度、用户精度、总体精度、Kappa系数、漏分误差及错分误差等分类精度指标进行计算。总体精度评价结果表明,基于Landsat-8 OLI和Sentinel-2 L1C影像的研究区内地物覆被类型在深层次残差网络ResNet-101分类器下的分类精度和总体性能最优。(5)基于谷歌地球引擎Google Earth Engine云处理的自编程语言设计遥感影像数据均从谷歌地球引擎Google Earth Engine云平台在线获取,导入后的遥感影像数据集与全球矢量地图或者卫星地图叠加形成高度可视化的数据呈现方式和交互式分析界面,通过云端存储的海量遥感影像数据集和分析处理算法,直接编写相应代码进行调用、处理及分析应用工作,集数据获取和分析处理于一体。试验结果证明,集成化的处理和并行运算的方式极大地提高了运行效率,并节省了本地存储空间。Google Earth Engine云平台强大的云端运算能力,为大尺度区域下遥感影像的处理和分析提供了十分便捷的技术平台。
倪元元[4](2021)在《突发事件期间人群决策偏好与健康知识水平及其心理健康状况的影响研究 ——基于COVID-19的数据分析》文中指出目的:本研究旨在了解突发事件发生时公众的疫情信息获取途径、相关知识水平、心理和睡眠现况,探讨个人决策偏好与获取途径的关系以及获取途径、决策偏好与健康知识水平和心理健康状况的关系,为突发事件防护信息的有效宣传提供理论支持,为公众心理健康干预提供依据。方法:以普通人群作为研究对象,不对年龄、性别、地点等进行限定,采用方便抽样法对自愿参与研究的人群进行在线电子问卷调查。对所有数据采用问卷星直接导出并生成相应Excel表格,运用SPSS20.0统计学软件对数据进行统计描述和统计分析,P<0.05将被认为具有统计学意义。应用频数、构成比对研究对象的一般资料进行描述性统计;应用卡方检验分析公众决策偏好的主要影响因素;应用单因素方差分析探讨信息获取途径与公众知识水平、睡眠质量和焦虑程度的相关性;应用卡方检验探讨决策偏好与信息获取途径的关系以及和知识水平、睡眠质量以及焦虑程度的相关性。应用决策树算法对数据进行进一步分类,提取有效信息。结果:公众决策偏好为被动决策的占47.2%(503/1065),共享决策的占34.4%(366/1065),主动决策的占18.4%(196/1065);通过社交媒体获取疫情相关知识的公众占总人数的54.5%,通过官方媒体获取疫情相关知识的公众占总人数的43.4%,通过亲朋好友获取疫情相关知识的公众占总人数的2.2%,最信任的获取途径为官方媒体,占83.7%;公众新冠肺炎基本知识评分及格率为90.8%(967/1065);匹兹堡睡眠指数量表结果显示,有72.3%的研究对象出现睡眠问题;疫情期间有焦虑情绪的公众占总人数的62.35%(664/1065)。1.卡方检验显示:公众的决策偏好与获取途径相关(p=0.016)。2.方差分析显示:公众的疫情信息获取途径与知识水平呈相关性(p<0.001);与匹兹堡睡眠质量呈相关性(p=0.001);与焦虑程度呈相关性(p=0.010)。3.卡方检验显示:决策偏好与知识水平(p=0.001)、焦虑程度(p<0.001)、睡眠质量(p<0.001)存在相关性。结论:(1)公众的决策偏好多倾向于被动决策,共享决策程度较低;知识呈较高水平;大多通过社交媒体途径了解疫情相关知识,但更信任的是官方媒体;睡眠质量较差;焦虑水平较高。(2)公众的决策偏好与知识获取途径相关。(3)公众的信息获取途径与知识水平呈相关性;与睡眠质量呈相关性;与焦虑水平呈相关性。(4)公众的决策偏好与知识水平呈相关性;与焦虑水平呈相关性;与睡眠质量呈相关性。
李茵[5](2021)在《面向医院管理的数据驱动决策研究》文中进行了进一步梳理信息技术的快速发展与应用以及大数据战略的深入实施,使得大数据成为科技创新引领与决策支撑的重要战略资源,科学研究与实践正在完成“假设驱动”到“数据驱动”的巨大转变,大数据的深度挖掘与利用能够为社会发展、政府治理、国家安全等提供新的动能。围绕国家大数据战略,丰富和拓展大数据应用创新领域,推动管理升级,给学术界、产业界以及政府部门带来许多新的重要课题。其中面向健康服务供给侧的决策支持、决策引导和决策创新中的数据驱动、数据价值转换问题即是管理学、数据科学的核心科学问题之一,更是情报学应对大数据环境开展智慧型情报服务必须解决的关键问题之一。健康医疗大数据时代的到来,促使医院管理和医院管理者的观念都随之变化。数据驱动对医院精细化、智慧化管理决策具有重要意义。本研究从提升医疗管理决策质量的角度出发,构建数据驱动医院管理决策过程模型,分析数据驱动医院管理决策的影响因素,进而提出面向医院管理的数据驱动决策模型,并展开实证研究,为数据驱动决策领域的研究理论基础和实证研究提供参考依据,为促进医院精细化管理提供对策及建议。基于此,通过界定“数据驱动”、“医院管理”、“医院管理评价”与“数据驱动决策”等相关概念,以回顾数据驱动决策、面向医疗健康领域的数据驱动决策、面向医院管理的数据驱动决策以及数据驱动决策的影响因素研究现状为基础,综合运用文献调研法、半结构访谈法、问卷调查法、扎根理论法、结构方程法、统计分析法、机器学习法分析了面向医院管理的数据驱动决策的过程模型和影响因素模型,并构建了面向医院管理的数据驱动决策模型。围绕面向医院管理的数据驱动决策模型这一核心研究内容,本文第三章在已有BASM模型研究过程的基础上,结合医院管理决策场景的特殊性,探索面向医院管理的数据驱动决策的运行机理,构建面向医院管理的数据驱动决策过程模型,以梳理驱动的路径,理清其中的内在逻辑。该模型由处理过程模型及支持过程模型两部分构成,旨在分别回答面向医院管理的数据驱动决策过程中两个核心问题,一是数据本身如何转化并如何嵌入到医院管理决策过程中,二是医院中能够支持并且推动数据驱动决策的途径是什么。第四章采用扎根理论进行了面向医疗管理领域数据驱动决策的影响因素识别研究,编码面向医院管理者的半结构化访谈资料,经过饱和度测试,最终识别出了四个维度的影响因素。第五章在对影响因素定性研究的基础上利用结构方程模型方法进一步验证影响因素,探讨相关变量的权重和关系。阐述各个因素对医院管理决策的影响关系,验证数据驱动医院管理决策影响因素模型。第六章整合数据驱动医院管理决策过程模型和影响因素模型,构建支持医院管理决策全过程的数据驱动决策模型,探讨过程模型与影响因素模型的内在联系。第七章根据已构建的面向医院管理的数据驱动决策模型,进行基于DRGs分组的医疗服务能力评价和医生绩效评价管理工作的实证研究,修正和完善已构建的模型。具体内容如下:(1)构建面向医院管理的数据驱动决策过程模型。基于现有的数据驱动决策机制模型,结合医院管理实践,构建面向医院管理的数据驱动决策过程模型,该模型由处理过程模型及支持过程模型两部分构成,处理过程模型包括面向医院管理决策的数据处理过程和数据驱动的医院管理决策处理过程。决策处理过程既是数据处理过程的最后阶段,对数据处理的结果进行展示与应用,又会不断地产生新的数据,前推已有数据的老化和错误,补充和修正数据处理过程。而数据处理过程以决策处理过程中的阶段性需求为导向,能嵌入到决策处理过程的所有阶段,为决策处理的全流程服务。支持过程模型主要涉及两用户一技术。两用户包括数据分析人员和管理者,使能技术是创建和改进能够嵌入到操作系统的分析工具,这三个主体不能割裂独立,而可以互相转化并可能同时存在,共同对数据和决策进行处理,支持处理过程模型运转。(2)系统分析了面向医院管理的数据驱动决策影响因素。对主观及客观上影响管理者数据驱动决策的因素进行整合和相关分析,确定四个核心影响因素范畴分别是医疗数据质量,信息技术,医院组织管理和管理者信息素养,构建了影响因素模型,发现数据驱动医院管理决策能受到管理者信息素养、医院组织管理和信息技术的正向影响,其中管理者信息素养最强,其次是医院组织管理和信息技术;医院组织管理对医疗数据质量、管理者信息素养、决策目标均有影响,对医疗数据质量的影响要强于管理者信息素养;医疗数据质量能够对信息技术产生正向影响;信息技术对决策目标具有正向影响。(3)构建了面向医院管理的数据驱动决策模型。将过程模型与影响因素模型有机结合在一起,构成了面向医院管理的数据驱动决策模型。打造数据驱动决策模型,将医院数据质量标准化管理贯穿于医院管理全流程、智能化管理提升医务人员的信息技术、高效化管理增效医院组织三个方面分析模型的实现,提出模型优化建议。(4)基于DRGs的肺癌医疗服务绩效分析实证研究。模拟医院管理中运用DRGs分组工具解决绩效问题的真实场景,应用数据驱动医院管理决策模型,优化DRGs分组,优化绩效管理。研究最终确定性别、年龄、入院途径、离院方式、住院次数、医保付费方式、是否手术、合并症严重情况八个因素为影响肺癌医疗服务费用的因素,构建了8个DRGs分组,其中合并症严重程度、是否手术、住院次数是决策树分组的分类结点变量。选用医疗服务能力的指标(DRGs总权重、CMI)根据获取的数据进行比较,完成绩效评价工作,实现基于数据驱动决策的绩效管理。
章建赛[6](2021)在《基于区块链技术的信用治理研究》文中提出区块链被《经济学人》杂志定义为“信任的机器”,是由信息互联网转向价值互联网的关键核心技术,是数字经济时代能够改变生产关系的技术革命。在区块链技术条件下,合作秩序将由中心化到去中心化转变。信用是现代市场经济运作的核心生产关系之一,区块链技术将重塑人类社会的信用治理。本文在理论层面,系统梳理了信任、信用及区块链的学术谱系,拓展演化经济学分析方法,分析了区块链的共识机制及从区块链机器信任投射到人类社会信用治理的原理,应用博弈理论研究了去中心化的理性个体的信用特征,以及有限理性条件下产生信用合作的稳定性。并从个体行为和群体行为两个层面,分析了三类区块链所形成的社会网络的信用演化和变异规律。其中,在个体行为层面,构建微观经济学偏好分析模型,推导了公有链中Token(代币)经济的信用偏好承袭演化、信用合作的场域和市场均衡状态;在群体行为层面,引入病毒感染模型,推演了 DeFi(去中心化金融)在私有链随机网络、联盟链无标度网络环境下的信用变异特征。在应用层面,本文构建了个人信用评价、中小企业信用评价2个改进模型,并应用实践数据进行了实证研究。其中,在个人征信上引入区块链的“币天销毁”技术,构建“币天销毁”信用评价模型,应用机器学习算法进行了实证研究;在中小企业授信方面,将不可篡改的企业主特征信息变量加入传统的信用评价模型,构建区块链增强信息的企业信用评价模型,并采用Logistic回归算法进行实证研究。实证研究验证了基于区块链技术改进的个人和企业信用评价模型,在区分能力、识别能力等方面均优于传统信用评价模型,具有良好的应用前景。面向未来数字世界,区块链分布式账本体系将深化(而不是替代)传统的由中央银行创造、商业银行扩张的中心化的信用创造和治理体系,并从人类社会的信用治理延伸到物理世界的信用治理,深入到“云-管-端-边”的设备系统治理中,通过“+区块链”和“区块链+”实现从万物互联、万物智能到万物账本的“设备民主”和设备自治。区块链技术对信用要素之间的结构关系和运行方式的重构,对信用生成、发展、应用、拓展和监管等治理的变革,尚处于初期阶段,未来必将进一步深化。
郝淑玲[7](2021)在《抽样调查无响应问题研究》文中研究指明抽样调查中的无响应问题,是影响调查信度和数据品质的重要因素之一。无论是入户访问或街头拦截等面访调查,还是基于互联网介质的在线调查,受访者面对调查问卷的无响应行为均受到多源复杂因素影响。抽样调查中,不仅要在设计阶段采用科学的抽样方案和技术以降低抽样误差,而且要在调查执行阶段充分关注受访者无响应带来的深远影响。受访者对调查问卷或者问题的无响应,主要有两个来源,一是随机无响应,二是主观无响应。随机无响应可以通过抽样设计做出积极的改进和规避,而主观无响应可能来自受访者对调查主题的敏感程度、隐私保护意识或者对调查本身的价值判断。同时,样本群体的复杂度、样本单元的流动性、调查环境等外部要素也对无响应问题有较大影响。因此,仅仅采用问卷回收率、响应率等传统指标来评估抽样调查的质量和数据质量显然是不够的。来自流动人口的抽样调查具有典型性。流动人口是在中国固定户籍制度背景下产生的一个特殊群体,为中国经济社会的发展做出了重大的贡献。流动人口的抽样调查受到复杂的社会经济因素影响,无响应问题比较突出,导致调查数据不可避免地出现缺失,影响了数据质量。本文以流动人口抽样调查中出现的项目无响应问题为切入点,深入分析了抽样调查中的无响应问题,对主观无响应的成因进行了剖析,阐述了由此造成的数据缺失的机理和数据插补方法,并以流动人口调查数据为研究对象,对流动人口抽样调查中的代表性响应进行了测度,以达到评估调查质量的目的,同时就如何处理流动人口抽样调查中的项目无响应问题进行深入研究。第二章是本文的逻辑起点,对抽样调查中的无响应问题造成的数据缺失的机理进行了详细分析,为无响应问题的研究提供理论基础。第三章是项目无响应的处理方法研究,为项目无响应问题的处理提供方法论支持。第四章阐述了我国流动人口抽样调查的方案设计,是研究流动人口抽样调查中的项目无响应问题的基础,从抽样设计的角度反思出现项目无响应的原因。第五章是流动人口调查中项目无响应插补的实证研究,从实证角度测度流动人口抽样调查中的项目无响应问题,并基于单插值方法、多重插值方法和结构逻辑插值方法对流动人口抽样调查中的缺失数据进行插值;第六章是对流动人口抽样调查中项目无响应问题研究的相关结论、政策建议和研究展望。本文在抽样调查中的无响应问题及数据插补方法等方面,主要做了以下四个方面的工作:第一,深入探究了抽样调查中的无响应问题引致的数据缺失的机理。调查中受访者的无响应行为必然引起数据缺失,解决数据缺失问题首先是要识别引起受访者无响应的数据缺失机制。本文详细分析了完全随机缺失(missing-completely-at-random,MCAR)、随机缺失(missing-at-random,MAR)和非随机缺失(not-missing-at-random,NMAR)三种数据缺失机制,这是后文进行无响应问题研究的理论基础。无响应产生的后果是使总体特征估计量有偏,本文将无响应与抽样理论相结合探究了无响应对总体特征估计量的影响。第二,进一步完善了R统计量对抽样调查质量评估的理论基础和应用方法,设计了抽样调查质量评价的R算法,构建了抽样调查评估的一类新体系。关于抽样调查质量的探讨,现有文献主要集中在使用响应率对抽样调查质量进行评估,响应率越高,响应样本的代表性越强。但相关研究表明,响应率和响应样本的代表性之间没有必然关系,而R统计量可以测度响应样本的代表性,可以在更深入和细致的问题层面描述和估计调查质量。本文将R统计量视为响应率的重要补充指标,对测度响应代表性的R统计量和偏R统计量进行了扩展,构造出R统计量的标准误差和置信区间,最后基于2017年的中国流动人口动态监测数据进行了实证分析,完善了R统计量的落地与应用。本文同时编写了实现R统计量和偏R统计量的计算机程序。值得说明的是,表示响应代表性的R统计量和偏R统计量是对现有文献的统一整合,R统计量的标准误差和置信区间的计算是本文完成的对R统计量测度的重要补充。第三,对项目无响应的处理方法进行了系统研究。插值方法是处理项目无响应的常用方法,首先详细分析了插值方法的理论机制,然后对现有的单插值、EM插值、多重插值和分数插值方法进行了系统比较,并探讨了现有插值方法的适用条件和优缺点,最后提出了结构逻辑插值方法。本文设计的结构逻辑插值方法是包含分类插值、关联插值和多重取优插值的一个综合插值方法;结构逻辑插值方法是问题导向的插值方法;结构逻辑插值方法是抽样学习的一个方法,通过机器学习中的算法学习到分类规则、关联规则、多重取优规则,或更具体地说,通过抽样学习的方法,学习到个体的群特征、统计特征和个体行为特征,并基于这些特征对缺失样本进行插值,本文根据这个理论构建了项目无响应插值的完整体系。第四,从实证角度对流动人口调查中的项目无响应问题进行了测度,从而评估无响应对流动人口抽样调查质量的影响,然后基于单插值方法、多重插值方法和结构逻辑插值方法对影响流动人口居留意愿中的缺失数据进行了插值,并从不同角度对各种插值方法的效果进行了评估。具体来说,除了使用传统的方差比较的方法及将插值后的数据与原始数据进行对比的方法比较各种插值方法的效果外,本文提出在结构逻辑插值分析中使用Kappa一致性分析用于比较各种插值方法的优劣。抽样调查中的无响应问题直接导致不同程度的数据缺失,在不同程度上影响了抽样调查的质量。本文的创新之处在于完善R统计量的理论基础和算法设计,将R统计量作为响应率的补充指标来评估抽样调查中的无响应问题,从而评估抽样调查的质量,进一步改进了多重插值方法,最后提出新的结构逻辑插值方法对抽样调查中的项目无响应问题进行插值和评估。
车露美[8](2021)在《基于决策树的集成学习算法及其在生存分析中的应用》文中研究表明生存分析是研究事件发生时间的一种统计方法,包括死亡、疾病复发、治疗反应、失业破产、客户流失等问题,在生物学、医学、工程学和经济学等许多领域都有广泛的应用。生存分析的最主要挑战是如何有效处理生存信息不完全的删失数据,许多传统的统计方法已经被发展,建立生存时间与各种风险因素的生存分析预测模型。如何识别重要的癌症预后特征,构建适用于高维基因组数据的生存预测模型,对统计建模和计算提出了巨大的挑战。这仍然是一个亟待解决的研究问题,需要开发更先进的机器学习方法,构建更精确的高维基因组数据的生存分析模型。针对生存分析中的这些问题,本文研究了基于决策树集成学习的生存分析方法。主要研究内容和结论如下:(1)首先,基于随机生存森林和梯度提升生存树,建立了有效的生存分析模型;然后使用生存分析模型的风险评分预测,构建了预后风险分层模型;最后,将上述模型在TCGA数据集上作实证分析。实验结果表明,构建的预后风险分层模型能够显着地区分高危和低危癌症患者群体。(2)提出了基于重采样的XGBoost的特征基因选择算法,选取的特征基因提高了生存分析模型的预测性能。在乳腺癌数据集上进行实证分析,结果表明,本文提出的算法能够准确地识别剔除冗余基因,提高生存分析预测模型的准确性。(3)针对流行性新冠肺炎对医疗体系带来的资源配置挑战,研究了基于COVID-19患者住院时间的生存分析问题,建立了基于贝叶斯优化和决策树集成的生存分析模型。实验结果表明,相比其他基准算法,基于贝叶斯超参数优化的随机生存森林,取得较高的一致性指数评价值,能够较准确地预测患者的出院时间。
张旻宇[9](2021)在《基于增量式学习与集成学习的入侵检测方法研究》文中研究表明近年来,入侵检测系统已发展成为网络安全领域的一个重要组成部分,应用前景非常广阔。但是,目前的入侵检测系统还存在检测精度低、误报率高、实时性差等问题,难以在较短的时间内获得令人满意的检测结果。为了解决这些问题,基于机器学习的入侵检测方法得到了广泛关注和研究。决策树算法具有分类精度高、速度快、模型易于理解等优点,因此被广泛应用在入侵检测中。然而,现有的基于决策树的入侵检测方法还存在很多问题亟待解决。首先,这些方法大多采用静态策略来获取决策规则,每当数据集发生变化,都需要在整个数据集上重新创建决策树,难以有效处理动态数据;其次,采用单一决策树可能会出现误差和过拟合问题,所构建的入侵检测模型的性能很多时候难以令人满意。针对上述问题,本文将研究新的、更适合于网络入侵检测的决策树算法,并利用这些算法来检测入侵行为。首先,为了解决现有决策树算法分裂属性的选择标准不合适等问题,提出一种基于粒度决策熵的决策树算法DTGDE,并将其应用于入侵检测;其次,为了有效地处理动态数据,我们从增量式学习的角度来改进DTGDE,提出一种基于粒度决策熵的增量式决策树算法IDTGDE,并将其应用于入侵检测;第三,为了解决单一决策树可能出现的误差和过拟合问题,我们从集成学习的角度来改进DTGDE,提出一种基于粒度决策熵的决策森林算法DFGDE,并将其应用于入侵检测。本文的主要研究工作如下:(1)基于粒度决策熵的决策树算法及其在入侵检测中的应用现有的决策树算法存在分裂属性的选择标准不合适、子树存在大量重复等问题,本文结合粗糙集理论中的粗糙度与知识粒度这两个概念,提出一种基于粒度决策熵的决策树算法DTGDE,并应用于入侵检测。DTGDE采用粒度决策熵来作为分裂属性的选择标准。相对于现有的信息熵模型,粒度决策熵能够同时对知识的完备性和知识的粒度大小进行有效度量,因此,利用其来选择分裂属性可以更加全面地考察每个属性对决策分类的贡献。实验结果表明,相对于现有的决策树算法,DTGDE算法具有更好的入侵检测性能,此外,其在入侵检测效率上也表现较好。(2)基于粒度决策熵的增量式决策树算法及其在入侵检测中的应用针对现有的增量式决策树算法存在分裂属性选择标准不合理、处理动态数据的效率低等问题,本文从增量式学习的角度来改进(1)中所提出的算法DTGDE,并由此提出一种基于粒度决策熵的增量式决策树算法IDTGDE。IDTGDE算法首先基于粒度决策熵模型在初始训练集上创建初始决策树,然后,利用增量式学习的思想来有效地处理增量式数据。为了将IDTGDE算法更好地应用于入侵检测,在构建决策树之前,我们引入了三种原始数据的预处理机制。实验结果表明,IDTGDE算法不仅具有较好的入侵检测性能,而且计算开销非常小。(3)基于粒度决策熵的决策森林算法及其在入侵检测中的应用采用单一决策树可能会出现误差和过拟合问题,而集成学习则可以有效解决上述问题。集成分类器可以获得比仅使用单个分类器更强的泛化能力。为了在较短的时间内构建出性能令人满意的入侵检测模型,本文从集成学习的角度来改进(1)中所提出的算法DTGDE,并由此提出一种基于粒度决策熵的决策森林算法DFGDE。DFGDE算法首先使用自助采样机制来生成多个采样集;然后,在每一个采样集上分别进行随机属性选择,并使用DTGDE算法来构建一棵决策树;最后,将前面生成的所有决策树通过加权投票的方式组合成一个决策森林。实验结果表明,相对于已有的具有代表性的集成学习算法而言,DFGDE具有更好的入侵检测性能。特别是,DFGDE的入侵检测性能要优于DTGDE。
单杰[10](2021)在《基于机器学习的变压器色谱峰识别和故障诊断研究》文中指出变压器是保证电力系统安全稳定运行的关键设备之一,油中溶解气体分析(Dissolved Gas Analysis,DGA)是诊断变压器故障的重要手段。而油色谱在线监测技术是目前监测变压器油中溶解气体最有效的方法之一。变压器油色谱在线监测技术的特点:没有人工操作,系统自动完成油样采集、油气分离、多组分气体逐一分离、色谱峰识别及故障诊断等功能。在变压器油色谱在线监测技术中,准确的色谱峰识别是变压器故障诊断的前提。为提高变压器油色谱在线监测装置的可靠性,本文分别针对在线监测装置在长时间运行后存在色谱峰位置偏移情况,提出了基于C4.5决策树的变压器色谱峰识别算法;针对传统BP神经网络变压器故障诊断模型准确率不高的问题,提出了基于自适应多子群樽海鞘群算法(Adaptive multi-group slap swarm algorithm,AMSSA)的BP神经网络变压器故障诊断模型。本文的主要工作如下:(1)回顾了变压器油色谱在线监测技术的背景,分析了该技术中变压器色谱峰识别和故障诊断两方面的内容,总结了目前主流方法的优缺点以及今后发展的趋势。(2)简述了变压器油色谱在线监测技术和机器学习的一些基本理论。在变压器油色谱在线监测技术中,重点突出了变压器色谱峰的识别难点以及油中溶解气体产生的原因。在机器学习方法中,重点讨论了C4.5决策树算法以及BP神经网络模型的基本原理。(3)针对变压器色谱峰移动导致对气体色谱峰的误判和漏判现象,提出了一种基于C4.5决策树算法的变压器色谱峰识别方法。C4.5决策树对于根节点选取时,采用二分法对连续属性进行离散化处理,本文提出的方法根据此过程得到色谱峰特征属性的自适应阈值,从而达到色谱峰正确识别的效果。利用色谱峰测试样本集对该算法进行测试,准确率达到95.23%。(4)针对传统BP神经网络变压器故障诊断模型准确率不高的问题,提出了一种基于AMSSA-BP神经网络的变压器故障诊断模型。该模型采用AMSSA算法优化BP神经网络中的初始权值和阈值以此来提高变压器故障诊断模型的性能。其中,本文提出自适应代数交流机制和多子群机制来提高樽海鞘群算法的性能,使其进一步适应BP神经网络算法。利用465条变压器故障数据进行测试,实验结果显示本文提出的改进模型与传统BP神经网络变压器故障诊断模型相比,准确率上升了7.78%。
二、一种新型决策树属性选择标准(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一种新型决策树属性选择标准(论文提纲范文)
(1)基于机器学习的电力系统静态电压稳定评估及实时经济调度研究(论文提纲范文)
致谢 |
摘要 |
abstract |
1 绪论 |
1.1 研究背景 |
1.2 研究意义 |
1.3 国内外研究现状 |
1.2.1 光伏功率预测 |
1.2.2 电力系统静态电压稳定分析 |
1.2.3 电力系统经济调度 |
1.4 论文主要内容及章节安排 |
2 基于注意力机制的集中式光伏功率超短期预测研究 |
2.1 引言 |
2.1.1 问题描述 |
2.1.2 研究思路 |
2.2 基于数据挖掘的光伏功率特性分析 |
2.2.1 基于Spearman相关系数法的关键气象因素筛选 |
2.2.2 基于Spearman相关系数法的光伏功率时间相关性分析 |
2.2.3 基于灰色关联分析的光伏功率空间关联性分析 |
2.3 基于自适应LSTM网络的光伏功率超短期预测方法研究 |
2.3.1 深度学习理论及RNN |
2.3.2 基于自适应LSTM网络的光伏功率超短期预测模型 |
2.4 基于MNST-AN的光伏功率超短期精准预测模型 |
2.4.1 注意力机制基本原理 |
2.4.2 基于MNST-AN的光伏功率精准预测模型构建方法研究 |
2.5 案例分析 |
2.5.1 基于自适应LSTM网络的光伏功率超短期预测模型验证 |
2.5.2 基于MNST-AN的光伏功率预测模型验证 |
2.6 本章小结 |
3 基于决策树的静态电压稳定裕度评估研究 |
3.1 引言 |
3.1.1 问题描述 |
3.1.2 研究思路 |
3.2 静态电压稳定学习模型的训练样本生成 |
3.3 表征静态电压稳定的关键特征变量筛选 |
3.3.1 基于参与因子分析的特征变量初选 |
3.3.2 基于Relief-F-P算法的决策树属性集构建 |
3.4 基于决策树的静态电压稳定裕度评估模型 |
3.4.1 决策树理论 |
3.4.2 基于C4.5 算法的决策树模型构建 |
3.5 案例分析 |
3.6 本章小结 |
4 基于随机森林的静态电压稳定裕度可靠评估研究 |
4.1 引言 |
4.1.1 问题描述 |
4.1.2 研究思路 |
4.2 集成学习 |
4.2.1 集成学习理论 |
4.2.2 随机森林 |
4.3 多样性基决策树构建 |
4.3.1 基于P-V曲线随机抽取的基决策树训练样本选取 |
4.3.2 基于信息增益率的基决策树属性筛选 |
4.4 基于随机森林的静态电压稳定裕度可靠评估模型 |
4.5 案例分析 |
4.6 本章小结 |
5 基于深度学习的电力系统实时经济调度研究 |
5.1 引言 |
5.1.1 问题描述 |
5.1.2 研究思路 |
5.2 基于静态电压稳定约束及数据挖掘技术的训练样本集构建 |
5.2.1 基于完美调度理论和静态电压稳定约束的训练目标生成 |
5.2.2 基于层次聚类技术的历史相似日筛选 |
5.2.3 基于矩阵相关性分析技术的关键历史时刻筛选 |
5.2.4 实时经济调度学习模型差异化训练样本集构建 |
5.3 基于GRU的实时经济调度自适应学习模型 |
5.3.1 基于GRU的自适应学习模型构建及超参数设置 |
5.3.2 自适应学习模型运行模式 |
5.4 案例分析 |
5.4.1 IEEE-39 节点测试系统性能分析 |
5.4.2 IEEE-118 节点测试系统性能分析 |
5.5 本章小结 |
6 结论与展望 |
6.1 结论 |
6.2 展望 |
参考文献 |
作者简历及攻读博士学位期间取得的研究成果 |
学位论文数据集 |
(2)网络化协同制造系统的跨层生产优化调度(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.2 制造系统能效优化结构 |
1.2.1 系统能耗构成 |
1.2.2 协同优化结构 |
1.3 国内外研究现状 |
1.3.1 单作业车间调度问题现状 |
1.3.2 分布式多工厂调度问题现状 |
1.3.3 能效优化调度研究现状 |
1.3.4 现状的问题 |
1.4 论文主要内容与结构 |
第二章 网络协同制造系统跨层优化模型 |
2.1 引言 |
2.2 符号定义与约束条件 |
2.2.1 符号定义 |
2.2.2 作业车间约束条件 |
2.2.3 跨层协同生产约束条件 |
2.3 单作业车间能效优化问题 |
2.3.1 问题描述 |
2.3.2 能耗分析 |
2.3.3 目标函数模型建立 |
2.3.4 单作业车间跨层生产优化调度框架 |
2.4 分布式多工厂能效优化问题 |
2.4.1 问题描述 |
2.4.2 目标函数模型建立 |
2.4.3 分布式多工厂跨层生产优化调度框架 |
2.5 本章小结 |
第三章 融合案例推理的车间层能效优化方法 |
3.1 引言 |
3.2 案例知识推理框架 |
3.2.1 案例知识的特征 |
3.2.2 调度案例知识的表示 |
3.2.3 案例推理机制 |
3.2.4 相似度计算 |
3.2.5 案例修正 |
3.3 混合群智能算法 |
3.3.1 粒子群优化算法基本原理 |
3.3.2 混合改进策略 |
3.3.3 融合案例知识推理的算法流程 |
3.4 实验结果与分析 |
3.4.1 HGAPSO参数设置 |
3.4.2 HGAPSO算法性能测试 |
3.4.3 CBR-HGAPSO的应用 |
3.5 本章小结 |
第四章 融合决策树的分布式多工厂协同生产调度方法 |
4.1 引言 |
4.2 分布式多工厂数据挖掘框架 |
4.2.1 数据挖掘框架 |
4.2.2 分布式多工厂调度编码 |
4.2.3 ID3 基本原理 |
4.2.4 决策树调度数据分类与训练 |
4.3 ETGMOPSO离散多目标优化调度 |
4.3.1 多目标嵌套寻优框架 |
4.3.2 多目标粒子群优化算法 |
4.3.3 离散化 |
4.3.4 高斯项引入改进 |
4.3.5 粒子群分类排序与精英保留策略 |
4.4 融合决策树的嵌套寻优 |
4.5 实例验证与分析 |
4.5.1 ETGMOPSO寻优性能测试 |
4.5.2 ID3-ETGMOPSO的应用 |
4.6 本章小结 |
第五章 网络协同制造跨层优化调度系统开发与应用 |
5.1 引言 |
5.2 需求分析 |
5.3 优化调度系统框架设计 |
5.3.1 优化调度系统运行与开发环境 |
5.3.2 优化调度系统整体框架 |
5.3.3 调度任务执行框架 |
5.3.4 Hadoop知识提取 |
5.4 系统功能模块 |
5.4.1 柔性作业车间调度模块 |
5.4.2 工艺路线管控模块 |
5.4.3 指标展示模块 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
附录 A: 作者在攻读硕士学位期间的科研成果 |
附录 B: 软件测试报告 |
(3)基于Google Earth Engine云平台下地物覆被类型的遥感影像智能分类方法研究(论文提纲范文)
摘要 |
abstract |
1 引言 |
1.1 选题背景与意义 |
1.2 国内外研究现状 |
1.2.1 遥感影像分类方法研究现状 |
1.2.2 现有遥感影像数据的获取平台 |
1.2.3 遥感影像地物覆被分类中的关键问题 |
1.3 Google Earth Engine云平台 |
1.3.1 平台注册 |
1.3.2 公共数据集 |
1.3.3 程序设计接口 |
1.3.4 系统架构 |
1.4 拟解决的科学问题 |
1.5 研究目的和内容 |
1.6 论文创新点 |
1.7 技术路线 |
2 研究区概况 |
2.1 地理位置 |
2.2 气候环境 |
2.3 植被状况 |
2.4 地质地貌 |
3 数据与方法 |
3.1 数据源 |
3.1.1 MCD12Q1 |
3.1.2 Landsat-8 OLI |
3.1.3 Sentinel-2 L1C |
3.1.4 SRTM DEM |
3.1.5 其它数据 |
3.2 遥感影像预处理 |
3.2.1 最小云量影像集的生成 |
3.2.2 波段选择和彩色合成 |
3.2.3 灰度调整和反差处理 |
3.2.4 镶嵌和裁剪 |
3.3 多维分类特征集的构建 |
3.3.1 光谱特征 |
3.3.2 纹理特征 |
3.3.3 地形特征 |
3.4 大型训练样本数据集的创建与质量控制 |
3.5 分类后误差来源与精度评价 |
3.5.1 误差来源 |
3.5.2 精度评价 |
4 传统多分类器的调参优化 |
4.1 分类回归树的参数选择 |
4.1.1 构建分类回归树 |
4.1.2 拆分规则 |
4.1.3 修剪树 |
4.2 随机森林的参数选择 |
4.2.1 构建随机森林 |
4.2.2 粒子群性能 |
4.2.3 最优共享粒子 |
4.3 支持向量机的参数选择 |
4.3.1 最佳分类超平面 |
4.3.2 核函数 |
4.4 性能验证 |
4.5 小结 |
5 基于深度卷积神经网络ResNet-101的新型分类器研究 |
5.1 卷积神经网络的算法原理 |
5.1.1 卷积神经网络的结构 |
5.1.2 卷积神经网络的特点 |
5.2 深层次残差网络ResNet-101 分类器的构建 |
5.2.1 残差学习 |
5.2.2 基于TensorFlow构建残差网络ResNet-101 分类器 |
5.2.3 深层次残差网络分类器的应用优势 |
5.2.4 性能验证 |
5.3 小结 |
6 基于MCD12Q1 地物覆被类型的智能分类结果 |
6.1 地物覆被类型下的特征识别和提取效果 |
6.1.1 训练和验证样本数量下总体精度和运行时间的变化规律 |
6.1.2 多分类器下地物覆被类型像元的变化规律 |
6.1.3 遥感影像种类下地物覆被类型面积的变化规律 |
6.2 遥感影像地物覆被类型的分类结果比对 |
6.2.1 Landsat-8 OLI影像的地物覆被类型 |
6.2.2 Sentinel-2 L1C影像的地物覆被类型 |
6.3 小结 |
7 遥感影像智能分类结果的可靠性评价 |
7.1 混淆矩阵 |
7.2 精度计算 |
7.3 误差对比 |
7.4 Kappa系数 |
7.5 小结 |
8 讨论与总结 |
8.1 讨论 |
8.2 结论 |
8.3 展望 |
致谢 |
参考文献 |
作者简介 |
(4)突发事件期间人群决策偏好与健康知识水平及其心理健康状况的影响研究 ——基于COVID-19的数据分析(论文提纲范文)
中文摘要 |
abstract |
英文缩略词 |
第1章 绪论 |
1.1 研究背景 |
1.2 研究目的及意义 |
1.2.1 研究目的 |
1.2.2 研究意义 |
第2章 研究对象与方法 |
2.1 研究对象 |
2.2 研究类型 |
2.3 研究工具 |
2.3.1 一般资料调查表 |
2.3.2 决策参与期待问卷 |
2.3.3 新冠肺炎相关信息的获取途径调查表 |
2.3.4 新冠肺炎基本知识认知调查表 |
2.3.5 匹兹堡睡眠指数量表 |
2.3.6 焦虑自评量表 |
2.4 资料收集方法 |
2.5 资料整理与分析 |
2.5.1 资料整理 |
2.5.2 数据分析 |
2.5.3 决策树 |
2.6 质量控制 |
2.7 伦理原则 |
2.8 可行性分析 |
2.9 课题创新 |
2.10 技术路线 |
第3章 结果 |
3.1 问卷回收结果 |
3.2 研究对象的一般资料 |
3.3 研究对象决策偏好及影响因素的现状调查 |
3.3.1 研究对象决策偏好的现状 |
3.3.2 研究对象决策偏好在人口社会学上的差异比较 |
3.4 研究对象知识水平、睡眠质量以及焦虑程度的现状分析 |
3.4.1 研究对象新冠肺炎基本知识认知水平的现状及影响因素 |
3.4.2 研究对象信息获取途径的现状及影响因素 |
3.4.3 研究对象睡眠质量的现状及影响因素 |
3.4.4 研究对象焦虑的现状及影响因素 |
3.5 研究对象信息获取途径与知识水平、睡眠质量以及焦虑程度的相关性分析 |
3.6 研究对象决策偏好与信息获取途径的相关性分析 |
3.7 公众决策偏好与知识水平、睡眠质量以及焦虑程度的相关性分析 |
第4章 讨论 |
4.1 研究对象的分析 |
4.1.1 研究对象的人口社会学资料分析 |
4.1.2 研究对象决策偏好及影响因素的现状分析 |
4.1.3 研究对象知识水平及影响因素的现状分析 |
4.1.4 研究对象信息获取途径及影响因素的现状分析 |
4.1.5 研究对象睡眠质量及影响因素的现状分析 |
4.1.6 研究对象焦虑及影响因素的现状分析 |
4.2 研究对象的信息获取途径与知识水平,睡眠质量以及焦虑情况的相关性分析 |
4.2.1 研究对象的信息获取途径与知识水平的相关性分析 |
4.2.2 研究对象的信息获取途径与睡眠质量得分的相关性分析 |
4.2.3 研究对象的信息获取途径与焦虑得分的相关性分析 |
4.3 研究对象决策偏好和信息获取途径的相关性分析 |
4.4 公众决策偏好与知识水平、睡眠质量以及焦虑程度的相关性分析 |
4.4.1 研究对象公众决策偏好和知识水平的相关性分析 |
4.4.2 研究对象决策偏好和睡眠质量的相关性分析 |
4.4.3 研究对象决策偏好和焦虑程度的相关性分析 |
4.5 研究局限性与展望 |
第5章 结论 |
参考文献 |
附录 突发事件期间人群决策偏好与健康知识水平及其心理健康状况的影响研究-基于 COVID-19 的数据分析 |
作者简介及再学期间所取得的科研成果 |
致谢 |
(5)面向医院管理的数据驱动决策研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景 |
1.2 研究目的与意义 |
1.2.1 研究目的 |
1.2.2 研究意义 |
1.3 国内外研究现状 |
1.3.1 数据驱动决策的研究现状 |
1.3.2 数据驱动医疗健康领域决策的研究现状 |
1.3.3 数据驱动医院管理决策的研究现状 |
1.3.4 数据驱动决策的影响因素研究现状 |
1.3.5 研究现状述评 |
1.4 研究框架与研究内容 |
1.4.1 研究框架 |
1.4.2 主要研究内容 |
1.4.3 拟解决的关键问题 |
1.5 研究方法和技术路线 |
1.5.1 研究方法 |
1.5.2 技术路线 |
第2章 相关基础理论和方法 |
2.1 医院管理相关概念 |
2.1.1 医院管理 |
2.1.2 医院管理评价 |
2.1.3 医院管理者 |
2.2 决策支持相关理论 |
2.2.1 西蒙决策理论 |
2.2.2 数据驱动决策相关理论 |
2.3 信息链理论 |
2.3.1 信息链与信息技术 |
2.3.2 “信息”上溯到“数据”带来的变化 |
2.3.3 信息链视域下的数据驱动医院管理决策 |
2.4 BASM模型 |
2.4.1 BASM模型的产生 |
2.4.2 BASM模型的研究现状 |
2.4.3 基于BASM模型的数据驱动医院管理决策研究 |
2.5 相关研究方法 |
2.5.1 扎根理论 |
2.5.2 结构方程模型 |
2.5.3 决策树算法--CHAID |
2.6 相关应用场景 |
2.6.1 医疗服务绩效 |
2.6.2 DRG在医疗服务绩效管理中的应用 |
2.7 本章小结 |
第3章 面向医院管理的数据驱动决策过程模型构建 |
3.1 面向医院管理决策的数据驱动过程模型 |
3.1.1 数据驱动决策模式运行机制 |
3.1.2 BASM的过程模型 |
3.1.3 基于BASM过程模型的数据驱动医院管理决策过程模型构建 |
3.2 面向医院管理的数据驱动决策过程模型要素分析 |
3.2.1 驱动要素 |
3.2.2 需求要素 |
3.2.3 支持要素 |
3.2.4 要素间关系 |
3.3 数据驱动的医院管理决策中数据处理过程 |
3.3.1 医疗数据存在的问题 |
3.3.2 面向医院管理决策的数据处理原则 |
3.3.3 面向医院管理决策的数据处理过程 |
3.4 面向医院管理的数据驱动决策过程模型运行机制 |
3.4.1 面向医院管理决策的信息链转化过程 |
3.4.2 数据驱动的医院管理决策制定过程 |
3.5 本章小结 |
第4章 基于扎根理论的数据驱动医院管理决策的影响因素分析 |
4.1 研究问题与研究程序 |
4.1.1 研究问题 |
4.1.2 研究方法 |
4.1.3 研究程序 |
4.2 研究设计 |
4.2.1 研究对象选取 |
4.2.2 资料收集 |
4.2.3 信效度检验 |
4.3 编码分析 |
4.3.1 开放式编码 |
4.3.2 主轴编码 |
4.3.3 选择性编码 |
4.3.4 理论饱和度检验 |
4.4 数据驱动医院管理决策影响因素理论模型与阐释 |
4.4.1 影响因素理论模型构建 |
4.4.2 影响因素分析 |
4.4.3 影响因素关系分析 |
4.5 本章小结 |
第5章 数据驱动医院管理决策的影响因素模型构建 |
5.1 数据驱动医院管理决策影响因素变量选择与界定 |
5.1.1 医疗数据质量维度 |
5.1.2 信息技术维度 |
5.1.3 医院组织管理维度 |
5.1.4 管理者信息素养维度 |
5.1.5 数据驱动医院管理决策维度 |
5.2 相关研究假设 |
5.2.1 医疗数据质量 |
5.2.2 信息技术 |
5.2.3 医院组织管理 |
5.2.4 管理者信息素养 |
5.3 调查问卷的编制与问卷修正 |
5.4 数据获取与统计分析 |
5.4.1 研究对象 |
5.4.2 样本量的选择 |
5.4.3 信度分析 |
5.4.4 样本分布 |
5.4.5 样本数据相关性 |
5.5 效度分析 |
5.5.1 探索性因子分析 |
5.5.2 验证性因子分析 |
5.6 基于结构方程的影响因素模型构建与检验修正 |
5.6.1 影响因素模型构建 |
5.6.2 模型基本适配评估 |
5.6.3 假设检验的结果 |
5.7 结构方程模型检验结果分析 |
5.7.1 影响因素强度分析 |
5.7.2 医疗数据质量对信息技术影响的验证结果分析 |
5.7.3 信息技术对数据驱动医院管理决策影响的验证结果分析 |
5.7.4 医院组织管理对医疗数据质量影响的验证结果分析 |
5.7.5 医院组织管理对管理者信息素养影响的验证结果分析 |
5.7.6 医院组织管理对数据驱动医院管理决策影响的验证结果分析 |
5.7.7 管理者信息素养对医疗数据质量影响的验证结果分析 |
5.7.8 管理者信息素养对信息技术影响的验证结果分析 |
5.7.9 管理者信息素养对数据驱动医院管理决策影响的验证结果分析 |
5.8 本章小结 |
第6章 面向医院管理的数据驱动决策模型研究 |
6.1 数据驱动医院管理决策模型构建 |
6.2 面向医院管理的数据驱动决策模型的驱动机制 |
6.2.1 面向医院管理的数据驱动决策模型的驱动目标 |
6.2.2 面向医院管理的数据驱动决策模型的驱动特征 |
6.2.3 面向医院管理的数据驱动决策模型的驱动过程 |
6.3 数据驱动医院管理决策模型影响因素的作用机制 |
6.3.1 医疗数据质量在数据驱动决策模型中的影响机制 |
6.3.2 信息技术在数据驱动决策模型中的影响机制 |
6.3.3 医院组织管理在数据驱动决策模型中的影响机制 |
6.3.4 管理人员素养在数据驱动决策模型中的影响机制 |
6.4 数据驱动医院管理决策模型对医院管理的提升策略 |
6.4.1 提升医疗数据质量 |
6.4.2 发挥信息技术使能作用 |
6.4.3 发挥医院组织管理支持作用 |
6.4.4 提高管理人员信息素养 |
6.5 本章小结 |
第7章 面向医院管理的数据驱动决策的实证研究 |
7.1 资料来源与研究对象 |
7.2 原发性肺癌患者的DRGS分组 |
7.2.1 数据基础 |
7.2.2 数据纳入 |
7.2.3 术语映射 |
7.2.4 DRGs分组结果对比 |
7.3 基于DRGS细分组的医疗服务绩效评估 |
7.3.1 基于决策树的原发性肺癌患者DRGs细分组模型 |
7.3.2 基于DRGs细分组的医疗服务绩效评估指标 |
7.3.3 医生医疗服务绩效指标统计结果 |
7.3.4 科室医疗服务绩效指标统计结果 |
7.4 讨论 |
7.4.1 数据驱动医院管理决策过程 |
7.4.2 数据驱动医院管理决策影响因素 |
7.5 本章小结 |
第8章 结论与创新 |
8.1 结论 |
8.2 研究创新点 |
8.3 研究局限 |
参考文献 |
附录1 病案组DRGS分组情况 |
附录2 医生组DRGS分组情况 |
附录3 访谈提纲 |
附录4 调查问卷 |
作者简介及在学期间所取得的科研成果 |
后记与致谢 |
(6)基于区块链技术的信用治理研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究的背景与意义 |
1.1.1 研究的背景 |
1.1.2 研究的意义 |
1.2 论文的主要研究内容与研究思路 |
1.2.1 论文的主要研究内容 |
1.2.2 论文的主要研究思路 |
1.3 论文的主要研究方法 |
1.4 论文的主要创新点 |
1.5 本章小结 |
第二章 文献综述与基本理论 |
2.1 信用基本理论研究 |
2.1.1 关于信用基础之信任的相关研究 |
2.1.2 关于信用的特征及与其它相关概念的辨析 |
2.2 信用治理的相关研究 |
2.2.1 信用治理的理论分析 |
2.2.2 信用治理的应用分析 |
2.3 区块链技术的研究 |
2.3.1 比特币与区块链的研究 |
2.3.2 区块链核心技术的研究 |
2.3.3 区块链技术应用的研究 |
2.4 区块链技术与信用治理结合的研究 |
2.4.1 区块链与信任体系 |
2.4.2 区块链与信用治理 |
2.5 本章小结 |
第三章 区块链技术条件下的信用治理原理 |
3.1 区块链技术架构与共识机制 |
3.1.1 区块链技术架构 |
3.1.2 区块链的类型及特点 |
3.1.3 区块链共识机制 |
3.2 从机器信任到社会信用 |
3.3 完全理性博弈下的区块链信用治理 |
3.3.1 个体理性、重复博弈与区块链信用合作的产生 |
3.3.2 集体理性、合作博弈与区块链信用合作的有效性 |
3.4 有限理性博弈下的区块链信用合作及稳定性 |
3.5 本章小结 |
第四章 基于区块链技术的个体信用治理分析 |
4.1 DAO、公有链与代币(Token) |
4.2 Token(代币)经济与金融监管 |
4.3 个体行为视角的公有链社会网络信用治理分析 |
4.3.1 预期效用建模 |
4.3.2 信用偏好的承袭分析 |
4.3.3 信用偏好的均衡调整 |
4.3.4 信用合作的场域 |
4.3.5 极端状况下的均衡 |
4.4 政策建议 |
4.5 本章小结 |
第五章 基于区块链技术的群体信用治理分析 |
5.1 DeFi与普惠金融 |
5.2 DeFi的信用特征 |
5.3 DeFi普惠金融的群体信用建模 |
5.4 基于私有链的群体信用治理分析 |
5.4.1 私有链与随机网络 |
5.4.2 随机网络的群体信用治理 |
5.5 基于联盟链的群体信用治理分析 |
5.5.1 联盟链与无标度网络 |
5.5.2 无标度网络的群体信用治理 |
5.6 政策建议 |
5.7 本章小结 |
第六章 基于区块链技术优化个人信用评价的实证研究 |
6.1 “币天销毁”与“币天销毁”信用评价模型 |
6.2 “币天销毁”信用评价模型的构建与指标选择 |
6.2.1 “币天销毁”信用评价模型的指标选取 |
6.2.2 “币天销毁”信用评价模型指标的时序拆解与重组 |
6.2.3 “币天销毁”信用评价模型指标数据的引入与生成 |
6.3 “币天销毁”信用评价模型的初始权重设计 |
6.3.1 对于筛选指标的逻辑回归模型设计 |
6.3.2 模型的初始权重设计 |
6.4 “币天销毁”信用评价模型的测试评价 |
6.5 “币天销毁”信用评价模型的训练 |
6.5.1 模型训练方法的选择 |
6.5.2 模型训练方法的机理 |
6.5.3 模型训练的流程 |
6.5.4 模型训练相关程序 |
6.6 “币天销毁”信用评价模型的训练结果 |
6.6.1 模型的最终参数结果 |
6.6.2 模型最终的权重结果 |
6.7 “币天销毁”信用评价模型与传统信用评价模型的结果比较 |
6.7.1 传统信用评价模型的构建过程 |
6.7.2 两种模型的结果比较 |
6.8 本章小结 |
第七章 基于区块链技术改善中小企业授信的实证研究 |
7.1 中小企业信用评价和融资授信的相关研究 |
7.2 区块链技术改善中小企业融资授信的路径 |
7.2.1 区块链技术赋能中小企业融资授信 |
7.2.2 基于区块链技术的企业融资授信的平台架构和数据原型 |
7.3 区块链技术改善中小企业融资授信:实证模型的构建 |
7.4 基于区块链增强信息的企业信用模型的测试与分析 |
7.4.1 数据标准与准备 |
7.4.2 特征变量选取 |
7.4.3 测试结果与分析 |
7.5 基于区块链技术的模型与传统模型的结果比较 |
7.6 本章小结 |
第八章 区块链技术在公共管理领域的信用治理应用研究 |
8.1 区块链技术对国家信用治理带来的影响分析 |
8.1.1 区块链技术对国家信用创造和监管带来冲击 |
8.1.2 区块链技术对商业银行信用管理带来变革与颠覆 |
8.2 数字法币的技术路径选择,及对信用创造的影响 |
8.2.1 数字法币的技术路径选择与分叉 |
8.2.2 数字法币对信用创造的影响分析 |
8.2.3 数字法币对货币乘数的影响: 一个概要测算 |
8.3 利用区块链技术深化我国的社会征信管理 |
8.3.1 面向全社会各行业的征信系统面临的技术挑战 |
8.3.2 区块链技术应用于征信系统的可行性分析 |
8.3.3 区块链技术在征信系统中的应用研究 |
8.4 本章小结 |
第九章 基于区块链技术的物理世界信用治理应用研究 |
9.1 从万物互联、万物智能到万物账本,信用治理拓展原理 |
9.1.1 万物互联: 生产工具的升级 |
9.1.2 万物智能: 生产资料的升级 |
9.1.3 万物账本: 生产关系的升级 |
9.2 从“+区块链”到“区块链+,区块链信用治理拓展的路径 |
9.2.1 “+区块链”: 从信息互联网到价值互联网 |
9.2.2 “区块链+”: 商业逻辑、组织范式的颠覆性解构与重组 |
9.3 云-管-端-边“设备民主”,区块链信用治理应用拓展的实现 |
9.3.1 信息技术架构与信息服务架构 |
9.3.2 基于区块链技术实现云-管-端-边的“设备民主” |
9.4 本章小结 |
第十章 结论与展望 |
10.1 本文研究的主要结论 |
10.2 研究局限及展望 |
参考文献 |
附录 |
致谢 |
攻读学位期间取得的研究成果 |
(7)抽样调查无响应问题研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景和选题意义 |
1.1.1 抽样调查无响应问题的产生 |
1.1.2 影响调查无响应的主要因素 |
1.1.3 研究意义 |
1.2 文献综述 |
1.2.1 调查准备和实施阶段的无响应问题综述 |
1.2.2 调查数据整理阶段校正由于无响应而导致的偏差 |
1.2.3 国内学者调查无响应问题研究进展 |
1.2.4 解决无响应问题的推广应用价值 |
1.2.5 文献述评 |
1.3 研究思路、内容与方法 |
1.3.1 研究思路和目标 |
1.3.2 研究内容和章节安排 |
1.3.3 研究方法与技术路线 |
1.4 本文的创新点 |
1.4.1 完善R统计量的算法设计与应用,提出了抽样调查质量评估的新方法 |
1.4.2 对多种插值方法的进行比较分析,提出了根据不同变量类型分类插值的基本思想 |
1.4.3 引进决策树思想,提出结构逻辑的插值方法对项目无响应进行插值 |
第2章 无响应的机理研究 |
2.1 无响应概念的界定 |
2.1.1 无响应内涵 |
2.1.2 无响应产生的原因 |
2.2 与无响应相关的基本概念 |
2.2.1 误差的分类 |
2.2.2 无响应和欠覆盖 |
2.2.3 响应率 |
2.3 缺失数据机制 |
2.4 不同的响应类型 |
2.4.1 固定响应模型 |
2.4.2 随机响应模型 |
2.5 无响应的影响 |
2.5.1 无响应的一般影响 |
2.5.2 无响应对置信区间的影响 |
2.6 本章小结 |
第3章 R统计量相关理论及其研究 |
3.1 R统计量的产生 |
3.2 代表性响应的概念 |
3.2.1 代表性的含义 |
3.2.2 响应者子样本的代表性定义 |
3.3 R统计量 |
3.3.1 总体的R统计量 |
3.3.2 样本的R统计量 |
3.4 R统计量的特征 |
3.4.1 R统计量的一般特征 |
3.4.2 R统计量的可解释性 |
3.4.3 R统计量的可标准化性质 |
3.5 R统计量的标准误和置信区间 |
3.6 代表性响应的偏R统计量 |
3.7 本章小结 |
第4章 项目无响应处理方法研究 |
4.1 项目无响应的逻辑成因分析 |
4.2 插值方法的数理基础 |
4.2.1 插值方法的产生 |
4.2.2 插值方法的理论机理 |
4.3 常用插值方法比较 |
4.3.1 单插值方法 |
4.3.2 EM插值 |
4.3.3 多重插值 |
4.3.4 分数插值 |
4.3.5 对常用插值方法的解读和评论 |
4.4 结构逻辑插值方法 |
4.4.1 结构逻辑插值方法的内涵 |
4.4.2 结构逻辑插值方法的性质 |
4.4.3 结构逻辑插值图 |
4.4.4 结构逻辑插值方法的评估 |
4.5 本章小结 |
第5章 流动人口抽样调查无响应问题的实证研究 |
5.1 研究目的 |
5.1.1 居留意愿 |
5.1.2 流动人口居留意愿的理论分析 |
5.1.3 研究目标 |
5.2 R统计量的计算 |
5.2.1 宏观辅助变量的选取 |
5.2.2 并行变量数据 |
5.2.3 V统计量测度 |
5.2.4 R统计量的测度 |
5.3 插值变量选择及缺失数据说明 |
5.3.1 变量选择及说明 |
5.3.2 缺失数据说明 |
5.4 项目无响应插补前的估计值及其方差估计值 |
5.4.1 项目无响应插补前的估计值 |
5.4.2 项目无响应插补前方差估计值 |
5.5 基于单插值方法的项目无响应插补研究 |
5.5.1 项目无响应插补后的估计值及其方差研究 |
5.5.2 项目无响应插补后的实证结果分析 |
5.6 基于多重插值方法的项目无响应插补研究 |
5.7 基于结构逻辑插值方法的项目无响应插补研究 |
5.8 实证结果的总体分析 |
第6章 结论和建议 |
6.1 主要结论 |
6.2 建议 |
6.2.1 使用R统计量测度无响应问题,可以提高问卷调查的质量 |
6.2.2 结构逻辑插值方法对缺失数据进行插值的可靠性更高 |
6.3 展望 |
参考文献 |
致谢 |
攻读博士学位期间发表的论文和其它科研情况 |
(8)基于决策树的集成学习算法及其在生存分析中的应用(论文提纲范文)
摘要 |
abstract |
1.引言 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 主要研究内容 |
2.决策树集成学习算法与生存分析 |
2.1 基于决策树的集成学习算法 |
2.2 生存分析模型 |
2.3 生存分析模型评价指标 |
2.4 小结 |
3.基于决策树集成的生存分析与风险分层 |
3.1 预后风险分层 |
3.2 基于决策树集成的生存分析 |
3.3 风险分层模型 |
3.4 TCGA数据集上的实证分析 |
3.5 小结 |
4.基于重采样XGBoost的特征基因选择 |
4.1 引言 |
4.2 基于重采样XGBoost的特征基因选择 |
4.3 基因选择与生存分析 |
4.4 小结 |
5.基于贝叶斯优化的COVID-19 生存分析 |
5.1 引言 |
5.2 基于贝叶斯优化的生存分析模型 |
5.3 COVID-19 患者出院时间生存分析 |
5.4 小结 |
6.总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读硕士学位期间发表的学术论文 |
致谢 |
(9)基于增量式学习与集成学习的入侵检测方法研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 决策树研究现状 |
1.2.2 集成学习研究现状 |
1.2.3 入侵检测研究现状 |
1.2.4 基于粗糙集的决策树方法研究现状 |
1.3 本文的主要贡献 |
1.4 本文的组织结构 |
2 相关理论概述 |
2.1 入侵检测概述 |
2.1.1 入侵检测的基本概念 |
2.1.2 入侵检测系统的分类 |
2.1.3 常用的入侵检测方法 |
2.2 集成学习概述 |
2.2.1 集成学习的概念与特点 |
2.2.2 常用的集成学习算法 |
2.3 决策树概述 |
2.3.1 决策树的基本概念 |
2.3.2 常用的决策树算法 |
2.3.3 增量式决策树算法 |
2.4 粗糙集理论概述 |
2.4.1 粗糙集的基本概念 |
2.4.2 粗糙集理论中定义的信息熵模型 |
2.5 本章小结 |
3 基于粒度决策熵的决策树算法及其在入侵检测中的应用 |
3.1 引言 |
3.2 相关概念 |
3.3 基于粒度决策熵的决策树算法DTGDE |
3.3.1 DTGDE算法流程 |
3.3.2 DTGDE算法复杂度分析 |
3.3.3 DTGDE算法在入侵检测中的应用 |
3.4 实验以及结果分析 |
3.4.1 实验数据 |
3.4.2 实验步骤 |
3.4.3 实验结果及分析 |
3.5 本章小结 |
4 基于粒度决策熵的增量式决策树算法及其在入侵检测中的应用 |
4.1 引言 |
4.2 相关概念 |
4.3 基于粒度决策熵的增量式决策树算法IDTGDE |
4.3.1 IDTGDE算法流程 |
4.3.2 IDTGDE增量规则的修正策略 |
4.3.3 IDTGDE算法复杂度分析 |
4.3.4 IDTGDE算法在入侵检测中的应用 |
4.4 实验以及结果分析 |
4.4.1 实验数据 |
4.4.2 实验步骤 |
4.4.3 实验结果及分析 |
4.5 本章小结 |
5 基于粒度决策熵的决策森林算法及其在入侵检测中的应用 |
5.1 引言 |
5.2 随机森林算法概述 |
5.3 基于粒度决策熵的决策森林算法 |
5.4 DFGDE算法在入侵检测中的应用 |
5.5 实验及结果分析 |
5.5.1 实验数据 |
5.5.2 实验步骤 |
5.5.3 入侵检测结果及分析 |
5.6 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
附录 |
致谢 |
攻读硕士期间发表的学术论文 |
(10)基于机器学习的变压器色谱峰识别和故障诊断研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题背景及研究的主要内容 |
1.2 变压器油色谱在线监测技术的发展现况 |
1.2.1 变压器色谱峰识别研究发展现况 |
1.2.2 变压器故障诊断研究发展现状 |
1.3 研究内容 |
1.4 论文组织结构 |
第二章 变压器油色谱在线监测技术和机器学习的基本理论 |
2.1 变压器油色谱在线监测技术 |
2.1.1 变压器色谱峰识别难点及常用方法 |
2.1.2 变压器油中溶解气体的产生原因和常见故障 |
2.2 机器学习算法 |
2.2.1 C4.5 决策树算法 |
2.2.2 BP神经网络模型 |
2.3 本章小结 |
第三章 基于C4.5 决策树的变压器色谱峰识别算法研究 |
3.1 色谱峰数据的来源 |
3.2 色谱峰特征属性的选择 |
3.3 基于C4.5 决策树的色谱峰识别算法构建 |
3.4 实验测试与结果分析 |
3.5 本章小节 |
第四章 基于自适应多子群樽海鞘群算法的BP神经网络变压器故障诊断研究 |
4.1 基于BP神经网络变压器故障诊断模型的结构 |
4.2 自适应多子群樽海鞘优化算法 |
4.2.1 标准樽海鞘群算法 |
4.2.2 改进樽海鞘群算法 |
4.3 基于AMSSA-BP神经网络的变压器故障诊断模型结构 |
4.4 实验与分析 |
4.4.1 自适应多子群樽海鞘群算法的性能测试 |
4.4.2 基于AMSSA-BP神经网络的变压器故障诊断模型的训练和测试 |
4.5 本章小节 |
总结和展望 |
参考文献 |
致谢 |
个人简历、在学期间的研究成果及发表的学术论文 |
四、一种新型决策树属性选择标准(论文参考文献)
- [1]基于机器学习的电力系统静态电压稳定评估及实时经济调度研究[D]. 孟祥飞. 北京交通大学, 2021(02)
- [2]网络化协同制造系统的跨层生产优化调度[D]. 蒋天伦. 江南大学, 2021(01)
- [3]基于Google Earth Engine云平台下地物覆被类型的遥感影像智能分类方法研究[D]. 潘霞. 内蒙古农业大学, 2021
- [4]突发事件期间人群决策偏好与健康知识水平及其心理健康状况的影响研究 ——基于COVID-19的数据分析[D]. 倪元元. 吉林大学, 2021(01)
- [5]面向医院管理的数据驱动决策研究[D]. 李茵. 吉林大学, 2021(01)
- [6]基于区块链技术的信用治理研究[D]. 章建赛. 北京邮电大学, 2021(01)
- [7]抽样调查无响应问题研究[D]. 郝淑玲. 山西财经大学, 2021(09)
- [8]基于决策树的集成学习算法及其在生存分析中的应用[D]. 车露美. 西安建筑科技大学, 2021(01)
- [9]基于增量式学习与集成学习的入侵检测方法研究[D]. 张旻宇. 青岛科技大学, 2021(02)
- [10]基于机器学习的变压器色谱峰识别和故障诊断研究[D]. 单杰. 福建工程学院, 2021(02)