一、用无监督模糊聚类方法进行视频内容的分层表示(论文文献综述)
魏东[1](2021)在《采煤机工作空间人员检测与预警关键技术研究》文中研究说明随着智能化技术的发展,如何推动综采自动化向综采智能化转变,是当前煤炭行业亟需解决的核心问题之一。综采工作面具有低照度、工作环境恶劣的特点。在智能化综采工作面中,采煤机的操控由本地向远程转变。本地操作模式下,可以通过跟机工作人员的观察和提醒避免人员误入工作空间。随着综采机电装备操作方式的变化,如何保障机电装备工作空间内的人员安全,成为亟待解决的关键问题。当前的采煤机已经具有三维定位、记忆截割和远程监控等功能,但缺少采煤机工作空间误入人员的检测和预警保护功能,一旦出现井下人员误入其工作空间,将会带来严重的安全事故。因此,有必要研究采煤机工作空间人员检测与预警技术,实现煤矿的安全高效生产。本课题以采煤机工作空间人员检测与预警为研究对象,利用红外热成像仪采集采煤机工作空间内红外图像,研究具有复杂混合噪声的红外图像去噪增强方法,建立采煤机工作空间内人员目标的运动特征及位置提取模型,设计基于强跟踪模型的目标位置预测算法,实现采煤机工作空间内的人员位置预测与保护预警。本文的主要研究成果如下:(1)在分析综采工作面采煤机、液压支架和刮板输送机配套模型基础上,结合采煤机工作空间人员检测与预警系统的功能需求,搭建了采煤机工作空间人员检测与预警系统的总体架构,并分析了采煤机工作空间人员检测与预警系统的主要组成与工作流程。(2)研究了采煤机工作空间红外图像噪声的构成与特性,建立了针对具有非均匀信息分布特点的红外图像抗敏滤波模型,并结合采煤机工作空间红外图像序列的时域特性,构建了该模型的时空域变体,有效提高了对高强度不均匀复杂红外噪声的处理能力,改善了采煤机工作空间红外图像序列质量。(3)分析了采煤机工作空间人员检测系统需求,建立了采煤机工作空间红外图像域场景运动特征获取模型,结合红外图像序列自身特性,研究了动态背景下移动前景目标的红外图像运动特征提取方法,实现采煤机工作空间中移动目标的运动特征提取。(4)结合采煤机工作空间红外场景特征,研究了适合于采煤机工作空间复杂红外场景的图像分割方法,建立了基于局部信息权重和淘金算法的红外图像分割方法,实现了采煤机工作空间红外场景的有效分割,继而设计了基于形态学权重的位置检测算法,有效融合采煤机工作空间中人员的运动特征和分割图像信息,实现了移动人员位置信息的完整提取。(5)设计了采煤机工作空间人员预警算法,基于采煤机工作空间人员的运动及位置信息,分析适合于描述采煤机工作空间人员运动的机动目标跟踪模型,构建了基于强跟踪模型的移动人员位置预测与跟踪算法,实现了采煤机工作空间的人员危险状态预警。本文对采煤机工作空间人员检测与预警的关键技术进行了研究,并研发了采煤机工作空间人员检测与预警系统,开展了红外图像增强、采煤机工作空间人员运动特征及位置信息提取和人员位置预测及危险状态预警等相关工业性试验,结果表明:该系统可以有效地对采煤机工作空间中移动人员目标的运动特征和位置信息进行提取,实现工作人员预警保护,为智能化综采工作面的安全生产提供了技术支撑。该论文有图60幅,表21个,参考文献218篇。
李琛[2](2020)在《基于模糊深度学习的视频目标检测方法研究》文中研究表明近年来,视频目标检测技术由于其在无人驾驶技术、智能机器人、智慧城市等多个领域都发挥了不可或缺的作用,成为了计算机视觉领域的一个十分热门的研究课题。基于人工智能技术的视频监控系统作为智慧交通系统的重要组成部分,目前已经广泛应用于社会生活中的各个方面。深度神经网络与传统图像识别系统相比而言,其最显着的优势在于,它能将特征提取、特征压缩以及图像分类整合到一个神经网络中,能够有效提取出更抽象的高维特征。为此,本论文将结合深度神经网络技术,主要研究了基于模糊深度学习网络的车辆检测跟踪算法,包括模糊深度置信网络模型以及实际应用系统的开发等关键技术问题,具体如下:(1)提出了一种基于模糊深度置信网络的车辆检测算法。模糊深度置信网络通过在深度置信网络中引入模糊集理论,将模糊隶属函数加入到神经元中,使用模糊能量函数来定义模型的模糊概率。使其成为一个集成了受限玻尔兹曼机的抽象能力以及模糊集的分类能力的深度框架。受限玻尔兹曼机能实现数据的快速降维,模糊集能基于每个类的隶属函数提高深度学习框架的分类精度。实验结果表明,与普通的深度置信网络相比,提出算法能够更加快速准确地在复杂背景环境下检测出车辆,并有效降低传统深度学习算法对计算机硬件要求高的问题。(2)在上述提出方法的基础上,提出了一种基于模糊深度学习车辆检测跟踪方法,并开发了一套适用于实际道路交通监控系统的车辆检测与跟踪系统。在提出方法中,采用模糊深度置信网络解决车辆目标的检测问题;利用一种带约束的模糊聚类方法解决多车辆目标的数据关联问题,从而实现对车辆目标的检测与跟踪。在此基础上,设计开发了一套模糊深度学习车辆检测与跟踪系统软件,软件包括数据输入模块、运动车辆检测模块、运动车辆跟踪模块以及视频输出模块。通过对该系统的测试,测试结果表明了提出的算法能够在复杂背景环境下准确的进行车辆检测与跟踪,满足道路交通系统在车辆检测与跟踪方面的需求。
秦悦[3](2020)在《成对约束半监督聚类算法研究》文中指出半监督聚类算法是将传统聚类中加入了半监督学习思想而形成的一种新型算法,可以运用监督信息对聚类进行引导,监督信息可以分为成对约束和独立的类标签,但是在现实生活中,独立类标签往往需要大量的精力才可以获得,而样本之间成对关系的确定较为简单,所以考虑通过成对约束的监督信息来让聚类性能得到提升。但传统半监督聚类的缺点也是不可忽视的。首先初始先验集合的筛选具有随机性,其次在数据集中,带有监督信息的样本点数量远远少于未标记样本点的数量,此时通过主动学习可以对未标记样本数据进行训练,但已有的结合主动学习的半监督框架都具有较高的迭代时间,最后,目前为止成对约束在模糊聚类等软划分的方法上也可能会出现局部最优的情况。针对上述问题,本文对成对约束的半监督算法进行了研究。具体内容如下:针对已有的主动学习半监督研究框架和模型中迭代不稳定且先验信息选择上的随机性,本文考虑运用密度准则对先验集合进行确定,并通过主动学习,对未标记样本中不确定性最大的点进行主动约束标记,并对其约束条件进行了重新定义,通过对传统的半监督聚类进行了改进,提出了基于主动学习的稳定Cop-Kmeans聚类算法(Iterative Stable Cop-kmeans Clustering Based on Active Learning,ISCC-AL)。ISCC-AL算法分两部分进行,分别是构建稳定先验集合和主动迭代框架。通过标准数据集上的实验结果可以看出该算法相比传统半监督聚类,在聚类结果和迭代时间上都具有更好的性能。现实生活中数据集较多都是模糊性的,为了解决由模糊性导致了错误划分情况,同时加入成对约束,提出了改进的基于交叉熵的主动半监督模糊聚类算法(Active semi-supervised FCM based on Cross-Entropy,ASFCM-CE)。该算法通过添加权值和交叉熵对目标函数进行改进,并在后续过程中,主动对边界较为模糊点进行约束标记,从而使得聚类边界划分更加清晰。最终通过实验,本文算法可以得到更高的准确率。该论文有图28幅,表14个,参考文献111篇。
李巧凤[4](2020)在《基于深度学习的视频摘要方法研究》文中认为技术作为当代多媒体信息技术发展的重要产物,更是由于智能相机设备的广泛普及,使得视频摘要技术的研究进行得更加深入。视频摘要技术主要是指通过从原始的视频中选择出最能代表原始视频信息的关键帧子集或者镜头,换言之,视频摘要技术中关键帧的选择与提取是它的核心工作,传统的摘要算法考虑更多的是图像的颜色信息,依靠单一的颜色特征来进行关键帧选取效果并不理想,深度学习的发展为视频摘要技术问题的解决提供了多样化选择。本文主要对视频特征融合与强化学习机制进行研究。实现了视频摘要质量的提升。本文的主要工作如下:(1)阐述了视频摘要研究背景、现状以及现实应用的研究意义。介绍了视频摘要技术的基本框架和主要的摘要流程,并分析了传统方法与深度学习方法的理论基础,并对其相应的方法做出分析。(2)利用深度学习方法对数据处理速度,及高维度特征提取方面的优势,提出一种改进的特征融合视频摘要方法。首先通过编码器(CNN)对视频帧进行特征提取来获取原始的视频特征。然后在此基础上,从差异性特征和局部加强特征的角度出发,利用解码器(RNN)对长时序依赖关系的特点,并通过得分融合机制,对关键帧进行选择。实验结果表明,该方法可以改进关键帧的提取效果,提高了视频摘要质量的评价指标。(3)得益于深度卷积神经网络的发展,本文提出了一种在特征融合基础上添加强化学习机制的视频摘要方法。在摘要模型上做出改变,并将关键帧的重要性和多样性的分值的累加和作为强化学习机制中的状态-动作值函数。通过视频摘要网络和强化学习部分之间的不断学习循环,来提高提取的关键帧的质量,由于关键帧的筛选与提取又是视频摘要技术研究的核心技术,所以该方法证明了强化学习机制在摘要技术上的可行性和有效性。
李朋[5](2019)在《面向大数据特征学习的深度卷积计算模型研究》文中研究指明数据特征学习是一种有效地挖掘数据中事物发展固有规律的方法,可以支持商业决策、科学研究,已经成为当前大数据分析的热点。然而,在大数据挖掘处理中,数据模态的异构性、存储的海量性、分析的实时性以及固有的低质性为大数据的深度特征分析提出了巨大的挑战。本文针对大数据的异构性、海量性、实时性、低质性等特性以及当前深度特征学习方法的不足,展开面向异构数据、海量数据、实时数据以及低质数据特征学习的深度卷积计算模型研究。具体研究包含以下几个方面:(1)针对现有深度学习模型难以揭示大数据模态内私有特征与模态间复杂融合关系这一问题,本文设计一种基于张量数据表示的深度卷积计算模型。具体地,基于张量多点乘积设计张量卷积操作,提出张量卷积层,在高阶空间中感知大数据的局部特征。利用张量多点乘积操作,定义张量全连接层,组合数据的局部特征,构建大数据的深度全局融合表示。设计误差在张量卷积层、张量抽样层和张量全连接层的反向传播规则,将反向传播算法从向量空间扩展到张量空间,训练模型收敛于数据固有分布。实验验证基于张量的深度卷积计算模型能够较好地拟合异构数据的深度分层特征,分类正确率提升2%-4%。(2)针对当前基于高性能计算架构的深度学习方法忽视模型本身的冗余性这一问题,本文提出一种基于CP(Canonical Polyadic)分解的深度卷积计算模型。具体地,利用深度卷积计算模型中张量卷积核的冗余性,设计CP分解张量卷积核,提升数据的空间拓扑特征的学习效率。利用张量全连接层的特征相关性,提出CP张量权重,快速挖掘数据的深度特征。然后,在张量空间中,设计基于CP分解的反向传播规则,训练CP分解深度卷积计算模型,拟合数据的深度融合特征。实验验证CP分解深度卷积计算模型减少模型的训练参数,压缩模型的冗余性,在保证准确率的情况下提高特征学习效率。(3)针对现有的静态深度学习方法不能较快地构建新增数据与历史数据的整体分布这一问题,本文提出一种基于在线学习的增量深度卷积计算模型。针对相似增量数据,设计一种基于增强dropout方法的参数增量学习算法,强化训练全连接层节点,确保全连接节点保持历史知识与学习新增知识。此外,设计增量代价函数,提高参数增量学习算法的效率。针对分布变化较大的动态数据,设计深度卷积计算模型限制层和全连接层的拓扑结构更新规则,融合历史知识与新增知识。同时,将dropout方法扩展到张量空间,进一步提高模型的鲁棒性。实验表明增量深度卷积计算模型较短的时间内对历史数据与新增数据的分类正确率均达到再训练模型近似结果。(4)针对当前聚类算法忽视低质数据的深度融合模式这一问题,本文设计一种基于深度卷积计算的高阶模糊聚类算法。利用数据私有模态间的独立性,设计降噪自动编码机,抽取私有模态的鲁棒语义特征。利用数据模态间的互补性,采用张量外积融合私有模态特征,设计高阶卷积自动编码机,提取融合表示的深层特征。利用张量距离,在融合特征上扩展聚类隶属度和中心更新公式,设计高阶模糊聚类算法,挖掘低质数据的鲁棒固有特征。实验验证基于深度卷积计算的高阶聚类算法能够较好地学习低质数据的模式,聚类准确率提高2%-5%。
于天暝[6](2019)在《煤层气井站异常目标检测及识别算法研究》文中指出煤层气井站开采作业现场往往处于交通不便的荒郊野外地区,对其视频场景进行智能监控时,面临着以下挑战:(1)煤层气井站监控的背景属于动态背景场景,井站所处周围环境类型有农田、山林、水面等,在这些动态环境下摇晃的农作物、树木以及波动的水面等,都会增加正确检测到前景目标的难度;此外,野外光照条件随着时间的变化也会改变监控场景的背景环境从而影响前景检测方法的性能。(2)煤层气井站的抽水机在正常运行时是不停地旋转运动的,由于抽水机在视频画面背景中属于大尺度的运动物体,已有的背景建模方法自然地将其作为前景目标检出,然而运动的抽水机应属于背景,不应视为异常目标进行检测。(3)一个实用的视频智能监控系统,不仅能给出视频图像中移动目标的大小与位置,还要能识别出移动目标的具体类别是什么,从而提高视频监控系统异常目标检测的准确率并降低误报率。本文针对煤层气井站视频监控场景中的这些特有问题,围绕动态背景减除法、动态像素建模及目标识别方法开展研究,研究成果可以促进煤层气井站从传统的被动式视频监控方式向基于事件驱动(异常目标)的主动式视频监控方式转变。具体研究内容包括如下几个方面:(1)针对煤层气井站场景中复杂动态背景下前景目标检测时,由于像素分类过程中不确定性导致的前景目标检测性能较低的问题,提出了一种基于模糊模型的背景减除法。所提出的背景减除法是一种像素级的无监督的移动目标检测方法,该方法基于模糊C均值聚类的方法来计算像素的隶属度并构建模糊直方图背景模型,用模糊贴近度来度量像素与背景模型之间的距离。针对背景更新中像素归属不确定性的问题,提出了新的模糊学习规则,以自适应地更新背景模型。在实际动态背景视频集与煤层气井站视频上进行的实验验证了所提出方法的有效性。(2)针对动态背景视频场景下背景减除法的前景目标检测性能的改进问题,提出了一种基于视频图像深度卷积层特征的改进方法来提高背景减除法的前景目标检测性能。为了减弱煤层气井站场景视频中复杂动态背景与噪声对前景目标检测的干扰,利用深度卷积网络的浅层卷积层提取其图像的通用特征图像,然后根据卷积特征图像与原始输入图像的相似性,选择适合的特征图像合成新的输入图像。再将处理后的视频图像输入背景减除法模型进行前景目标检测。实验结果表明,所测试背景减除法的前景目标检测性能均有了不同程度的提升。(3)针对煤层气井站视频场景中大尺度抽水机周期旋转运动的干扰消除以及抽水机运动状态监测的问题,提出一种动态像素二次建模的方法。首先,将背景减除法获得的抽水机运动像素部分形成的区域标记为动态背景区域,然后对动态背景区域的动态像素进行二次建模,来进一步提取异常像素值,从而检测出真正的异常目标像素。这种方法既可以克服正常工况时抽水机转动对前景目标检测的干扰问题,又可以监测抽水机的运动状态,一旦抽水机发生停止转动、倒塌等事故时,可以通过动态背景区域像素的变化情况获知。(4)针对煤层气井站场景中外来移动目标的识别问题,融合背景建模与迁移学习方法用于识别场景中的目标。由于煤层气井站场景不适合直接使用深度学习中“端到端”的方式进行目标识别。因此,使用背景建模方法提取场景中移动目标,为识别模型提供待识别目标在场景中的候选区域,以提高目标识别的效率与准确性。背景模型提取的异常目标数量多,然而典型类型少,故而使用聚类的方法对异常目标进行聚类,并利用深度迁移学习的方法,训练出一个适用于煤层气井站场景下移动目标的识别模型,以提高监控系统的准确性并降低其误报率。
张雄涛[7](2019)在《模糊TSK系统的深度集成研究》文中认为近年来,机器学习随着人工智能的火热得到了如火如荼地发展,在推荐系统、机器翻译、语音识别等领域得到了广泛而成功应用。但是,随着应用场景的不断扩大,数据的规模和形式也变得复杂,多样化的数据场景,例如含有噪音特征和噪音标签的训练数据等,给传统的机器学习方法带来了巨大的挑战。在有监督机器学习中,经典的神经网络和TSK模糊系统在面对这些复杂的数据场景时,往往会遇到如下问题:由于技术的限制,采集到的数据不可避免的含有噪音或不确定数据。当使用这些含有噪音和不确定信息的数据进行学习建模时,得到的模型往往泛化性能较差;其次,采集到的原始数据,不可避免的会被工人标注错,或不能确定其类标。如何对错误的类标进行矫正,也是一个亟需要解决的问题。针对上述问题,本文将在现有经典机器学习的基础之上,通过构建不同的集成分类器,以期得到能够解决在复杂数据场景下的建模方法,主要研究成果如下:(1)提出了一种基于模糊划分和模糊加权的集成深度信念网络FE-DBN,用于处理大规模复杂数据的分类问题。首先通过模糊聚类算法对输入数据空间进行模糊划分,将训练数据划分为多个子集,然后利用多个不同结构的DBN独立的对各个子集并行进行训练,凭借DBN强大的神经表达能力逐层去掉各子集中原始数据的不确定信息,最后基于模糊理论思想,将每个分类器的结果进行模糊加权。根据集成原理,FE-DBN可提高DBN的泛化性能,并加速训练时间;(2)提出了一种新型的集成TSK模糊分类器EP-TSK-FK,首先通过并行学习的方式组织所有零阶TSK模糊子分类器,然后每个子分类器的输出被扩充到原始(验证)输入空间,最后通过提出的迭代模糊聚类算法(Iterative fuzzy C-means clustering algorithm,IFCM)作用在增强验证集上生成数据字典,从而利用KNN对测试数据进行快速预测。EP-TSK-FK具有以下优点:以并行学习方式训练其所有零阶TSK模糊子分类器;在EPTSK-FK中,每个零阶TSK子分类器的输出被扩充到原始(验证)输入空间,以便以并行方式打开原始(验证)输入空间中存在的流形结构。因此,根据堆栈泛化原理,可以保证提高分类精度;和其它按顺序训练的分层结构和Boosting结构模糊分类器相比,EPTSK-FK以并行方式组织所有的子分类器,因此运行速度可以得到有效保证;由于EPTSK-FK是在以IFCM&KNN所获得的数据字典的基础上进行分类的,因此具有强鲁棒性。理论和实验验证了模糊分类器EP-TSK-FK具有较高的分类性能、强鲁棒性和高可解释性;(3)提出了一种称为DBN-TSK-FC的新型模糊深度分类器,使之能同时利用模糊表达强大的不确定性处理能力和基于DBN的神经表达的突出抗噪能力对数据进行分类。在所提出的分类器DBN-TSK-FC中,通过在原始数据集上使用经典的模糊聚类算法FCM(fuzzy c-means clustering algorithm FCM),从而形成模糊规则的前件部分,并作为原始数据集的模糊表达;而基于DBN的神经表达则是通过在现有的DBN学习过程中只对训练数据应用相同的无监督预训练,然后将对应的DBN结构中顶层的所有隐层节点的神经表达作为模糊规则的后件变量。以这种方式,通过将后件参数的学习问题转化为线性回归问题,从而利用最小学习机LLM(Least Learning Machine)求得后件参数的最优解,可解释的模糊表达和基于DBN的神经表达被进一步集成以快速形成相应的模糊规则。因此,从模糊规则的角度来看,DBN-TSK-FC本质上是一种新型的TSK模糊分类器,它使DBN的行为在所提出的分类器中是可以解释的。标准UCI数据集的实验结果验证了所提出的分类器DBN-TSK-FC的有效性;最后将DBN-TSK-FC成功应用于AAL(Ambient Assisted Living)中的室内用户移动预测中;(4)在第3章基于模糊聚类和KNN的集成TSK模糊分类器EP-TSK-FK基础上,提出了一种改进型具有标签抗噪能力的集成TSK模糊分类器EW-TSK-CS。在EW-TSKCS中,每一个子分类器TSK-noise-FC在原始零阶TSK模糊分类器目标函数的基础上,增加了两个约束,分别对应不确定标签和错误标签,即标签噪音。在EW-TSK-CS的决策阶段,由于我们在此只考虑二分类问题中的标签噪音问题,因此选用FCM&KNN。每一个子分类器的输出被当做验证数据的增强特征从而打开原始数据空间中的流行结构,从而保证了所提出的EW-TSK-CS的高效性。在实验部分,我们在UCI数据集上模拟真实众包环境中的标签噪音矫正问题,验证了所提出的EW-TSK-CS的性能。最后在电力价格数据集上展示了集成模糊分类器EW-TSK-CS的高可解释性。EW-TSK-CS具有2个非常重要的特征:1)每一个子分类器都是TSK模糊分类器TSK-noise-FC,且EW-TSK-CS并行训练所有的子分类器,没有中间变量的存在,因此保证了EW-TSK-CS具有高可解释性;2)每一个子分类器的目标函数中考虑了标签噪音的存在,因此EWTSK-CS具有较强的标签噪音抗噪能力。
张文元[8](2019)在《鲁棒模糊加权C-有序均值聚类算法研究》文中研究说明模糊聚类分析作为信息科学、统计学、数学、机器学习等多个学科交叉而形成的一种无监督的数据分析方法,是数据分析、知识发现和智能决策等领域中的重要研究内容。本文在对国内外关于模糊聚类相关研究进行深入了解的基础上,采用理论分析、数据实验和应用研究相结合的方法,对模糊聚类进行了较深入的研究。课题从以下几个方面对现有算法做出以下改进:引入了局部空间信息解决了数据受邻域数据影响的问题;引入了数据典型性解决了数据在计算中和中心距离远近影响问题;引用模糊直觉算法解决了对数据不确定性进行了定性研究问题。首先,针对现有模糊聚类法存在去噪性差,计算量大,鲁棒性不足问题,提出一种新的混合聚类算法,新的算法兼容模糊C-均值聚类、聚类空间邻域和聚类数据典型性特性。新的算法综合考虑了运用模糊数学去处理数据的模糊性的优点、数据受邻域数据影响的空间邻域客观性优点和数据离中心距离远近的典型性优点。实验结果表明,合理地设置不同指标的权重能够解决现有聚类算法鲁棒性不足、去燥性差的缺点,较好的实现对给定数据集聚类划分。其次,针对现有模糊C-均值(FCM)算法对噪声敏感性问题,数据空间考虑不足问题,提出了一种模糊C-均值(FCM)算法的改进算法偏倚校正模糊加权C-均值聚类算法。该算法采用模糊的局部(空间和灰度)相似性度量,同时在隶属度中加入了数据属性典型性分析,以保证对噪声不敏感和图像细节的保存。再次,针对上述偏倚校正模糊加权C-均值聚类算法计算量大和模糊C-均值聚类算法对图像细节处理能力较弱的问题,提出一个新的算法核偏差校正模糊加权C-有序均值聚类算法。该算法以核诱导距离测度为基础,结合模糊局部(空间和灰度)相似性度量和数据属性典型性,解决了空间约束模糊C-均值聚类算法对图像噪声不敏感和计算量大等问题。核偏差校正模糊加权C-有序均值聚类算法的中心思想是通过核函数使在低维空间不好解决的问题映射到高维空间,以简化计算增强算法的鲁棒性。最后,针对现有聚类算法对不确定性因素多的图像数据处理中图像噪声敏感性差的问题,提出了一种基于直觉模糊集理论的直觉模糊典型性加权C-有序均值聚类算法。直觉模糊典型性加权C-有序均值聚类算法在隶属度、非隶属度的基础上加入了犹豫度的概念,将数据的不确定性进行定性研究。该算法改善了现有算法对图像噪声敏感性的性能,具有计算量更小和鲁棒性强的优点。
倪景秀[9](2018)在《图像语义融合关键技术的研究》文中认为数字图像的井喷式增长为图像的充分利用提供了坚实的基础,挖掘出图像内容背后隐含的深层次语义信息,也是图像理解领域的重要任务。图像数量的增长对于图像理解的准确度和图像处理的速度提出了更高的要求。首先,图像理解的智能化,要求尽可能地缩小图像内容表示和图像语义理解之间的语义鸿沟。其次,海量图像对于图像处理的时间性能也提出了更高的要求。因此,高效准确地对图像进行自动语义标注迫在眉睫。目前,已有大量研究人员对基于语义的图像标注和图像语义融合等算法展开研究,但是图像理解领域仍然存在许多亟待解决的问题,主要表现在以下三个方面:(1)现有的图像标注的效率和准确率无法满足海量图像的处理需求。图像数量的大幅增长对图像工程的关键技术提出了前所未有的挑战。图像分割、图像语义标注、图像语义融合等算法的性能直接影响图像检测和图像分类等后续环节的准确度。因此,如何实现准确高效的图像自动标注是一项很有挑战性的研究工作。(2)现有的图像分割忽略了图像的空间信息或图像子块之间的位置关系,导致图像分割准确率不高。在图像分割算法中,颜色信息是很重要的图像属性。因为颜色直方图具备旋转不变性、平移不变性和缩放不变性等优势,所以颜色直方图的应用较为广泛,但是,因为颜色直方图缺乏像素点的位置信息,所以颜色直方图也在一定程度上影响了图像分割和图像分类的准确率。在颜色直方图的基础上,附加上像素点或图像子块的位置信息,可以减少错误分割,提高图像分割的准确性,这是一项有意义的研究工作。(3)不同的标注系统产生的图像标注词在语义上存在歧义或冗余。将图像的不同标注信息进行融合,给图像提供完备的、准确的语义信息,这是一项很有意义的工作。目前的图像理解系统在处理图像语义时,很难挖掘出图像内容以外的高级语义,比如场景语义和情感语义。因此,图像检索的结果与人们的需求之间还存在着难以逾越的语义鸿沟。旨在消除计算机理解和人类实际需求之间语义鸿沟的图像语义标注和图像语义融合是当前图像理解领域的研究热点。针对以上问题,本文进行了以下三个方面的研究创新工作。(1)提出一种基于分层的图像语义标注模型。该模型充分利用了图像的全局特征和局部特征的不同作用。整个模型的工作流程分为模型训练阶段和图像标注阶段。在模型训练阶段,利用场景语义树的结构,将场景语义和图像的视觉特征建立关联。在图像标注阶段,利用待标注图像的全局特征将图像归类到某一特定场景,并找到场景对应的场景语义树。然后,根据待标注图像的局部视觉特征,图像在场景语义树中游走,直到某个叶子节点为止,图像在场景语义树中所经过的所有节点的语义标注词的集合即为该图像的语义标注。本文构建了场景相关的场景语义树,对场景内的语义信息进行合理的组织和管理,从而提高图像标注质量。此外,本文提出的语义标注算法在视觉特征的处理过程中采用了模糊聚类算法,这也在一定程度上提高了本文标注算法的准确度。在本文算法中,语义标注词的选择需要结合自然语言处理的语义提取机制,对图像提供的标注词也要符合自然语言的语义层次。根据以上几条标准,本文对于常见的几种场景分别建立对应的场景语义树。(2)提出一种基于模糊聚类和空间信息的图像分割算法。该算法结合图像的颜色直方图和空间金字塔,实现了不同尺度的图像颜色直方图信息提取,促使图像子块的分类和分割更加灵活。由于空间金字塔本身包含了各尺度下图像子图的位置信息,因此,本文提出的图像分割算法大大提高了图像分割的准确率。(3)提出一种基于语义相似度和多特征融合的图像语义融合算法。该算法将两个图像的语义信息进行融合,得到更为全面、更加准确的图像信息。本文提出的基于语义相似度和多特征融合的图像语义融合算法,主要有以下四点贡献:第一,给出语义概念之间相似度的计算方法,以衡量不同语义之间的接近程度;第二,为不同的视觉特征赋予不同的权值,体现了不同特征在图像分类中的不同重要性;第三,权值不同的语义信息使得图像语义融合的结果更加全面和完备;第四,在形成最终语义标注词的过程中使用了 FCM模糊聚类方法,将大量存在冗余的标注词集合用模糊聚类的方法进行集约,保留核心标注词,提高了图像标注的准确性和完整性。通过不同数据集上的实验数据验证,本文得出了以下结论:(1)提出了一种基于分层的图像语义标注模型,充分发挥图像的全局特征和局部特征在图像分类中的不同作用,构建了场景相关的场景语义树,提高了图像语义标注的准确性并降低了标注的时间复杂度。(2)提出了一种基于模糊聚类和空间信息的图像分割算法,该算法结合图像的颜色直方图和空间金字塔,提高了图像分割的准确率。(3)提出一种基于语义相似度和多特征融合的图像语义融合算法,将两个相关图像的语义信息进行融合,得到更加全面的标注信息。
周之昊[10](2007)在《模糊聚类在影像上的应用研究》文中认为在当今飞速发展的数据挖掘和探查性数据分析中,聚类分析技术已广泛应用于模式识别、生物、心理、计算机视觉、遥感、图像处理和视频数据分析等领域。在实际问题中,已有的各种聚类算法各有其优势。在图像处理和数据分析的应用中,如何降低聚类算法对阈值的敏感度以及如何减少人为经验因素对阈值设定的影响,提高检索质量和效率成为众多学者正致力于研究并解决的问题。本文针对目前在聚类算法及其应用中的一些热点问题展开了研究与探讨工作,主要的工作分为以下三部分:1)颜色作为影像的一种重要视觉信息,广泛应用于基于内容的影像检索。文中在将视频分割为镜头后,以SCD与CLD两种颜色描述子作为描述镜头的视觉特征。鉴于图像信息固有的复杂性和不精确性,本文引入了模糊化的机理对HSY颜色模型的颜色信息进行模糊量化,得到关于颜色特征的模糊直方图,并应用于相似度计算,取得了较为满意的效果。2)本文研究了基于非监督在线聚类的模糊聚类算法,给出了一种一般化的模糊聚类方法MRLC。该方法将非监督模糊聚类算法Leader-follower与半径圆心概念结合起来,具有对聚类初始条件不敏感和自适应的特点。大量的实验结果表明了该模糊方法MRLC的有效性。3)在深入分析基于相似度量的聚类方法的核心算法Leader-follower的基础上,本文引入其它算法对模糊聚类方法MRLC进一步修正和补充。在提取关键帧和提取关键镜头时,根据实际情况,分别作了一些改进,使聚类结果更符合主观视觉。同时尽量减少因人为经验对阈值的影响,避免使用这类阈值或使其所受影响减少。
二、用无监督模糊聚类方法进行视频内容的分层表示(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、用无监督模糊聚类方法进行视频内容的分层表示(论文提纲范文)
(1)采煤机工作空间人员检测与预警关键技术研究(论文提纲范文)
致谢 |
摘要 |
abstract |
变量注释表 |
1 绪论 |
1.1 课题来源及背景 |
1.2 课题研究现状及存在问题 |
1.3 课题研究内容与方法 |
1.4 课题研究意义 |
2 采煤机工作空间人员检测与预警技术总体设计 |
2.1 综采工作面总体布置 |
2.2 采煤机工作空间人员检测与预警技术 |
2.3 本章小结 |
3 综采工作面红外图像去噪技术研究 |
3.1 综采工作面红外热成像技术的适用性分析 |
3.2 综采工作面红外图像去噪技术 |
3.3 仿真分析 |
3.4 本章小结 |
4 采煤机工作空间移动目标运动特征提取技术研究 |
4.1 采煤机工作空间人员检测问题 |
4.2 基于窗口尺寸自适应Lucas–Kanade光流移动目标运动特征检测 |
4.3 采煤机工作空间移动目标运动特征提取 |
4.4 仿真分析 |
4.5 本章小结 |
5 采煤机工作空间移动目标位置信息检测方法研究 |
5.1 采煤机工作空间移动目标位置信息检测算法实现 |
5.2 综采工作面红外图像分割 |
5.3 基于群智能的局部信息加权直觉模糊C聚类算法 |
5.4 基于投票法的采煤机工作空间人员检测方法 |
5.5 仿真分析 |
5.6 本章小结 |
6 基于卡尔曼滤波的采煤机工作空间人员位置预测和危险状态预警技术研究 |
6.1 采煤机工作空间人员运动状态预测及预警功能实现 |
6.2 基于卡尔曼滤波的运动预测 |
6.3 机动目标跟踪模型 |
6.4 基于卡尔曼滤波的运动预测算法 |
6.5 采煤机工作空间人员预警实现 |
6.6 本章小结 |
7 实验研究 |
7.1 采煤机工作空间人员检测与预警系统关键参数设置 |
7.2 采煤机工作空间人员检测功能评价 |
7.3 采煤机工作空间人员预警保护功能评价 |
7.4 采煤机工作空间人员检测与预警成功率分析 |
7.5 本章小结 |
8 总结与展望 |
8.1 总结 |
8.2 论文创新点 |
8.3 展望 |
参考文献 |
作者简历 |
学位论文数据集 |
(2)基于模糊深度学习的视频目标检测方法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 模糊深度学习 |
1.2.2 目标检测 |
1.2.3 目标跟踪 |
1.2.4 研究的主要难点 |
1.3 研究主要内容和章节安排 |
1.3.1 研究内容 |
1.3.2 章节安排 |
第2章 相关基本理论 |
2.1 引言 |
2.2 模糊聚类算法 |
2.3 背景建模算法 |
2.3.1 平均背景模型 |
2.3.2 单高斯背景模型 |
2.3.3 混合高斯背景模型 |
2.4 目标跟踪算法 |
2.4.1 卡尔曼滤波算法 |
2.4.2 质心跟踪算法 |
2.5 本章小结 |
第3章 基于模糊深度置信网络的视频车辆检测方法 |
3.1 引言 |
3.2 深度置信网络 |
3.3 模糊受限玻尔兹曼机 |
3.4 基于模糊深度置信网络的车辆检测算法 |
3.4.1 目标特征提取 |
3.4.2 模糊深度置信网络学习算法 |
3.4.3 系统框架设计 |
3.5 实验结果与分析 |
3.6 本章小结 |
第4章 模糊深度学习车辆检测跟踪算法及系统设计与实现 |
4.1 引言 |
4.2 基于模糊聚类的数据关联算法 |
4.3 模糊深度学习检测跟踪软件设计方案 |
4.4 模糊深度学习检测跟踪系统实现 |
4.4.1 视频导入模块 |
4.4.2 视频目标检测模块 |
4.4.3 视频目标跟踪模块 |
4.4.4 视频输出模块 |
4.4.5 系统交互界面实现 |
4.5 系统测试 |
4.6 本章小结 |
第5章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
指导教师对研究生学位论文的学术评语 |
学位论文答辩委员会决议书 |
致谢 |
攻读硕士学位期间的研究成果 |
(3)成对约束半监督聚类算法研究(论文提纲范文)
致谢 |
摘要 |
abstract |
1 绪论 |
1.1 课题来源 |
1.2 研究背景及意义 |
1.3 国内外研究现状 |
1.4 本文主要研究内容 |
1.5 论文组织结构 |
2 相关理论概述 |
2.1 数据挖掘 |
2.2 聚类分析 |
2.3 主动学习 |
2.4 本章小结 |
3 基于主动学习的成对约束半监督聚类方法 |
3.1 半监督聚类分析 |
3.2 基于主动学习的半监督框架 |
3.3 基于主动学习的迭代稳定Cop-kmeans聚类算法 |
3.4 实验结果与分析 |
3.5 本章小结 |
4 基于熵的成对约束半监督聚类方法 |
4.1 交叉熵介绍 |
4.2 相关算法介绍 |
4.3 改进的基于交叉熵的主动半监督模糊聚类算法 |
4.4 实验结果与分析 |
4.5 本章小结 |
5 总结和展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
作者简历 |
学位论文数据集 |
(4)基于深度学习的视频摘要方法研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 本文主要工作 |
1.4 论文内容安排 |
第二章 视频摘要理论与技术 |
2.1 视频摘要理论概述与方法框架 |
2.2 基于聚类的方法 |
2.3 深度学习的方法 |
2.3.1 深度学习方法的理论介绍 |
2.3.2 对抗网络的视频摘要方法 |
2.3.3 文本信息的方法 |
2.4 本章小结 |
第三章 基于改进的特征融合视频摘要方法 |
3.1 引言 |
3.2 整体方法概述 |
3.3 特征的提取与关键帧的选择 |
3.3.1 差异性的特征融合与关键帧的选择 |
3.3.2 注意力机制特征融合与关键帧的选择 |
3.4 实验设计及分析 |
3.4.1 实验数据及及评价标准 |
3.4.2 实施细节及结果分析 |
3.5 本章小结 |
第四章 基于强化学习的视频摘要 |
4.1 引言 |
4.2 整体方法概述 |
4.3 强化学习 |
4.3.1 强化学习的基本模型和原理 |
4.3.2 策略梯度 |
4.4 特征提取与关键帧选择 |
4.4.1 关键帧检测与提取 |
4.4.2 状态-动作值函数对agent的作用 |
4.4.3 .策略梯度 |
4.5 实验 |
4.5.1 数据集 |
4.5.2 评价标准 |
4.5.3 实施细节 |
4.5.4 实验结果分析 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 论文总结 |
5.2 工作展望 |
参考文献 |
攻读硕士学位期间的学术活动及成果情况 |
(5)面向大数据特征学习的深度卷积计算模型研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外相关工作研究进展 |
1.2.1 深度学习概述 |
1.2.2 深度学习典型计算架构 |
1.2.3 面向异构数据特征学习的深度学习相关工作 |
1.2.4 面向海量数据特征学习的深度学习相关工作 |
1.2.5 面向增量数据特征学习的深度学习相关工作 |
1.3 本文主要研究内容 |
1.4 论文组织结构 |
2 深度卷积计算模型 |
2.1 引言 |
2.2 问题描述 |
2.3 张量数据模型 |
2.4 张量非线性计算层 |
2.4.1 张量卷积层 |
2.4.2 张量抽样层 |
2.4.3 张量全连接层 |
2.5 高阶反向传播算法 |
2.5.1 张量全连接层反向计算 |
2.5.2 张量抽样层反向计算 |
2.5.3 张量卷积层反向计算 |
2.6 基本深度卷积计算模型 |
2.7 实验验证与分析 |
2.7.1 实验对比模型 |
2.7.2 验证评价指标 |
2.7.3 数据划分策略 |
2.7.4 CUAVE数据集实验结果 |
2.7.5 STL-10数据集实验结果 |
2.8 本章小结 |
3 CP分解深度卷积计算模型 |
3.1 引言 |
3.2 问题描述 |
3.3 CP张量分解 |
3.4 CP分解张量计算层 |
3.4.1 CP分解张量全连接层 |
3.4.2 CP分解张量卷积层 |
3.5 CP高阶反向传播过程 |
3.5.1 CP分解张量全连接层反向计算 |
3.5.2 CP张量卷积层反向计算 |
3.6 基本CP分解的深度卷积计算模型 |
3.7 实验验证与分析 |
3.7.1 实验对比模型 |
3.7.2 验证评价指标 |
3.7.3 数据划分策略 |
3.7.4 CUAVE数据集实验结果 |
3.7.5 STL-10数据集实验结果 |
3.8 本章小结 |
4 增量深度卷积计算模型 |
4.1 引言 |
4.2 问题描述 |
4.3 dropout正则化方法 |
4.4 增量学习算法 |
4.4.1 参数增量学习算法 |
4.4.2 结构增量学习算法 |
4.5 实验验证与分析 |
4.5.1 CIFAR数据集 |
4.5.2 CUAVE数据集 |
4.6 本章小结 |
5 基于深度计算的模糊聚类 |
5.1 引言 |
5.2 问题描述 |
5.3 模糊聚类算法 |
5.3.1 模糊聚类定义 |
5.3.2 模糊聚类研究进展 |
5.4 基于深度卷积计算的模糊聚类框架 |
5.4.1 私有模态降噪自动编码模块 |
5.4.2 深度卷积计算特征融合模块 |
5.4.3 高阶模糊聚类模块 |
5.5 实验验证分析 |
5.5.1 实验对比模型 |
5.5.2 验证评价指标 |
5.5.3 数据划分策略 |
5.5.4 MIR Flickr数据集实验结果 |
5.5.5 CUAVE数据集实验结果 |
5.6 本章小结 |
6 结论与展望 |
6.1 结论 |
6.2 创新点 |
6.3 展望 |
参考文献 |
攻读博士学位期间科研项目及科研成果 |
致谢 |
作者简介 |
(6)煤层气井站异常目标检测及识别算法研究(论文提纲范文)
摘要 |
Abstract |
主要符号表 |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外相关工作研究进展 |
1.2.1 前景检测方法 |
1.2.2 传统背景减除法 |
1.2.3 深度学习及深度背景减除法 |
1.2.4 迁移学习 |
1.3 本文主要研究思路 |
1.3.1 解决方案 |
1.3.2 论文章节安排 |
2 融合模糊聚类直方图与贴近度的背景减除法 |
2.1 问题描述及解决思路 |
2.2 方法描述 |
2.2.1 模糊集的基本概念 |
2.2.2 贴近度概念 |
2.2.3 模糊直方图背景建模 |
2.2.4 模糊自适应背景维护 |
2.2.5 动态阈值选择 |
2.2.6 算法流程 |
2.3 实验结果与分析 |
2.3.1 实验数据集 |
2.3.2 算法性能评估标准 |
2.3.3 实验结果 |
2.3.4 模糊背景建模方法对比 |
2.3.5 非模糊背景建模方法对比 |
2.3.6 煤层气井站视频移动目标检测实验 |
2.4 本章小结 |
3 无监督深度动态背景减除法改进 |
3.1 问题描述及解决思路 |
3.2 背景减除法改进方法描述 |
3.2.1 VGG16卷积网络模型 |
3.2.2 深度卷积层提取图像特征 |
3.2.3 卷积特征图像合成 |
3.3 实验结果与数据分析 |
3.3.1 动态背景视频数据集实验 |
3.3.2 与其他深度背景建模改进方法对比 |
3.3.3 基于卷积特征的FCFN的改进 |
3.3.4 煤层气井站视频数据集实验 |
3.4 本章小结 |
4 煤层气井站视频大尺度扰动下的动态背景建模 |
4.1 问题描述及解决思路 |
4.2 方法描述 |
4.2.1 核密度估计 |
4.2.2 动态背景与静态背景分割 |
4.2.3 动态背景建模 |
4.2.4 窗宽选择 |
4.2.5 动态背景模型的阈值选择 |
4.2.6 动态背景模型更新 |
4.3 实验与评估 |
4.3.1 实验数据集 |
4.3.2 不含前景目标的场景检测 |
4.3.3 含有前景目标的场景检测 |
4.4 本章小结 |
5 煤层气井站异常场景识别 |
5.1 问题描述及解决思路 |
5.2 抽水机运动状态监测 |
5.3 结合背景建模与迁移学习的移动目标识别 |
5.3.1 运动目标提取 |
5.3.2 前景目标聚类 |
5.3.3 迁移训练 |
5.4 实验结果与数据分析 |
5.4.1 前景目标检测 |
5.4.2 前景目标识别及分类 |
5.5 本章小结 |
6 结论与展望 |
6.1 结论 |
6.2 创新点 |
6.3 展望 |
参考文献 |
攻读博士学位期间科研项目及科研成果 |
致谢 |
作者简介 |
(7)模糊TSK系统的深度集成研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 经典机器学习研究现状 |
1.2.1 模糊系统研究现状 |
1.2.2 深度学习研究现状 |
1.2.3 集成学习研究现状 |
1.3 课题研究内容和本文结构 |
第二章 基于模糊划分和模糊加权的集成深度信念网络 |
2.1 引言 |
2.2 基于模糊划分和模糊加权的DBN分类器集成 |
2.2.1 FE-DBN结构图 |
2.2.2 实现过程 |
2.3 算法及其复杂度分析 |
2.3.1 FE-DBN算法描述 |
2.3.2 时间复杂度分析 |
2.4 实验与分析 |
2.4.1 实验设置 |
2.4.2 人造数据集实验 |
2.4.3 UCI数据集实验 |
2.5 本章小结 |
第三章 基于模糊聚类和KNN的具有高可解释的并行集成模糊分类器 |
3.1 引言 |
3.2 迭代模糊聚类算法IFCM |
3.3 EP-TSK-FK |
3.3.1 EP-TSK-FK的架构 |
3.3.2 EP-TSK-FK算法描述 |
3.3.3 时间复杂度分析 |
3.3.4 理论证明 |
3.4 实验分析 |
3.4.1 实验设置 |
3.4.2 UCI和 KEEL数据集实验 |
3.4.3 非参数统计分析 |
3.4.4 运行原理及可解释性展示 |
3.5 本章小结 |
第四章 基于DBN的模糊深度分类器及其在AAL中的应用 |
4.1 引言 |
4.2 现有的模糊深度分类器 |
4.3 DBN-TSK-FC |
4.3.1 DBN-TSK-FC的架构 |
4.3.2 DBN-TSK-FC训练及预测算法 |
4.3.3 时间复杂度分析 |
4.4 实验与分析 |
4.4.1 实验设置 |
4.4.2 UCI数据集实验 |
4.4.3 非参数统计分析 |
4.4.4 AAL数据集实验 |
4.5 本章小结 |
第五章 具有标签抗噪能力的集成TSK模糊分类器及其在众包中的应用 |
5.1 引言 |
5.2 准备知识 |
5.3 TSK-noise-FC |
5.4 EW-TSK-CS |
5.4.1 EW-TSK-CS的结构 |
5.4.2 EW-TSK-CS的算法描述 |
5.4.3 时间复杂度分析 |
5.5 实验与分析 |
5.5.1 实验设置 |
5.5.2 UCI数据集仿真实验 |
5.5.3 非参数统计分析 |
5.5.4 电力价格数据集实验 |
5.6 本章小结 |
第六章 结束语 |
致谢 |
参考文献 |
附录 |
附录1 :攻读博士学位期间发表的论文 |
附录2 :攻读博士学位期间参与的科研项目 |
(8)鲁棒模糊加权C-有序均值聚类算法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 聚类分析方法研究的背景及意义 |
1.1.1 分类 |
1.1.2 聚类的应用 |
1.2 模糊聚类算法国内外研究现状 |
1.2.1 FCM算法研究现状 |
1.2.2 序列均值模糊聚类算法研究现状 |
1.2.3 模糊直觉算法研究现状 |
1.2.4 模糊聚类算法在图像分割中的应用 |
1.2.5 模糊聚类算法的国内外重视程度 |
1.3 本文的主要研究内容 |
第2章 模糊聚类分析理论及其目标函数 |
2.1 模糊空间基础知识及其数值模式识别 |
2.1.1 模糊空间基础知识 |
2.1.2 模糊聚类空间划分及数学集合表示 |
2.1.3 模糊空间分类器 |
2.1.4 数值模式识别运行过程 |
2.1.5 模糊聚类算法分析的步骤 |
2.2 数据聚类算法及其目标函数研究 |
2.2.1 聚类分析 |
2.2.2 C-均值聚类及其迭代算法 |
2.2.3 FCM算法 |
2.2.4 C-均值模型算法 |
2.2.5 各类算法目标函数研究 |
2.2.6 HCM、FCM和 PCM算法研究 |
2.3 HCM、FCM和 PCM算法实验结果 |
2.4 本章小结 |
第3章 偏差校正模糊加权C-有序均值聚类算法研究 |
3.1 引言 |
3.1.1 空间信息的模糊均值聚类研究 |
3.1.2 提出BFWCOM算法动机 |
3.1.3 本章的组织结构 |
3.2 相关工作 |
3.2.1 模糊聚类算法中的局部空间信息 |
3.2.2 模糊均值权重C-序列均值算法 |
3.3 融入空间信息和模糊权重的新算法BFWCOM |
3.3.1 BFWCOM算法设计准则函数 |
3.3.2 BFWCOM算法隶属度和中心 |
3.3.3 聚类算法原型更新 |
3.3.4 偏置场 |
3.4 BFWCOM算法及其复杂度计算和收敛性 |
3.4.1 BFWCOM算法和复杂度 |
3.4.2 BFWCOM算法局部收敛性 |
3.5 BFWCOM算法实验 |
3.5.1 IRIS数据进行分类实验 |
3.5.2 合成图像实验 |
3.5.3 脑部MR图像和Lena图像实验 |
3.6 本章小结 |
第4章 核偏差校正模糊加权C-有序均值聚类算法研究 |
4.1 引言 |
4.1.1 引入核方法模糊聚类 |
4.1.2 本章的组织结构 |
4.2 相关工作 |
4.2.1 BFWCOM算法准则函数设计 |
4.2.2 聚类原型及偏置场更新 |
4.2.3 数据典型性计算 |
4.3 有关核函数理论及引入动机 |
4.3.1 核函数的定义 |
4.3.2 核函数的基本原理 |
4.3.3 高斯径向基函数聚类算法 |
4.3.4 引入核函数的动机 |
4.4 核诱导偏差校正模糊加权C-阶均值聚类算法 |
4.4.1 基于核诱导距离的FCM算法 |
4.4.2 基于核诱导距离的空间约束KBFWCM算法 |
4.5 KBFWCM算法实验 |
4.5.1 IRIS数据聚类实验 |
4.5.2 合成图像实验 |
4.5.3 脑部MR图像和Lena头像实验 |
4.6 本章小结 |
第5章 基于直觉模糊集的加权C-有序均值聚类算法研究 |
5.1 引言 |
5.1.1 引入直觉模糊集合简介 |
5.1.2 IFTWCOM算法动机 |
5.1.3 本章的组织结构 |
5.2 模糊集合聚类算法相关工作 |
5.2.1 BFWCOM算法准则函数设计 |
5.2.2 数据典型性计算 |
5.3 直觉模糊集相关工作 |
5.3.1 IFS定义 |
5.3.2 区间值直觉模糊集距离定义 |
5.3.3 直觉模糊C-均值聚类算法 |
5.4 直觉模糊典型性加权C-有序均值聚类算法 |
5.4.1 IFTWCOM算法目标函数 |
5.4.2 IFTWCOM算法及其复杂度 |
5.4.3 IFTWCOM时空复杂性分析 |
5.5 IFTWCOM算法实验 |
5.5.1 IRIS数据聚类实验 |
5.5.2 合成图像实验 |
5.5.3 脑部MR图像和海星图像实验 |
5.6 本章小结 |
结论 |
参考文献 |
攻读博士学位期间承担的科研任务与主要成果 |
致谢 |
(9)图像语义融合关键技术的研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究现状 |
1.2.1 图像分割算法现状 |
1.2.2 图像融合算法现状 |
1.2.3 图像语义标注现状 |
1.2.4 图像语义标注的数据集、语料库和标注工具 |
1.2.5 性能评价研究现状 |
1.3 存在的问题 |
1.4 主要研究内容和创新点 |
1.4.1 主要研究内容 |
1.4.2 创新点 |
1.5 文章组织结构 |
2 理论研究综述 |
2.1 图像分割算法 |
2.1.1 图像的全局特征的提取 |
2.1.2 图像的局部特征的提取 |
2.1.3 基于多层次的图像分割模型 |
2.2 基于聚类算法的图像分割算法 |
2.2.1 基于聚类算法的图像分割 |
2.2.2 基于FCM聚类的图像分割算法 |
2.2.3 FCM的深入研究和改进 |
2.3 图像融合算法 |
2.4 本章小结 |
3 基于分层的图像语义标注模型 |
3.1 图像语义标注的研究现状 |
3.2 图像的语义标注模型 |
3.2.1 图像的语义表示 |
3.2.2 场景语义树 |
3.2.3 语义相似度度量方法 |
3.3 基于分层的图像语义标注算法的实现 |
3.3.1 场景语义树的构造算法 |
3.3.2 分层次图像语义标注算法 |
3.3.3 分层次的图像语义标注模型 |
3.4 实验结果及分析 |
3.4.1 实验的建立 |
3.4.2 实验结果与分析 |
3.5 本章小结 |
4 基于模糊聚类和空间信息的图像分割算法 |
4.1 图像分割的研究现状 |
4.2 基于模糊聚类和空间信息的图像语义分割算法 |
4.2.1 显着区域的检测 |
4.2.2 空间金字塔实现多尺度特征向量的提取 |
4.2.3 基于模糊聚类和空间信息的图像分割算法 |
4.3 实验及分析 |
4.3.1 实验的设置 |
4.3.2 实验性能分析 |
4.4 本章小结 |
5 基于语义相似度和多特征融合的图像语义融合算法 |
5.1 图像语义融合算法的研究现状 |
5.2 图像语义融合算法模型 |
5.2.1 图像语义表示 |
5.2.2 图像特征 |
5.2.3 多特征融合 |
5.3 基于语义相似度和多特征融合的图像语义融合算法 |
5.3.1 融合算法的基本思想 |
5.3.2 基于语义相似度和多特征融合的图像语义融合算法 |
5.4 实验结果与分析 |
5.4.1 实验的设置 |
5.4.2 图像语义融合实验 |
5.4.3 图像标注有效性实验结果与分析 |
5.4.4 图像语义融合的性能比较 |
5.5 本章小结 |
6 结论与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
作者简介 |
(10)模糊聚类在影像上的应用研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 问题的提出 |
1.2 国内外研究现状 |
1.3 主要研究工作和成果 |
第二章 聚类分析简述 |
2.1 引言 |
2.2 相似性测量函数及聚类准则 |
2.2.1 相似性测量函数 |
2.2.2 聚类准则 |
2.3 聚类算法分类及有效性分析 |
2.3.1 聚类算法的分类 |
2.3.2 聚类有效性 |
2.4 小结 |
第三章 影像的采样与表示 |
3.1 引言 |
3.2 影像分割原理和方法 |
3.2.1 视频数据 |
3.2.2 分割原理 |
3.2.3 分割方法 |
3.2.4 模糊聚类在分割中的研究与应用 |
3.3 影像采样的特征提取 |
3.3.1 提取原理 |
3.3.2 提取方法 |
3.4 实验 |
3.5 小结 |
第四章 模糊聚类方法 |
4.1 聚类算法LEADER-FOLLOWER |
4.2 主要模糊聚类方法MRLC |
4.3 辅助模糊聚类方法迭代最优化 |
4.4 实验 |
4.5 小结 |
第五章 基于模糊聚类的视频检索方法 |
5.1 引言 |
5.1.1 基于内容的视频检索(CBVR)技术 |
5.1.2 本章所作的工作 |
5.2 关键帧提取和关键镜头提取 |
5.2.1 关键帧提取 |
5.2.2 关键镜头提取 |
5.3 镜头检索的主客观评判准则 |
5.4 实验 |
5.5 小结及展望 |
致谢 |
参考文献 |
攻读硕士学位期间录用和发表的论文 |
四、用无监督模糊聚类方法进行视频内容的分层表示(论文参考文献)
- [1]采煤机工作空间人员检测与预警关键技术研究[D]. 魏东. 中国矿业大学, 2021
- [2]基于模糊深度学习的视频目标检测方法研究[D]. 李琛. 深圳大学, 2020(10)
- [3]成对约束半监督聚类算法研究[D]. 秦悦. 中国矿业大学, 2020
- [4]基于深度学习的视频摘要方法研究[D]. 李巧凤. 合肥工业大学, 2020(02)
- [5]面向大数据特征学习的深度卷积计算模型研究[D]. 李朋. 大连理工大学, 2019(08)
- [6]煤层气井站异常目标检测及识别算法研究[D]. 于天暝. 大连理工大学, 2019(08)
- [7]模糊TSK系统的深度集成研究[D]. 张雄涛. 江南大学, 2019(05)
- [8]鲁棒模糊加权C-有序均值聚类算法研究[D]. 张文元. 燕山大学, 2019(06)
- [9]图像语义融合关键技术的研究[D]. 倪景秀. 中国矿业大学(北京), 2018(03)
- [10]模糊聚类在影像上的应用研究[D]. 周之昊. 江南大学, 2007(03)