面向高分辨SAR图像分类的量子深度神经网络研究

项目来源

国家自然科学基金(NSFC)

项目主持人

李阳阳

项目受资助机构

西安电子科技大学

立项年度

2017

立项时间

未公开

项目编号

61772399

研究期限

未知 / 未知

项目级别

国家级

受资助金额

63.00万元

学科

信息科学-人工智能

学科代码

F-F06

基金类别

面上项目

关键词

深度神经网络 ; 地物分类 ; 高分辨SAR图像 ; 稀疏特征 ; 量子并行计算 ; quantum parallel computation ; deep neural network ; sparse feature ; high-resolution SAR image ; terrain classification

参与者

李豪;李玲玲;孟洋;刘天宇;陆高;周林浩;张玮桐;白小玉

参与机构

西安电子科技大学;上海海事大学

项目标书摘要:本课题针对高分辨SAR图像数据量大,稀疏特征难以表示的瓶颈问题,从而借鉴脑神经计算机理,构造量子深度神经网络模型对高分辨SAR数据进行稀疏表示;为解决深度神经网络模型规模与训练速度、训练精度之间的权衡问题,基于量子并行计算,建立量子深度学习算法,实现高效学习,克服灾变性失忆等缺陷;将非监督的高分辨SAR图像分类转化为对目标函数的优化问题,针对传统优化算法全局优化能力不足导致SAR图像处理结果易陷入局部极值,建立量子免疫优化的高维特征选择算法,用具有挑战性的高分辨SAR图像分类问题,来验证该网络计算模型的有效性与可扩展性。

Application Abstract: Aiming at the bottlenecks,such as large amount of data and being difficult to represent the sparse features,of high-resolution Synthetic Aperture Radar(SAR)images,this subject draws on the neural network mechanism and constructs the quantum-inspired deep neural network to overcome these bottlenecks.In order to solve the trade-off between the model scale and the training speed,training precision of the deep neural networks,we will design quantum-inspired learning algorithms based on the quantum parallel computing,which achieve efficient learning,and overcome catastrophic amnesia.In our study,we convert the unsupervised high-resolution SAR image classification problem into optimization problem.Meanwhile,aiming at the shortcomings that the SAR image processing results are easy to fall into the local optimum of the traditional optimization algorithm,we establish a high-dimensional feature selection algorithm for quantum-inspired immune optimization,and use the challenging high-resolution SAR image to verify the validity and expansibility of the computing network model.

项目受资助省

陕西省

项目结题报告(全文)

针对高分辨SAR 图像数据量大,稀疏特征难以表示,借鉴量子神经网络的指数级记忆容量和学习速度,并行计算能力,稳定性好的特性,建立模拟大脑处理信息过程的智能计算模型——量子深度神经网络模型;针对深度神经网络在处理高分辨SAR图像时的瓶颈问题,建立量子学习算法;通过优化的方式构建高效的深度神经网络,实现高分辨SAR图像分类,突破了网络模型的结构和超参数难以确定、复杂数据计算量庞大、自适应性弱、抗噪能力差和鲁棒性差等关键技术,为高维复杂结构的SAR图像分类任务构建了高效、稳健的深度神经网络;成功应用于高分辨SAR图像分类与解译的关键问题中,设计并实现基于量子神经网络的高分辨SAR图像识别系统。本课题研究成果共计发表论文37篇,其中SCI检索的国际期刊论文25篇,包括SCI Ⅰ区及II 区的国际刊物共16篇,出版教材1部,获2020年度陕西省研究生优秀教材一等奖1项,申报国家发明专利16 项和软件著作权2项(其中授权5项专利和2项软件著作权),培养博士和硕士9人,其中一篇博士论文获得“2021年陕西省优秀博士学位论文”称号。

  • 排序方式:
  • 2
  • /
  • 1.基于全卷积网络和半监督学习的极化SAR图像分类

    • 关键词:
    • 极化SAR;全卷积网络;注意力机制;边缘检测;对抗训练;半监督学习
    • 邢若婷
    • 指导老师:西安电子科技大学 李阳阳
    • 学位论文

    极化SAR(Polarimetric SAR,Pol SAR)图像是由地物目标对极化波束的后向散射而形成的高分辨遥感影像,在地质勘探、植被生长评估、城市规划及海洋监测等方面都有很广泛的应用。极化SAR图像分类是极化信息处理和地物目标解译的重要环节之一,近来,得益于深度学习技术的发展,出现许多解决极化SAR图像分类问题的新思路和新模型。全卷积网络的编解码网络结构非常适合极化SAR图像分类,但由于网络固有的缺陷以及问题本身的特殊性,还存在一些有待解决的问题。极化SAR图像难以获得大量有标签数据,半监督分类方法成为目前的研究热点之一。基于全卷积网络和半监督学习,本文提出了几种准确率高、效率高的极化SAR图像分类方法,具体内容如下:(1)针对极化SAR图像的高维特征的有效编码表示问题和上采样解码丢失细节特征造成的分类模糊问题,第二章提出了一种基于特征注意和特征改善全卷积网络的极化SAR图像分类方法。该方法在网络中引入了两种注意力机制模型和一种残差修正模型,其中双重特征注意模型从极化SAR图像的高维特征中自适应地获取更加鲁棒的特征编码,融合特征注意模型能够获取不同阶段的融合特征的一致性,并结合特征改善模型重建一致性的细节特征。本方法增强了全卷积网络的特征表示和特征重建这两部分的功能,实验验证能够显著提升极化SAR图像的分类准确率。(2)针对各个类别的边缘区域的分类不够精细和分类区域一致性不强的问题,第三章提出了一种基于边缘感知双分支全卷积网络的极化SAR图像分类方法。该方法在第二章全卷积网络的结构基础上添加了边缘感知网络,进而形成双分支全卷积网络,同步训练两个分支可以达到约束分类区域边缘、增强区域一致性的目的。本方法对类别边缘的分类更加精细从而增强了分类区域一致性,实验验证能够有效地提升极化SAR图像的分类准确率。(3)针对极化SAR图像分类中的小样本问题,第四章提出了一种基于对抗训练的半监督极化SAR图像分类方法。该方法在第二章全卷积网络的结构基础上添加了判别网络,两者采用对抗训练的方式逐渐修正分类结果和真实标签之间的高阶不一致,使预测结果更接近真实值。此外该方法合理地定义了无标签样本的分类损失,采用判别网络的预测置信度自动标注无标签样本并动态地扩大训练集,使大量无标签样本信息获得有效利用。实验验证本方法仅利用少量的有标签样本也能一定程度地提升极化SAR图像的分类准确率。

    ...
  • 2.基于改进粒子群算法的超参数优化问题的研究

    • 关键词:
    • 超参数优化;离散粒子群算法;密母算法;SAR图像分类;卷积神经网络
    • 李甜甜
    • 指导老师:西安电子科技大学 李阳阳
    • 学位论文

    随着云计算、移动互联网的快速发展,大数据时代正在来临,数据对任何行业都至关重要。在数据决定研究问题上限的基础上,如何高效地利用算法去逼近这个上限是所有科研人员关注的问题。机器学习方法可以快速、有效地从海量数据中获取潜在信息,在这方面表现较为突出的是深度学习方法,它在海量数据面前表现出了强大的运算能力。在使用机器学习算法前,需要事先配置好模型的超参数,在同一问题上,不同超参数配置的模型的表现能力往往差别较大。在大型机器学习算法兴起之前,人们大多依靠经验手动的对模型的超参数进行调整,但随着模型日益复杂,这种方法显然已不能满足需求。基于此,本文围绕超参数优化问题展开研究,提出了基于改进粒子群算法的超参数优化方法。本文主要工作如下:(1)提出了一种基于离散二进制粒子群算法的超参数优化方法,简称BPSO。该方法模拟自然界中鸟群觅食的行为,并采用启发式的搜索思想来寻找最优解。经典的粒子群算法多适用于连续空间的优化问题,而常用的机器学习模型的超参数多为离散变量,本文结合超参数属性特点,提出了BPSO算法。在BPSO算法中,采用二进制编码方式对粒子位置进行编码,并结合粒子速度信息搜索超参数。实验证明,不管是对四个基准测试函数还是对神经网络、随机森林模型,本方法的处理结果优于遗传算法和随机搜索方法。(2)提出了一种基于密母算法的超参数优化方法,简称MA。考虑到上文BPSO算法在优化超参数时,可能出现陷入局部最优点的情况,提出了MA算法。相较于基本的进化方法,密母算法在进化过程中加入了局部搜索策略,提高了算法的搜索能力,从而有效避免解陷入局部最优,MA算法中的局部搜索使用了上文提出的BPSO方法。为了验证算法的有效性,将本算法与上文使用的超参数优化方法在四个测试函数和MINIST手写体数据集上进行实验比较。实验证明不管是算法收敛速度还是得到的最优值,本章提出的方法表现都较为理想,优化的模型也最为稳定。(3)针对现有合成孔径雷达(Synthetic Aperture Radar,SAR)图像分类任务都是依靠手动进行参数调整的现状,将超参数优化的思想应用到SAR图像分类中,提出了一种基于量子粒子群算法的超参数优化方法。该方法优化用于处理SAR图像分类任务的卷积神经网络的超参数,并通过分类准确率来评估算法性能。实验表明,经过手动调参和超参优化的卷积网络在SAR图像分类问题上表现相差较大,经过超参优化后的卷积网络的泛化能力更强,SAR图像分类的准确率更高。

    ...
  • 3.基于多任务学习与代理模型的多目标跟踪方法

    • 关键词:
    • 多目标跟踪;多任务学习;级联匹配;注意力机制;上采样;代理模型
    • 张家豪
    • 指导老师:西安电子科技大学 李阳阳
    • 学位论文

    多目标跟踪任务是计算机视觉领域中的关键任务,其是目标检测、图像分割等任务的进一步发展,也是人体姿态估计、行为识别与分析等高级任务的基石,具有丰富的研究和实用价值。多目标跟踪任务的目的是识别和检测出视频帧中所有的目标,并保证每个目标在其所在视频帧中的身份信息不变,即对每个目标维持一个相同的ID编号。目前对多目标跟踪任务的处理框架主要分为四个步骤,包括目标检测、特征向量提取、相似度计算和数据关联。研究对象主要集中在行人跟踪方面,因为对行人的研究更具有应用价值和商业价值,常见的应用场景包括自动驾驶、视频监测和虚拟现实等。如何构建快速且准确的多目标跟踪模型,是本课题的研究重点。本文具体研究工作如下:(1)从速度方面考虑。针对多目标跟踪任务流程冗余,运行时间慢,提出了一种基于多任务学习和级联匹配的多目标跟踪方法。该模型中的多任务学习方法合并了目标检测过程和基于检测框的特征向量提取过程,一步检测出目标的位置并输出具有类内区分度的特征向量,省去了基于检测结果的特征提取时间,减少了总任务时间。并且在多任务学习的过程中,特征向量提取子任务会对目标检测子任务产生“窃听效应”,获取到目标周围的环境信息,更提升了目标特征向量在数据关联过程中的鲁棒性。同时,基于级联匹配的数据关联方法按优先度不同,分批次匹配相关轨迹和目标检测框,减少了目标错配、漏配的可能性,获得更高效更稳定的匹配结果。实验表明,该模型的速度在多目标跟踪任务中达到了实时性,因此具有了实时性场景下的实用价值。(2)从性能方面考虑。为了进一步提高多目标跟踪方法的精度,提出了一种基于三维残差注意力与双路上采样的特征提取结构。该结构的三维残差注意力机制通过通道注意力和空间注意力实现了对通道和空间层面分别进行注意力筛选。其中每种注意力同时包含均值池化操作和最大池化操作,其中均值池化获取特征图全局信息,最大池化操作获取特征图显著信息。结合特征图全局信息和显著信息进行融合,得出更具辨识度且对结果更有效的注意力分配权重。双路上采样同时使用了双线性插值和改进的Pixel Shuffle模块进行上采样,即也就是对深层的语义特征进行了等比例放大和参数放大,得到两种不同的放大特征,融合后得到更高分辨率且对结果更有效的特征。实验表明,该方法在速度依然保持实时性的情况下,又提高了跟踪精度。(3)从任务框架方面考虑。为了进一步优化多目标跟踪任务的流程和框架,提出了一种基于数据关联代理模型的多目标跟踪方法。其核心部分的数据关联代理模型是基于双向GRU构成的,目的是用来近似替代数据关联过程。同时在模型训练阶段,提出了一种新颖的神经网络结构来近似表达MOTA和MOTP评价指标,将其作为模型训练的损失函数。从而将数据关联过程和评价指标引入到了神经网络训练中,使整个多目标跟踪任务都能够进行端到端的训练,引导网络朝着更高关联准确度的方向精准优化,得到更高质量的多目标跟踪结果。实验表明,该方法优化了多目标跟踪的任务框架,同时得到了更好的跟踪效果。

    ...
  • 4.基于对称空间变换的轻量化多人姿态估计

    • 关键词:
    • 人体姿态估计;空间变换模块;复杂场景;深度可分离卷积
    • 孙振翔
    • 指导老师:西安电子科技大学 李阳阳
    • 学位论文

    人体姿态估计任务是计算机视觉任务的热点之一,主要包括对图像或者视频中的人体和人体关键点的准确定位,进而估计恢复出人体姿态的任务。在运动建模、监控安防、行为动作分析和人机互动等领域,人体姿态估计都具有广泛的应用价值。在实际生活中,受拥挤人群遮挡、光线因素变化以及各种复杂场景等的影响,人体姿态估计一直存在着一些普遍和典型的问题和挑战。基于这些问题和挑战,本文在学习总结了相关领域知识方法的基础上,利用深度学习神经网络,提出了相应的处理解决方式,具体研究工作如下:(1)针对目标检测结果在姿态估计网络的应用效果不佳的问题,提出了一种基于对称空间变换的多人姿态估计方法。该方法利用空间变换的人体姿态估计网络,在网络的目标检测输出阶段添加空间变换模块,实现从不准确的人体候选框中提取高质量的单人姿态区域的目的,从而提高目标检测网络的性能,进而使单人姿态估计网络能够得到高质量的候选框,使得网络最终能够得到更好的人体关键点结果。利用上述方法,可以解决目标检测算法结果于姿态估计网络应用效果不佳的问题,同时,通过在MPII数据集和MS COCO数据集上的实验结果,验证了所提出的算法在提高候选区域框质量,提高网络整体性能的有效性和竞争力。(2)针对拥挤人群状态下人体检测困难的问题,提出了一种基于KM算法的多人姿态估计方法。该方法在目标检测和单人姿态估计网络输出结果后,通过优化损失函数,生成人体-关键点图,利用KM匹配算法,将关键点预测问题转化为求解人体-关键点图的最优匹配问题,最后通过进行算法匹配,解决拥挤人群状态下关键点错判、漏检等问题。最后通过实验验证,证明了上述方法可以提高拥挤人群状态下多人姿态估计网络的性能。(3)针对多人姿态估计网络模型复杂,运算时间长的问题,提出了一种基于MobileNet的轻量化多人姿态估计方法。该方法利用MobileNet网络轻量化的特点,在方法一的网络结构基础上,通过使用深度分离卷积和倒残差模型来降低网络的复杂度,从而在平衡算法准确率的同时提高算法的运行速度。最后通过对比实验验证了算法的有效性和竞争力。

    ...
  • 5.基于编解码与注意力机制的遥感图像描述研究

    • 关键词:
    • 遥感图像描述;编解码结构;注意力机制;对抗样本
    • 方双康
    • 指导老师:西安电子科技大学 李阳阳
    • 学位论文

    目前对于遥感图像的研究多集中在分类、检测、分割等任务上,并且已经取得了很好的进展。这些任务的研究目的都是希望更好地挖掘和理解遥感图像的信息。语言是人类最常用的交流方式,它可以用简洁的话表达出丰富信息。因此如何将遥感图像转换为语言信息是很值得探索的。图像描述任务是研究如何用一句话适当地描述一张图片的内容。遥感图像描述不是单一的分类或检测等问题,它要更加的复杂,需要知道图片中的多个目标,还需要知道它们之间的高级关系,对这种高级关系的认知能加深计算机对遥感图像更深层次的理解,因此它具有重要的研究意义。但由于遥感图像大范围的场景及数量众多的目标,想要生成贴切的描述是较困难的。如何构建快速稳定且性能好的遥感图像描述模型,是该课题研究中的重点。本文具体研究工作如下:(1)为了更近一步促进遥感图像描述的实用价值,我们对已有的遥感图像描述数据集进行了大量的修复工作。修复了包括单词错误、语法错误、描述不贴切等一系列问题。超过20%的数据集,共近3000张图片的描述得到了修正。(2)从性能考虑。为了进一步提高遥感图像描述的精度,我们提出了一种多层注意力结构。该结构更符合人类在进行描述图片时的注意力过程,主要包含三个注意力结构:对图像不同区域的注意力、对已生成单词的注意力、对图像和语义信息之间的注意力。该模型能够更智能地“注意”到有用的信息,能更大限度地利用图像和语言信息。实验证实该模型可以取得更好的得分成绩。(3)从速度考虑。针对遥感图像描述模型参数过多,时间复杂度过高的问题,我们提出了一种快速的遥感图像描述模型。该模型使用了效果好且更快速的卷积网络和循环网络作为编解码器,也使用了更精简化的注意力结构。同时为了保证模型效果和加速训练,预先使用了skip-gram和负采样的方法来学习词向量。实验表明,该模型在精度损失较小的情况下,可以大幅降低模型大小和提高模型运算速度。(4)从安全性和稳定性考虑。针对遥感图像应用场景对安全性和稳定性等有绝对要求,本文在遥感图像描述任务上研究了其对抗样本的生成方法。我们提出了一种针对编解码结构的黑盒攻击方法,该方法无需知道模型具体的编码和解码网络,便可实现有效的攻击。该方法可以用于判断已有模型的鲁棒性和安全性。此外本文还对对抗样本进行了一定的防御工作,为进一步提高模型的鲁棒性和安全性提供了基础。

    ...
  • 6.基于CNN和数据增强的遥感图像目标检测与识别

    • 关键词:
    • SAR图像;光学遥感图像;数据增强;目标检测与识别;卷积神经网络
    • 何爱媛
    • 指导老师:西安电子科技大学 李阳阳
    • 学位论文

    遥感图像具有图像尺寸较大、目标相对图像占比小的特点。无论是SAR图像还是光学遥感图像,之中包含的特征在军事、城市管理上都有着极高的研究价值。随着遥感卫星技术的发展,遥感图像的分辨率不断提升,但是获取有标记的SAR图像数据集进行目标检测与识别存在困难。本文旨在采用基于卷积神经网络的数据增强对SAR图像和光学遥感图像数据集进行扩充,并针对现有问题提出改进方法,本文主要工作分为三个部分。第一,针对SAR图像目标检测与识别数据量有限的问题,提出了一种新的基于卷积神经网络的数据集扩充方法。首先,根据MSTAR数据集中SAR图像军事车辆目标和场景图像,合成制作了SAR图像目标检测与识别数据集SAROD。将SAROD数据集中的图片输入本文设计的卷积神经网络中,确定图片适合放置新目标的位置并放置合适数量的目标,得到数据增强后的数据集SAROD+。实验证明,经过本文方法进行数据扩充的数据集SAROD+训练的模型在评价指标上有明显提升,尤其在选取50%的训练数据进行的实验中,提升效果更显著。因此,在数据量有限的情况下,可通过采用本文的数据集扩充方法,提升SAR图像目标检测与识别性能。第二,针对部分类别样本分类效果较差的问题,本文采用了改进的交叉熵损失函数替代Faster R-CNN原有的分类损失函数,进一步提升难以分类的样本对损失函数的贡献,从而达到更好的目标检测与识别效果。实验证明,该方法在各个数据集训练的模型上均有不同程度提升,平均精度低的目标类别提升更显著。通过SAROD+数据集对改进的Faster R-CNN进行训练,采用训练好的模型搭建基于Py Qt 5的SAR图像目标检测与识别系统,实现了模型性能测试功能和单张图像检测展示功能。第三,针对光学遥感图像背景复杂、每类目标出现的背景较为统一的特点,提出了基于卷积神经网络的光学遥感图像数据增强方法。首先选取十分类光学遥感图像数据集NWPU-VHR 10中带有飞机、舰船和车辆目标的图像,制作数据集VHR-3。将图片输入到卷积神经网络模型中预判其应该放置的目标类别,并根据预判结果将图片输入到不同网络中,判断适合放置目标的位置并放置特定类别的目标。根据数据集中存在部分目标过于密集、标记框重叠部分多等特点,采用改进的非极大值抑制方法去除多余候选框。实验结果表明,采用改进的非极大值抑制方法可以有效提高目标框容易重叠的类别的平均精度,数据增强后,进一步提升了目标检测与识别性能,并在训练集数据量更少(50%数据)的情况下,其提升效果更显著。

    ...
  • 7.基于深度神经网络的遥感图像道路提取

    • 关键词:
    • 全卷积神经网络;道路提取;弱监督学习;条件随机场;集成学习
    • 马文康
    • 指导老师:西安电子科技大学 张向荣
    • 学位论文

    道路是遥感图像中,一项重要的地物要素。准确地提取出遥感图像中的道路,能够在城市导航、城市规划、军事测绘、灾害评估等方面起到重要的作用。利用模式识别、图像处理、机器学习算法对遥感图像的道路进行自动化的提取,已经成为当今遥感领域一个重要的研究方向。基于机器学习的道路提取算法虽然在性能上相对其他方法有较大优势,但是,这类算法普遍面临着在样本数据中道路和背景样本之间的不平很问题。而道路和背景样本的不平衡,往往会导致分类器在收敛后,偏向于将样本预测为占据众数的背景类,进而使得道路提取结果图中,道路的路网不够完善,道路的查全率较低。此外,为满足机器学习对于样本的需求,需要对训练样本中每一景的遥感图像逐像素地进行道路、背景二值标注,而标注过程需要消耗大量人力,繁琐而费时。为了解决上述问题,提出了基于全卷积神经网络集成学习的道路提取算法以及基于弱监督深度卷积网络的道路提取算法,并根据道路提取的结果图,提出基于条件随机场的道路中心线提取算法,进一步挖掘遥感图像中的信息。道路提取算法在Massachusat道路数据集上进行了实验,算法有效性得到了验证。本文的主要工作总结如下:1.提出了一种基于集成学习的全卷积神经网络道路提取算法,该方法在原生的全卷积神经网络的基础上,将损失函数改为了加权的交叉熵损失函数,对正样本赋予不同的权值,使得道路像素点错分为背景时,会获得更高的惩罚权值。由于损失函数的权值难以自适应的确定,提出了一种基于空间一致性的集成策略,将不同权值损失函数的全卷积网络得到的结果集成,提高道路提取质量。2.提出了一种基于弱监督的深度卷积网络道路提取算法,该方法仅仅利用场景级的数据标签作为训练样本的监督信息。利用遥感图像和对应的场景标注,训练一个道路分类网络,当分类网络收敛时,利用类激活映射得到每一景遥感图像中的道路热度图,将道路热度图作为监督信息,训练用于道路提取的语义分割网络。弱监督道路提取网络通过设置种子损失、扩展损失、边界约束损失三原则来弥补热度图作为监督信息的不完备性。3.提出了一种基于条件随机场的道路中心线提取算法,该方法对道路提取结果进行核密度估计,得到道路概率密度,用概率的对数值作为条件随机场能量函数的一元势能;同时,将相邻像素的关系作为二元势能;为保证中心线的连贯性,用全局的连通区域作为高阶势能。

    ...
  • 8.基于anchor-free与轻量化的遥感图像目标检测

    • 关键词:
    • 遥感图像;目标检测;anchor-free;轻量化网络;知识蒸馏
    • 裴轩
    • 指导老师:西安电子科技大学 李阳阳
    • 学位论文

    遥感图像目标检测作为一个基础且具有挑战性的视觉任务,不仅在军事领域应用广泛,如准确获取战场信息并对敌方进行精准打击。它还在民用领域具有广泛的应用,例如环境管理、区域规划和矿产资源勘探等。现有的遥感图像目标检测方法大都基于anchor boxes,这类方法会因为过多的anchor boxes引入大量的超参数,增加了内存占用以及冗余的计算量,甚至会导致严重的正负样本不平衡等问题。另外,遥感图像又具有背景复杂,目标尺寸变化大且排列密集,目标具有方向性等特点,进一步增加了遥感图像目标检测的难度。除此以外,现在的遥感图像尺寸越来越大,数据量也逐渐增多,为了能够获得更好的检测性能,模型的深度和复杂度也随之增加,虽然这很大程度提高了检测精度,但是在对模型复杂度有很高要求的应用场景下,例如军事领域需要将模型部署到无人机等设备上进行监测任务,如果模型过于复杂也是不易部署的。构建稳定轻量且性能好的anchor-free遥感图像目标检测器,是该课题研究中的重点。本文具体研究工作如下:(1)针对现有遵循anchor机制的遥感图像目标检测所带来的问题,本文提出了基于anchor-free的遥感图像目标检测方法。在该方法中本文设计了密集路径聚合特征金字塔网络,该网络充分利用高层语义信息与低层纹理信息,提升了网络对于不同尺度目标的检测能力。除此以外,本文还提出了中心区域采样策略,避免了采样过程中模糊样本或者噪声样本对模型性能的影响。实验表明本章方法在遥感图像目标检测任务上能够获得更好的表现。(2)针对遥感图像中目标具有任意方向的特性,本文提出了基于关键点的遥感图像定向目标检测方法。在该方法中,考虑到遥感图像背景复杂导致特征中会有很多的噪声信息,导致特征比较粗糙,本文提出了语义迁移模块对特征精细化。另外,考虑到遥感图像中的目标尺寸变化多样,提出了自适应高斯热图对目标进行定位和分类。实验表明本章方法在遥感图像定向目标检测任务上能够获得更好的表现。(3)针对遥感图像目标检测模型被过度参数化的问题,本文提出了基于知识蒸馏的遥感图像目标检测方法。通过该方法得到了一个轻量的检测网络。实验表明,该方法在精度损失较小的情况下,可以大幅度降低模型复杂度。

    ...
  • 9.基于量子遗传算法的神经网络架构搜索研究

    • 关键词:
    • 量子遗传算法;卷积神经网络;神经网络架构搜索;MCMC方法;评价预估策略
    • 叶伟良
    • 指导老师:西安电子科技大学 李阳阳
    • 学位论文

    近年来,随着深度学习技术的发展,基于深度学习的图像识别应用变得越来越普遍。停车场的车牌识别,小区门禁的人脸识别,手机的刷脸支付等都极大地方便了人们的日常生活。这些应用都得益于学者们不断开发的各种神经网络架构,设计神经网络架构是一个耗时和容易出错的过程,而且神经网络架构的应用也离不开专业人员的重复调试。因此各类能够自动搜索神经网络架构的算法受到广泛关注,其中进化算法正是应用最为广泛的算法之一。遗传算法是一种经典的进化算法,自它被提出以来,世界各地的学者相继提出了各种改进方案用于解决各类优化问题。量子遗传算法作为改进算法中的经典之作,将传统的染色体转变为量子染色体,借助量子染色体的优势,可以有效保持种群的多样性和提高算法的性能。本文在总结相关领域已有成果的基础上,基于量子遗传算法提出了一种新的卷积神经网络架构搜索算法,并且结合评价预估策略和数据预处理技术有效地加快网络架构搜索速度。具体内容如下:(1)提出了基于量子遗传算法的卷积神经网络架构搜索算法。该方法首先通过量子编码将卷积神经网络编码成量子染色体;随后通过量子旋转门对量子染色体进行变异更新,解码训练后找出全局最优解。借助量子编码的特性,该算法可以有效的保持染色体的多样性,有助于避免网络架构搜索过程中陷入局部最优。本算法在图像分类任务上不仅优于许多传统的机器学习算法,而且与传统进化算法搜索神经网络架构的方法相比也具有较强的竞争力。(2)提出了一种基于马尔可夫链蒙特卡洛方法的网络性能评价预估策略。该策略首先通过概率模型拟合网络架构的学习曲线,然后在完成少量训练次数后,借助马尔可夫链蒙特卡洛方法推断网络架构在达到最大训练次数后性能超过当前最优网络架构的后验概率,根据这个后验概率可以提前终止预期性能表现不好的网络架构。实验证明,本预估策略可以在损失极少搜索质量的前提下大幅提高网络架构搜索效率。(3)在量子遗传搜索算法和评价预估策略的基础上,结合相关的数据预处理技术,提出一个完整的卷积神经网络架构搜索算法。在网络架构搜索阶段使用量子遗传算法,在网络性能评价阶段采用评价预估策略以及图像下采样、通道压缩等数据预处理技术。实验表明,本章算法在运行效率和算法性能两方面都优于传统的卷积神经网络,而且还可以在不影响架构搜索质量的前提下大幅提高神经网络架构搜索效率。

    ...
  • 10.基于量子粒子群的深度卷积神经网络结构搜索研究

    • 关键词:
    • 深度卷积神经网络结构;粒子群优化算法;量子计算;图像分类
    • 肖俊杰
    • 指导老师:西安电子科技大学 李阳阳
    • 学位论文

    深度卷积神经网络(CNN)在解决复杂的图像分类问题上已被证明是有效的,但其结构的设计却具有一定的挑战性。许多学者依靠其丰富的CNN结构设计经验,设计出了许多性能良好的模型来解决特定的图像分类问题。但CNN结构的设计对于普通的用户而言却具有极大的难度和学习成本,如何针对不同的图像分类任务快速地构建出一个最优的CNN结构,且不要求用户对CNN领域有深刻的认识,是一个对人工智能的发展有着很强现实意义的研究。本文探索粒子群优化算法在CNN结构搜索上的应用,针对CNN结构的复杂性提出了一个分段压缩编码策略,可以将一个完整的CNN结构配置映射于PSO的搜索空间中,并引入了量子思想对粒子的进化策略进行改进,提高了进化效率,还针对粒子群优化算法的局限性提出了二进制编码策略,提高范化能力,这是一个用粒子群优化算法来构建CNN结构的完全自动化方法。本文具体工作如下:(1)为了将复杂的CNN结构映射于粒子群优化算法的搜索空间中,本文提出了分段压缩编码策略,使得一个粒子个体能够承载整个CNN结构的配置,从而有效地降低了搜索空间的大小。利用该策略,本文设计出了一个基于粒子群优化算法的CNN结构搜索方法。在对比实验中,该方法在能够在有限的迭代次数下快速搜索出一个性能良好的CNN结构,在MNIST和MRDBI两个数据集上的分类准确度均大于许多人工设计的CNN结构。(2)针对搜索过程中产生许多无效CNN结构的问题,本文提出了一个针对CNN结构的量子多次测量方法加以改进,能够在不增加计算代价的情况下有效地降低了搜索过程中产生的无效CNN结构的数量。改进前后的方法在数据集MNIST、MRDBI及CS上进行对比实验,结果表明改进后的方法有更大的搜索能力,搜索出的CNN结构能够获得更好的分类准确度。(3)本文详细分析了粒子群优化算法在CNN结构搜索问题上的局限性,提出了一个基于二进制的量子粒子群优化算法的CNN结构搜索方法,将CNN结构搜索问题转移到了离散搜索空间中,其二进制编码的特性使得量子的不确定性得到了充分发挥。在对比实验中,所提出的方法在不同复杂度的MNIST变体数据集上均表现最为突出,并且数据集的复杂度越高其领先竞争者的优势越明显。

    ...
  • 排序方式:
  • 2
  • /