面向高分辨SAR图像分类的量子深度神经网络研究

项目来源

国家自然科学基金(NSFC)

项目主持人

李阳阳

项目受资助机构

西安电子科技大学

立项年度

2017

立项时间

未公开

项目编号

61772399

研究期限

未知 / 未知

项目级别

国家级

受资助金额

63.00万元

学科

信息科学-人工智能

学科代码

F-F06

基金类别

面上项目

关键词

深度神经网络 ; 地物分类 ; 高分辨SAR图像 ; 稀疏特征 ; 量子并行计算 ; quantum parallel computation ; deep neural network ; sparse feature ; high-resolution SAR image ; terrain classification

参与者

李豪；李玲玲；孟洋；刘天宇；陆高；周林浩；张玮桐；白小玉

参与机构

西安电子科技大学；上海海事大学

项目标书摘要：本课题针对高分辨SAR图像数据量大，稀疏特征难以表示的瓶颈问题，从而借鉴脑神经计算机理，构造量子深度神经网络模型对高分辨SAR数据进行稀疏表示；为解决深度神经网络模型规模与训练速度、训练精度之间的权衡问题，基于量子并行计算，建立量子深度学习算法，实现高效学习，克服灾变性失忆等缺陷；将非监督的高分辨SAR图像分类转化为对目标函数的优化问题，针对传统优化算法全局优化能力不足导致SAR图像处理结果易陷入局部极值，建立量子免疫优化的高维特征选择算法，用具有挑战性的高分辨SAR图像分类问题，来验证该网络计算模型的有效性与可扩展性。

Application Abstract: Aiming at the bottlenecks,such as large amount of data and being difficult to represent the sparse features,of high-resolution Synthetic Aperture Radar(SAR)images,this subject draws on the neural network mechanism and constructs the quantum-inspired deep neural network to overcome these bottlenecks.In order to solve the trade-off between the model scale and the training speed,training precision of the deep neural networks,we will design quantum-inspired learning algorithms based on the quantum parallel computing,which achieve efficient learning,and overcome catastrophic amnesia.In our study,we convert the unsupervised high-resolution SAR image classification problem into optimization problem.Meanwhile,aiming at the shortcomings that the SAR image processing results are easy to fall into the local optimum of the traditional optimization algorithm,we establish a high-dimensional feature selection algorithm for quantum-inspired immune optimization,and use the challenging high-resolution SAR image to verify the validity and expansibility of the computing network model.

项目受资助省

陕西省

项目结题报告(全文)

针对高分辨SAR 图像数据量大，稀疏特征难以表示，借鉴量子神经网络的指数级记忆容量和学习速度，并行计算能力，稳定性好的特性，建立模拟大脑处理信息过程的智能计算模型——量子深度神经网络模型；针对深度神经网络在处理高分辨SAR图像时的瓶颈问题，建立量子学习算法；通过优化的方式构建高效的深度神经网络，实现高分辨SAR图像分类，突破了网络模型的结构和超参数难以确定、复杂数据计算量庞大、自适应性弱、抗噪能力差和鲁棒性差等关键技术，为高维复杂结构的SAR图像分类任务构建了高效、稳健的深度神经网络；成功应用于高分辨SAR图像分类与解译的关键问题中，设计并实现基于量子神经网络的高分辨SAR图像识别系统。本课题研究成果共计发表论文37篇，其中SCI检索的国际期刊论文25篇，包括SCI Ⅰ区及II 区的国际刊物共16篇，出版教材1部，获2020年度陕西省研究生优秀教材一等奖1项，申报国家发明专利16 项和软件著作权2项(其中授权5项专利和2项软件著作权),培养博士和硕士9人，其中一篇博士论文获得“2021年陕西省优秀博士学位论文”称号。

排序方式：时间相关性
显示方式：列表摘要

1.Double feature selection algorithm based on low-rank sparse non-negative matrix factorization

关键词：
Feature Selection;Matrix algebra;Geometry;Feature selection algorithm;Geometric structure;Local geometric structures;Nonnegative matrix factorization;Self-representation;Sparse non-negative matrix factorizations;Sparse representation;Unsupervised feature selection

Shang, Ronghua;Song, Jiuzheng;Jiao, Licheng;Li, Yangyang
《International Journal of Machine Learning and Cybernetics》
2020年
11卷
8期
期刊

Recently, many feature selection algorithms based on non-negative matrix factorization have been proposed. However, many of these algorithms only consider unilateral information about global or local geometric structure normally. To this end, this paper proposes a new feature selection algorithm called double feature selection algorithm based on low-rank sparse non-negative matrix factorization (NMF-LRSR). Firstly, to reduce the dimensions effectively, NMF-LRSR uses non-negative matrix factorization as the framework to further reduce the dimension of the feature selection which is originally a dimension reduction problem. Secondly, the low-rank sparse representation with the self-representation is used to construct the graph, so both the global and intrinsic geometric structure information of the data could be taken into account in the process of feature selection, which makes full use of the information and makes the feature selection more accurate. In addition, the double feature selection theory is used to this paper, which makes the result of feature selection more accurate. NMF-LRSR is tested on the baseline and the other six algorithms in the literature and evaluated them on 11 publicly available benchmark datasets. Experimental results show that NMF-LRSR is more effective than the other six feature selection algorithms.
© 2020, Springer-Verlag GmbH Germany, part of Springer Nature.

...

2.A Two-Branch Network Combined with Robust Principal Component Analysis for Hyperspectral Image Classification

关键词：
Classification (of information);Deep learning;Neural networks;Principal component analysis;Image analysis;Spectroscopy;Image denoising;Extraction;Convolution;Image classification;Branch structure;Convolutional neural network;Deep learning;Features extraction;Hyperspectral image classification;Low-rank representations;Robust principal component analysis;Subspace estimation;Two-branch structure

Mu, Caihong;Zeng, Qize;Liu, Yi;Qu, Yi
《IEEE Geoscience and Remote Sensing Letters》
2021年
18卷
12期
期刊

Noise in hyperspectral images (HSIs) may degrade the HSI classification result. Robust principal component analysis (RPCA) is an excellent method to obtain low-rank (LR) representation of data and is widely used in image denoising and also in HSI classification. However, data are drawn as a union from multiple subspaces in HSIs, so LR subspace estimation (LRSE) is necessary when using RPCA, which is complicated and time-consuming. To solve this problem, this letter proposes a novel LR-based method for HSI classification called two-branch network combined with RPCA, which combines RPCA with a neural network. Specifically, both the LR component and the sparse component are preserved and used for feature extraction in two independent convolutional branches. This way, we can avoid information loss without using accurate LRSE. A concatenate operation and a pointwise convolution are then adopted to realize the feature fusion. Finally, fused features are constructed to indicate the ground truth of each pixel in the classification process. The proposed method constructs a convenient model for HSI classification by discarding the LRSE and combining denoising, feature extraction, feature fusion, and classification into an end-to-end network. The experimental results on three data sets demonstrate that the proposed method outperforms many state-of-the-art methods including ones based on LR representation and ones based on deep learning. In addition, it maintains good classification performance for the cases of small samples and class imbalance.

...

3.基于像素注意力的遥感图像四倍超分辨率重建

关键词：
遥感图像超分辨率重建像素注意力基金资助：陕西省重点研发计划项目（No.2019ZDLGY09-05）；国家自然科学基金（No.61772399）；专辑：工程科技Ⅱ辑信息科技专题：工业通用技术及设备自动化技术 DOI：10.27389/d.cnki.gxadu.2022.003126 分类号：TP751 导师：李阳阳手机阅读

《》
0年
卷
期
期刊

遥感进行远程的数据采集,获取大范围的区域信息。遥感图像在农业领域可进行植物观测,在气象领域可进行天气预报,在地质领域可进行环境探查,在各种领域都可以发挥作用。近年来,遥感图像的空间分辨率获得了提高,图像涵盖更多信息,每个像素点代表的地面区域更大。相对地,遥感图像中的对象变得更密集、更难以判别。在保证高空间分辨率的同时,从硬件的角度来提升成像分辨率较困难,不仅研发成本高昂,数据的传输成本也会增加。本文旨在通过神经网络的方法将硬件采集到的低成像分辨率遥感图像生成为更清晰的图像。本文主要工作可以分为以下三个部分。第一,将现有的网络模型,用于单图像超分辨率的增强深度残差网络（Enhanced Deep Residual Networks for Single Image Super-Resolution,EDSR）,应用于遥感图像的四倍超分辨率重建。针对于连续的上采样操作在进行四倍放大时无法有效提取特征的现象,采用残差网络来间隔上采样操作。将深度残差模块作为上采样的一部分,将两次上采样用残差网络进行分隔,先学习更复杂的非线性映射后再进行放大。实验结果表明,将深度残差模块作为上采样模块的一部分后,在相同参数量下可以提高遥感图像四倍放大时的重建效果。第二,对于四倍放大时图像细节模糊的问题,将用于单图像超分辨率的增强深度残差网络与卷积块注意模块（Convolutional Block Attention Module,CBAM）进行结合提出基于像素注意力的遥感图像重建网络。该网络结合了通道和空间两种注意力方法,将深度残差提取出的特征先在通道维度进行加权平均,再在空间维度进行加权平均,自适应的学习两种权重。实验结果表明,与用于单图像超分辨率的增强深度残差网络相比,该网络可重建出更好的细节。第三,根据遥感图像中色彩越杂乱的区域重建越困难的现象,本文提出了一种可以模拟方差关系的、二阶的聚合像素注意力模块。不同于采用空间维度的池化层进行聚合的传统方式,本文通过计算特征像素与周围像素之间的方差来聚合注意力。根据方差的公式推导,采用两个特征逐像素相乘的方式可以自适应的表示出图像的二阶关系。因此采用特征逐像素相乘来代替池化层进行聚合,可以根据色彩的方差关注色彩更杂乱的区域。实验结果表明,在遥感图像的四倍超分辨率重建中,该方法获得的图像更容易辨识出较小的对象。此外,本文探索了在较早的层中引入高阶表示对重建效果的影响,以及与增强上采样结合后的效果。

...

4.基于深度学习与模型融合的SAR图像变化检测

关键词：
变化检测 SAR图像神经网络多尺度模型融合遗传算法网络优化基金资助：国家自然科学基金Nos.61772399,面向高分辨SAR图像分类的量子深度神经网络研究,2018/01-2021/12；国家自然科学基金,U1701267；专辑：信息科技专题：电信技术自动化技术 DOI：10.27389/d.cnki.gxadu.2019.000757 分类号：TN957.52TP18 导师：李阳阳手机阅读

《》
0年
卷
期
期刊

遥感图像的变化检测是指通过合适的算法分析同一地区不同时相的两幅图像,找出其中变化的区域。由于合成孔径雷达（Synthetic Aperture Radar,SAR）图像不受光照、天气等条件影响的优势,已经在环境检测、灾害评估、城市规划与监测等领域得到了广泛的应用。本文主要对一些原有的SAR图像的变化检测方法进行研究分析并对其改进。同时结合新理论提出一些新的方法来提高变化检测精度。本文主要内容如下:1.由于不同算子生成的差异图具有不同的优缺点,本文对差值法、对数比值法、均值比值法产生的3种差异图进行优势互补。不同于以往人工选取策略将其融合的方法,该算法将3幅差异图作为不同的特征图像输入到多通道卷积神经网络。然后卷积神经网络将自动学习并提取各个差异图的不同特征。该算法通过选择不同差异图的像素及其邻域空间像素生成训练样本训练卷积网络,然后由训练好的网络预测测试样本的变化类与不变类。2.针对边缘检测精度低的问题本文提出了一种多尺度模型融合算法。该部分首先提出了一种新的差异图生成算法:通过将比值算子差异图进行伽马变换然后得到一种新的差异图,该变换与对数变换都能使图像的对比度增强,新的差异图比对数差异图整体偏亮。通过FLICM算法对几种差异图分析对比证明了我们差异图的有效性。因为变化检测结果中边缘细节处错误率较高,针对该问题本文提出了一种算法,将生成样本的滑窗尺寸变为1,即生成样本时仅利用四幅差异图的像素信息,不提取邻域信息。然后利用多层感知机进行分类。由于不利用邻域信息该方法噪声较大,但带来的优势是该算法对边缘等异质区域检测效果好,检测结果边缘清晰。最后将该模型与算法1的模型采用加权融合。融合后的模型细节处检测精度得到了提升。3.神经网络中超参数众多,针对神经网络结构优化和超参数选择困难问题,本文提出了一种基于遗传算法的神经网络超参数优化算法。该算法优化的网络模型是变化检测过程中用到的卷积神经网络和多层感知机。进化算法与神经网络有两种结合方式,一种方式是在固定网络拓扑结构的情况下,利用进化算法确定连接权重。本文采用的是另一种方式直接利用遗传算法优化神经网络的结构,然后用反向传播算法训练网络。首先将超参数调优问题建成一个优化模型然后采用遗传算法优化该模型。该方法能够为变化检测所需的模型找到相对较优的超参数,并提高算法精度。

...

5.基于量子进化的神经网络架构搜索方法研究

关键词：
神经网络架构搜索深度神经网络量子神经网络量子计算基金资助：陕西省重点研发计划项目（No.2019ZDLGY09-05）；国家自然科学基金（No.61772399）；专辑：信息科技专题：自动化技术 DOI：10.27389/d.cnki.gxadu.2022.000790 分类号：TP183 导师：李阳阳手机阅读

《》
0年
卷
期
期刊

随着神经网络相关研究的发展,在深度学习领域中深度神经网络（Deep Neural Networks,DNN）模型已经在图像分类等问题中展现出了强大的性能优势。与此同时,另一项改变传统计算范式的新兴领域——量子计算也发展迅速。在量子计算领域中由于量子系统所具有的并行特性优势,量子计算与神经网络结合而产生的量子神经网络（Quantum Neural Networks,QNN）也成为越来越多研究者进行深入的研究领域。近年来,愈来愈多的性能优秀的神经网络被提出并应用在不同的任务之中,这些神经网络在性能方面的优势往往取决于人工设计的优秀网络架构。然而,无论是DNN还是QNN,神经网络的架构设计仍然需要依靠非常丰富的先验知识和专业经验。因此,如何针对同样的任务例如图像分类任务,让机器自动地设计、构建和搜索优秀的神经网络架构是具有非常重要且深远的现实意义的。本文对量子神经网络和传统深度神经网络这两种不同计算范式下的神经网络在网络架构搜索方法上进行探索和研究。利用量子进化策略提升了传统进化策略在庞大的离散搜索空间中的搜索能力,以帮助神经网络架构搜索方法搜索到更为优秀的网络结构。本文根据QNN与DNN中不同的网络特性设计相应的搜索空间,并针对QNN中存在的网络设计无明确指导经验、人工设计模型精度较低复杂度较高的问题和DNN中网络设计需要大量先验知识、现有方法在离散空间搜索能力不足、时间代价较大以及网络性能相关性较低的问题提出了新的神经网络架构搜索方法。本文的主要工作如下:在量子神经网络方面,针对量子神经网络领域中网络的设计方法无明确指导经验、人工设计的网络模型性能较差、网络模型的线路复杂度较高、传统网络架构搜索方法在未来无法完全利用量子特性等问题,本文提出了一种基于量子线路的进化量子神经网络架构搜索方法。通过与原人工设计的网络模型的对比实验可以得出,经过搜索得到的量子神经网络比原来的网络模型在模型精度上有所提高,并有效地降低了量子线路的复杂度,为在真实量子计算机上搭建量子神经网络提供了有效的帮助。在深度神经网络方面,针对人工设计网络模型需要大量先验知识、现有的基于进化的神经网络架构搜索方法在庞大的离散搜索空间中搜索能力不足、时间代价较大等问题,本文提出了基于量子进化的Oneshot神经网络架构搜索方法,提高了搜索能力并降低了搜索时间。通过在基准数据集CIFAR10与CIFAR100上与人工设计的网络模型和现有的神经网络架构搜索方法进行对比实验可以得到,本文所提出的方法搜索到的神经网络在模型性能上更为优秀。针对神经网络架构搜索方法中网络性能评估与真实性能相关性较低、差距较大的问题,本文详细分析并深入思考了传统神经网络架构搜索方法和基于权重共享的Oneshot方法之间存在的问题和矛盾,以及当前Oneshot方法中不同超网络训练采样方式之间的冲突与问题。最终在保持量子进化带来的优势的基础上提出了基于量子进化与平衡池策略的神经网络架构搜索方法。在对比实验中,所提出的方法搜索到的神经网络相较于其他人工设计的网络与其他搜索方法得到的网络具有更优秀的模型性能。

...

6.基于多尺度特征和无监督数据增强的遮挡行人重识别

关键词：
行人重识别多尺度特征人体特征重构无监督数据增强基金资助：陕西省重点研发计划项目（No.2019ZDLGY09-05）,面向高分辨SAR图像目标识别的量子深度神经网络技术研究；国家自然科学基金（No.61772399）,面向高分辨SAR图像分类的量子深度神经网络研究；专辑：信息科技专题：计算机软件及计算机应用 DOI：10.27389/d.cnki.gxadu.2022.001342 分类号：TP391.41 导师：李阳阳张小龙手机阅读

《》
0年
卷
期
期刊

行人重识别技术可以搜索特定行人,被广泛用于现在的智能视频监控系统中,辅助人们抓捕罪犯或寻找失踪人员。遮挡行人重识别任务的提出主要是由于现实世界中行人往往被各种遮挡物所遮挡,极大地影响了模型匹配的精度。目前针对遮挡行人重识别任务的工作依旧面临巨大的挑战,早期的大多工作只关注人体匹配并未考虑遮挡问题,后来出现了基于局部特征的方法,使得模型的泛化性能有所提高,但这类方法大多需要严格的行人对齐,严重遮挡下表现依旧不佳。部分行人重识别方法面对遮挡情况时需要手动裁剪图片十分费时费力。不仅如此,目前针对于遮挡问题的数据集往往规模较小,不仅训练时容易造成过拟合,不同数据集之间的图像风格差异也使得联合使用这些数据集变得十分困难。由此可见,对于遮挡行人重识别技术的研究目前尚不完善,攻克这些难关对于遮挡情况下行人重识别问题的研究具有重大意义。基于此,本文研究了遮挡情况下的行人重识别问题,其主要工作和贡献如下:（1）针对遮挡情况下存在人体的不完整的问题,提出了一种基于多尺度特征的遮挡行人重识别方法。与部分重识别方法中的手动裁剪不同,该方法利用目标检测算法构造部分人体定位器,自动识别和裁剪部分人体,并设计了水平金字塔池化策略,融合不同尺度下的行人局部特征,增强了模型的鲁棒性。实验表明,该方法在遮挡行人重识别任务上有着更优越的匹配精度。（2）针对遮挡情况下不同行人图像之间的局部特征难以对齐的问题,提出了一种基于人体特征重构的遮挡行人重识别方法。与目前主流方法严重依赖局部特征对齐不同,该方法是一种无对齐方法。在方法一的基础上,采用稀疏表示重构人体特征,利用人体特征重构距离改进了难样本三元组损失,增大相似部分对匹配相关性的占比。实验表明,该方法可以有效提高模型的抗遮挡性。（3）针对遮挡行人重识别任务中有标签数据量较少的问题,提出了一种基于无监督数据增强的遮挡行人重识别方法。该方法在方法二的基础上,采用无监督方法进行数据增强,引入无标签数据并生成伪标签,提出混合记忆模型和聚类可靠性评价标准,动态更新不同类型数据所需的标签,利用统一对比损失对原模型参数微调,在扩充数据量的同时减少模型的过拟合。实验表明,该方法进一步提高了遮挡情况下的模型精度。

...

7.基于自适应权重损失函数的SAR图像目标检测与态势识别

关键词：
SAR图像目标检测数据增强自适应权重损失函数态势识别基金资助：陕西省重点研发计划项目（No.2019ZDLGY09-05）；国家自然科学基金（No.61772399）；专辑：信息科技专题：电信技术 DOI：10.27389/d.cnki.gxadu.2022.001473 分类号：TN957.52 导师：李阳阳手机阅读

《》
0年
卷
期
期刊

随着计算机软件和硬件的发展,机器学习和深度学习成为了当前的研究热点,基于此的计算机视觉领域也取得了很大的进展。SAR图像由于其全天时、全天候的优点,在地质勘探、军事战争等领域有着重大的应用。然而可用的SAR图像数量稀少,因此SAR图像目标检测任务的精度也收到了制约,基于目标检测结果的战场态势识别准确率同样受到了限制。本文主要针对SAR图像数量少、目标检测精度差以及态势识别准确率低三个问题提出了相应的改进方法。主要的工作点可以分为三个部分:第一,针对SAR图像数量稀少的问题,提出了一种简洁高效的基于卷积神经网络的数据增强方法,利用现有的目标与背景图像进行自动合成,将训练集数量扩充了一倍,并在目标检测任务上进行实验。实验结果表明,该数据增强方法能够将m AP提升7.57%,显著提升了SAR图像目标检测的精度。第二,在SAR图像目标检测任务中,针对部分类别样本检测效果差的问题,提出了自适应权重损失函数（1/Io U Loss）,应用于区域生成网络中的回归损失部分。该损失函数通过调节因子,能够自适应地增大检测效果差的样本在损失函数中的贡献,有针对性地提升这些检测效果差的样本的检测精度,从而提升整体的检测精度。实验结果表明,1/Io U Loss法对越困难的原始任务提升效果越好。其中,使用数据增强后的数据集进行改进前后方法对比实验,得到的m AP提升了4.61%。第三,在SAR图像态势识别任务中,将第二个工作中的检测结果作为特征向量中的一维,同其他设计的能够反映态势信息的特征一起输入支持向量机分类器中,对敌方动机进行多分类,判断其是进攻、防守还是撤退,辅助专家进行战场态势的预判。其中,由于SVM的高斯核对两个参数敏感,故针对此提出了分步网格搜索算法,自动搜索最优的参数组合。相比手动搜索,本章提出的方法提升了效率的同时还提高了分类准确率。实验结果中,SVM的分类准确率可以达到100%。同时,将本文的工作整合成了一个可视化系统,可以展示战场的态势和热点区域。

...

8.基于度量学习的小样本遥感图像场景分类

关键词：
遥感图像场景分类小样本学习度量学习基金资助：国家自然科学基金（No.61772399）面向高分辨SAR图像分类的量子深度神经网络研究；陕西省重点研发计划项目（No.2019ZDLGY09-05）面向高分辨SAR图像目标识别的量子深度神经网络技术研究；专辑：工程科技Ⅱ辑信息科技专题：工业通用技术及设备自动化技术 DOI：10.27389/d.cnki.gxadu.2022.001147 分类号：TP751 导师：李阳阳张小龙手机阅读

《》
0年
卷
期
期刊

遥感图像场景分类是根据遥感图像的语义信息对其进行分类,在很多领域都有广泛的应用。随着深度学习的发展,基于深度神经网络的场景分类方法取得了很好的效果。然而,一个优秀的遥感场景分类深度学习模型的训练需要大量的标注样本,而遥感样本的标注往往十分困难。此外,这些模型只能对训练集中出现的场景进行分类,对训练集中未出现的新类别的扩展性较差。为了解决上述问题,一些学者开始研究小样本遥感图像分类方法,其目的是在只给出少量已知场景类的标记样本条件下识别出新的场景类别。与自然图像相比,遥感场景的背景复杂、类内多样性大、类间相似性高且物体尺度变化大,使得遥感领域的小样本分类更具挑战性。大多数现有的工作仅使用小样本方法来解决小样本遥感场景分类问题,忽略了学习遥感图像特征表示的重要性,而且常常使用图像级特征表示,这很容易丢失判别信息。因此,构建能够充分挖掘遥感图像的特征表示的小样本遥感图像场景分类算法,是该课题研究中的重点。本文具体研究工作如下:（1）针对小样本遥感图像中背景复杂的特性,提出了一种基于注意力机制的深度近邻神经网络。考虑到小样本场景下图像级特征较为稀疏,网络采用深度局部描述子进行特征表示。此外,设计了类别相关注意力模块,得到场景类别相关的注意力特征图,从而在度量过程中增加有代表性的局部描述子权重。经实验验证,注意力图能够识别图像中与场景相关的局部区域,所提网络更加适用于小样本条件下的遥感图像场景分类。（2）针对小样本遥感图像中类内多样性大、类间相似性大的特性,提出了基于判别性增强的小样本遥感图像场景分类方法。为了获得更健壮的特征,网络通过嵌入模块得到局部-全局描述子,将局部特征与全局特征融合。引入中心损失来优化全局信息,并增加了类内紧致性。为了学习遥感图像中更有判别性的特征,在度量模块的损失函数中加入了余弦边距。实验表明该方法进一步提升了模型的分类精度。（3）针对小样本遥感图像中物体尺度变化大的特性,提出了一种基于双流结构的小样本遥感图像场景分类方法。为了网络不受物体尺度变化的影响,构建一个双流架构,分别从整个图像和最重要区域预测图像所属类别的概率,最后融合两个分支的结果。为了获得图像中最重要区域位置,设计了关键区域定位方法,并利用该方法连接上述两个流。实验表明该方法能够减轻物体尺度变化剧烈对模型分类性能的负面影响,从而获得更高的分类精度。

...

9.基于自监督的视频目标分割算法研究

关键词：
自监督学习视频目标分割边缘检测深度学习基金资助：陕西省重点研发计划项目（No.2019ZDLGY09-05）；国家自然科学基金（No.61772399）；专辑：信息科技专题：计算机软件及计算机应用 DOI：10.27389/d.cnki.gxadu.2022.002245 分类号：TP391.41 导师：李阳阳手机阅读

《》
0年
卷
期
期刊

随着深度学习技术的发展,基于深度学习的视频目标分割算法已经成为了处理视频目标分割任务的主要方法。但是深度学习模型需要大量的训练数据进行训练,可以预见,靠人工制作视频目标分割数据集将无法满足规模日益扩大的视频目标分割模型的训练需求。基于自监督学习的视频目标分割算法以其不需要人工标注数据集即可对视频目标分割模型进行训练的特点受到了广泛的关注。由于使用的数据集没有经过人工标注,自监督学习方法将直接决定视频目标分割模型的性能,而有效的模型框架也是提高视频目标分割模型性能的关键。因此,搭建有效的视频目标分割模型,并设计高效的自监督学习方法,是该课题研究中的重点。本文具体研究工作如下:（1）为了进一步提高视频目标分割模型从视频帧中提取的特征对大尺寸目标和小尺寸目标的泛化性,本文提出了基于多像素尺度图像重建的自监督学习方法,通过不同像素尺度的图像的重建任务,使得模型提取的特征兼顾小尺寸目标和大尺寸目标。实验证明通过多像素尺度图像重建的自监督训练任务训练得到的模型较单一像素尺度图像重建的训练任务得到的模型有更好的表现。（2）针对视频目标分割模型在进行视频目标分割时误差累积导致错误分割的问题,本文提出通过图像中目标边缘对目标分割掩膜进行修正。为了在自监督范式下提取目标边缘,本文提出了基于自监督的边缘检测算法。实验表明,通过该方法提取候选目标边缘的表现要好于Canny算法等无监督方法,更加适用于自监督视频目标分割任务。（3）为了根据目标边缘修正视频目标分割结果,本文提出了基于边缘修正的自监督视频目标分割算法。该方法能够使用自监督学习方法训练边缘融合网络,并根据侧输出边缘检测网络预测的候选目标边缘对视频目标分割模型预测的目标粗分割掩膜进行修正,得到更为精细准确的目标分割掩膜。实验表明,该模型能够根据目标帧的候选目标边缘对骨干视频目标分割模型预测的目标帧的目标粗分割掩膜进行修正,效果要好于传统视频目标分割模型。

...

10.基于深度学习的多时相CT图像肝肿瘤分割

关键词：
肝肿瘤分割迁移学习特征融合 Transformer 多时相CT图像基金资助：国家自然科学基金面上项目,61772399,面向高分辨率SAR图像分类的量子深度神经网络研究；陕西省重点产业创新链项目,2019ZDLGY09-05,面向高分辨SAR图像目标识别的量子深度神经网络技术研究；专辑：医药卫生科技信息科技专题：临床医学肿瘤学肿瘤学特种医学计算机软件及计算机应用 DOI：10.27389/d.cnki.gxadu.2022.002033 分类号：R735.7R730.44TP391.41 导师：李阳阳罗中华手机阅读

《》
0年
卷
期
期刊

在中国,肝癌的发病率和死亡率常年居于高位。目前肝癌患者在治疗过程中通常通过多时相CT扫描来确定自身肝肿瘤的情况。利用计算机实现CT图像中肝肿瘤的自动分割不仅节省了手动标注需要的人力物力,还降低了人为标注过程中因主观因素造成的误标漏标风险。多时相CT扫描包括按时间顺序获得的动脉期图像、门静脉期图像和延迟期图像三期图像。其中动脉期和门静脉期图像的成像时间相近,图像中各器官组织结构相似,延迟期图像中各器官组织对比前两期差异较大。如何利用多时相CT图像信息提高肝肿瘤的分割效果是本文的研究重点。本文的主要研究工作如下:（1）针对使用单期图像分割肝肿瘤导致的肝肿瘤欠分割的情况,本文提出了一种基于语义迁移的多时相CT图像肝肿瘤分割方法。首先利用单期分割精度最高的门静脉期图像训练得到门静脉期分割网络,冻结该网络的编码器中权重,然后利用语义迁移使用动脉期图像、延迟期图像及另一机构的平扫CT图像对冻结后的网络进行微调,分别得到各自对应的分割网络。实验表明采用语义迁移可以提高分割网络的分割性能,且语义迁移在不同来源并且数据量少的CT数据上也有较好的适用性。（2）针对门静脉期图像中肝脏对比度低以及肝肿瘤成像质量差导致的肝肿瘤分割不准确的问题,本文提出了一种基于多时相融合与双注意力机制的肝肿瘤分割模型。首先将含有肝脏及肝肿瘤底层特征的动脉期图像浅层特征和门静脉期图像浅层特征通过设计的多时相特征融合机制进行融合,对门静脉期图像特征进行补充。并且在分割网络的编码器中嵌入双注意力机制强化分割网络对肝肿瘤特征的学习。实验表明该模型有效缓解了肝肿瘤分割结果的欠分割情况,肝肿瘤的分割效果有明显提升。（3）针对肝肿瘤分割过程中因信息损失影响肝肿瘤分割准确性的问题,本文提出了一种基于多头交叉注意力Trans UNet与形状约束的肝肿瘤分割模型。首先利用两个权重共享的卷积特征提取器将动脉期和门静脉期图像映射至相同的特征空间,将得到的两种特征图输入基于Transformer结构设计的交叉注意力特征融合机制中进行融合,为分割网络补充更多肝肿瘤分割信息。再利用形状表示模型将形状约束引入网络训练中,引导网络训练的优化方向。实验表明该模型的肝肿瘤分割性能良好,分割结果的准确度明显提高。本文得到如下基金资助:陕西省重点研发计划项目（No.2019ZDLGY09-05）和国家自然科学基金（No.61772399）。

...

排序方式：时间相关性
显示方式：列表摘要