本文内容来源于《测绘学报》2024年第6期(审图号GS京(2024)1198号)
纪长琦,1, 郭肇捷1, 孙海丽,1,2, 钟若飞1,2
1.首都师范大学资源环境与旅游学院,北京 100048
2.
基金项目
作者简介
摘要
关键词
本文引用格式
纪长琦, 郭肇捷, 孙海丽, 钟若飞.
doi:10.11947/j.AGCS.2024.20230438
JI Changqi, GUO Zhaojie, SUN Haili, ZHONG Ruofei.
阅读全文
http://xb.chinasmp.com/article/2024/1001-1595/1001-1595-2024-06-1236.shtml
中国城市轨道交通迅速发展,截至2023年底,中国大陆地区共有59座城市开通城市轨道交通运营线路338条,运营线路总长度为11 224.54 km,其中,地铁运营线路长度为8 543.11 km,占比为76.11%[1]。盾构法和矿山法是主要的地铁隧道施工类型,盾构隧道通过盾构掘进和管片架设完成,而矿山法隧道则采用钻爆法,并呈现多样的断面轮廓,如马蹄形和类矩形。由于地质、受力和地下水等因素,隧道内部经常发生形变和衬砌病害,如拱顶沉降、渗漏水、衬砌剥落和裂缝等,其中渗漏水是最常见且主要的问题。渗漏水会引起衬砌结构破坏,导致剥落病害加剧,同时加速对内部设备的腐蚀,缩短使用寿命,增加维修费用[2]。
随着智能化测绘技术的发展,自动化和智能化的数据处理方法为隧道检测提供了新的解决方案。研发以知识为引导、算法为基础的智能化测绘技术至关重要。如,智能测绘技术已应用于城市地理路网的区域协调控制和大规模点云语义标识[3-5]。目前智能化测绘的核心目标是通过先进的算法和系统实现地理空间数据的高效管理和分析。
在隧道变形和病害检测方面,准确的定位是必要的。为了便于后续维护工作,隧道检测的主要目的之一是告知工作人员病害和变形发生的位置。因此,开展隧道定位和检测渗漏水病害具有重要的意义和价值。相对定位是获取隧道内目标点相对于某点的三维坐标的过程。已有研究通过在移动激光扫描系统中集成位移传感器[6]、利用点云强度信息生成影像,采用梯度累计法[7]及手动标注和相对里程纠正[8]的方法,成功实现了盾构隧道的定位。然而,这些研究主要集中在盾构隧道,较少涉及矿山法隧道的定位研究,且主要关注里程方向上的定位,对环内定位的研究有限。
隧道渗漏水检测通常采用人工巡检或计算机视觉的方法。计算机视觉方法在效率和数据管理方面具有显著优势,主要通过摄影测量或移动激光扫描获取光学图像或强度图像进行自动检测。这种方法分为传统图像特征检测和深度学习两大类。传统图像特征检测[9-16]是指利用图像平滑、动态阈值分割、多次线性变换等技术突出渗漏水的反射率、几何特征等传统的图像特征。如,图像平滑和动态阈值分割[9]可以突出渗漏水特征。红外热成像仪结合粒子群最佳熵阈值[12]算法和形态学操作可以实现渗漏水区域提取。通过CCD相机和传统Otsu算法[13]与边缘检测算法,也能够将渗漏水从背景中区分。然而,隧道内的附属物可能影响这些方法的稳健性和普适性,因此一些研究[15-16]通过去除点云数据中的附属物和噪音来减小干扰,但这种方法可能误将隧道壁点云去除,从而影响检测效果。
深度学习[17-32]方法能够自主学习出最合适的特征提取算子,且在精度和速度方面相较于传统方法都有了很大提升。如,使用FCN[17]可以实现地铁盾构隧道渗漏水的语义分割,工业相机结合Mask R-CNN[19]进行隧道渗水分割,Cascade Mask R-CNN[22]也被用于CCD照片的渗水分割。进一步的研究还结合了Res2Net优化模型[23]、Tensorflow框架下的ResNet[24]模型、改进的Blend Mask[25]图像分割模型、添加ECA-Net信道注意力机制的Deeplab V3+模型[26]、多光谱模态融合技术[27]、带有注意力模块的VGG16网络和Rest Net34[28]等,提高了识别准确率和检测效率。此外,还提出了如ACPA-Net[29]、Swin transformer网络[30]、UNet和UNet++结合分类CNN[31]、基于YOLOv5(you only look once version 5)的RDES-Net[32]等方法,用于渗漏水的有效检测和分割。这些方法在实际应用中显著提高了渗漏水检测的精度和速度,解决了传统检测算法难以迅速、准确检测缺陷的问题。
深度学习在隧道渗漏水检测方面取得了一定进展,然而,现有研究主要侧重于图像中渗漏水特征的提取,而忽略了对渗漏水的精确定位研究,与实际工程应用存在脱节。目前的深度学习方法多采用二阶段模型,导致渗漏水检测效率较慢。考虑到传统可见光相机对光源的依赖性,不是最优选择,本文通过移动激光扫描技术获取隧道点云强度影像,结合不同施工方法的隧道结构特征,研究了隧道的定位方法,为全测区精确定位隧道渗漏水病害位置提供基础。在此构思上,本文改进了YOLOv7[33]基线模型,结合渗漏水特征,实现了对矿山法和盾构法隧道渗漏水的检测,并实现了渗漏水的准确定位,为智能化测绘在城市轨道交通领域的应用提供了技术方法。
1 隧道点云数据优化与定位策略
移动激光扫描技术通过将激光扫描仪集成至轨道小车平台,利用小车移动实现二维螺旋线扫描,进而将获取的二维数据转换为三维点云。此过程同时生成灰度图像,用于体现隧道的几何结构及其强度信息。这种数据形式的局限性对精确定位提出了挑战。移动激光扫描因受到里程传感器精度和车轮运行中可能发生的打滑、扭动等现象的制约,导致里程信息不准确(存在3‰的误差)。为提升渗漏水定位精度,本文进行了隧道定位方法研究。
地铁隧道根据结构不同分为盾构隧道和非盾构隧道。盾构隧道采用规则环片拼接,环片上的螺栓孔分布规律明显,可以结合螺栓孔分布特点实现隧道数据的精确定位[34],文献[7]研究发现在整体里程纠正的基础上经过环片宽度改正之后,环缝位置的平均差值减小到2.3 cm,有了大幅度的下降,且各环缝位置的偏差分布更加均匀。相比之下,非盾构法隧道缺乏螺栓孔和拼接缝的规律,因此在定位中可借助其他定位标识。矿山隧道是最主要的非盾构隧道类型。本文以盾构法和矿山法隧道为例,实现了隧道的精确定位。
为提升隧道壁数据处理的效率及准确性,本文采用了基于目标几何位置特征的预处理策略。首先,在遍历断面的过程中,考虑扫描角度,将隧道数据从原始数据中剥离并删除冗余信息。随后,采用迭代椭圆拟合方法去除断面点中的隧道内部附属物点云。最后,研究应用圆柱面投影方法将隧道壁投影展平,以满足后续处理需求。
盾构隧道定位流程如图1所示,隧道点云数据展平后,螺栓孔从隧道壁凸起,采用布料滤波(cloth simulation filtering,CSF)算法[35]提取螺栓孔,并借助密度聚类(density-based spatial clustering of applications with noise,DBSCAN)算法[36]去除噪点。改进后的CSF算法与DBSCAN算法相结合的实现过程包括反转隧道LiDAR点云、初始布料网格设置、获取分类阈值等步骤。同时,使用Mean-Shift聚类算法识别每个螺栓孔的中心点,定义了螺栓孔中心的识别模板,如图1(e)所示。基于不同块的螺栓孔中心点,通过直线拟合实现了对盾构隧道三维点云数据的精确定位,将隧道分成不同的块,结合环号与分块信息,实现了数据纵向接缝和环向接缝的精确定位。通过将定位结果与原始点云中的接缝进行对比,评估了定位精度,定位结果如图1(h)、图1(i)所示,其中黑色线段为原点云中接缝,红色线段为本文方法定位的接缝。
图1
图1 盾构隧道定位流程
Fig.1 Locating flowchart of shield tunnel
针对矿山法隧道自身不具备定位结构的特性,本文引入了标靶辅助定位策略,每50 m设置一对标靶,粘贴在隧道内壁,用于里程纠正[37]。标靶采用YOLOv7(you only look once version 7)深度学习算法进行目标检测。裁剪隧道衬砌预览影像成640×640子图片,构建原始数据集,划分为4∶1比例的训练集和验证集,采用对比度拉伸、左右翻转、上下翻转等方式扩充数据。为优化标靶自动识别精度,综合考虑置信度阈值、标靶空间位置、标靶灰度规律等因素,有效减少误检。在实际测量中,标靶通常安装在隧道拱底且有固定距离,利用标靶固定的空间特性,可有效减少金属支架引起的误检。如,在里程方向上,通过遍历bounding box之间的距离,小于一定值的被视为误检并去除,有效减少其他附属物引起的误检。标靶的4个区域用不同颜色区分,通过像素值规律判断正确结果。通过自动识别标靶,本文实现了对矿山法隧道的全测区里程定位,为定位渗漏水病害提供了基础。标靶自动识别及定位效果见图2。
图2
图2 标靶识别
注:bb为bounding box。
Fig.2 Target identification
2 深度学习驱动的隧道渗漏水智能化检测方法
2.1 基于YOLOv7改进模型的隧道渗漏水快速检框架
本文致力于地铁隧道渗漏水的精确识别与定位,选择YOLOv7模型作为研究的基础模型,YOLOv7的骨干网络使用ELAN(efficient layer aggregation)模块和最大池化(maxpool,MP)模块交替提取图像特征,并输出3个不同尺度的特征图作为Head网络的输入。Head网络由改进后的FPN(feature pyramid network)和PANET(path aggregation network)结构组成,采用ELAN-W(efficient layer aggregation network with wider receivers)模块进行特征提取和融合,具有更强的特征强化能力。RepConv(re-parameterized convolution)模块在训练时由3个分支相加输出,推理时将分支的参数重参数化到主分支上,提高模型推理效率。
尽管YOLOv7在常规场景任务中表现出色,但在渗漏水检测中仍存在问题。为此,本文将骨干网络中的第1个和第4个ELAN结构替换为Conv NeXt(convolutional network next)[38]模块,以提升对可变渗漏水的检测和定位能力。在颈部网络的3个Concat(concatenation)操作后添加了卷积块注意模块CBAM(convolutional block attention module)[39],以增强模型对渗漏水目标的感知能力,减少背景噪声干扰,并促进特征的交互。文中还对损失函数和非极大值抑制(non-maximum suppression,NMS)进行了改进,以提升渗漏水检测效果。改进后的YOLOv7网络结构保留了原有的CBS(convolutional block with SiLU)模块、上采样(Upsample)操作、SPP(spatial pyramid pooling)和分支结构。其中,CBS模块由Conv层(convolutional layer)、BN层(batch normalization layer)和SiLU层(sigmoid linear unit layer)组成,SiLU激活函数为Swish激活函数的变体;Upsample操作采用最邻近插值;SPP通过最大池化获取不同感受野以适应不同分辨率的图像;分支结构包含4次最大池化(maxpool)操作,使用不同大小的卷积核。改进后的YOLOv7网络结构如图3所示,图中的k、s分别代表卷积核大小(kernel size)、步幅(stride),以区分大目标和小目标;REP(Rep Conv)为重参数化卷积模,cat(Concat)为连接操作,用于将多个特征图连接起来。
图3
图3 改进的YOLOv7网络结构
Fig.3 Improved YOLOv7 network structure
2.2 特征提取优化模块
隧道渗漏水数据与常规目标检测的数据相比,呈现出形状多变、大小不一、轮廓多样等特点。在YOLOv7网络中,ELAN虽然执行通道交互,但其分支结构相对简单,限制了不同分支之间的信息交互。为了更有效地学习渗漏水的不同形状特征,本文采用ConvNeXt模块替换了原骨干网络中的第1个和第4个ELAN模块。
在骨干网络降采样提取渗漏水特征的过程中,Conv NeXt模块中特殊逆瓶颈层的设计能够有效避免小尺寸渗漏水目标特征信息的丢失。同时,Conv NeXt模块使用7×7的卷积核提取特征,更好地掌握大尺寸渗漏水对象和多样形状特性。网络结构详见图4,其中层归一化模块用于中间层输出的归一化,有助于提高训练的稳定性。而层尺度模块则用于增强模型表达能力,通过学习通道之间的权重,更灵活地捕捉不同通道之间的关系。
图4
图4 Conv NeXt模块[38]
Fig.4 ConvNeXt module[38]
Conv NeXt网络是一种纯卷积网络,该模块采用逆瓶颈层设计模式,输入特征图高为H,宽为W,通道数为n。先用7×7的深度可分离卷积进行特征提取,再用1×1的卷积进行升维操作,此时通道数为4×n,最后用1×1的卷积进行降维操作,将通道数再变成n,这种逆瓶颈层结构能够有效地避免高维信息的流失。Conv NeXt使用7×7的自注意力窗口,增大了感受野。Conv NeXt网络把批量归一化替换成层归一化,同时减少了归一化层的数量,这种调整减少了梯度振荡,使模型在训练过程中更加稳定。
2.3 卷积注意力模块
隧道衬砌上存在电缆、管道、电表箱和指示牌等附属物,导致隧道渗漏水检测面临背景复杂的挑战。传统网络结构往往通过简单的加权输出来处理这些影响。然而,这种方法忽视了通道之间的关系,可能导致信息的丢失,从而降低渗漏水检测效果。
CBAM(convolutional block attention module)通过整合通道注意力和空间注意力,使网络能够专注于重要的特征并抑制不必要的特征。本文在头部网络中引入CBAM注意力机制,使网络在渗漏水特征提取和融合过程中更准确地关注渗漏水特征,从而避免背景因素的干扰,提高渗漏水检测的精度。
CBAM由两个子模块组成(图5):①通道注意力模块(channel attention module,CAM),进行通道层面的注意;②空间注意力模块(spatial attention module,SAM),在空间层面进行注意。
图5
图5 CBAM模块[39]
Fig.5 CBAM module[39]
假设输入特征图为F,通过第1个通道注意模块生成通道特征Mc(F)与F进行Element Wise乘法操作得到特征图F'。通过第2个空间注意模块生成空间特征Ms(F')与F'进乘法操作得到特征图F″,公式如下
在通道注意力模块中,特征图F首先要分别在宽和高的维度上进行全局最大池化和平均池化,接着将得到的两个1×1×n的特征图分别送入一个MLP(multilayer perceptron)神经网络。然后,将MLP输出的特征先后进行Element Wise的加和操作及sigmoid激活操作、最后,生成通道特征Mc(F),公式如下
在空间注意力模块中,首先要对来自上阶段的特征图进行基于通道的全局最大池化和全局平均池化,将得到的两个H×W×1的特征图进行通道拼接。然后,利用一个7×7的卷积将其再降维成一个H×W×1特征图。最后,经过sigmoid激活操作生成空间特征Ms(F),公式如下
2.4 定位损失函数
针对隧道渗漏水检测问题,损失函数的恰当选择对于优化模型性能具有决定性作用。本文旨在开发一种损失函数,该函数能够综合评估渗漏水目标的定位精度及预测框的置信度,从而促进模型学习过程并提升其预测效能。研究将交并比(intersection over union,IoU)作为目标定位的主要衡量指标。IoU是用来衡量预测框A与真实框B之间的重叠率的指标,计算公式如下
当预测框A与真实框B交集为空时,IoU为0,不能准确地反映A、B之间的距离。针对这种情况GIoU(generalized intersection over union)[40]通过引入预测框A和真实框B的最小外接框C来获取预测框A、真实框B在外界框C区域中的比重。这样不仅可以关注重叠区域,还可以关注其他非重叠区域,能较好地反映两个框在闭包区域中的相交情况,GIoU Loss计算公式如下
GIoU的取值范围为[-1,1],预测框A与真实框B完全重合的时候取最大值1,两者无交集时取-1,这样解决了IoU的缺陷。但是也存在问题,当预测框完全包含真实框或真实框完全包含预测框时,GIoU就等于IoU,这种情况下也是不能区分两者的相对位置关系。DIoU(distance intersection over union)[41]考虑了预测框A与真实框B中心点的距离和对角线距离的比值,避免了GIoU存在的问题。DIoU Loss计算公式如下
式中,b为预测框中心点;bgt为真实框中心点;ρ表示欧氏距离计算方式;c表示预测框与真实框对角线距离。
DIoU Loss在两框中心点重合,但宽高比不同时,就会退化为IoU Loss。因此,为了得到更加精准的预测框,CIoU(complete intersection over union)在DIoU的基础上增加了一个影响因子,即考虑了预测框与真实框之间长宽比是否一致,具体公式如下
式中,wgt、hgt分别表示真实框的宽和高;w、h分别表示预测框的宽与高;?用来衡量长宽比;α为平衡参数。
本文对比了GIoU Loss、DIoU Loss、CIoU Loss 3种定位损失函数,最终选择在渗漏水数据集中能使模型表现更优异的GIoU Loss作为最终的定位损失函数。
2.5 非极大值抑制
传统的NMS算法根据IoU阈值去除重叠的预测框,这种一刀切的方式存在一定的问题,当两个渗漏水目标距离很近的时候,其中一个置信度较低的预测框会被去掉,降低模型预测的准确度。在隧道渗漏水检测任务中,由于隧道环境复杂,渗漏水的位置、形状、大小等都存在差异,这会导致渗漏水检测结果中存在很多重叠的边界框。简单地过滤掉得分低且重叠度高的边框可能会导致漏检问题。
soft NMS(soft non-maximum suppression)[42]改变了传统的NMS一刀切的操作,将其他置信度较低的预测框bi与置信度最大的预测框M进行IoU计算,当计算的值小于IoU阈值Nt,置信度Si不变;当计算的值大于IoU阈值Nt,遵循IoU越大置信度Si越低的原则,与M重叠度越高的预测框置信度衰减越严重。IoU和IoU阈值作为降低置信度的依据,最后根据置信度阈值将得分小于阈值的预测框去掉。Soft NMS的公式如下
soft NMS使模型更好地解决两个渗漏水因为离得近而被去掉的情况,通过降低重叠检测框置信度的方式,减少渗漏水病害的漏检率。
2.6 渗漏水定位
本文利用隧道内壁正射影像输入至训练完成的模型,以获得渗漏水病害的检测边界框,其中包含左上角坐标、右下角坐标、置信度。计算目标检测框中心坐标作为病害的发生位置,具体的位置信息结合隧道定位方法,针对盾构法隧道,给出里程、环号、分块信息;针对矿山法隧道结合标靶标纠正里程,给出渗漏水所在纠正后的里程信息。
3 试验结果与分析
3.1 数据采集及制作
本文分别选取重庆矿山法与盾构法两种隧道类型数据,线路长度分别为2 km,利用首都师范大学研制的移动式激光检测系统采集数据,现场作业图如图6所示。
图6
图6 移动式激光扫描系统及现场作业
Fig.6 Mobile laser scanning system and field operation
本文主要采用Z+F 9012激光扫描仪的移动式激光扫描系统[43]获取数据。系统主要参数:分辨率设置为高分辨率,转速设置为200 Hz,前进速度设置为0.5 m/s。进行轨道往返扫描采集,保障隧道点云数据的质量,点间距为3~5 mm,断面间距为5 mm,点密度满足隧道变形分析要求,生成高质量隧道衬砌影像,并对影像进行了分段线性拉伸增强[44-45]。
结合实测点云强度影像,构建了盾构法和矿山法隧道渗漏水数据集。裁剪隧道衬砌影像为1000×1000像素的子图像,生成322张盾构法隧道数据和318张矿山法隧道数据。按照4∶1的比例分割训练集与测试集。为扩充数据集,采用旋转方式,顺时针和逆时针分别旋转5°、10°,最终得到盾构法隧道训练集1290张、验证集320张,矿山法隧道训练集1275张、验证集315张。使用LabelImg软件对所有数据进行标注,标注完成后绘制渗漏水最大边界的长方形包围框。详细数据集情况见表1。
表1 渗漏水数据集概况
Tab.1
数据集名称 | 训练集 | 测试集 | 总数 |
---|---|---|---|
盾构隧道数据集 | 258 | 64 | 322 |
盾构隧道扩充数据集 | 1290 | 320 | 1610 |
矿山法隧道数据集 | 255 | 63 | 318 |
矿山法隧道扩充数据集 | 1275 | 315 | 1580 |
新窗口打开| 下载CSV
图7
图7 渗漏水检测数据集的代表性示例
Fig.7 A representative image example of a water leakage detection dataset
本文的所有试验均在安装有Windows 10操作系统的服务器上执行。所述服务器装备有AMD Ryzen 9 5950X 16核处理器,时钟频率为4.00 GHz,具备64 GB运行内存,以及一张拥有24 GB显存的NVIDIA GeForce GTX 3090显卡,后者专门用于提高深度学习模型训练的效率。
3.2 隧道定位效果
盾构法隧道定位精度验证分为纵向接缝和环向接缝两个方面进行分析。首先,对纵向接缝定位精度进行评估,选择封顶块与两侧邻接块之间的纵向接缝进行分析。其中,x轴平行隧道中线指向大里程方向,y轴垂直于x轴。通过比较随机选取的5环点云中纵向接缝的端点与本文方法定位的接缝端点的y坐标值,得到平均差值为3.4 mm。其次,对环向接缝定位精度进行评估,选择展开后隧道壁点云的拱顶、左右腰间相同位置本文方法定位的环向接缝与原点云中环向接缝的里程值进行对比。图8为盾构法环向接缝定位对比图,其中黑色线段为原点云中环向接缝,红色线段为本文方法定位的环向接缝。定位结果与原点云中环向接缝在拱顶、左腰、右腰处差值的均值分别为3、4、5 mm。
图8
图8 盾构法环向接缝定位对比
Fig.8 Circular joint positioning comparison
通过上述对纵向接缝和环向接缝定位精度的评估可知,本文方法在盾构法隧道中定位精度较高,为隧道测量提供了可靠的基础。
矿山法隧道的定位精度通过往返测量顶净高之差来评估,计算同一断面下拱顶净高的两次测量结果。拱顶净高是轨道面到拱顶的距离,通过多项式拟合曲线获取。
为了验证定位精度,选择39个断面进行往返测量,对比每对标靶右侧标靶中心点确定的断面的拱顶净高。结果表明,往返测量的绝对偏差为0~4 mm,最大偏差为3.5 mm,平均偏差值为1.4 mm。往返测量的差值说明了拱顶净高在不同测量中的一致性。虽然5.3%的测量结果超过3 mm的阈值,但仍能表明本文方法在矿山法隧道的高精度定位方面具有可靠性。这一验证方法为矿山法隧道的定位提供了可行的手段,确保了拱顶净高的测量精度。
3.3 渗漏水检测方法对比
为了充分验证本文提出的各改进模块的有效性,本文分别利用不同隧道数据集进行了试验,采用以下指标评估模型的好坏:①正确检测的数量TP,即预测与实际相一致的结果数量;②误检的数量FP,即预测结果为正样本,但是实际结果是负样本的数量;③漏检的数量FN,即预测结果为负样本,但实际结果是正样本的数量;④准确率P,为正确检测数量占所有检测结果的比例;⑤召回率R,为正确检测数量占实际标记数量的比例;⑥m AP0.5,指当IoU设置为0.5时,准确率P曲线与召回率R曲线所围成面的面积;⑦F1值是平衡准确率与召回率的指标,取值范围为[0,1],其值越接近于1,说明模型检测结果越好即检测目标准确且全面。P、R、F1值计算公式如下
3.3.1 损失函数对比
损失函数是用来衡量模型预测值与真实值的差异,其数值越小表示模型性能越优异。模型的训练阶段通过损失函数不断的计算达到优化模型的目的,使预测值更贴近真实值。本文对比了矿山法和盾构法隧道数据集在不同定位损失函数下的表现情况,试验结果如表2所示。
表2 隧道不同定位损失函数精度对比结果
Tab.2
数据集 | 损失函数 | 总标记 | TP | FP | FN | P | R | m AP0.5 | F1值 |
---|---|---|---|---|---|---|---|---|---|
盾构法 | CIoU | 375 | 303 | 80 | 72 | 0.791 | 0.808 | 0.807 | 0.799 |
DIoU | 375 | 283 | 49 | 92 | 0.852 | 0.755 | 0.802 | 0.801 | |
GIoU | 375 | 312 | 83 | 63 | 0.790 | 0.832 | 0.825 | 0.810 | |
矿山法 | CIoU | 398 | 302 | 74 | 96 | 0.803 | 0.759 | 0.815 | 0.780 |
DIoU | 398 | 300 | 97 | 98 | 0.756 | 0.754 | 0.802 | 0.755 | |
GIoU | 398 | 323 | 71 | 75 | 0.820 | 0.812 | 0.848 | 0.816 |
新窗口打开| 下载CSV
F1值能够综合地评判模型效果。在两个数据集中,GIoU Loss作为定位损失函数的F1值明显高于其他两种定位损失函数的F1值。因此,本文选取GIoU Loss作为模型的定位损失函数。
3.3.2 消融试验
如表3所示,试验组G1为基线模型,未进行改动的YOLOv7;试验组G2是在基线模型的基础上插入了CNEB模块;试验组G3是在基线模型的基础上插入了CBAM模块;试验组G4是在基线模型的基础上将原有的定位损失函数替换为GIoU Loss;试验组G5是在基线模型的基础上将原有的NMS替换为soft NMS;试验组G6是在试验组G2的基础上插入CBAM模块;试验组G7是在G6的基础上将原有的定位损失函数替换为GIoU Loss;试验组G8是在G7的基础上将原有的NMS替换为soft NMS。
8组试验在训练过程中的参数设置相同,其中超参数设置为:batch size为8;总迭代为300轮;初始学习率为0.01;动量为0.937。
表3 试验组差异
Tab.3
试验组 | CNEB | CBAM | GIoU | soft NMS |
---|---|---|---|---|
G1 | × | × | × | × |
G2 | √ | × | × | × |
G3 | × | √ | × | × |
G4 | × | × | √ | × |
G5 | × | × | × | √ |
G6 | √ | √ | × | × |
G7 | √ | √ | √ | × |
G8 | √ | √ | √ | √ |
新窗口打开| 下载CSV
表4、表5为各试验方法的隧道消融结果。总体来看,不同方法相对于G1都有显著改善。如,在盾构法数据集中,G6相对于G1,P上升了2.3%,R上升了4.3%,m AP0.5提升4.5%,F1值提高了3.3%,在矿山法数据集中,P、R、m AP0.5、F1值分别提升了7.3%、6%、6.4%、7.6%;类似地,G2、G3、G4、G5、G7都在不同程度上改善了检测性能。相对于G1,G8的所有指标都取得了显著提升。
表4 盾构法隧道消融试验结果
Tab.4
试验组 | 总标记 | TP | FP | FN | P | R | m AP0.5 | F1值 |
---|---|---|---|---|---|---|---|---|
G1 | 375 | 303 | 80 | 72 | 0.791 | 0.808 | 0.807 | 0.799 |
G2 | 375 | 316 | 103 | 59 | 0.753 | 0.843 | 0.82 | 0.795 |
G3 | 375 | 293 | 56 | 82 | 0.84 | 0.781 | 0.837 | 0.809 |
G4 | 375 | 312 | 83 | 63 | 0.790 | 0.832 | 0.825 | 0.810 |
G5 | 375 | 304 | 63 | 71 | 0.828 | 0.811 | 0.799 | 0.819 |
G6 | 375 | 319 | 73 | 56 | 0.814 | 0.851 | 0.852 | 0.832 |
G7 | 375 | 318 | 53 | 57 | 0.857 | 0.848 | 0.868 | 0.853 |
G8 | 375 | 320 | 47 | 55 | 0.872 | 0.853 | 0.865 | 0.862 |
新窗口打开| 下载CSV
表5 矿山法隧道消融试验结果
Tab.5
试验组 | 总标记 | TP | FP | FN | P | R | m AP0.5 | F1值 |
---|---|---|---|---|---|---|---|---|
G1 | 398 | 302 | 74 | 96 | 0.803 | 0.759 | 0.815 | 0.78 |
G2 | 398 | 329 | 91 | 69 | 0.783 | 0.827 | 0.831 | 0.804 |
G3 | 398 | 316 | 67 | 82 | 0.825 | 0.794 | 0.886 | 0.809 |
G4 | 398 | 323 | 71 | 75 | 0.820 | 0.812 | 0.848 | 0.816 |
G5 | 398 | 323 | 62 | 75 | 0.839 | 0.812 | 0.867 | 0.825 |
G6 | 398 | 326 | 46 | 72 | 0.876 | 0.819 | 0.879 | 0.847 |
G7 | 398 | 328 | 55 | 70 | 0.856 | 0.824 | 0.878 | 0.840 |
G8 | 398 | 329 | 41 | 69 | 0.889 | 0.827 | 0.871 | 0.857 |
新窗口打开| 下载CSV
3.3.3 检测结果分析
为了进一步说明本文方法的优势,选取一些具有代表性的结果进行可视化。图9展示了本文方法与基线模型在不同隧道上的对比结果,其中GT为LabelImg软件标注的真实值,BL为基线模型YOLOv7检测结果。
图9
图9 渗漏水目标检测结果对比
Fig.9 Comparison of water leakage target detection results
(1)示例1:基线模型在矿山法隧道中将两个距离很近的渗漏水检测成一个,造成误检,而在盾构法隧道中因为横缝的存在造成误检,本文方法显著降低了误报率,增强了检测的准确性(图9(a))。
(2)示例2:基线模型在矿山法隧道上因为渗漏水的不清晰造成漏检,而在盾构法隧道中又因为线缆的部分遮挡造成漏检,本文方法能够更好地提取渗漏水特征,抗干扰能力更强,能够消除这两种误检(图9(b))。
(3)示例3:由于两个渗漏水病害距离近,IoU过大,导致置信度较低的被去掉,本文方法能够在一定程度上解决这种问题,减少漏检的数量(图9(c))。
(4)示例4:盾构隧道与矿山法隧道中的小目标容易被基线模型忽略,本文方法能够成功地检测部分小目标,一定程度上减少因目标过小造成的漏检(图9(d))。
(5)示例5:基线模型检测结果范围过大,本文方法能够更好地关注渗漏水本身的特征,减少背景的影响,所检测的范围更接近真实值(图9(e))。
(6)示例6:基线模型在线缆的遮挡下造成检测渗漏水范围不全,相较于现有技术,本文方法在特征提取方面展现了更高的效能,能够更好地涵盖渗漏水整体范围(图9(f))。
3.3.4 与其他模型的比较
当前主流的目标检测算法包括Faster RCNN(Swin)、Faster RCNN(ConvNeXt)及YOLOv8。Faster RCNN(Swin)和Faster RCNN(ConvNeXt)是两阶段目标检测算法,分别采用Swin Transformer和ConvNeXt作为骨干网络,而YOLOv8是一种单阶段目标检测模型。
本文以盾构法隧道和矿山法隧道数据集为基础,与当前主流目标检测算法进行了全面比较,结果见表6。在盾构法隧道数据集上,本文方法相较于Faster RCNN(Swin)提升了检测速度,提高了准确率和F1值。与Faster RCNN(ConvNeXt)和YOLOv8相比,本文方法也取得了显著改进,正确检测数量增加,错误检测数量减少,漏检数量降低,准确率和F1值均有提升。在矿山法隧道数据集上,本文方法同样表现出色,与Faster RCNN(Swin)相比,本文方法单张图片检测用时少0.119 s,准确率P上升20.1%,召回率R上升0.1%,m AP0.5提升0.6%,F1值提升10.7%;与Faster RCNN(Conv NeXt)相比,本文方法单张图片检测用时少0.128 s,准确率上升19.2%,F1值提升7.4%;与YOLOv8相比,本文方法准确率高3.6%,召回率上升9.6%,m AP0.5提升4.7%,F1值提升6.9%。
表6 隧道不同方法结果对比
Tab.6
数据集 | 方法 | 每秒检测图片数量 | TP | FP | FN | P | R | m AP0.5 | F1值 |
---|---|---|---|---|---|---|---|---|---|
盾构法 | Faster(Swin) | 0.161 | 332 | 157 | 43 | 0.679 | 0.885 | 0.855 | 0.769 |
Faster(ConvNeXt) | 0.169 | 342 | 139 | 33 | 0.711 | 0.912 | 0.869 | 0.799 | |
YOLOv8 | 0.030 | 280 | 64 | 95 | 0.814 | 0.747 | 0.812 | 0.779 | |
本文方法 | 0.045 | 320 | 47 | 55 | 0.872 | 0.853 | 0.865 | 0.862 | |
矿山法 | Faster(Swin) | 0.168 | 328 | 149 | 70 | 0.688 | 0.824 | 0.865 | 0.75 |
Faster(Conv NeXt) | 0.177 | 355 | 154 | 43 | 0.697 | 0.892 | 0.883 | 0.783 | |
YOLOv8 | 0.031 | 291 | 50 | 107 | 0.853 | 0.731 | 0.824 | 0.788 | |
本文方法 | 0.049 | 329 | 41 | 69 | 0.889 | 0.827 | 0.871 | 0.857 |
新窗口打开| 下载CSV
本文方法在与当前主流的两阶段目标检测模型对比试验中表现出两大优势,如图10所示。首先,本文方法能够显著减少误检,提高准确率,实现了准确率与召回率的平衡;其次,本文方法极大地提高了检测速度,检测速度比两阶段模型快3.4~3.8倍。与单阶段检测模型YOLOv8对比,尽管本文方法的检测速度稍慢,但在准确率、召回率和m AP0.5方面表现更加出色。
图10
图10 准确率及检测速度对比
Fig.10 Comparison of accuracy and detection speed
3.4 渗漏水定位结果
为了全面评估本文方法的应用效果,笔者团队在盾构法和矿山法隧道中分别选取了未参与模型训练的点云生成衬砌影像图进行检测,以确定渗漏水的发生位置。在盾构法隧道的案例中,研究设计了包含序号、环号、位置、里程和面积5个参数的记录体系,用于详细登记渗漏水病害情况。其中,环号代表目标检测框中心点的实际环号位置,而位置参数指代中心点所在的具体管片区域。表7详细列出了盾构法隧道中6个渗漏水案例的统计数据。相较之下,矿山法隧道的记录体系稍作简化,仅包含序号、位置、里程和面积4项参数,位置参数特指从小里程至大里程方向的隧道一侧。表8为矿山法隧道中6个渗漏水案例的具体发生情况。
表7 盾构法隧道渗漏水发生情况
Tab.7
序号 | 环号 | 所在位置 | 里程/m | 面积/m2 |
---|---|---|---|---|
1 | 1001 | 封顶块 | 28 551.13 | 0.108 |
2 | 1002 | 右邻接块 | 28 552.98 | 0.124 |
3 | 1004 | 左标准块 | 28 555.96 | 0.719 |
4 | 1005 | 左邻接块 | 28 557.41 | 0.079 |
5 | 1006 | 左标准块 | 28 558.45 | 0.158 |
6 | 1007 | 左标准块 | 28 558.60 | 0.242 |
新窗口打开| 下载CSV
表8 矿山法隧道渗漏水发生情况
Tab.8
序号 | 所在位置 | 里程/m | 面积/m2 |
---|---|---|---|
1 | 右 | 23 542.89 | 0.265 |
2 | 右 | 23 543.73 | 0.429 |
3 | 右 | 23 545.13 | 0.086 |
4 | 左 | 23 548.65 | 0.128 |
5 | 左 | 23 549.71 | 1.235 |
6 | 右 | 23 550.54 | 0.314 |
新窗口打开| 下载CSV
4 结论
本文成功地将智能化测绘的理念应用于地铁隧道渗漏水的检测中,探索了应用于点云强度影像的隧道渗漏水检测深度学习模型,实现了隧道渗漏水的高效检测与精确定位,为智能化测绘技术在城市轨道交通安全监测领域的应用开辟了道路。本文方法对YOLOv7基线模型进行了全面的优化,包括网络架构、特征融合策略、定位损失函数及非极大值抑制技术,以构建一个专门针对隧道渗漏水检测的深度学习模型,强调了对点云数据的独特性的适应,尤其是在提供定位和实际面积信息方面的优势。
为了验证本文方法的有效性,本文基于实际地铁隧道场景的移动激光测量数据,构建了包含盾构法与矿山法渗漏水样本的综合数据集进行试验。试验结果显示,本文方法在隧道渗漏水检测上表现卓越,实现了不同施工类型隧道渗漏水的里程定位、目标检测与参数提取,结合对比试验与消融试验,证实了本文方法在隧道渗漏水检测中的高效性和准确性。
未来的研究将进一步探索本文方法在不同类型隧道及复杂环境下的应用潜力,并集成至现有的智能化测绘系统中,以实现更广泛的工程应用。
初审:张 琳 复审:宋启凡
终审:金 君
资讯
初审:张 琳 复审:宋启凡
终审:金 君
资讯
本文暂时没有评论,来添加一个吧(●'◡'●)