基于匹配线索回归的侧面脊柱关键点检测
1 引言
特发性脊柱侧弯是一种严重的疾病,严重影响患者的心肺健康[1]。临床上,医生通常利用正侧面脊柱X线片上的关键点估计Cobb角、胸椎后凸角(TK)和腰椎前凸角(LL)等参数来量化评估脊柱侧弯[1-3]。精确的正侧面脊柱关键点检测对于量化评估脊柱侧弯具有重要的意义。由于侧面脊柱图像数据量少且存在严重的器官及肋骨遮挡现象,精确的侧面脊柱关键点检测更具挑战性。
目前,脊柱关键点检测的方法主要分为两类:两阶段法和单阶段法。两阶段法首先通过椎骨检测确定每个椎骨的范围,然后在椎骨范围内对单个椎骨进行关键点检测。两阶段方法[4-6]鲁棒性较好但存在不能端到端训练和无法利用图像全局信息等问题。单阶段法通常直接对脊柱图像中的关键点进行检测,具有可端到端训练和可利用图像全局信息等优点。单阶段法主要分为三类:坐标回归方法、中心加偏移方法和热图回归方法。坐标回归方法[7-8]通常利用网络直接预测关键点坐标,该方法受限于参数量和输入图像尺寸,精度不高[9];中心加偏移方法[9-10]通过预测椎骨中心和关键点与对应椎骨中心的偏移(offset)获得关键点坐标,该方法容易受到椎骨中心预测精度的限制,进而导致精度不足;热图回归方法[11-13]通过回归关键点热图并使用非极大值方法抑制获得关键点坐标,该方法相较于坐标回归方法具有更好的鲁棒性和精度。然而由于不同椎骨上相同位置的关键点具有相似的特征,热图回归方法难以区分不同椎骨上的关键点,容易造成椎骨与关键点的匹配错误,如,第一节椎骨上的关键点被误识别为第二节椎骨上的关键点。在侧面脊柱关键点检测中,侧面脊柱X线片存在严重的器官和肋骨遮挡,导致匹配错误更加严重。匹配错误对于后续任务如脊柱三维重建、TK和LL评估等有较大的影响。
为了解决上述问题,本文提出了一个新的单阶段侧面脊柱关键点检测方法,该方法同时预测关键点热图和关键点匹配线索(椎骨中心热图和关键点offset),利用关键点匹配线索建立关键点与对应椎骨的匹配关系。当椎骨的某一部分被遮挡时,该椎骨上未被遮挡的关键点特征有助于椎骨中心的预测。为了缓解遮挡对于椎骨中心预测的影响,提出几何感知特征增强(GFA)模块,该模块通过采样关键点特征增强椎骨中心的特征表达。为了缓解关键点热图和椎骨中心热图中正负样本比例失衡问题,提高关键点热图和椎骨中心热图的预测质量,对关键点热图和椎骨中心热图使用加权损失函数进行监督训练。
2 方法介绍
所提侧面脊柱关键点检测网络如
在关键点分支中,feature map经过landmark heatmap head获得预测的关键点热图。landmark heatmap head包含卷积层、BN(batch normalization)层和ReLU(rectified layer unit)层,其中两个卷积层的输入通道分别为64和256,卷积核大小k分别为3和1,步长均为1。
在匹配线索分支中,feature map首先经过offset head得到预测的关键点offset map。然后feature map 和offset map被送入GFA模块增强椎骨中心的特征表达,之后经过center heatmap head得到预测的椎骨中心热图。其中center heatmap head与landmark heatmap head参数设置相同,offset head与landmark heatmap head结构类似但两个卷积层的卷积核更大,分别为7和3,这样可以更好地学习关键点与椎骨中心的关系。在推理阶段,首先从预测的椎骨中心热图与offset map中获得关键点匹配线索,其次从关键点热图中提取关键点坐标,最后使用匹配方法建立关键点与椎骨的匹配关系。
2.1 关键点热图
考虑到椎骨之间的相似性,即每节椎骨相同位置的关键点具有类似的特征,按照脊柱关键点的位置和临床定义将脊柱关键点分为9类,同一类关键点用同一热图进行监督。坐标为
式中:
2.2 椎骨中心热图
与关键点热图类似,使用高斯核
式中:
2.3 关键点offset
关键点offset是指从椎骨中心到该椎骨上各关键点的向量,表示为
式中:
2.4 GFA模块
椎骨上分布有若干个关键点,这些关键点在椎骨上呈现一定的几何结构,利用这些关键点的特征可以增强椎骨中心的特征表达,缓解遮挡对于椎骨中心预测的影响。因此提出GFA模块,该模块结合可变形卷积[14-15]和offset head预测的offset map,动态地提取关键点特征增强椎骨中心的表达。与以往的可变形卷积采用间接监督的方式预测offset map不同,GFA模块采用直接监督的方式预测offset map,可以更加高效地指导网络学习关键点的几何结构。
GFA模块的示意图如
具体地,对于输入feature map的每个位置,通过可变形卷积(
式中:
2.5 关键点匹配方法
为了获得脊柱关键点的精确坐标,对于输入的一张侧面脊柱图片,同时预测关键点热图和关键点匹配线索。对于关键点热图,利用非极大值抑制(NMS)方法获得若干候选关键点构成的集合,
对于椎骨中心热图和关键点offset,首先使用NMS获得17个预测的椎骨中心坐标,然后将每个预测的椎骨中心坐标与关键点offset相加获得每节椎骨上数量为
在获得候选关键点集合
2.6 损失函数
所提损失函数分为两部分:offset损失函数和热图损失函数。使用L1损失函数监督offset;为了缓解关键点热图和椎骨中心热图中正负样本不平衡问题,使用加权损失函数监督训练关键点热图和椎骨中心热图,加权损失函数表示为
式中:
总损失为offset损失与热图损失之和:
式中,
3 数据集及评价指标
3.1 数据集
构建的新的侧面脊柱关键点检测数据集包含328例侧面脊柱X线片图像,该数据集的图像及标注如
实验过程中,使用60%的图像作为训练集,20%的图像作为验证集,20%的图像作为测试集。
3.2 实验设置
实验均使用Ubuntu20.04平台和一张NVIDIA 3090 GPU完成。Backbone网络为ResNet34和FPN,ResNet34使用ImageNet[16
]数据集预训练,其他网络权重均使用标准高斯分布初始化。训练时输入图像均缩放到1024 pixel
3.3 评价指标
为了评估脊柱关键点检测的精度,将平均检测误差Edec[9]、归一化的平均绝对误差(Scaled MAE)[17]和均方误差(MSE)[7]作为评价指标,具体计算公式为
式中:
为了评估TK和LL的精度,将对称平均绝对误差(SMAPE)[18]作为评价指标,表示为
式中:
4 分析与讨论
4.1 对比实验
为了验证所提方法的性能,与目前先进的两阶段脊柱关键点检测方法进行了对比实验。由于棘突与邻近的椎骨较为靠近,椎骨边界框很难将其包含在内,为了公平起见,仅比较每节椎骨上除棘突外其余8个关键点的检测精度。
从
表 1. 所提方法与两阶段方法对比实验结果
Table 1. Comparative experiment results between two-stage methods and the proposed method
|
对于单阶段方法,对比了包括棘突在内的9个关键点的检测效果,实验结果如
表 2. 所提方法与单阶段方法对比实验结果
Table 2. Comparative experiment results between one-stage methods and the proposed method
|
图 4. 与其他单阶段脊柱关键点检测方法的对比结果。(a)输入图像;(b)Zhang等[13]方法检测结果;(c)Ao等[11] 方法检测结果;(d)Yi等[9] 方法检测结果;(e)所提方法检测结果
Fig. 4. Comparison results between other single-stage methods and proposed method. (a) Input image; (b) results by Zhang et al.[13] proposed method; (c) results by Ao et al.[11] proposed method; (d) results by Yi et al.[9] proposed method; (e) results by our method
为了验证所提方法在侧面参数评估中的效果,还比较了所提方法与其他先进方法在TK和LL估计中的精度。评价指标为SMAPE,值越小表示性能越好。其中TK和LL均使用预测的脊柱关键点(上下端板端点)计算得到。实验结果如
表 3. 所提方法与其他先进方法在TK和LL估计中的SMAPE对比结果
Table 3. Comparison results of SMAPE between the proposed method with other advanced methods in TK and LL estimation
|
4.2 消融实验
为了验证所提方法的有效性,进行了消融实验,评价指标为Edec。实验结果如
表 4. 所提方法的消融实验结果
Table 4. Ablation experiment results of the proposed method
|
从
图 5. 消融实验结果。(a)基线;(b)使用加权损失函数;(c)使用加权损失函数和GFA模块;
Fig. 5. Ablation experiment results. (a) Baseline; (b) with weighted loss; (c) with weighted loss and GFA module
为了比较所提GFA模块与以往的可变形卷积的性能,进行了一组对比实验。实验结果如
表 5. 所提GFA模块与可变形卷积的对比结果
Table 5. Comparison results between proposed GFA module with deformable convolution
|
为了验证匹配线索的作用,对比了使用匹配线索和不使用匹配线索的检测效果。实验结果如
表 6. 所提关键点匹配方法的有效性
Table 6. Validity of landmark matching method
|
5 结论
在侧面脊柱关键点检测中,针对以往热图回归方法中存在的匹配错误问题,提出了基于匹配线索回归的方法。该方法在预测关键点热图的同时,通过预测椎骨中心热图和关键点offset为关键点提供匹配线索,从而大大降低了匹配错误。为了缓解遮挡对于椎骨中心预测的影响,获得更好的匹配效果,使用GFA模块采样关键点特征增强椎骨中心的特征表达;利用加权损失函数缓解关键点热图和椎骨中心热图中正负样本不平衡问题。实验结果显示利用关键点特征可以提高椎骨中心热图的预测质量,采用直接监督的方式可以更加高效地学习关键点的几何结构。最终所提方法在侧面脊柱关键点检测中取得了较好的检测精度和鲁棒性,并在侧面临床参数估计中取得良好表现。然而,所提方法还存在一定的不足,如,当某节椎骨被完全遮挡或连续几节椎骨都被遮挡时,椎骨中心仍然会出现较大偏差导致关键点匹配错误。因此,解决大面积遮挡问题将是未来工作的重点。
[1] Zhang K L, Xu N F, Guo C Y, et al. MPF-net: an effective framework for automated Cobb angle estimation[J]. Medical Image Analysis, 2022, 75: 102277.
[2] Vrtovec T, Pernuš F, Likar B. A review of methods for quantitative evaluation of spinal curvature[J]. European Spine Journal, 2009, 18(5): 593-607.
[3] YangG S, FuX L, XuN F, et al. A landmark estimation and correction network for automated measurement of sagittal spinal parameters[M]//Yang H, Pasupa K, Leung A C S, et al. Neural information processing. Communications in computer and information science. Cham: Springer, 2020, 1332: 213-221.
[4] KhanalB, DahalL, AdhikariP, et al. Automatic Cobb angle detection using vertebra detector and vertebra corners regression[M]//Cai Y, Wang L, Audette M, et al. Computational methods and clinical applications for spine imaging. Lecture notes in computer science. Cham: Springer, 2020, 11963: 81-87.
[5] ZhangK L, XuN F, YangG S, et al. An automated Cobb angle estimation method using convolutional neural network with area limitation[M]//Shen D, Liu T, Peters T M, et al. Medical image computing and computer-assisted intervention-MICCAI 2019. Lecture notes in computer science. Cham: Springer, 2019, 11769: 775-783.
[6] ChenK L, PengC, LiY, et al. Accurate automated keypoint detections for spinal curvature estimation[M]//Cai Y, Wang L, Audette M, et al. Computational methods and clinical applications for spine imaging. Lecture notes in computer science. Cham: Springer, 2020, 11963: 63-68.
[7] WuH B, BaileyC, RasoulinejadP, et al. Automatic landmark estimation for adolescent idiopathic scoliosis assessment using BoostNet[M]//Descoteaux M, Maier-Hein L, Franz A, et al. Medical image computing and computer-assisted intervention-MICCAI 2017. Lecture notes in computer science. Cham: Springer, 2017, 10433: 127-135.
[8] SunH L, ZhenX T, BaileyC, et al. Direct estimation of spinal Cobb angles by structured multi-output regression[M]//Niethammer M, Styner M, Aylward S, et al. Information processing in medical imaging. Lecture notes in computer science. Cham: Springer, 2017, 10265: 529-540.
[9] YiJ R, WuP X, HuangQ Y, et al. Vertebra-focused landmark detection for scoliosis assessment[C]∥2020 IEEE 17th International Symposium on Biomedical Imaging (ISBI), April 3-7, 2020, Iowa City, IA, USA. New York: IEEE Press, 2020: 736-740.
[10] GuoY, LiY M, ZhouX W, et al. A keypoint transformer to discover spine structure for Cobb angle estimation[C]∥2021 IEEE International Conference on Multimedia and Expo (ICME), July 5-9, 2021, Shenzhen, China. New York: IEEE Press, 2021.
[11] Ao Y Y, Wu H. Feature aggregation and refinement network for 2D anatomical landmark detection[J]. Journal of Digital Imaging, 2023, 36(2): 547-561.
[12] ReddyP K, KanakatteA, GubbiJ, et al. Anatomical landmark detection using deep appearance-context network[C]∥2021 43rd Annual International Conference of the IEEE Engineering in Medicine & Biology Society (EMBC), November 1-5, 2021, Mexico. New York: IEEE Press, 2021: 3569-3572.
[13] Zhang C, Wang J, He J, et al. Automated vertebral landmarks and spinal curvature estimation using non-directional part affinity fields[J]. Neurocomputing, 2021, 438: 280-289.
[14] WangJ S, MaY C, HuangS F, et al. A keypoint-based global association network for lane detection[C]∥2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), June 18-24, 2022, New Orleans, LA, USA. New York: IEEE Press, 2022: 1382-1391.
[15] DaiJ F, QiH Z, XiongY W, et al. Deformable convolutional networks[C]∥2017 IEEE International Conference on Computer Vision (ICCV), October 22-29, 2017, Venice, Italy. New York: IEEE Press, 2017: 764-773.
[16] Russakovsky O, Deng J, Su H, et al. ImageNet large scale visual recognition challenge[J]. International Journal of Computer Vision, 2015, 115(3): 211-252.
[17] Wu H B, Bailey C, Rasoulinejad P, et al. Automated comprehensive Adolescent Idiopathic Scoliosis assessment using MVC-Net[J]. Medical Image Analysis, 2018, 48: 1-11.
[18] Wang L S, Xie C, Lin Y, et al. Evaluation and comparison of accurate automated spinal curvature estimation algorithms with spinal anterior-posterior X-Ray images: the AASCE2019 challenge[J]. Medical Image Analysis, 2021, 72: 102115.
Article Outline
高孟豪, 郭立君, 张荣, 倪丽欣, 王强, 何秀超. 基于匹配线索回归的侧面脊柱关键点检测[J]. 激光与光电子学进展, 2024, 61(4): 0417001. Menghao Gao, Lijun Guo, Rong Zhang, Lixin Ni, Qiang Wang, Xiuchao He. Lateral Spine Landmark Detection Based on Matching Clue Regression[J]. Laser & Optoelectronics Progress, 2024, 61(4): 0417001.