多标记胸片分类的关系学习视角
重磅干货,第一时间送达

小黑导读
论文是学术研究的精华和未来发展的明灯。小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容。个人能力有限,理解难免出现偏差,建议对文章内容感兴趣的读者,一定要下载原文,了解具体内容。


摘要
胸部x线图像的多标签分类通常使用判别方法,即学习将图像直接映射到其二进制标签。这些方法使得添加辅助信息(如注释的不确定性或标签之间的依赖性)具有挑战性。为此,作者提出了一种新的多标签分类的知识图谱重建方法,它不仅可以提高编码器的预测性能,而且可以作为引入新的领域知识的一般框架。
具体来说,作者从胸部x射线图像及其标签中构造出多模态知识图谱,并将多标签分类作为链接预测问题。合并辅助信息可以简单地通过添加额外的节点和它们之间的关系来实现。当在一个公开可用的x线照片数据集(CheXpert)上进行测试时,作者使用朴素知识图进行的关系重构优于最先进的方法,实现了83.5%的roc下面积曲线,与纯判别方法相比,改善了1%的roc值。

具体来说,作者将关系机器学习领域与多标签分类相结合,做出了三个关键贡献:
作者将多标签CXR分类重新表述为放射知识图中的链接预测问题。
作者表明,在CheXpert[1]上测试时,作者的重新配方产生了83.5%的roc下面积曲线,而与之前的最先进的[5]的83.2%相比。不像[5],这没有包含任何标签依赖。
作者通过包括额外的信息来证明作者的KG表示的灵活性:(a) ground truth注释中的不确定标签和(b) CXR发现之间的依赖性。

框架结构

由于大规模的CXR数据集[1,2],人们提出了许多基于深度学习的方法来解决多标签CXR分类问题。文献中提出的两种主要的解决方案包括:(1)特别的二进制多标签分类[3,4]和(2)利用基于标签依赖的分类[5,6,7]。后者的方法很有趣,因为除了图像到标签的映射之外,他们还致力于开发领域知识。yao等人[7]提出了一种基于递归神经网络的解码器来学习标签之间的相互依赖性。Pham等构建了一个标签树,提出了一种分层学习训练机制,对叶节点进行分类,然后是非叶节点进行分类,相当于条件训练。Chen等人,另一方面,提出利用标签共现。一种基于标签共现的图被用来丰富由单纯卷积神经网络(CNN)对图像进行处理学习到的特征表示。

实验结果

作者使用ROC曲线下面积(AUC)作为评价分类性能的指标
作者所有的实验都是在上述三种随机数据折叠上进行评估的,并报告其平均值。作者不报告标准偏差,因为它在所有情况下都小于0.1%。与之前的工作类似,作者进行了两组实验:第一,作者将不确定的标签视为积极的,第二,作为消极的。作者将作者的方法与之前的两个作品[1]和[5]进行比较,前者使用一个典型的CNN,后者使用一个CNN,其特征增强了使用图卷积网络从疾病共发图学习到的疾病特征。

结论
在这项工作中,作者提出了一个基于关系学习的多标签CXR分类的重新制定。以cxr和“发现”为实体构造的知识图形成了作者方法的核心。然后,作者提出分类作为链接预测问题在这个KG。作者在公开可用的CXR数据集上展示了所提方法的优越性能,实现了83.5%的AUC,优于最先进的方法。
论文链接:https://arxiv.org/pdf/2103.06220.pdf
每日坚持论文分享不易,如果喜欢我们的内容,希望可以推荐或者转发给周围的同学。
- END -