机器学习在器官定位方面的应用

来源：互联网发布：不敢给客服打电话知乎编辑：程序博客网时间：2024/05/22 06:48

随着计算机计算能力的增强和大批量医学图像的涌现，机器学习技术在医学图像处理领域的应用已获得越来越多的关注。其思想是通过计算机对大批量训练数据的统计学习，来预测新的待处理图像的相关信息。关于统计学习，推荐一本斯坦福的Hastie在2009年写的书: The Elements of Statistical Learning: Data Mining, Inference and Prediction (pdf)

统计学习的基本模型

统计学习的主要目标是对一个输出变量y对输入变量x的依赖进行建模。这种依赖关系可以定义为一个后验概率分布p(y|x),该分布可以用来预测一个样本x所对应的输出y。例如在图像分割方面，x可以是一个像素点岁对应的特征向量，而y则是其类别标号（目标器官或者背景）。对p(y|x)的建模有两种方式，一种是学习x与y的联合分布p(x,y)，称之为产生式模型（generative model），一种是直接学习这个条件概率p(y|x)，称之为判别模型（discriminative model）。有些研究者发现随着样本容量的增大，产生式模型有一些优点，但在大多数的应用中，判别模型还是应用得更广泛，主要是因为数据的实际分布很难估计。

分类问题与回归问题

如果y对应于一个离散变量，该问题就是一个分类问题，例如y=1代表x属于目标器官而y=0代表背景。如果y对应一个连续变量，则该问题就是一个回归问题。例如在目标器官定位中，y可以是一个器官的位置。在图像处理中，基于分类的方法通常利用图像的局部环境（local context), 因此需要对图像进行穷尽的扫描。通常回归问题依赖图像的全局环境（global context），可以更加快速，但同时精度也会降低一些。

目标器官的定位既可以使用分类的方法，也可以使用回归的方法。根据不同的尺度可分为两种：基于标记点检测的方法和发现感兴趣区域的方法。

标记点检测

标记点检测通常用作定位某个器官的预处理步骤。标记点是指那些在解剖结构上比较特殊的点，例如右肺的最顶部。一个器官及其周围有很多标记点，这些标记点可以一个一个地独立检测，也可以利用它们的空间位置关系，例如使用多变量的高斯模型（西门子的詹翊强等2008年的文章[2]），或者图形模型（graphical model）（Seifert等2009年的文章[3]）。也可将检测任务分解为若干子模块以减少搜索范围。上述方法在肺部、肾脏的定位中取得了不错的效果，这些基于标记点检测的方法通常在精度和速度方面（甚至可达到或低于1秒）都很高，但是面临的一个问题是：标记点的可靠性可能难以保证。对于骨骼等组织标记点可能很明显，但是对肝脏等软组织，发现可靠的标记点则很有难度。鉴于这个问题，另外一种定位目标器官的方法使用了感兴趣区域的检测。

感兴趣区域检测

感兴趣区域通常是包含目标器官的一个边界框（bounding box），如果使用分类的方法来处理，就使用一个分类器对不同的图像区域进行分类，看该区域是否包含目标器官，以寻找最好的边界框。例如西门子的Lu Chao，郑冶枫 [4] 就使用了这种方法。回归的方法也可以用来处理这个问题，微软剑桥研究院的Criminisi [5]提出基于随机森林（random forest）的回归方法来定位多个器官，该方法对一个目标器官的边界框的六个变量进行回归（上下左右前后）。这个方法在精度与速度（可能要几秒）方面寻求了一种平衡，但是它容容易实现（有许多随机森林的开源代码）。

参考文章：

[1] Gauriau, Romane, et al. "Multi-organ localization with cascaded global-to-local regression and shape prior."Medical image analysis. 2015.

[2] Zhan, Yiqiang, et al. "Active scheduling of organ detection and segmentation in whole-body medical images."MICCAI 2008.

[3] Seifert, Sascha, et al. "Hierarchical parsing and semantic navigation of full body CT data."SPIE medical imaging. International Society for Optics and Photonics, 2009.

[4] Lu, Chao, et al. "Precise segmentation of multiple organs in CT volumes using learning-based approach and information theory."MICCAI 2012.

[5] Criminisi, Antonio, et al. "Regression forests for efficient anatomy detection and localization in CT studies."Medical Computer Vision. Recognition Techniques and Applications in Medical Imaging. 2011.

0 0