机器学习在器官定位方面的应用

来源:互联网 发布:不敢给客服打电话 知乎 编辑:程序博客网 时间:2024/05/22 06:48

    随着计算机计算能力的增强和大批量医学图像的涌现,机器学习技术在医学图像处理领域的应用已获得越来越多的关注。其思想是通过计算机对大批量训练数据的统计学习,来预测新的待处理图像的相关信息。关于统计学习,推荐一本斯坦福的Hastie在2009年写的书: The Elements of Statistical Learning: Data Mining, Inference and Prediction (pdf)

统计学习的基本模型

    统计学习的主要目标是对一个输出变量y对输入变量x的依赖进行建模。这种依赖关系可以定义为一个后验概率分布p(y|x),该分布可以用来预测一个样本x所对应的输出y。例如在图像分割方面,x可以是一个像素点岁对应的特征向量,而y则是其类别标号(目标器官或者背景)。对p(y|x)的建模有两种方式,一种是学习x与y的联合分布p(x,y),称之为产生式模型(generative model), 一种是直接学习这个条件概率p(y|x),称之为判别模型(discriminative model)。有些研究者发现随着样本容量的增大,产生式模型有一些优点,但在大多数的应用中,判别模型还是应用得更广泛,主要是因为数据的实际分布很难估计。

分类问题与回归问题

    如果y对应于一个离散变量,该问题就是一个分类问题,例如y=1代表x属于目标器官而y=0代表背景。如果y对应一个连续变量,则该问题就是一个回归问题。例如在目标器官定位中,y可以是一个器官的位置。在图像处理中,基于分类的方法通常利用图像的局部环境(local context), 因此需要对图像进行穷尽的扫描。通常回归问题依赖图像的全局环境(global context),可以更加快速,但同时精度也会降低一些。

    目标器官的定位既可以使用分类的方法,也可以使用回归的方法。根据不同的尺度可分为两种:基于标记点检测的方法和发现感兴趣区域的方法。

标记点检测

    标记点检测通常用作定位某个器官的预处理步骤。标记点是指那些在解剖结构上比较特殊的点,例如右肺的最顶部。一个器官及其周围有很多标记点,这些标记点可以一个一个地独立检测,也可以利用它们的空间位置关系,例如使用多变量的高斯模型(西门子的詹翊强等2008年的文章[2]),或者图形模型(graphical model)(Seifert等2009年的文章[3])。也可将检测任务分解为若干子模块以减少搜索范围。上述方法在肺部、肾脏的定位中取得了不错的效果,这些基于标记点检测的方法通常在精度和速度方面(甚至可达到或低于1秒)都很高,但是面临的一个问题是:标记点的可靠性可能难以保证。对于骨骼等组织标记点可能很明显,但是对肝脏等软组织,发现可靠的标记点则很有难度。鉴于这个问题,另外一种定位目标器官的方法使用了感兴趣区域的检测。

感兴趣区域检测

    感兴趣区域通常是包含目标器官的一个边界框(bounding box),如果使用分类的方法来处理,就使用一个分类器对不同的图像区域进行分类,看该区域是否包含目标器官,以寻找最好的边界框。例如西门子的Lu Chao,郑冶枫 [4] 就使用了这种方法。回归的方法也可以用来处理这个问题,微软剑桥研究院的Criminisi [5]提出基于随机森林(random forest)的回归方法来定位多个器官,该方法对一个目标器官的边界框的六个变量进行回归(上下左右前后)。这个方法在精度与速度(可能要几秒)方面寻求了一种平衡,但是它容容易实现(有许多随机森林的开源代码)。

参考文章:

[1]  Gauriau, Romane, et al. "Multi-organ localization with cascaded global-to-local regression and shape prior."Medical image analysis. 2015.

[2]  Zhan, Yiqiang, et al. "Active scheduling of organ detection and segmentation in whole-body medical images."MICCAI 2008.

[3]  Seifert, Sascha, et al. "Hierarchical parsing and semantic navigation of full body CT data."SPIE medical imaging. International Society for Optics and Photonics, 2009.

[4] Lu, Chao, et al. "Precise segmentation of multiple organs in CT volumes using learning-based approach and information theory."MICCAI 2012.

[5] Criminisi, Antonio, et al. "Regression forests for efficient anatomy detection and localization in CT studies."Medical Computer Vision. Recognition Techniques and Applications in Medical Imaging.  2011.

   

0 0