> 硕士毕业论文 > 42500字硕士毕业论文基于Adaboost分类学习的医学图像检索

42500字硕士毕业论文基于Adaboost分类学习的医学图像检索

论文类型:硕士毕业论文
论文字数:42500字
论点:图像,检索,肿瘤
论文概述:

本文使用LIDC图像库建立了包含876个肺部肿瘤图像(ROI)的实验图像库,针对病变肿瘤图像的特点,提取了包括大小、灰度、纹理、形状等67维的图像特。然后使用这些图像特征设计了一个基于Adaboos

论文正文:

介绍

1.1图像检索的研究背景

近20年来,基于内容的视觉图像检索(cbvir)或基于内容的图像检索(cbir)一直是计算机视觉领域最热门的研究方向。随着互联网和多媒体技术的快速发展,视频图像呈现爆炸式增长趋势。随着海量存储设备和数字设备的普及,许多海量存储数据库系统应运而生。这些存储系统在数据库系统中存储大量数据,如声音、图像和视频,使现代社会过去拥有非常丰富的信息资源。然而,大多数数据库系统不能有效和高效地管理和应用这些数据信息,不能在需要时快速找到相关数据信息,并且大量信息被淹没在数据库中。因此,如何快速准确地从大量图像中查询相关图像成为当前的研究热点之一。传统的检索技术大多基于文本的精确匹配检索模式。在检索之前,数据库中的所有图像都被有效地解释并标记有关键字。在查询过程中,根据查询图像的关键词搜索相关图像。

该方法在检索数据量小的图像时相对直接有效。然而,随着数据库的爆炸式增长,许多大型数据库中传统的基于文本的检索越来越不能满足图像检索发展的要求。这种检索技术不仅耗时费力,主观性强,而且有时很难用几个关键词反映图像中丰富的视觉内容。为了克服传统基于文本的图像检索技术的缺陷,有效地管理和查询图像,人们一直致力于一种新的图像检索技术的研究。基于内容的图像检索(CBIR)应运而生。在CBIR系统中,各种图像处理技术被用来提取一系列潜在的视觉特征,例如灰度、纹理、形状等。在图像中形成高维特征向量,通过相似性度量实现目标图像的检索。然而,图像的潜在视觉特征和高级语义概念之间存在巨大的差距。同时,用户感知的主观性和图像内容的多样性也难以解决。这是图像检索研究领域中最大的问题。CBIR的快速发展必将推动与CBIR相关的许多领域的技术发展,如特征提取、相关反馈、图像相似性度量和数据库。它在医学领域的成功应用将对临床诊断、治疗研究、医学交流和医学教育产生重大而深远的影响。因此,如何利用CBIR技术和医学知识的结合来实现疾病诊断的智能化是当前医学研究领域的一个重大问题。

1.2研究在医学领域的意义

在医学领域,大型医院每天产生大量包含患者病理特征和解剖信息的医学图像。2009年,日内瓦大学附属医院放射科每天制作114 000多幅图像,而2002年每天制作12 000幅图像。截至2009年(1),凯泽永久(Kaiser Permanente)等一些医院管理机构已经存储了超过700TB的图像数据,而维也纳大学医院等一些大型医院每天可以产生100GB的医学图像。从这些医学图像中,医生可以很好地总结出许多病变的规律和表现。医生进行计算机辅助疾病诊断是计算机断层扫描(CT),即电子计算机x光断层扫描技术。根据人体不同组织对x光的不同吸收率和通过率,它使用精确准直的x光光束和灵敏度极高的探测器来扫描人体某一部分周围的一个又一个截面。在每次扫描过程中,探测器在穿过人体后接收衰减的x光信息。然后通过快速模数转换器将模拟量转换成数字量,然后将模拟量输入到电子计算机。经电子计算机高速计算后,得到该层上各点的x光吸收系数值,并利用这些数据形成图像矩阵。然后通过图像显示器以不同的灰度级显示不同的数据,使得切片的解剖结构可以清晰地显示在监视器上,并且图像也可以通过多个相机或激光相机记录在照片上。肺的CT断层图像可以被看作是根据一定的层厚将肺切割成许多切片,并且每个切片形成一个CT图像。仔细观察人体被检查部位的断层图像或立体图像可以发现任何部位的小病变。肺癌影像数据库联合体(LIDC)是由NCI国家癌症研究所建立的肺部CT影像数据库,用于开发、研究和评价使用螺旋CT进行肺癌评估和诊断的计算机辅助诊断方法。在此数据库的基础上,不同的研究者可以比较肺癌的计算机辅助评估诊断性能及其临床应用诊断价值。目前,它的应用越来越广泛。目前,LIDC数据库已经完成,包括1010例的100多万个断层图像(扫描层厚度为1.25毫米-3毫米,512像素*512像素)。每个病例都包括一个文件夹,其中包含100-200张全肺的医学图像(DICOM-formated CT tomography)和一个包含四位医学专家的诊断结果作为“金标准”的XML格式注释文件。在注释文件中,四位医学专家对每一张CT片中出现的结节进行了评论,包括肺结节的主要病理特征、结节位置、边缘轮廓等。

2.1 XML标记文件信息

XML是一种可扩展标记语言,它是一种独立于平台的表示数据的方法。简而言之,使用XML创建的数据可以被任何平台上的任何应用程序读取。您甚至可以通过手动编码来编辑和创建XML文档。一方面,XML被设计用来存储数据和交换。XML看起来非常像超文本标记语言,它由标签、属性和值组成。然而,XML不是用来显示信息的,而是用来存储和携带信息的。另一方面,XML可以很容易地扩展和修改。您使用XML设计自己的自定义标记语言,然后使用这些语言来描述您的信息。任何系统都可以通过一个XML解析器读取XML数据,因此它的数据可以无处不在,而不用担心系统不支持的问题。XML语法很简单,可以被所有机器解释,并且可以在各种平台上使用,这使得XML成为一个潜在的通用标记。

2.2医疗监控标准介绍

医学中的数字成像和通信(DICOM)标准最初是由美国放射学会(ACR)和NEMA(国家电气制造商协会)组成的联合委员会于1983年起草的,此后逐渐发展成为医学数字图像和相关信息的传输标准。DICOM标准指出了硬件接口、最小软件命令集和由不同供应商实施的数据格式的一致性集。DICOM标准的引入和实施极大地简化了医学图像信息交换的实现,促进了远程医疗系统、图像管理和通信系统(PACS)的研发。由于医学数据交换系统的开放性和互连性,与其他医疗应用系统(医院信息系统、RIS等)的集成。)是可能的。

介绍

1.1图像检索的研究背景……1

1.2研究在医学领域的意义……1

1.3国内外研究现状3

1.4医学领域国内外研究现状……4

1.5本文的研究背景................................4

1.6第六条的主要研究内容和组织安排

2LIDC图像库介绍及肿瘤感兴趣区域的提取9

2.1 XML标记文件信息……9

2.2医学中的DICOM标准介绍………………………………17

2.3肿瘤感兴趣区域图像提取……19

摘要

CBIR的主要目标之一是弥合人类感知和计算机之间的语义鸿沟。例如,由于医学图像的特殊性和医学图像解释中放射科医师的主观性,LIDC数据库中的四个专家注释并不完全相同,图像的低级视觉特征和高级语义概念之间存在巨大差距。这给CBIR系统在医学领域的应用带来了很大的困难。针对肺部肿瘤图像难以解释的问题,利用LIDC图像库建立了包含876幅肺部肿瘤图像的实验图像库。根据病理肿瘤图像的特点,提取了包括大小、灰度、纹理和形状在内的67维图像特征。然后,利用这些图像特征设计了一个基于Adaboost特征选择的医学图像检索系统。该系统根据肺部肿瘤的恶性程度对其进行分类,并使用阿达波斯算法设计了一个强分类器。在检索过程中,用户可以对图像中的可疑肿瘤区域进行标记,然后将提取的特征输入到强分类器中,首先进行分类,然后根据相似性进行检索。平均准确率为0.755。验证了Boosting算法在图像检索系统应用中的可行性和有效性。

实验中也有许多不足之处。主要问题是肿瘤感兴趣区域的图像提取方法有待改进,肿瘤图像预处理不够准确。实验发现,专家标记的肿瘤轮廓具有主观性,与实际肿瘤轮廓存在误差。图像特征的选择不足以完全描述肿瘤的详细特征。LIDC数据库是一个三维断层扫描图像。200幅图像,每个肿瘤仅由中间的二维图像表示。没有任何三维特征,将会有大量的信息丢失。我们还将考虑以下几个方面:①对于三维断层图像,提取一些三维图像特征,包括三维形状特征、三维灰度分布等。,以确保图像特征的准确性。(2)针对LIDC数据库中“一图多注”的现象,很难确定肿瘤边界。在下一步中,可以尝试肿瘤R0I边界的自动或半自动提取。

参考

[1]北方,凯撒永久公司。\"自我管理计划对慢性病患者的影响。\"有效临床实践4.6 (2001): 256-262

[2]麦克尼特-格雷,迈克尔·福”等。一种模式http://sblunwen.com/yxyxx/分类方法,用于描述高分辨率CT成像的孤立肺结节:初步结果。1医学物理学26 (1999): 880。

基于共生矩阵的纹理参数对计算机断层成像孤立肺结节分类的影响计算机医学成像和图形23.6 (1999): 339-348。

[4]罗世忠等,“诊断性CT中肺结节的分类:基于三维血管特征、结节密度分布和形状特征的方法”SPIE会议录。第5032卷。2003.

[5]Mtller,Henning,等,“医学图像检索系统的评估轴:图像线索体验”第十三届美国计算机学会多媒体国际年会论文集。ACM,2005年。

郭阎正,岳建华。基于内容的医学图像检索[。医疗设备信息,2006,21(1):34-36,45。

李典赞。图像检索技术在医学图像数据库中的应用研究。重庆:重庆大学软件学院,2004。

[8]塔格雷、赫曼特、卡尔·贾菲和詹姆斯·邓肯。“医学图像数据库基于内容的检索方法。1美国医学信息学协会杂志4.3 (1997): 184-198。

[9]楚,卫斯理?阿方索·卡德纳斯5和里基·泰拉。\" KMeD:一个基于知识的多媒体医学分布式数据库系统.\"信息系统20.2 (1995): 75-96。

[10]米勒,亨宁等,“医学图像检索系统评估的参考数据集”计算机化医学成像和图形28.6 (2004): 295-306。