美章网 精品范文 图像分析论文范文

图像分析论文范文

图像分析论文

图像分析论文范文第1篇

配合重要新闻播出的口播评论:这是最早出现的一种口播评论形式。多数不署名,即以本台的名义阐述对有关事物的看法和见解;一般配合当天某一重要新闻播发,没有固定播出周期;篇幅短小,议论力求集中、切中要害。初期多数是按照报刊评论的模式撰写的,以“短评”或“编后语”的名目播出。以后逐渐注意体现电视的传播特点,有时插播与内容相关的图片,日渐重视语言的规范化、通俗化、口语化;同时播音员也越来越注意利用出图像的条件,调动表情、动作等非语言符号强化表达效果。这种配合新闻播出的口播评论,无论对于观众理解重要新闻还是及时引导社会舆论、指导社会实践仍然具有图像评论不可取代的存在价值和社会意义。

常设栏目播出的口播评论:中央电视台《东方时空·面对面》,开了这种口播评论的先河,并把它定位为“纯谈话类”栏目。这个栏目每天播出一个话题,题材多为观众关注的社会现象、社会问题,多数运用夹叙夹议的表现方法,具有相当鲜明的谈话特点。在《东方时空》的影响和带动下,不少省市的电视台都相继开办了类似的口播评论栏目。下面的例子来自重庆电视台的《记者观察》,是围绕着“明星该不该做广告”而展开议论的。评论者由此提出:明星屡屡参与做虚假广告,大肆坑害消费者,除开他们的道德和法制意识存在严重的缺陷外,问题到底出在谁身上?请看评论者是如何进行生动而犀利的评论的:

明星能不能给药品做广告?这个问题的提出,是因为近年来明星广告激增,而老百姓对他们的夸张、不实之词和误导多有怨言的缘故。药品和食品都不是闹着玩的,吃错了会出人命。即使吃不死,也没有人愿意白花钱吃没用的东西。可是这玩艺儿被明星现身说法一吹,大家就难免上当,上当的次数多了,就要骂明星缺德坑人。有些明星异口同声在广告上说,服了一种药之后、“腰不酸了,背不疼了,腿也不抽筋了”。是不是这么“神”?人们上当过后,又回过味儿来,就怀疑那些明星是不是真的吃过这种药——难道那么巧,他们一个个都曾不约而同地腰酸、背疼、腿抽筋来着?有的受害者还把明星告上法庭,说他们有意弄虚作假,利用自己的知名度和影响骗人——官司自然都不了了之。

评论者紧接着指出:明星们之所以肆无忌惮地以假患者的身份出现在广告上,与商家一道疯狂行骗,其根本原因是尚无一部能管住明星胡作非为的法规出台。然后,继续评论道:

其实人们在这个问题上不应该一味将矛头对着明星。广告总是要人去做的,明星和非明星都有权利受雇做广告。赵本山说:“明星为企业做广告是应该的。药品毕竟是为病人治病的,不是,而且有国家颁发的产品合格证,为什么不能做?”不无道理。但是问题在于,你没有病,你凭什么、又有什么资格以“患者”的身份来“证明”一种药的疗效?更严重的问题在于,劣质的产品、虚假的广告内容以及明星建立在虚假之上的夸张煽情表演,不但坑害了消费者,而且毒化了社会风气。所以,在产品质量和广告内容的源头上把好关,明星们就是想钱想得发疯,赶着做广告,也危害不到老百姓。新的广告审查办法最关键的问题是,要从内容和形式上保证广告的“真”。

在这篇口播评论中,尽管不时有明星做虚假广告的画面出现,但是这些生动、具体的画面并没有喧宾夺主,更没有让人误以为这是图像评论,而始终将注意力集中到评论者,即播报者的口播评论的精彩评析上,尤其是论证者的声调和表情,情和理交融而产生的感染力和说服力。使这台口播评论充满了吸引受众的魅力。

图像评论的概念是相对于口播评论而言。与口播评论最显著的区别是:图像评论必须同时运用画面、声音和屏幕文字多种符号来表现评论的理性与情感。因此这种独特的电视评论形式有两个方面必须提请注意。这两个方面是:第一,图像评论以声画兼备、视听结合区别于口播评论。它虽然集中地体现了电视评论的基本特点,但不是电视评论的唯一形式,而是同口播评论并列的一类评论形式。明确这一点,防止把图像与电视评论等同起来,或者同口播评论对立起来,无论对于图像评论还是整个电视评论的健康发展,都是值得注意的问题。第二、图像评论作为一类电视评论的总称,既涵盖了已有的具体形式,也随时吸纳新的形式,是一个生生不息的开放性系统。虽然目前新闻述评和访谈式评论占居主导地位,但完全可以预料着实践、探索的深化,还将有新的形式出现,已有的形式也将有新的发展。

除此之外,还必须了解,图像评论的表现优势。图像评论除了形诸声音的论述语言以外,还可以调动画面、同期声、屏幕文字等为表现内容服务。符号及符号组合的多样性,给这类评论带来其他媒介的评论、电视播评论难以企及的表现优势。这种表现优势主要集中在两个方面:第一是画面的传真功能,使图像评论对于作为论据的新闻事实的“转述”,能够达到具体、形象、绘形绘色的境界,让人产生有如身临现场、直接面对客观事实的感受;这种以直接再现的方式提供的论据,无疑比任何语言、文字的的描述具有更强的实证性和雄辩的说服力。第二是多种符号的相互配合,既原原本本地把客观事物之“象”呈现于观众面前,又从中引出相应的看法和见解;这样融画面、声音和屏幕文字于一体,比单纯的语言、文字论述,更有利也更方便观众经由具体事物理解抽象内容。

在图像评论中,画面、论述语言、访问同期声、屏幕文字相互必须配合,才能收到强化评论说服力的良好效果,给群从众留下深刻的印象。运用图像的传真功能,使其再现新闻事实论据,从而有力地为评论的论点服务。在两者的关系构成当中,图像与评论间是以一种使人信服的逻辑推理作为关系构成的桥梁的。

在此例举《尊重农民,爱护农民》的几个片断;以帮助我们具体了解图像和评论之间是怎样建立起这种逻辑关系:

第一组:(画面):河南某县农业局办公室,几个机关干部模样的人正在喝茶、聊天,放肆地大笑,办公室角落,一个干部正在伸懒腰……

(解说词——论述语言):农村地域广大,农村的事情千头万绪,如果光坐在城里,是一定做不好农村工作的。现在一些地方决策之所以脱离实际,往往与我们的干部深入基层不够有关。

第二组:(画面):陕西某县农业局旁边,农业局下属的“股份有限公司”的招牌赫然;马路对面几幢醒目的建筑,一是局办的摩配市场,二是下属的一个很大的加油站……

(解说词——论述语言):农业是国民经济的基础,但是在一些干部的思想和实际工作中忽视农业的现象还比较普遍。要真正解决这个问题,还必须加深对农业重要性的认识。不能因为农产品出现了阶段性的供大于求,就以为我国农业已经过关了。农业是关联全社会的产业,解决农业中的问题,光靠农业部门是远远不够的。各部门都要把支持农业作为自己义不容辞的责任,增强服务意识,采取切实措施,支持农业和农村的发展,农业的效益不仅体现在农民收入上,还体现在对整个国民经济发展的支撑上;不仅体现在经济效益上,还体现在社会效益上,不能因为农业的比较效益低,就忽视对农业的投入和支持。

第三组:(画面):安徽某县县政府大楼,几名县级领导干部正在制定本县农村经济发展“腾飞计划”,县中心广场上树立的巨幅标语牌上写着“上台阶争速度,一年建成小康县”的字样格外醒目……

(解说词——论述语言):当前要特别强调在干部中加强坚持实事求是的思想路线教育,坚决反对形式主义和虚报浮夸。这里有一个正确估计农村经济发展水平和农民富裕程度的问题。一些地方随意向基层下达各种“达标升级”任务,一些干部为了个人政绩,盲目上项目、铺摊子,造成乡村负债累累,农民负担沉重。这都与过高估计农村经济发展水平和农民富裕程度有关。要教育基层干部,既要对上负责,更要对下负责。即使是上级布置的任务,如果不符合当地农村实际,没有条件完成,也要主动向上反映,做到量力而行,珍惜民力。必须指出,农村基层干部作风中存在的许多问题,同上级机关的和形式主义有很大关系,有些就是上面逼出来的。领导机关和领导干部要结合贯彻落实六中全会决定,解决好自身存在的问题。上级部门在给基层布置任务时,一定要从农村实际出发,体谅基层的困难。要关心和爱护农村基层干部,为他们创造良好的工作条件,保护好他们的积极性。

由此可见,图像表现的效果优势是十分明显的。像这样恰当地运用图像符号,按照图像符号自身的表现功能和规律来突出这种优势,可以收到事半功倍的奇效。试看,第一组画面里,农业干部们的无所事事具有很强的讽刺意味;第二组画面里,农业局不重视农业、农村、农民,反映出一些农业部门的撒手放任,不仅服务意识缺乏,措施缺乏。第三组画面里,形式主义泛滥,反映出他们缺乏尊重农民,爱护农村的意识和感情。正是在充分发挥图像符号优势的基础上,评论才得以大显身手,使观众获得强烈的视听功能效果。

图像分析论文范文第2篇

论文摘要:随着医学成像和计算机辅助技术的发展,从二维医学图像到三维可视化技术成为研究的热点,本文介绍了医学图像处理技术的发展动态,对图像分割、纹理分析、图像配准和图像融合技术的现状及其发展进行了综述。在比较各种技术在相关领域中应用的基础上,提出了医学图像处理技术发展所面临的相关问题及其发展方向。

1.引言

近20多年来,医学影像已成为医学技术中发展最快的领域之一,其结果使临床医生对人体内部病变部位的观察更直接、更清晰,确诊率也更高。20世纪70年代初,X-CT的发明曾引发了医学影像领域的一场革命,与此同时,核磁共振成像象(MRI:MagneticResonanceImaging)、超声成像、数字射线照相术、发射型计算机成像和核素成像等也逐步发展。计算机和医学图像处理技术作为这些成像技术的发展基础,带动着现代医学诊断正产生着深刻的变革。各种新的医学成像方法的临床应用,使医学诊断和治疗技术取得了很大的进展,同时将各种成像技术得到的信息进行互补,也为临床诊断及生物医学研究提供了有力的科学依据。

在目前的影像医疗诊断中,主要是通过观察一组二维切片图象去发现病变体,往往需要借助医生的经验来判定。至于准确的确定病变体的空间位置、大小、几何形状及与周围生物组织的空间关系,仅通过观察二维切片图象是很难实现的。因此,利用计算机图象处理技术对二维切片图象进行分析和处理,实现对人体器官、软组织和病变体的分割提取、三维重建和三维显示,可以辅助医生对病变体及其它感兴趣的区域进行定性甚至定量的分析,可以大大提高医疗诊断的准确性和可靠性。此外,它在医疗教学、手术规划、手术仿真及各种医学研究中也能起重要的辅助作用。

本文对医学图像处理技术中的图像分割、纹理分析、图像配准和图像融合技术的现状及其发展进行了综述。

2.医学图像三维可视化技术

2.1三维可视化概述

医学图像的三维可视化的方法很多,但基本步骤大体相同,如图.。从#$/&’(或超声等成像系统获得二维断层图像,然后需要将图像格式(如0(#1&)转化成计算机方便处理的格式。通过二维滤波,减少图像的噪声影响,提高信噪比和消除图像的尾迹。采取图像插值方法,对医学关键部位进行各向同性处理,获得体数据。经过三维滤波后,不同组织器官需要进行分割和归类,对同一部位的不同图像进行配准和融合,以利于进一步对某感兴趣部位的操作。根据不同的三维可视化要求和系统平台的能力,选择不同的方法进行三维体绘制,实现三维重构。

2.2关键技术:

图像分割是三维重构的基础,分割效果直接影像三维重构的精确度。图像分割是将图像分割成有意义的子区域,由于医学图像的各区域没有清楚的边界,为了解决在医学图像分割中遇到不确定性的问题,引入模糊理论的模糊阀值、模糊边界和模糊聚类等概念。快速准确的分离出解剖结构和定位区域位置和形状,自动或半自动的图像分割方法是非常重要的。在实际应用中有聚类法、统计学模型、弹性模型、区域生长、神经网络等适用于医学图像分割的具体方法。

由于可以对同一部位用不同的成像仪器多次成像,或用同一台仪器多次成像,这样产生了多模态图像。多模态图像提供的信息经常相互覆盖和具有互补性,为了综合使用多种成像模式以提供更全面的信息,需要对各个模态的原始图像进行配准和数据融合,其整个过程称为数据整合。整合的第一步是将多个医学图像的信息转换到一个公共的坐标框架内的研究,使多幅图像在空间域中达到几何位置的完全对应,称为三维医学图像的配准问题。建立配准关系后,将多个图像的数据合成表示的过程,称为融合。在医学应用中,不同模态的图像还提供了不互相覆盖的结构互补信息,比如,当CT提供的是骨信息,MRI提供的关于软组织的信息,所以可以用逻辑运算的方法来实现它们图像的合成。

当分割归类或数据整合结束后,对体数据进行体绘制。体绘制一般分为直接体绘制和间接体绘制,由于三维医学图像数据量很大,采用直接体绘制方法,计算量过重,特别在远程应用和交互操作中,所以一般多采用间接体绘制。在图形工作站上可以进行直接体绘制,近来随着计算机硬件快速发展,新的算法,如三维纹理映射技术,考虑了计算机图形硬件的特定功能及体绘制过程中的各种优化方法,从而大大地提高了直接体绘制的速度。体绘制根据所用的投影算法不同加以分类,分为以对象空间为序的算法(又称为体素投影法)和以图像空间为序的算法!又称为光线投射法",一般来说,体素投影法绘制的速度比光线投射法快。由于三维医学图像的绘制目的在于看见内部组织的细节,真实感并不是最重要的,所以在医学应用中的绘制要突出特定诊断所需要的信息,而忽略无关信息。另外,高度的可交互性是三维医学图像绘制的另一个要求,即要求一些常见操作,如旋转,放大,移动,具有很好的实时性,或至少是在一个可以忍受的响应时间内完成。这意味着在医学图像绘制中,绘制时间短的可视化方法更为实用。

未来的三维可视化技术将与虚拟现实技术相结合,不仅仅是获得体数据的工具,更主要的是能创造一个虚拟环境。

3.医学图像分割

医学图像分割就是一个根据区域间的相似或不同把图像分割成若干区域的过程。目前,主要以各种细胞、组织与器官的图像作为处理的对象,图像分割技术主要基于以下几种理论方法。

3.1基于统计学的方法

统计方法是近年来比较流行的医学图像分割方法。从统计学出发的图像分割方法把图像中各个像素点的灰度值看作是具有一定概率分布的随机变量,观察到的图像是对实际物体做了某种变换并加入噪声的结果,因而要正确分割图像,从统计学的角度来看,就是要找出以最大的概率得到该图像的物体组合。用吉布斯(Gibbs)分布表示的Markov随机场(MRF)模型,能够简单地通过势能形式表示图像像素之间的相互关系,因此周刚慧等结合人脑MR图像的空间关系定义Markov随机场的能量形式,然后通过最大后验概率(MAP)方法估计Markov随机场的参数,并通过迭代方法求解。层次MRF采用基于直方图的DAEM算法估计标准有限正交混合(SFNM)参数的全局最优值,并基于MRF先验参数的实际意义,采用一种近似的方法来简化这些参数的估计。林亚忠等采用的混合金字塔Gibbs随机场模型,有效地解决了传统最大后验估计计算量庞大和Gibbs随机场模型参数无监督及估计难等问题,使分割结果更为可靠。

3.2基于模糊集理论的方法

医学图像一般较为复杂,有许多不确定性和不精确性,也即模糊性。所以有人将模糊理论引入到图像处理与分析中,其中包括用模糊理论来解决分割问题。基于模糊理论的图形分割方法包括模糊阈值分割方法、模糊聚类分割方法等。模糊阈值分割技术利用不同的S型隶属函数来定义模糊目标,通过优化过程最后选择一个具有最小不确定性的S函数,用该函数表示目标像素之间的关系。这种方法的难点在于隶属函数的选择。模糊C均值聚类分割方法通过优化表示图像像素点与C各类中心之间的相似性的目标函数来获得局部极大值,从而得到最优聚类。Venkateswarlu等[改进计算过程,提出了一种快速的聚类算法。

3.2.1基于模糊理论的方法

模糊分割技术是在模糊集合理论基础上发展起来的,它可以很好地处理MR图像内在的模糊性和不确定性,而且对噪声不敏感。模糊分割技术主要有模糊阈值、模糊聚类、模糊边缘检测等。在各种模糊分割技术中,近年来模糊聚类技术,特别是模糊C-均值(FCM)聚类技术的应用最为广泛。FCM是一种非监督模糊聚类后的标定过程,非常适合存在不确定性和模糊性特点的MR图像。然而,FCM算法本质上是一种局部搜索寻优技术,它的迭代过程采用爬山技术来寻找最优解,因此容易陷入局部极小值,而得不到全局最优解。近年来相继出现了许多改进的FCM分割算法,其中快速模糊分割(FFCM)是最近模糊分割的研究热点。FFCM算法对传统FCM算法的初始化进行了改进,用K-均值聚类的结果作为模糊聚类中心的初值,通过减少FCM的迭代次数来提高模糊聚类的速度。它实际上是两次寻优的迭代过程,首先由K-均值聚类得到聚类中心的次最优解,再由FCM进行模糊聚类,最终得到图像的最优模糊分割。

3.2.2基于神经网络的方法

按拓扑机构来分,神经网络技术可分为前向神经网络、反馈神经网络和自组织映射神经网络。目前已有各种类型的神经网络应用于医学图像分割,如江宝钏等利用MRI多回波性,采用有指导的BP神经网络作为分类器,对脑部MR图像进行自动分割。而Ahmed和Farag则是用自组织Kohenen网络对CT/MRI脑切片图像进行分割和标注,并将具有几何不变性的图像特征以模式的形式输入到Kohenen网络,进行无指导的体素聚类,以得到感兴趣区域。模糊神经网络(FNN)分割技术越来越多地得到学者们的青睐,黄永锋等提出了一种基于FNN的颅脑MRI半自动分割技术,仅对神经网络处理前和处理后的数据进行模糊化和去模糊化,其分割结果表明FNN分割技术的抗噪和抗模糊能力更强。

3.2.3基于小波分析的分割方法

小波变换是近年来得到广泛应用的一种数学工具,由于它具有良好的时一频局部化特征、尺度变化特征和方向特征,因此在图像处理上得到了广泛的应用。

小波变换和分析作为一种多尺度多通道分析工具,比较适合对图像进行多尺度的边缘检测,典型的有如Mallat小波模极大值边缘检测算法[6

3.3基于知识的方法

基于知识的分割方法主要包括两方面的内容:(1)知识的获取,即归纳提取相关知识,建立知识库;(2)知识的应用,即有效地利用知识实现图像的自动分割。其知识来源主要有:(1)临床知识,即某种疾病的症状及它们所处的位置;(2)解剖学知识,即某器官的解剖学和形态学信息,及其几何学与拓扑学的关系,这种知识通常用图谱表示;(3)成像知识,这类知识与成像方法和具体设备有关;(4)统计知识,如MI的质子密度(PD)、T1和T2统计数据。Costin等提出了一种基于知识的模糊分割技术,首先对图像进行模糊化处理,然后利用相应的知识对各组织进行模糊边缘检测。而谢逢等则提出了一种基于知识的人脑三维医学图像分割显示的方法。首先,以框架为主要表示方法,建立完整的人脑三维知识模型,包含脑组织几何形态、生理功能、图像灰度三方面的信息;然后,采用“智能光线跟踪”方法,在模型知识指导下直接从体积数据中提取并显示各组织器官的表面。

3.4基于模型的方法

该方法根据图像的先验知识建立模型,有动态轮廓模型(ActiveContourModel,又称Snake)、组合优化模型等,其中Snake最为常用。Snake算法的能量函数采用积分运算,具有较好的抗噪性,对目标的局部模糊也不敏感,但其结果常依赖于参数初始化,不具有足够的拓扑适应性,因此很多学者将Snake与其它方法结合起来使用,如王蓓等利用图像的先验知识与Snake结合的方法,避开图像的一些局部极小点,克服了Snake方法的一些不足。Raquel等将径向基网络(RBFNNcc)与Snake相结合建立了一种混合模型,该模型具有以下特点:(1)该混合模型是静态网络和动态模型的有机结合;(2)Snake的初始化轮廓由RBFNNcc提供;(3)Snake的初始化轮廓给出了最佳的控制点;(4)Snake的能量方程中包含了图像的多谱信息。Luo等提出了一种将livewire算法与Snake相结合的医学图像序列的交互式分割算法,该算法的特点是在少数用户交互的基础上,可以快速可靠地得到一个医学图像序列的分割结果。

由于医学图像分割问题本身的困难性,目前的方法都是针对某个具体任务而言的,还没有一个通用的解决方法。综观近几年图像分割领域的文献,可见医学图像分割方法研究的几个显著特点:(1)学者们逐渐认识到现有任何一种单独的图像分割算法都难以对一般图像取得比较满意的结果,因而更加注重多种分割算法的有效结合;(2)在目前无法完全由计算机来完成图像分割任务的情况下,半自动的分割方法引起了人们的广泛注意,如何才能充分利用计算机的运算能力,使人仅在必要的时候进行必不可少的干预,从而得到满意的分割结果是交互式分割方法的核心问题;(3)新的分割方法的研究主要以自动、精确、快速、自适应和鲁棒性等几个方向作为研究目标,经典分割技术与现代分割技术的综合利用(集成技术)是今后医学图像分割技术的发展方向。

4.医学图像配准和融合

医学图像可以分为解剖图像和功能图像2个部分。解剖图像主要描述人体形态信息,功能图像主要描述人体代谢信息。为了综合使用多种成像模式以提供更全面的信息,常常需要将有效信息进行整合。整合的第一步就是使多幅图像在空间域中达到几何位置的完全对应,这一步骤称为“配准”。整合的第二步就是将配准后图像进行信息的整合显示,这一步骤称为“融合”。

在临床诊断上,医生常常需要各种医学图像的支持,如CT、MRI、PET、SPECT以及超声图像等,但无论哪一类的医学图像往往都难以提供全面的信息,这就需要将患者的各种图像信息综合研究19],而要做到这一点,首先必须解决图像的配准(或叫匹配)和融合问题。医学图像配准是确定两幅或多幅医学图像像素的空间对应关系;而融合是指将不同形式的医学图像中的信息综合到一起,形成新的图像的过程。图像配准是图像融合必需的预处理技术,反过来,图像融合是图像配准的一个目的。

4.1医学图像配准

医学图像配准包括图像的定位和转换,即通过寻找一种空间变换使两幅图像对应点达到空间位置上的配准,配准的结果应使两幅图像上所有关键的解剖点或感兴趣的关键点达到匹配。20世纪90年代以来,医学图像配准的研究受到了国内外医学界和工程界的高度重视,1993年Petra等]综述了二维图像的配准方法,并根据配准基准的特性,将图像配准的方法分为两大类:基于外部特征(有框架)的图像配准和基于内部特征(无框架)的图像配准。基于外部特征的方法包括立体定位框架法、面膜法及皮肤标记法等。基于外部特征的图像配准,简单易行,易实现自动化,能够获得较高的精度,可以作为评估无框架配准算法的标准。但对标记物的放置要求高,只能用于同一患者不同影像模式之间的配准,不适用于患者之间和患者图像与图谱之间的配准,不能对历史图像做回溯性研究。基于内部特征的方法是根据一些用户能识别出的解剖点、医学图像中相对运动较小的结构及图像内部体素的灰度信息进行配准。基于内部特征的方法包括手工交互法、对应点配准法、结构配准法、矩配准法及相关配准法。基于内部特征的图像配准是一种交互性方法,可以进行回顾性研究,不会造成患者不适,故基于内部特征的图像配准成为研究的重点。

近年来,医学图像配准技术有了新的进展,在配准方法上应用了信息学的理论和方法,例如应用最大化的互信息量作为配准准则进行图像的配准,在配准对象方面从二维图像发展到三维多模医学图像的配准。例如Luo等利用最大互信息法对CT-MR和MR-PET三维全脑数据进行了配准,结果全部达到亚像素级配准精度。在医学图像配准技术方面引入信号处理技术,例如傅氏变换和小波变换。小波技术在空间和频域上具有良好的局部特性,在空间和频域都具有较高的分辨率,应用小波技术多分辨地描述图像细貌,使图像由粗到细的分级快速匹配,是近年来医学图像配准的发展之一。国内外学者在这方面作了大量的工作,如Sharman等提出了一种基于小波变换的自动配准刚体图像方法,使用小波变换获得多模图像特征点然后进行图像配准,提高了配准的准确性。另外,非线性配准也是近年来研究的热点,它对于非刚性对象的图像配准更加适用,配准结果更加准确。

目前许多医学图像配准技术主要是针对刚性体的配准,非刚性图像的配准虽然已经提出一些解决的方法,但同刚性图像相比还不成熟。另外,医学图像配准缺少实时性和准确性及有效的全自动的配准策略。向快速和准确方面改进算法,使用最优化策略改进图像配准以及对非刚性图像配准的研究是今后医学图像配准技术的发展方向。

4.2医学图像融合

图像融合的主要目的是通过对多幅图像间的冗余数据的处理来提高图像的可读性,对多幅图像间的互补信息的处理来提高图像的清晰度。不同的医学影像设备获取的影像反映了不同的信息:功能图像(SPECT、PET等)分辨率较差,但它提供的脏器功能代谢和血液流动信息是解剖图像所不能替代的;解剖图像(CT、MRI、B超等)以较高的分辨率提供了脏器的解剖形态信息,其中CT有利于更致密的组织的探测,而MRI能够提供软组织的更多信息。多模态医学图像的融合把有价值的生理功能信息与精确的解剖结构结合在一起,可以为临床提供更加全面和准确的资料。

医学图像的融合可分为图像融合的基础和融合图像的显示。(1)图像融合的基础:目前的图像融合技术可以分为2大类,一类是以图像像素为基础的融合法;另一类是以图像特征为基础的融合方法。以图像像素为基础的融合法模型可以表示为:

其中,为融合图像,为源图像,为相应的权重。以图像特征为基础的融合方法在原理上不够直观且算法复杂,但是其实现效果较好。图像融合的步骤一般为:①将源图像分别变换至一定变换域上;②在变换域上设计一定特征选择规则;③根据选取的规则在变换域上创建融合图像;④逆变换重建融合图像。(2)融合图像的显示:融合图像的显示方法可分成2种:空间维显示和时间维显示。

目前,医学图像融合技术中还存在较多困难与不足。首先,基本的理论框架和有效的广义融合模型尚未形成。以致现有的技术方法还只是针对具体病症、具体问题发挥作用,通用性相对较弱。研究的图像以CT、MRI、核医学图像为主,超声等成本较低的图像研究较少且研究主要集中于大脑、肿瘤成像等;其次,由于成像系统的成像原理的差异,其图像采集方式、格式以及图像的大小、质量、空间与时间特性等差异大,因此研究稳定且精度较高的全自动医学图像配准与融合方法是图像融合技术的难点之一;最后,缺乏能够客观评价不同融合方法融合效果优劣的标准,通常用目测的方法比较融合效果,有时还需要利用到医生的经验。

在图像融合技术研究中,不断有新的方法出现,其中小波变换在图像融合中的应用,基于有限元分析的非线性配准以及人工智能技术在图像融合中的应用将是今后图像融合研究的热点与方向。随着三维重建显示技术的发展,三维图像融合技术的研究也越来越受到重视,三维图像的融合和信息表达,也将是图像融合研究的一个重点。

5.医学图像纹理分析

一般认为图像的纹理特征描述物体表面灰度或颜色的变化,这种变化与物体自身属性有关,是某种纹理基元的重复。Sklansky早在1978年给出了一个较为适合于医学图像的纹理定义:“如果图像的一系列固有的统计特性或其它的特性是稳定的、缓慢变化的或者是近似周期的,那么则认为图像的区域具有不变的纹理”。纹理的不变性即指纹理图像的分析结果不会受到旋转、平移、以及其它几何处理的影响。目前从图像像素之间的关系角度,纹理分析方法主要包括以下几种。

5.1统计法

统计分析方法主要是基于图像像素的灰度值的分布与相互关系,找出反映这些关系的特征。基本原理是选择不同的统计量对纹理图像的统计特征进行提取。这类方法一般原理简单,较易实现,但适用范围受到限制。该方法主要适合医学图像中那些没有明显规则性的结构图像,特别适合于具有随机的、非均匀性的结构。统计分析方法中,最常用的是共生矩阵法,其中有灰度共生矩阵(graylevelco-occurrencematrix,GLCM)和灰度—梯度共生矩阵。杜克大学的R.Voracek等使用GLCM对肋间周边区提取的兴趣区(regionofinterest,ROI)进行计算,测出了有意义的纹理参数。另外,还有长游程法(runlengthmatrix,RLM),其纹理特征包括短游程优势、长游程优势、灰度非均匀化、游程非均匀化、游程百分比等,长游程法是对图像灰度关系的高阶统计,对于给定的灰度游程,粗的纹理具有较大的游程长度,而细的纹理具有较小的游程长度。

5.2结构法

结构分析方法是分析纹理图像的结构,从中获取结构特征。结构分析法首先将纹理看成是有许多纹理基元按照一定的位置规则组成的,然后分两个步骤处理(1)提取纹理基元;(2)推论纹理基元位置规律。目前主要用数学形态学方法处理纹理图像,该方法适合于规则和周期性纹理,但由于医学图像纹理通常不是很规则,因此该方法的应用也受到限制,实际中较少采用。

5.3模型法

模型分析方法认为一个像素与其邻域像素存在某种相互关系,这种关系可以是线性的,也可以是符合某种概率关系的。模型法通常有自回归模型、马尔科夫随机场模型、Gibbs随机场模型、分形模型,这些方法都是用模型系数来表征纹理图像,其关键在于首先要对纹理图像的结构进行分析以选择到最适合的模型,其次为如何估计这些模型系数。如何通过求模型参数来提取纹理特征,进行纹理分析,这类方法存在着计算量大,自然纹理很难用单一模型表达的缺点。

5.4频谱法

频谱分析方法主要基于滤波器理论,包括傅立叶变换法、Gabor变换法和小波变换法。

1973年Bajcsy使用傅立叶滤波器方法分析纹理。Indhal等利用2-D快速傅立叶变换对纹理图像进行频谱分析,从而获得纹理特征。该方法只能完成图像的频率分解,因而获得的信息不是很充分。1980年Laws对图像进行傅氏变换,得出图像的功率谱,从而提取纹理特征进行分析。

Gabor函数可以捕捉到相当多的纹理信息,且具有极佳的空间/频域联合分辨率,因此在实际中获得了较广泛的应用。小波变换法大体分金子塔形小波变换法和树形小波变换法(小波包法)。

小波变换在纹理分析中的应用是Mallat在1989年首先提出的,主要用二值小波变换(DiscreteWaveletTransform,DWT),之后各种小波变换被用于抽取纹理特征。传统的金字塔小波变换在各分解级仅对低频部分进行分解,所以利用金字塔小波变换进行纹理特征提取是仅利用了纹理图像低频子带的信息,但对某些纹理,其中高频子带仍含有有关纹理的重要特征信息(如对具有明显的不规则纹理的图像,即其高频子带仍含有有关纹理的重要特征)得不到利用。使用在每个分解级对所有的频率通道均进行分解的完全树结构小波变换提取特征,能够较全面地提取有关纹理特征。

由于医学图像及其纹理的复杂性,目前还不存在通用的适合各类医学图像进行纹理分析的方法,因而对于各类不同特点的医学图像就必须采取有针对性地最适合的纹理分析技术。另外,在应用某一种纹理分析方法对图像进行分析时,寻求最优的纹理特征与纹理参数也是目前医学图像纹理分析中的重点和难点。

6.总结

随着远程医疗技术的蓬勃发展,对医学图像处理提出的要求也越来越高。医学图像处理技术发展至今,各个学科的交叉渗透已是发展的必然趋势,其中还有很多亟待解决的问题。有效地提高医学图像处理技术的水平,与多学科理论的交叉融合、医务人员和理论技术人员之间的交流就显得越来越重要。多维、多参数以及多模式图像在临床诊断(包括病灶检测、定性,脏器功能评估,血流估计等)与治疗(包括三维定位、体积计算、外科手术规划等)中将发挥更大的作用。

参考文献

[1]P.Suetens.FundamentalsofMedicalImaging[M].CambridgeUniversityPress,2002.

[2]刘俊敏,黄忠全,王世耕,张颖.医学图像处理技术的现状及发展方向[J].医疗卫生设备,2005,Vol26

(12):25-26.

[3]田娅,饶妮妮,蒲立新.国内医学图像处理技术的最新动态[J].电子科技大学学报,2002,Vol31(5):

485-489.

[4]周刚慧,施鹏飞.磁共振图像的随机场分割方法[J].上海交通大学学报,2001,Vol35(11):1655.

[5]ZhangHM,YuanZJ,CaiZM.SegmentationofMRIusinghierarchicalmarkovrandomfield[J].Journalof

Software,2002,Vol13(9):1779.

[6]林亚忠,陈武凡,杨丰.基于混合金字塔吉布斯随机场模型的图像分割[J].中国生物医学工程学报,

2004,Vol23(1):79.

[7]聂生东,陈瑛,顾顺德.磁共振颅脑图像快速模糊聚类分割算法研究[J].中国生物医学工程学报,2001,

Vol20(2):104.

[8]江宝钏,张钧良.基于BP神经网络的MRI分割[J].微机发展,2000,Vol1:67.

[9]AhmedMN,FaragA.Two-stageneuralnetworkforvolumesegmentationofmedicalimages[J].Proceedings

ofIEEEInternationalConferenceonNeuralNetworks,1997,Vol28(3):1373.

[10]黄永峰,岑康,司京玉等.模糊神经网络在颅脑磁共振图像分割中的应用研究[J].中国生物医学工程

学报,2003,Vol22(6):508.

[11]CostinH,RotariuCR.Knowledge-basedcontourdetectioninmedicalimagingusingfuzzylogic[J].

InternationalSymposiumonSCS’03,2003,1:273.

[12]谢逢,罗立民,田雪琴.基于知识的人脑三维医学图像分割显示方法[J].生物医学工程学杂志,1997,

Vol14(2):124.

[13]王蓓,张立明.利用图像先验知识与Snake结合对心脏序列图像的分割[J].复旦大学学报(自然科学

版),2003,Vol42(1):81.

[14]RaquelVC,VeronicaMB,OscarYS.Couplingofradial-basisnetworkandactivecontourmodelformulti

spectralbrainMRIsegmentation[J].IEEETransactionsonBiomedicalEngineering,2004,Vol51(3):459.

[15]LuoXP,TianJ,LinY.Analgorithmforsegmentationofmedicalimageseriesbasedonactivecontour

model[J].JournalofSoftware,2002,Vol13(6):1050.

[16]HallpikeL,HawkesDJ.Medicalimageregistration:Anoverview[J].BrInstituteRadiol,2004,Vol14(6):

455-463.

[17]PetraA,ElsenV.MedicalImagemaching:Areviewwithclassification[J].IEEETransMedImage,1993,

Vol12(3):26-39.

[18]LuoShuo-qian,LiXiang.Implementationofmutualinformationbasedmulti-modalitymedicalimage

registration[A].EngMedBillSocProc22ndAnnIntConfIEEE[C].NavyPierConventionCenterChicago,

Illinois,USA:TheInstituteofElectricalandElectricalandElectronicsEngineers,Ind,2000,2:1447-1450.

[19]SharmanR,TylerJM,PianykhOL,etal.Afastandaccuratetomethodtoregistermedicalimagesusing

waveletmodulusmaxima[J].PattRecogLett,2000,21:447-462.

[20]LesterH,ArridgeSR.ASurveyofhierarchiclnon-linearmedicalimageregistration[J].PatternRecognition,

1999,32:129-149.

[21]卢健,胡志忠,杨如乃.医学图像融合技术的研究[J].上海生物医学工程,2006,Vol27(3):163-167.

[22]王新成.高级图像处理技术[M].北京:中国科学技术出版社,2001.

[23]RVoracek,HPMcAdams,puterAidedDiagnosisofInterstitialLungDisease:aTexture

FeatureExtractionandClassificationApproach[J].ProcofSPIE,1998,3338:1502-1509.

图像分析论文范文第3篇

一建筑符号的图像特征

20世纪现代西方哲学的一个重要特征就是语言学转向,语言研究几乎对各个学科的发展都产生了深远影响,这在建筑界的一个直接结果就是建筑符号学的产生。符号学认为人们对世界的认识都是以符号现象作为中介的,这一思想得到了建筑理论界的响应,产生了众多建筑符号学派,学者们在各自理论范围内做出了不同的探索。建筑符号学认为,一切建筑的意义都是由于符号表达而产生的,建筑符号的意义是文化的象征,它能引起人们的联想。建筑符号同时表达了“能指”与“所指”两方面的功能,建筑符号的能指是其具体形式,所指则是其象征意义。符号的象征作用对建筑创作极为重要,它是建筑获得意义的关键。需要说明的是:建筑符号学在创立之初,仍然有着诸多不尽如人意之处,这突出地表现在机械地搬用语言学的概念、术语,照搬语言研究的分析方法,关注语言意义的共时分析等方面。与之相对应,建筑符号学也正是试图在能指—所指的二元对立关系中对建筑形式进行代码化,寻求形式的所谓精确含义。正如某些学者指出的那样,这样做必然使建筑符号学在探究建筑意义的传达机制时过分依赖逻辑化的思维方式和语言学的概念范畴,就必然把建筑形式的多义化的类比隐喻关系纳入单一的概念化、逻辑化轨道,于是建筑的艺术层面就在对其意义加以逻辑化的硬性规约中被无情了,建筑符号学的理论探讨也就由此相当程度地远离了建筑作为艺术的重要层面———审美。建筑能够通过诉诸人类意指活动,产生丰富多样的文化意义。在这一点上建筑与语言有着很大的相似性;但从另一个方面来讲,建筑又与语言有着本质不同,因为建筑不是通过概念化的逻辑语言,而是直接诉诸具体的图像来传达意义,由此形成的图像与意义的关系不是语言式的一一对应的严格的逻辑关系,而是多样化的隐喻类比关系。在这一点上,建筑作为符号事实上是“图像符号”,与逻辑化的符号与其所指的联系方式不同,它更加隐蔽、微妙。建筑的这一图像性本质在理论界已经成为一种共识。

二建筑符号的文本特征

进一步而言,图像作为符号与语言符号的不同还在于它只在某些层面具有明确编码关系,这使它仅在局部层面上具备逻辑化象征特点;而众多尚未明确“编码化”的个人化因素的不断渗透则使图像符号在总体上表现出复杂的“文本”性质。图像并不和单词一样具有单一的功能含义,它更类似语句所具有的功能即能传达多样的意义,它是某种非语词性句子,可以被称为“超符号”。“超符号的典型例子是一种‘图像’陈述,诸如某人的照片;它不仅仅意味着‘某某人’,而且指‘如此如此微笑,戴眼镜,等等’(它可能仅仅是一种描述),或‘如此如此走路’,这显然对应于一条语词性语句”。在这里,符号传达的是多种编码关系共存导致的多义性以及由于某些编码阙如所产生的歧义性,即“有些‘符号’导源于模糊的表达组织联系,并传达大面积无法分解的内容片段;有些表达手段依据不同语境而传达不同内容”,因此,图像符号“就属于一种复杂文本,其内容范围所及,乃是从编码过的可靠鉴别单位到一段不确定话语或一块内容雾状体。建筑在总体上并不能够像语言那样传达什么具体而微的含义,这是最明显不过的事实。在建筑符号中诚然存在着某些要素,对之我们已经有某种类似语言式的象征编码,如圆拱被视为罗马建筑的象征,尖券被用来作为哥特式教堂建筑的象征;但建筑中也同样存在着众多“内容雾状体,对之我们目前尚难以依据既定的编码关系予以把握,正是这一点使建筑符号仅仅在局部上具备逻辑化的含义或象征,而在总体上则成为一种具有高度“复杂性”的文本。“甚至最基本的建筑构形总是文本”。

三建筑“第三”层次的意义与符号学的“能指”、“所指”等概念并行,语言学对建筑学产生影响的另一个重要方面是其“结构”或句段组合概念。在语言中,符号的结构表述是依据这样一种方式进行,即单字组合成词,词又组合成为句子,由此实现叙事和传达意义;这一点在建筑中也有类似反映,建筑构件组合成为符号,符号组合而成为建筑“文本”。对此需要指出:就建筑作为空间艺术而言,这一类比具有相当程度上的正确性,而其局限性则在于它忽略了同样重要的建筑审美的“时间”之维。长期以来,每每谈及建筑与其他艺术门类的关系,人们一般总是把建筑与绘画、雕塑等静态艺术相类比,这诚然在很大程度上揭示出了建筑与各艺术门类的丰富联系,但建筑作为一门相对独立的艺术,表现为它不仅是静态的空间艺术,而且是动态的时间艺术,即人们可以在行进中体验建筑在变换的角度中呈现出的不同情境效果。正是在这一点上,建筑与绘画、雕塑等静态艺术有着很大的不同,而与电影艺术有着很大的相似性。对此,正如爱格瑞丝特指出的,当代建筑设计面临的一个重要问题就是建筑与城市的关系问题,而人们徜徉在城市街道中观赏建筑,与观看电影时的体验十分相似,由此可以认为电影作为一种动态视觉艺术,和建筑有着更大的相关性以上我们谈到,建筑符号的图像性使它表现为一种复杂的文本特征,具有丰富的意义层次。这就涉及到一个建筑最小意义单元的界定和意义层次的划分问题,据此,本文拟借鉴意大利符号学家艾柯的符号分节理论做出分析,并藉此探讨其对建筑创作的方法论意义。在关于图像符号的意义分节的论述中,艾柯指出,图像符号就是作为最小意义单元存在的,因为它不能进一步分解为符号,而只能分解为“格”,它是某种非能指单位,不带有意义。

就此而言,图像符号系统只具备一级组接形式;在某个画面中,各图像符号则通过某个二级组接关系被理解,在这一新的观照背景下,构成图像符号的“格”也将在新的层面上被赋予意义,有些“格”可能显得无足轻重,而有些“格”则可能成为至关重要的意义单元;在其电影符号学研究中,艾柯进一步认为,电影符号是具有三级组接方式的符号。“在我看来,三级组接方式的唯一例子可以在摄影语言里找到。不妨假定:在摄影画面里存在一些视觉方面的非能指灯光现象(格),其组合产生视觉方面的能指现象”,图像的组合又构成了画面,由此构成二级组接关系,“但从画面过渡到镜头时,人物就在表演一些姿势,而图像则通过瞬时运动促成动作符号……”在这里,动作因素的引入使图像符号在某个三级组接关系中被赋予新的意义。关键在于,艾柯不仅把电影符号看做是视觉符号,更是把它看做是动作符号。艾柯把动作或姿势看做与视觉一样的符号文化现象:“人体的姿势与运动不是人性的本能,而是习惯的行为的系统,在不同的文化中,表现不同”,而手势学的符号学意义就在于“把人的姿势系统化地编为可以组和檐口等的相对位置和尺度、比例等关系使得各图像符号在新的系统中获得新的意义,这时,柱子则可能是作为构成“人与自然的和谐关系”中的一个必要平衡因素被理解。就建筑处于某个大环境或某个“文脉”之中而论,人们往往在行动中把握着建筑与其周围环境错综复杂的关系,而由此形成的多样化的、第三层次的意义则再一次把建筑纳入某个新的符号界面。与观看电影相似,人们在行动中视线、位置的不断变化,产生了某种“镜头”式效应,空间位置的不断变化使建筑相对于人的视觉产生了“静中之动”效应而成为一种特殊的动作符号,从而导致在建筑中出现了只有在电影中才能出现的“蒙太奇”效果。超级秘书网

由此人们在一种更高的组合层次上赋予建筑符号新的意义,如在雅典卫城中,各个建筑就是通过与卫城空间整体的关联获得超越自身风格以外的意义。在这一层次的意义中,建筑作为一个新的意义单元即环境意义的单元被把握,这突出地体现在,某个建筑要素属于何种风格可能并不重要,而建筑的檐口高度、材质和各个建筑之间的主从关系等至关重要。这一点在世界上许多著名的城市广场中都可发现,如威尼斯的圣马可广场作为一个环境整体,其意义就主要是通过各个建筑的檐口高度和尺度的近似传达出来的,而不是各个建筑自身的风格;贝聿铭先生的美国国家美术馆东馆、巴黎卢浮宫扩建工程等之所以成为杰作,在很大程度上也应归结于对建筑“第三”层次的意义的成功把握。进一步而言,重视建筑“第三”层次上的意义意味着建筑在此将被视为构成城市空间的认知图式的重要一元。在这一点上,我们认为,符号学事实上已走出了自身的狭窄疆域,它必将为当前文脉主义以至城市设计的创作和实践提供丰富有益的理论启示,也为符号学研究展现出更加广阔的前景。在建筑中,图像符号的组接就是依据这种“由静到动”的三级结构序列进行的,它使图像符号通过众多意义网络交叉组合在一起。不难看出,建筑符号意义层次的这一三重分节,使建筑符号在其构成及组合机制上摆脱了纯语法式的逻辑法则的规约,而具有“言、象、意”式的美学层次特点。从图像符号到建筑以至城市,每一层次结构都蕴含着其组成要素所不具备的意义内容,由此形成人类环境结构意义层次的绵延之链,这事实上也就是人类符号创造的诗意之链。世界即藉此成为充满诗性意义的“存在空间”。

图像分析论文范文第4篇

关键词:系统功能语法;再现意义;互动意义;构图意义;平面广告

一.引言

平面广告,若从空间概念界定,泛指现有的以长、宽两维形态传达视觉信息的各种广告媒体的广告;若从制作方式界定,可分为印刷类、非印刷类和光电类三种形态;若从使用场所界定,又可分为户外、户内及可携带式三种形态;若从设计的角度来看,它包含着文案、图形、线条、色彩、编排诸要素。对平面广告的多模态分析模式是建立在多模态理论的基础上的,由于平面广告一般包括的模态有图像模态和文字模态,所以平面广告的多模态分析主要包括对这两个模态的分析。

之前对于平面广告的多模态分析基本是根据多模态分析理论上对于个案的分析,而没有一个系统的完整的平面广告多模态分析方法和结构。这样在遇到新的案例或者素材时就没有可供使用的分析框架,分析者往往要进行各方面的知识学习和概括才能进行多模态分析。本文试图通过构建一个适合大多素平面广告的多模态分析的框架,使分析更加简洁和清晰,并且能够为一些分析者提供研究的切入点。

二.理论基础

克瑞斯和勒文的理论是建立在韩礼德系统功能语言学的基础上,系统功能语言学把语言功能分为三个方面,即概念功能、人际功能和语篇功能。概念功能是指我们利用语言来认识世界的功能;人际功能是讲话者运用语言参加社会活动的功能;语篇功能指语言用于组织信息的功能。而根据克瑞斯和勒文的理论模式图像的意义可以分为三个模块,即分析图像的再现意义,互动意义和构图意义。因此我们在研究图像模态时可以根据这三个模块来分析图像模态的意义和特点。

平面广告包含有图像和文字两种模态,Barthes认为,图象和文字说明是关联的,然而由于图象本身的意义飘忽不定,必须借助文字说明才能确定(Barthes1967, 1977)这种观点认为图像依赖于文字,而克瑞斯和勒文却认为,图象和文字说明是有联系的,但并不依赖文字说明,因为它本身既是有组织的(organized) ,又是有结构的( structured) ( Kress & Leeuwen 2006 )。虽然两种观点在文字和图像的关系上有所不同,但是他们都认为对于图像模态的分析,要结合文字模态,对于文字模态的分析,需要结合图像模块。

三.分析步骤

平面广告的多模态分析分为两个方面,第一是图像模态的分析,第二是文字模态的分析。

3.1图像模态的分析

图像模态的分析可以从三个方面着手:再现意义、互动意义和构图意义。

3.1.1图像模态的再现意义

系统功能语言学中指出,概念功能指语言对人们在现实世界(包括内心世界)中各种经历加以表达的功能。而克瑞斯和勒文提出的再现意义是在概念功能的理论上建立的,他们将再现意义区分为叙事和概念两大类。其中叙事的再现包括行动过程、反应过程及言语和心理过程三类。而概念的再现对应功能语法中的语义关系的关系过程和存在过程。

区分叙事再现和概念再现的方法是看图中有没有矢量的存在。有矢量的图属于叙事再现图像,而没有矢量的图则属于概念再现图像。

矢量是叙事图像的标志。在图片中,图像中的元素形成斜线, 通常是强烈的对角线,形成矢量。当参与者被矢量连接起来时,他们之间的关系被再现为相互作用,表现为行动过程和反应过程。在叙事再现的行动过程中,动作者(actor)即为发出矢量的参与者。在图像中,动作者通常是最为突出。而没有矢量的图则属于概念图像,概念图像的再现意义通过分类过程、分析过程和象征意义来实现。

在确定了图像模块属于何种再现图像之后,我们就可以根据两类图像的特点和结构来进行分析。如果图像中包含矢量,即属于叙事图像,那么就要按照分析叙事图像的方法,首先要分清图像中的动作者,参与者和反映者,然后再分析他们之间的相互关系以及是如何相互作用的。各方的相互作用也是通过矢量连接的。叙事图像的在现分为行动过程、反应过程及言语和心理过程。行动过程的元素和人物可以看作动作者,反应过程的元素和人物可以看作参与者,心理过程的元素和人物可以看作反映者。世博会的会徽可以被看做是一个叙事图像,可以明显的看到由图像中的元素构成的强烈的对角线而形成的向量。动作者并不是具体的某个人或者某些人,而是一个由图像构造出来的具有象征意义的整个群体。

如果图像中不包含矢量,即属于概念图像,那么就要按照概念图像的模式来进行分析。概念图像的再现意义通过分类过程、分析过程和象征意义来实现。分类过程即把图像中的各个元素按照一定的标准进行分类,将属于同一类的元素归纳到一起,而分析过程则是把已经归类的元素进行信息处理,将元素中的有效信息提取出来,象征意义是将从元素中提取的有效信息再处理,并且归纳总结出深刻的内涵概念。

3.1.2 图像模态的互动意义

互动意义对应于系统功能语言学中的人际意义。"互动意义是关于图像的制作者、图像所表征的事物(包括人)和图像的观看者之间的关系,同时提示观看者对表征事物应持的态度。"跟语言的人际功能类似,人际功能是指语言用来维持社会和人际关系的功能,而互动意义是用图像语言进行交流,使交流的各方能够有效的沟通。互动意义由四个要素构成,它们是接触、社会距离、态度和情态。我们可以从这四个方面来分析图像模态的互动意义。接触:很多图像表现画框中的人直接看着观看者,即他们与观看者"接触",从而与他们建立起(想象中的)关系。根据图像与观看者之间的接触关系,可以分为"索取"类图像和"提供"类图像。距离:图像可以使观看者靠近人物地点和事件,也可以将观看者挡在一臂之外。图像的距离要素类似于电影和摄影中的镜头距离,根据距离的长短,图像可以给观看者不同的感觉,例如近距离的特写可以让观看者身临其境,而长距离的画面则是强调的整体感觉。态度:当仰视/俯视/平视某物时,我们会对物体产生象征性的权势,平等的和不平等的,这之间还有很多不同程度的卷人或超脱的介人。最后分析的一项是情态,情态指的是"某种图画表达手段(色彩、再现的细节、深度、色调等)使用的程度,其中的每一个方面都可以看作是一个尺度,从没有细节到对细节最大量的再现,或者从没有深度到最大深度"。分析情态就是分析图像中的色彩运用,图像中的情态分为高、中、低三类:(1)高感官情态:图像自然主义地使用了高饱和度的色彩;(2)中感官情态:图像色彩不太饱和,如"水洗"的或飘逸的水粉;(3)低感官情态:图像只是黑白的。克瑞斯和勒文从色彩饱和度、色彩区分度、色彩调和度、语境化、再现、深度、照明和亮度等八个视觉标记探讨了图像中情态的现实意义量值的高低。所以在分析图像时,要结合美学对色彩的研究来分析图像色彩的运用及包含的意义。

3.1.3 图像模态的构图意义

构图意义对应的是系统功能语法中的语篇意义,正如对于语篇意义的分析一样,多模态分析把整个图片看做是一个语篇,而不同的是多模态分析注重的是图片内部结构和整体的关系。构图意义包含三种资源:信息值、取景和显著性。分析图片的构图意义就是对这三种资源的分析,同样的也需要借助美学的知识。信息值是通过元素在构图中的放置实现的。元素在图中的不同位置代表了不同的意义,在图像上方的元素是"理想的",而被放在下面的元素则是"真实的";放在图像左边的元素是已知的,而右边的元素则是新的信息。在功能语法中,已知信息是常识性的或显而易见的,而新信息则是补充到认知环境中的,可供讨论和争议的。取景指的是用取景手段(可通过造成分割线条、或实际分割框架的线条来实现)割断或连接图像中的元素,表示它们在某种意义上是属于还是不属于的。显著性值得是元素吸引观看者注意力的程度。显著性可以通过图片的前景或背景、相对尺寸、色调值的对比、鲜明度的不同等来实现。此外,文化因素也可以影响显著性,例如女人体现在图像中总是具有显著性。而很多的平面广告大多是借助人物来表现产品的,所以其中的各种因素所表现出来的显著性会有很大差别。

3.2文字模态的分析

广告中的文字部分通常对整个广告起到画龙点睛的作用,在广告中往往是必不可少的,文字模态和图像模态相互照应,共同作用以展示产品或宣传品。因此我们在分析完图像之后还要对文字进行分析,并且要结合图像的意义和特点来分析文字。

文字模态的分析主要是从两方面来进行。一方面要分析文字的构图模式,排版和色彩运用。像图像模态一样,文字模态也有其自身的构图原则和目的,我们在分析时要把握好作者的意图以便更好的结合文字来对整个广告分析。在平面广告中,文字说明能够更好的帮助把产品的精华和特点展示出来,让观看者更准确的把握住广告的意图。这种分析是把文字看做图像来分析的,与图像模态的分析有类似之处。

另一方面,要利用传统的系统语言学的方法来对纯文字部分进行分析。在分析完文字模态的构图方面的特点和意义之后,我们还要对文字模态进行再分析。因为传统的系统功能语言学分析的是单模态的文字语篇,所以我们在利用此理论来分析文字模态时要对语言的三大功能进行分析,即概念功能、人际功能和语篇功能。同时,要结合广告语的形式和特点分析语篇。广告语中包含有大量的转喻和隐喻,在分析时要把其中的隐含意义解释出来从而方便读者对整个语篇的理解。

四.结语

多模态的分析不仅仅依赖语言学这一门学科的知识,因为多模态不可避免的包含有图像或者视频,所以对于这些模态的分析还要借助于其他方面的知识,例如美学和社会学。多模态分析发展到现阶段,缺点还存在很多,最明显的一个,由于分析者在分析各个模态时虽然根据相同的理论和结构,但是分析仍然带有强烈的主观性。不同的人对于同一个图片分析的结果和侧重点就会有很大的差别。而对于文字模态和图片模态之间的互动关系和互补作用仍然难以确定,因此在对这两个模态分析时就难以准确全面的将二者结合。

平面广告只是多模态语篇的一种,并且是一般仅包含有两种模态的语篇,所以在分析的内容相对较少,结构相对较简单。但是分析要抓住图像所表达意义的本质却不是那么简单的,在分析者利用理论来进行实际分析时,往往无法把握好图像的各个元素的重要性顺序以及背后所隐藏的含义,这就会造成一种分析的失误,导致分析太流于表面,而无法深层次的挖掘其中的精髓。并且多模态分析往往要求分析者掌握多方面的理论和背景知识,仅仅通过一些简单的知识进行似懂非懂的分析结果会给人一种空洞和言之无物的感觉。

参考文献:

[1]Kress G. and T.Van Leeuwen. Multimodal Discourse Analysis. London:[2]Arnold, 2001

[3]Kress,G. and T.Van Leeuwen. Reading Images.1996. London: Routledge, 2006.

[4]Halliday, M. A. K. An Introduction to Functional Grammar.1985. London: Arnold, 1994.

[5]T.van Leeuwen Introducing Social Semiotics. London: Routledge, 2005.

[6]Hodge, R. and G. Kress. Social Semiotics. Cambridge: Polity Press, 1988

[7]胡壮麟,"社会符号学研究中的多模态化",《语言教学与研究》, 2007年第1期,1-10。

图像分析论文范文第5篇

关键词: 图像分析; 教学模式; 教学改革; 项目驱动

中图分类号:TP3-0 文献标志码:A 文章编号:1006-8228(2015)05-59-03

Abstract: The teaching content and teaching mode for course of digital image analysis are researched in the paper, education reform measures is implemented from three aspects, the theory teaching, the practice teaching and the related scientific research. Project driven teaching is proposed to cultivate innovative and practice talents, the practice teaching is strengthened and the scientific research is introduced into the teaching process.

Key words: image analysis; teaching mode; teaching reform; project driven

0 引言

随着现代信息技术的快速发展,图像分析日益广泛地应用于军事目标识别控制、智能交通、医学图像重建、社会事务管理、生物特征识别,以及互联网相关产业等诸多领域,越来越多的研究者更加关注图像分析领域的研究工作[1-2]。而高等教育要与实际应用紧密联系,“图像分析”这门课程在高校电子信息类专业也有了越来越重要的地位。

图像分析是用模式识别和人工智能方法对景物进行分析、描述、分类和解释的技术,又称景物分析或图像理解。一般利用数学模型并结合图像处理的技术来分析底层特征和上层结构,从而提取具有一定智能性的信息。图像分析侧重于研究图像的内容,包括但不局限于使用图像处理的各种技术,它更倾向于对图像内容的分析、解释和识别。

“图像分析”的教学目的是使学生了解和掌握数字图像分析的基本概念与主要内容,为今后的深入研究和开发工作打下良好的基础。其基本教学内容包括图像增强、图像分割、图像复原、图像描述、图像识别等理论和方法。该课程主要阐述数字图像分析中的基本概念、基础理论和常用算法,介绍数字图像分析研究中的基本问题以及解决这些问题的原理和实现方法,使学生能够编程实现简单的图像处理算法,能够逐渐解决数字图像分析领域的实际问题。

“图像分析”课程属交叉学科,其起点高、难度大,既有较强的理论性,又与实践紧密结合,目前的教学现状表明,学生对本课程往往入门时就心存畏惧,深入学习困难,不管是考试成绩还是实践动手能力都不理想,教学上存在许多问题。如何引导学生明确学习目的、转变思想观念,如何在教学过程中合理利用多重教学手段、灵活采用教学相长的方法激发学生的学习兴趣,成为教学中必须解决的难题。

1 课程教学现状分析

经过对国内多所高校的调研发现,现行的教学模式存在严重的弊端。在目前的图像分析课程教学中,教师只是按部就班地按照教学大纲进行讲授,而对于程序运行实现及实际应用部分大纲中并没有严格的要求,所以多数教师也就只讲解理论,对程序实现则省略掉或是一带而过。而学生也只是按部就班地对理论知识进行学习,没有结合相关的应用,所以随着课程内容的深人,学生会感觉到枯燥乏味,对该课程逐渐失去了兴趣。即便是认真学习的学生,也是一直处于被动学习的状态。至于考试,只需要按照教师的授课内容认真复习就可以拿到优异的成绩。很多学生直到他们学完了该门课程,也没弄清楚这些图像处理的方法该如何具体实现,而且对于如何应用到实际生活和研究当中,也是一无所知,更谈不上创新能力、实践能力和综合能力了。该课程目前的教学方法大大影响了学生的创新实践能力的培养。长此以往,高分低能的现象将会日趋严重。因此,图像分析课程教学改革迫在眉睫。

2 课程教学改革措施

2.1 教学内容和方法的改革

图像分析本身为交叉学科,与图像处理、模式识别、信号分析多领域存在密切联系,而课程内在耦合性并不强,目前还没有一个完备的课程体系,许多教学实践难以组织。一般除了图像分析课程的基本内容,根据教材丰富程度的不同,可能还包括图像的数据结构、图像重建、图像识别、图像的小波分析,以及图像的数学形态学分析。其内容庞杂,难度也偏大,在有限的教学时间内往往难以将全部内容讲透,传统的教学模式只能以理论介绍为主,忽视实现步骤,造成学生在学习时普遍感到过于抽象。故有必要优化教学课程设置,精简课程教学内容。课堂讲授中,要抓住重点难点进行讲解,鼓励学生课下自主学习,有疑问主动讨论求教,以此来提高教学质量。

教学内容中不能只有理论知识,还要与图像分析相关应用软件结合起来,如Matlab、Opencv、Image Analyzer等,必要的时候也可以用目前较流行的Photoshop软件举例。这样和软件结合起来讲解,学生可以看到实实在在的图像变化过程,学习兴趣自然就提高了。而且学生也比较容易理解图像分析的基本原理,听起来也不会觉得枯燥,无形中提高了学生的学习效率。同时学生学会了一门语言,用以实现各种图像处理过程,为以后的学习和工作打下坚实的基础。

传统教学中理论学时与实验学时的分配比例一般为3:1,高校普遍偏重理论教学,而忽视了实验教学。理论教学是一种被动的单向的学习模式;而主动性的、互动式的实验教学更能调动学生的积极性,有利于学生自主的去发现问题分析解决问题。因此,要优化理论教学与实验教学的课时比例,加大实验教学的课时,通过实验加深对理论基础的理解。

2.2 强化实验教学

选择图像分析中最重要的算法作为实验课教学的主要内容,覆盖图像分析中图像增强、图像压缩、图像分割、形态学处理、图像特征描述等各个重要部分。图像的读取和显示、图像的直方图均衡化、图像的平滑滤波和锐化滤波、快速傅里叶变换、频域上的高通和低通滤波、Hough 变换、图像的阈值化、图像的膨胀、腐蚀和开闭操作、细化算法等实验完全能包含图像分析领域理论。

实验教学[3]要求学生提前阅读课程实验指导书,了解实验内容,进行初步的设计分析,自己编写核心代码,自行设计实验测试用例,预测实验结果。实验课上认真演示图像处理的效果,将实验结果与预测结果相比较,对出现的问题耐心分析和总结,按要求撰写实验报告,从而加深对数字图像分析概念和方法的理解。引导学生利用所学到的知识,来解决图像分析领域简单的实际应用问题,要把课堂上讲授的理论知识和现实生活中应用的具体例子相结合,将最新的科研前沿动态和信息反馈给学生。

2.3 将科研引入教学

科研中的图像分析相关部分要进人到教学中,让学生在学习理论知识的基础上,了解该方向的前沿技术和应用领域,这对以后的工作有重要的引导作用,也能够激发学生的探索能力和创新灵感,达到真正的学以致用。同时形成科研带动教学,教学促进科研的良性循环[4]。

将科研引入教学,开展项目驱动教学,让学生接触一些具体的项目,在做这些项目时要用到哪些知识点,如何综合运用它们,都是项目中必须解决的问题。通过项目驱动教学的方式,学生的综合实践能力将得到进一步提高。

项目驱动教学的关键是项目的选择和设计,它的好坏直接影响到教学的开展。图像分析项目驱动教学的示意图如图1所示。由图1可知,这一互动式的教学模式重点在于师生的交流反馈,学生是学习的主体,是项目的承担者 、实施者,老师在项目中主要起组织引导的作用。在项目驱动教学实施中,教师不是直接把知识技能传递给学生,而是学生在教师的指导下去选择“项目”,分析“项目”,并最终完成“项目”。学生不再盲目的把学习当任务,而是以项目需求驱动,有目的、有针对性的学习,变被动地接受知识为主动地寻求知识。学生学习的主动性和创新意识在项目实施的过程中不断强化。

根据课程的知识层次和内容体系把理论学习与科研项目相结合。譬如设计“车牌识别系统研究[5]”来展开课堂教学,如图2所示。由图2可知,“图像分析”的大部分教学内容都可通过“车牌识别系统研究”这一项目组织起来。以“实施项目”的方式引入有关概念和主题,展开教学内容深入学习,将学生的“被动学习”转换为“兴趣驱动”,从而提高教学效率。

另外,根据学校的实验条件,还可设计“脑部CT图像处理”、“运动目标检测研究”、“人脸识别系统”等项目,从而融合图像分析各方面的知识点。

整个项目的实施分为两个阶段:理论学习和项目实施。在理论学习阶段,可以引入大量应用实例,授课时重点阐述诸如医学图像处理、运动目标特征提取、智能视频监控、基于图像的工业检测、图像压缩在3G通信技术中的应用等实例。通过对具体项目的讲解,让学生对项目的理论基础有初步的了解,而这种将深奥的理论实例化,使学生易于接受,激发了学生的学习兴趣和对项目的探索激情。在第二阶段的项目实施中,将项目分成若干个小组,在教师的指导下,各小组召开会议,分析项目需求,明确项目任务,进行成员分工,确定各分工的职责及项目实施计划,在此阶段,教师扮演项目顾问的角色,解答小组成员项目实施中遇到的各种问题。学生在教师的指导下完成对项目的需求分析、系统设计、编码实现、测试部署的整个过程,达到学生在完成项目的过程中理解学科知识、掌握综合技能的目的。

项目完成之后,需要对项目进行总结和反馈。各小组提交项目结题材料,以论文答辩的形式在班上演示各小组项目成果,介绍项目实施过程、成果、优势及不足,总结项目实施阶段的经验教训,回答现场提问。在听取其他小组报告的基础上自我总结,找出自己的不足,查缺补漏,提高专业理论基础及定向分析解决问题的能力。最后,以学生自评、组内成员互评、教师点评的方式来确定每位学生的最终成绩。

3 结束语

高校素质教育的重点在于培养学生的创新精神和实践能力,以适应新形势的要求[6],所以专业课程需要根据不断变化的发展形势进行合理的改革。而教学改革是一个长期的、多方位的、不断探索的逐步完善的过程,需要教学工作者打破固定传统教学模式的局限,科学地改善教学方法,并合理运用到教学课程中,真正培养出具有综合实践能力和创新精神的高素质人才。实践表明,本文提出的教学改革方法是可行的、有效的,有利于激发学生的学习动力,提高学生的学习主动性及动手能力,从而锻炼学生解决专业领域实际问题的能力,提高教学水平,同时增强了学生的综合素质和专业竞争力,有利于扩大学生的就业率。

参考文献:

[1] 笪邦友.“数字图像处理”课程教学探讨[J].科技创新导报,2013.

[2] 孙先达.图像分析处理技术研究及应用[D].四川大学硕士学位论文,2002.

[3] 李金萍,陆玲,刘自强等.数字图像处理课程实验教学改革探索[J].科技视界,2012.7.

[4] 唐佳林.探讨“数字图像处理”课程的教学对策与方法[J].中国西部科技,2011.10(19).

图像分析论文范文第6篇

关键词:研究综述;信息检索;图像检索

1.引言

伴随着计算机网络技术、多媒体技术和数字化信息处理技术的飞速发展,互联网上的多媒体信息迅速膨胀。与此同时,计算机所能处理的媒体信息范围也在不断扩大。如何对海量数字图像信息资源进行高效地组织、管理和检索成为了当前热门的研究课题。图像检索成为多媒体领域研究热点的现实原因包括:一方面,图像作为一种内容丰富、表现直观的媒体资源,已经应用在社会各个层次和领域;另一方面,人们面对日益增长的多样化的图像信息,如何在这些海量图像信息中检索出满足自身需求的资源,是近年来网络图像信息处理领域迫切需要解决的问题。

2.图像检索国内研究综述

从20世纪70年代开始,国外有关图像检索的研究就已开始,当时的研究内容主要是基于文本的图像检索技术,到90年代以后,出现了对图像内容语义检索的研究,即基于内容的图像检索。与国外相比,我国有关图像检索的研究起步较晚,从20世纪90年代开始,我国图情领域的核心期刊才开始有相关图像检索的研究论文出现,研究内容大多也是参考国外的研究方向。近年来,随着相关专家、学者对图像检索领域关注度的提高,我国图情领域有关图像检索的研究论文大量出现,相关研究的理论和技术也取得了一定进展。

2.1图情领域核心期刊中图像检索研究论文分布及相关分析

根据中国社会科学引文索引(CSSCI)数据库1998年来对图书情报领域有关图像研究来源文献的收录情况,下文将运用文献计量方法对目前我国图情领域有关图像检索的研究论文按期刊种类、年份、研究主题分布等进行统计分析。

2.1.1图像检索研究论文年度分布情况及相关分析

从表l可以看出,截止到2014年我国图情领域的相关核心期刊在图像检索方面论文收录量总体上呈余弦波状趋势。其中,2002年以前,我国有关图像检索的论文在图情领域核心期刊上的分布处于量少且分散化的状态。2002年到2006年来数量相对较多,属于有关图像检索研究的高峰期,2005年达到最大值。但在2006年以后,相关论文数量趋于明显回落的状态。从以上表格数据的分布状况可以看出,尽管我国图情领域的专家、学者对于图像检索领的研究出现过关注密集期,但重视程度并非长期处于始终如一的状态。

另外,从上表中还可以看出研究论文在核心期刊的分布状态,其中《现代图书情报技术》、《情报科学》、《情报杂志》、《图书情报工作》这四种期刊对图像检索这一研究方向相对关注较多,几乎每年都有相关的。其余的期刊对图像检索研究方向的关注程度相对不高,只有少量其上,并且期刊中有关图像检索的研究论文按年度划分时,总体分布也是相对比较分散的状态。

2.1.2图像检索相关研究论文主题分布及整体分析

对于CSSCI中所收录的126篇有关图像检索研究的文章,按照所研究的相关内容可大致划分为图像检索基本理论与概述、基于具体图像特征的检索、图像检索的具体应用、图像检索交互性与反馈机制、图像检索系统及搜索引擎的设计与评估和图像检索技术、方法研究六个主题方向。

以上结果表明,我国图书情报领域近十年以来对图像检索的研究主要集中于图像检索基本理论与图像检索技术、方法方面。通过对这些相关主题研究论文的阅读,可以发现近十年来,我国对图像检索的研究比较理论化,缺乏对具体图像检索系统的设计、图像检索技术在实际生活中的应用与用户交互性方面的研究。对基于内容的图像检索技术,无论是从低层视觉特征,还是从高层语义中的图像检索,均是涉及理论方向的探讨居多。这表明我国图情领域有关图像检索的研究,无论是从广度还是深度上,均有较大提升空间。另外,有关图像检索系统及搜索引擎的设计与评估方面,则比较注重典型系统和搜索引擎的比较和分析,新的图像检索系统的设计较少。

(1)图像检索基本理论与概述

该主题方向主要包括图像检索的所涉及的基本原理、基本理论模型构建、已有的国外检索系统简介等。相关论文及研究内容有,毛力、张晓林1999年在“基于内容的图像检索技术与系统”一文中首先简述了传统图像检索中出现的问题,又初步探讨了基于内容的图像检索的原理,并简要介绍了国外几个典型基于内容的图像检索系统,开了我国研究基于内容图像检索的先河。2005年王彤、魏成光在“数字图像信息的组织和检索”一文中介绍了网络信息环境中数字图像信息的检索原理。随后,又有一些新的学科理论原理相继在图像检索领域涉及和应用,相关论文包括“基于压缩与特征点的快速图像检索”、“基于贝叶斯定理的遥感图像检索”“数字图书馆中基于本体的图像检索”等。由研究论文所涉及的内容可以看出,越来越多的新的学科内容将应用于图像检索领域中。

(2)基于具体图像特征信息的检索

该主题主要涉及基于具体的图像内容特征的检索方式,包括基于图像的颜色、纹理、形状等具体内容特征及其在具体实验中的应用。彭斌2000年在“基于颜色内容的图像检索”一文中论述了基于颜色内容的图像检索方法,并提出基于图像分割的颜色直方图和将主色调进行适当扩展检索,这是对原有基于颜色特征的图像检索方法进行改进的开端。随后又有多篇关于颜色内容特征的研究论文相继出现,例如毛力、张晓林的“基于颜色内容的图像检索原理与方法”、张学福的“论图书馆基于颜色内容的图像检索技术”、何立民、万跃华的“数字图书馆基于内容的多分辨率颜色特征检索和相关反馈技术”等。2006年来,并未有涉及具体图像特征信息检索的研究论文出现。

(3)图像检索的具体应用:

主要包括图像检索技术在社会农业、商业、工业、医学、艺术等方面的实际应用及实际现象研究。1999年张学福、冷伏海发表“商标数据库信息检索技术研究”一文,基于当时图像检索技术水平探讨了图像商标信息数据库的检索问题,旨在推进我国商标数据库的建设和利用,更好的满足我国市场经济发展需要。黄琨、赖茂生2007年在“彩色自然风景图片的四季特征提取”一文中根据彩色自然风景图片的特点,提出“天空去除”和“1/2区域分析”提取图像特征改进方法,同时采用四季调查法收集用户评价,然后通过多元线性回归方法建立颜色特征与用户评价的映射关系,用于彩色自然风景图片四季特征的自动提取,通过实验验证了该映射机制对于正确预测彩色自然风景图片四季特征的有效性。近年来并没有相关图像检索的具体应用研究论文的出现。

(4)图像检索交互性与反馈机制

主要讨论目前图像检索系统的交互和有关用户反馈及其相关反馈技术的发展。董文军2001年在“基于内容的图像检索的相关性反馈机制”一文中阐述了一种新的相关性反馈机制―通过对用户指定的相关及不相关图像的特征分布进行统计分析来动态更新相似性度量和查询,从而更准确地表达用户特定的信息需求及提高检索系统的性能。2006年黄琨,赖茂生在“以用户情感为线索的图像检索研究”一文中介绍了以用户情感为线索检索图像的产生背景,并提出了其实现原理、检索流程、检索系统的一般架构。从2006年以后,我国图像检索领域未有关于用户交互性的研究论文在图情领域的核心期刊中出现。

(5)图像检索系统及搜索引擎的设计与评估

该部分主要研究内容有原有系统的改进以及新系统的设计,此外还包括相关搜索引擎的设计与评估标准的研究。文燕平2001年初在《现代图书情报技术》上发表“基于内容的图像检索系统研究”一文,首次介绍了一些国外著名的图像检索系统,并且对图像检索系统的新成果进行了详细阐述。王惠、沈玉利2005年发表“基于内容的图书馆图片检索系统”一文,该文提出了一种基于特征向量的索引方法,构建了一个高效实用的图书馆图片检索系统,并对系统的构建方法进行了较详细的讨论。近年来,又相继有多篇关于图像检索搜索引擎的研究论文出现,例如:“集成式图像搜索引擎体系结构分析”、“基于用户满意度的图像搜索引擎评价研究”等。

(6)图像检索技术、方法研究

主要包含各种各样的图像检索系统的检索工具、支持技术等,以及对原有技术的评估以及对新的核心技术进展的探讨。袁方、刘明2001年在“数字图书馆中的基于内容图像检索技术”一文中分析和介绍了图像数据库构建、图像的内容描述、特征提取和匹配、快速检索等基于内容图像检索的关键技术。高仕龙2010年在“基于特征融合的图像检索算法研究”一文中提出了一种新的基于特征融合的灰度图像检索算法。期间又有多篇有关图像检索技术、算法研究论文的出现,如“图像检索中版面自动分析技术研究”、“图像检索中索引技术研究”等等。

2.2存在问题

通过阅读近年来我国图情领域核心期刊所包含的有关图像检索的126篇研究论文,并对其在发表时间、研究主题、发表期刊的分布状况进行了统计分析,发现目前我国图情领域对图像检索的研究存在着一些不足,需要做出相应的对策以促进其的进一步发展。

2.2.1整体研究水平不高

多年来我国图情领域对图像检索的研究总体关注度不高,有关研究文献分布上较为分散,并没有大量、集中、系统性的研究性文章集合出现。这种分散的趋势给有关人员查找、利用相关信息带来了不便,也不利于图像检索的深入研究。另外,我国图情领域对图像检索的研究课题独立性不强,研究理论和技术也不够成熟。因此,在重视研究成果的系统性与全面性的前提下,更应该积极借鉴国外有关图像检索的研究成果,紧密跟踪图像检索发展动态,关注热点、难点、前沿问题,提高我国图像检索领域的整体研究水平。

2.2.2研究内容不平衡

正如前面表2对论文研究主题统计分析的一样,近十年来我国图情领域有关图像检索的研究集中于图像检索基本理论与图像检索技术、方法方面,缺乏具体图像检索系统的设计,图像检索技术在实际生活中的应用与用户交互性方面的研究设计的也较少。面对这一研究现状,一方面应对现今较成熟的研究方向继续深入探索。另一方面,应拓宽研究领域,促进其他研究方向共同发展。尤其是系统用户界面、图像检索的具体应用等研究薄弱的方向更应该引起相关领域的专家、学者的足够重视。

3.发展与展望

由于其检索对象和应用领域的多样性,有关图像检索的研究具有广泛的内容,它不但吸收了传统计算机信息的存储、检索和图像处理等各方面的理论和技术,同时又促进了这些理论和技术研究的深入和发展,成为了一个目前比较热门的研究课题。目前,在图像检索技术的新发展方面,还要解决多种检索手段相结合的问题,以提高图像检索的查全率、查准率。有关图像检索算法、方法研究的发展趋势表现为,一是对原有算法的不断改进;二是新方法、新概念的引入和多种方法的有效综合运用。与此同时,图像检索有关新的算法、方法应该向更智能化、精确化和实用化方向发展。本文通过对我国图情领域有关图像检索的研究论文进行统计分析,发现我国图情领域有关图像检索研究的不足,并预测未来的发展方向,以期为今后我国图像检索领域的发展与完善起到参考作用。(作者单位:乐山职业技术学院)

参考文献:

[1]韩建新.图像数据库与图像检索.图书与情报(J),1993(03):38―40

[2]毛力,张晓林.基于内容的图像检索技术与系统.现代图书情报技术(J),1999(05):30―33

[3]柳群英.基于形状特征的图像检索技术.情报杂志(J),2004(04):87―88

[4]董文军.基于内容的图像检索的相关性反馈机制.情报杂志(J),2001(07):17―18

[5]黄琨,赖茂生.以用户情感为线索的图像检索研究.情报科学(J),2006(09):1395―1399

[6]严丽君.新浪、Google、Yahoo图像搜索引擎比较.图书情报工作(J),2003(10):83―87

[7]吴金红,张玉峰.基于内容的图像检索之相关标准研究.图书情报工作(J),2004(09):48―51

[8]高仕龙.基于特征融合的图像检索算法研究.情报杂志(J),2010(04):126―129

图像分析论文范文第7篇

【关键词】数字图像处理;SAR图像;矩特征;目标识别

1.绪论

在概率论中,矩用来呈现概率密度函数的特性,如果我们将图像的灰度值看作是一个二维或三维的密度分布函数,那么矩方法即可用于图像分析领域并用作图像特征的提取。本文主要分析讨论SAR图像的几何矩特征。由于不变矩方法能构造出旋转、平移、比例不变量而形成一组重要的反映目标形状的特征集,这种方法被广泛应用于文字识别、目标识别、场景匹配与图像配准等领域。针对SAR图像常常带有明显的几何形变的特点,用矩的良好的几何不变性进行对目标的提取可以取得较好的识别效果。

本文对用MATLAB环境下对一幅经过初步预处理的SAR图像进行仿真分析。本文分析了目标的七个不高于三阶的几何矩在图像旋转过程时的特性,对其不变性做了具体的分析,在不变的整体趋势情况下讨论其特性。主要使用了MATLAB的IMAGE PROCESSING TOOLBOX的相关图像处理函数,如图像的显示、滤波、旋转、插值和形态学处理的相关函数对一副图像进行分析。在旋转过程中,为了尽量减小图像旋转造成的图像模糊和灰度较大的变化,每次旋转后进行双线性插值运算和维纳滤波。

2.不变矩原理

矩特征主要表征了图像区域的几何特征,又称为几何矩,由于其具有旋转、平移、尺度等特性的不变特征,所以又称其为不变矩。在图像处理中,几何不变矩可以作为一个重要的特征来表示物体,可以据此特征来对图像进行分类等操作。

2.1 矩的定义

在概率论中,对于连续函数f(x,y),其p+q阶矩(moment)定义为:

式中分别为x、y的期望。

在概率论中,矩用来呈现概率密度函数的特性,例如,期望值是一阶矩,方差及协方差是二阶中心矩等。推广到力学中,它被用作刻画空间物体的质量分布。同样的道理,如果我们将图像的灰度值看作是一个二维或三维的密度分布函数,那么矩方法即可用于图像分析领域并用作图像特征的提取。

2.2 二维图像的矩

一个与平面区域有关的几何特性如大小、位置、方向及形状等,其中很多特点与矩这个参数有关。故可设二维离散图像的灰度函数用f

式中,,y0是图像亮度的矩心,零阶几何矩m00代表一幅图像的总亮度,表示图像灰度在水平方向上的灰度重心,y0表示图像灰度在垂直方向上的灰度重心。

2.3 不变矩

不变矩是指物体经过平移、旋转以及比例变换仍保持不变的矩特征量,沿用相同的定义,在二维图像中,Hu提出了7个几何矩的不变量,这些不变量满足于图像平移、伸缩和旋转不变。

若一般矩为已知,则中心矩的计算可以通过一般矩来表达,且中心矩是与图像的平移无关的。

3.实验仿真

3.1 实验仿真思路

对一幅经过去噪等初步预处理的SAR图像首先进行目标的提取。目标提取函数见附录一。对原图的7个不高于三阶的几何矩进行编程计算,把原图像进行以5°步长进行360°的双线性次插值旋转,提取每次旋转后图像的目标,计算目标的矩。通过对每幅图矩值的绘图,分析其变化规律。作为不变矩,在理想情况下,预测将具有一定范围内的稳定性。

3.2 编程流程图

如图1所示,仿真编程中,采样了单循环,每次图像旋转比上次多5度,总共旋转355度,并显示旋转出的图像。对每幅图像,调用子函数invmoments函数进行矩计算。为了便于数据的比较分析,将所以的矩建立成一个72*7的矩阵。在invmoments函数中,由于对求取的中心矩原点矩都做了归一化,故算的的矩的值会很小,为了便于表示和分析,所求得的值都是经过对原始值做了求常熟对数的计算的。

3.3 仿真结果及分析

3.3.1 目标提取

3.3.2 原图旋转和目标提取目标

3.3.3 旋转目标的矩的数值分析

a.变化幅度分析

通过对矩值矩阵的每列分别减去第一行,即原图像的对应矩,得到各矩的变化曲线如图10。

取其中变化值的绝对值最大的,并计算其变化比例,结果如表1:

观察以上数值,可以发现,在旋转过程中矩发生的变化比较小,最大的变化达到1.5%,多数集中在1%以内。

b.周期性分析

从仿真获得的旋转图上初步观察,可以发现其具有一定的周期性。我们从数值上稍做分析。由图示的周期性特点,对矩一、二、三、四、五、七用19行后没18行与前18行做差,对矩第六用后三十六行与前三十六行做差,即观察这种周期性的每个周期所具有的波动特性。用plot函数绘图如图10。

同时,对结果的绝对值统计发现,在504个数值中有65个为零,有346个数值是小于0.02,只有93个数值大于0.02。

总体观察可以发现,如果减去所有的第一周期内的数值,其余的部分具有很好的周期性,只有小部分点与周期性应具数值有微小的差别。故完全可以认为对于七个几何矩的微小范围内的变化,有较好的周期性,其中矩一到五和七具有九十度的周期,矩六具有180度的周期。

c.对整幅图像做类似的处理

对原始图像在包含较较多的背景信息的时候做旋转求矩运算,同样具有以上分析获得的类似目标的这种特性,不同的是对原图某些变化规律性不如仅对目标分析时的理想,存在一些偏离较大的点,分析其原因为由过多的背景信息在旋转等过程中带来的计算上的误差累积和较多的噪声导致。

4.结论

通过以上仿真和分析可以得出,SAR图像的七个几何矩的具有以下性质:

(1)对旋转波动变换比较小,主要集中在1%左右,即具有很好的不变形和稳定性;

(2)波动变化都有着明显的周期性。其中,矩一至五和矩七总体上都是以90度为一个周期,矩六每180度一个变化周期。这种周期说明目标图像在90到180、180到270、270到360三个范围内旋转时,矩的变化与0到90度的旋转有着基本完全相同的变化规律。对于个别的不规律点,包括矩值比其他周期同位置点理论值存在些许差别,及出现的少数偏离较大的点,可以归结为是由图像各种类型的噪声的存在导致的,这种现象都是合理的,并不影响矩的以上规律。

图像几何矩的这些特点对雷达从不同方位获取目标图像时进行目标的识别与匹配及其他很多领域的应用提供了很好的理论基础,具有广泛的应用。

参考文献

[1]Hu M K.Visual pattern recognition by moment invarints[J].IRE Trans,Ifn.Theory.1962.IT:179-187.

[2]金敏,徐守时,王行.不变矩在模式识别中的应用研究[J].计算机工程与应用,2004,40(25):65-76.

图像分析论文范文第8篇

【关键词】版面分析;模式识别;智能

1 图文分解方法[1]

对于图文混排的复杂度高的文档图像一般采用自底向上的版面分析策略,在通过连通区搜索算法(包括二次分析)获得版面全部连通区信息后即面临文本区域和图像区域的连通区信息区分问题。为方便讨论,依模式识别理论我们称文本区域和图像区域的连通区为不同的模式类对象。由于文本区域和图像区域不能出现交叠(这种交叠情况我们结合后续相同模式类对象合并过程称为合并或聚类风险),但试验表明即使在刚刚获得版面全部连通区信息,即在尚未展开后续合并等处理过程就已经存在文本区域和图像区域交叠的情况,或者说存在合并风险问题。所以有理由说合并风险将是伴随相同模式类对象合并过程始终的。由于问题的复杂性,受二分法思想启发,我们把问题逐步分解,即确立图文分解的方法。

对于一个待分析图像文档,我们将图像中的图像模式类对象:边框线和标题在原图像中滤除,同时将所提取的文字图像部分就其在文档中区域信息(该信息由对原图像的连通区搜索得到)规范化为图像文档,即作为原始文档的伴随图像。由于生成伴随图像,初步排除图像模式类对象的干扰,从而就其文字图像的版面分析的复杂度大为降低[2][3]。

需要说明的是这仅是初步做到图文分解,就是说在伴随图像中仍可能存在图像模式类信息,为此我们采取“渐进合并,特征凸现”的策略在后续处理中解决(对此将作另文详述);另一方面的关键问题是仍无法保证对不同图像模式类对象(如文字、图像甚至表格)分析的互不干扰性,而这一点正是我们要求系统所能体现出的智能性,它是由聚类稳定性算法保证实现的。

2 其他功能模块的运用

承前所述,随着并行合并过程进行,由于对模式类对象是采用“渐进合并,特征凸现”的策略,模式类对象的确定要建立在一定前提条件上,即要待其模式类特征从不明显到明显之后,但在此过程完成时会有相互冲突情况产生。尽管上述算法的采用极大提高了系统的版面分析质量,但必须佐以其他功能模块的运用来处理这种更复杂的情形。该模块的功能将分别不同情况实现:1择取强势特征模块,该情况下将保留取强势特征对象同时舍弃异类对象;2折中退让,该情况下将根据冲突的情形做单方面的退让,如可以是文本类对象退让图像类对象(简称“文退图”)等,由于该情况较复杂,鉴于篇幅作者只做一般情形解释。

3 结论

对于图文分解方法可以做策略层面的理解,这对于整个版面分析系统的质量是举足轻重的,但没有其他方法的辅助则很多具体问题仍不可得以完善和解决,因为版面分析要面临很多复杂的模式识别问题。本文正是探讨通过两者的融合从而是系统最终能体现出智能性的特点,进而获得实际应用的价值。

【参考文献】

[1]周长岭.中文OCR中的版面分析算法初探[C]//第六届全国汉字识别学术会议论文集,重庆.1996:137-142.

图像分析论文范文第9篇

关键词:医学图像分析;实践教学;教学改革

一、课程背景

医学图像分析是一门医学影像与信息学图像处理相结合的课程。主要学习如何采用图像处理方法对医学图像数据进行增强、勾画、分割、识别等操作[1]。主要授课对象为医工结合专业如生物医学工程、医学信息工程等的本科生或研究生。其主要教学目标是让学生掌握医学图像的采集原理,各种不同类型的医学图像的特点,不同医学图像主要面临的问题,不同医学图像遇到的问题的传统解决方法,并启发学生思考新的解决思路[2]。近几年,由于计算机运算速度的进步以及机器学习算法的快速发展,医学图像分析发展迅速,在医学临床上应用越来越广,例如肺结节的识别、脑灰质白质的分割以及辅助诊断等。总之,医学图像分析在临床上扮演着越来越重要的角色。目前医学图像分析在产业界的发展迅速,相关企业不断涌现,国内目前相关企业超过100家,融资上亿的企业近20家。因此,该课程的重要性也逐渐突显。医工结合是医学与工科学科结合而产生的未来医学的重要发展方向。近几年,综合类大学纷纷创办医学院,其中医工结合是这些综合类大学医学院的重要方面,而医学图像分析又是目前医工结合的优秀范例[3]。然而,目前医学图像分析课程的教学存在重视理论讲述,忽略实践操作的现象。同时医学图像与传统自然图像存在着较大差异,例如信噪比低、图像维度更高、与自然图像纹理显著不一致等问题。因此,医学图像分析与传统图像处理课程存在较大差异。笔者在教学过程发现,学生在学习该门课程后,存在理论与实际脱节的情况。大部分学生反馈在进行课程学习之后,尝试将学会的图像处理方法用于实际医学图像分析时,遇到各种问题,例如:由于数据维度不一,传统二维自然图像处理方法无法用于三维或者四维的医学图像中;由于信噪比的问题,传统自然图像处理方法运用到医学图像上后效果不佳。因此,医学图像分析的教学应该与传统自然图像的处理课程有所区分,需要针对医学图像进行分析与教学。

二、现存教学问题分析

在教学完成后,通过学生反馈,获得的教学反馈问题如下:(1)课程中讲授的图像处理方法多基于二维图像,但医学影像中存在大量其他维度影像,如脑电信号为一维图像,CT、磁共振为三维图像,PET、功能磁共振为四维图像,不知如何处理;(2)课程讲授中出现的自然图像大多分辨率较高,而医学图像分辨率较低,将算法运用于图像分析后效果不佳;(3)构建辅助诊断模型时,自然图像样本量较大,而医学影像样本量相对较小,同时数据维度更高,构建出的模型效果较差。如图1所示,笔者分析与总结现存教学问题之后,认为主要是以下三个原因导致出现了上述教学问题。

(一)自然图像与医学图像存在差异

如表1所示,传统自然图像与医学图像存在较大差异,目前医学图像分析课程讲授的大部分课程内容与传统图像处理一致,涉及的医学图像多为与自然图像性质相近的二维X光图像或单层CT图像。这种差异导致课程所学算法难以直接用于医学图像的分析与处理。

(二)学生缺乏对医学图像特性的了解

学生在学习课程的时候对医学图像的采集过程以及图像特性不了解,导致难以对现有图像处理方法进行改进或者提出新的图像处理方法以适用医学图像。图2所示为一个典型的三维大脑MRI医学图像,该图像具有分辨率低、维度高等特点。

(三)缺乏与临床影像科医生的交流

本门课程的教学主要由图像处理相关老师完成,临床医生没有参与教学。这种缺失进一步导致学生对医学图像以及医学图像在临床上遇到的实际问题缺乏了解,难以提出真正解决临床实际问题的医学图像处理方法。

三、教学改革方案

鉴于目前医学图像分析课程教学存在的问题,笔者结合综合类大学医学院基础条件,提出以下五方面的教学改革措施,并设计了一套医学图像分析教学流程。

(一)增加医学成像原理教学

医学成像原理是一门讲解各种医学影像的采集原理、采集方法的课程。该课程可帮助学生深入理解医学图像的由来,从图像成像原理的部分深入理解各种医学图像的特性,例如脑电信号的位置坐标系统、磁共振图像的无标度特性、PET图像如何从四维图像转变为三维图像等。学生通过该部分理论的学习,了解不同医学图像的特点。

(二)图像处理老师与临床影像科医生携手教学

综合类大学医学院教学相对于其他学院的一大重要优势在于学院具有大批一线临床工作者。相对于学校教师而言,一线临床工作者对于目前医学影像在临床实践中需要解决的问题更为熟悉。临床医生参与教学,可进一步让学生了解自己所学知识可用于解决哪些临床实际问题。在了解到这些的基础上,学生能够理清今后工作中的实际问题,对实际问题有了进一步的了解后才能思考如何对所学理论方法进行融会贯通,并在此基础上进行创新改进。

(三)增加医学影像采集教学环节

在完成医学成像原理的理论教学之后,为进一步让学生理解医学影像采集原理及其特点,结合医学院条件,可安排学生进行各种医学影像采集的实践操作。在影像采集实践操作过程中,学生不仅能深入理解各种医学影像的成像原理,还能进一步了解到各种图像常见噪声的来源与特点,例如磁共振图像的运动伪影的由来及其特点。学生在进行图像处理算法学习之后,能够针对性地对各种不同噪声进行处理分析,或者在了解噪声特点的情况下,能够针对性地提出图像处理算法降低噪声的影响。

(四)结合

Octave进行实践算法教学传统图像处理是一门理论性较强的课程,近些年,该门课程的教学更多地提倡理论与实践融合。Octave是一个类似MATLAB的数学计算软件,其语法模仿了MATLAB。MATLAB是目前世界上最常用的数学分析软件之一,其具有强大的图像处理能力,是目前科研界常用的图像处理平台。Octave在继承MATLAB语法的同时,还具有免费开源的优点。在讲授完图像算法理论之后,将要求学生基于医学影像采集环节得到的医学影像数据,基于Octave进行编程实践,在实践过程中学生将切实感受到各种图像处理算法的作用,以及在医学影像数据上与自然图像不一致的效果,从而激发学生继续探索,对算法进行改进以适用医学影像数据。

(五)改变课程考核方式

基于实践教学的医学图像分析课程在考核环节应该更加注重考核实践操作[4]。笔者在教学过程中,最终考核环节题目设置为:基于课程讲授以及实践教学,提出一个医学图像问题,并给出解决方法。答题模板如表2。学生通过回顾与总结本门课程中的医学图像实践采集环节与后续图像处理算法理论,思考一个现实生活中会遇到的医学图像问题,最后选用合适的图像处理方法或者对现有的图像处理方法进行改进来解决该问题。上述考核方式注重考核学生“提出问题”与“解决问题”的能力。

(六)医学图像分析的实践教学流程总结

前面笔者提出了不同的医学图像分析课程的实践教学环节,最后对全部环节进行一个总结,提出一套医学图像分析的实践教学流程,如图3所示。希望上述教学模式能给具备相应条件的综合类大学医学院的医学图像分析课程教学提供一定的帮助与启示。

结语

通过总结与分析医学图像分析课程教学中遇到的问题与学生反馈,结合本单位的实际情况与优势,本文提出在医学图像分析课程教学中增加诸多实践环节,以提升学生对本门课程的认识,增强对医学影像原理及问题的深入理解,在此基础上培养与提高学生“提出问题”的能力。在图像处理教学环节,提出基于Octave的实践教学环节,在图像处理理论学习的同时,增强学生理论结合实践的能力。最终通过实践考核,考核学生“提出问题”与“解决问题”的能力,通过提出并解决医学图像相关问题达到对本门课程教学内容的深入理解,从而培养出能够学以致用,并能解决实际临床医学影像问题的学生。

参考文献:

[1]汤敏,张士兵,沈晓燕.医学图像处理与分析课程的实践教学改革研究[J].中国教育技术装备,2014(2):90-91.

[2]陈跃,杨建茹.医学图像分析实验教学改革的研究与实践[J].中华医学教育杂志,2004(03):45-46.

[3]黄忠江,姜增誉,陈文青,张智星.基于人工智能的医学图像分析在脑肿瘤中的应用进展[J].中国医学影像学杂志,2021(6):626-630.

图像分析论文范文第10篇

关键词:新闻图像;视觉说服;ACTS模式

中图分类号:G20 文献标识码:A 文章编号:1000-2731(2012)03-0163-05

图像在现代传播中发挥越来越重要的作用。它能吸引全社会的注意,影响公众的舆论,甚至有时能改变国家政策、行为。越南美莱村大屠杀等照片的公布改变了美国公众对越南战争的看法,并促使美国停止了那场战争;美国士兵在伊拉克的虐俘照片公布后,使美国政府颜面扫地;2009年《华商报》刊登的《挟尸要价》照片,该照片夺得了2010年中国新闻摄影最高荣誉“金镜头”奖,也在全国引起了轩然大波,引起了人们对社会良知的反思。总体来说,传播从过去以文字为主时展到今天图文并重的多媒体时代,一场视觉革命正在蔓延。图像作为传播的一种重要方式,正潜移默化地影响着人们的思维模式和行为方式。本文将图像作为文本,基于符号学理论和阿恩海姆视知觉形式动力理论,提出视觉传播机制ACTS模式,即从吸引注意(Attention)、引向内容(content)、展现主题(Theme)和积淀为符号(Symbolic)四个层面来解析图像的视觉说服机制。本文以新闻图像为例,一方面向传播者揭示成功的视觉传播效能是如何实现的、可以怎样实现;另一方面也向受传者揭示视觉传播是如何影响人的态度、行为的。

一、新闻图像:从表征到说服

新闻图像是以视觉符号为载体对新闻事实进行的视觉报道。按照其表现形态可以分为静态新闻图像和动态新闻图像两种。前者主要是指新闻照片和新闻漫画、图表等,也被统称为新闻图片;而后者则包括电视图像和网络视频等动态影像。在新闻图像的生产过程中,无论是摄影(像)师还是观者,总是有意或无意地将自己的观念、情感、经验融入其中,从而使图像体现了权力和意识形态等社会文化内涵。因此,新闻图像是一种文化表征。在新闻图像形象性、纪实性、真实性的背后,隐藏的是视觉符号语言逻辑和文化意义。那么人们不仅要问,新闻图像的话语、权力以及意识形态等是如何通过视觉符号建构的?能不能为观者提供一种解读新闻图像的方法论?

英国伯明翰学派领军人物斯图尔特·霍尔引用罗兰·巴尔特《今日神话》中“一黑人士兵向法国国旗敬礼”的一个例子,运用符号学理论分析了视觉表象建构意义的方法。对我们分析新闻图像的意义建构有一定的借鉴价值。

有一天巴尔特去理发店,看到一本法国杂志《巴黎竞赛》封面上有张照片,照片上一个身穿法国军服的黑人青年正在敬礼,双眼上扬,可能注视着一面三色旗(法国国旗)。在第一层次上,……这产生了带有简单的字面信息或意义的一系列符号:一个黑人士兵正向法国国旗敬礼(直接意指)。但是,巴尔特论证道,这形象还具有更广泛的文化意义。……“法国是一个伟大的帝国,她的所有子民,没有任何肤色歧视,都忠实地在她的旗帜下服务,对于那些提出所谓的殖民主义的诽谤者,没有什么比这个黑人服务于他的所谓压迫者时所显示的热情更好的回答了。”……在第一个过程中,各种能指(形象的各种要素)和所指(概念——士兵、国旗等等)联合构成一个带有单纯的直接意指的符号:一个黑人士兵正向法国国旗敬礼。第二阶段,这个完成的信息或符号被联系到第二层所指——有关法国殖民主义的一个广义的意识形态主题。

之所以这样引用,是因为这个例子是我们接下来要探讨问题的起点。符号学方法是分析视觉表征的一个有效方法,其一层层有条理的分析,展现了意义的建构过程。但是,从第一层的“直接意指的符号”到第二层的所指是如何实现的?也就是说,对是什么让巴尔特从“一个黑人士兵正向法国国旗敬礼”产生了“法国是一个伟大的帝国,她的所有子民,没有任何肤色歧视,都忠实地在她的旗帜下服务”这种意识形态的?巴尔特和霍尔等符号学家认为这两者之间是自明的,没有对这个问题进行进一步阐释,这也许是符号学需要进一步拓展的方面。实际上,在第一层的直接意指和第二层的所指之间还有一个环节——视觉传播机制,即在这两者之间有个视觉传播机制在起作用。也就是说,从新闻图像的编码到其解码的过程中,或者说从视知觉形式层面到文化意义层面有一个视觉传播机制在起作用。下面将运用基于符号学理论和阿恩海姆视知觉形式动力理论的ACTS模式来剖析新闻图像的视觉传播机制。

二、阿恩海姆的视知觉形式动力理论简介

在介绍视觉传播机制ACTS模式之前,需要了解一下阿恩海姆视知觉形式动力理论(Visual Per-ception Form Dynamics),作者已经对此进行过较为详细论述。概括地说,该理论认为,视知觉形式动力一方面是视觉形式建构的动力机制,完形倾向是一种动力机制;另一方面表现为动态形式。从表现形式上看,视知觉形式动力就是我们在图像中感觉到的那种视觉力,是一种心理力,比如人们常说的“视觉冲击力”。我们在一张纸中随便画一个小圆圈,会发现它有向某方向运动的趋势,它有作用点、方向和强度,因此被阿恩海姆冠称为“视知觉形式动力”。该理论对于视觉传播机制主要有以下三个方面的应用价值:第一,只有视知觉形式动力才能被视觉所把握,视知觉形式动力是探寻表征(现)之门径;第二,运用视知觉形式动力把视觉形式与情感统一起来,从大脑的生理机制上讲,情感表现也是视知觉形式动力的活动,而且视知觉形式动力具有最自然、最深刻的象征意义;第三,揭示了生成视知觉形式动力的方法。它们是视觉传播机制ACTS模式的主要支撑理论。

图像分析论文范文第11篇

1.1海报的首要功能

社会符号理论的基本理论认为,所有符号系统都是社会性的,这集中体现在符号系统的社会目的。据此可知,海报也有自己的社会目的。海报众多社会功能中最显而易见的一个就是信息传播,在信息技术不发达的年代尤为如此。然而,这一切在工业革命以后发生了很大的变化。众所周知,工业革命极大地促进了生产力发展水平,人类历史上第一次出现了产品超过需求的局面。在此大背景下,各学科都在探讨影响受众消费决策的方法,直接导致了包括市场营销、广告学在内的新兴学科的发展。由此,海报的社会功能也发生了显著的变化,由最初的信息转变成了说服受众。可以说,当代世界海报的首要功能还是为了说服受众,让他们接受海报传播出的信息。基于上述对海报首要社会功能的理解,前期研究着力解决的问题就是要解释海报是如何通过图像系统来传递信息并说服受众的。

1.2研究方法和数据

考虑到上述研究目的,最终选取质性扎根理论(QualitativeGroundedTheory)作为本研究的研究方法。扎根理论由社会学家BarneyGlaser和AnselemStrauss于1967年提出,其核心思想是通过归纳法从大堆数据中得出能解释数据分布特征的理论。因其在构建新理论框架方面的有效性,后来被广泛应用到社会科学研究中,作为发展相关理论的重要研究方法。扎根理论一般包括下面三个研究步骤:开放式编码、轴心编码和选择编码。根据扎根理论的要求,本研究主要通过专门的海报数据库网站(如PosterArchives/archives)开展了系统的海报收集工作,共收集到589份商业或政治宣传海报,时间跨度从二十世纪初到2012年,涵盖欧美,亚洲等十多个国家和地区,尽可能代表了不同文化和历史背景下的海报。每份海报的年代、国家/地区、出处等特征描述性信息都在编码后被输入数据库软件,以备后续分析之用。

1.3基本原理

研究发现,数据呈现的核心属类可通过综合锚定和横向组合关系来加以解释海报通过图像来说服受众的机理。在文化教学和研究中,常常需要比较两种文化的异同。实践证明,海报图像分析框架能揭示隐藏在图像背后的文化同质性,为文化教学研究工作提供了稳定便利的分析工具。

2实例分析

本节的分析材料呈现在,分析的目的是要通过分析框架来揭示英美两国大众文化的同质性。是美国纸币上广为人知的一句话“InGodWeTrust”,常常被误读为美国人信仰上帝的证据(“一个国家把对上帝的信仰写在钱上,可见他们有多信上帝”)。这句话的真实意义其实与美国发行纸币的背景有关。美国立国之初,货币大多是硬通货,加之当时合众国刚成立,老百姓对其发行的纸币是否有效还有相当大的疑虑。因此,美国财政部在纸币上加上“InGodWeTrust”这句话和财政部长的签名,就是要说服老百姓相信纸币的有效性。从这个角度看,美国纸币上的这句话和财长的签名也可视作一种海报,因为它和传统海报一样,也在说服其受众接受某一理念。英国新闻部于1939年8月份二战爆发前印制的宣传海报,预计在战争爆发24小时内能够立刻投入使用,在战争期间起到了鼓舞士气安定民心的作用。该海报设计简洁,字体易于识别,需要特别说明的是文字上方的王冠式样是都铎王朝特有的,象征集世俗和宗教权力为一身的英王乔治六世。显然,也是一个海报,其目的也在于说服手中就接受一个理念,即保持冷静,照常生活。根据分析框架,海报为了说服受众接受一个新理念,通常会将这一理念以图像的方式表现出来,再将其图像表征通过横向组合关系与一个广为受众接受的图像表征结合起来。因此,要考察隐藏在海报图像背后的文化同质性,只需要看这些海报都用什么理念来说服受众(即Acc.VP),这些理念的同质性就是文化同质性的具体体现。据此,可以通过几个简单的步骤来分析隐藏在海报图像背后的文化同质性,现以海报为例将这些步骤说明如下:

(1)理解海报的社会目的。

几乎所有的文本都是为实现某一或某些社会目的而生成的。具体到美国钱币上的InGodWeTrust,它仅仅是要用上帝的名义来给当时殖民地政府发行的纸币做信用背书,旨在使纸币的持有者相信纸币的效力,这和每张纸币上都有财长的签名是一个目的。类似地,英国战前的海报则需要让英国臣民接收海报传达的信息。简而言之,社会目的都是说服受众接受某一个理念(A是纸币的有效性,B是继续冷静地生活)。

(2)发现海报中希望受众接受的理念及其图像表现。

通过(1)的分析,至此应能发现希望受众接受的信息是纸币是有效力的,其图像表现就是纸币本身;两个大写的押韵短句(Keepcalmandcarryon)。

(3)发现海报中已被受众接受的理念(锚定)及其图像表现,并比较它们的特性。

很明显,锚定是美国民众对上帝的基督教信仰,其图像表征就是InGodWeTrust;而锚定则是民众对国王作为宗教领袖的信仰。众所周知,英国君主自光荣革命后只保留了虚位,虽说名义上是国家和教会的领袖,但却没有行政特权。因此,英国君主更多的只是的代表,这两点可以从英国君主正式名号的最后一个头衔“DefenderoftheFaith”以及英国国歌中得到印证。这也就是说,都铎王冠更多地是的图像表现。通过上面的分析不难发现,虽然锚定在具体表现形式上有不少差别(如字体,背景颜色等),但它们都有一个非常重要的共性,即都是。这也就是说,尽管美国纸币和英国二战海报在文化和时空上有很大的差异,但它们代表的文化却有非常惊人的同质性:美国人和英国人都通过来推广新的理念。

(4)寻找其他证据来增强(3)的共时效度。

共时效度是指一个理论与其他已经证实的理论间的相关性,在此引入该标准就是为了增强步骤(3)分析结果的有效性。在本例中,能在欧洲文化历史中发现以宗教或上帝的名义推广新思想的传统。例如英国1381年农民起义的宣言人JohnBall就曾用上帝和宗教的信仰来支持他对自由和平等的论述:Inthebeginningwewereallcreatedequal.IfGodwilledthatthereshouldbeserfshewouldhavesaidsoatthebeginningoftheworld(LindsayandGroves,1950:72);近400年后,美国的革命者又在《独立宣言》里用“Allmenarecreatedequal”来向欧洲大陆的启蒙思想致敬。上述两项证据证明欧洲有用来为新思想做背书的传统,而(3)的分析正好与这一传统相符,从而增强了这一分析的共时效度。综上,海报图像分析框架能有效地揭示隐藏在图像背后的文化同质性,为文化研究和教学工作提供了一个有效的分析工具。

3小结

图像分析论文范文第12篇

关键词: 多模态话语分析 视觉语法 公益广告

1.引言

公益广告的目的在于强化公众的社会意识,并在潜移默化中影响人们的思想意识与行为,并且通过不同的感官渠道,以不同的核心模式向观众提供丰富的媒体资源,使人们可以更好地了解和感受世界。广告是最显著的运用多种符号构建意义的语篇载体。传统广告的语篇分析主要是对广告语言的语法、词汇、文体及修辞特点进行研究,忽视了其他表意系统,如图像色彩等。多模态话语分析的出现恰好满足了分析电视节目及广告中包含丰富资源的需要。

多模态是指除了文本之外,还带有图像、图表等复合话语,或者说任何由一种以上的符号编码实现意义的文本。Kress和Van Leeuwen于1996年提出了系统的视觉语法。他们从多个方面进行研究,向读者展现了图像表意的途径与方式。本文运用多模态语篇的社会符号学分析方法对一则电视公益广告进行分析,旨在揭示文字与视觉两种模态互动的意义共建功能。

2.多模态语篇分析的理论框架

自Harris于20世纪50年代初提出语篇分析的研究方向之后,语言学家提出了多种话语分析理论和方法。这些理论和方法,基本上只分析语言系统和语义结构本身,忽视图像、声音、颜色等其他表意符号。这就使得传统语篇分析带有较大的局限性。上世纪90年代西方兴起的多模态语篇分析,指出分析一个语篇,如一则杂志广告的文本和形象,或一部电影的影像、音乐和有声文献等几个或所有不同符号模态的意义表达。因此,多模态语篇分析在很大程度上克服了传统语篇分析的局限。视觉语法指出模态就是符号形式,多模态语篇是多种符号资源整合的结果。该理论正是根据Halliday的社会符号学,并以系统功能语言学理论为基础构建的,它比照语言的三大元功能建立了图像的三大元功能,创造出了图像的三种意义:再现意义、互动意义和构图意义。目前这一理论已被广泛运用于广告新闻网络语篇等相关领域。

3.对一则公益广告的多模态解读

本文选择目前在央视各大频道播出的一则公益广告FAMILY为例。这则广告具有以下特点:背景画面简单,动作者较少及话语说明简单,却很生动地表达出了“家”这一主题,从而唤起观看者爱家、爱父母的情感共鸣和意识。本文根据图像的再现、互动和构图三个元功能分析该广告如何通过图像与文字的共建意义达到广告目的——唤醒观看者的爱家意识。

该广告主题为FAMILY,“Family”=Father and Mother,I Love You。“家”就是儿女从内心发出的表白:爸爸和妈妈,我爱你们。该广告将组成FAMILY这个单词的每个字母都拆开,并且其中每个字母都代表家庭中的每个角色,讲述了一个非常感人的关于孩子在家庭中成长的故事。故事中的F(爸爸)和M(妈妈)在I(孩子)小的时候细心呵护,可随着孩子的长大,当孩子有了主见,会与爸爸妈妈发生冲突,这使爸爸妈妈十分伤心,并流下了眼泪。后来,孩子成年以后,体会到生活的艰辛,才发现爸爸的背早已弯曲,妈妈的身体也已臃肿,于是孩子主动承担起家庭的责任长成参天大树,让年迈的爸爸可以依靠,替年老的妈妈遮挡盛夏的骄阳。广告的最后出现了Father And Mather I Love You这句话,爸爸妈妈我爱你,结束时出现了一行字:有家就有责任。

3.1广告的再现意义

Kress 和Van Leeuwen(1996)提出的再现意义表示图像和语言一样能够如实地再现客观世界中的人物、地点、实物和人类的内心活动。再现意义分为叙事再现和概念再现。其中,叙事再现指图像通过各个再现意象讲述正在发生的“故事”。概念再现包括两个过程,相当于系统功能语法中及物性的关系过程和存在过程。图像中有无矢量的产生将叙事再现与概念再现区分开。图像中,矢量代表过程与方向的力量,图像主要动作参与者被矢量这条无形的线条相连,观看者可以通过图像中的矢量关系判断主要动作参与者之间的互动关系。

画面中,常人家中的桌椅,沙发,门窗,后面出现的高楼大厦,以及夏日的骄阳,风雨,属于概念再现,构成了整个广告的背景。该广告的概念意义包含三种象征意义:(1)常人家中的桌椅、沙发、门窗,这些物件都是每个家庭里都有的,采用温馨的颜色,构成了家的背景,象征着温馨的家庭氛围;(2)随后出现的高楼大厦,象征着孩子成人长大,走入社会,学着生存,生活;(3)骄阳和风雨象征着父母与孩子相互为彼此遮风挡雨,幼时父母对孩子呵护,成人后孩子对父母的爱护,承担起家庭的责任。画面中,FAMILY占据了画面的大部分,其中,F(爸爸),M(妈妈)和I(孩子)是主要动作参与者,也是矢量的主要发出者。整个广告里有多个动作过程,即动态的反映过程。F(爸爸),M(妈妈)和I(孩子)之间有互动,如I(孩子)小时,母亲的细心呵护,父亲为家庭遮风挡雨,渐渐长大,孩子开始顶撞父亲,父母对他的教育唠叨,孩子对他们的顶嘴,以及孩子成年后,成长起来,张开双臂为父母遮风挡雨,这些相互之间的互动,即矢量,表明了孩子的成长,家庭父母随着孩子成长所发生的变化,以及联结双方之间的纽带:爱与责任。同时将爱与责任贯穿于整个动态过程中,在观看者心中形成一个温馨的家庭,父母与孩子彼此爱护,唤起观看者爱家、承担责任的共鸣。

3.2.广告的互动意义

视觉语法中,互动意义对应系统功能语言学的人际元功能,是关于图像的制作者、图像主要参与者和观看者之间的关系,也表示观看者对主要参与者的态度。实现互动时,有四个要素:接触、社会距离、视角和情态。

3.2.1接触

Kress和Van Leeuwen指出图像传达意义由图像主要参与者的凝视系统实现,该凝视表达分为:索求和提供。索求就是图像主要参与者和观看者之间有直接的视线接触,所表达的是要求观看者加入到图像主要参与者的活动中。在该广告图像中,F(爸爸),M(妈妈)和I(孩子)的眼睛及视线并未明显清晰地表现出来,图像的主要动作参与者通过展示家庭的生活,孩子的成长及父母的呵护等,让人们产生情感共鸣,唤起人们心中对父母、对家庭的爱与责任,并为之行动。

3.2.2社会距离

视觉语法中,社会距离主要由图像取景距离的远近决定。在广告中,FAMILY的家庭生活以社会近距离呈现出来,即图像主要参与者占整个图像一半以上的距离,观看者可以清晰地看到图像主要参与者的整个形象。整个画面突出F(爸爸),M(妈妈)和I(孩子)之间的互动,给人们一种身处其境的感受,表明了每个人与家庭不可分割的感情。这与广告所要表达的含义相符合,每个人都是家庭中的成员,不论是小家还是大家,家庭成员彼此爱护,成员对家庭负有责任。

3.2.3视角

Kress和Van Leeuwen指出,图像主要参与者与观看者形成的视角体现图像的态度。仰视表明了图像中的参与者处于权力的一方,平视表明参与者和观看者之间平等的关系,俯视表明观看者处于权势一方。该广告的主要参与者——F(爸爸),M(妈妈)和I(孩子)与观看者处于平行视线中,表明了任何一个观看者都可能是广告中的家庭F(爸爸),M(妈妈)和I(孩子)中的任何一员,而广告中所表现的生活都是每一个人再熟悉不过的家庭生活。这样更能唤起观看者的共鸣。

3.2.4情态

情态指对世界所做出陈述的真实度和可信度。在该广告中,色彩以黄色和橙色为主色调,而这两种颜色都属于暖色调,用在该广告的情境中,给人温馨的感觉,这也是想要表达及家庭所具有的感觉。随后,画面采用了蓝色的高楼大厦,在整体灰色的基调下,这两种颜色都为冷色调,象征着孩子成年后,踏入社会,所感受到的生活的辛苦与艰难,以及在孩子爱护父母,承担起家庭责任的情境下,衬托出孩子的成长与坚强,以及其对家的爱。

3.3广告的构图意义

构图意义对应功能语法的语篇意义,通过三种资源得以实现:信息值、显著性和取景。Kress 和Van Leeuwen指出上下方图像具有不同的信息值,置于上方的是“理想的”,下方的是“真实的”。该广告中,没有上下图像或远近图像的放置。在背景图像下,图像的主要参与者FAMILY居于图像的中央,通过F(爸爸),M(妈妈)和I(孩子)的动态过程,讲述故事,图像下方,有文字随着上方的动态过程,作相应阐述,即写实性描述。

显著性是指元素吸引观看者注意力的不同程度,可以通过被放在前景或背景、色调值的对比、相对尺寸、鲜明度的不同来实现。该广告中,FAMILY占据了大部分画面,采用黄色这一鲜亮的色调,突出背景的基调,属于前景化,吸引人们的眼球,抓住人们的注意力,讲述故事,传达故事的核心,唤起人们爱家、承担责任的意识。

4.广告中图像与文字的意义共建

Kress和Van Leeuwen明确指出,图像和语言都是实现语义关系的基本方式,作为意义的表征,很多情况下可同时由图像与文字实现。图像的意义经常具有模糊性,可以进行不同的解读,这就意味着图像和语言一样,对社会现实和心理现实既具有复制作用,又具有重新构建的作用。但配上文字,其所指就会清晰。在本广告图像中,语言起辅助作用。每个动态过程,图像下方都配有相应的文字阐述。广告结尾,图像表明了FAMILY的含义,“Family”=Father and Mother,I Love You,爸爸妈妈我爱你,以及广告想表达的思想:家,有爱就有责任。该广告中,图像与文字互为补充说明,构成了一个完整的语篇。

5.结语

本文介绍了在系统功能语法基础上发展起来的多模态语篇分析方法——视觉语法,对所选的公益广告的再现、互动和构图意义进行了详细的分析,指出了广告语篇中的图像和语言是通过视觉语法相互作用共同构建出语篇意义。一方面证明了传统语篇分析的局限性,另一方面指出了建立在系统功能语法上的多模态语篇分析的优越性。随着科技的进步还会有更多的社会符号出现,多模态语篇所包含的符号将会越来越多,这就给研究者提供了更多研究方向。

参考文献:

[1]Halliday M.A.K.An Introduction to Functional Grammar[M].London:Edward Arnold,1994.

[2]Kress,G.& van Leeuwen,T.Reading Images:The Grammar of Visual Design[M].London:Routledge,1996.

[3]孔亚楠.多模态环保广告语篇的社会符号学分析[J].外语艺术教育研究,2009(2):23-28.

[4]朱永生.多模态话语分析的理论基础与研究方法[J].外语学刊,2007(5):82-86.

[5]魏晓茹.社会符号学视角下的多模态语篇分析——以洛阳中国2009世界邮展展徽为例[J].燕山大学学报,2008(11):106-107.

图像分析论文范文第13篇

关键词: 社会符号学 多模态话语分析 视觉语法 第16届广州亚运会会徽

1.引言

随着数字化时代的到来,语篇日益凸显多模态化,多模态话语分析成为了国内外语言学家研究的热点之一。胡壮麟指出,在人类进入社会符号学的多模态化的新世纪,对多模态识读能力的培养应引起重视[1]。李战子说:“图像时态的到来,特别是图像在媒体,教育和儿童文学中的大量生产,使我们无法忽视多模态,也不应该认为它比单一模式的话语低下而置之不理。”[2]Kress提出,所有模态都具有表达意义的潜势[3]。

第16届亚洲运动会在我国广州举行,此届亚运会会徽以柔美上升的线条,构成了一个造型酷似火炬的五羊外形轮廓,构图以抽象和具象相合,在灵动中不失稳重,象征着亚运会的火炬熊熊燃烧、永不熄灭,既体现了广州的城市象征,又表达了广州人民的美好愿望,还表现了运动会应有的动感。

本文从多模态话语分析的角度,以第16届广州亚运会会徽为例,运用视觉语法的研究方法进行分析,进而解读图像作为一种社会符号是如何产生意义的,并且揭示图像和文字的表意功能。

2.理论背景

2.1多模态话语的普遍性

话语的多模态并非是一个新现象,而是人们一直以来在实践甚至理论研究中总是趋向于关注一种模式而忽略其他模式,例如,朱永生认为话语分析基本上局限在语言本身,即只注重语言系统和语义结构本身及其社会文化和心理认知之间的关系,忽视了诸如图像、声音、颜色、动漫等其他意义表现形式[4]。图像建构的意义,以及只有通过两种模式共同作用才能表达的意义就被置于边缘地带或者完全被忽略。实际上,各种符号模式也参与意义表达,只是它们属于意义构建的不同层次。例如,“一图抵千言”的俗语就侧重单独图像意义的构建,新闻报道中文字与图片的结合则强调文字与图片的互补性。“语言使用,不管是口语还是书面语,总是不可避免地由多种交际模态构建”[5],所以,“所有的文本都是多模式的”[6]。随着社会的发展和科技的进步,特别是随着数字、网络和多媒体技术的广泛使用,传统语法认为是副语言的图像、颜色、声音和动作等符号在现代交流中不再处于辅助位置,而是正在和语言符号一起形成更为宽泛的符号资源共同参与构建意义。

2.2多模态话语分析的社会符号学理论基础

首先提出“多模态话语”的是克瑞斯和赖文。理论基础是韩礼德系统语法功能中的相关理论。韩礼德在其《功能语法介绍》一书中主张语言是社会符号系统,提出了三大元功能,即表示概念意义的概念功能,表示说话人和听话人之间的关系和说话人对说话内容态度的人际功能,以及表示语篇构建意义的语篇功能。因此,多模态话语分析理论的社会符号学基础即是把语言作为社会符号所具有的三大元功能延伸到除语言之外的其他符号,并把包括语言在内的各种符号看作是各自独立而又相互作用的符号资源,在分析语言特征的同时强调图像、颜色、声音和动作等视觉、听觉和行为方面的符号模态在话语中的作用。Hodge和克瑞斯归纳出用以指导阐释多模态话语两个理论前提,并进一步强调社会符号在社会实践中的应用,强调符号的动态表意功能[7]。由此可见,社会符号学为理解视觉化语篇提供了一个总的描述的语法。

2.3视觉语法

克瑞斯和赖文基本接受了韩礼德的系统功能语言学观点,并且进一步发展了自己的理论。克瑞斯和赖文指出多模态话语分析也是一个符号系统,每种模态(文字、图像、声音)在语篇中作为独立的部分存在并产生意义;所有的模态系统组合,作为一个整体产生语篇意义[6]。克瑞斯和赖文在韩礼德三大元功能基础上,主张图像的社会符号性,认为:“正如语言的语法决定词如何组成小句、句子和语篇,视觉语法将描写所描绘的人物、地点和事物如何组成具有不同复杂程度的视觉‘陈述’。”[6]他们将韩礼德的语法功能延伸到图像分析,建立了以“再现意义”、“互动意义”、“构图意义”为中心的视觉语法理论框架,与韩礼德三大元功能一一对应。

3.1会徽的图像解读

第16届亚运会会徽可以看作是一个由图像、文字、颜色构成的多模态语篇。整个语篇由意象、文字、颜色构成,以红色为主要基调,黄色和黑色搭配而成。意象的创作来自“五羊的传说”,在会徽的意象中“五羊”被设计成四条跑道,又作火焰状,意喻亚运火炬,一直延伸向天空中的太阳。图像下方是“16th Asian Games”和“Guangzhou 2010”,中西合璧;两行文字均采用黑色,但是“Guangzhou 2010”采用粗体汉字字体,突出我国文化底蕴的深厚。

3.2会徽的多模态话语分析

3.2.1再现意义

克瑞斯和赖文认为再现意义包括叙事和概念两大类,其中叙事的再现包括行动过程、反应过程、言语和心理过程。概念的再现包括分类过程、分析过程和象征过程。李战子[2]指出在图片中,使图中的元素形成斜线就形成矢量。矢量是叙事图像的表示。叙事再现指图像中参与者被连接起来后对相互做某件事。行动过程中最为突出的参与者可以通过尺寸、位置、颜色等判断。克瑞斯和赖文认为概念再现中分类过程是将参与者分为主从的过程;分析过程是分析显性和隐性的过程;象征过程是关于参与者是什么或者意味着什么。

会徽中的主要意象基于广州“五羊的传说”,五只羊演化成了燃烧的火焰,一直伸向天空的太阳,隐含着行动过程的参与者;五只羊又可以理解成四条跑道,一直延伸到世界的尽头,寓意了亚运会的发展将永无止境;火焰、跑道的“目光”投向天空中的太阳,形成了反应过程。在整个图像中,“五只羊”是图像中最突出的参与者,扮演者“主角”,用红黄这种高饱和的颜色填充,强调了五只羊的化身――广州人民将以最热情的态度、最友好的方式传递亚运社火的精神。

3.2.2互动意义

克瑞斯和赖文认为图像中包含图像的制作者、图像表征的事物、图像的观看者之间的关系,并提示观看者对所再现的事物应持的态度。在此过程中,有接触、距离、视点和情态四大要素。克瑞斯和赖文将图像的参与者直接看着观看者的过程叫做“索取”,将图像人物的展示叫做“提供”;距离主要包括亲密、非个人、社会距离的展现;通过仰视、俯视、平视等不同视点展现权势;情态与图像的真实度和可信度有关,通过色彩饱和度、色彩、区分度、色彩调谐度、再现、深刻、照明和亮度标志反应图像的“现实主义”。

此图像是一幅“提供”类图像,将亚运会的理念通过会徽传递给观看者。这是一幅近景图像,观看者可以清楚看到整幅图像。会徽图像以红色为主色调,文字以黑色为主色调。在中国传统色彩中,红色表示喜庆、热烈等情感;黑色表示庄重、肃穆等意思。使用红和黑这两种高情态的色彩,充分体现了广州人民将以热情的、严肃的、饱满的精神状态迎接亚运会的到来。图像下方的两行文字直接告诉观看者此会徽的用意,采用中英文的形式直接说明了亚运会将在中国广州举办,并且突出了亚运会的国际性。舞动的广州体现出亚运会的动感。

3.2.3构图意义

“构图意义”对应功能语法中的语篇意义,克瑞斯和赖文提出了构图意义中的三种资源:信息值、取景和显著性。信息值是通过元素在构图中的放置实现的即空间位置。在克瑞斯和赖文看来,左边的信息是已知的,右边的是新的;上方的是“理想的”,下方的是“真实的”。中心与边缘的差异与文化差异相关。取景指的是是否采用取景手段,用于变现图像元素的有无。显著值指元素吸引观看者注意力的不同程度,通过被放置的前景或者后景,相对尺寸,色调值对比和鲜明度的不同来实现。

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

“理想的”是指它的信息是理想化的或概括性的实质,它的信息是最显著的部分;“真实的”是指更特定的信息,如细节等。在广州亚运会会徽中,被再现为火焰、跑道的五羊在图像的上方,象征广州人民奋发向前愿为亚运会作出最大努力;“16th Asian Games”和“Guangzhou 2010”被放置在下方,它提供的信息细致、真实、可信。

4.结语

数字化时代下的语篇不再以语言为唯一的意义产生方式,各种符号资源(图像、声音、颜色等)都被广泛用于语篇之中,因此,语篇呈现多模态化,对语篇进行多模态话语分析显得日益必要。本文通过利用社会符号学视角下的视觉语法理论,对第16届广州亚运会会徽进行多模态话语分析,发现图像从“再现意义”、“互动意义”和“构图意义”三个方面构建意义,意象、文字、颜色等各种符号资源共同产生意义,验证了各种符号资源都是意义产生的源泉。

参考文献:

[1]胡壮麟.社会符号学研究中的多模态化[J].语言教学与研究,2007,(1):1-10.

[2]李战子.多模态话语的社会符号学分析[J].外语研究,2003,(5):1-8.

[3]Kress,G.Sociolinguistics and Social Semiotic[SA].In Sobley,P.ed,London & New York:Routledge,2001.

[4]朱永生.多模态话语分析的理论基础和研究方法[J].外语学刊,2007,(5):82-86.

[5]Scollon,R.&Levine,P.Multimadol Discourse Analysis as the Con-fluence of Discourse and Technology[SA].In Levine,P.&Scollon,R.(eds).Discourse and Technology[C].Washington,DC:Gergetown University Press,2004.

[6]Kress,G.& Van Leeuwen,T.Reading Images.The Grammar of Visual Design[M],London:Routledge,1996.

图像分析论文范文第14篇

关键词:医学图像重建 实验教学 基础仿真实验 应用实践实验

中图分类号:G642 文献标识码:A DOI:10.3969/j.issn.1672-8181.2014.17.027

1 引言

医学图像重建课程主要讲解医学成像与分析系统中的现代图像重建技术,内容包括图像重建解析算法和迭代算法以及这些算法在XCT(X-Ray Computed Tomography)、SPECT(Single Photon Emission Computed Tomography)及MRI(Magnetic Resonance Imaging)等医学影像中的应用,是生物医学工程专业的一门十分重要的专业基础课。掌握现有的医学图像重建技术,并基于此研究速度快精度高的新型医学图像重建技术将大大促进医学影像技术的发展与进步。医学图像重建课程要求学生具有基础物理、数学、线性系统、电子电路方面的基础知识,旨在培养学生掌握现代医学成像的物理原理、成像理论以及应用等,是一门理论与实践紧密结合、涉及多个领域的学科。对于本科生来讲,通过这门课程的学习不仅仅需要获得坚实的理论知识,还需要从实验实践中更好的理解知识,掌握更加先进有用的科研技术。医学图像重建课程专业性强,综合性高,并且理论和实践紧密结合。目前大多院校主要开设医学图像处理课程,教学重点在于利用图像处理方法对医学图像进行处理与分析;而医学图像重建属于医学成像技术,课程教学重点在于如何利用算法处理医学影像设备采集的原始数据从而得到医学图像,针对本科生开设该课程的院校不多。而开展该课程教学工作的院校主要限于理论教学,并且由于基础实验设备缺乏,实验条件不成熟等因素影响,极少涉及实验教学,学生对该课程内容的掌握情况并不十分理想。目前,公开文献主要针对医学影像成像课程的教学研究及教学改革,尚没有针对医学图像重建课程的实验教学研究论文公开。笔者结合本校该课程的教学情况,展开一些该课程基础仿真实验与应用实验教学环节的设计研究,以全面培养学生的学习技能,激发学习兴趣,改善教学效果。

2 基础仿真实验设计

为了让学生掌握本课程设计的成像理论以及成像算法,基础仿真实验分为三大部分,分别为XCT图像重建仿真实验,SPECT图像重建仿真实验和MRI图像重建仿真实验,重点为XCT图像重建仿真实验。基础仿真实验要求学生利用计算机仿真实验采集数据,并选取合适的重建算法对实验数据进行重建。以XCT图像重建仿真实验为例,学生2人1组,首先利用Matlab软件产生平行束XCT的360度投影数据;再编写解析重建算法――滤波反投影算法和迭代重建算法――代数迭代重建算法函数程序代码;并将仿真的投影数据作为编写号的函数的输入参数,进行重建,输出重建后的断层图像;最后将重建后的断层图像与理论图像相比较,分析重建算法的性能。对于学习能力较强的学生,可自主选择课本上的其他算法进行图像重建与结果分析。通过基础仿真实验,学生可以深入了解医学成像系统的成像原理与成像过程,掌握图像重建算法,并学会分析比较不同算法的重建性能,真正掌握课程中的医学图像重建理论。

3 应用实践实验设计

医学图像重建是一门理论与实践密切结合的综合性课程,在掌握各种重建方法的同时并将其应用于医学图像重建是学习本课程的最终目标。在课程理论教学以及基础仿真实验基础上,有必要进一步进行应用实践实验的设计,让学生用学到的知识解决实际问题。笔者所在学校的生命科学技术学院定位为研究型学院,搭建了适用于小动物成像的微型XCT硬件系统,并开发了与之配套的图像采集与图像重建软件平台。该微型XCT硬件系统中的X光管和X探测器固定,将成像对象固定在转台上,通过电动控制旋转转台,进行多角度投影数据采集。笔者基于课题组的科研背景以及学院软硬件条件,设计了小鼠XCT成像以及基于XCT图像的小鼠主要器官分割应用实践实验。实验时,学生4人1组,首先准备好实验材料,即麻醉小鼠并尾静脉注射CT造影剂,熟悉微型XCT硬件系统的构成以及性能指标并开启成像软件和硬件系统;采用由8个钢珠构成的仿体对微型XCT系统进行几何校正,消除转台的转动误差以保证成像精度;几何校正完成后,将小鼠固定在转台上,以1度为间隔,旋转360度,采集360幅投影图像;利用软件平台在服务器上对投影图像进行重建,得到小鼠的断层图像和三维结构;基于小鼠的断层图像,利用Amira软件,采用人机交互方法进行小鼠主要器官分割。通过应用实践实验,学生亲自操作微型XCT成像系统,并对采集的投影数据进行重建。经过该实验训练,学生能够熟练掌握微型XCT系统的结构、系统的工作过程以及数据处理流程,对微型XCT成像及其应用有了系统深入的认识,锻炼了动手操作能力。

4 结论

本文结合笔者教学与科研经验,基于学院科研条件,以提高医学图像重建课程教学质量为目标,针对该课程的实验教学环节提出一些改革措施。本课程以有代表性的重建理论和有典型性的应用实践作为实验内容,结合“课堂理论指导、计算机仿真巩固以及真实实验提高”三个层次的教学手段,巩固学生的图像重建理论基础,锻炼学生的实验操作技能,提升学生的综合知识水平,为以后从事相关领域工作奠定坚实基础。

参考文献:

[1]曾更生.医学图像重建[M].高等教育出版社,2010.

[2]黄文亮,吴淑芬,周山.对医学影像技术专业医学影像成像理论与医学影像检查技术课程整合的思考[J].卫生职业教育,2013,(7).

图像分析论文范文第15篇

关键词:小波变换;图像增强;图像对比度增强

中图分类号:TP391.41 文献标识码:A 文章编号:1007-9599 (2011) 22-0000-01

Image Enhancement Based on Wavelet Transform

Zhou Xu

(Wulanchabu Branch,Chian Tietong,Wulanchabu 012000,Chian)

Abstract:An image system consists of acquisition,transmission,

reception and display,and every part of them can come about disturbance which makes equality of image degradation de.Elementary requirement of image enhancement is how to deal with these degraded images to meet our need.One of main contents of image processing is image enhancement.Now,there are many methods of image enhancement,but they will more or less bring bad effects when enhancing images.

Keywords:Wavelet transform;Image enhancement;Image contrast enhancement

一、引言

人类依靠自身的器官获取有关世界的各种信息来认识世界。据统计在人类获取的信息中,听觉信息约占20%,视觉信息约占60%,其他味觉、触觉、嗅觉总的信息加起来不超过20%。可见,作为获取和传递信息的重要媒体和手段―图像信息是十分重要的。

二、小波变换的基本思想

小波变换(Wavelet Transform)是八十年代后期发展起来的应用数学分支,与Fourie:变换、窗口Fourie变换(Gabor)相比,小波变换是时域和频域的局部变换,因而能有效地从信号中提取信息,通过伸缩和平移等运算功能对函数或信号进行多尺度分析(Multiscale Analysis),解决了Fourie变换所不能解决的许多困难,因而小波变换被誉为“数学显微镜”。小波变换是调和分析发展史上里程碑式的进展,成为国际上众多研究和学科领域共同关注的热点,并在相关领域取得了重要成果。

三、基于小波分析的图像增强算法

在图像增强的同时应考虑到噪声问题,所以对小波分解后高频部分的处理很重要。为此,设计合适的增益函数是关键的一步。

考虑到处理计算的复杂度,将增益函数作了简单的分类:

第一类是简单的增益函数,即常数k (j表示小波分解的级数),如果考虑到每个高频,就对每个方向的高频采用不同的常数,采用k (j表示小波分解的级数,i表示分解后不同方向的高频,即水平、垂直和斜方向的高频)。

第二类是比较复杂的增益函数,有分段线性函数和非线性函数。这两种增益函数考虑到图像的对比度,增强了那些不太清楚的细节,而对于已经很清楚的图像细节却没有增强,这样,图像处理后的整体效果比较好。对于这两者的讨论会在下面的算法中有详细的叙述。

所以,根据处理高频的增益函数,可以将图像增强分为两种:线性增强和非线性增强。

(一)非线性增强算法。线性增强仅仅增强尖锐的边缘,没有充分利用图像显示设备的有效动态范围,很难检测出图像中不太明显但很重要的特征。下面,通过一个非线性函数解决这个问题。非线性增强可以看成小波系数的一个线性映射 线性增强可以看成非线性增强的一个特例。下面依次讨论非线性增强所涉及到的具体问题。

(二)增益函数的设计。增益函数的设计是非线性增强中最为关键的一步,直接影响到处理的结果。根据有关文献,结合仿真试验,总结出一个增强算子必须做到以下几点:低对比度的区域应该得到比高对比度区域更多的增强;同时,不会模糊原有的边缘细节,还应去掉图像中的噪声(至少不会放大图像的噪声),即将增强与去噪有机地结合起来。

四、总结和展望

小波分析自八十年代以来,已经发展成为一个重要的数学分支,建立了基础的理论体系,并在实际应用中取得了一定的成果。和数字图像处理结合,是小波分析研究领域的重要内容之一。其中,把小波分析应用于图像增强的研究比较少。本文就是把基于小波分析的多分辨增强和灰度增强应用于图像处理。

在Lifting Scheme的研究中,最初让人们感兴趣的是它的计算量比较小易于实现。但是,随着研究的逐步深入,人们逐渐发现在如何根据信号或图像的特点来自适应地选择小波基,有它的特别之处。

数字图像处理与分析一直是个具有广泛应用前景的领域,并不断取得有价值的成果。图像增强就是其中的一个部分,虽然它研究的比较早经典的理论与技术己经成形,现在研究的不是很多,但是随着新的研究工具(小波分析就是一例)的发展,再次引起人们的注意,图像增强的研究也就不断地向前发展。在有关图像的研究领域中,一个很重要的问题至今仍然没有很好的解决,那就是图像质量的评价指标,如何将图像的主观质量和客观指标有效地统一起来,即主观质量定量化问题。可喜的是,小波分析由于在时频分析中有着独特的魅力,所以它能将图像方面的时频刻画和人眼的视觉特性能有效地结合。因此,基于小波分析的图像质量指标值得进一步研究。

参考文献:

[1]赵荣椿.数字图像处理导论.西安:西北工业大学出版社,1995年3月