美章网 精品范文 高中数学特征范文

高中数学特征范文

高中数学特征

高中数学特征范文第1篇

关键词:高中数学;优效教学;基本特征;特征

1.前言

当前,现代教育事业不断发展进步,人们越来越重视高中数学的优效教学,在新课标的理念下,高中数学教学不但要教给学生相应的数学知识,还需要提高学生的数学学习能力及数学知识应用能力,提高学生的数学水平。因此,高中数学教师应该对优效教学进行深入的研究,积极更新教学模式与教学方法,综合应用情景教学、小组合作、探究教学等教学法,为学生构建优效的数学课堂,让学生积极参与到各项教学活动中,提高高中数学教学的效率及质量。

2.分析高中数学优效教学的基础特征

总的来说,高中数学优效教学有以下几个基础特征:(1)教学目标具有整合性,在优效教学中,教师对教学中的“三维目标”进行整合,确定具体、可行、有效的教学目标,这些教学目标对学生会产生导向作用,能够促进学生数学能力、综合素质的发展[1]。(2)教学过程具有高效性,教学过程不但要保证达到教学目标,还应该保证教学的效率和质量,实现“轻负担、高效率”,并注重学生的差异性,让学生的个性得到发展。(3)注重学生数学思维能力的培养,通过组织学生参与一系列的教学活动,培养学生的数学思维,让学生学会融会贯通、举一反三。(4)强调数学教学的动态生成性,加强师生、生生之间的交流与合作,在此过程中生成新的数学问题、解决数学问题的新方法等[2]。(5)注重学生探究能力的培养,让学生亲身参与学习过程,培养学生自主探究的意识及能力,让学生能够灵活解决各类数学问题。

3.实现高中数学优效教学的教学策略

3.1激发学生数学兴趣

兴趣是最好的老师,学生只有在学习过程中获得乐趣,才会积极主动地参与到教师组织的教学活动中,因此,高中数学教师应该充分重视学生学习兴趣的激发,实现“三维目标”中情感态度的目标。以数列教学为例,在教学过程中,教师可以在导入环节给学生讲解一些数列故事,吸引学生的注意力,让学生对接下来的教学活动产生兴趣,渴望学习到其中的数学知识。这样,不但能够激发学生学习数学的兴趣,提高学生学习数学的积极性,而且能够为教学活动的顺利进行打好基础,提高数学课堂的效率。此外,在教学过程中,教师还应该注重学生与学生之间的合作,充分应用小组合作教学法,让学生在互相帮助、共同沟通的过程中探究、解决数学问题,加深学生对数学知识的印象,从整体上提高学生的数学水平。

3.2培养学生数学思维

高中数学具有较强的逻辑性,对学生数学思维提出了更高的要求,目前,部分高中数学教师忽视了学生数学思维的培养,一味地给学生讲解课本上的例题,在遇到一些变式数学问题时,学生往往束手无策,不知如何下手,应用数学知识解决数学问题的能力不强。因此,高中数学教师应该充分应用探究教学法,给学生设置一系列探究任务,并引导学生自主探究,自主应用所学的数学知识解决相应的数学问题。比如,在数列教学中,教师可以给学生设置以下探究任务,等比数列{an}的前n项和为Sn,S3,S9,S6三个成等差数列,a2,a8,a5是否成等差数列?对这一问题进行以下变形处理:(1)假如Sn是等比数列{an}的前n项和,S3,S9,S6成等差数列,求证am,am+6,am+3成等差数列。(2)设Sn是等比数列{an}的前n项和,q不等于1,m,nN+,kN,Sm,Sn,Sp成等差数列,求证am+k,an+k,ap+k成等差数列,随后组织学生进行探究。这样,不但能让学生养成良好的数学学习习惯,学会从不同的角度思考问题,在遇到各类数学问题时都能够“迎刃而解”,而且能够转变传统的教学模式,提高高中数学教学的有效性。

3.3构建和谐的师生关系

在传统的高中数学教学中,师生关系仅限于教师传授知识,学生接受知识,师生关系遥远,难以保证各项教学活动顺利开展。因此,在高中数学教学中,教师应该亲切的与学生沟通、交流,拉近师生间的距离,并用自己的人格魅力去感染学生,让学生在和谐的氛围中学习数学。此外,在平时的教学中,教师对学生的评价应该以鼓励性为主,增强学生学习数学的信心,让学生更加积极地参与到教师组织的各项教学活动中。

4.结束语

高中数学是高中教学的重要组成部分,逻辑性和实践性较强,学生往往难以把握其中的规律,在学习时经常感到力不从心,高中数学教学有效性有待提高。因此,高中数学教师应该转变教学观念,注重优效课堂的构建,通过一系列的教学活动来激发学生的数学兴趣,提高学生学习积极性,进而提高学生的数学思维能力。

参考文献:

[1]肖凌戆.高中数学“优效教学”的探索性研究[J].中国数学教育(高中版),2015,(1):13-15.

[2]潘素珍.例谈“优效教学”在高中数学课堂教学中的实施[J].文理导航(中旬),2013,(3):13.

高中数学特征范文第2篇

关键词:高中数学 课堂教学 教学方式 知识结构 

美国哈佛大学的口号是:“一流的技术要有一流的科学,一流的科学要有一流的数学”,而数学教育中以基础数学教育为关键,基础数学的教学对整个国民的数学教育有着不可替代的重要作用。重视和钻研基础数学教学是提高国民整体素质,发展国家科学技术的最有效、最便捷的途径。基础数学中的核心是高中数学。随着时代的发展和科技的日新月异,新课改应运而生,新课改下的高中数学课堂教学也就成了教育科研人员、课程改革专家和高中一线数学教师当下最为紧迫的研究任务。教育家陶行知先生说:“教师首先必须是学习者。”高中数学教师肩负的重任不可低估,因此高中数学教师首先要弄清楚高中数学课堂教学的基本特征。 

一、知识来源生活化 

新课改下的高中数学课堂教学的基本特征之一是知识来源生活化,与之前版本不同的是,课改后的数学课程更加重视日常生活与数学的联系,注重知识的发生、发展过程,注重知识在日常生活中的“原型”,让学生在掌握知识结论的同时,了解知识的发生、发展过程,并在日常生活中找出知识的应用方面。比如“集合的概念”一节,集合的含义涉及国家的省会城市、特别行政区等;“基本不等式”一节涉及2004年在北京举办的国际数学家大会会标;“双曲线的性质”一节体现了双曲线在日常生活中的应用,用来确定炮弹发射的具体位置;“正余弦定理的应用”一节密切联系生活中的距离测量、高度测量、角度测量等问题,做了详尽的论述,让学生体会了生活中的数学。 

在当今的信息化社会中,教材和教师不再是学生获取知识的唯一来源,知识的来源大都容易找出生活中的“原型”,真正体现了“知识源于生活而服务于生活”的特性。 

二、教学方式多元化 

新课改下的高中数学课堂教学的基本特征之二是教学方式多元化。叶圣陶先生说:“语文教本只是些例子。”数学教本何尝不是如此?如果教师不能在新课改的形势下审时度势地选择最适合于学生的教学方式,还是拿自己以前所接受的或者所使用的教学方式来应付新教材,势必是失败的。不少教师反映说高中数学教材课时太少,实际上是教师总希望把什么都拿来自己讲,把讲台变成自己独唱的表演台或者熟练自己知识结构的主要场所,完全忽视学生的存在,这样面面俱到的讲授式教学显然不是新课程需要的,也不符合时展的基本要求。 

高中数学不同于其他学科,内容的丰富性、思维的抽象性、知识的概括性都是很强的,这就要求教师深入钻研高中数学课程中所涉及的基本知识,基本思想,引导学生积极参与,形成学生个人的基本技能,这期间可以是“讲练结合式”“讲练议结合式”“合作探究式”“议练结合式”“参与式”“实验操作式”等形式。“教学有法,教无定法,贵在得法”,不同章节的课型,不同班级的学生,所适合的教学方法不尽相同。 

三、师生角色互动化 

新课改下的高中数学课堂教学的基本特征之三是师生角色互动化,新课程的一个亮色是教师不再是课堂的独裁者和课程内容的垄断者,《基础教育课程改革纲要(试行)》指出:“教师在教学过程中应与学生积极互动、共同发展”,“逐步实现教学内容的呈现方式、学生的学习方式、教师的教学方式和师生互动方式的变革”,学生成为学习的主人、课堂的主角,教师仅仅是引导者、辅助者,真正体现“学习全靠自用心,教师只不过是引路人”的俗语。 

叶圣陶先生说“教是为了不需要教”,华罗庚先生说“自学,不怕起点低,就怕不到底”。可以看出,教师的角色是引导学生掌握方法,高中数学教师的责任在于教会学生思考,教会学生探求新知的思路和方法,不是全权代替学生学习已有的现成的“知识”,变成传授“知识”的“好老师”,进而让学生成了所谓记忆“知识”的“好学生”,那样的话将是教育的不幸,是有悖于新课改倡导的创新意识和发展目标的。高中数学教师应以学生为主体,充分调动学生的学习积极性和主动性,让学生真正成为学习的主人,实现“青,取之于蓝,而胜于蓝”的大好局面。 

四、知识结构模块化 

新课改下的高中数学课堂教学的基本特征之四是知识结构模块化,按照课程标准的要求,高中数学课本出现了必修模块和选修系列,选修系列中又出现了模块和专题。总体来看,高中数学知识结构呈现出了模块化的新局面,每一个模块或者专题都可以自成一个知识体系,而且模块与模块之间的顺序也可以按需调整,这对高中数学的教与学都是有益的,也是新课改的另一亮色。 

美国人本主义教育家、心理学家罗杰斯认为“教育的目的在于使每个学生从中获得个人意义,其意义不是内在于教材之中的,而是个人赋予教材以意义的”。高中数学知识结构的模块化给学生以后的发展提供了选择的空间,和以前对所有学生统一要求的数学基础相比较,课改后的高中数学有其独特的优越性。“数学探究、数学建模、数学文化”不单独设置,而是渗透在每个模块与专题之中,这对整个高中数学的教学无疑是一个好的势头。课程标准对高中毕业生最基本的要求是学完必修模块达到10个学分;要求向人文、社会科学方面发展的学生可以在这10个学分的基础上,再在系列1、3、4中选择6或者10个学分进一步学习;要求在理工类(包括部分经济类)方面发展的学生可以在必修模块10个学分的基础上,再在系列2、3、4中选择10或者14个学分进一步学习,这真正体现了新课改的选择性,也实现了不同的学生有不同发展的基本要求。 

参考文献 

[1]张奠宙.数学教育研究导论[M].南京:江苏教育出版社,1994. 

[2]丁尔升.现代数学课程论[M].南京:江苏教育出版社,1997. 

[3]郑毓信.数学教育哲学[M].成都:四川教育出版社,2001. 

[4]叶立军.关于实施新课程标准问题及对策[J].内江师范学院学报,2004(2). 

高中数学特征范文第3篇

关键词:高中数学;数学特征;数学学习

多年的高中数学教学,让笔者开始思考一些本源性的问题,譬如什么是高中数学?高中数学的价值又是什么?高中数学的特征又有哪些?数学特征是数学有别于其他学科的关键所在,自然也是数学教学的重要着力点所在. 教学生数学,不仅是教学生积累数学知识,更重要的是能够通过数学及其数学的特征,发现身边的事物中存在的数学属性,以让学生不仅能够在形式上靠近数学,也能够在本质特征上靠近数学. 高中学生有其明显的年龄特征,这个年龄的学生擅长于理性思维,喜欢思考一些相对深刻的问题,在这样的认知特点的基础上,如果高中数学教学还只是机械的知识积累,那显然是满足不了学生的学习需要的(并不是说知识积累不重要,而是说高中数学教学不能完全局限于知识的积累). 而如果带着学生去认识数学特征,或者说带着学生从数学特征的角度去认识高中数学,既不会影响学生的基本应试技能,同时又能够从更高层次上引导学生与数学之间有一个更为强烈的共鸣.

[?] 高中数学及其实质与特征概述

“高中数学”可谓是高中数学及其教学中最为基本的一个概念,因为基本,所以常常为师生所忽视;因为基本,所以常常无法引起更多的思考. 而事实上,近年来的教学研究正有一种向本源回归的趋势,人们在经过了新课程改革所带来的太多的时髦概念的洗礼之后,有了一种思考基本概念的愿望,希望能够回到教学的出发点,从本源概念去思考本学科教学的意义与价值. 作为高中数学教师,笔者的思考也正是从“高中数学”这一概念开始的.

一个基本的认识是,“数学是研究数与形的科学”,对于高中学习而言,这里的数与形多指具有一定难度的空间形式与数量关系. 又有人说,数学作为一门基础科学,其是自然科学及技术科学的基础,在社会发展的各个领域发挥着重要的作用. 笔者从高中数学教学的实际出发,结合他人的一些研究成果,就高中数学作出这样的理解:高中数学首先是一门科学. 这与传统的认识有所不同,学生提到科学,往往想到的是自然科学,而事实上,高中数学作为数学学习的一个重要阶段,其在传播科学精神方面有着重要作用,数学作为自然科学的工具也在其他学科中有着广泛的运用. 高中数学其次是一门哲学. 将高中数学视作哲学是一个挑战,同时也是适切高中学生思考需要的,如上所说,高中学生喜欢深刻思考,而哲学恰恰能够给学生的思维带来这一挑战,结合高中数学知识去向学生提供一些数学发展史,可以给学生带来一些基本的数学思考. 高中数学还是艺术. 高中数学的高度抽象性以及高度抽象之后的简洁性,可以让学生体会到数学通过数与形将复杂具体的事物作了高度抽象,且抽象的结果能够体现出形的简洁与量(尤其是等量关系)的美.

基于对什么是高中数学的思考,再来看高中数学的实质,会发现问题的回答变得相对简单:高中数学的价值就在于引导学生在高中数学学习的过程中,形成用数学目光看待事物的能力与习惯. 这里的数学目光是指数学方法(形成于学生的数学学习与解题过程当中)、数学思想以及数学精神. 而这与课程标准所倡导的“在发展和完善人的教育中,在形成人们认识世界的态度和思想方法方面,在失去社会进步和发展进程中起着重要作用”是一致的.

然后再来看高中数学的特征,就会发现高中数学在义务教育阶段数学学习的基础上,具有这样的一些特征:其一,基础性. 尽管高中数学难度更高,但仍然属于基础性数学的一部分,只不过这种基础应当是学生接受更高层次数学教育的基础. 其二,抽象性. 高中数学的抽象性是不言而喻的,无论是函数还是概率,基本上都是在与抽象的对象打交道. 其三,前瞻性. 当前的高中数学内容是以新的课程标准为基础的,能够更好地带领学生进入高等数学的概率、矩阵、微积分等,这种知识更新的背后实际上是数学思维的更新,可以让学生带着这些知识背后的数学思维更好地与社会需要进行衔接. 其四,可选性. 高中数学既有必修模块,又有选修模块,这为不同学生基于不同的需要提供了多种选择的可能.

[?] 高中数学的基本特征及其例析

考虑到高中数学及其价值都是在教学过程中体现出来的,考虑到更具操作性的是在实际教学中引导学生去认识高中数学的特征,因此这里想重点就高中数学的教学内容,对高中数学的特征做一些解读.

对于基础性,可以以“算法初步”这一内容为例进行分析. 这是之前不曾有过的内容,但又是数学甚至是生活中的一种基本的行为,比如教材中所举的猜商品价格的例子,又比如说生活中买卖商品时讨价还价的例子,都与算法有关.而对于算法的定义“一般而言,对一类问题的机械的、统一的求解方法”则需要引导学生进行基础性理解,尤其是对于“求解方法”这一概念而言,需要引导学生认识到对于任何一个数学问题,求解方法都是必要的,而机械的、统一的求解方法听起来不上档次,实际上却是绝大多数人遇到问题时的正常思维.教学中,必须引导学生关注这种基础性.

对于抽象性. 抽象性是数学最为本质的特征,也是高中数学教学中最需要引导学生体验的特征,笔者在高中数学教学的第一课开始,就引导学生去关注数学的抽象性. 比如“集合”的教学,生活中类似于教材所举的“我家有爸爸、妈妈和我;我来自第三十八中学;我现在的班级是高一(1)班,全班共有学生45人,其中男生23人,女生22人”等的例子,就是实际生活中事物的描述方式,而这种方式经过抽象之后可以以“集合”来作为描述方式. 这里也需要认真研究集合以及元素等基本概念的定义,比如“一般地,一定范围内某些确定的、不同的对象的全体构成一个集合”这一定义,笔者以为就不能过快地告诉学生,而应当通过丰富的实例来进行分析与抽象,也就是说在教材所提供的一个例子的基础上,教师应当更多地向学生提供一些例子,让学生对着这些实例去分析,更主要的是抽象. 在得出集合的定义之后,还要引导学生回过头来看看这一定义的概括性,因为概括是抽象的必然结果,当将实际事物抽象成元素时,将实际事物的群体抽象成集合时,学生就会认识到抽象对于建立数学模型来说是必不可少的一个步骤.

对于前瞻性,实际上在基础性所举的“算法初步”例子中已经有所体现,为什么要将这一内容纳入高中数学教学,就是因为其实际上是现代信息社会的一种需要,没有基本的算法及逻辑知识,那基本上是无法有效融入这一信息社会的. 因此,类似于此的内容纳入教材,就是前瞻于学生的未来的.

对于可选性. 这主要是相对于选修模块而言的,选修模块中的内容数学性更强,对于理科的学生来说是思维拓展的需要. 以选修2-1中“圆锥曲线与方程”这一内容而言,教师不能完全以传统的思路来看待,而应当看到“圆锥曲线”是一个概括性的概念,对于具有一定数学天赋或者对数学感兴趣的学生而言,是一个借助于数学认识事物的机会,选椭圆、双曲线、抛物线而修之,并概括以圆锥曲线的统一定义,寻找到曲线以及描述它们的方程,是一个纯粹的数学探究的过程,在其中可以享受到数学探究的兴趣. 这对于选而修之的学生而言,原本就是慎重选择的结果.

[?] 基于数学特征的高中数学教学

关注了高中数学及其价值,尤其是研究了高中数学的基础性、抽象性、前瞻性以及可选性之后,再来看待基于数学特征去实施教学,会发现其对传统的教学思路与方式有着重要的补充意义.

首先,高中数学教学必须走出纯粹的应试道路,必须关注学生在数学学习中会获得一些什么. 而基于数学特征的教学恰恰是可以弥补这一不足的,引导学生将学习的目光从机械的解题迁移到从数学特征的角度去研究数学学习,可以让研究性学习真正成为常态,从而促进学生对数学的正确理解.

高中数学特征范文第4篇

【关键词】高中数学;有效教学;内涵;特征;策略

在新课改的深入发展下,教育教学对高中数学教学提出了更高的要求,即高中数学教学不仅要传授给学生一定的知识、技能,而且还需要通过高中数学教学培养学生数学思维能力,提升学生的数学综合素养.为此,需要教师在数学课堂教学中更好地引导学生,拓展学生的学习思维,实现有效的数学教学.

一、高中数学有效教学内涵和特征

高中数学有效教学的内涵是指通过采取有效的高中数学教学策略和教学方式,实现学生的全面发展,落实高中数学教学目标,提高学生的认知能力.高中数学教学的特征具体表现在有效化、有效果和有效益几个方面,和无效、低效的数学教学相区分,在注重学生数学思维和对数学知识理解的同时,注重帮助学生建立良好的数学学习知识体系.其中,有效化是指数学学习要有效率,能够在半个小时做完的数学练习不能拖延到四十分钟做完.数学教学的有效,首先,要体现教学目标的有效,即将教育课程目标分散化处理,从而加强学生对数学知识的理解和接受.其次,教师要选择有效的教学方法帮助学生理解笛е识.再次,是教学过程的有效,在教与学的过程中,教师和学生都要有自己的思维,教师要善于启发学生的数学学习,学生要能够在教师的启发下进行思考和总结.最后,教学效果要有效,学生通过数学学习要树立正确、科学的数学认知体系.有效果是指教师在数学教学的过程中,通过教学能够实现学生对所学数学知识的活学活用.有效益是指数学教学效果和利益的实现,是数学教学、学习中得到和付出之间的对比,具体要求学生在一定的时间内能够获得所需要掌握的数学知识.

二、高中数学有效教学的策略

(一)通过引导探究构建有效的高中数学知识体系

建构主义认为,学习的过程是学习者将自己所掌握的知识、经验重新构建的活动,能够将教师所讲授的知识主动内化为自己的知识.为此,在高中数学教学中,教师应该引导学生主动探究知识,在数学学习中形成良好的数学认知结构.对于高中数学定理和公式的导入,教师不仅可以通过情境的创设来实现,还可以从定理在总体数学知识体系中的作用、和其他数学知识的联系等方面提出更深层次的数学问题.比如,在学习“直线和平面平行的性质定理”的时候,教师可以做出如下设计教学:在初中平面几何的学习中,我们是如何通过两条直线平行判定定理来获得它的性质定理的?学生在教师的提问下进行思考,之后在复述了直线和平面平行判定定理之后,写出了它的逆命题.

(二)实现有效的数学思维训练

在数学教学中,通过数学学习实现学生数学思维的发散是提升学生学习能力、促进学生学习发展的关键.数学学习的过程不仅是对数学知识的传授和应用,而且也是对数学思维、思想的一种发展,为此,高中数学有效教学需要进一步对学生的思维进行训练.比如,在讲授过抛物线的定义之后,需要进一步推导出抛物线的标准方程.数学教材中做出了这样的描述:“过F点作直线FN和直线l垂直,垂足是N,以直线NF为x轴,线段NF的垂直平分线为y轴,建立相应的平面直角坐标系(F是焦点,l是准线),请问为什么要这么建平面直角坐标系?”教师向学生抛出这样一个问题,能够让学生锻炼自己的思维进行求解,对提升学生的数学学习效果意义重大.之后根据抛物线的定义,提问学生,根据抛物线方程的推导,有哪些建立直角坐标系的方法?如何推导?学生在调动自己的思维之后得到了三种直角坐标系建立的方法,得到了相对应的三种方程.

三、结束语

综上所述,新课改的深入发展对高中数学教学提出了更高的要求,需要教师在把握有效教学内涵性、特征的基础上,根据班级学生数学学习特点,进行有针对性的高中数学有效教学,通过有效的数学教学逐渐引导学生主动探究知识,训练学生的数学思维,加强对学生数学学习兴趣的培养.

【参考文献】

高中数学特征范文第5篇

关键词:数学;新课程理念;高效;课堂教学;特征

当前,一些数学课上的“小组讨论与交流”虽给人课堂气氛热烈的印象,但学生未必真讨论、弄懂了课内问题,初中数学课堂教学重形式轻实质现象依旧严重。诚然,“小组讨论”、同学间的“交流”是数学教师常用的教学形式,但课堂热热闹闹很显然只是表面浅层次的,不是学生真的在“自主”学习,这样的数学课不属于高效的数学课堂教学。那么,如何打造出一节高效的数学课,让学生的讨论交真正发挥出它的效用呢?本人认为,作为一名初中数学教师首先需要弄清初中高效数学课堂教学应具有的以下几点特征。

一、自信、自主、有活力且有收获的数学课堂教学

“一节好课应该是鼓舞人心的,课堂上学生应该显得自信、无忧无虑,是机灵又富于创见的自愿学习。”一节高效的数学课堂一样不能例外,学生充满自信、有活力且有收获是高效数学课堂首要特征之一。小组合作学习是实现高效数学课的一种重要教学形式,运用这种教学形式需要创设一个适度的竞赛机制。这样才能发挥学生学习数学的主观能动性,学生才能在自主合作学习中更好地理解并掌握“基本的数学知识与技能,数学思想和方法,获得广泛的数学活动经验”,从而实现高效的数学课堂教学。

进行小组合作学习时,数学教师可以采用积分奖励制,谁先想出来,给谁积分,谁在小组讨论中提出的方案更有建设性,被采用的给予积分奖励。笔者经过一段时间的实践后发现在这样的小组讨论中所有人参与讨论的热情、自主学习的积极性都较以前有明显提高,学生在课堂上的收获大了,教学效果自然也不会差。

二、数学活动丰富且有实效的数学课堂教学

数学新课程理念更重视对学生学习数学兴趣的培养。教学中没有绝对万能的教学方法,不管何种方法,都应落脚于能否调动学生主动参与学习的积极性,只有学生积极参与到数学教学活动中才有可能取得良好的教学效果。比如,教学“几何体三视图”时,我先要求学生自己做几个正方体,然后让学生带到班上向小组内其他成员展示并组合出新的几何体,再让组内的学生画出从不同方向看到的视图并与同伴互相猜想、辨认各自所画的是三视图中的哪一种视图。学生通过借助手中的小正方体实际摆一摆、放一放,又实际从不同的方向看一看,再尝试画一画的数学活动操作,主动参与到数学教学活动中,很快就较好地掌握了几何体三视图的学习内容,积累了大量的数学活动经验,而且还充分锻炼了学生空间思维想象能力。

当然,不同的教学设计会有不同的特点,教师选用的教学方法需要适合教学内容的不同特点,才可能提高学生的参与性,提升教学效果。比如,教学“100万有多大”时,可以通过“每个人浪费一粒米你不会觉得浪费很多,但是你知道如果照这样算,我国13亿人口一天要浪费多少米吗?”这种形式的提问激发起学生的好奇心,然后让学生发挥想象力,在小组合作交流中讨论解决。这可能会耽误时间,但可以激发学生学习数学、喜欢数学的热情,从而实现高效的数学课堂教学。

三、充满审美与灵感的数学课堂教学

罗素形容数学的美为“冷而严肃的美”。数学之美,首先表现在数学结论的概括之美,“一个好的数学结论或模型可以解决一系列,甚至是许多看似毫不相干领域的实际问题。在数学上的一点突破,可以带动很多领域和行业的进步。”数学之美表现为一种简单、简约之美,一个正确的数学结论在其内容上可能复杂或深奥,但其表现形式往往却很简单,而且正确的数学结论在形式上通常比那些错误的结论看起来更协调、更具美感。当然数学之美还表现在很多方面。数学教师应在平时的数学教学过程中坚持渗透数学美的教育,让学生在课堂中不断感受、欣赏数学的美,让学生最终领悟到数学的美。充满审美与灵感的数学课堂教学,才能激发出学生数学思维的灵感、碰撞出数学思维的火花,才能潜移默化地影响更多的学生喜欢上数学课,从根本上改变学生意识中数学的枯燥印象,进而实现高效的数学课堂教学。

四、充满思维训练与质疑的数学课堂教学

高中数学特征范文第6篇

一、有效教学的实施特征

1.教学目标有效

全面的教学目标是有效教学的基础,一般来说教学的目标分为三个层次.依次为:基础知识和技能、过程和方法、情感和态度.有效教学目标不仅仅重视基础知识和基本技能的掌握,同样注重教学的过程和教学方法对学生的影响,当然也有情感的迁移.对于高中数学的教学目标来说,基础知识和技能要求学生必须熟练地掌握数学的本质、概念、结论和应用方法,基本的技能要求有运算求解、数据分析、抽象概括、空间想象等,教学过程中注意学生分析、解决问题的能力,教学迁移目标要求学生能够应用数学技能以及数学思想来分析和解决生活中的[JP3]实际问题,对现实世界蕴含的数学问题有一定的判断和思考能力.

2.教学过程有效

新课改要求突出学生为主体,把课堂还给学生,但是不可忽视教师在其中的主导地位.教学过程的有效体现在两个方面:(1)教师教学活动有效.教师要结合实际的教学目标、教学设计有组织地开展讲解、提问、引导启发等行为,并与有效的教学目标相结合.为此就要求教师在课前做足准备应对课程上的问题,在课堂教学中认真观察并聆听学生的反馈,发现主要问题,给予合理的引导,并给予具有逻辑性和启发性的问题.面向全体学生,在这教师也要合理地引导并对知识做一定的情景迁移,站在学生的角度思考问题,照顾到学生知识结构和思维能力的局限性,引导课堂教学的正常进行;(2)学生学习活动有效.数学是一门逻辑性和抽象性很强的学科,学生在学习中的思维活动直接决定着学习的效果.因此如何引导学生在学习中进行积极主动的思考也是学习有效的关键,特别是数学中的归纳、分析、抽象和逻辑等学习活动是构成学习行为的重要过程,教师切不可采取填鸭式的教学方式,忽视了学生学习的主观能动性.

3.教学方法有效

随着新课改的进行,现阶段越来越多先进的教学方法被引入到教学中.那么这些全新的教学理念和方法在应用到实践教学中的时候是否能够起到应有的效果呢?教学方法的有效特征就是要求教学方法能切合教学内容的要求,提高对教学内容的有效诠释.其主要体现表现在两个方面:(1)突出探索的理念.教学方法中不应该只注重学生被动地接受知识和技能,而是发挥学生的主动性,因此要运用适当的教学方法来让学生参与到学习活动中来,亲自感受知识的产生过程,突出探究性学习的重要性;(2)突出与教学内容之前的配合.不同的授课对象、授课内容用到的教学方法也是有一定区别的,而且教师也应该明白任何教学方法都不是尽善尽美的,教师要综合运用多种教学方法来激发学生在课堂上的活跃度.

二、高中数学中有效教学的实施策略

1.突出探究性学习,实现知识重构

构建主义认为人的学习是建立在生活经验和现有知识基础上的,而不是生硬地接受知识本身.因此为了提高数学教学的有效性,教师必须在教学过程中充分地考虑学生的知识体系以及生活经验,注重定理、定义等知识的重构过程,并在这个过程中激发学生的自主思考能力.教师也可以和学生形成学习共同体,共同分析知识的重构过程,提高对数学的理解.

2.教学过程突出思维训练

思维能力依然是数学教学的重点,而数学学习的过程并不仅仅是知识的接受、学习和运用的过程,更重要的是思维能力的提高.因此教师要合理地在教学中安排思维训练,从而暴露出思维操作的平台,让学生养成良好的思维素质,从而促进学生综合数学能力的提高.数学教学的本质就是思维启发的过程,因此过程更重要.

3.以激发学生学习兴趣为基础

兴趣是最好的老师,如果学生对学习数学产生了浓厚的兴趣,那么学习的效果自然也会很好.因此教师除了要注重传授知识的过程,还需要关注学生在这个过程中的情感状态,通过师生之间良好的互动,产生正向的情感体验,从而激发学生的学习兴趣和动力.以激发学生兴趣为基础的教学过程能够发挥有效的作用,从而形成学生学习的内动力,促进教学和学习的双边开展.

总之,有效教学的开展不是纸上谈兵,还需要实践教学的不断完善,不断促进教学质量和学习效率的提高.

[FL(K2]好的方法.已知f(x)=[SX(]k・2x-1[]2x+k[SX)]为奇函数,求k的值时,用f(0)=0求k就漏解了,原因就是没有考虑0是否在定义域内,所以第二个问题用定义求解更好.

高中数学特征范文第7篇

关键字:学生画像;标签;特征矩阵

中图分类号:G641 文献标志码:A 文章编号:1673-8454(2015)19-0046-04

一、引言

当今大学生成长在以互联网和手机通信为代表的现代传媒手段蓬勃兴起的时代,虽然可以开拓国际视野,但也缺乏自制力,容易迷失方向,无法自拔;还有部分学生由于其人生观、价值观在成长过程中发生偏差,崇尚享乐主义,主要精力不放在学习上,学生的自主能力差,不能正确的处理学习和交友,学习与休息,学习与娱乐等的关系。自我控制能力差,纪律松懈,作风散漫。从而导致了多门课程重修,学习进入了恶性循环。2012年中国社会科学院在国内教育发展研究报告中指出,目前国内每年平均有50万大学生选择了退学,其达到了大学招生的0.75%左右。其中主要原因是由于成绩差,对个人学业或是对学校教学环境丧失信心[1]。大学生选择退学的结果给社会、学校、家庭带来了很大负面影响。

从学校的管理角度出发,若能建立动态的预警教育机制,对大学生的不良思想、行为做到事先警示教育、事后跟踪管理,对学生可以起到“扬鞭奋起”的警示与鞭策作用。学籍异常都是逐渐产生的,怎样在产生恶果之前及时介入干预和帮扶,怎样才能做到“防微杜渐”、是急待解决的问题[2][3]。

二、当前学籍预警体系的现状

目前,高校学籍管理一般分为校院两级管理模式,学校级别的管理主要靠建立规章制度和执行规章制度,而学院对学生的管理主要靠学籍监控及预警指导为主。教务工作与学生思想政治工作在学生管理方面相对独立,主要是事后预警。

(1)成绩预警:根据教学管理系统,统计学生完成的学分及学分绩点和教学计划要求的进程比对,评估学生学习情况,并预测学生完成培养方案的趋势,将可能无法完成培养方案的学生整理汇总,并将其交给学院辅导员。辅导员针对学生的具体情况进行干预并对其预警。

(2)日常预警:可以借助教师定期对学生考勤记录、作业是否按时完成、以及课堂学习状态等进行分析,学院教学管理者收集到相关信息后进行整理及筛选后反馈给辅导员,由辅导员进行预警处理。

由此可见,目前的预警主要是单方向的,孤立的事后预警,具有迟滞性。只有出现严重的学籍异常后,才采取相应的对策解决问题,但是对于一些潜在的问题,学生不能发现,比如对处于网瘾状态而上学期表现良好的学生不能及时发现。现有的学籍预警系统无法做到对学生的学习和生活状况的实时监管,对问题的根源无法追踪。要以“学生为本”构建全方位预警方式的构架,将大数据挖掘技术和传统的人力管理相结合,做到“防微杜渐”,减少产生恶劣的后果。

三、基于学生画像的学籍预警系统

随着大数据时代的到来,学生的所有行为在高校面前几乎全是“可视化”的。许多高校开始研究如何有效的利用大数据技术为人才培养服务,挖掘学校海量数据潜在的巨大价值,进而提出“学生画像”的概念。学生画像即学生特征进行标签化处理,是高校利用采集到学生的各方面数据, 构建一个学生数据抽取模型。通过分析其个人基本属性、学籍信息、考勤信息、上网行为、借阅图书信息、校内消费行为及个人兴趣爱好等重要特征,进而抽象出学生的在校画像,该画像可以作为是学校教学管理的重要依据。学生画像可以为学校提供了充足的学生数据,对学生特征数据进行降维及聚类分析,能够帮助学校快速准确的了解各个学生的学籍状态,依据评价结果,有针对性的对相关学校有关部门、教师、家长和学生传递预警信号,必要时采取干预措施,对学籍状态出现异常的学生给予有针对性的引导,避免因各种原因导致学生无法完成学业或产生其他不良结果的事情发生。

1.构建学生画像的意义

随着信息化建设的不断推进,高校在各种管理系统中采集并保存了有关学生信息的海量数据,并逐步形成了一个从学生基本信息、学籍信息、校内消费、图书借阅到上网行为的多维度数据存储体系。如果能够根据学校管理决策的需要构建一个数据仓库,对该存储体系统的数据进行抽取、清洗、转换并载入数据仓库中,进而形成一个高质量的数据中心,学生画像是在学校数据仓库中进行数据挖掘,通过其中多维度的数据信息,分析学生的有关信息,还原学生的基本属性、学习成绩、上课考勤、图书借阅行为、上网行为以及校内消费行为等属性。了解学生的各种特征及需求,精准描述学生群体特征,针对特定场景进行学生不同维度的聚类分析,将杂乱无章的海量数据转变为栩栩如生的学生画象,进而监控学生的学籍状态,并预测学生学业走向,必要时管理者可以干预学籍异常学生行为,对其进行有效的管理。

2.学生画像的构建

学生画像的主要任务是给学生贴“标签”,标签是指可以准确精炼的描述学生的特征标识,比如性别、年龄、民族、兴趣爱好等,将学生的所有标签综合在一起,就可以构成学生的“画像”了。本文主要从学生的基本属性、学习成绩、上课考勤、图书借阅行为、上网行为以及校内消费行为对学生特征进行研究。学生画像主要分三步:①采集学生数据;②统计分析,生成学生特征标签;③生成学生画像。流程如图1所示。

首先,对学校各个数据源进行数据抽取、清洗、转换、装载入学生数据仓库中,采集到的学生数据分为静态特征数据和动态特征数据,所谓静态特征数据是学生相对固定不变的特征信息,如姓名、性别出生日期、民族等特征,动态特征数据就是学生随时间的推移不断变化的行为特征,如学习成绩、上课考勤、图书借阅行为、校内消费行为及上网行为等。

其次,利用收集到的学生特征属性信息,通过统计分析为学生在不同纬度特征上贴上标签。其中,对于学生静态属性,例如学号、姓名、性别、出生日期、民族籍贯等,通过对采集到的特征数据进行抽取、清洗及转换,可以直接为学生贴上标签。 对学生动态属性贴标签时,需要根据具体需求进行统计分析。比如对学生学习状况分析时,需要对学生学年学期不同课程性质课程获取的成绩标准化处理,然后进行统计分析,生成学生学期不同课程性质获取的平均成绩,从而为该生贴上学习状况标签。依据同样方式为学生贴上上课出勤特征、上网特征及借阅图书特征等。

最后,根据学生的所有标签为学生画像,通过画像可以直观地呈现学生特征属性。

3.学生画像分析

高校为学生特征生成画像后,通过分析学生画像可以实时准确了解学生的各方面特征,掌握其基本学籍状态。考虑到学生画像中不同特征间具有某种相关性,而相关性会增加统计分析的复杂程度,采用主成分分析法对学生画像进行分析,将最初具有关系的属性用新的相互独立的属性来替代。选取尽可能少的属性来反映学生的所有特征。分析学生画像主要包括以下步骤:

(1)将n个学生画像数据按列生成矩阵S,如公式(1),该矩阵由n行m列组成

(5)选择主成分

根据标准化的学生特征数据,根据特征贡献率将学生特征值按降序排列,根据统计需求取前若干行(特征),形成降维后的学生特征矩阵S。

四、实验验证

通过对北京信息科技大学31个专业2个年级5367名学生静态数据及动态特征数据采集、整理、过滤分析,形成学生画像。其中包括静态特征(基本属性)24个,动态特征5个,总计29个特征信息。针对学生的特征数据生成学生特征矩阵,进而对学生特征矩阵进行主成分分析法进行降维处理,动态提取学生关键特征值,从而生成新的学生特征矩阵,然后利用基于距离的聚类分析法,将学生进行聚类,将严重偏离中心点的学生特征信息提取出来,如图3所示,离群点的学生信息有可能为学籍状态异常,进而生成学籍异常学生信息,通过将模型提取的学籍异常学生信息与学院核对,结果发现95%的学生确实存在学籍异常特征。

在分析过程中产生了一些急待解决的新问题,为进一步动态地监控学生学籍的状态,需要教务处、学生处、学院、任课教师、辅导员及学生多方形成合力,缺少任何一方的积极推进,都无法顺利完成预警工作并取得实效。必须在以下几方面进行加强建设:①及时上报课堂考勤数据。任课教师考勤是考勤预警的最准确、全面的数据来源,数据汇总要及时,以免错失最佳干预期。②各个信息系统数据充分共享。各个应用系统之间的信息避免出现孤岛现状,实行实时的共享和同步。

五、结束语

采用学生画像的方法监控学籍状态,构造学生特征矩阵,并经过降维处理,简化特征,能够实时掌握学生学籍的动态生特征信息,及时的发现问题,未雨绸缪的采用预警措施,利于学校的学风建设,对于学籍信息不稳定的学生,采取实时预警措施。在有大量信息的教育领域,将基于学生特征画像方法应用于学籍状态监测,在高校学生管理中加以推广应实验结果表明,所得出的结论对高校教学和人才培养具有一定的指导意义。

参考文献:

[1]杨东平.中国教育发展报告2012[M].北京:社会科学文献出版社,2012.

[2]张红云.高校学习预警机制探索[J].科技信息,2010(1):801.

[3]章东飞.大学生学籍预警机制探索[J].教育学术月刊,2010(5):75-76.

[4]袁安府,张娜,沈海霞.大学生学业预警评价指标体系的构建与应用研究[J].黑龙江高教研究,2014(3):79-83.

[5]吴青芳,胡欣敏.高校学籍管理与学风建设关系研究[J].化工高等教育,2010(4):21-24.

[6]李爱凤,刘葵,唐连章等.数据挖掘技术在数字化校园共享数据中心的应用[J].实验室研究与探索,2013(11):232-236.

[7]黄晓霞,程论.综合评价与数据挖掘的比较[J].上海海市大学学报,2007(12):54-58.

[8]刘昕,郑莆燕,刘莉.学分制下二级学院学生预警机制的探索与实践[J].教育与职业,2013(1中):174-175.

[9]林静,陶爱萍.我国近二十年高校学籍管理制度理论研究综述[J].江苏高教,2012(1):60-62.

[10]曾丽.学分制条件下学籍管理的完善[J].鞍山科技大学学报,2006(6).

[11]张波,耿在丹,杜保强.基于数据仓库的学生信息管理决策系统[J].实验室研究与探索,2009,28(12):60-62.

[12]华金秋.台湾高校学习预警制度及其借鉴[J].江苏高教,2007(5):136-137.

[13]赵力,王涛,金代志等.高等院校学籍管理系统功能设计,2009(8):107-108.

[14]别红桂.高校学籍管理工作的改革与探索[J].教育探索,2011(1):88-89.

[15]赵雄辉,聂娟.高等学校学籍管理制度建设原则探讨[J].高等教育研究学报,2006(3):78-80.

高中数学特征范文第8篇

(集宁师范学院数学系,内蒙古乌兰察布012000)

摘要:本文对矩阵特征值进行归纳、总结,通过例题了解求特征值的方法与技巧,并利用特征值求解行列式、矩阵等相关问题,提高学生对矩阵特征值的认识,从而扩展解题思路,提高抽象思维能力,为其进一步的学习和研究打下良好的基础。

关键词 :矩阵;行列式;特征值;特征多项式

DOI:10.16083/j.cnki.22-1296/g4.2015.04.072

中图分类号:O151.2文献标识码:A文章编号:1671—1580(2015)04—0153—02

收稿日期:2014—10—19

作者简介:张瑜(1977— ),男,内蒙古四子王旗人。集宁师范学院数学系,讲师,硕士,研究方向:应用数学。

张越(1975— ),男,内蒙古四子王旗人。集宁师范学院数学系,讲师,硕士,研究方向:应用数学。

一、引言与预备知识

特征值在高等代数中尤为重要,在各高校历年考研试题中占有一定的比例,它在很多领域都有广泛的应用。在科学研究与工程设计中灵活运用特征值可以使很多复杂的问题简单化,起到便利的作用,而且随着现代科学技术的迅猛发展,矩阵理论已成为目前最有实用价值的数学理论之一。尤其是对特征值与特征向量的讨论被作为矩阵理论研究的一个重要组成部分,因此,对矩阵特征值的研究与探讨是很有必要的。

定义1若存在非零向量X,使得AX=λX,则称λ为A的特征值,X称为A的属于特征值λ的特征向量,f(λ)=(λI-A)称为A的特征多项式。

A的特征值λ是特征方程f(λ)=0的根,特征向量X是方程组(λI-A)X=0的所有非零解。

注 ①特征向量X≠0,且特征值只针对于方阵。

②特征值λ与特征向量X并不具有唯一性。

③n阶方阵A的特征值是使齐次线性方程组(λI-A)X=0有非零解的λ的值,即满足|λI-A|=0的λ都是方阵A的特征值。

二、矩阵特征值的几个有用且比较重要的结论

命题1设A,B是n阶方阵,则AB与BA有相同的特征值。

证明(法Ⅰ)若A可逆,则|λI-AB|=|A-1(λI-AB)A|=|λI-BA|。若A不可逆,但A-aI可逆,此时b(A-aI)与(A-aI)B有相同的特征多项式,于是|λI-B(A-aI)|=|λI-(A-aI)B|,但仅有有限个值使得|A-aI|=0,即有无限个a之值使得A-aI可逆,故上式为恒等式。特别当a=0时,上式成立,即|λI-AB|=|λI-BA|,故AB与BA有相同的特征多项式,从而AB与BA有相同的特征值。

(法Ⅱ)若λ=0是AB的特征值,即存在λ≠0,使得ABX=0X=0,所以AB不可逆,于是A,B中至少有一个不可逆,从而AB不可逆,故存在非零向量X,使得BAX=0,即0是BA的特征值。

若λ=0是AB的特征值,即存在X≠0,使得ABX=λX,令Y=BX,则AY=ABX=λX≠0,所以Y≠0,于是BAY=BABX=BλX=λBX=λY,即Y是属于AB的特征向量,λ是BA的特征值,同理,BA的所有特征值也是AB的特征值。故AB与BA有相同的特征值。

命题2设A,B分别为n×m与m×n阶矩阵,如果n>m,则AB与BA的特征多项式仅相差一个因子λn-m。

=[a1a2…an]T,

C=[b1b2…bn],则A=BC,而CB=∑nk=1akbk,于是CB的特征值为∑nk=1akbk。

又由于BC与CB的特征多项式仅相差一个因子λn-1,因此A=BC的特征值是特征方程λn-1

λ-∑nk=1akbk=0的根,即λ1=λ2=λn-1=0,λn=∑nk=1akbk,因此I+A的特征值为1,1,1,…,1,1+∑nk=1akbk。

特别地,若A=[a1a2…an],则I+ATA的特征值为1,1,1,…,1,1+∑nk=1a2k。

命题4实反对称矩阵的特征值是零或纯虚数。

证明设A是实反对称矩阵,λ是A的任一特征值,ξ≠0是属于特征值λ的特征向量,则Aξ=λξ。

以上命题的结论较为重要,不仅在特征值的计算中应用较多,在其他性质、结论的证明过程中应用也比较广泛。另外,特征值的计算方法较多,尤其对于不同的矩阵,如实对称矩阵、正定矩阵等,均有不同的特征值求法,在此不一一举例说明。

三、结束语

通过对矩阵特征值的探究与讨论,我们了解到特征值应用的广泛性,利用矩阵特征值可以求出实对称矩阵的正交矩阵、高次幂矩阵等较复杂的问题,使得计算简单方便,并且有利于扩展解题思路,提高抽象思维能力。

参考文献]

[1]张禾瑞,郝炳新.高等代数[M].北京:高等教育出版社,2008.

[2]张贤科,许甫华.高等代数[M].北京:清华大学出版社,2004.

[3]钱吉林.高等代数题解精粹[M].北京:中央民族大学出版社,2010.

高中数学特征范文第9篇

针对语音识别中梅尔倒谱系数(MFCC)对中高频信号的识别精度不高,并且没有考虑各维特征参数对识别结果影响的问题,提出基于MFCC、逆梅尔倒谱系数(IMFCC)和中频梅尔倒谱系数(MidMFCC),并结合Fisher准则的特征提取方法。首先对语音信号提取MFCC、IMFCC和MidMFCC三种特征参数,分别计算三种特征参数中各维分量的Fisher比,通过Fisher比对三种特征参数进行选择,组成一种混合特征参数,提高语音中高频信息的识别精度。实验结果表明,在相同环境下,新的特征与MFCC参数相比,识别率有一定程度的提高。

关键词:识别精度;梅尔倒谱系数;逆梅尔倒谱系数;中频梅尔倒谱系数;Fisher准则

中图分类号: TP391

文献标志码:A

Parameter extraction method for Mel frequency cepstral coefficients based on Fisher criterion

Abstract:

Concerning the low identification precision of Mel Frequency Cepstral Coefficients (MFCC) parameters in high frequency signals and the problem that the influence of each dimension feature parameters has not been considered to identify, the method of extracting features based on MFCC, IMFCC (Inverted MFCC) and MidMFCC (Mid-frequency MFCC) combined with Fisher criterion was adopted. Extracting MFCC, IMFCC and MidMFCC parameters from speech signals and calculating the Fisher ratio of components of three parameters, useful parameters were chosen by using Fisher standard and a mixture feature was constructed to improve mid-frequency and high frequency recognition accuracy. The experimental results show that the new feature has better recognition results compared with MFCC in the same environment.

Key words:

recognition accuracy; Mel Frequency Cepstral Coefficient (MFCC); Inverted MFCC (IMFCC); Mid-frequency MFCC (MidMFCC); Fisher criterion

0 引言

在语音识别中,最终的训练和识别环节是针对语音的特征参数进行的,因此特征提取在识别过程中作用非常关键[1]。

目前,常用的特征参数主要有线性预测系数(Linear Prediction Cepstral Coefficent, LPCC)、感性预测系数(Perceptual Linear Predictive, PLP)及梅尔倒谱系数(Mel Frequency Cepstrum Coefficient, MFCC),其中LPCC与PLP对环境的依赖性较高,抗噪能力差[2],所以目前应用较多的是MFCC。MFCC系数描述的是语音在频率上的能量分布,使用一串在低频区域交叉重叠排列的三角滤波器组,获得语音的频谱信息,但是由于低频区域使用的滤波器数量较多,分布密集,同时中高频区域使用的滤波器数量较少,分布稀疏,造成MFCC随着频率的提高,计算精度下降,对最终的识别结果会造成影响,特别是当识别基元选择为音节或词组时,在两个读音相近的音节或词之间误识率较高。目前对于语音的特征参数的提取,提出了许多改进的算法,如针对短时傅里叶变换无法兼顾时间和频率分辨率,采用分数阶傅里叶变换或小波变换等调频信号的处理方法代替短时傅里叶变换对语音信号进行处理[3],或者针对MFCC参数对于语音信号描述的不完整性,在其基础上进行改进。文献[4]采用分数阶傅里叶变换代替短时傅里叶变换,三角Mel滤波器组替换为听觉滤波器组进行特征参数的提取,但是在这种算法中变换阶数的选取对于分数阶傅里叶变换的性能有至关重要的影响。Sandipan等[5]针对高频信息,提出了逆梅尔倒谱系数(Inverted MFCC, IMFCC),结合MFCC与IMFCC作为新的特征参数。韩一等[6]提出了针对中频能量的滤波器组,得到一种新的参数,结合MFCC和IMFCC组成混合参数进行情感识别。袁正午等[7]采用IMFCC、中频梅尔倒谱系数(Mid-frequency MFCC, MidMFCC)和MFCC相结合的改进算法,使用混合滤波器组,进行语音识别。

评价特征参数中不同分量对识别的贡献一般有两种方法,通过各个分量的Fisher比得到各分量的区分能量,或者通过增减分量的方法判断每个特征分量的贡献[8]。甄斌等[9]采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献,但是通过增减特征分量的方法计算量较大,同时受环境及语音识别的影响较大,因此利用Fisher准则来分析特征向量,确定特征分量的可分离性是一种常用的特征选择方法。张芸等[10]利用Fisher准则对LPCC和MFCC特征参数进行结合构造一种新的特征参数应用于说话人的识别。胡雪峰等[11]利用Fisher准则结合MFCC与IMFCC构造出了新的混合特征参数,但这种参数没有考虑到中频能量分布情况。

1 语音特征参数的提取

1.1 Mel倒谱系数的提取

梅尔倒谱系数(MFCC)模拟人耳的听觉特性,即对于低频语音信号的感知分辨能力相比高频信号更强,将语音线性频谱转化为基于Mel频标的非线性频谱,然后转换到倒谱域[1]。在1000Hz以下,Mel刻度与Hz频率刻度近似遵循线性关系,而在1000Hz以上的声音频率范围Mel刻度与Hz频率坐标遵循近似对数关系,两种坐标的变换关系如式(1):

Fmel=1127*ln(1+fHz/700)(1)

MFCC是采用滤波器组的方法计算出来的,在Mel域均匀分布一组三角带通滤波器,称为Mel滤波器组,变换到Hz频域,滤波器的中心频率和带宽随着频率的变化而变化,在1000Hz以下滤波器分布密集,而在1000Hz以上,滤波器分布比较稀疏,频域滤波器分布如图1所示。

图1(a)表示MFCC中尺度变换关系,(b)是三角滤波器组分布图,人耳对于不同频率的声音,感知能力是不一样的:频率在1000Hz以下的声音,人耳对其感知能力基本满足线性关系;频率高于1000Hz时,人耳对声音的感知能力与声音的频率近似满足对数关系。而在Mel频率域,人耳对于不同Mel频率的声音近似满足线性关系。

MFCC参数提取流程:

1)语音信号经过加窗处理后变为短时信号,利用快速傅里叶变换(Fast Fourier Transform, FFT)将这些时域信号转换为频域信号,并计算短时能量谱。

2)将短时能量谱用一组三角滤波器组进行滤波,得到一组滤波系数,其中每个滤波器的中心频率在Mel刻度上均匀分布,带宽为相邻中心频率的差值。

3)对得到的滤波系数根据式(2)进行余弦变换,去除各维信号之间的相关性,将信号映射到低维空间以得到特征参数。

1.2 IMFCC和MidMFCC的提取

在MFCC参数中,滤波器组主要分布于低频部分,注重于语音的低频频谱,对于中高频的频谱信息计算精度较差,造成最终提取的参数不能最大限度地表征语音的特征。为了提高中高频的计算精度,先后提出了逆梅尔倒谱参数(IMFCC)[5]和中频梅尔倒谱参数(MidMFCC)[6]。这两种参数与经典的MFCC的不同主要在Mel刻度与Hz刻度的转换上,IMel刻度和MidMel刻度与Hz刻度的转换关系如式(3)、(4)所示。

2 Fisher比准则

以上三种特征参数分别表征语音信号三个频段的特点,可以结合这三种特征对语音进行描述,但是,直接将它们叠加组合会产生一些问题。首先,增加了特征参数的维数,如果每种参数提取12维,那么最终得到的是36维参数,增加了计算量,同时各维特征参数对识别的贡献不同,有些参数可能包含的信息量较少,有些包含的可能是冗余信息,如果将它们同等对待,最终会影响识别性能。所以必须对各维参数对识别结果的影响程度进行评价,得到对识别影响最大的参数,然后组合三组特征作为新的特征参数。通过计算特征分量的Fisher比得到各分量的区分能力[12]。

Fisher判别准则:

其中:k表示特征参数的维数,k=1,2,…,12;mk表示语音特征第k个分量在所有类上的均值;mik表示语音特征第k个分量第i类的均值;ωi表示第i类的语音特征序列;M、ni分别表示语音特征序列的类别数及各类的样本数;cik表示第i类语音特征序列的第k个分量。

特征分量的类间方差反映了不同语音样本之间差异的程度,而类内方差反映了同一语音样本之间的密集程度,对于特征分量,从类内方差和类间方差两个方面表征了它的可分离程度,图4给出了三种特征参数中维数与Fisher比之间的关系,从中可以看出不同维数分量对识别的贡献程度是不同的。

混合特征参数的提取过程如下:

1)对语音数据进行预处理,包括预加重、分帧加窗和端点检测;

2)分别对预处理后的语音数据在三种滤波器组的情况下提取特征参数MFCC、IMFCC和MidMFCC;

3)分别从MFCC、IMFCC和MidMFCC三种参数中选择Fisher比即区分度最大的6个分量组合成新的18维的混合特征参数。

3 实验分析

从说话的方式可以将语音识别分为孤立词识别、连接词语音识别和连续语音识别:孤立词语音中主要是将词语作为整体进行识别;连接词语音通常涉及的是数字串的识别;连续语音识别的对象是自然连续的语音,词与词之间没有停顿,像日常口语一样,因此会出现大量的连音和变音现象,识别时比较复杂。因此,一种新的特征参数不仅在孤立词下能够提高识别率,同时在连续语音的情况下,对识别性能应该有所改善。为了验证本文提出的混合特征参数的有效性,主要针对孤立词和较复杂的连续语音进行试验,分别设计了两个实验进行仿真验证,实验一在孤立词的情况下进行,实验二是在语音段长度较长的情况下对本文提出的特征参数有效性进行验证。

3.1 实验一

实验中所用到的语音数据采集自实验室的同学,创建了一些控制词汇(包括启动、左转、右转、停止)的语音库,录制4个人(3男1女)的语音,每个词每人录制7次,其中采样频率为22050Hz,共有112个语音数据,将其中的80个作为了测试语音,每个词有20个测试样本,其余的作为训练样本。

实验中首先需要确定所选的滤波器的阶数,通常滤波器组的阶数在18到24之间,所以本文在考虑计算速度的同时采用19阶滤波器组,通带范围0~4000Hz,这是由于正常情况下普通人发出的声波在4000Hz以下,帧长256个采样点,帧移128个采样点,分别得到12阶MFCC系数、MidMFCC系数及IMFCC系数,然后分别在三种参数中选择Fisher比最大的6个组成18维的混合特征参数。在识别实验中,选取MFCC特征参数和文献[7]的特征参数作为本文参数的比较算法。

训练和识别环节采用混合高斯模型(Gaussian Mixture Model, GMM),GMM的混合度为8,利用高斯模型对训练样本的混合特征参数进行训练,得到4个语音声学模型,然后对测试语音进行识别,与经典MFCC特征参数和文献[7]的特征参数相比,识别率如表1所示。

由结果可以得到:

1)根据文献[7]的算法和本文算法得出的特征参数与MFCC相比,在相同环境下,识别率上都有不同程度的提高,这主要是这两种方法都增强了中频与高频能量的计算精度,这说明虽然语音的主要特征信息集中于低频部分,但是中高频部分对于识别结果有影响。

2)从表1看到,基于MFCC参数的识别在四个词中都存在误识,其中“左转”和“右转”误识次数较多,这主要是由于本文是以词为识别基元,在这两个词中存在相同的音节,对最终的识别结果有影响。基于文献[7]的算法提取的特征参数虽然在识别率上提高了2.5%,但是在“左转”和“右转”这两个词之间识别效果并没有明显的改进,并且误识一般发生在这两个词之间,即“左转”识别成“右转”,同时将“右转”识别成“左转“,这说明在滤波器组分布上简单地对三种滤波器进行组合,对识别结果有所改善,但是若音节的读音比较相近,那么与MFCC相比,改善效果并不明显,甚至可能加大误识数。本文算法提取的特征参数在音节读音相近如左转和右转之间,能够减小它们之间的误识数,说明本文通过Fisher比选择特征参数能够提高识别率,同时改进相近字节之间的识别效果。

3.2 实验二

在实验二中采用字数较多的词组来验证提出的算法的效果,这些词组为“重庆大学自动化学院”“重庆大学电气工程学院”“重庆大学机械工程学院”和“重庆大学光电学院”。相比实验一的数据,这些词组读音的相似度很高,同时字数比较多。每段语音的录制情况与实验一中相同每人录制7次,将其中的80个作为测试语音,每个词有20个测试样本,其余的作为训练样本,语音识别过程其他参数的设定与实验一相同,结果如表3所示。

1)实验中语音数据的特点是语音较长,语速与正常交谈的语速相同,同时语音模板之间读音的相似度较高,仅仅只有两个字不同,因此,相比实验一,实验二中的数据更加符合日常的交谈特征,同时本文只采用声学模型进行验证,没有结合语言模型,造成三种算法的识别率都有所下降。

2)由表3可以得到本文的特征提取算法相比传统的MFCC算法和文献[7]的算法最终的识别率高,并且在没有语言模型的情况下,也可以达到88.75%,说明不管是在孤立词还是在较长的语音段的情况下,本文算法提取的特征参数更能表征语音的特征,这主要是因为本文算法结合每一维特征参数在不同语音模板之间的方差来构造特征参数。

4 结语

本文针对经典的MFCC参数对于语音中高频信息描述不完全的问题,利用Fisher比分布选择MFCC、IMFCC和MidMFCC参数中可分程度最大的特征分量构造了新的混合参数。最后采用GMM进行语音的识别,结果表明,这种特征参数相比经典MFCC参数,在相同的环境条件下有较好的识别效果。

参考文献:

[1] HAN J, ZHANG L, ZHENG T. Speech signal processing[M]. Beijing: Tsinghua University Press, 2004:101-124.(韩纪庆, 张磊, 郑铁染.语音信号处理[M].北京:清华大学出版社, 2004: 101-124.)

[2] WEI Y, ZHANG X. A PLP speech feature extraction method in noisy environment[J]. Journal of Taiyuan University of Technology,2009,40(3):221-224. (魏艳, 张雪英. 噪声条件下的语音特征PLP参数的提取[J]. 太原理工大学学报, 2009, 40(3): 221-224.)

[3] YIN H, XIE X, KUANG J. Acoustic features based on auditory model and adaptive fractional Fourier transform for speech recognition[J].Acta Acustica, 2012,37(1):97-103.(尹辉, 谢湘, 匡镜明.基于听觉模型与自适应分数阶Fourier变换的声学特征在语音识别中的应用[J]. 声学学报, 2012, 37(1): 97-103.)

[4] ZHANG W Q, HE L, HOU T, et al. Fractional Fourier transform based auditory feature for language identification[C]// Proceedings of the 2008 IEEE Asia Pacific Conference on Circuits and Systems. Piscataway: IEEE, 2008: 209-212.

[5] SANDIPAN C, ANINDYA R, SOURAV M. Capturing complementaiy information via reversed filter bank and parallel implementation with MFCC for improved text-independent speaker identification[C]// Proceedings of the 2007 International Conference on Computing: Theory and Application. Piscataway: IEEE, 2007: 463-467.

[6] HAN Y, WANG G, YANG Y. Speech emotion recognition based on MFCC[J].Journal of Chongqing University of Posts and Telecommunications: Natural Science,2008,20(5):597-602.(韩一,王国胤. 杨勇.基于MFCC的语音情感识别[J].重庆邮电大学学报:自然科学版,2008,20(5):597-602.)

[7] YUAN Z,XIAO W. Improved speech recognition algorithm based on MFCC feature[J].Computer Engineering and Applications,2009,45(33):108-110.(袁正午,肖王辉. 改进的混合MFCC语音识别算法研究[J]. 计算机工程与应用, 2009, 45(33):108-110.)

[8] KANEDERA N, ARAI T, HERMANSKY H. On the importance of various modulation frequencies for speech recognition[C]// Proceedings of Eurospeech. Rodos, Greece:[s.n.],1997,9:1079-1082.

[9] ZHEN B, WU X, LIU Z, et al. On the importance of components of the MFCC in speech and speaker recognition[J].Journal of Peking University:Natural Sciences,2001,37(5):371-378.(甄斌, 吴玺宏, 刘志敏,等. 语音识别和说话人识别中各倒谱分量的相对重要性[J]. 北京大学学报:自然科学版, 2001, 37(5): 371-378.)

[10] ZHANG Y,LI X,ZHENG Y, et al. Speaker recognition based on Fisher discriminant criterion[J].Journal of Lanzhou University: Natural Sciences,2007,43(2):92-97.(张芸, 李昕, 郑宇, 等.一种基于Fisher准则的说话人识别方法研究[J]. 兰州大学学报:自然科学版, 2007, 43(2): 92-97.)

高中数学特征范文第10篇

近年来,随着计算机视觉和模式识别等技术的快速发展,在计算机科学范畴提出了计算美学的概念,希望研究“美”的可计算方法,使计算机能模拟人类自主地理解、推导和计算“美”,并在相关应用中做出可行的美学决策.

图像美学可以定义为人们在观察图像时引发的美学兴趣.可计算的图像美学是计算美学在图像理解方面的重要探索,其研究目的是希望计算机能够模拟人类视觉及审美思维,进而对图像进行美学决策、建立计算机与视觉艺术作品之间的桥梁;使计算机能够自主地对图像的“美”进行定量的分析、计算和评价,比如评价美学指数、判断绘画的美学风格等;通过对图像的美学分析、计算和评估,理解用户的美学感受,帮助寻找到最适合用户心理需求、具有积极情感影响的目标和方案,这对于实现和谐的人机交互具有重要的意义.其研究结果可应用到融合主观感知的基于语义的图像检索、图像美学质量评估、摄影的美学预测与修正、艺术作品风格分析、人机交互,以及设计、摄影、广告等领域.相关研究涉及到艺术、认知科学、心理学、计算机科学等多个学科,属于多学科交叉的创新性前沿研究课题,具有重要的理论价值和应用前景.

由于审美的主观性和复杂性,可计算美学的研究存在一定的难度.1988年,李介谷撰写的《图像处理技术》一书中,曾提及Sasaki提出的关于美函数的概念,他认为图像之所以给人以美的印象与图像的总体布局有关,总体布局包括图像中各对象的布局和总体色调等.2005年,Hoening在计算机科学领域提出了可计算美学的研究,阐释了可计算美学的概念,推动了结合人类感知的可计算美学决策应用的发展.

针对图像美学分类与评价,宾夕法尼亚大学的Wang领导的研究小组,率先实现了图像视觉特征到图像美学判定的关联.他们基于摄影美学相关的一些简单规则,提取了包括图像的亮度、色彩分布、小波变换、景深等35个图像特征,并结合特征选择提取了最有效的15个特征,使用支持向量机方法(supportvectormachine,SVM)对高美感和低美感的图像进行分类;而后采用多元线性回归、利用图像特征评估图像美感分数值.虽然评估结果正确率不高,但显示出可计算图像美学分析是可行的.

不少专家学者在其成果上进一步开展与图像美学评价相关的研究,如Wong等[7]将视觉注意机制引人美学分类,提取出区域特征,获得了更好的分类效果;Wu等实现了图像美感标签(如beautifulvs.ugly)的自动标记,这实际上还是属于图像的美学分类问题;卡内基梅隆大学的Li等™从艺术美学的角度出发,设计了相应的艺术美学特征,实现了绘画作品的美学视觉质量高低两类别分类;Marchesotti等设计了一种图像低层局部特征描述子来评估图像美学质量,给出了一种自底向上的特征提取思路.

图像美学研究的另一个方向是基于美学规则的图像美化.Liu等利用三分法、对角占优等美学构图规则,通过调整原始图像的布局实现图像美化;Bhattacharya等将图像美学应用到图像修改和重建中,利用美学中的三分之一法则改变图像中的主体目标的位置或对图像进行空间重构,以提升照片的视觉美感.

总的来说,图像美学的相关研究在国内外刚刚兴起.在美学分类与评估方面,目前大部分研究只是简单地对图像的美感等级进行分类,其采用的图像特征相对简单,对包含重要信息的区域特征以及结合人类视觉感知的高层美学特征缺乏重视.

1.图像美感分类与评估方案设计

本文提出一种根据人类视觉及审美习惯来评价图像美学价值的可行方案,通过提取符合人类视觉审美的高层美学特征以及包含图像重要信息的区域特征,采用机器学习方法建立模型来实现模拟人类审美感知的图像美学自动评价.图1所示为本文图像美学自动评价系统的框架.

图像的关键区域包含了重要的、主导图像内容的有用信息,在很大程度影响了人们的审美决策.因此,本文不仅对图像整体区域进行分析,还提取了图像关键区域的特征.

此外,为了克服低层视觉特征难以表述人类对图像美感感知的缺陷,在计算低层视觉特征的基础上,引人图像的复杂度特征、色彩均衡性特征、图像能量和景深特征等图像高层美学特征,使之能有效地描述图像,更符合人类对图像美感的感知.

本文的可计算图像美学分析研究主要包括2部分:图像美感等级分类和美学分数评估.图像美感等级分类模型可自动将图像分为高美感和低美感2类,对应机器学习中的分类问题;图像美感分数评估模型可以自动给出图像美感的具体分值,对应于机器学习中的回归问题.本文分别采用SVM分类算法和支持向量回归(supportvectorregression,SVR)算法对图像特征数据进行训练学习,建立了图像美感等级分类模型和图像美感分数评估模型,实现了机器自动对图像的高、低美感进行分类,并给出与人的审美思维相近的美学分数.

2.图像关键区域提取

SteP2.图像分割.显著性计算是基于像素的计算,要提取出关键区域,还需要与图像分割方法相结合.

图像分割指的是将图像细分为多个图像子区域的过程.在图像分割问题中,MeanShift分割算法是一种比较成熟的算法,它基于区域进行分割,综合考虑图像的空间信息和色彩信息,依靠特征空间中的样本点进行分析,与人眼对图像的分析特性相近,无需任何先验知识,且具有收敛速度快的特点,分割效果好,且鲁棒性强.因此,本文采用MeanShift算法对显著图进行图像分割,得到分割块.

Step3.关键区域提取.根据分割块的平均显著性选择分割块,具体步骤如下:

计算每个分割块k的平均显著性St其中,为分割块々中像素总数,^为点j的像素值,/„是分割块6中所有像素的平均值.如果S*>2XS„,即分割块是的平均显著性大于整幅图像的平均显著性的2倍,标记出这个分割块;最后将所有被标记的分割块组合,得到显著区域提取图,将其作为图像的关键区域提取图.经过上述步骤所提取的图像关键区域,基本能代表图像的关键信息,具体示例如图3所示.为提取图像关键区域,主要包括显著性计算、图像分割和关键区域提取3个部分.图2所示为本文提取关键区域的框图.

Stepl.显著性计算.本文参考八(^1«3等的显著区域检测方法提取显著区域,并将其作为图像关键区域.该方法基于Lab颜色空间计算图像的显著性,对于一幅图像令h为图像7所有像素的平均值,乙为图像J高斯模糊后的图像,和L都用Lab颜色空间表示,通过计算L和込的欧氏距离来计算显著性,显著图得到图像显著图后,计算图像平均显著性

    3.图像特征提取

目前从图像中提取低层客观特征(如颜色、纹理、形状等)的算法已经日趋成熟,但是以美学评估为目的的图像特征提取需要结合艺术、心理学和摄影的相关基础理论,寻找出与人的感知和美学密切联系的相关特征,并运用适当的方式进行描述.基于美学的图像特征提取是图像美学研究的核心部分.

本文所计算的图像特征包括低层视觉特征、高层美学特征和区域特征.

3.1低层视觉特征

低层特征具有直观的视觉表达意义,可以独立地、客观地描述图像内容.本文提取的常用低层视觉特征包括颜色特征、纹理特征和形状特征;其中颜色特征包括基于非均匀量化的HSV颜色空间的128维的颜色直方图/!〜/128,以及H,S,V3个分量的一、二、三阶矩(9维)/129〜/137.

本文采用Gabor特征、Tamura特征和灰度共生矩阵来表征图像的纹理特征.对每幅图像计算了6个方向、4个尺度的滤波后平均值和方差,形成48维的Gabor特征向量/us〜/iss.而Tamura特征中,提取了粗糙度、对比度、方向性、线性度、规则度和起伏度,共6维特征/186〜/191.对于灰度共生矩阵特征,提取了4个方向的5个纹理特征属性/192〜/2„,包括角二阶矩、熵、对比度、均匀度和相关度,共20维.对于形状特征,则是基于Sobel算法的图像边缘梯度幅值和方向,得到16维的边缘方向直方图212'.fin最终,从每幅图像提取了一个227维的低层视觉特征向量.

3.2 高层美学特征

由于低层视觉特征与人对图像的理解判断之间存在着较大的差异,基于美学的图像特征提取是图像美学研究的核心部分.本文总结了已有的研究成果,结合审美心理学、美学度量和摄影规则等与人类美学感知相关的各个方面,计算了图像复杂度特征、图像色彩均衡性特征、图像能量和景深特征作为图像高层美学特征.通过实验验证,本文所计算的高层美学特征能更好地表述图像信息和美感信息.

3.2.1图像复杂度特征

图像复杂度指的是图像本身所具有的色彩分布、形状分布、纹理分布以及结构分布等的复杂性程度,被认为是高度相关的审美测度之一.

1933年,美国数学家Birkhoff[14]就提出了著名的美学度量(aestheticmeasure,AM)公式

其中,O。表示事物内在的秩序,0。表示事物内在的复杂性.式(1)显示美学度量与事物内在的秩序与复杂性相关,它被认为是计算美学的雏形.虽然其缺少具体的计算方法,但这些理论对相关工作具有十分重要的指导意义.

Machado等[15]在式(1)的基础上针对图像的美学度量提出了美学公式,并将其中变量的计算具体化.他们认为图像的“美”的度量与图像复杂性(imagecomplexity,1C)成正比,与人脑对图像的处理复杂性(processingcomplexity,PC)成反比,内在重复性高的图像(如分形图像)虽然1C高,但是人在识别和理解时的处理却相对简单,即PC低,所以会感觉美.因此,他们给出美学公式M=IC/PC;其中1C用JPEG压缩图的误差与压缩率的比值表示,PC用分形图像压缩率来表示,并通过心理学绘画欣赏测试实验验证了其方法的有效性.

本文结合目前关于复杂度的研究成果,以信息理论、Kolmogorov复杂度、物理摘,以及图像处理等的基本知识为背景,归类并计算了PC复杂度(包括秩序复杂度和熵复杂度),以及1C复杂度(包括色彩复杂度和纹理复杂度)作为图像复杂度特征.

1) PC复杂度

复杂度的概念最早是由Kolmogorov提出的,其描述的是一维信号或序列的不规则程度,其最大的缺点是不可计算.Rigau等利用心理学理论的观点和思路拓展了Birkhoff的美学信息度量,给出了结合信息论和Kolmogorov复杂度的美学量化方法,包括利用色彩分布信息计算图像的Shanno摘来定义的测度iWB,利用Kolmogorov复杂度结合JPEG压缩比率定义的测度MK,以及从2肛吐的物理熵观点得到的测度Mz.通过在3种不同风格油画作品上的美学数字化分析,验证了这些量化测度的有效性.

借鉴Rigau等[17]的研究,本文采用JPEG编码后的文件大小K来近似Kolmogorov复杂度,并结合Zurek物理熵的观点定义图像的计算复杂度,包括秩序复杂度、熵复杂度,具体如下:

秩序复杂度.是从空间信息规律呈现角度来计算图像的构图复杂性.当图像越有秩序、越有规律时,进行】PEG压缩的压缩程度会越大秩序复杂度Mk的计算式为

其中,为图像的最大信息熵,所得到的(JVXHmax)为图像JPEG编码前的大小,K为编码后的大小.这样,我们得到了秩序复杂度特征/228.Mk值越大,图像压缩量越大,说明图像具有秩序,越具有审美性.

熵复杂度.是基于Zurek的观点计算的,即采用物理熵来衡量图像的复杂度,是Sharmo熵和Kolmogorov复杂度的结合即Mz= K;其中,为颜色分量的平均熵,K为编码后大小.Mz越小,图像越具有美感.这样,我们得到了熵复杂度特征.

2) 1C复杂度

本文计算的1C复杂度包括色彩复杂度和纹理复杂度.

色彩复杂度.基于HSV颜色空间的图像信息量和信息熵理论,定义图像的色彩复杂度.3个颜色通道的信息量分别为Hh,Hs,Hv;WH通道为例,色彩复杂度为

其中,iV为图像的像素总数,PH(;r)为图像H通道上第工维像素的概率.色彩复杂度越大,表明图像所含色彩信息越丰富,图像越具有美感.这样,我们提取了3个颜色通道H,S,V的色彩复杂度/23。〜/232.

纹理复杂度.图像纹理的有序性、规律性反映了图像本身的复杂情况.灰度共生矩阵能较好地描述图像灰度的空间分布情况和图像的整体纹理复杂信息,本文借鉴了高振宇等方法计算灰度共生矩阵的各个特征值并加权,用以衡量图像的纹理上的复杂度.

通过计算灰度共生矩阵的能量特征£:、对比度S、信息熵H、相关度C,以及图像边缘比率尺后,赋予各个特征不同的权重,对它们加权后构成纹理复杂度,其计算公式为MT=H+i?+S—C_E.这样,我们提取了纹理复杂度特征.

3.2.2图像色彩均衡性

色彩均衡是形式美的另一种构成形式,其表现为色彩强弱、轻重的均衡性,能够给人相对稳定的视觉生理和心理感受.色彩均衡是色彩给人重量感的对称性,是重色与轻色相互均衡.一般来说,色彩的重量感取决于色彩的明度,例如深色、浓色会给人重的感觉;而浅色、淡色会给人轻的感觉.人们在观察一幅图像时,均衡的色彩分布、稳定的视觉以及好的心理感受能增强图像的美感.

本文使用了2种衡量图像色彩均衡性的度量,包括色彩熵分布和色彩视觉平衡性.

色彩熵分布.本文从信息熵的角度考虑,通过色彩分布信息计算图像的Sharnio熵来定义色彩分WMB=(Hmax—其中,H咖x为图像的最大信息熵,为HSV各个颜色分量的平均信息熵,得到的为绝对冗余.MB越小,图像中各种色彩使用越均衡.这样,我们提取了色彩熵分布特征.

色彩视觉平衡性.推土机距离(earthmover’sdistance,EMD)是Rubner等提出的一种相似性度量,其采用求解最小运输成本的基本思路来求2个待匹配对象间相似性,这实质是一个双向网络最优路径的选择问题.EMD是一种反映计算机视觉感知相似性的距离度量,通过计算原图像与色彩均匀分布的理想图像之间的颜色EMD,可以衡量图像的色彩视觉平衡性.

对LUV色彩空间进行64等分均匀量化,对于色彩分布均匀的理想图像,其64个色彩分量值是相等的.一幅图像与理想图像之间的色彩分布相似性用EMD距离[4]表示,具体为EMDLuvsemcKD,,D2,{d(a,6)|0<a,6<63}),d(a,6)=||C„-CJ其中,emd()表示EMD的计算函数,D,和D2分别表示理想图像和待求图像的色彩分布和6分别对应于和认分布中的某个直方图区间;和(^6分别是a和6的直方图区间高度,即相应色彩值出现的频数;rfU,6)是Ca与(:6间的欧氏距离,其为64X64的矩阵.这样,我们得到了图像的色彩视觉平衡性特征EMDh.

同时,参考在LUV空间的做法,在RGB空间中,我们也采用同样的方法计算得到图像的色彩视觉平衡性特征EMD^b.这样,我们提取了二维EMD距离特征.

3.2.3图像能量

图像能量是从统计特性上描述图像的一种基本属性,是图像信息丰富与否的体现,它与图像美感密切相关.

由于图像的小波系数代表了图像的主要能量,本文对单通道图像进行3层Daubechies小波变换,并计算每一层变换的HH,HL,LH频带能量和,以此作为图像的小波能量值.

对于3个单通道图像JH,JS,IV分别进行3层小波变换得到每一层的小波变换系数为0^,|_={1,2,3};当i=l时,表示第一层小波变换.因此,每个单通道的每一层的图像能量可以表示为

其中,S,=|丨+|W1|+|丨M.每个通道的3层平均小波系数之和表示该通道的小波能量,对应求得3个通道的小波能量分别为£gH,我们提取3个通道每一层的能量及其小波能量,共12维特征,即/Z37〜/248.

3.2.4图像景深

在摄影中,景深是当镜头对准某一点聚焦时其前后都仍可清晰的范围,它能决定是把背景模糊化来突出拍摄对象,还是拍出清晰的背景.专业摄影师往往通过设置小景深得到主体清晰、背景模糊的照片,从而达到中心明确、突出主题的目的,这样的图像往往更具美感.

参考文献[4]的做法,我们利用HSV图像的Daubechies小波变换来定义景深.首先对图像进行4X4的网格分割,得到16个矩形图像分块,按照从左到右、从上到下的顺序标明图像分块序号,依次是{M,,M2,-,M16},中心区域位置为{Ms,M7,M10,M„}.接着对图像3个单通道图像(JH,JS,JV)进行3层Daubechies小波变换,然后计算小波系数能量值用以衡量景深.景深(lowdepth,LD)定义[4]为

其中,W3(x,y)为单通道图像经过3层小波变换后像素p(x,y)的小波系数能量值;而M,G'=1,2…16)表示各个用于景深计算的图像分块.

为此,对HSV图像3个单通道图像JH,IS,JV计算的景深值分别为LDH,LDS,LDV,即特征f24s〜/251。

3.3 区域特征

图像的关键区域包含了图像最主要的信息内容.视觉心理学研究表明,在观察图像时,关键区域会吸引人们大部分的兴趣和注意力.因此,在美学分析中,关键区域相比其他区域更有价值.Wong等[7]利用视觉显著模型提取显著区域,并提取显著区域的区域特征,将其应用到图像美学分类中,提高了分类正确率.

对于图像的关键区域,人们往往更多地关注该区域的颜色分布、纹理情况、形状大小和形状比例等.因此,本文计算了关键区域的颜色矩和形状比特征,颜色矩包括H,S,V3个颜色通道的一、二、三阶矩(/252〜/26。),形状比(/m)为关键区域像素总数与原图像的像素总数的比率,得到10维的区域特征.

最终,对每一幅图像提取了包括低层特征、高层特征和区域特征共261维的特征向量.

4.学分类与评估模型建立

自动将图像分为高美感和低美感类别是一个分类问题.SVM算法是一种监督学习模型,由Cortes等[22]首次提出,它的基本思路是构造最优分类超平面,使类间间隔最大.它解决了神经网络中过学习与欠学习的问题,在高维空间的运算避免了“维数灾难”,泛化性能好,在解决小样本、非线性、高维模式识别问题中优势较为明显.在图像美学分类学习中有较多采用SVM算法,已有相关研究验证了其在该领域的有效性.所以,本文采用SVM算法对图像进行高、低美感分类,并使用基于混渚矩阵的分类准确度来衡量分类性能.在分类模型测试中,通过网格搜索技术寻找到SVM中RBF核函数的最优参数C=256,y=0.5.

图像美学分数评估是模拟人的感知自动给出图像的美学分数,属于回归问题.本文采用SVR算法,并选用RBF核函数对其进行训练学习,获得美感分数评估模型.通过将模型自动评分的结果与人类主观美感评分进行对比,计算相关系数、均方根误差(RMSE)、平均绝对误差、平均相对误差和剩余标准差等指标来衡量系统的性能.其中相关系数越高、各类误差越小时,说明回归性能越好.在评估模型测试中,通过网格搜索技术寻找到SVR中RBF核函数的最优参数C=l.0,7=0.0625,e=0.5类,共得到高美感图像750幅,低美感图像644幅,用于美学分类实验.

本文采用第3节方法提取了261维的图像特征,分别采用SVM算法实现美感等级(高美感与低美感)的图像分类,同时采用SVR算法实现图像美学分数的评估.

为了验证本文提取的各类特征的有效性,我们对比了不同类别特征(低层特征227维、高层特征24维、区域特征10维)的分类效果和回归性能,如表1〜2所示

从表1我们可以看到,只采用低层特征的平均分类准确率为72.21%;加人高层特征和区域特征后的平均分类准确率提升为75.37%.表2所示为美学分数评估的回归模型结果对比,其反映了模型自动评估结果与人类主观美学评分之间的相符合的程度.从表2中可以看到,当只采用低层特征时,美学分数自动评估结果与人的主观美学评价分数的相关性为0.753;加人高层特征和区域特征后,相关系数提高到0.79,同时各类误差都更低.

表1和表2的数据说明,本文提取的与人类的视觉系统、审美思维相关的高层特征和区域特征是有效的.通过本文模型能自动分析出图像的美感等级和美学分数评估值,结果符合人对图像的美学感知.图5所示为本文方法的评价示例.

高中数学特征范文第11篇

关键词:集成学习;特征提取;Adaboost M1;医学图像分类

中图分类号:TP311文献标识码:A 文章编号:1009-3044(2009)33-9515-03

The Design of Medical Image Classification Based on Ensemble Leaning

LIN Xiao-jia

(Faculty of Logistic and Information Management, Fujian Ineternational Business and Economics College,Fujzhou 350006,China)

Abstract: The paper proposes a medical image classification based on ensemble leaning.The system we proposing consists of a pre-processing phase, a feature extraction phase and a building the classifier phase. On the basis research of single feature, one new method is proposed one kind of medicine image classification new method that synthesized the multi-characteristic merge and the data mining technology. This method is through the introduction of data mining in the concept of Ensemble Learning,utilizing the Ensemble learning method to classify to the single characteristic the weak sorter to carry on the iterative training.

Key words: ensemble learning;the characteristic extraction;adaboost M1;medical image classification

随着计算机医学成像技术的发展,医学影像越来越多样化,医学影像的应用也越来越广泛,与此同时大量的医学设备的应用使得医学影像的数量也越来越多,大量的影像资料使医院迷失在信息的海洋。利用数据挖掘技术可以有效的对医学图像进行组织和管理,合理有效的对其进行分类,从而使其更好的辅助日常的医学诊断和医学研究。

该文提出的方法是使用SVM分类器将整个特征空间分成诸多子空间;采用集成学习方法Adaboost方法对样本进行多次抽样,将Adaboost算法中的分类精度作为特征选择的依据,选取出少量有利于分类的特征,同时将单特征训练得到的弱分类器通过集成学习增强为强分类器。

1 系统的构成

整个系统的构成如图1所示。

该系统主要包括训练和分类两个阶段。在医学图像训练阶段,通过数据库建立训练集,对医学图像进行预处理,提取图像颜色和纹理特征,创建训练的弱分类器。对图像特征进行选择。分类阶段进行的是待分类图像的选择特征的提取,利用训练得到的强分类器进行分类,输出分类结果。

2 图像预处理

由于实际的医学图像数据因为操作的原因,存在不完整性、噪声和不一致性性,不能直接在原始数据上进行数据提取,因此必须对医学图像进行预处理。数据清洗和数据的变换[1-2]都是经常用于图像数据预处理技术上的。

图像预处理的第一步就是图像去噪。大部分的医学图像一般包含了大量有噪声的背景:有的医学图像太暗,有的医学图案太亮,还有来自影像设备中电子元器件的随即扰动。通过去噪处理后,可以去掉图像中的大多数的背景信息和噪声,增强图像的特征,提高图像的信噪比。针对医学图像来说,图像本身有边缘模糊的特性,通过去噪对医学图像进行复原,使之与原图像逼近是存在比较大的困难的。因此本系统主要采取的去噪方法为滤波技术,该技术可以在最大限度保持信号不受损失的基础上,尽可能过滤噪声,提高图像的可读性,将医学图像中感兴趣的特征(图像的轮廓和边缘等重要信息)有选择的突出。

图像预处理的第二步是图像归一化,基于图像特征分类主要是对图像特征进行匹配和区分的过程,但是通常情况下待检图像的图库中,图像的大小尺寸并不完全相同,用户所提供的分类例图大小也不完全一样的。在提取图像特征(特别是空间分布特征)时,就有可能存在本身同类的图像所计算出来的特征差别却很大,而不属于同一类的图像由于尺度不同却计算出了相似的特征,进而影响到分类的结果。为了防止这类情况的发生,本分类系统必须首先对图像的尺度进行归一化,即通过对图像的缩放使得图像具有同一尺度256×256,在同一尺度上提取图像特征,从而消除尺度影响,又能够保证图像的整体灰度不变性。通过对大尺度的图像进行尺度归一化之后,按比例进行了缩小,降低了图像特征提取时的计算量,提高了分类速度。

3 基于集成学习方法的特征选择和分类

3.1 集成学习方法

集成学习(Ensemble Learning)是一种新的用来组合的学习器的方法。其主要思想[3]是:通过某种组合方法把一些学习器组合起来,使得集成后的学习器能够表现出比单个学习器更好的性能。狭义的说,集成学习是指利用多个同质的学习器对同一个问题进行学习,这里的“同质”是指所使用的学习器属于同一种类型,例如所有的学习器都是决策树、都是神经网络等等。广义的来说,只要是使用多个学习器来解决问题,就是集成学习[4]。

集成学习从萌芽阶段发展到现在,很多研究者提出了不同的算法。其中研究最深入,最具影响力,应用最广泛的就要算Boosting算法了。在众多Boosting算法中,AdaBoost是Boosting家族中的基础算法,也是Boosting家族最具代表性的算法,之后出现的Boosting家族中的扩展算法都是在AdaBoost算法的基础上发展而来的,对AdaBoost的分析也适用于其它的Boosting方法。因此下面我们以AdaBoost M1算法为例,进行描述。

AdaBoost M1算法用于解决多类单标签问题。每个待分类样本只能属于多个类别中的单个类。AdaBoost M1的基本思想是:首先给定任意一个弱学习算法和训练集(x1,y1),(x2,y2),…,(xm,ym),yi在分类问题中是一个带类别标志的集合,yi∈Y={1,…,K}。初始化的时候,对每个训练例赋予的权重都相同为1/m。接着,调用弱学习算法对训练集进行T次的迭代训练,每次训练后,按照训练结果更新训练集上的分布,对于训练失败的训练示例赋予教大的权重,也就是在下一次迭代训练的时候,更加关注集中对这些失败的训练例进行训练。通过这样的T次迭代训练,得到一个预测函数序列h1,h2,…,ht,其中ht也有一个权重,预测效果好的预测函数的权重较大,预测效果差的预测函数的权重较小。经过T次迭带后的最终预测函数H采用有权重的投票方式产生。

3.2 特征选择和分类

本系统利用训练样本的分类属性,采用Adaboost M1算法同时,对算法进行改进,使算法同时具有进行特征分类性能的评价(特征选择)和SVM分类器的增强的功能:对样本进行多次抽样,将分类精度作为特征对分类性能的判定依据,进行有效特征选择,选取出少量对分类作用较大的特征,同时将单特征训练得到的弱分类器增强为强分类器,使分类器具有较好的分类精度和泛化能力。具体算法思想如下:

1) 在Adaboost M1算法每次迭带训练时候,赋予每个训练例的分配权重 Dt(i)(t表示迭代次数,i表示训练例标号),同时也表明它被分类器选入新训练子集的概率。如果某个样本已经被准确的分类,那么在构造下一个训练集中,它所占的比重概率就会被降低;反之,如果某个样本没有被正确分类,那么它所占的比重就会得到提高。通过这样的方式,Adaboost M1算法就能更加重视那些较困难、更富信息的样本上。

2) 针对Adaboost M1这个特点,我们在选入的训练集上,选择SVM作为弱学习机,针对每个特征维向量进行训练,产生弱分类器,并且计算分类精度,用来衡量该弱分类器对分类的作用程度,精度大的弱分类器表明该特征维向量的分类性能较好,有利于作为有效的分类特征,被选入作为分类特征,经过多次迭代可以得到大部分对分类作用较高的特征,最终增强得到一个强分类器。

改进的Adaboost M1进行特征选择以及SVM分类器增强的算法步骤如下:

输入:训练集 (x1,y1),(x2,y2), …,(xm,ym) ,其中标签yi ∈Y={1, …,k}

特征维向量集{S}

弱学习算法SVM

迭带训练的次数T

初始化:对于i=1,2,…,D1(i)=1/m, Do For t=1,2,…,T //其中T为迭代训练的次数,m为训练样本数。

步骤1 弱分类器学习

根据选择权重Dt(i)进行采样,获得第t次迭代样本集,选取特征子集,学习重采样后的样本集得到弱分类器集合Hrt ,其中Srt是特征子集集合,表示第t次迭代的每个特征维度;Srt是弱分类器集合,是根据Hrt单特征训练出的弱分类规则,r表示特征维度标签号,t表示迭代次数。

步骤2 计算分类精度,选择特征

计算弱分类器在样本集上的误差 在此作为特征子集Srt 有效性的判据,误差越小则此特征子集作用越大,选取误差最小(εt=min{εrt})的对应的分类器为Ht与有效特征向量Srt计算本次迭代得到的分类器贡献权值βt=εt/(1-εt)。

步骤3 更新权重

其中,βt为每次迭代的分类器贡献权值,值由βt=εt/(1-εt)来确定;Dt(i)为每个训练例的分配权重,Zt为标准化常量。

输出:有效特征子集Sr

增强分类器

通过改进的Adaboost M1算法可以得到所选择的特征子集Sr以及增强的分类器Hx。

分类时,只要将待分类医学图像根据有效特征子集Sr进行特征提取,输入增强的分类器集 Hx中,就可得到分类的结果。

4 实验结果及结论

本实验所采用的是医学图像中的CT、MRI和DDR图像,根据医学图像的功能和用途,我们将这些医学图像分为头部(包括中枢神经和头颈五官)、胸部(包括呼吸系统、循环系统)、腹部(包括消化系统)、骨盆(包括泌尿系统)和其他等五大类标签,每类标签60幅(由于CT应用比较广泛,所以选用CT图像40幅,MRI和DDR各20幅),共计300幅图像构成图像库。在测试集和训练集的选择上,采用10折交叉验证的方法。通过训练集最终选取了36维特征向量中的分类性能较高的12维(详细如表1所示)。

分类性能采用敏感度(sensitivity)、特异度(specificity)以及分类精度(precision)三个指标率来衡量:敏感度也称真正识别率,即正确识别该类元组的百分比;特异度是真负率,即正确拒绝不属于该类元组的百分比;而精度就来标记实际属于该类的元组在已分配到该类的元组总数的百分比,表2是本实验的分类结果。

从表2中可以看出,本实验医学图像分类器算法的敏感度、特异性和分类精度都较高,分类识别率和精度平均在83%左右。

分类系统的速度主要取决于特征的提取以及进行分类的运算量。如果将所有特征都运用于分类的话,由于有些特征向量维度对分类贡献不高,对分类效率没有明显的提高,并且也大大增加了特征提取阶段的时间负担。在本系统中仅仅选择了不到1/3的特征,去除了部分对分类效率贡献不高的特征,因此在特征提取阶段速度大大提高了,而且在分类阶段也因为只在有效特征中进行提取分类,速度也有较大提高,表3列出了在 Inter Core Duo processor T2450 2.0GHz、1G DDR内存、VC++6.0环境下本分类系统与其他分类平均分类精度的比较。

本方法比最常见的综合特征分类法在特征提取分类阶段速度上有所提高,但是比起单个特征提取,速度还是比较慢的。但是从表3正确率相比,准确率还是蛮高的,相对的牺牲时间还是值得的。

参考文献:

[1] Maria-Luiza Antonie,Osmar R.Z aiane and Alexandru Coman,Application of Data Mining Techniques for Medical Image[C],Proceedings of the second international workshop on Multimedia Data Mining(MDM/KDD’2001),in conjunction with ACM SIGKDD conference.

[2] Osmar R.Z aiane,Maria-Luiza Antonie and Alexandru Coman,Mammography Classification by Association Rule-based Clasifier[C], MDM/KDD2002:International Workshop on Multimedia Data Mining(with ACM SIGKDD 2002).

[3] Zhou Z-H,Wu J-X,Tang W,Chen bining regression estimators:GA-based selective neural network ensemble.International Joural of Computational Intelligence and Applications,2001,1(4):341-356.

[4] Zhou Z-H,Wu J-X,Tang W.Ensembling neural networks:many could be better than all.Artificial Intelligence,2002,137(1-2):239-263

[5] 夏顺仁,莫伟荣,王小英,严勇. 基于特征融合和相关反馈的医学图像检索技术[J].航天医学与医学工程,2004,17(231):429-433.

高中数学特征范文第12篇

行人再识别指的是在非重叠监控视频中,检索某个监控视频中出现的目标是否出现在其它的监控视频中.最近几年,行人再识别问题引起了广大科研人员的兴趣与研究.监控视频中的目标图像分辨率低、场景中存在着光照变化、视角变化、行人姿态变化以及摄像机自身属性的问题,导致同一目标在不同的监控视频中外观区别很大,使得行人再识别问题遇到了很大的挑战。为了有效的解决这些挑战,广大的研究者提出了很多解决方法.目前的行人再识别算法可以简单概括为四种:直接法、基于深度学习的方法、显著性学习的方法和间接法.

直接法利用视觉特征对行人建立一个鲁棒性和区分性的表示,不需要通过学习直接利用行人特征然后根据传统的相似性度量算法(欧式距离、巴氏距离等等)来度量行人之间的相似度.文献[1]首次提出了利用直方图特征来表征目标并通过度量直方图的相似度来识别不同的目标.文献[2]将行人图像粗略分为头部、上半身和下半身3部分,然后串联每一部分的颜色直方图对行人描述.文献[3]采用分割的技术提取人的前景,并利用行人区域的对称性和非对称性将人的前景划分成不同的区域.对于每个区域,提取带权重的颜色直方图特征、极大稳定颜色区域(maximallystablecolorregions)特征和重复度高的结构区域(recurrenthighlystructuredpatches)特征描述它们.文献[4]提出了一种结合gabor特征和协方差矩阵描述的BiCov描述子来对行人描述.文献[5]采用图案结构(pictorialstruc-ture)算法定位图像中人的各个部件所在的区域.对于每个部件的区域,提取与文献[3]类似的颜色直方图特征、极大稳定颜色区域特征来描述它们.文献[6]利用lbp特征和21个滤波器特征(8个gabor滤波器和13个schmid滤波器)来描述图像中的行人.文献[7]通过共生矩阵对行人的形状和外形特征进行描述.虽然直接法的算法模型简单,但由于在光照变化、视角变化以及姿态变化等情况下,同一个人的外观变化往往很大,很难提取出鲁棒性和区分性的特征描述.因此在光照变化、视角变化以及姿态变化等情况下,直接法的效果很差.

深度学来在计算机视觉中得到了广泛的应用,因此不少学者研究并提出了基于深度学习的行人再识别算法.文献[8]LiWei等人提出了一种六层的FPNN神经网络,它能有效解决行人再识别中出现的光照变化、姿态变化、遮挡和背景粘连等问题,从而提高了识别率.文献[9]Ahmed等人提出了一种深层卷积结构能够同时自动学习特征和相应的相似性测度函数.但基于深度学习的行人再识别算法需要非常大的训练数据库,导致训练时间长,此外还需要针对特定问题搭建相应的模型,因此不利于方法的推广.同时,深度学习方法中还存在调置参数缺乏理论性指导,具有较大主观性的问题.基于显著性学习的行人再识别方法近年来也受到研究者的广泛兴趣.人们可以通过行人的一些显著信息来识别行人,但传统的方法在比较两张图片的相似性的时候,往往忽略了行人身上的显著性特征.对此,文献[10]赵瑞等人提出了一种通过学习行人图像的显著性信息来度量两张行人图像的相似性的方法.但显著性学习的行人再识别算法在行人姿态变化的情况下,显著性区域会出现偏移或者消失,导致识别效果较差.间接法主要是学习得到一个分类器或一个排序模型.间接法代表性的算法有距离测度学习、支持向量机、迁移学习和流形排序算法.距离测度学习算法作为间接法中的一种,最近几年在行人再识别中得到了广泛的应用.本文提出的算法也是基于距离测度学习,所以下面着重介绍基于距离测度学习的行人再识别算法.

与手动设计特征的直接法不同,距离测度学习方法是一种利用机器学习的算法得出两张行人图像的相似度度量函数,使相关的行人图像对的相似度尽可能高,不相关的行人图像对的相似度尽可能低的方法.代表性的测度学习算法有文献[11]郑伟诗等人把行人再识别问题当成距离学习问题,提出了一种基于概率相对距离的行人匹配模型,文献[12]提出了一种基于统计推断的方法学习测度矩阵来度量两张行人图像的相似度,以及文献中提出的相应测度学习算法.距离测度算法是将原始特征空间投影到另一个更具区分性的特征空间.与其它的算法相比,距离测度学习算法具有更好的效果.距离测度学习算法即使只使用简单的颜色直方图作为特征,算法的性能往往优于其它算法.文献[12]提出了一种基于统计推断的方法学习测度矩阵来度量行人对的相似度,但作者直接在原始特征空间训练得到测度矩阵,进而得到样本之间的相似性函数.原始特征空间的线性不可分性导致通过原始特征空间直接训练得到的测度矩阵不能很好的表征样本之间的相似性和差异性.本文提出基于核学习的方法,首先通过相应的核函数将原始特征空间投影到非线性空间,然后在非线性空间中学习得到相应的测度矩阵.投影后的非线性特征空间具有很好的可分性,这样学习得到的测度矩阵能准确的表征样本之间的相似性和差异性.另外,基于测度学习的行人再识别算法一般是把多特征融合并建立特征模型,然后基于相应的测度学习算法,学习得到一个测度矩阵.然而这种特征融合往往忽略了不同属性特征之间的差别,这样学习得到的测度矩阵不能准确的表征样本之间的相似性与差异性.对此,本文提出在不同的特征空间中学习相应的测度矩阵,进而得到表示不同特征空间的相似性函数,最后根据不同的权重结合这些相似性函数来表征样本之间的相似性.本文算法在公共实验数据集上的实验效果优于目前主流的行人再识别算法,尤其是第一匹配率(Rank1).本文其余章节的组织安排如下.第1节介绍本文提出的行人再识别算法.第2节介绍本文算法在公共数据集上的实验.第三节总结全文以及展望.

1基于多特征子空间与核学习的行人再识别算法

1.1基于核学习的相似度量函数的学习文献[12]中提出了一种KISSME的算法,文中指出,从统计学角度考虑,一对有序行人对(i,j)的相似度可以表示为式。文献[12]中提出的算法是直接在原始线性特征空间中训练得到测度矩阵,进而得到表示样本之间相似性的相似度函数.由于原始特征空间的线性不可分,上述方法得到的测度矩阵不能准确表达样本之间的相似性和差异性,导致识别效果差.本文提出基于核学习的算法首先通过相应的核函数将原始特征空间投影到更易区分的非线性空间,然后在非线性空间中训练得到测度矩阵M.这样得到的测度矩阵具M有很好的区分性,能使同类样本之间的距离尽可能小,异类样本之间的距离尽可能大.核学习的主要思想是将原始线性特征空间投影到区分性好的非线性空间.原始特征空间中的特征xxi通过函数Φ投影到非线性空间,则非线性空间的特征表示为Φ(xxi).非线性映射函数一般是隐性函数,则很难得到显示表达式,可以利用核函数求解特征空间中样本点的内积来解决。

1.2基于多特征子空间的测度学习基于测度学习的行人再识别算法一般是把多特征融合并建立特征模型,然后基于相应的测度学习算法得到测度矩阵.这种方法忽略了不同属性特征之间的差别,导致学习得到的测度矩阵不能准确的体现样本之间的相似性与差异性.对此,本文提出对于不同的特征空间单独学习相应的测度矩阵,进而得到表示不同特征空间的相似性函数,最后根据不同的权重结合这些相似性函数来表示样本之间的相似性.

1.3行人图像的特征表示本文采用颜色特征和LBP特征对行人目标进行描述,生成两种特征子空间.颜色空间有很多种,用不同的色彩空间描述一图片的效果是不同的.依据文献[20]和文献[21],本文采用的颜色特征从RGS、HSV、YCbCr和CIELab4种颜色空间中提取.RGS空间的定义为R=R/(R+G+B)、G=G/(R+G+B)、S=(R+G+B)/3.为了获取具有鲁棒性和区分性的颜色特征表示,本文将上述四种颜色特征空间融合.融合后的颜色特征描述对于光照变化的场景具有良好的鲁棒性.图1给出了一张被平均分成6个水平条带的行人图像,对于每个水平条带的每种颜色空间的每个通道,提取16维的颜色直方图特征,将所有的颜色直方图特征串联形成行人图像的颜色特征,从而得到行人图像颜色特征的维数为1152维(4*6*3*16).原始特征空间的1152维特征经过核函数投影后的特征维度较高且大部分信息都是冗余的.因此实验中利用PCA将核空间中的特征维数降到保持大于90%的能量。为了更好的描述图像的局部信息,本文中提取的局部特征来自于LBP等价模式中邻域点数为8半径为1和邻域点数为16半径为2两种模式的特征.上面两种LBP等价模式的维度分别为59维和243维.类似于颜色特征的提取,一张行人图像被平均分成6个水平条带,对于每个水平条带提取LBP两种模式的特征,将所有的LBP特征串联形成行人图像的局部特征,从而得到行人图像局部特征的维数为1812维((59+243)*6).同理,原始特征空间的1812维特征经过核函数投影后的特征维度同样较高并且大部分信息也都是冗余的.因此实验中同样利用PCA将核空间的特征维度降到保持90%以上的能量.

1.4本文算法的具体操作步骤利用步骤3得到不同核空间中的测度矩阵计算样本在不同核空间的相似度,然后将样本在不同核空间中的相似度按照一定的权值结合来表示样本之间的相似性.

2实验测试与结果

本节首先介绍实验中所使用的测试数据和算法性能的评测准则,其次介绍本文算法在不同公共实验集上与已有的行人再识别算法的性能比较,然后在不同公共实验集上对比核映射前后的算法性能,最后在不同公共实验集上分析权值不同时对算法性能的影响.文中所有的实验是基于vs2010+opencv2.4.9实现的,实验平台是24G内存的Intel(R)Xeon(R)CPUE5506@2.13GHz(2处理器)PC台式机.

2.1测试数据和算法性能的评测准则为了与已有算法公正比较,实验中,采用先前工作普遍采用的评价框架.如文献[22]所述,随机选择p对行人图像对作为测试集,余下的行人图像对作为训练集.测试集由查询集和行人图像库两部分组成.每对行人图像,随机选择一张图像并入查询集,另一张则并入行人图像库.当给定一个行人再识别算法,衡量该算法在行人图像库中搜索待查询行人的能力来评测此算法的性能.为了测试算法在只有少量的训练样本时的性能,p分别取316,432,532进行实验.p取值越大,则测试样本越多(匹配越困难),训练样本越少(训练越困难).对于每组实验,以上产生测试集和训练集的过程重复10次,10次实验结果的平均值作为本组实验的结果.已有的行人再识别算法大部分采用累积匹配特性(CumulativeMatchCharacteristic,CMC)曲线评价算法性能.给定一个查询集和行人图像库,累积匹配特征曲线描述的是在行人图像库中搜索待查询的行人,前r个搜索结果中找到待查询人的比率.第1匹配率(r=1)很重要,因为它表示的是真正的识别能力.但是当r取值很小时,第r匹配率也很有现实意义.因为在实际应用中,反馈的前r个搜索结果中,可以通过人眼判断找到查询目标.

2.2不同公共实验集上实验对比本文算法选择在VIPeR[23]数据集、iLIDS[24]数据集、ETHZ[25]数据集和CUHK01[26]数据集上进行实验.VIPeR数据集中相关行人对来自两个不同的摄像机.相关行人对的外观由于姿态、视角、光照和背景的变化而差异大.iLIDS数据集包含119个行人的476张图像,每个行人的图像从两张到八张不等.iLIDS数据集是从机场收集的,数据集有严重遮挡和光照变化的问题.ETHZ数据集包含146个行人的8555张图像.数据集中的图像来自移动摄像机拍摄的三个视频序列.ETHZ数据集中的图像由同一摄像机拍摄,则数据集中行人姿态变化和视角变化的程度没有VIPeR数据集那么明显.为了使ETHZ数据集具有挑战性,实验中相关行人提取两张图像,一张近景和一张远景.远景图像含有大量无用的背景信息,使选用的数据集有明显的遮挡情况和光照变化.CUHK01数据集是由两个摄像机在校园环境中拍摄得到,包含971个行人的3884张图像.每个行人包含四张图像,前两张图像是摄像机拍摄的行人前后景图像,两张图像是摄像机拍摄的行人侧面图像.每个行人的前两张图像只是姿态上有稍许的变化,前两张图像与后两张图像在视角上、姿态上差异较大以及有明显的光照变化.实验中,每个行人前后景图像随机选择一张,侧面图像随机选择一张,这样得到的实验集具有显著的视角变化、姿态变化和光照变化.

2.2.1VIPeR数据集VIPeR数据集是由632对相关行人对图像组成.如图2所示,同一列中的行人图像为同一个人,为了对比本文算法基于不同核函数的实验效果,下表1给出了该算法基于不同核函数的实验对比.实验中测试样本集和训练样本集均为316对相关行人图像.VIPeR数据集上的其它实验,如果没明确表明测试样本集和训练样本集的个数,都默认有316对相关行人图像.从表1可知,本文算法基于RBF-χ2核函数的效果最优.为了充分体现算法的效果,在后面的实验效果对比中都是基于RBF-χ2核函数.下表2给出了该算法与当前主流算法的效果对比.从表2可知,该算法性能有较大的提升,尤其是Rank1,Rank1比表中最好的结果提高了约8(%).此外,该算法与表中的PCCA、rPCCA、kLFDA和MFA等算法都是基于RBF-χ2核函数;但该算法整体效果明显优于它们.值得一提的是,对于Rank1,该算法的效果相对主流的行人再识别算法有了显著的提高.第1匹配率很重要,因为它表示的是真正的识别能力.行人再识别技术一个典型的应用是刑事侦查;若Rank1越高,则在刑事侦查中,搜集与嫌疑人有关的线索的效率就会提高.为了充分说明本文算法的优越性,表3给出该算法在仅用HSV特征情况下与其它算法效果对比.由表3可知,该算法虽然只使用了HSV特征,但是效果比采用多特征的算法(SDALF、PS、RDC和KISSME)更好.KISSME融合了HSV、LAB和LBP等特征,Rank1仅有20(%);该算法只用HSV特征,Rank1就达到了28.4(%).另外,该算法与同样只使用HSV特征的算法(如ITML、Euclidean、NRDV和KRMCA等)相比,仍然优于它们.其中,ITML和Euclidean算法整体效果都比该算法差.NRDV算法虽然Rank1与该算法相近,但是Rank10和Rank20较低,且NRDV算法模型比该算法复杂得多.KRMCA算法效果总体上都不如该算法且KRMCA的代价函数收敛很慢,算法训练时间很长.当测试集规模为P=432和P=532时,该算法与已有行人再识别算法的性能比较如表4和表5.从表中可知,在只有少量的训练样本情况下,该算法性能同样优于已有算法.由此可见,该算法有效解决了学习相似度度量函数中出现的过拟合问题.

2.2.2iLIDS数据集iLIDS数据集中每个行人包含两张到八张照片不等.实验中,从每个行人所包含的图像中随机取两张作为实验集,最后得到的实验集为119对相关行人图像.最终实验效果是多次随机取得的实验集效果的平均值.数据集中的图像尺寸是不尽相同的,实验中统一把图像的尺寸设置为高128宽48.实验中训练集为59对行人图像,测试集为60对行人图像.本文算法在iLIDS数据集上与其它算法的效果对比如下。该算法与表中基于测度学习的算法PCCA、rPCCA、MFA和kLFDA都是基于RBF-χ2核函数.但从表6可知,该算法整体性能优于PCCA、rPCCA和MFA等算法;该算法虽然与kLFDA算法性能接近,但总体上还是优于kLFDA算法.由此可见,该算法比使用相同核函数的其它算法效果更好.另外,该算法整体性能也优于KISSME、SVMML和LFDA算法.

2.2.3ETHZ数据集数据集中的图像尺寸是不相同的,实验中统一把图像尺寸设置为高128宽48.实验中训练集为76对行人图片,测试集为70对行人图片.表7分析了本文算法在ETHZ数据集上与其它算法的效果对比.从表7可知,该算法在ETHZ数据集上的整体性能优于同样基于RBF-χ2核函数的PCCA、rPCCA、MFA和kLFDA等算法.在ETHZ数据集上,同样证明了该算法比使用相同核函数的其它算法效果更好.值得一提的是,该算法的rank1较于其它算法显著提升了.另外,该算法整体性能也优于KISSME、SVMML和LFDA算法.

2.2.4CUHK01数据集数据集中的图片的尺寸是不相同的,实验中统一把图片的尺寸设置为高128宽48大小.实验中训练集为486对行人图片,测试集为485对行人图片.本文算法在CUHK01数据集上与其它算法的效果对比如下表8:从表8可知,该算法在CUHK01数据集上的整体性能同样优于KISSME和SVMML算法以及基于测度学习的算法PCCA、LFDA、rPCCA、MFA和kLFDA.该算法与MidLevel算法效果接近,但MidLevel算法模型复杂.该算法与其它算法效果对比可知,该算法可以学习得到具有良好区分性的相似性度量函数.通过在CUHK01数据集上的效果对比,进一步说明该算法与使用相同核函数的其它算法相比效果更好.

2.3特征核映射前后算法性能的比较为了分析特征经过核映射后对算法的影响,表9、表10、表11和表12分别给出在四种数据集上特征经过核映射前后算法效果的对比实验.通过在四个公共数据集上实验对比可知,特征经过核映射后算法效果在VIPeR、iLIDS和CUHK01数据集上整体上都得到了显著的提升,在ETHZ数据集上虽然提高不明显,但还是优于已有算法.总的来说,该算法在特征经过核映射后,学习得到的相似度度量函数更具有区分性,能够得到较好的识别效果.

2.4权值a取值不同时算法的性能比较为了分析权值a对算法性能的影响,图3、图4、图5和图6分别给出在四种数据集上不同的权值a下,本文算法性能的对比实验.其中SC为颜色特征子空间的相似度函数,ST为LBP特征子空间的相似度函数.权值a越大,代表相似度函数中颜色特征子空间的相似度函数比重越大.通过在四种数据集上不同的权值a下算法性能的对比实验可知,a取值对算法效果的影响较大.当a取值很小时,算法效果不是很理想,当a增大时,算法性得到一定程度的提升,当a在0.5到0.7范围内取相应的值时,算法性能能达到最优,当a继续增大后,算法性能有一定程度的下降.

3结论

高中数学特征范文第13篇

近年来,一系列高分辨率卫星的相继上天,高分辨率卫星遥感的应用也因此成为可能,也凸现出遥感影像数据处理的重要性日益显现。遥感影像数据处理的主要内容就是对遥感数据(主要是高分辨率遥感影像数据)进行自动(半自动)图像处理分析,从而获取人们需要的信息。

Taries软件是具有自主知识产权的软件产品,由中科院遥感所国家遥感应用工程技术研究中心下属的空间信息关键技术研发部开发。Taries软件主要应用于对高分辨率遥感影像的各种信息的处理、提取与分析,其功能包括影像的预处理、影像分割、影像分类、特征提取与表达、特征分析、目标识别等。它是集矢量和栅格于一体化的软件系统。

Taries主要功能

1. 影像处理

(1)采用几何精纠正方法:建立基于空间投影理论与有限控制点的全局自适应方法,并建立基于控制点、线、面特征的局部自适应相结合的影像几何精纠正模型。

(2)实现多源遥感影像信息的特征级融合: 在像元级、高精度的多源遥感信息分析技术基础上,发展了各种特征估计器和融合评判规则,建立特征级的多源遥感信息融合的方法以及相应的算法。

2. 影像信息提取

(1)在复杂环境中的目标信息增强: 采用具有空间自适应能力的目标特征的信息增强模型与方法,特别是弱目标信息的增强方法,并对无关背景信息进行抑制。

(2)高分辨率影像分割: 基于空间特征(包括纹理特征、形状特征和动态特征)以及高维统计特征,采用面向特征的高分辨率影像分割技术(如基于模糊集理论、EM模型、Markov模型、MCMC模型、小波分析等)。

(3)基于智能计算模型的目标特征提取: 基于神经网络、支撑向量机等智能计算模型,研究和发展针对目标的纹理特征、结构特征的提取方法,并实现相应算法。

(4)目标识别与提取系统原型: 采用组件技术,研制开发目标识别与提取软件系统原型,包括影像精处理、目标单元分割与特征提取、目标识别等模块。

3. 矢量数据显示、处理与分析

(1)兼容ArcGIS SHP等矢量数据存储格式,能够采用系统的矢栅一体化数据模型对相应的矢量数据进行读取与显示。

(2)基于底层数据模型,能够实现基于Taries软件的矢量数据的修改功能,包括基本对象(点、线、面)的增、删、改等操作。

(3)基于相应的矢量数据建立拓扑关系,并在此基础上进行相应的空间分析功能(如最优路径查询分析等)。

(4)具有常规的矢量数据显示软件的基本功能,并可在此基础开发进一步的应用(如移动目标定位与车辆跟踪系统等)。

关键技术

1. 高分辨率影像的高精度几何纠正技术

考虑到高分辨率影像的特点,首先应对高分辨率影像进行包括如下两项技术的精处理:

(1)基于重叠影像的高精度影像配准技术: 采用既满足一定精度要求、又保证一定运算速度与适应性的子像素匹配技术,从而确定具有一定重叠的两幅图像间的几何对应关系,获得对应的控制点对,采用整体匹配技术使配准精度达到一个像元。

(2)空间自适应高精度几何纠正: 针对高空间分辨率影像的特征,采用具有局部自适应的高精度几何纠正方法,消除常规最小二乘法平面拟合纠正方法对图像局部纠正误差较大的问题。

2. 复杂自然环境下的信息增强

针对地形复杂、植被茂密的复杂自然环境,采用针对特征的统计信息增强技术,对具有重要意义的地面信息进行初步的检测性增强,特别是弱目标信息的增强,并对其他背景信息进行抑制。建立基于多种影像以及已有目标信息与判别知识的潜在目标快速检测技术,使用方法包括微观特征提取、动态变化检测等。

3. 高分辨率影像分割技术

以影像理解研究为基础,建立融遥感图像信息、地理时/空信息与地学知识为一体的目标空间认知结构模型。该模型为对中高分辨率遥感图像目标单元群体的处理和分析,提供面向纹理特征和结构特征,并能够最大限度地利用地学分类知识与时/空推理模型的智能化识别与提取方法。目前软件包括十余种不同的遥感影像分割算法。

基于目标空间认知结构模型和空间特征(包括纹理特征、形状特征、动态特征和轮廓特征)以及高维统计特征,研究面向特征的高分辨率影像分割技术,并采用稳健统计机制来保证分割算法具有较强的稳健性,将分割后的特征按照其几何关系、属性关系、统计关系和操纵方式,以面向对象的模式进行统一化管理,从而将连续的图像形式转化为离散的、便于操作的特征群体,便于目标特征的快速提取。

4. 智能计算模型的目标特征提取技术

针对遥感信息特征的提取问题,在传统统计和人工神经网络方法基础上,发展新型针对高分辨率遥感影像的目标特征提取模型,主要包括: 基于知识的神经网络模型来处理混合密度分布的特征提取和分类; ARTMAP神经网络作为低维空间结构特征的联想记忆模型; 基于统计学习理论的支撑向量机(SVM)。SVM是近几年最新提出的机器学习算法,它可以作为高维有限特征的记忆单元来实现对高分辨率遥感影像目标特征信息的提取。应用SVM模型进行特征提取,需要重点解决的问题有: 高维映射函数定义、领域知识融合、支撑向量集极小优化和高维信息压缩。

在以上有关特征提取的智能计算模型基础上,针对不同复杂程度的目标特征提取问题,可分别采用MCMC统计模型、RBF/EBF神经网络、ARTMAP神经网络、支撑向量机来对目标库中的目标特征进行提取和表达。

5. 视觉尺度空间变化的特征表达与目标识别技术

针对空间数据的多尺度特征,引进尺度空间视觉聚类方法,对空间数据的尺度特征变化进行描述(图1)。基本原理是: 模拟人眼对目标特征从近到远逐步综合的视觉过程,来定量化地划分不同尺度上的空间单元。在目标识别过程中,将采用视觉空间尺度变换理论和方法,对遥感影像空间特征集采用逐步综合的特征多尺度聚类,从而在尺度空间转换上实现对影像特征集的树状方式管理,以满足不同尺度上的特征组合与表达。

图2 Taries软件处理矢量数据界面

6. 目标识别与提取的RS与GIS集成化处理技术

遥感图像给出了地面目标的栅格化波谱表达,突出并准确地再现了地物的大小、形状(包括点、线、面)和纹理变化; 而GIS则有着对地物边界的精细刻画能力,并能够对地物间的空间关系进行拓扑变换与推理分析。因此,从空间单元数据处理的粒度入手,并将GIS的空间关系拓扑变换与时空推理分析引入到对遥感图像信息的智能化处理中,极大地提高了目标群体的识别精度与提取的一致性,为基于矢栅一体化数据模型的分析提供重要支撑技术。

7.矢量数据显示、处理与分析技术

除具有矢量数据的显示与基本操作外(如电子地图缩放、漫游等),系统还对矢量数据的编辑功能进行了实现,包括: 特征点显示、点选、矩选、圆选、分裂、合并、增加控制点、删除控制点、移动控制点、增加对象、删除对象、移动对象等功能,并实现了相应的空间分析功能(如拓扑关系建立,最优路径选取等)。

高中数学特征范文第14篇

以上文章都结合卷积神经网络模型对交通标志分类做了大量的研究,避免了复杂的人工特征提取算法的设计,研究结果具有一定的参考性。在现有卷积神经网络模型的启发下,以上文章都采用分类器。而训练分类器需要大量样本,因而在小样本数据下,采用分类器容易造成过拟合,降低网络的泛化性。同时,由于SVM分类器在小样本数据集上具有出色分类性能,本文提出一种基于卷积神经网络和多类SVM分类器[[4]的交通标志识别模型。此模型利用卷积神经网络强大的特征提取和泛化能力,使得算法在复杂环境中依然具有可靠的识别结果。  首先,本文通过迁移学习策略「51L61对AlexNet网络[7]特征提取部分进行微调,并将微调结果作为本文的特征提取器。然后将卷积神经网络提取的特征作为多类SVM分类器的输入。同时为了进一步防止过拟合现象的发生,本文在SVM分类器中加入dropout层,利用随机置零策略进行参数选择。最后,文章通过实验结果证实本文提出的分类模型相比于采用softmax分类器有更好的准确率、在复杂背景中具有较高的识别率和较强的鲁棒性棒。1卷积神经网络和SVM

1.1  AlexNet网络    

AlexNet网络是著名的卷积分类网络,可成功实现对1000类别物体的分类。其结构可以分为特征提取器和分类器两部分。    

特征提取器主要由卷积层、池化层、激活函数组成。卷积层由大小不同的卷积核组成,卷积核类似于传统视觉中的特征提取算子。但区别于传统视觉算子,卷积核参数由网络自己学习得到,可以提取图像从底层到高层的不同特征信息。池化层常连接在卷积层之后,一般常用最大池化操作。池化层可以加强网络对平移变化的鲁棒性。激活函数为网络引入非线性因素,使得网络可以逼近任意函数形式。    

分类层主要由全连接层和多类逻辑回归函数组成。全连接层学习用合理的方式组合特征,可以看为函数映射。逻辑回归函数进行类别概率判别,逻辑回归判别见公式。同时,为了防止全连接层过拟合,AlexNet网络引入dropout层,dropout[9]采用随机置零的方式,防止神经元以特定的方式组合工作,从而防止深度网络的过拟合。p}Y}}}=j1二(‘);B)=艺  e醉x})丫‘eBTx}' }e'  j代表类别,二(i)为输入,k代表类别总数,8,表示将样本x}')映射到j类的参数,B代表er,r=i,z,~…  ,,组成的矩阵,p(少‘)=j}x(仍表示x}'}属于j类的概率。1.2标准SVM    SVM是基于结构风险最小化理论的有监督学习算法,通过寻找最优分割超平面来实现分类[}10}。相比于神经网络,SVM在小样本数据集上也能表现出良好的分类效果,因而得到广泛使用。标准的SVM通过寻求公式(2)的最优解来找到最优超分割平面。minw,b含,,w,,(2)yc> (w·二(‘)+b) >_ 1,i=1, 2,……,m尹)代表第i个样本标签,x}'}代表第i个样本特,m为训练集大小。分类模型设计    

本文提出的分类模型主要分为两部分,特征提取部分和多类SVM分类器。整体结构如图1所示。    

图1中,特征提取器主要对输入图片进行特征提取和融合,最终得到图像的高阶特征并将提取到的信息特征送入多类SVM分类器。dropout层进行参数随机丢失步骤,此步骤通过随机失活神经元可有效防止过拟合的发生;然后结合不加正则化项的SVM算法进行分类,得到最终输出结果。

2.1特征提取器    

高中数学特征范文第15篇

关键词:音乐流派分类;多核学习;支持向量机;特征选择;模式识别

中图分类号: 中图分类号是否有误,请核实?是否应为TP391.4对,应该为TP391.4TP391.4

文献标志码:A

英文摘要

Abstract:Multiple Kernel Learning and Support Vector Machine (MKLSVM) was applied to automatic music genre classification to choose the optimal kernel functions for different features, a method of conducting the optimal kernel function combination into the synthetic kernel function by weighting for music genre classification was proposed.

Different optimal kernel functions were chosen for different acoustic features by multiple kernel classification learning, the weight of each kernel function in classification was obtained, and the weight of each acoustic feature in the classification of the genre was clarified, which provided a clear and definite result for the analysis and selection of the feature vector in the classification of music genre. The experiments on the dataset of ISMIR 2011 show that, compared with the traditional single kernel support vector machine classification, the accuracy of the proposed music genre automatic classification method based on MKLSVM is greatly improved by 6.58%. And the proposed method can more clearly reveal the the different features impacts on music genre classification results, the classification results has also been significantly improved by selecting features with larger effects on classification.

英文关键词

Key words:

music genre classification; multiple kernel learning; Support Vector Machine (SVM); feature selection; pattern recognition

0 引言

音乐流派分类是音乐信息检索领域一项应用前景广阔同时又非常具有挑战性的研究工作,而多核学习是目前机器学习领域一个新的热点,它是非线性模式分析中解决数据异构、数据不平坦分布等一系列问题的一种有效方法。本文研究将多核学习支持向量机(Multiple Kernel LearningSupport Vector Machine, MKLSVM)应用于音乐流派自动分类,研究音乐流派分类中的特征选择及自动分类。最具开创性的自动音乐流派分类研究当属Tzanetakis等[1]在2002年给出了基于声学特征的流派分类的三个阶段:1) 基于短时音频帧的特征提取过程,在这个过程中一些描述音乐音色、节奏和音高的底层声学特征将被计算出来;2) 特征选择过程,使用特征选择算法降低特征向量的维数同时去除无关和冗余特征;3) 分类过程,使用模式识别及分类算法对特征向量进行处理,从而对音乐进行自动的流派分类。由于音乐感知的各维声学特征之间具有一定的相关性和冗余度,不同声学特征对流派分类的重要程度也各不相同,需要使用特征选择算法进行特征降维;但是传统的特征选择结果并没有明确各维感知特征在流派中的权重,对得到的结果无法给出明确的解释。

2004年, BachFrancit不是文献2作者,现改为Bach,核实修改是否恰当答:没问题!但注意参考文献的时间是2004年等[2]提出了多核学习(Multiple Kernal Learning,MKL)的思想。目前,多核学习已经成为机器学习领域的一个新的热点研究。传统的单核学习将所有的特征归于一个核,因此无法区分不同特征在分类中的不同效果。多核学习对不同的特征采用不同的最优核函数,通过学习得到各个核函数在分类中的权重,这样可以在特征选择的同时得到不同特征在分类中的不同作用。2012年,Lukashevich[3]将多核学习技术应用于音乐流派分类领域,取得了一定的成果。Lukashevich对16、32、64、128、256、512、1024及2048维特征进行了多核特征组合研究,在6大类音乐流派数据的实验结果上,验证了64维多核特征组合后的分类性能优于单核分类性能。

本文将多核支持向量机(Support Vector Machine,SVM)应用于音乐流派分类中,在组合核函数中,明确不同的特征权重,研究基于多核学习的特征选择和流派分类。

1 相关知识

1.1 支持向量机

支持向量机是从线性可分情况下的最优分类发展而来的,其本质就是在于寻找一个把训练空间Rd分成两部分的最优线性分类面w・x+b=0(Vapnik 1999)[4],使得不仅能够把两类分开,而且两类的分类间隔最大,最终得到一个决策函数。

1.2 多核学习

文献[2]最早提出了多核学习(Multiple Kernal Learning,MKL)的思想。Sonnenburg等[5]对Lukashevich等[3]提出的多核思想进行了推广和应用, 将最初的MKL扩展到更大规模,可以同时结合几十个甚至几百个核,极大地提升了多核学习在模式选择领域的应用。2012年,Lukashevich等[3]第一次将多核学习技术应用于音乐分类领域,证明了其在特征分析和流派分类上的有效性。

本文研究基于MKLSVM的音乐流派分类,研究流派分类问题中的特征选择和各特征的权重,分析音乐流派中不同特征的作用。MKLSVM模型如图1所示。

从图1中可以看到,MKLSVM在传统的SVM和输入数据之间加入了多核学习的过程,用多个核函数的线性组合作为最终的核函数(称为合成核)。多核学习分类较之单核的情况,能够更细粒度地照顾到各个不同特征的特性,针对不同特征可以选取各自最适合的核函数。

2 音乐流派分类

2.1 数据集

音乐数据集的收集和整理是整个流派分类的基础。本文研究中选用的音乐数据集为ISMIS 2011比赛中采用的数据集[6]。ISMIS 2011数据集中包含了60个艺术家6大类流派的音乐,分别是:Classical、Jazz、Blues、Rock、Heavy metal、Pop。对每个表演者搜集了15~20个音乐片段,数据分布情况如表1所示。

从表1可以看出,ISMIS并不是一个平衡的数据集,最多的Classical数量甚至达到最少的Heavy metal的三倍以上。实验中,每个音乐片段都被分成20小段。

2.2 声学特征向量

ISMIS 2011比赛中使用的特征向量包括主要包括三类:1)127维的多媒体内容描述接口(Multimedia Content Description Interface,MPEG7)已查,对应Multimedia Content Description Interface描述符;2)40维表征音色的梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC);3)24维时域相关特征。同时,将各个特征按照MPEG7标准进行了分组,191维特征向量共分成10个组,具体向量的描述见表2。

2.3 MKLSVM特征选择

前文提到,通常的特征选择算法只能给出最终的特征选择结果,而对于为什么会有这种结果却无法给出合理的解释。基于多核学习的特征选择,在选取最优特征组合的同时还可以得出不同核的权重,可以清楚地得到不同特征对分类的影响。

利用MKLSVM进行流派分类中的特征选择的算法步骤如下:

1)对于每一组特征,分别用单核SVM选出其对应的最优核参数,确定10个核函数;

2)顺序添加各个子核及其对应训练数据、测试数据,开始多核训练;

3)初始化权向量W,利用利用牛顿下降等优化算法对W进行更新直到多核目标函数收敛;

4)输出结果权向量W,按照权重值对各组特征进行排序、选择;

5)选择前K组特征进行分类,并与未作特征选择的结果进行比较,循环操作直至选择出最佳的K值。

3 实验及结果分析

3.1 SVM最优参数选择

SVM具有非常完备的数学理论基础,使得它具有非常好的稳定性。对于不平衡的数据集,通过设置正例、负例不同的惩罚系数,很容易避免不平衡对于训练结果的影响。训练具有独立性,即分类器的训练可以在测试样本特征到达之前完成,实时性比较好。但是,SVM核函数的参数对于SVM性能的影响非常大。

在流派分类中最常用的SVM为RBF核函数的SVM,而影响RBF核函数SVM性能的参数有误差惩罚系数c、参数σ(参见式(4))。考虑到SVM对c值并不是特别敏感,只要c不是特别小,分类效果都比较不错[7]。为此,实验中只训练集分类效果对参数σ进行选择,该算法的前提是:对于满足特定条件的c值,总能找到一个参数σ使得分类的效果达到最佳。

实验中,SVM的核函数选择RBF核函数,固定核函数的参数c=1.0,参数σ由20取到28。通过训练集的学习,确定10个最优核函数,并在测试集上进行验证。在全部特征集合上的参数选择结果如图2所示,当σ=25,此时的分类准确率达到75.78%。

3.2 基于MKL的特征选择

实验中,根据基于MPEG7标准的分组结果[8],利用3.1节的方法,给每组特征一个单独的核进行学习,选取每组特征的最优参数核函数;然后通过对权向量的不断优化学习,在分类过程中得到图3多核学习中的权值分布。

从图3中可以明显看出,在流派分类过程中对分类结果影响权重最大的四个特征组分别为特征组2,3,6,7,而影响最小的三个特征组分别为特征组5,4,1;清楚地给出了什么特征对于流派分类影响最大,什么特征对流派分类的影响较小。

3.3 MKLSVM分类

如图1所示,在每组最优分类器结果上,将多核学习得到权重进行组合后送到SVM分类器中进行分类学习,得到最终的分类结果。表3和图4给出了选择权重最大的前3组、前4组、前5组、前6组特征及全部特征下的最优分类参数分布和分类结果分布。

从表3和图4中可以看出:在参数σ=24时前4组特征组合得到最优分类结果,分类准确率为76.58%。而前3组、5组和6组组合特征下的分类最优参数和最优准确率分别为: σ=23下的75.72%、 σ=24下的76.48%和σ=25下的75.97%。全部特征下的分类最优参数和最优准确率为σ=25下75.78%,略差于权重最大的前4组特征组合的分类准确率。

前面提到,特征选择可以看作为流派分类的过程之一。特征选择在降低特征向量维度、减少特征向量冗余度、提高分类学习效率的同时,也提高了分类的准确率[9]。本文中,将多核学习的特征选择结果同交互前向特征选择算法[10]的结果进行了比较。交互前向特征选择(Interaction Based Forward Feature Selection,IBFFS)是Wrapper特征选择算法的一种,其基本思想是以SVM分类器为最终评价标准,利用多次迭代,选取最佳的特征组合。在10大类音乐流派分类中[11],IBFFS特征选择算法给出了分类效果最优的特征组合和分类结果[10]。但对于为什么会有这种结果却无法给出合理的解释,更无法说明其中的每一个特征到底起多大作用。

实验结果发现:IBFFS特征选择得到的4组特征组合分别为ASE均值、ASE方差、SFM均值和SFM方差,从前面表2中可以看到其结果与MKL的结果完全相同。这一结果证明了MKLSVM进行特征选择的有效性。

3.4 分类实验结果比较

实验中还将MKLSVM与单核SVM进行了比较,不同分类方法下总的分类准确率比较如表4所示。

从表4中可以看出,MKLSVM的分类准确率比单核SVM提高了6.58%,与IBFFS特征选择后的结果一致,比传统的特征选择方法如前向特征选择算法(Forward Feature Selection,FFS)、Relief特征选择算法以及Fisher特征选择算法的结果都要好[12]。

从表5的混淆情况可以看出:MKLSVM分类错误主要表现在两个方面: 1)Blues类、Rock类、Pop类三类之间的混淆;2)Classical类与Jazz类的混淆。认为这两方面的错误主要源自音乐类别之间的相似性。R&B音乐被称为“黑人的流行音乐”,源于黑人的Blues音乐,是现今西方流行乐(Pop类)和摇滚乐(Rock类)的基础[13],由此可见Blues类、Rock类、Pop类三者之间的关系千丝万缕;同理,Classical音乐与 Jazz音乐也存在着很大的相似性,要想更好地区分这些音乐类别,还需要从基本的特征层面出发,找出反映音乐类别特点的关键特征。

4 结语

音乐流派自动分类中使用了很多不同类的声学特征,不同特征的对于流派分类的贡献不同。本文研究了不同特征向量下选择最优核函数的学习方法,并将得到各个最优核函数进行加权组合构成一个合成核进行音乐流派分类的方法,有效地解决了音乐流派分类征向量分析和选择的问题,更

清楚地解释了不同特征向量对流派分类的影响大小。

由于多核学习支持向量机中只研究了SVM作为分类器的分类效果,其分类结果受到了分类器的影响。因此,下一步的工作将考虑引入多核多分类器,并对特征进行稀疏表示后进行组合研究。

参考文献:

[1]TZANETAKIS G, COOK P. Musical genre classification of audio signals [J]. IEEE Transactions on Speech and Audio Processing, 2002,10(5): 293-302.

[2]BACH F R, LANCKRIET G R G, JORDAN M I. Multiple kernel learning, conic duality, and the SMO algorithm [EB/OL].[2014-12-02]. http://cs.berkeley.edu/~jordan/papers/skm_icml.pdf.

[3]LUKASHEVICH H. Applying multiple kernel learning to automatic genre classification [C]// Proceedings of the 34th Annual Conference of Challenges at the Interface of Data Analysis, Computer Science, and OptimizationStudies in Classification, Data Analysis, and Knowledge Organization

.Berlin: Springer, 2012: 393-400.

[4]VAPNIK V N. An overview of statistical learning theory [J]. IEEE Transactions on Neural Network, 1999, 10(5): 988-999.

[5]

SONNENBURG S, RTSCH G, SCHFER C, et al. Large scale multiple kernel learning [J]. Journal of Machine Learning Research, 2006, 7: 1531-1565.

[6]KOSTEK B, KUPRYJANOW A, ZWAN P, et al. Report of the ISMIS 2011 contest: music information retrieval [C]// ISMIS 2011: Proceedings of the 19th International Symposium on Foundations of Intelligent Systems, LNCS 6804. Berlin: Springer, 2011: 715-724.

[7]DING Y, YAN Z, GAO Z. A method for selecting parameter of SVM with RBF kernel [EB/OL]. Beijing:Chinese Sciencepaper Online

. [2014-12-05]. http:///html/releasepaper/2010/05/659/. (丁允静,闫志刚,高瞻.一种RBF核SVM的参数选择方法[EB/OL].北京:中图科技论文在线. [2014-12-05].http:///html/releasepaper/2010/05/659/.网站提供的引用方式,没有问题)

[8]ZENG C, SONG S, XU J. Study on multimodal music genre classification [J]. Journal of Frontiers of Computer Science and Technology, 2011, 5(1): 50-58 (甄超,宋爽,许洁萍.多模态音乐流派分类研究[J].计算机科学与探索,2011,5(1):50-58.)

[9]WLFING J. RIDEMILLER M. Unsupervised learning of local features for music classification [EB/OL]. ISMIR 2012, Proceedings of the 13th International Society for Music Information Retrieval Conference 2012[2014-12-03]. http://ml.informatik.unifreiburg.de/_media/publications/wuelf2012.pdf.

[10]XU J. WANG P. YAN L. Feature selection for automatic classification of Chinese folk songs [C]// CISP08: Proceedings of the 2008 International Congress on Image and Signal Processing. Piscataway: IEEE, 2008, 5: 441-446.

[11]DIELEMAN S, SCHRAUWEN B. Multiscale approaches to music audio feature learning [C]// ISMIR 2013: Proceedings of the 14th International Society for Music Information Retrieval Conference. Rio de Janeiro: Pontifícia Universidade Católica do Paraná, 2013: 116-121.