美章网 精品范文 教育测量与评价论文范文

教育测量与评价论文范文

教育测量与评价论文

教育测量与评价论文范文第1篇

关键词 教育测验 教育测量 教育评价

教育评估、教育评价是20世纪30年代在美国兴起,60 年代兴盛于西方世界并传入我国。这些学科虽然在我国大力发展已有20余年,但理论

研究的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有考试院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生学习的潜在能力、发展倾向,如音乐能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理,准确地掌握教育

情况,为制定教育方针、政策提供科学依据,为开展教育科学研究,探索教育规律,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育问题的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要内容包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的历史、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和规律为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的社会意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的分析可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的问题上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群研究的建议

教育评价学经过几十年的发展已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把考试学、教育统计学、教育测量学的内容纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和理论约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极总结实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育科学界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

教育事业的发展有重大的理论和实践意义。

参考文献

[1] [5]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页、第167页

[2] 参见曹延亭编著·《教育统计学基础》·辽宁人民出版社·1984年版·第2--5页

[3] 见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页

[4] 参见许茂祖编著·《高等教育评估理论与方法》·中国铁道出版社·1997年版·第16--27页

[6] 见刘尧著·《教育评价学》·中国文联出版社·2000年版·第 7--23页

教育测量与评价论文范文第2篇

关键词教育测验教育测量教育评价

教育评估、教育评价是20世纪30年代在美国兴起,60年代兴盛于西方世界并传入我国。这些学科虽然在我国大力已有20余年,但

的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生的潜在能力、发展倾向,如能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和研究教育现象中的数量关系的一门学科。它通过数据的和处理,准确地掌握教育

情况,为制定教育方针、政策提供依据,为开展教育科学研究,探索教育,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群的建议

教育评价学经过几十年的已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把学、教育统计学、教育测量学的纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

教育事业的发展有重大的理论和实践意义。

[1][5]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页、第167页

[2]参见曹延亭编著·《教育统计学基础》·辽宁人民出版社·1984年版·第2--5页

[3]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页

[4]参见许茂祖编著·《高等教育评估理论与》·铁道出版社·1997年版·第16--27页

[6]见刘尧著·《教育评价学》·中国文联出版社·2000年版·第7--23页

教育测量与评价论文范文第3篇

刘 尧

提要 本文针对教育评价相关关系不清的总是从多角度对此进行了辨析,并对教育评价学科群的建设,提出了许多有益的建议。

关键词 教育测验 教育测量 教育评价

作者 刘尧 浙江师范大学教科所副研究员(金华 321004)

教育评估、教育评价是20世纪30年代在美国兴起,60 年代兴盛于西方世界并传入我国。这些学科虽然在我国大力发展已有20余年,但理论

研究的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有考试院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生学习的潜在能力、发展倾向,如音乐能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理,准确地掌握教育

情况,为制定教育方针、政策提供科学依据,为开展教育科学研究,探索教育规律,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育问题的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要内容包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的历史、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和规律为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的社会意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的分析可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的问题上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群研究的建议

教育评价学经过几十年的发展已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把考试学、教育统计学、教育测量学的内容纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和理论约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极总结实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育科学界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

教育事业的发展有重大的理论和实践意义。

教育测量与评价论文范文第4篇

关键词:构建 德育测评 理论探析

《中国普通高校德育大纲》指出:“德育考评是高校德育工作的重要环节,是实现高校德育目标的必要保证。”目前,高校的德育评价工作面临新的挑战,如何适应新形势,进一步加强和改进大学生德育评价工作,特别是制定科学有效的大学生德育测评体系是我们需要深入思考的重要课题。

一、大学生德育测评体系构建的理论基础

1.哲学方法论基础:系统论。

系统论为大学生德育素质测评指标体系的创建提供了方法论。系统论原理讲究事物的整体性、有序性和动态原则。整体思想是系统论的核心。按照整体思想的观点,大学生的思想政治、品德的知、情、意、信、行这五项心理要素特征相互联系、相互作用,是知行协调统一的整体。在创建这个测评指标体系时,坚持知行统一评价;有序性要求我们既要反映测评的诸多要素,又不能等同对待,因为相对而言大学生“行”的状况更能反映其思想政治素质的水平,所以我们更应赋予大学生“行”的评价较大比重;动态性要求我们要紧扣时展的要求,从学生的实际情况和发展来把握测评指标体系的调整速度,从而体现测评指标体系的针对性。

2.心理学基础:“知、情、意、信、行”的发展规律。

心理学研究表明:学生思想道德的形成要经历“知、情、意、信、行”,由简单到复杂,由量变到质变循环往复过程,表现为认知产生思想,思想支配行为,行为改造外界并形成新认识和新思想,产生新行为,进一步改造外界。可见,学生的一言一行投射出学生的所思所想。因此,从理论上讲,对学生德育进行测评是完全科学的。尽管大学生的思想、政治、品德素质是精神性的、变动性的东西,但借助于测评技术,能使我们较客观地认识德育现象与规律,认识大学生真实的思想、政治、品德、个性及行为面貌。

3.教育学基础:多元智力理论。

多元智力理论认为人的智力有语言智力、数理智力、空间智力、动觉智力、节奏智力、人际智力和内省智力等几种,它们通常以复杂的方式综合运作。根据多元智力理论,大学生德育素质的测评不应偏重于某个单项测评结果对学生进行分类、排名次,或者贴标签,而应该采用多元评价结果的方式,体系的设置应涉及对学生的“两课”学习情况和学生思想、政治、品德的实践情况进行全方位的综合测评。

二、大学生德育测评体系构建的基本原则

构建大学生德育素质评价体系,必须遵循以下基本原则:

1.科学性原则:指构建的测评指标体系要全面完整、层次分明、要求明确,能反映大学生思想、政治、品德素质的本质及各个方面,即不仅要测评大学生对思想政治品德理论知识的掌握情况,更要突出测评大学生对思想、政治、道德的情感、信念和行为等方面的发展情况。即测评目的要从传统评价的“预测”、“控制”、“选拔”转移到“发展”上来,即从选拔适合教育的学生转到创造适合学生的教育。同时测评指标自身的概念的表达也要科学而严密,其量化和取值尽可能科学、合理,它所体现的要求要符合大学生德育水平及其发展规律,使测评结果有较强的权威性和可比性。

2.导向性原则:所谓导向,就是指导大学生的品德朝着社会所期望的方向发展。大学生德育素质评价体系了体现社会对大学生的要求,评价指标体系的评价内容和各项指标的权重赋值以及评价结果的合理运用,对大学生会具有明显的导向作用。品德测评的根本目的不是对学生的德性进行终极性的诊断、甄别与分类,而是注重个体在测评过程中的积极体验,强化自我意识,以调动测评对象的积极性,帮助学生树立成功的信心,自觉趋近德育目标,促进学生更好地全面发展。

3.层次性原则:指测评指标体系的创建要从实际出发,针对学生的不同类型、不同年级和个体差异来进行创建。人的发展是有差异的,这种差异可以体现在年龄、知识、能力、性格、兴趣、行为表现等多方面。所以我们研究创建的测评指标体系只有是多种层次的,才能准确地反映出大学生每个个体在不同年级、不同方面的发展水平,才能使每个大学生都能发现自己的长处,增强自信。

4.主体性原则:大学生德育测评的目的是为了实现大学生更好的发展,大学生应当成为测评的主人。以往评价主体多为教师和评价小组,主要是他评,大学生处于被评价者的地位,导致评价缺乏大学生的坦诚参与,从而使评价的调节、激励、改进功能不能得到很好的发挥。要充分发挥大学生在德育测评中的主体作用,让大学生参与评价自己并给予一定比例记分,增强其参与意识,引导大学生自觉重视测评过程和结果,并充分发挥自我教育功能,从而自觉调整思想和行为。

5.实用性原则:一方面是指测评指标体系要从大学生的实际出发制定,各项指标都可以进行实际观察、测定或测评,便于高校操作实行,给出符合评价对象实际情况的评价、指标分值;另一方面是指测评指标体系的创建要与社会用人机制和社会需求接轨,为社会所接受。使其既能满足大学生了解自身的思想、政治、品德素质状况,有目的地提高自身素质,适应个人未来职业设计的需要,同时也能满足社会对大学生素质的多层次、多维度的选拔需要。

三、大学生德育测评体系构建的现实意义

1.有利于大学生充分发挥自我评价和自我教育管理功能,不断提高自身德育素质。

从高校德育主体与客体、内因与外因的关系看,任何一个道德目标的达成,最终都是自我教育的结果。心理学原理说明,自我教育离不开自我评价,正确地认识自我,客观、正确地评价自我,就能量力而行,为确立合适的理想自我并实现理想自我而不懈努力。建立德育测评体系就是把德育目标、德育内容以定性和定量的形式明确规定,用制度细化大学生思想行为准则,有利于大学生比照这些标准,明确应当做什么,怎么做,随时进行自我“测”、“量”,对测评项目进行价值上的判断分析,对自己品德发展水平作出评价,进而调整自己的行为表现,自觉趋近德育目标,从而形成正确的思想与行为。总之,大学生德育测评体系的构建为大学生对照体系进行自我测评提供了可能,有利于大学生正确认识自己优点和缺点,不断提高自我评价、自我教育能力,促使大学生按照德育目标不断提高自身德育素质。

2.有助于落实德育地位,促进高校德育工作的发展。

构建大学生德育素质测评体系,是把大学生思想道德素质评估由软变硬、由虚变实的重要措施,是掌握和激励大学生思想道德素质的有效制度。长期以来,高校德育首位的地位还没有落实。这其中一个重要原因就是缺乏科学完整的高校德育评价体系,尤其是缺乏科学、全面的大学生德育素质的评价体系。可见,只有构建大学生德育素质测评体系并实施测评,才能够使德育看得见、摸得着,实在可行,真正实现“德育为首,诸育并举”;同时,建立测评体系对大学生德育素质进行科学评价是高校德育工作的实体内容之一,既可以为“两课”教师提供反馈信息,增强“两课”教学的针对性、实效性,从而较好地解决以往“两课”教学“虚多实少”,又可以将大学生德育管理目标细化分解,使其具体化、可操作化,把德育教育与日常管理相结合,从而增强德育实效。另外,测评体系的建立通过充分发挥大学生自我评价、自我教育和管理的作用,从而有助于学生政工干部从一些日常的德育活动中解放出来,加强研究德育的动态发展,整体把握德育过程,促使高校德育工作的科学化和系统化,实现德育的良性循环和质量的提高。

3.有利于实现对大学生综合素质的测评,全面提高高等教育的质量。

高等教育数量扩张迫切需要通过建立健全系统的、科学的、高效的质量保障与评价机制,大力加强高等教育的全面质量管理。随着我国高等教育从精英阶段向大众化阶段的过渡,一些不利因素影响到我国的高等教育质量。如高等学校连续几年扩大招生,使得大学生生均教育经费、生均占有图书资料的数量、教学实验(实习)的条件等硬件资源减少,以及相应师资的数量和质量等软件资源不足,另外毛入学率的提高而带来生源质量相对下降等等。而不断提高大学生的素质尤其是提高大学生的思想、政治、品德素质质量是关系到高等教育能否培养出德才兼备的社会主义现代化的合格建设者和接班人的重大问题,因而,构建科学、合理、全面的大学生德育素质测评体系,就为确保高等教育的质量的提高提供了明确的德育标准,有利于消除大学生综合素质测评过程中普遍存在的“一手软,一手硬”现象,也将为大学生科学文化素质测评体系的构建和完善提供重要的参考和借鉴,从而真正实现对大学生综合素质的科学测评,满足社会选拔人才的需要,确保高校全面提高高等教育的质量,为社会培养德才兼备的人才。

参考文献:

[1]邓艳葵.构建新型的大学生德育测评指标体系探析[J].广西社会科学,2002,(2).

[2]林雷.高校学生思想品德行为量化测评浅探[J].南京人口管理干部学院学报,2001,(6).

[3]王健敏.学生品德测评系统的改革与探索[J].课程・教材・教法,2002,(l).

[4]张辉.大学生思想、政治、品德素质测试指标体系的研究.东北师范大学硕士学位论文,2003,(10).

[5]李上文.大学生道德养成教育的基木途径[J].学校党建与思想教育,2003,(1).

教育测量与评价论文范文第5篇

关键词:中职教育;教学质量;评价

职业教育的质量问题是我国职业教育内涵式发展的内核,针对教育教学质量的评价则是对教育起点、教育过程以及教育结果的信息搜集、分析、诊断与反馈,能够有效保障并提升教育教学质量。当前在我国的中职教育教学质量评价中仍然存在不少问题,这在很大程度上制约了职业教育的现代化发展,影响了职业教育的地位和吸引力。然而,中职教育教学质量评价是一个极其复杂的理论与实践体系,其中涉及了诸多因素、线索与层面,现以学生发展为主视角,对中职教育教学质量评价的特征、指标以及实施等问题进行粗浅思考与剖析。

一、中职教学质量评价存在的问题

(一)评价特征不明显

中职学校的教学质量评价理应关注中职教育人才培养的目标要求,体现中职教育的类型特征。但在实践中,不少中职学校受传统思维影响,在中职教学质量评价的设计与实施过程中,常常与普高教学质量评价混为一谈,无法从本质上凸显中职教育教学质量评价的内在特征。即便部分学校在教学评价方面做了职教特征设计,也往往只是形式上的表征,并没有真正触及职校学生发展的内核,故而无法真正发挥教学质量评价对于职业学校人才培养的作用与功能。

(二)评价标准不清晰

教学质量评价的有效性应建立在一套清晰的评价标准之上,但调查发现,当前在部分中职学校中,一定程度存在教学质量评价标准不清晰的问题。具体表现为:第一,标准制定缺乏科学依据。在评价标准制定过程中,常常根据领导意志或凭借经验随意制定标准,与教育研究机构组织的专业评价联系不多,与行业企业的要求相差较大;第二,标准内容缺乏核心指标。标准内容的目标指向不明确,看似面面俱到,实则泛泛而谈,缺乏具有支持学生发展的专业学科特色的核心指标;第三,标准水平难以评测。大量的评价标准停留于模棱两可的描述层面,没有达到可操作的量化水平,致使评价人员只能凭主观判断。

二、教学质量评价的核心指标

中职教学质量评价问题的消解,关键在于对教学质量内涵的准确理解,并据此确立一种复合型多层次的教学质量评价标准体系。在现代职业教育理念的关照下,以中职教育培养目标为基础,中职教学质量应具备的基本特征为:其一,基础性与专业性兼容,在为学生提供一定宽而深的文化知识基础的同时,关注对学生的专业教育,实现人与社会职业的有效链接。其二,理论学习与技能实践并重,加强学生实践教学和技能训练的同时,更应重视学生的理论学习,帮助学生锻炼思维能力,提炼实践经验,满足现代行业企业对复合型人才的素质要求。其三,人的发展与职业适应相契,以人的职业适应为基础,完善人的发展,关注人的生命价值,追求人的幸福。围绕上述中职教学质量的三大特征,提出相对应的以“文化基础—专业知能—职业素养”为基本维度的教学质量评价标准体系,该体系以学生基本素质为基础标准,以专业能力为核心标准,以职业素养为职业发展的价值标准,并在此框架下设计各维度的下属指标及其表征、权重。

(一)学生基本素质

根据中职教学质量的基础性特征,评价学生发展的基础维度应是基本素质,这既是学生发展专业知识和技能的基础,也是学生终身学习、终身发展的重要基础。根据人的全面发展理论“,基本素质”维度下属指标具体分为:身心素质———指学生在身体、心理方面所具备的良好素质,拥有健康的体质条件、一定的运动能力以及正常的心理状态,这是一个人全面发展的基础之基础。道德素质———指学生在思想、政治、道德等方面所表现出来的符合一定的社会要求与规范的特点和倾向,具有高尚的道德情操、良好的个人修养以及端正的行为品质。智力素质———指学生在语言文字表达、逻辑数学运算、视觉空间觉察等方面的能力以及一定存量的人文科学知识基础,这是学生发展必要的知识文化基础。情感素质———指学生在情感态度等方面所具备的基本素质,比如在艺术欣赏、情感表达、情绪管理、人际沟通等方面拥有较好的素养。实践素质———指学生在动手操作实践、参与社会活动等方面具备的基本能力。

(二)学生专业知能

从教学质量的专业性特征来看,学生的专业知能就是评价教育教学质量的核心维度,依照“理论学习与技能实践并重”的基本特征,该维度可进一步分为“专业知识”与“专业技能”。由于受到不同专业特性的限制,因此在专业知识和专业技能的具体结构、内容以及水平方面,需要结合具体专业要求设计。以“中职学前教育专业”为例,要求学生在专业知识结构方面具体掌握:学前教育学科的基本知识,主要包括学前教育学、学前心理学、学前卫生学等;学前教育学科专业知识,主要包括了《幼儿园教育指导纲要》涉及的“健康、科学、语言、艺术、社会”五大领域的专业知识;学前教育学教学的基本内容;幼儿园管理的基本知识。在专业技能方面,要求学生具备以下几个方面:教育教学技能,即指组织开展课堂教学活动的能力;实践操作技能,即在弹、唱、跳、说、画、演、做等方面实践和创编技能;幼儿保育管理技能,能够对幼儿进行日常保育、管理、沟通的技能;幼儿园活动设计、实施的技能;与家长交流合作的技能;以及开展幼儿教育研究的技能。对于“专业知能”指标的评价,主要可以从下列评价参考入手:专业理论课程学业水平、专业技能课程学业水平、实习见习课程学业水平、专业技能比赛成绩以及职业资格证书获取。

三、教学质量评价的实施框架

教学质量评价的实施是一项极其复杂的系统工程,涉及评价机构、评价制度、保障措施等诸多要素与关系,因此对于教学质量评价实施体系的全面呈现与阐述是一大难题。笔者试从支持学生职业发展的角度,以学生学习的起始水平、过程表现、最终成果以及后续发展作为教学质量评价实施的纵向流程,以教学质量评价核心指标为横向要素,对中职教学质量评价实施的基本框架进行初步探索。

(一)基线水平测评

在学生进入中职学习的第一周内,由学校教学评价管理部门组织对各专业学生的学业基线水平进行测评,并建立学业评价信息平台,将每一个学生的基线水平存储进入数据库。针对不同评价指标,学生学业基线水平测评方式也有所不同,具体为:

1.基本素质的基线测评

采用不同的评价手段对学生五项基本素质进行测评,主要利用日常行为评价量表、情感态度评价量表等对学生道德素质、情感素质进行测评,获得基线数据B-A1、B-A2;以语、数、外、音、体、美等文化课程为主要考核方式,对学生的身心素质、智力素质进行测评,获得基线数据B-A3、B-A4;最后通过社会实践等课程考核获得学生实践素质的基线数据B-A5。

2.专业知能的基线测评

由专业教师组织对学生的专业理论知识与专业技能进行基线测评,通过理论笔试与技能实考等形式,获得专业知能B-B1和B-B2的基线数据。

3.职业素养的基线测评

参考国外职业素养测评专业量表,结合学校生源特点,按职业道德、职业关键力、职业情商与职业个性四项维度,编制校本《中职学生职业素养测评量表》,组织学生进行量表测评,获得职业素养B-C1、B-C4的基线数据。

(二)过程监控管理

对于学生学习过程的监控管理,是过程性评价的重要体现,教学评价管理部门应从以下几个方面实施评价:

1.课堂教学监控

这是教学质量过程评价的主体环节,做到“对教师教学的评价”与“对学生学习的评价”相结合,通过建立“评价部门—教学组—教师”三级监控机制,对基础文化课程、专业理论课程的课堂教学进行监控管理,由教师对每一位学生的学业表现进行实时监控,并将评价信息登录评价信息平台;由教学组对教师的课堂教学,开展教案检查、听课评课、教学反思等常规教学监控活动;最后由评价管理部门对各个教学组的活动进行统一监控管理。

2.实习见习监控

对于学生专业技能与职业素养两大指标的过程性评价,主要通过对实习见习活动的监控管理。以“学校—企业”为教学评价双主体,由学校实习指导教师和企业师傅联合对学生的实习见习过程进行评价,将学生在专业技能与职业素养方面的变化信息反馈至评价信息平台。此外,学生在各类专业技能竞赛中的成绩作为参考指标纳入本环节的评价内容。

3.阶段性水平测评

以学期为一个阶段,针对教学质量评价核心指标,按照基线水平测评的方法程序,进行阶段性水平测评,将测评结果按学期分别标为I阶段、II阶段、III阶段等,并将每个阶段水平与基线水平进行统计,经诊断分析,形成教学质量评价报告,反馈给教师、学生,并对存在的问题发出预警,提供改进建议。

(三)发展水平评定

对学业发展水平的评定,既是对于学校教学质量的最终评价,也是对于学生发展的关注,主要分为:

1.发展水平测评

在学生完成学校全部教学计划之后,由评价管理部门组织对学生的基本素质、专业知能与职业素养三大评价指标进行最终成就水平测评,获得学生发展水平数据(D-A1—D-C4),发展水平(D)与基线水平(B)之间的统计比较结果,成为评价学校教学质量的重要信息。

2.资格证书审核

对资格证书的审核主要是对专业知能达成水平的最终评价,通过对学生获得的职业资格书数量、比例、等级等数据进行统计,以此反映学生在就业竞争力方面的水平以及学校职业教育的质量。

3.毕业去向统计

中职学校毕业生已不再全部面向就业市场,毕业去向的多元性已经成为中职教育的一大趋势,主要包括了就业、升学深造、出国留学、自主创业等,对学生的毕业去向进行搜集统计,既是对中职教育人才培养目标多样性的评价,也为关注学生职业生涯的后续发展奠定了基础。为了进一步关注学生后续发展,可对学生的职业发展进行追踪。例如,定期与学校毕业生取得联系,调查毕业生职业生涯发展状况,建立学校毕业生数据库,实现职业教育对人发展的终身关怀。

作者:叶盛楠 单位:浙江宁波外事学校

教育测量与评价论文范文第6篇

关键词:教育评价;课程评价;价值;目标

20世纪的学者围绕着“如何合理地衡量‘预期目标’和‘实际结果’的存在的差异”的问题展开研究, 30年代来自泰勒“目标达成评价”奠定了美国教育评价的基础。随着联邦政府对教育的投入,教育评价取得了繁荣和昌盛,对“目标达成评价”的批评来自两个方面:一是针对教育目标本身的攻击。反对该次课程改革的人们开始质疑课程改革本身是否能满足社会需要,也就是质疑教育目标自身的合理性问题,这就使得原本“中立”的目标评价对自身的价值产生了反思。二是针对教育目标实施过程的关注。这时人们关注的并不仅仅是目标的达成,而是在过程之中所具有的繁复情境,关注在各种情境下的参与者特有的价值立场。教育研究者对教育改革实施过程的关注使得参与者的价值立场凸现出来。这些批评带来了教育评价革命性的发展。与此同时,评价研究配合联邦政府的教育渗透政策,展开新的评价视阈的开拓。

一、屏蔽价值:目标达成的“科学”评价

20世纪30年代,美国俄亥俄州立大学教授泰勒 (Ralph W.Tyler)站在课程研制的管理者立场,将评价拓展到教育方案质量的评价。不过,这种拓展受到当时科学管理思想的影响,所谓的方案质量的评价指:将课程视为目标的存在。泰勒宣称评价是“测定教育目标在课程与教学的方案中究竟被实现多少的历程”,而评价的核心就是长存于历史当中的“学习经验(learning experience)的发展”。为此,课程评价的重点工作就是确立客观可信的标准和测量的工具,而工具应该能够囊括“教育目标所期望的行为的任何有效证据”,如纸笔测验(paper-and-pencil tests)、观察(observation)、交谈(interview)、问卷(question-naires)、收集实际作品(actual products)等。30年代早期,泰勒的评价方法在俄亥俄州得以实践。

经济大萧条时期(The Great Depression),学校和其他公众组织遭受资源短缺的困扰。此时,罗斯福总统(Roosevelt)开始进行政治上的新改革(New Deal Program)。在这个背景下,进步主义运动沸沸扬扬,泰勒参与了进步主义的运动,1932年开始领导著名的“八年研究”,并在卡内基机构(Carnegie Corporation)资助下,尝试比较不同学校教育的有效性。泰勒的教育评价(education evaluation)开始将评价拓展到教育方案质量的评价,“八年研究向全美的教育学者们介绍了更加广泛的教育评价,而不只是局限在学生的有效性和测验的范围”。而且,评价确定了预定的目标规范,关注预期目标的实现。泰勒以其研究的结果告诉我们,在预期目标和实际结果之间存在着巨大差异。早期的评价倾向于关注结果的测量,而把作为课程实施的重要环节——课堂和学校屏蔽起来,这种过程“黑箱”很快就引起了学者的反思。20世纪40年代以后,泰勒也对自己的工作进行了反思,其论著在以后的25年中产生了持续的影响。

20世纪40年代到50年代中期,美国城乡里弥漫着贫穷和失望,充满种族偏见和隔离,是一个资源浪费而人们熟视无睹的时代,是工业发展而危害环境的时代。但在经济的带动下,新的学校形式出现,学区的教育形成各种服务系统。社会和教育对教育的需求无限膨胀,但是人们很少关注教育的效率和有效性。不过,评价技术却得到了很大的发展,1947年成立的教育测验服务机构(Educational testing service)。20世纪50年代,联邦资金鼓励并支持专业研究活动,标准化测验已经得到广泛传播,专业组织建立了一系列规范测验指标。1954年,美国心理学家协会(American psychological association)提供《心理测量和诊断技术的具体建议》(Technical Recommendations for psychological tests and diagnostic techniques,简称APA)的报告。1955年,美国教育研究协会 (American education research association,简称AERA)和国家教育测量委员会(National council on measurement used in education,简称NCME)了《成就测验的技术建议》(Technical Recommendations for Achievement Tests)。1966年,前面三个机构联合了“教育和心理测量的标准手册”(Standards for Education and Psychological Tests and Manuals)并于 1974年进行了修订。

此时,标准化测量风靡一时,专家根据可接受的目标或目的建构测验,预先设定不同年龄或年级的常模或标准,用以管理、评级和解释分数的意义。包括性向测验(Aptitude tests)、成就测验(Aptitude tests)以及兴趣、个性和态度测验(Interest,Personality and attitude inventories)。这些标准测验方法看起来满足了科学化的要求,但在实际上却与泰勒规则相矛盾,因为泰勒认可并鼓励目标的差异性。不过,这些技术性的发展为未来评价的拓展奠定了技术的基础。

二、价值渗透:关注过程的“方案”评价

进入20世纪50年代,评估已经拓展到学生学习、课程设计的有效性之外,进入到教育系统、国家发展计划甚至是政策系统。评价者并没有遵照课程评价领域的前辈们的已有研究范围,而是将自己的研究领域拓展到公众领域的政策问题范围。50年代后期,教育领域资源的重组,随之产生了各类课程发展与教育的问题,评价的价值及其伦理问题已经成为评价领域的重要问题。

1957年苏联卫星发射成功的事件之后,联邦政府制定了《国防教育法》(National Defense Education Act,1958)。整个时期,联邦政府开始关注到教育的质量问题,开始资助大规模的评价计划,评价开始从“作为行业(industry)的评价到依靠税收的职业(profession)”。学科专家组织了科学和数学的课程发展计划(curriculum development project),不过很快人们就发现这些课程没有发挥其真正的力量,而且评价者的论著既无助于课程研制,也不对有效性的检测负责。1963年,心理测量专家克龙巴赫(Lee J.Cronbach)针对人们的抱怨,批评评价缺乏相关性和应用性,主张《通过评价提升课程》(Course improvement through evaluation),认为测验项目的分析和汇报有利于教师的教学,并建议课程评价必须聚焦于课程研制过程中课程专家的决策。但是,这并未引起美国教育评价领域学者的关注。

几年之后,情况变得不同了。1965年,肯尼迪总统智囊团的主席休伯特·汉弗莱议员(Senator Hubert Humphrey)和约翰逊总统(President Lyndon Johnson)对贫穷问题展开争论,人们开始将目光转移到社会福利的改革。20世纪早期积累的财富促使联邦政府开始资助这些福利计划。《初等和中等教育法案》(1964)(The Elementary and secondary education Act of 1964,简称ESEA)首次拨出特定联邦资金用于地区教育系统,教育被视为州的责任。随着联邦资金对地区教育的投入,国家开始干涉资金的运用效果。很多资金投入并未如地方宣称的那么理想,因此这些都要求教育者将教育评价转移到实践等支持性研究,学校开始接受ESEA的定期检测。由于评价可以终止或辅助课程项目,因此课程评价研究变得如此重要。费黛奥塔·卡朋(Phi Delta Kappa)联合会建立了“国家评价研究委员会”(National Study Committee on Evaluation),针对评价存在的问题进行调查。1960年后期,大部分美国教育学者都在着手于教育评价的研究,各类人员从不同的领域开始进入到教育评价领域,重新审视教育评价的本质概念。教育评价研究开始进入概念化(conceptualization)过程,这意味着对评价目标、评价对象、实施建议、服务过程,以及测量预定和非预定的结果等问题展开讨论。

1967年,美国教育研究协会(American Education Research Association,简称AERA)的罗伯特·斯蒂克(Robert Stake)对课程评价的研究引发了公众的关注。此时,评价者大多为心理测验学和实验设计人员,因此被人批评为缺乏教育问题的鉴赏力。其实,在1962年AERA会议之后,随着AERA的专论的出版,评价是教育测验的假设已经逐渐被摧毁。争论由此扩大化,就连泰勒(Ralph Tyler)、斯克里文 (Michael Scriven)和斯蒂克(Robert Stake)也开始批评心理测验手段是否可以用于满足评价的目的。1967年,斯克里文区分了形成性评价和终结性评价,“形成性评价”不仅仅是作为一种评价形式而被提出,它开启对过程与未来目标的重视。评价不再是单纯的心理测量技术,它需要容纳伦理的、政治的各种价值。到了20世纪70年代,就连专门从事测量的学者伯汉姆(Popham)也在提醒学生要关注伦理维度的新问题。接着,课程实施的过程开始容纳进入课程评价的眼帘。斯克里文的《应答性评价》(Responsive Evaluation,1974)、麦克唐纳(McDonald)的《民主的教育》(Democratic Education,1974)、里庇(Rippey)的《交互式评价》(Transactional education,1973)论著发表,这些论著鼓励参与者通过各种表达形式参与到课程改革中来,将课程改革拓展到更广泛的参与层面。

三、重构价值:关注评定的“综合”时代

1973年,评价领域开始成为一个专业研究和测验的领域。教育评价者的计划在20世纪70年代开始凸显,例如专业杂志《教育评价和政策分析》(Educational Evaluation and Policy Analysis)、《评价研究》 (Studies in Evaluation)、《评价和方案计划》(Evaluation and Program Planning)、《评价新闻》(Evaluation News)等陆续产生。专业机构如“五月十二日”(The May 12th Group)、H区域(Division H of AERA)、评价网络(the Evaluation Network)以及评价研究社会(The Evaluation Research Society)专攻评价研究。许多大学也开始设计评价方法的课程(不同于研究方法),例如伊利诺斯州立大学(University of Illinois)、斯坦福大学(Stanford University)、波士顿学院(Boston College)、加利福尼亚大学洛杉矶分校(UCLA)、明尼苏达州立大学(the University of Minnesota)、西密歇根大学(Western Michigan University)。各种形式的专业研究机构开始组建,如UCLA的评价研究中心(Center for the study of evaluation at UCLA)、西北地区教育实验室(Northwest Regional Educational Laboratory)、斯坦福评价联盟(the Stanford Evaluation Consortium)、伊利诺斯州教学研究和课程评价中心(the Center for Instructional Research and Curriculum Evaluation at The University of Illinois)、西密西根大学的评价中心(the Evaluation Center at Western Michigan University)、测验研究中心(the Center for the Study of Testing)、波士顿大学评价和教育政策机构(Evaluation and Educational Policy at Boston College)等。交流会导致各种嘈杂的声音,专业机构之间的合作虽然增多,新的专业组织加强了交流,并降低了评价领域的碎片化。这些机构对评价进行研究,甚至出现了对评价质量进行研究的元研究(meta-evaluation)。学者们在不断寻求适当的方法,增加交流和理解,评价的技术得到发展。

在这个时代,评价者意识到评价技术必满足各种各样的需求,委托人的需求、中心的价值、真实的情况、探究的需要、精确的要求,评价的方法得到了发展,例如,目标游离评价(goal-free evaluation, Scriven,1974,Evers,1980)、支持一对手小组(Adver-sary-advocate teams,Stake & Gjerde,1974)、支持小组(Advocate teams,Reinhard,1972)、元分析(Meta analysis,Glass,1976;Krol,1978)、应答性评价(responsive evaluation,Stake,1975)、自然主义评价(naturalistic evaluation,Guba & Lincoln,1981)等等。此时,更受人青睐的是案例研究(case study),案例分析可以避免破坏其他参与者对潜在事件的透视,它不仅仅作为汇报的方式,更是提供了丰富信息。1980年,12个关心教育评价问题的组织构成了联合委员会,共同了文件《教育方案、计划和资料的评价标准》(The standards for evaluation of educational programs,projects and materials),1981由麦格罗·希尔(McGraw-Hill)出版公司出版。

随着联邦政府对教育领域的渗透,评价开始作为政治的行动,评价者以智囊团的方式存在,努力地为相关的政治社区提供信息。克龙巴赫也将评价纳入了政策的领域,认为评价主要是提供信息、思考和决策的材料。20世纪的最后十年,教育评价已经成为一个成熟的专业领域。不过,专业机构之间的合作虽能很好地用于提升行为和提高评价的质量,实际的评价却很少发生变化;而且,人们需要教导评价者如何获得、尝试、反馈和发展新的评价技术。

四、研究发展的两条路径:反思范式的递进

教育投资体系的变革对评价研究的发展提供了物质基础,评价研究问题领域的成熟带来了评价理论的演进。第一,评价对象不断得到拓展,从单纯学生成就评定到教学过程的评定,以课程领域为例,从课程目标的评价到整个课程改革方案(如CIPP模式,即context,input,process,product)的评价。第二,评价目标从单一到多样,从衡量预期目标的达成,到关注实施过程中的即时目标达成。第三,评价标准多元化,随着对实施过程的重视,实践过程的各种参与者的立场开始被评价者关注,这种参与者的价值渗入影响了评价研究的发展。第四,评价方法的宽容,随着评价对象的拓展、评价目标的多样、评价标准的多元,评价方法也发生了相应的转换,从单一的测量方法,到关注实践历程的人类学方法。

对教育目标的攻击、对教育方案实施过程的反思促动了教育评价的发展路向:首先,针对教育目标本身的攻击去除了所谓的客观价值的假象,教育评价的作用从“证明(prove)”走向了“改进(ireprove)”。如1972年,斯克里文提出的目的游离评价(goal-free evaluation,简称GFE)模式,将评价的重点从“课程计划预期的结果”转向“课程计划实际的结果”。他认为一般评价是为了检测“是否能够达成预先存在的目标”,从而忽略了那些积极的非预期的结果。在他看来,评价的原则应该是“有效的结果”而非“目标”,为此评价者必须意识到所有的结果,还要创建一个被评价对象的档案袋。“空白课程”的提出者艾斯特在《教育的想象》一书中提出要以“表现性目标(the expressive objectives)”为标准,进行“启示性评价(illuminative evaluation)”。

其次,为了促进方案的改进,教育评价的对象发生了变化:以课程领域为例,必须针对课程研制的全面过程采取考察。就将课程实施的背景(context)、过程(process)、成果(product)全部纳入评价的范畴,如20世纪60年代的CIPP方案评价模式、60年代后期应用广泛的评价学习中心(Center for the Study of Evaluation,简称CSE)评价模式等。当我们发现课程评价已经转向“教程的决策”、“关于个体的决策”和“行政的调控”的时候,就不得不意识到课程本身所具有的计划性、目的性与组织性。因此,人类学的方法开始作为评价方法的基础,如“应答式评价(responsive)”、“启示性评价(illuminative)”或“案例研究”等。

再次,由于容纳了相当多的评价对象,也就是说将各种时空的人的价值都纳入其中,为此课程的评价标准也发生了变化,从“有效”的功利价值到包含了“生命”原则的伦理价值。故此,人们开始关注课程评价的价值主体、价值主体的需求问题。既然如此,在评价的过程中就需要关注到评价者、被评价者各自的价值立场,注意到评价标准和评价对象之间的匹配,关注到评价手段与评价对象的匹配。现代课程评价研究力图在制定评价标准、收集评价资料、采取评价方法上能够兼顾到更多价值取向。

藉着对评价历史的回顾,我们可以看到直到今天为止,这些变革造就了三个具有差异的评价范式(见图1),每个范式都具有自己的目的、偏好的技术、关注的焦点等等。由此,我们便获得了对研究发展的一种沉思:现代化促使我国的教育研究面临着巨大的危机,我们的学者不得不一边追赶,一边进行着反思,步伐在国际化与本土化之间交替,踉踉跄跄地前进。研究主题的变化代表了一种景况的转变,以及对研究者自身角色和地位的反思。

图1

课程评价范式图解

参考文献:

[1][美]泰勒。课程与教学的基本原理[M].中国台北:桂冠图书有限公司,1981.119.

[2][美]泰勒。怎样评价学习经验的效用[A].施良方译。瞿葆奎。教育评价[C].北京:人民教育出版社,1989.265.

[3]施良方。课程理论——课程的基础、理论与问题[M].北京:教育科学出版社,2000.156.

[4][美]斯塔弗尔比姆。方案评价的CIPP模式[A].陈玉琨译。瞿葆奎。教育评价[C].北京:人民教育出版社,1989. 298.

教育测量与评价论文范文第7篇

关键词:中小学教育;学习质量;测评体系

中图分类号:G632 文献标识码:B 文章编号:1002-7661(2016)10-087-01

前言:现代世界在信息化中进行高速的发展,数学是现代科技产品开发的基础保障,是国家创新建设的重要支柱,也是人才培养的重要方向之一。为了使我国在国际市场中更具竞争力,科技型人才的培养是一项重要工作,而保证科技人才培养的一大重要前提就是保证数学教学的质量。在各个国家的基础教育中,数学都是一门重要的学科。鉴于数学在在未来社会发展中起到的重要作用,二十世纪六十年代初便逐渐出现研究学者致力于数学的研究工作。而我国对数学研究成果相对不完善,需要吸取先进经验进行充实。

一、全美教育进展的评价

1、NAEP的发展

NAEP是全美教育的简称,NAEP的发展要从20世纪60年代说起,美国教育部门针对学生学习质量缺少了解,开展了一项全国范围的周期性研究项目,称之为全美教育进展评价,也就是NAEP。此项目使用多维度的评价框架,详细的描述了学生的学习状况,科学的反映出学生对教学知识的掌握情况。此项研究使全美对学生的学习质量有了初步的了解。到80年代时期,不同地区的要求下,NAEP在各州开展了测评体系[1]。随着NAEP发展逐步成熟,越来越受到各教育部门的重视,不仅如此此项研究在国际教育事业中也引起了极度的重视,1988年国际教育进展评价研究使用NAEP的评价体系,在所参与的6个教学机构进行了教学质量评价。足以见得NAEP教学研究成果的质量。

2、NAEP数学评价系统

NAEP的数学评价系统力图描绘出,全美中小学生数学教学成绩的变化状态。NAEP在1990-2003年这个阶段所使用的评价结构包括了,数学内容、数学能力、数学质量三个方向,其中数学内容所指的是书的性质、运算、测量、代数与函数等等,数学能力所指的是对概念的了解、程序性知识等,数学素质干改了推理、交流与关联。到2005年NAEP的数学评价结构所反映的是最新的课程重点与课程目的[2]。为达到在数学内容与了解做数学的方法上保持平衡的效果。

二、国际学生评价项目的研究

1、PISA的评价体系

PISA的概念是国际经济合作与发展组织所进行的国际学生评价项目。PISA的评价是基于终身学习的理念,所提出的论据是认为数学素养是理解与使用数学的能力,以及数学对人类在未来生活与工作中所起到的作用于良好的判断能力。所以PISA的方向是学生未来的发展,所重视的是学生发展的潜能。不只是倾向于学生对数学课程的掌握程度,与数学教学的目的,而是同时吸收校内的教学内容与校外所学习的元素,关注学生在平时生活中使用的数学能力。

2、PISA的数学评价结构

PISA同样是属于定期的持续的评价项目。第一次的评价测查开始于2000年,参与国家高达30个OECD成员国,此后PISA的进度是每三年进行一次测查。PISA的目标是以一个更开阔的角度对学生进行数学的考察。PISA的基本结构涵盖了三个方面,第一个是数学内容,通过更广泛的意义去理解数学内容,例如定量推理、从属关系等等。第二个是数学过程,所指向的是思考与推理、交流、解决问题等等呢过。第三个是数学情景,所指向的是人的生活、工作、科学关系等想关联的情景。更加开阔了评价的范围。

三、已有研究结论对我国教育评价的启示

1、确定正确评价目标的前提

正确的评价目标属于建设可续评价系统的前提。对于技术数学质量的评价需要以提升教学质量,以及学生数学素质为方向。国内现阶段的数学教育评价对基础数学教育的改革行程了阻碍。现阶段的书序质量评价主要重视的是高难度方向,目标是甄别与选拔服务,在一定程度上屏蔽了评价系统的反馈学生发展的性能。科学性的数学评价系统需要着眼于学生未来的发展,科学的反应学生的学习状态。

2、确保教育评价的科学规范实施

目前已经形成的国际数学研究结论是,客观的研究资料、严格的测查过程是进行成功评价研究的保障。结合研究过程来看,要先保证调查抽样的随机性,对国内中小学生进行测评时,要涵盖各个范围的中小学教学机构,避免抽样调查的不全面性。在进行全面测查前,可进行小范围内的测评,对测查中可能出现的问题进行提前掌握,确保测查的有效进行[3]。测查方式可选择多种渠道,最后在进行测查结果分析时要确保其真实。可靠,在收集测查结果是要细致,测查结果不仅要显示学生的数学学习情况,还应该查看数学素养的发展进程。

结论:国际数学测评的最新理念与测评的最新方式,对我国进行素质教育为中心的教育改革具有一定的启发。我国教育的发展长期以来受制于应试教育的模式,形成的教育发展进度的重要阻碍。在我国教学模式中各类的考试也是在进行学生的测评,若是在测评过程中,加入学生过程测评与数学素养测评则更具现展的意义。对中小学数学测评的研究,可对国际现有的先进研究成果进行借鉴,充分丰富我国中小学数学测评的理论依据,提升教育改的的进度。

参考文献:

[1] 张维忠,孙庆括.我国数学文化与数学教育研究30年的回顾与反思[J].当代教育与文化,2011,02(06):41-48.

教育测量与评价论文范文第8篇

    1964年《劳卫制》改为《青少年体育锻炼标准》,所以,这一阶段应是实行“体育锻炼标准”的起始阶段,但随着“军国民体育”的抬头,1967年底军训课开始逐渐代替了体育课,1971年后军体课正式列入课程表。此时的学校体育评价以学生的军事技能为主。

    1978年实施的《全日制十年制中小学体育教学大纲(试行草案)》首次在考核项目中设置了素质项目,促进了“课课练”在体育教学中的应用,使增强学生体质的目标在体育教学中得到落实,评价领域主要集中在速度运动素质、速度耐力运动素质、爆发力运动素质、力量素质运动技能及力量素质方面,而且把学生体质是否有所增强作为评定学校体育工作成绩的标准,这一评价思想一直影响至今。

    这一阶段由于“文化大革命”十年的影响,真正开展学校体育评价工作的时间较短,也未形成完整的理论体系,评价思想及模式也仅散见于有限的规范性文件当中。总结建国到1978年时期我国学校体育评价工作可以发现,由于全盘苏化、“大跃进”和“文化大革命”的影响,和同时期国外教育评价理论和实践研究快速发展相比,我国的理论研究近乎一片空白。评价的实践工作虽然仅集中在对学生体能的测试方面,但其活动的进行为我国当时学校体育工作的开展作出了不小的贡献,实践经验的积累也为今后理论研究奠定了一定的基础。

    探索创新和快速发展时期(1979年至今)

    在党的十一届三中全会春风的吹拂下,我国迎来了思想的解放、经济的发展、政治的昌明、教育的勃兴、科学的春天,作为教育事业重要组成部分的学校体育工作也逐步走上了健康发展的轨道。伴随着教育改革的不断深入,关于学校体育评价理论的研究也步入了改革创新和快速发展时期,取得了丰硕的成果。

    1第一阶段(1979-2001年)

    这一阶段以1979年教育部等四部委联合召开的扬州会议为主要标志。伴随着改革的进程,学校体育评价理论研究工作也得到了广泛的开展,取得了一些成果,形成了一定理论积累。1975年原国家体委公布的《国家体育锻炼标准》(后经1982年和1990两次修改)、1990年原国家教委颁布《普通高等学校教育评估暂行规定》和国务院1999年颁布的《中共中央国务院关于深化教育改革全面推进素质教育的决定》为学校体育评价理论研究工作提供了指导。

    1.1主要研究成就

    体育测量与评价的研究有所发展,起步较早的是广州体育学院的陈骏良。1982年广州体育学院受教育部的委托,举办了“体育测量”的学习班和学术讨论会。广州体育学院《体育测量与评价》教学小组在陈骏良的主持下,收集、分析研究国外研究成果的基础上,提出了《体育测量与评价》较为完整的内容体系表。该教学小组还结合我国体育师资培养的现实需要,分析了我国体育院系开设《体育测量与评价》课程的意义,提出了在我国如何开展该课程的具体设想,为形成我国自己的《体育测量与评价》奠定了基础。

    产生了一些有较高学习和应用价值的专着。较早的研究成果是邢文华等1983年编着出版的《中小学生体质测定与评价》和1985年出版的《体育测量与评价》;1987年赵秋蓉等编着的《体育测量评价》出版;1987年陈骏良主编,国内第一本经国家教委审定的《体育测量学基础》教材出版,1991年其又编译了《体育测量与评价》,把国外学校先进的体育评价理论引进到了我国,对我国这方面的研究提供了参考;1995年全国体育学院教材委员会编着了《体育测量评价》,成为我国体育院系学生的正式教材,为我国培养学校体育评价理论研究和实践人才作出了巨大贡献。

    这一阶段研究领域逐渐扩大,涉及到学生、教师活动、学校体育管理等多个方面;评价方法的研究得到重视,对学生评价的具体步骤和方法已有较详细的设计,有数十位专家学者设计了各种评价指标体系和具体的评价方法;模糊数学评判法受到了广泛的关注;提出了目标评价模式,华东师范大学的张争鸣认为“要进行学校体育评价,必须探讨如何制定合理的、可行的、可测的、可靠的学校体育目标体系。”他同时提出了“必须以定性描述为基础,采用定性评价与定量评价相结合”的观点,这些观点至今仍是我国教育评价理论和实践研究的重点。

    1.2研究特点该阶段评价方法研究较多,对于学校体育在实践

    中应采取什么类型的评价形式研究较少。譬如应采取相对评价还是绝对评价,抑或是个体内差异评价;对学生、教师应采用过程性评价还是终结性评价,这方面的基础理论研究明显不足。仅有刘永东、王剑君提出“体育成绩的评定应着眼于教学开始与结束时成绩的变化上,利用进步分评价体育成绩不仅可能,而且必要”。

    他们建立了进步分评价常模,并建议采取个体内差异形式对学生进行评价。这一阶段关于学校体育评价的研究取得了很多有价值的成果,其中对学校体育评价理论的发展进行了有意的探索,对当时高校体育工作起到了极大的促进作用。但随着研究的深入,有些学者已经注意到有些观念和具体评价方法已不能适应现代教育的发展要求,譬如林永森就对当时的体育效果评价提出了“身体素质检测不确定性、赋值评价分值安排难求合理和评价体系忽视了课外活动的内容”3个方面的质疑,并提出了建立合理体育效果评价的新思路。

    2第二阶段(2002年至今)

    2002年教育部制定了《全国普通高等学校体育课程教学指导纲要》,确定体育课程评价包括对学生的学习、教师的教学和课程建设等3个方面,并分别就这3个方面的评价内容给予了原则性规定。同年又颁布了《教育部关于积极推进中小学评价与考试制度改革的通知》,对中小学评价与考试制度改革的原则做了详细的规定。

    2.1主要研究成就

    产生了一些新的学校体育评价理论,研究更加全面和深入。李建军编着的《新课程的学校体育评价》以“体育与健康课程评价”为主要研究内容,明确提出了发展性和“主体取向”的学校体育评价思想,为我国学校体育评价研究提供了新的思路。姚蕾和杨铁黎所着《中小学体育教学评价的基本理论与实践》关注了学生体育态度的评价,认为“通过对体育态度的测量,可以检验体育教学大纲的内容和教学方法对学生情感究竟有什么样的影响,为改进体育教学方法,提高教学效果提供较为客观的理论依据。”并对学生体育态度评价的具体方法进行了分析。

    四川大学体育学院的张超慧等编着的《学校体育评价》不仅对学校体育评价从理论上进行了深入的分析,而且介绍了评价实践的一些具体方法。对元评价的研究受到重视,建立了一定的元评价量化分析模型。金红珍在分析教学评价元评价的内涵和意义基础上提出了体育教学评价信度和效度的量化分析模型。杨军等人所着《学校体育评价理论与实践》一书,不仅对国内外关于学校体育评价现状进行了阐述,确立了学校体育评价的理论基础,并且对学校评价、体育教师评价和学生评价方法进行了详细的分析。

    这一阶段的研究把统计学、数学模型、心理学等其他学科知识应用到学校体育评价中来,出现了一些对国外学校体育评价的研究成果。张建华、杨铁黎、殷恒婵通过对美、日两国体育教学评价的改革和发展现状的比较研究,了解到国外体育教学评价的共同发展趋势是“重视过程性评价和个性评价、评价内容多元化、评价方法和工具多样化、强调定性与定量化评价相结合”,对我国体育教学评价改革有重要的启示作用。

    该阶段提出了发展性评价理论,有不少学者对自我评价、形成性评价、多元评价体系进行了理论研究,并构建了多种评价指标体系,如张京生等人在2002至2003运用发展性评价理论进行了体育学习行为和效果的跟踪试验,验证了发展性评价对学生体育学习与学习效果的积极影响。杨军、闫建华等人在发展性评价理论基础上把质性评价引入体育教师评价,构建了质性评价和量化评价相结合的多元主体参与的体育教师业务能力评价体系,使评价更全面,更有利于教师的专业发展和业务能力的提高。

    2.2研究特点

    高校体育评价研究更加深入,关于中小学校体育评价也受到重视。伴随着基础教育课程改革的深入和推广以及国家对中小学评价制度改革提出的要求,这一时期关于中小学体育评价的研究热情空前的高涨,产生了大量有影响的研究成果。

    研究领域更加广泛,涉及到了学生体育学习行为和态度、体育考核、课余训练及学校体育工作的各个方面,对体育教师综合素质的评价研究受到了关注。

    开始对现行评价体系进行反思和改革,随着教育评价理论的发展和“健康第一”思想的提出,过去学校体育评价理论中的一些观点和方法已不再适应时代的要求,不少学者在研究先进评价理论的基础上,分析了我国过去学校体育评价体系的不足,提出了一些好的改革意见,构建了不少新的评价体系。如陈玉清、李汉超从“以人为本”理念的角度,对高校公共体育课的教学评价进行了研究,提出了更新观念、建立创新评价体系的思路和建议。

    反思与展望

    1对我国学校体育评价研究的反思

教育测量与评价论文范文第9篇

关键词: 爱国主义教育 监测与评价模式 意义 原则 运行

新的历史时期使高校爱国主义教育面临新的挑战,出现新的问题,这就对新时期高校的爱国主义教育提出了新的更高要求,赋予其新的内容与时代特征。为了适应这种新挑战,解决出现的新问题,爱国主义教育者必须首先解放自己的思想、实事求是,变革已经不能很好地适应当今时代特征和实践要求的传统爱国主义思想观念,结合“90后”大学生爱国主义教育面临的新问题和传统教育的经验,树立爱国主义教育的新理念,明确爱国主义教育的原则,既要积极有效地探索加强“90后”大学生爱国主义教育的方法和途径,又迫切需要建立科学、全面、公正的爱国主义教育监测与评价模式进行保驾护航。

一、建立监测与评价模式的意义

(一)建立监测与评价模式是高校加强和改进“90后”大学生爱国主义教育的需要。爱国主义教育是一项具有战略意义的基础性工程。它是基础,是面向全社会、全民族、全国人民的教育,是提高民族素质和加强社会主义物质文明和精神文明建设的基础性工程。爱国主义能极大地调动全民族的力量,增强民族凝聚力,形成全民族的最大合力,推动社会主义现代化建设;爱国主义能够激发每一个人的爱国热情,唤起人们和祖国同呼吸共命运的爱国情怀,使人们为祖国取得的每一个重要成就感到欢欣鼓舞,为国家碰到的灾难和人民受到的损害而伤心忧虑。我国党和政府长期以来都十分关注大学生爱国主义教育工作,推出了一系列举措,各高校也相应地采取了一定措施,对爱国主义教育进行监测的过程,实质上是推动高校提高爱国主义教育质量和效率的过程。

(二)建立监测与评价模式是弥补爱国主义教育不足的需要。我国高校长期以来在爱国主义教育方面偏重于在课堂上对学生的正面灌输教育和日常生活中的严格管理,只关注教师在教学方面的质量如何和学生考试的成绩高低。单纯的衡量标准虽然对教学质量起到了促进作用,但是对于爱国主义教育的真实效果如何却没有一个完善的监测与评价标准。因此建立爱国主义教育的监测与评价模式是促进爱国主义教育全面发展的必然。

(三)建立监测与评价模式是“90后”大学生特点的必然要求。从当前的情况来看,一是“90后”大学生对待爱国主义教育存在模糊性,对待爱国主义教育在态度上存在偏差;二是“90后”大学生的多元性特征导致其爱国主义价值取向削弱,良好的成长经历导致其爱国主义意识淡薄;三是大学爱国主义教育存在着内容缺乏时代性,理论缺乏创新,教育对象缺乏连续性、长期性和针对性,教育方法直接且过于单调等问题。“90后”大学生本身处在一个思想不断发展成熟的时期,承受巨大的学业、心理和就业压力,极易受到外来思想的侵蚀,这就更加迫切需要加强以爱国主义为核心的民族精神和以改革创新为核心的时代精神教育。也迫切需要建立爱国主义教育的监测与评价模式推动高校改革原有的爱国主义教育体系,使之更好地适应“90后”大学生的需要。

二、构建监测与评价模式的原则

(一)坚持社会主义原则。思想政治教育工作需完全服从于政党和阶级的需要,体现了政党和阶级利益。因此在对爱国主义教育进行的监测和评价的过程中要按照无产阶级的立场、观点、方法和党的社会主义初级阶段基本路线对照爱国主义教育工作,坚持用科学的、发展的眼光制定相应的监测和评价模式,同时应结合90后大学生中存在的错误思潮进行批判,帮助学生树立正确的爱国主义思想。

(二)坚持实事求是的原则。新时期的大学生对于新思想、新事物的接受能力非常快,爱国主义教育工作也不能脱离实际情况,要做到理论联系实际。同样作为爱国主义教育重要一环的监测与评价工作也要坚持实事求是的原则,掌握实际情况,了解实际效果,作出实事求是的判断和分析。其根本是为了实实在在地推进爱国主义教育工作,使其能取得显著的效果。

(三)坚持针对性的原则。高校爱国主义教育的监测和评价必须针对爱国主义教育的目标和要求,无论对爱国主义教育的内容、方法还是实现途径,以及实际效果都要契合爱国主义教育的根本目的。此外,由于“90后”大学生的不同特点,要充分考虑到他们不同的成长环境、不同的思想状况和不同的文化背景,同时他们的接受能力和思考能力也已大大超过前人。因此,要始终坚持以学生为本,在进行监测与评价的时候要根据不同层次的学生制定不同的标准,不能以偏概全、以点概面。

(四)坚持系统性原则。高校爱国主义教育的过程是一个规范的系统性过程,这就决定了高校爱国主义教育的监测与评价具有突出的系统性特征。它要求高校爱国主义教育的监测与评价工作立足于全面把握,从整体上真实反映学校爱国主义教育的基本情况与成效。同时要求学校内部各行政机构、教学、教辅部门及各基层院系都明确责任,层次分明,管理有序,各部门做到分工明确,协同合作,做到各个环节紧密相连,环环紧扣,形成爱国主义教育的合力,充分发挥教育、管理这两大要素在爱国主义教育这一系统工作中的巨大作用。

(五)坚持动态性的原则。建立爱国主义的监测与评价模式一方面要充分继承和发扬我国监测公正、评价客观的优良传统,同时充分汲取国外在此领域内的先进经验和优秀的成果,把它们和我国高校爱国主义教育的实际相结合。另一方面时代的发展及互联网的普及应用使爱国主义教育处于不断发展和完善的过程,其教育效果也是一个逐步显现和不断强化的过程,这就决定了爱国主义教育的监测与评价的内容、方式方法要经常性地根据客观条件和具体情况的变化而变化。只有坚持这种动态的变化才能准确及时地反映出高校爱国主义教育的变化和发展。

三、监测与评价模式的运行

(一)明确组织领导机构。设立校级领导机构,建议各高校党委成立由校领导为主要负责人,教务处、学生工作部等部门负责同志,以及各二级学院分管学生工作的党委(总支)书记共同参与的一个直属于高校党委领导的爱国主义教育监测与评价领导小组,负责全校的爱国主义教育监测与评估工作。具体由教务处主导教学监测系统和教学评估系统,校学生工作部主导管理监测系统和管理评估系统,相关职能部门和各二级学院一起协助做好管理监测和评估系统。此外还应建立健全机构的相关管理制度和绩效考核标准。

(二)进行逐阶分级式的监测与评价。“90后”大学生的爱国主义教育是一个具有高度整体性和系统性的工作,它需要学校党委、行政把它作为一个全局性的问题进行考虑和布局,它不是某一个部门或者某一位老师能够组织和实施的。高校应结合“90后”大学生的特点,构建具有现代爱国主义教育特色的监测与评价体系。该体系分为两个主系统,分别是教育系统和管理系统。

1.教育系统。由学校教务处主导,相关的职能部门例如教学设备处、现代教育中心、评估中心等教辅部门协助管理,下设教育监测系统和教学评价系统。其监测与评估的内容主要包括两方面:一是施教者的主体状况,包括他们的政治素质、人格素质和理论修养;二是受教者个人的思想品德情况及受教群体的思想品德的状况。目前各高校的教育评价系统已经相对比较完善,国家也专门进行本科教学水平合格(审核)评估促进高校不断改进教学,完善教学评估。对于教学监测系统,主要包括教学前的准备监测、教学过程监测和教学效果监测与信息反馈三部分职能,由于目前高校职能部门人手有限,往往对于教学监测都是通过教案检查、督导组听课、学生评教等方式进行。

2.管理系统。由校学生工作部主导,相关职能部门例如团委、招生就业处等部门协助管理,下设管理监测系统和管理评价系统。管理监测系统主要通过二级学院进行,以各学院的学生科、团总支为基础,通过辅导员和学生组织对党团组织活动开展情况,学生会和学生社团开展活动情况,校园文化建设情况,以及社会实践活动开展情况进行监测。管理评价系统则通过学生对辅导员和班主任的测评、对学生活动的参与程度、对学生干部的拥护程度等方面进行评价。

3.两个主系统的地位与关系。在系统论的构建原理下,教育系统和管理系统都处于同等重要的地位。学生爱国主义教育监测与评价领导小组可以通过构建这两个系统对学生的理论、实践及评价进行有机整合,两个主系统下的子系统一旦出现问题就可以及时得到协调和解决。

四、监测与评价的结果反馈

对爱国主义教育工作进行监测和评价的最终落脚点是增强爱国主义教育的效果。因此将监测和评价的最终结果对监测和评价的主体和客体进行反馈,促进他们不断进步显得尤为重要。监测和评价必须有结果,不能有头无尾,只有过程,没有结论。如果只有监测和评价的过程而没有结果的反馈,那么整个监测与评价体系的构建也就失去了意义。

对于监测与评价的结果,应当采用恰当的方式表现出来。可以采用评语、等级、数量或者综合以上的表现方式。但是无论采用哪种方式都必须把结果反馈给被评价单位和被评价者。反馈的过程中应当注意方式和方法,可以采用集体讲评、个别谈话的方式,一方面保护了被评价者的隐私,另一方面实现了反馈过程中的思想沟通。在整个反馈中应以表扬为主,批评为辅,重要的不是将被评价人一棒子打死,而是让他通过评价反馈找出不足,寻求解决之道。最终把爱国主义教育的工作提高到新的水平。

爱国主义教育的监测与评价是一个系统的工程,可以对爱国主义教育的效果作出更加真实可信的结论,对于帮助和改善高校“90后”大学生爱国主义教育工作具有非常重要的理论意义和现实意义,值得更多的思想政治教育者关注和研究。

参考文献:

[1]梁建桃.高校大学生健康教育实施监测与评价的研究[J].武汉体育学院学报,2007(9).

[2]乔琳.高校政治理论课教学效果双层监测系统的构建探析[J].中国高等教育评估,2008(4).

教育测量与评价论文范文第10篇

关键词:科技教育经济社会;计量计价;基础理论:方法

社会有关部门都是自成体系的复杂系统,对这些系统的计量评价早已普遍展开,并出现了一大批评价机构与人员,出版了大量的论文著作,但由于缺乏应有的理论基础与依据,也存在不少问题。本文力图从计量评价原理这个根本性的问题人手进行初步探讨。

1 科技教育经济社会的计量评价理论

科技教育经济社会计量评价原理研究的由来与基础有以下几点。

1.1 计量评价的地位和重要性

社会经济领域的理论多种多样,而笔者在对科技教育经济社会的计量研究中发现,整个社会科学乃至自然科学讨论的客观对象,无非是揭示事物与事物之间的关系。这些被揭示的数量关系可以归结为三大类。

一是事物与事物之间的大小多少强弱相比较而得出的指标值的关系,是某阶段不同事物发展状态的指标比较关系。

二是事物自身随着时间的推移而形成的非因果性时序关系,即人们常说的历史规律的计量表述。

三是事物与事物之间在运动变化中的相关关系与因果关系是最复杂的关系,也是讨论得最多,在理论体系中占比重最大的科学。

所有的基础理论科学(不包括技术与方法性科学)所讨论的计量分析内容都没有超出这三者的范围,任何一个学科都是研究这三大关系中的某一部分内容。这三大关系都可以用数学方法表述出来。

计量评价要讨论的是第一种关系,即已经给出评价对象的数量多少、规模大小、水平高低、能力强弱、影响大少、发展速度快慢等等一些条件。它是研究客观世界的三大关系之一。

在这三大关系研究中,事物的计量评价关系研究是基础。因为事物的时序关系(历史规律)是事物状态(计量关系)的变化过程与变化规律,通过状态数据的变化体现出来,没有事物在各个时点上的状态数据,便无法定量讨论事物发展的过程与规律。事物的相关关系与因果关系的定量分析也要建立在统计评价数据的基础上,没有数据作基础的相关分析,因果分析就成了无源之水。需要说明的是因果关系与相关关系两者之间只是程度上的差别,因为相关关系也是部分程度的因果关系。

由此可见,我们要进行规律分析、相关分析、因果分析,必须先了解不同事物的各自状态,从各自状态在相互运动中发生的变化,来分析他们之间的连带关系。如果各个事物的状态数据都没有,便不能分析事物之间的因果关系与相关关系。因此,事物的状态计量与评价是关于事物的一切分析的基础,没有事物的状态计量就没有其他定量分析,可见其地位是多么重要。

1.2 计量评价的历史现状与需要解决的几个问题

正因为社会领域的计量评价如此重要,所以这方面的探索有着较长的历史、较多的成果、较大的规模。美国早在20世纪初就成立国会服务部(CRS),直接针对各委员会及议员们提出的各类问题进行研究分析与评价,而其中与科技有关的分析与评估即可认为是评估的雏形。经过近百年的发展,该项工作在美国已成为制度化、经常化的工作,并建立了科技教育经济社会评价支持系统。其它一些国家如法国、德国、加拿大、日本、丹麦开始于20世纪的40-60年代:瑞士、瑞典、英国、澳大利亚、韩国开始于20世纪80年代;西班牙、新西兰、泰国开始于20世纪90年代。其中基本效仿美国开展科技教育评价活动的国家有瑞典、德国、丹麦、荷兰、澳大利亚;部分借鉴美国科技教育经济社会评估的国家有瑞士、匈牙利、墨西哥、俄罗斯等。日本的科技教育经济社会评价开始于20世纪40年代的日本科技审议制度,到90年代已形成了完善的开放型研究评价体制,增加了科技教育经济社会评估的透明性、公开性,使科技教育经济社会的评价发展到了一个新的阶段。

现在世界各国对科技教育经济社会的计量评价都已形成了自己的方法与步骤。由定性分析转向以定性分析为基础,定量分析为手段,采用定性与定量相结合的方法,也有以定性分析为主的国家。美国、法国、日本等国家的评价采用定性与定量相结合的方法,英国、瑞士的评价以定性为主,瑞典基本上是定性分析。

科技教育经济社会评价已形成了一个庞大的组织机构体系。概括起来这些机构已有两种属性(政府性的和非政府性的)和三个层次(部级、地方或省级、科研院所高校级)。由于各国从事科技教育经济社会计量评价的历史背景不同等诸多原因,组织机构的设置和作用也有所差别,美国、法国、英国、澳大利亚、马来西亚等国家的评价组织机构的设置都相当健全,两种属性和三个层次的机构并存,所不同的是日本高层的评价机构较多,欧美则较少。

科技教育经济社会计量评价至今还存在不少问题,其中有些还是根本性的,非解决不可的问题。主要表现在缺少系统的科技教育经济社会计量评价的理论基础;评价的主观性、经验性太强,而科学性太差;评价的组织者不规范;评价的内容较紊乱;评价的数据源多种多样;评价的方式参差不齐等方面。

1.3 科技教育经济社会计量评价理论的构成

社会计量系统评价基础理论体系的构建是一个重要问题,方法研究较多,对基本原理的研究较少。因此,构建计量评价学的基础理论体系还不成熟;但与评价相关的统计学、数量经济学等学科则较成熟。笔者提出以下观点。

1.3.1 科技计量评价理论由总论与各论两部分构成

总论包括两大块理论,即各种评价都需要运用的最基本的四大评价指标(数量指标、质量指标、效益指标与综合指标)理论和评价过程中的四大关键环节。即指标选择、指数分类、指标建模、结果检验的数学规则与方法。

各论是把基本指标用于特定对象的评价。在总论中我们用四大指标基本覆盖了科技教育经济社会评价中的全部内容,在各论中,有多少评价对象,就有多少种评价。各论的计量评价方法体系要庞杂得多,但它们都离不开对四大基本指标的运用。现把各论分为两大块,①特定对象评价,包括:区域评价(一个省、一个市等的某一方面评价或几个方面的综合评价)、部门评价(如工业评价、农业评价、教育评价等)、单位评价(如对一个企业、一个学校、一个医院等单位的评价)、工作要素评价(如职工队伍评价、经济状态评价等)。②工作方面评价,包括工作水平评价、工作质量评价、创新程度评价等。

总之,各论中的各种评价都是运用总论的理论

与方法,结合实际进行的评价是应用性评价。

1.3.2 科技教育经济社会计量评价的四大基本指标的内在联系

科技教育经济社会的所有评价指标都可以按从简单到复杂的依次包含关系分为四个等级(或叫四类),每个等级(每类)又包含一些子指标。如图1所示。

科技教育经济社会的评价也好,测算也罢,所有指标都包含在以上四类指标之内,它们四者构成了层次分明、相互联系、指标繁多的体系,覆盖了评价领域的各个方面。

数量指标是直接从测算对象数出来的与量出来的单个指标。如一个地方的生产总值、国民收入、科技人员数、科技经费数、科技成果数等。

质量指标是由两个以上数量指标而体现的,在数量指标的基础上得出一定规模的地方与单位的活动效果水平的大小,质量指标包含了数量指标,如人均生产总值、人均收入、科技人员的人均受教育年数、人均科研经费等等。由效能指标、功能系数、标高分析等方法解得的数据也是由两个以上数量指标结合计算而来的。

效益指标是数量指标、质量指标与成本的关系的体现。效益指标既包含了数量指标与质量指标,又增添了成本指标,因而更复杂。

综合指标是近些年讨论最多的。但又是不明确的指标,现在看来它是由数量指标、质量指标、效益指标、能力指标等四者所构成,并经复杂计算而得的指标。

由以上可见,各指标的关系是从简单到复杂的关系,是依次构成和包含而不可替代的关系。

1.3.3 提出科技教育经济社会计量评价的四大环节的基本方法与处置原则

即评价指标选择的原理方法,评价指标分类的原理方法,评价指标组合建模的原理方法,评价指标结果的诊断方法原理。

2 科技教育经济社会四大基本指标测评的数学原理

笔者认为对科技教育经济社会系统四大基本指标的评价,总的指导思想是远离主观意识,贴近客观自然,在具体研究上找出科学的测度方法和计算方法,用科学方法代替经验方法。具体的创新性思考如下。

2.1 科技教育经济社会数量指标评价的科学原理

科技教育经济社会的数量指标是整个评价指标的基础,其他三种指标都是在此基础上繁衍出来的。数量指标本身多种多样,有直观的、有潜在的、有明确的、有模糊的。对于明确直观的数据,直接统计即可,如人口数、生产总值等;对于间接的、潜在的数据,可以通过特定的测度方式或特定的数学转换方式把它测定出来,如统计学上的定类尺度、定序尺度、定距尺度、定比尺度就很好地解决了一些问题。

对于模糊不清的数量指标,一直是不能不面对的难题。过去大多采用人为的划等级赋值的方法处理,现有不少人提出用模糊数学的方法解决。但评价实践中很少有人运用这种方法,原因是计算太复杂,不适用,要求实际测评者有深厚的数学功底。

笔者提出运用隶属函数和模糊判别的方法进行简化,得出步骤清晰明显的处理方法。

①隶属函数的模糊事物截距方法。首先要明确两种不确定性,即评价对象论域U到[0,1]上的映射是反映客观事物的复杂性,而概率论中从事件集合到[0,1]上是反映客观事物的随机性,但两者都具有不确定性。隶属函数的方法就是在复杂的不确定性事物的[0,1]范围中,找出其临界值,在之上为1,在之下为0,使不确定的模糊数字变成了精确的定量的概念。

②模糊识别与科技教育经济社会的数据测度方法。评价对象的某些数量特征模糊。有明显层级性,但无精确数据,如人的能力大小、水平高低等。要转化为精确数据,运用模糊识别的方法,通过建立模糊向量及其内积外积、笛卡儿乘积、贴近度等途径,采用最大隶属原则、择近原则等方法抽取事物的数量指标。

③理顺了不同的繁多的数量指标,并进行分类构建。首先分为总量指标、相对指标、平均指标、内在差别指标等四类,每类再细分,由此形成体系。

2.2 科技教育经济社会质量指标的评价原理

科技教育经济社会质量指标是测度其评价对象内部和不同评价对象之间的能力价值内涵的指标,它是由两个有联系的数量指标进行对比而产生的。另外,两个有联系的质量指标对比也产生新的质量指标。把物体的变量(数量指标)与体积(数量指标)对比得出比重(质量数据):把受不同教育程度的人(质量指标)与相应人口数(数量指标)对比得出人口文化程度构成的质量指标,质量指标的高低与总体范围与规模没有直接关系。对质量指标的测度有直接测评法,如衡量论文著作质量被引频率的测度、单位生产水平的无量细化测度。

因为现在评价质量指标最常用的方法还是数量指标乘权重。过去的权数多为主观赋给的,现在要运用相对客观的数学方法。目前常用的有质量指标权数的模糊评价法、质量指标权数的模糊关系方程计算法、质量指标权数的矩阵向量评价法。

通过直接测度法、无量纲化测度法、权数评价数学法等方法,基本上能给出有理论基础的、科学的、相对客观的评价方法。

2.3 科技教育经济社会效益指标的评价原理

在科技教育经济社会计量评价中,明确了效益指标的内涵。它与质量指标相比有共性也有差别,共性是两者都表征着评价对象所达到的水平与能力,不同的是质量指标只考虑评价对象所达到的整体水平与整体能力,而不考虑成本和投入,不考虑总成本与总收入的关系。近些年关于大学评价与排序,绝大多数评价者只考虑了各高校在本、专科教育上所达到的相关产出指标与拥有量,即各高校在论文、著作、科研立项、获奖等达到的指标,不考虑政府与社会对各高校在投入量上的差别,所以这只是一般的质量指标评价,而不是效益指标评价。效益指标是考虑投入的,要把投入与产出联系起来分析。

科技教育经济社会效益指标的计算方法,总的指导思想同样是尽量避免主观感性的定量分析,采用具备科学性的全面定量的评价方法。目前运用的方法有效益指标的直接比较计量方法、多因素简易计算法、量本利分析方法、拓扑分析方法、数据包络分析法,这些方法在文献中都有详细的讨论。通过这些方法对科技教育经济社会进行的评价既全面系统又较为彻底。特别是社会科技教育经济社会的拓扑分析方法是《科技教育经济社会计量评价原理》一书中首创的分析方法,它包括了从一因一果到多因一果,再到多因多果的分析方法,从线性变化关系到非线性变化关系的分析方法。从正常时期到非正常转化时期的投入产出分析方法。同时还都给出了详细的计算模型与检验方法。从这些模型特点出发,推论出了科技教育经济社会的关系和影响机制。

2.4 科技教育经济社会综合指标的评价原理

科技教育经济社会综合评价的指标叫综合指

标。综合评价是用得最多,而评价的主观性太强。为了在综合评价中把主观经验性评价转变为科学客观性评价,笔者首先把综合指标看成由数量指标、质量指标、效益指标、能力指标(也可把能力指标列入质量指标)四者所构成的综合体系。

①列出科技教育经济社会综合指标体系。该体系分为四大部分,即社会发展指标体系、教育发展指标体系、经济发展指标体系、科技发展指标体系。这是一级指标,还可从中划分出二级指标和三级指标。

②科技教育经济社会综合指标的功能系数评价法,即运用功能系数评价科技教育经济社会的综合指标的方法,这是一套相对系统的方法。

③科技教育经济社会综合指标的模糊聚类评价方法,包括明确二元模糊关系等概念。

④科技教育经济社会综合指标联合概率评价法,也是《科技教育经济社会的计量评价原理》一书中首次提出的方法,即把各分子都看成各自的概率指标(各指标都有不确定性),各子系统的概率指标之间的关系我们称其为联合概率关系,这些都可以用数据表达出来,也可以用概率的方法计算总体结果。

3 科技教育经济社会评价的四大环节的处置规则

在科技教育经济社会评价过程中,有四大基本环节,这都是评价中的根本性问题,包括评价指标的选择标准和分类问题、各评价指标之间在构成数学模型时的方法原则问题、评价结果的检验问题等。能否提出科学的数学方法对此予以解决,本文提出了一些新的思路与系统性方法。

3.1 科技教育经济社会计量评价指标选择的数学方法与原则

在科技教育经济社会的计量评价中,往往有许多的相关指标,有的直接,有的间接;有的作用程度大,有的作用程度小。在评价中收集采用的指标越多,所得结果越准确,但计算的工作量则越大。如何既把主要指标不遗漏地收集进来,又把作用稍次的指标放弃,这就需要对指标进行科学的选择。在该领域用得最多的是温伯格的科学评价指标选择准则。基本要点如下。

①要回答的问题:开展哪些研究是更合适的?该领域科学家的研究能力如何?

②外部准则:包括技术价值、科学价值、社会价值。根据其价值大小,确定临界值进行选择。

③内部准则:包括研究方向选择的正确与否:研究主体的研究能力如何?技术研究本身所达到的高度如何?

根据以上几个方面给出的指标,采用数学方法得出评价标准,进行判断选择。

3.2 科技教育经济社会评价指标分类的依据与方法

科技教育经济社会评价指标的分类,过去是凭主观经验进行,现在要用数学方法依据事物间的相似性作为类层划分准则对评价指标进行区分和分类。因此,属于无监督分类的范畴,在分类过程中人们必须先给出一个分类标准,分类分析能够从样本数据出发,自动进行分类。分类分析所使用的方法不同,常常会得到不同的结论;不同研究者对于同一组数据进行分类分析,所得分类数据也未必一致。

①层次分类及Q型聚类与R型聚类。层次分类是根据评价指标之间的亲疏程度,将最相似的对象归类在一起,以逐次归类的方式将评价指标分类。直到最后所有样本都聚合成类,分为Q型聚类与R型聚类两种形式。前者使具有共同特点的样本归在一起,以区分不同类的样本,后者是将具有共同特征的变量聚在一起,以便从不同类中分别选出具有代表性的变量作分析,从而减少分析变量的个数。

②指标的相似程度测量。有一个测度方法,即对一群有待分类的指标标志值用P个变量描述,则每个样本点可以看成是R空间中的一个点。因此在数学上可以用“距离”来测度标志值之间的相似程度,即最短距离法与最长距离法。

3.3 科技经济评价指标的综合建模方法与规则

科技教育经济社会的评价过程始终离不开建模,将复杂样本的模糊数据转化为精确数据,要建模测算。将不同数量指标转化为质量指标,将数量指标与质量指标转化为效益指标。将数量指标、质量指标、效益指标等概括为综合指标,每一步都离不开建模测算。建模是根据评价目标、各指标之间的关系来构建的。在数学上建模有以下基本规则。

①加法规则:根据评价的需要与数据的可能,采取直接相加或加权平均等方法测算的基本规则。

其中各项指标可以线性地互补,一项指标得分低,哪怕为0,其他指标得分高。其总评价值仍较高。

②乘法规则:有自己的建模测算方法,这种方法主要应用于要求各项指标都取得较好的水平才能使总的评价较高,只要有一个指标低,总分就低。如有一个指标为0,不管其他指标多高,总分便为0。

③其他规则:除上述两种常用规则外,还有比率法、乘除法、功能系数法、主次兼顾法、指标规划法、指标分层法等,各自都有自己的建模规则与适用范围。

3.4 科技教育经济社会评价结果的检验与控制

教育测量与评价论文范文第11篇

[关键词]教育统计;德育评价;品德测评法

[作者简介]易瑞洁,长江大学政法学院助理研究员,湖北荆州434104

[中图分类号]C41

[文献标识码]A

[文章编号]1672―2728(2006)11―0207-03

如何科学地评价德育工作及其质量,这是一个世界性的难题。虽然我国在德育学科的研究上取得了世界瞩目的成就,但德育评价方面的研究却十分缺少。德育作为一种塑造学生心灵、建设社会主义精神文明的系统工程,必然要求科学的德育评价作为其信息反馈的手段,而教育统计方法的应用,正是适应了这一要求,使德育评价又有了一个科学手段。

一、德育评价和品德测评

德育评价是人们依据一定的评价标准,通过科学的方法和正确的途径,多方面收集适合的事实性材料,对德育活动及其效果的价值作出判断的过程。在德育评价及其研究中,要特别重视德育质量的评价。目前所进行的德育评价,大多属于德育工作的评价,由于德育过程的复杂性和长期性,对德育工作进行评价是必要的,但德育评价中更为重要的是德育质量的评价,德育工作评价本身不能代替德育质量的评价。在德育质量的评价中,要以学生品德评价为主,这是因为德育质量主要体现在学生品德水平的提高上。德育质量评价的难点与关键点也在于对学生品德的科学评价――品德测评。

品德测评是品德测量与评价的总称。这个总称并不是“测量”与“评价”两个概念的机械相加,而是指一种建立在对德育信息“测”与“量”基础上的分析判断,它实质上就是统计分析的过程。在这个过程中,测评者通过“测”与“量”的活动,获得所要收集的品德特征信息,然后进行比较,以求得认识。这里的认识不是仅凭个体的感性经验,而是积极地借助教育统计进行分析,把最终的比较与判断建立在客观事实的收集、测量和分析上,并且把分析判断的结果,采用语言和数量的形式,进行定性或定量的转化与解释,由此来反映个体品德发展的客观情况。

二、教育统计及其意义

教育统计是和统计、学校统计既有联系又有区别的不同层次的概念,这是我们必须要弄清楚的问题。

统计,原指总括计算的意思,当它作为科学术语使用时,往往有不同的含义:一指统计资料,把说明社会政治、经济和文化等现象的数字或数据称为统计;二指统计工作,把统计资料的收集、整理、发表和分析等实践活动本身称为统计;三指统计科学,即研究总体现象的数量表现、变化规律及其运用的科学总称。学校统计是教育学与数理统计学相结合的一门交叉学科,是应用统计的分支,它把统计学的方法应用于教育实际工作和教育科学研究,通过数据的分析和处理,以便更准确地掌握教育情况,为探索规律,制定教学方案,检查教育效率,提供一种教育方法。教育统计,即学校教育统计,是针对各级各类学校中教育现象和数量情况,应用数理统计的原理和方法,进行收集、整理、分析和推断,探索教育规律,进行教育决策的教育管理方法。掌握和应用教育统计的知识和技能,对于学校管理、教育科研、教学工作、学生学习等方面都是十分必要的,意义十分重大。

1.教育统计是教育科研活动的基础。现代教育的新观念和新理论的发展往往都需要借助于统计方法,这可以从以下几点来说明:(1)教育统计可以使研究的数据由繁化简。运用分类、列表、图示、计算等统计方法,可以使我们从纷乱庞杂的现象中理出头绪,从个性中看出共性,从特殊上升到一般。(2)教育统计可以从样组统计量推断出普遍的结论。科学研究往往是从已知推出未知,具体地说,是从样组推断总体,教育统计就具有这种功能。(3)教育统计可以帮助我们作预测。比如,我们可以根据学生高中学习成绩和大学入学考试分数来预测该生一年后的学习成绩。当然这种预测不是没有误差的,然而统计方法可以告诉我们误差有多少。(4)教育统计使实验设计更为合理。现代统计作为科学方法论,它已把推断统计与实验设计紧密结合在一起了,因而我们就可以在复杂的教育现象中分析出因果关系。各种教育研究的实验设计与实施实验,均需要用到统计方法。

2.教育统计有助于科学方法的训练。教育统计有描述统计和推断统计。统计推理是一种归纳法的推论,它可以使我们从庞杂的数据中理出可取的信息,学会从客观实际出发,去粗取精、去伪存真、由此及彼、有表及里的科学方法和科学态度。作为教育研究者如能熟悉各种统计推论的方法,也就能用客观的方法来研究教育及各种教育现象。

3.教育统计可以帮助我们了解许多教育研究的成果。在现代教育研究文献中,除教育哲学和教育史外,其他如教育状况的研究、教育测验、教育心理学,都会采用各种统计方法。如果研究者不掌握统计符号、统计基本概念和统计思维方法,就无法阅读有关文献,不能吸取新鲜的成果。

三、教育统计在学生思想品德评定中的应用

目前世界各国,在人才选拔过程中,或是对学生的品德不加考虑,只看智育考试成绩;或是以老师与学校的评语作为依据。由于每个人的价值观不同、评定的重点不同、评定“尺度”和标准不同,因而每个老师或学校所作的品德评定的结果常常会缺乏客观性和可比性,不能为人才选拔提供可靠的依据。为此,笔者认为可以把教育统计方法应用到该领域里,设计出既适合于工作和毕业会考,又适合于人才选拔的FRC品德测评法。

FRC品德测评法是事实报告计算机辅助分析的考核性品德测评法。F是英文词fact(事实)的头一个字母;R是英文词report(报告)的头一个字;C是英文词computer(电脑或计算机)的头一个字母。FRC是事实报告计算机测评法的缩写。其基本思想是:借助计算机分析技术,从学生品德结构要素中确定一些基本要素,再从基本要素中选择一些表征行为或事实,然后要求学生自己就是否具备这些表征行为或事实予以报告。报告的形式既可以是个别谈话,也可以是集体问卷,每个学生所报告的表征行为或事实经过光电信息处理,储存于个人品行信息库里,然后计算机根据专家仿真测评系统对学生报告的表征行为进行分析,作出定性和定量的评定。

这种品德测评法的特点在于它能够克服长期以来学生品德测评因缺乏同一标准、同一测评系统、不客观公正的缺点,使品德评价有了比较客观的依据。

这种品德测评法的步骤程序,即学生个体独立报告表征行为与事实,可以采取个体测评方式,直接通过计算机终端输入;也可以采取集体测评方式,在规定的时间与场合,统一地对所问的各种行为事实予以实事求是的报告。报告的方式是先在问卷上作出选择,然后把所选择的结果用特定的2B铅笔标记在答卷上。

逐张输入学生的答卷卡,进行光电阅读并储存。同时,要求学生干部和老师检查每个同学问卷上的选择,检查答卷是否符合要求。

进行电脑比较判断。当检查卡与答卷卡的结果在误差允许范围内,则进行测评,否则退出,要求机外调查证实与修正。

测评后报告分数、等级与评语,并作出有关专家的诊断与指导建议。可以图示为:

FRC品德测评法的设计,可以把中小学班主任从期末操行评语的困境中解脱出来,不需要再去写一些套话、空话或者做文字变换游戏,只须补充一些学生的突出个性特征与典型事例,使提高品德测评的客观性、建构一种适合大规模选拔考核学生品德的统测统评方法成为可能。通过实验证明,这种品德测评法既便于操作,也具有较高信度,是教育统计与德育评价的有效结合。但这种品德测评法的设计,目前仅仅适用于中小学,它是否适合于大学生,还有待于进一步的研究。

教育测量与评价论文范文第12篇

【关键词】英语专业;测评;高等教育信息化

【作者简介】吴琼(1970.04-),女,汉族,黑龙江哈尔滨人,沈阳师范大学外国语学院教授,硕士学位,研究方向:应用语言学、英语教学;刘昭含(1994.08-),女,满族,辽宁朝阳人,沈阳师范大学外国语言学及应用语言学在读研究生。

一、引言

为了进一步推进新时代教育信息化发展,2018年4月,教育部颁布了《教育信息化2.0行动计划》(以下简称《行动计划》)。《行动计划》将教育信息化作为教育变革的内生变量,支撑和引领教育现代化的发展,推动教育理念的更新和模式变革。在高校英语专业人才培养中,教育信息化已经成为衡量教育教学质量的重要标准之一。因此,树立信息技术与教育教学深度融合的理念,是新的历史时期提高英语专业教育教学质量的需要,也是培养新时代英语专业人才的需要。

测评是教育教学的重要环节,在人才培养过程中起着重要作用。测评对学生学习具有导向作用,学生怎么学,在很大程度上取决于考试怎么考。离开了测试和评价,教学质量便失去了可检测的依据,学习的效果也无从验证。此外,有效的测评会对教师的“教”与学生的“学”产生积极的反拨作用,能够促进教师与学生及时发现教与学过程中的问题,持续改进教学和学习。然而,长期以来,英语专业教育教学改革忽视测评改革的重要性,更多关注的是教学内容、教学方法和教学方式的改革。在高等教育信息化背景下,如何将教育信息技术与英语专业测试改革深度融合,是当今教育教学改革的重要议题之一。

二、英语专业传统测试模式的主要问题

受传统考试观念的影响,高校英语专业测评仍存在以下主要问题:

1.测评形式相对单一,缺乏多样性。目前,高校英语专业测评主要采用期末终结性评价与形成性评价相结合的方式,终结性评价多以闭卷笔试为主,占总评成绩的70%左右,形成性评价主要是针对平时表现的评价,占总评成绩30%左右,由出勤、课堂表现、作业、平时测验等构成。闭卷考试多设置标准答案,教师根据标准答案对学生的答题进行评判。该种形式的测试在一定程度上能够体现考试的公平性,但某种程度上限制了学生的开放性和创造性思维。

2.测评注重语言知识和技能,缺乏创新性。英语专业各门课程测试在很大程度上停留在检测学生的英语语言知识和技能或陈述性知识层面,没有将对语言、内容和思维的考查有机地结合起来。测试往往脱离生活实际,不能有效检测学生应用所学知识解决现实问题的能力。听力、阅读等课程测试多以选择、判断、填空、简述题为主;口语、写作等课程测试多以根据话题进行口头或书面语表达为主;专业知识类课程大多停留在对所学语言学、文学、文化知识进行判断,选择,简答,分析等。长期以来,英语专业学生一直被批评缺乏高阶思维能力,测评内容单一,忽视对思维能力进行考查,是造成英语专业学生思辨能力缺失的原因之一。

3.测评注重结果,缺乏对学生学习的指导性。英语专业测评体系中,终结性评价多占据主导地位,缺乏对学习过程的检测和有效反馈。终结性评价虽然对一个阶段的学习效果具有诊断作用,但因为学生随即进入下一阶段的学习,教师往往忽视对考试结果的深入分析,学生更多关注的是阶段性学习后的测评结果。重结果的测评方式不能很好地起到以考促学的作用,缺乏对学生学习过程的有效指导,这种模式下的测评与教学和学习脱离,三者没有形成有机的整体。

三、教育信息化背景下英语专业考试模式改革探索

基于上述背景及传统测试模式存在的弊端,在当前高等教育信息化背景下,英语专业需要思考如何依托信息技术,对考试模式进行改革。

1.更新测评理念,提高教师的测评素养。教师测评素养在教育教学及测评改革中起到关键作用。教师在教学中需要科学设计测评内容,运用科学有效的测评方法和工具,对学生的学习效果进行评价。但是许多研究发现,英语专业教师的语言测评素养总体上落后于课堂教学等方面的发展,亟需加强评价知识及评价操作能力(潘鸣威,2020)。

教育部提出的一流课程建设为语言教师测评理念和测评素养提出了明确要求。按照教育部《关于一流本科课程建设的实施意见》(以下简称《实施意见》)要求,教师要进行“科学评价,让学生忙起来”,要完善以学生为中心的过程评价制度,加强对学生课堂内外、线上线下学习的评价,要通过科学的测评,提升学生学习的深度和广度,要加强非标准化、综合性等评价,提升学习的挑战性。为了做到科学、有效评价,英语专业教师要掌握必要的语言测评知识(如英语学习、英语语言测试等知识)、测评技能(如何命制及编写试题、如何进行试卷的统计分析等)及测评原理(如何有效使用测试等)。按照《实施意见》的要求,语言教师应改变传统的测试理念,重新思考测评的作用和功能。我国学者罗冠中(2015)将assessment划分为三个方面的意义,分别为assessmentoflearning(对学习结果的测评),assessmentaslearning(对学习过程的测评)和assessmentforlearning(促进学习的测评)。英语专业教师应充分认识到,测评不仅仅是对学习结果的检测,更要关注学生的学习过程,最终促进学生的学习。

在网络和大数据时代,学生的学习环境和学习方式发生了根本性变化,学习观念也发生了颠覆性改变,这些变化意味着测评也不能局限于傳统课堂,靠一张纸和一支笔来完成。线上线下、课堂内外对学习过程的测评和促进学习的测评要随时随地发生,以便对学生的学习进行实时监控、及时发现问题,及时解决问题。

2.依托信息技术,丰富测评形式。随着教育信息技术的广泛应用,线上线下相结合的多样化形成性评价在促进学生学习方面发挥越来越重要的作用。以新冠肺炎疫情期间笔者所讲授的《欧洲历史与文明》课程为例,根据课程目标的要求,课程加大了形成性评价的比例,形成性评价占总体测评的60%,主要对学生课前探究学习(20%)、课上及课下专题讨论(20%)及主题论文(20%)的参与和表现进行评价。在课前探究部分,学生观看课程视频后需要完成课程平台的知识点自我检测,或者按照教师的要求绘制知识点地图,或录制微视频对本章节知识点进行梳理汇报;专题讨论主要检测学生参与讨论的积极性及观点的深度,由教师给出话题,或采用小组负责制,在老师的指导下,每一章节由一个小组发起讨论。该部分测评的目的是帮助学生内化知识点,同时引导学生对所学内容进行深度思考和探究,训练学生的高阶思维能力;完成每一章学习后,学生撰写小论文,要求学生在消化理解本章学习内容的基础上,批判性地评价这一历史时期或某一历史事件,考查学生分析、评价和迁移能力,引导学生要树立以古为鉴、文明互鉴的意识。

依托信息技术,课程所实施的多种形式的形成性评价对学生的学习过程实现了动态监控,将检测与学习探究融为一体,强调了学生在学习过程中的主体地位,改变了以往学生在考试前突击复习的现象。动态的形成性评价引导学生按照学习的规律进行学习,有效帮助学生习得知识,通过研讨、专题论文、汇报等形式将知识转化为能力,最终促成教学目标的达成。同时,课程的形成性评价为教师及时提供诊断,有针对性地为学生布置个性化任务,帮助学生解决学习过程中的问题。

3.合理利用信息技术,改革测评内容。传统的语言测试题型比较单一,多采用选择题、判断题、匹配题、简答题、论述题、段落翻译题、口笔头作文题等题型,考查的内容往往脱离生活实际,且往往根据标准答案进行评判。语言测试研究专家Bachman和Palmer于1996年提出了测试有用理论,用来评价试题任务是否具有高质量的标准。按照测试有用理论,测试内容的真实性和互动性是评价测试是否有效的两个重要指标。真实性指语言测试中的试题任务越接近目标语使用的真实情境,测试越有效。互动性指受试者与测试任务之间的互动,互动性高的测试任务能够激发起受试者的相关知识、策略及情感图式等帮助受试者完成测试任务(刘亭亭,2019)。

在“互联网+”时代,网络信息平台为教师设计具有真实性、互动性、非标准化的测评提供了情境和平台。如应用文写作课上,教师可以结合网上某一国际化企业的招聘启事,让学生写一封应聘信及个人简历;针对高级写作课程考查,教师可以选择2-3个新闻媒体对同一事件的不同报道,让学生进行综述,比较不同观点,并批判性地发表个人观点;高年级听说课上,教师可以指定学生观看英美国家对某一事件的报道,然后学生录制个人对该报道的口头驳斥。借助网络信息技术,测评任务变得贴近实际,帮助学生意识到学习的目的是要解决实际问题,绝非应试。因此,依托信息技术而实现的多维度、非标准化测评能够帮助学生树立正确的测试观,调动学生参与测评任务的积极性。

4.发挥信息技术优势,有效利用测评结果。测评结果的有效使用在语言教学中起着重要作用,它可以帮助教师和学生检测不同阶段教学目标与学习目标的达成情况,诊断“教”与“学”中的问题,并从问题出发,改进教学。借助信息技术,课程平台可以完整记录学生的学习表现,形成学生学习电子档案袋,包括学生在每一次测评中的得分或失分情况、在线答题时间、成绩位次及与平均分数的对比等。一方面,教师可以充分利用后台统计数据,总体分析全班教学目标达成情况,适当调整并持续改进教学;另一方面,教师可以对每位学生个体的学习情况进行分析,有针对性地进行精准的个性化辅导。学生可以清楚了解自己的学习情况,对学习内容、学习过程、学习方法等进行反思,采取有效策略改进学习。

教育测量与评价论文范文第13篇

论文关键词:高等教育;质量与水平;评价指标

据统计,2008年中国各类高等教育总规模达到2907万人,继续稳居高等教育大国的位置。与此同时,高等教育面临的挑战也相当严峻。挑战的严峻性主要集中在以建设高等教育强国为战略目标的高等教育质量与水平的提升。建设高等教育强国是一个长期而复杂的过程,在这一过程之中,高等教育质量与水平评价指标体系则发挥导向作用,指导高等教育各个方面向前发展。因此,如何构建评价高等教育质量与水平的指标体系,采用何种分析框架,是目前中国高等教育迈向高等教育强国过程中必须正视和急需回答的一系列问题。

一、评价指标体系设计依据

目前,对于评价指标体系设计的依据主要有两个方面,一种是从概念分析出发,通过演绎的方式对被评客体属性有关内涵进行分解进而生成具有相互关联的各项指标,另外一种是根据评价目的来确定评价指标体系。评价目的是指进行评价活动所要达到的目标和要求,对评价指标的设计具有导向作用。不同的评价目的会导致评价指标体系的差异。根据评价目的来确定指标体系的具体步骤为:先从评价目的结构分析入手,认真分析评价目的所包含的各种因素,并将其全部罗列出来,再经过反复的分析、筛选,最终提炼出最能反映目标体系的指标,从而形成指标体系。当然,两种方法并不互相对立,在恰当的情境中两者可以很好地结合。对于高等教育质量与水平评价指标体系构建来讲,其最终目的是建设高等教育强国,所以,评价指标体系的设计既涉及对高等教育质量与水平的概念演绎,也要将其与建设高等教育强国的目的结合起来。

(一)高等教育质量与水平的概念演绎

当将“质量”与“水平”两个概念连接在一起的时候,在不同的场合或语境所表达的意思侧重点不一样,在过程评价中,“质量与水平”的重心放在“质量”上,在结果评价中,重心则放在“水平”。因此,在作为过程的指标体系的构建中,概念的演绎应该将重心放在“高等教育质量”这一概念上。

高等教育质量是个见仁见智的概念,其中尤以联合国教科文组织在考察世界各国高等教育情况基础上所提出的高等教育质量概念最具有代表性和全面性。“高等教育的质量是一个多层面的概念,应该包括高等教育的所有功能与活动:各种教学和学术计划、研究和学术、教学人员、学生、楼房、设施、设备、社区服务以及学术环境等等”,“还应包括国际交往方面的工作:知识的交换、相互联网、教师和学生的流动以及国际研究项目等”。因此,可以根据对高等教育质量概念的演绎,选择有代表性和可行性的指标,共同构成一个完整的指标体系,全面反映高等教育质量的各个方面。

(二)高等教育强国的内涵、特征

高等教育强国的内涵和特征是什么?指标设计如何体现这些内涵和特征?现有文献分析表明,虽然不同的学者对于高等教育强国这样一个复杂概念有不同的分析和解读视角,但是数量、要素、结构、功能、环境、输人、输出却是绕不开的理解维度。具体而言,一个国家之所以可以称得上高等教育强国,关键在于“它拥有较大的高等教育规模和较高的高等教育普及率”(数量、输入);在于“它培养出一大批具有国际影响的高水平的人才”(输出);在于“它建有若干所世界一流的大学或一批世界一流的学科”(要素、输出);在于“它已经形成多样化、多层次、多类型、布局结构合理、开放的高等教育体系”(结构);在于“它的高等教育系统已与本国的社会各子系统已形成功能耦合关系,能够全面适应经济社会发展的需要”(功能);在于“它是世界知识创新、科技创新和高等教育创新的‘集散地”’(输出)。因而,在设计指标体系时必须以上述高等教育强国的特征为依据,进行逐层分解并体现在具体的指标上。

二、评价指标体系构建

(一)指标体系分析框架

在逐层分解出评价指标之后,一定要有贯穿其中的理论分析框架将所有指标组织起来,才能发挥指标体系所具有的功能,使深入分析成为可能,否则,分解出来的指标只是一种教育统计数据的堆积。建设高等教育强国的评价目的一方面使评价指标体系不得不放在国家层面来考虑,另一方面也蕴含着对于高等教育质量与水平的评价不是为了证明,而是为了改进。对于前者,长期致力于教育指标研究的专家约翰斯通(johnstone,james.n.)认为,在建构国家层面的教育指标体系过程中,教育输入、过程与输出这个框架仍是最常用的分析架构;l6对于后者,则与斯塔弗尔比姆(stuflebeam,l.d.)所提出的教育评价的cipp模式具有恰切性。cipp即为背景(context)-投入(input)一过程(process)一结果(product)的评价模式。_7因而,结合高等教育质量概念演绎和评价目的,可将评价指标体系纳人背景一投入一过程一结果的分析框架,并将其列为评价指标体系的一级指标。在一级指标下,确定生源与规模、学术基础设施、教育投入、科研投入、学生类型、教师资源、学生投入、教育资源转化、人才培养结果、学术和科研产出、社会服务、国际影响力等12个二级指标,二级指标之下又设立32个观测点,构成高等教育质量与水平评价指标框架(见表1)。

(二)观测点内涵与重要性说明

1.与高等教育背景(资源基础)相关的观测点

人是教育的出发点和归宿点,在评价一个国家的教育水平时,人口统计上的特征是一个重要要素,对于高等教育来讲也不例外。人均受教育年限反映的是某一国家人口接受教育的总体水平,受教育年限越长则人口中接受教育的水平越高。完成高中教育是青年人进入高等院校学习的基础,因此高中教育的毛入学率直接影响高等教育的毛入学率及其规模。高等教育毛入学率反映的是国家提供高等教育机会的整体水平,实质上是高等教育培养人才能力的一个标志。学生均拥有图书量和在校生计算机普及率是评价国家或地区学术基础设施能力的指标。从高等教育的逻辑起点高深学问来看,对高深学问的保存、共享的方式和手段则对高等教育和研究有着重要的作用。信息社会,互联网时代,个人计算机不仅为身处高等教育领域的人们打开了交流高深学问的新通道,而且也为高等教育找到高校与社会资源相互合作的途径和方式。当然,传统以图书来保存、共享知识的方式也不能丢弃。

 

2.高等教育投入观测点

合理的教育财政投入比例是教育发展的重要保障。在反映高等教育投入的各个指标中,政府对高等教育的财政支持力度和投向直接影响到高等教育质量的高低。公共教育经费占gdp的比例反映了一个国家对教育投入的总量,也是衡量一国政府对教育努力程度的主要指标;高等教育经费占总教育经费的比例反映一国政府在总体财政资源中如何对各级教育进行分配;高校生均经费指数含义是一个国家用一个gdp支撑了几个学生完成其一年的学习,也可以说相对于一定的经济发展水平,一个国家拿出多少财力支持相关教育的发展。从经费来源结构上看,高等教育的社会效益为政府对高等教育投入并发挥主导作用提供了充分合理性,但是,由于政府对高等教育投入的增长无法满足人们对高等教育日益增长的需求,非公共资金带着满足利益相关者的兴趣、需要的使命介入高等教育的现象开始在全球出现。因此,观测点“公共高等教育经费占gdp比例”与“非政府高等教育经费占gdp比例”在结构上的伙伴关系也会影响一个国家高等教育系统的使命和质量。与扩大高等教育入学机会一样,促进高等教育公平也是提高高等教育质量的一种方式和衡量手段。“学生资助经费(奖学金、贷款等)占高等教育经费的比例”反映了一国政府对弱势学生群体入学机会的关注和资助力度。

通过研究促进知识的发展是高等教育系统的重要职责,研发经费是保证高校实现这一职责的重要保障。“高校研发经费占gdp的比例”反映了一国企业、政府、高等教育部门、私人非营利部门对研发的投入力度;“高校科研经费占总科研经费的比例”反映了研发经费在上述各部门的分配。

3.体现高等教育过程的观测点

对过程的监测也是保证质量的重要手段。与高等教育过程相关的主体主要有学生和教师及两者的比例。观测点“5a类学生比例”、“5b类学生比例” 和“博士生比例”反映了高等教育结构的多样化程度及比例与社会需求的协调性。学生是学习的主体,学习效果既取决于学校的教学安排,也取决于学生课后的自主学习。与其他观测点相关的统计数字不同的是,观测点“学生课后自我学习时间”需要通过抽样调查来获得相关的数据。拥有博士学位是大多数国家高校教师的入场券,因而,拥有博士学位教师比例反映了一个国家高校教师所具有的基础学术训练水平,也体现了师资的质量与水平。教师年薪占人均gdp比例是反映高校教师职业获得经济收入在社会各职业中所占的位置,是教师职业是否具有吸引力的标志。生师比是影响教育质量的重要指标。生师比越低,师生之间互动的机会可能越多,学生得到教师的指导就越多。反之,亦然。

4.高等教育结果观测点

结果是直接体现质量的直接观测点。在高等教育的人才培养结果中,观测点“25—64岁人口接受高等教育的比例”反映以往高等教育培养人才的存量。高等教育所培养的人才必须能够参与经济活动才能体现出其质量和价值,观测点“经济活动人口教育程度构成”中高等教育的比例说明了这一点。

科研产出的具体观测点包括“师均日论文数”、“师均sci论文数”、“师均专利授权数”、“高被引论文数”。虽然科技论文ei、sci收录和被引是一个在国际学术界广为争议的话题,但是在没有更有效的衡量方法出现之前,其对科研质量的度量仍然是主要的方法。由于高深学问只有同行才能理解,高被引论文则通过同行评价体现了科技论文的质量。专利本身的特点之一就是要有新颖性,反映了技术发明创造活动的水平。

根据高等学校的社会服务职能的含义是“以直接满足社会的现实需要的为目的、以教学和研究职能为依托,有目的有计划地向社会提供的具有学术性的服务”,指标体系将“高校年均非学历教育人次”和“师均技术和专利转让收入”作为评价高等学校社会服务的观测点。

正如克拉克·克尔所言,“大学按它对普遍知识的承诺的性质而论,本质上是国际机构”,因而,吸引着来自许多国家的学生与教师。观测点“留学生占全球国际生比例”、“外籍教师占本国教师比例”体现了一国高等教育系统从其他系统获得资源的吸引强度。这种资源在反映本国高等教育质量与水平的同时,也通过交流、理解促进该国高等教育质量与水平的提升。世界一流大学是一国高等教育系统的标杆或高地,在各种不同世界大学排行中,一国的高等教育机构居于何种位置、数量的多少体现了该国高等教育标杆或高地高度。观测点“上海交通大学世界大学学术排行前500的高等教育机构数”和“泰晤士高等教育增刊世界大学排行前20的高等教育机构数”分别从学术排行和声誉排行两方面分别反映一个国家高等教育机构的国际学术地位和社会声誉。

三、指标体系构成特点

高等教育质量与水平评价指标体系构成特点可以参照图1来理解。

(一)反映高等教育质量的本质特征

指标体系从高等教育质量概念的内涵演绎出发,使具体的观测点并不是一种主观判断,而是有着比较充分的依据,反映高等教育质量的本质特征。

(二)以诊断和导向为功能

评价指标体系的构建以建设高等教育强国为目的,因而,具有诊断和导向的功能。通过观测指标观照高等教育,诊断发展过程中所存在的质量问题,找出解决问题的对策,进而发挥其导向作用,指导高等教育各个方面向前发展,最终达到高等教育强国的目的。

(三)反馈性与可塑性的统一

一方面,指标体系的构建不仅遵循着输入——过程——结果的分析框架,而且在体系内存在着反馈回路,体现为结果评价不仅可以夯实高等教育的基础,而且可以刺激高等教育投入。另一方面由于高等教育职能的多样化,指标体系可以根据研究的需要变换组合,具有可塑性。

(四)过程考察与结果考察的统一

针对以往评价指标体系注重结果评价的弊端,该评价指标体系在重视结果评价的同时增加了反映教育过程的指标。

(五)与社会、经济发展密切相关

教育测量与评价论文范文第14篇

我国正处于高等教育大众化向普及化的转型期,受教育者资质各异,学业需求与学生学业发展不可避免地呈现出多样化的态势,教育成效和学生发展再度成为高等教育质量保障拓宽问题所关注的核心点。我国《国家中长期教育改革和发展规划纲要(2010~2020年)》中明确提出,提高人才培养质量是高等教育质量保障的刚性需求。我国高等教育改革已进入深水区,如何客观科学地评价高等院校自身的教育效力,科学地测量高校学生在大学四年的学业成果、发展表现及其增值幅度,是我国高等教育质量保障研究的热点与难点。与此同时,来自美国教育界的评价经验与做法为我国提供了理论与实践上的启蒙。

1 增值评价概念辨析

增值评价(Value-Added Assessment)的概念最早出现在美国,对它的研究始于1966年美国约翰霍普金斯大学社会学系科尔曼教授对美国教育公平的研究,之后陆续出现了一些涉及到学生学业评价问题的研究,直至2001年美国联邦教育法《不让一个孩子掉队》(No Child Left Behind)的出台,增值评价才开始成为美国教育评价的主流方式。

在英文语境下,增值评价的内涵范围多有交叉。有学者认为,“增值”观是针对学生学业成绩进步的增值进行价值判断,亦可称“成绩说”,此观点主要应用于基础教育领域。如汉塞克(Handshake)对增值内涵采取相对窄化的态度,将增值定义为后测与前测二者之间的成绩差异,即剩余值[1,2]。特克维(C.D.Tekwe)等将学生成绩进行连续年度的比较后所产生的变化定义为增值,并提倡以此来矫正学生入学知识或能力的教育效能评价[3]。泰勒(Taylor)和迈克柯兰(McClain)等提出了增值评价法(Value-added),认为学生在学习上进步或发展的增量可被看作是教学质量提升的结果,也是教学质量评估所要抓的重点[2]。萨丽托马斯(Sally Thomas)认为如果学校的教育可以为学生的学业成就增加“价值”,那么“增值”就表示学校所加诸学生身上,使其学习成绩超过一般期望成绩的额外部分[4]。另一种“增值”观,关注教育的整体效能,着眼于评价学生的整体发展程度的价值增值,亦可称“全面说”,在高等教育情境下应用较为广泛。学者阿斯汀(Alexander W.Astin)把有关增值内涵的观点在《实现卓越教育(Achieving educational excellence)》一书中有所阐述,他认为在高等教育情境下,所谓增值是指学校教育对大学生学业成就以及毕业后的工作生活所带来的积极影响,而增值评价即是对这种影响程度的测量[5],增值评价关注学生从进入大学到大学毕业之前所发生的变化,指出生源质量是大学教育质量的根本体现,真正的质量在于大学对学生认知和情感发展的影响程度,学生在大学期间学习和发展的变化越大,那么学校对学生发展的影响也就越大,因而学校的教育质量就越高[5]。

综上所述,虽然没有哪一种观点得以一统学界,但是通过梳理增值评价的各种概念界定,可以发现学者们对这一内涵有如下共同理解:价值增值的概念是建立在教育可以增加“价值”到学生身上这一假设基础之上的。从宽泛意义上来讲,“增值”是指在一段时间内所实施的教育活动给受教育者带来正面的、积极的影响,是推进受教育者自身获得进步与发展的价值增量。从狭义上来讲,增值评价考察教育教学对受教育者学业成绩影响的“净”效应,通过追踪研究设计,收集他们在一段时间内不同时间点上的学习成绩为评价依据,将进步与变化作为评价的核心,基于对受教育者自身的纵向比较并考虑其他不受学校或教师控制的因素对其成绩的影响,来考量其学业的进步幅度。值得注意的是,增值评价作为一种发展性的评价方法,是建立在符合学校实际、动态教学效能的基础上所产生的概念,它基于学生原有的发展水平,始终专注于教学品质的持续改进,因此增值观的核心指向也发生了从单纯注重学习成绩增长向学生整体性发展诉求的转变。

2 增值评价的理论依据与实施方式

2.1 增值评价理论依据的分析

在欧美等西方国家尤其是美国教育界,针对学生发展理论的研究已有近百年历史,美国高等教育质量评估方面的发展也深受学生发展理论的影响。对学生发展过程、结果及其影响因素深入研究与探讨所形成的学生发展理论是增值评价的理论基石。而增值评价的理论与高校学生学业评价的理论基础一脉相承,同样源自美国的大学生发展理论。

20世纪60年代以来,在心理学视域下兴起于美国心理学界的大学生发展理论是“人的发展理论”在高等教育情境下的运用,本质上来源于人的发展理论的思想内核,描述了大学生发展的某一维度或若干维度,以及经历的阶段或者某一维度的发展过程,其目标是对学生在四年的大学学习与生活中自主发展的过程做出客观化、科学化解释,揭示大学生如何发展成为了解自我、他人及世界的成熟个体的过程,旨在研究大学生的成长与变化。建立在学生发展理论基础上的增值评价理论,提倡充分尊重评价的利益相关者主体――学生的获益诉求,突破了传统评价主体的范式局限,将关切点转移到学生个体成长与发展的主体性建构上,是真正意义上的“以人为本”的培养质量评价。在探讨学生发展理论及其在人才培养质量评估领域的应用中,朱红根据不同的研究视角,把大学生发展理论分为两大类:个体发展理论和变化理论。变化理论从社会学的视角出发,侧重于关注外部因素的影响机制,强调大学生在高校期间的成长是受外在因素影响的因果关系,而个体发展理论多以心理学的视角出发,侧重于关注个体自身内部因素的影响机制,将学生在大学期间的发展更多视为一种自主发展的过程,旨在研究学生在大学期间会发生什么样的变化,以及这些变化产生的过程[6]。因此,这两种理论互为补充,从不同的角度阐释了学生在大学成长过程中的结果和机制。在探讨学生发展理论及其在学生事务管理领域的应用中,美国高校学生事务管理的一个核心的知识领域和理论基础就是大学生发展理论。克里斯汀仁(Krist Renn)将四种(个体与环境理论、社会心理理论、认知与价值观理论、整合型理论)普遍应用于美国学生事务研究领域的学生发展理论进行了梳理和概括[7],他指出,各种类型的理论并非彼此孤立而截然分开,有些理论难以划归于单一的理论类型,某一特定的理论有可能是跨越性的理论。依据这个观点,对于学生发展理论做进一步的研究是非常有必要的,理论的价值在于应用,但理论成果没有被应用于实践和改进,或者说应用效果的适切性不佳,那么理论的实践意义和参考价值也就无从体现了。

由此可见,增值评价的理论概念并不是静态的,而是与心理学领域的理论与实践共同成长、齐头并进的。一方面,在面对不同的主客体情境与价值导向时,研究者可以从文献中发现评价过程中所涉及的各种心理学概念,各个理论在主要观点上也存在着差异。另一方面,来源于美国的大学生发展理论这一概念虽然在我国也得到了广泛的运用,但在应用过程当中不免会出现跟中国的教育情境不相适恰的问题,目前我国教育界还缺少自主研发的理论基础。中国的大学生发展是否有规律可循,美国的大学生发展理论是否能够描述、解释、预测和指导中国的大学生发展,这还有待深入研究[8]。

2.2 增值评价实施方式的分析

从美国的相关研究来看,学生学业成果是高校增值评价的关键指标。高校学生学业的评价指标通常以学生在知识、技能、能力等方面的参与体验和收获来构建,包括认知与非认知、心理、行为等若干层面,对它们的界定将直接影响评价结果[5]。这些指标获取的途径主要有两种:第一种是具有直接、客观等特点的学生标准化测试;第二种是具有间接、主观等特点的自陈式量表/自我报告型调查问卷。从数据的质量上来看,每一种评价方法对学业成果的反映都有其优势与局限。标准化测试侧重考查学生的学习结果,其优点在于测试成绩的客观性强、尤其是能够直接反映大学生的核心认知能力及增值情况,具有较高的信效度,且数据易于收集和统计,这类数据对改进教师教学及学生学习过程具有重要意义,且有助于在不同学校之间进行学生学习成果差异比较,探索差异背后的深层影响因素[5]。但是标准化测试对大学生的情感、态度、人格等非认知层面的学业成果的测量方面尚属空白,学生主体参加测试的动机和意愿也会直接影响测试结果的效度;相对于标准化测试,自陈式量表/自我报告型调查问卷的亮点在于关注对学生学习的过程、经历、态度、感受等方面的考量,所得数据更能丰富地反映出大学生课内外学习与活动的参与情况以及自我对个体发展与收获情况,但是自我报告型调查量表的测量效度不易建立,理论构思与假设的合理性、科学性及其转换为指标的恰当程度与可操作性都不易把握。

高校学生在就读期间的学习经历和收获存在较大的异质性,评价指标的发散化和柔软化使学生发展的增值情况也很难通过单一的评价工具来获得。“多法并用”是高校学生学业评价方法的有效方式[9]。当前国际教育评估界还缺乏将标准化测试与自陈式自我问卷调查量表相结合的好办法。因此,在未来获取数据信息的过程中,研究者该如何扬长避短,如何寻求两者的相互融合而为增值评价通过一次评估即可同时获得全面的、客观的、动态化的数据信息,是高校学生学业增值评价的挑战。

3 我国高校学生学业增值评价的现实与 启示

3.1 增值评价工具的分析

目前,高等教育阶段的学生学业增值评价主要依赖于标准化测试和自陈式量表/自我报告型调查问卷。其中,由2000年美国兰德公司(Research and Development Corporation,简称RAND)和教育资助委员会共同开发的《大学学习评估》(The Collegiate Learning Assessment,简称CLA)、《大学生学术熟练程度与进步测量》(Measure of Academic Proficiency and Progress,简称MAPP)等,这些测量工具主要测量大学生的认知能力,测验数据主要用于评价大学对学生综合能力的提升(即学生能力的增值)[10],它们是较有代表性的测标准化测试;目前在学界较为流行的由全美高等教育管理系统中心(National Center for Higher Education Management System)、皮尤慈善信托基金会(Pew Charitable Trusts, PCT)与美国印第安纳大学调查研究中心共同研发的“全国性大学生参与度调查”(National Survey of Student Engagement, NSSE)是一种通过对学生投入各项有效学习的程度所展开的调查,它通过从问卷结果中提炼与学生个体学习收获相关的、动态性的、过程性的评价指标,选取相应的模型来构建评价体系[11],并采用高级统计方法(如Hierarchical Linear Model,简称HLM模型,该模型同时也是增值研究的主流工具)来深入分析各个因素及变量间的复杂关系及直接或间接的影响来实现对大学生学习过程和结果的增值评价,属于自我报告型调查问卷。通过以上途径而获得数据后,所进行的统计分析模型主要有三种:分数差值法、多元线性回归模型(Multivariable Linear Regression Model)以及多水平分析模型(Hierarchical Lineaer Model,简称HLM),它们目前是美国所采用的主流分析模型。其中,从评估频率(Frequency of Assessment)上看,增值评价拥有多个比较基准,在纵向评估(Longitudinal Assessment)的过程中可以对时间序列上所产生的发展与变化进行有效比较,这是增值评价模型成为当前美国教育评价主流原因之一[12]。

事实上,通过研究发现并得出结论,增值评价不存在世界范围统一的评价模式。受实际因素的影响,在同一国家内的不同地区尚且存在不同的评价模式,统计方法与评价模型本身的不断完善与发展的动态过程也使评价结果受模型变化的影响较大,通过不同的模型对同一套数据进行分析,所得出的结果也不尽相同[13]。综上所述,鉴于学习活动本身是一个动态的、多维度的活动,因此对探索构建评价的过程性指标就别具意义,评价工具的开发者也频繁地使用那些能够体现“价值增值”的要素来构建测量维度。这对增值评价在我国高等教育界的推广提供了技术与信念上的支持。

3.2 增值评价实施过程中的价值与准则

在教育学语境下,所谓的“价值”是由一群社群、团体或个人所坚持的完美典范,或者是相关优点的归因,或对象的有用性所构成[14],价值是开展评价活动的基石。“评价”属于一种价值判断活动,任何评价都与评价人的价值选择有关,评价方依据价值的明确来展开评价。与此同时,价值提供并导出了评价准则的基础,在测量一项评价活动的价值或质量时,评价方所基于的那些共同认可的原则,即为准则。价值与准则共同引导了评价工具的建构与评价标准的阐释方向。价值的明确活动在评价过程中是持续不断的,对完成评价任务来说,这是一个挑战。从某种意义上来说,评价过程中的价值与准则是完成评价任务的灵魂构成,它们也是一种方向性的要求,从某种程度上来说,它直接制约着学生的学业发展。因此,增值评价的价值澄清与准则说明它们跟评价的设计与实施间应该保持流体般的交互状态,两者的研究进度不能截然脱离,不能只停留在某一界面上进行单独的改良与革新。

在保存与维护并提升美国社会共同利益的过程中,存在着一种十分重要的普世价值观:针对社会所有方面,都应进行共同、全面且持续的努力来改善质量,所有行为都应致力追求卓越。由此,美国教育界的高等教育质量运动带来了一种共同的学习责任感、一种倾听服务对象心声的习惯、一种数据偏好、一种持续提升的道德、一种充分开发每一位学习者才能的决心,还有一种认同,就是工作上对同事和服务对象负责的义务[3]。同时,增值评价对学业评价的目的提出了价值澄清的要求,价值澄清的目的在于教育政策制定者通过选择和实践过程来增进赋予理智的价值选择。正是这些被突显出来的价值诉求孕育了对追求高等教育卓越的思考和探索,为我国的高等教育评价的理论研究注入了新的活力。

3.3 对我国的启示与借鉴:以教育公平促进高等 教育质量卓越

公平是社会与教育的核心价值,也是教育灵魂卓越的要素。推进教育公平作为社会公平和正义的基础和先行条件,是促进教育发展从规模扩张向质量内涵转型发展的关键。保障教育公平和提高教育质量是追求教育卓越的两个重要维度,也是当今世界各国高等教育发展的共同目标。从整体上来讲,我国的高等教育大众化在“量”的层面上是对教育公平起到了促进作用,但是在“质”的表现上就不尽理想。“质”的公平将逐步成为我国高等教育公平问题的核心要素,如何促进质的建设是评价活动的价值所在。在我国实施高校学生学业增值评价的意义在于促进教育公平、提高教育质量,保障每位受教育者都能得到充分的发展。

教育测量与评价论文范文第15篇

论文关键词:高等教育;质量与水平;评价指标

据统计,2008年中国各类高等教育总规模达到2907万人,继续稳居高等教育大国的位置。与此同时,高等教育面临的挑战也相当严峻。挑战的严峻性主要集中在以建设高等教育强国为战略目标的高等教育质量与水平的提升。建设高等教育强国是一个长期而复杂的过程,在这一过程之中,高等教育质量与水平评价指标体系则发挥导向作用,指导高等教育各个方面向前发展。因此,如何构建评价高等教育质量与水平的指标体系,采用何种分析框架,是目前中国高等教育迈向高等教育强国过程中必须正视和急需回答的一系列问题。

一、评价指标体系设计依据

目前,对于评价指标体系设计的依据主要有两个方面,一种是从概念分析出发,通过演绎的方式对被评客体属性有关内涵进行分解进而生成具有相互关联的各项指标,另外一种是根据评价目的来确定评价指标体系。评价目的是指进行评价活动所要达到的目标和要求,对评价指标的设计具有导向作用。不同的评价目的会导致评价指标体系的差异。根据评价目的来确定指标体系的具体步骤为:先从评价目的结构分析入手,认真分析评价目的所包含的各种因素,并将其全部罗列出来,再经过反复的分析、筛选,最终提炼出最能反映目标体系的指标,从而形成指标体系。当然,两种方法并不互相对立,在恰当的情境中两者可以很好地结合。对于高等教育质量与水平评价指标体系构建来讲,其最终目的是建设高等教育强国,所以,评价指标体系的设计既涉及对高等教育质量与水平的概念演绎,也要将其与建设高等教育强国的目的结合起来。

(一)高等教育质量与水平的概念演绎

当将“质量”与“水平”两个概念连接在一起的时候,在不同的场合或语境所表达的意思侧重点不一样,在过程评价中,“质量与水平”的重心放在“质量”上,在结果评价中,重心则放在“水平”。因此,在作为过程的指标体系的构建中,概念的演绎应该将重心放在“高等教育质量”这一概念上。

高等教育质量是个见仁见智的概念,其中尤以联合国教科文组织在考察世界各国高等教育情况基础上所提出的高等教育质量概念最具有代表性和全面性。“高等教育的质量是一个多层面的概念,应该包括高等教育的所有功能与活动:各种教学和学术计划、研究和学术、教学人员、学生、楼房、设施、设备、社区服务以及学术环境等等”,“还应包括国际交往方面的工作:知识的交换、相互联网、教师和学生的流动以及国际研究项目等”。因此,可以根据对高等教育质量概念的演绎,选择有代表性和可行性的指标,共同构成一个完整的指标体系,全面反映高等教育质量的各个方面。

(二)高等教育强国的内涵、特征

高等教育强国的内涵和特征是什么?指标设计如何体现这些内涵和特征?现有文献分析表明,虽然不同的学者对于高等教育强国这样一个复杂概念有不同的分析和解读视角,但是数量、要素、结构、功能、环境、输人、输出却是绕不开的理解维度。具体而言,一个国家之所以可以称得上高等教育强国,关键在于“它拥有较大的高等教育规模和较高的高等教育普及率”(数量、输入);在于“它培养出一大批具有国际影响的高水平的人才”(输出);在于“它建有若干所世界一流的大学或一批世界一流的学科”(要素、输出);在于“它已经形成多样化、多层次、多类型、布局结构合理、开放的高等教育体系”(结构);在于“它的高等教育系统已与本国的社会各子系统已形成功能耦合关系,能够全面适应经济社会发展的需要”(功能);在于“它是世界知识创新、科技创新和高等教育创新的‘集散地”’(输出)。因而,在设计指标体系时必须以上述高等教育强国的特征为依据,进行逐层分解并体现在具体的指标上。

二、评价指标体系构建

(一)指标体系分析框架

在逐层分解出评价指标之后,一定要有贯穿其中的理论分析框架将所有指标组织起来,才能发挥指标体系所具有的功能,使深入分析成为可能,否则,分解出来的指标只是一种教育统计数据的堆积。建设高等教育强国的评价目的一方面使评价指标体系不得不放在国家层面来考虑,另一方面也蕴含着对于高等教育质量与水平的评价不是为了证明,而是为了改进。对于前者,长期致力于教育指标研究的专家约翰斯通(johnstone,james.n.)认为,在建构国家层面的教育指标体系过程中,教育输入、过程与输出这个框架仍是最常用的分析架构;l6对于后者,则与斯塔弗尔比姆(stuflebeam,l.d.)所提出的教育评价的cipp模式具有恰切性。cipp即为背景(context)-投入(input)一过程(process)一结果(product)的评价模式。_7因而,结合高等教育质量概念演绎和评价目的,可将评价指标体系纳人背景一投入一过程一结果的分析框架,并将其列为评价指标体系的一级指标。在一级指标下,确定生源与规模、学术基础设施、教育投入、科研投入、学生类型、教师资源、学生投入、教育资源转化、人才培养结果、学术和科研产出、社会服务、国际影响力等12个二级指标,二级指标之下又设立32个观测点,构成高等教育质量与水平评价指标框架(见表1)。

(二)观测点内涵与重要性说明

1.与高等教育背景(资源基础)相关的观测点

人是教育的出发点和归宿点,在评价一个国家的教育水平时,人口统计上的特征是一个重要要素,对于高等教育来讲也不例外。人均受教育年限反映的是某一国家人口接受教育的总体水平,受教育年限越长则人口中接受教育的水平越高。完成高中教育是青年人进入高等院校学习的基础,因此高中教育的毛入学率直接影响高等教育的毛入学率及其规模。高等教育毛入学率反映的是国家提供高等教育机会的整体水平,实质上是高等教育培养人才能力的一个标志。学生均拥有图书量和在校生计算机普及率是评价国家或地区学术基础设施能力的指标。从高等教育的逻辑起点高深学问来看,对高深学问的保存、共享的方式和手段则对高等教育和研究有着重要的作用。信息社会,互联网时代,个人计算机不仅为身处高等教育领域的人们打开了交流高深学问的新通道,而且也为高等教育找到高校与社会资源相互合作的途径和方式。当然,传统以图书来保存、共享知识的方式也不能丢弃。

2.高等教育投入观测点

合理的教育财政投入比例是教育发展的重要保障。在反映高等教育投入的各个指标中,政府对高等教育的财政支持力度和投向直接影响到高等教育质量的高低。公共教育经费占gdp的比例反映了一个国家对教育投入的总量,也是衡量一国政府对教育努力程度的主要指标;高等教育经费占总教育经费的比例反映一国政府在总体财政资源中如何对各级教育进行分配;高校生均经费指数含义是一个国家用一个gdp支撑了几个学生完成其一年的学习,也可以说相对于一定的经济发展水平,一个国家拿出多少财力支持相关教育的发展。从经费来源结构上看,高等教育的社会效益为政府对高等教育投入并发挥主导作用提供了充分合理性,但是,由于政府对高等教育投入的增长无法满足人们对高等教育日益增长的需求,非公共资金带着满足利益相关者的兴趣、需要的使命介入高等教育的现象开始在全球出现。因此,观测点“公共高等教育经费占gdp比例”与“非政府高等教育经费占gdp比例”在结构上的伙伴关系也会影响一个国家高等教育系统的使命和质量。与扩大高等教育入学机会一样,促进高等教育公平也是提高高等教育质量的一种方式和衡量手段。“学生资助经费(奖学金、贷款等)占高等教育经费的比例”反映了一国政府对弱势学生群体入学机会的关注和资助力度。

通过研究促进知识的发展是高等教育系统的重要职责,研发经费是保证高校实现这一职责的重要保障。“高校研发经费占gdp的比例”反映了一国企业、政府、高等教育部门、私人非营利部门对研发的投入力度;“高校科研经费占总科研经费的比例”反映了研发经费在上述各部门的分配。

3.体现高等教育过程的观测点

对过程的监测也是保证质量的重要手段。与高等教育过程相关的主体主要有学生和教师及两者的比例。观测点“5a类学生比例”、“5b类学生比例” 和“博士生比例”反映了高等教育结构的多样化程度及比例与社会需求的协调性。学生是学习的主体,学习效果既取决于学校的教学安排,也取决于学生课后的自主学习。与其他观测点相关的统计数字不同的是,观测点“学生课后自我学习时间”需要通过抽样调查来获得相关的数据。拥有博士学位是大多数国家高校教师的入场券,因而,拥有博士学位教师比例反映了一个国家高校教师所具有的基础学术训练水平,也体现了师资的质量与水平。教师年薪占人均gdp比例是反映高校教师职业获得经济收入在社会各职业中所占的位置,是教师职业是否具有吸引力的标志。生师比是影响教育质量的重要指标。生师比越低,师生之间互动的机会可能越多,学生得到教师的指导就越多。反之,亦然。

4.高等教育结果观测点

结果是直接体现质量的直接观测点。在高等教育的人才培养结果中,观测点“25—64岁人口接受高等教育的比例”反映以往高等教育培养人才的存量。高等教育所培养的人才必须能够参与经济活动才能体现出其质量和价值,观测点“经济活动人口教育程度构成”中高等教育的比例说明了这一点。

科研产出的具体观测点包括“师均日论文数”、“师均sci论文数”、“师均专利授权数”、“高被引论文数”。虽然科技论文ei、sci收录和被引是一个在国际学术界广为争议的话题,但是在没有更有效的衡量方法出现之前,其对科研质量的度量仍然是主要的方法。由于高深学问只有同行才能理解,高被引论文则通过同行评价体现了科技论文的质量。专利本身的特点之一就是要有新颖性,反映了技术发明创造活动的水平。

根据高等学校的社会服务职能的含义是“以直接满足社会的现实需要的为目的、以教学和研究职能为依托,有目的有计划地向社会提供的具有学术性的服务”,指标体系将“高校年均非学历教育人次”和“师均技术和专利转让收入”作为评价高等学校社会服务的观测点。

正如克拉克·克尔所言,“大学按它对普遍知识的承诺的性质而论,本质上是国际机构”,因而,吸引着来自许多国家的学生与教师。观测点“留学生占全球国际生比例”、“外籍教师占本国教师比例”体现了一国高等教育系统从其他系统获得资源的吸引强度。这种资源在反映本国高等教育质量与水平的同时,也通过交流、理解促进该国高等教育质量与水平的提升。世界一流大学是一国高等教育系统的标杆或高地,在各种不同世界大学排行中,一国的高等教育机构居于何种位置、数量的多少体现了该国高等教育标杆或高地高度。观测点“上海交通大学世界大学学术排行前500的高等教育机构数”和“泰晤士高等教育增刊世界大学排行前20的高等教育机构数”分别从学术排行和声誉排行两方面分别反映一个国家高等教育机构的国际学术地位和社会声誉。

三、指标体系构成特点

高等教育质量与水平评价指标体系构成特点可以参照图1来理解。

(一)反映高等教育质量的本质特征

指标体系从高等教育质量概念的内涵演绎出发,使具体的观测点并不是一种主观判断,而是有着比较充分的依据,反映高等教育质量的本质特征。

(二)以诊断和导向为功能

评价指标体系的构建以建设高等教育强国为目的,因而,具有诊断和导向的功能。通过观测指标观照高等教育,诊断发展过程中所存在的质量问题,找出解决问题的对策,进而发挥其导向作用,指导高等教育各个方面向前发展,最终达到高等教育强国的目的。

(三)反馈性与可塑性的统一

一方面,指标体系的构建不仅遵循着输入——过程——结果的分析框架,而且在体系内存在着反馈回路,体现为结果评价不仅可以夯实高等教育的基础,而且可以刺激高等教育投入。另一方面由于高等教育职能的多样化,指标体系可以根据研究的需要变换组合,具有可塑性。

(四)过程考察与结果考察的统一

针对以往评价指标体系注重结果评价的弊端,该评价指标体系在重视结果评价的同时增加了反映教育过程的指标。

(五)与社会、经济发展密切相关