20世纪美国教育评价研究的发展历程

打印本文 - 下载本文〗〖0条评论 - 0推荐〗〖字数:5300字〗

摘要:美国教育评价研究的发展经历了三个阶段:20世纪初期至50年代的屏蔽价值关注“目标达成”的阶段、20世纪50年代至70年代的价值渗透关注过程的“方案评价”阶段、20世纪70年代至今的关注价值评定“综合”阶段。研究视域围绕着对教育目标的批评和实施过程的批评得到拓展,其中缠绕着各类教育参与者的价值的融合。

关键词:教育评价;课程评价;价值;目标

20世纪的学者围绕着“如何合理地衡量‘预期目标’和‘实际结果’的存在的差异”的问题展开研究,30年代来自泰勒“目标达成评价”奠定了美国教育评价的基础。随着联邦政府对教育的投入,教育评价取得了繁荣和昌盛,对“目标达成评价”的批评来自两个方面:一是针对教育目标本身的攻击。反对该次课程改革的人们开始质疑课程改革本身是否能满足社会需要,也就是质疑教育目标自身的合理性问题,这就使得原本“中立”的目标评价对自身的价值产生了反思。二是针对教育目标实施过程的关注。这时人们关注的并不仅仅是目标的达成,而是在过程之中所具有的繁复情境,关注在各种情境下的参与者特有的价值立场。教育研究者对教育改革实施过程的关注使得参与者的价值立场凸现出来。这些批评带来了教育评价革命性的发展。与此同时,评价研究配合联邦政府的教育渗透政策,展开新的评价视阈的开拓。

一、屏蔽价值:目标达成的“科学”评价

20世纪30年代,美国俄亥俄州立大学教授泰勒(RalphW.Tyler)站在课程研制的管理者立场,将评价拓展到教育方案质量的评价。不过,这种拓展受到当时科学管理思想的影响,所谓的方案质量的评价指:将课程视为目标的存在。泰勒宣称评价是“测定教育目标在课程与教学的方案中究竟被实现多少的历程”,而评价的核心就是长存于历史当中的“学习经验(learningexperience)的发展”。为此,课程评价的重点工作就是确立客观可信的标准和测量的工具,而工具应该能够囊括“教育目标所期望的行为的任何有效证据”,如纸笔测验(paper-and-penciltests)、观察(observation)、交谈(interview)、问卷(question-naires)、收集实际作品(actualproducts)等。30年代早期,泰勒的评价方法在俄亥俄州得以实践。

经济大萧条时期(TheGreatDepression),学校和其他公众组织遭受资源短缺的困扰。此时,罗斯福总统(Roosevelt)开始进行政治上的新改革(NewDealProgram)。在这个背景下,进步主义运动沸沸扬扬,泰勒参与了进步主义的运动,1932年开始领导著名的“八年研究”,并在卡内基机构(CarnegieCorporation)资助下,尝试比较不同学校教育的有效性。泰勒的教育评价(educationevaluation)开始将评价拓展到教育方案质量的评价,“八年研究向全美的教育学者们介绍了更加广泛的教育评价,而不只是局限在学生的有效性和测验的范围”。而且,评价确定了预定的目标规范,关注预期目标的实现。泰勒以其研究的结果告诉我们,在预期目标和实际结果之间存在着巨大差异。早期的评价倾向于关注结果的测量,而把作为课程实施的重要环节——课堂和学校屏蔽起来,这种过程“黑箱”很快就引起了学者的反思。20世纪40年代以后,泰勒也对自己的工作进行了反思,其论著在以后的25年中产生了持续的影响。

20世纪40年代到50年代中期,美国城乡里弥漫着贫穷和失望,充满种族偏见和隔离,是一个资源浪费而人们熟视无睹的时代,是工业发展而危害环境的时代。但在经济的带动下,新的学校形式出现,学区的教育形成各种服务系统。社会和教育对教育的需求无限膨胀,但是人们很少关注教育的效率和有效性。不过,评价技术却得到了很大的发展,1947年成立的教育测验服务机构(Educationaltestingservice)。20世纪50年代,联邦资金鼓励并支持专业研究活动,标准化测验已经得到广泛传播,专业组织建立了一系列规范测验指标。1954年,美国心理学家协会(Americanpsychologicalassociation)提供《心理测量和诊断技术的具体建议》(TechnicalRecommendationsforpsychologicaltestsanddiagnostictechniques,简称APA)的报告。1955年,美国教育研究协会(Americaneducationresearchassociation,简称AERA)和国家教育测量委员会(Nationalcouncilonmeasurementusedineducation,简称NCME)发布了《成就测验的技术建议》(TechnicalRecommendationsforAchievementTests)。1966年,前面三个机构联合发布了“教育和心理测量的标准手册”(StandardsforEducationandPsychologicalTestsandManuals)并于1974年进行了修订。

此时,标准化测量风靡一时,专家根据可接受的目标或目的建构测验,预先设定不同年龄或年级的常模或标准,用以管理、评级和解释分数的意义。包括性向测验(Aptitudetests)、成就测验(Aptitudetests)以及兴趣、个性和态度测验(Interest,Personalityandattitudeinventories)。这些标准测验方法看起来满足了科学化的要求,但在实际上却与泰勒规则相矛盾,因为泰勒认可并鼓励目标的差异性。不过,这些技术性的发展为未来评价的拓展奠定了技术的基础。

二、价值渗透:关注过程的“方案”评价

进入20世纪50年代,评估已经拓展到学生学习、课程设计的有效性之外,进入到教育系统、国家发展计划甚至是政策系统。评价者并没有遵照课程评价领域的前辈们的已有研究范围,而是将自己的研究领域拓展到公众领域的政策问题范围。50年代后期,教育领域资源的重组,随之产生了各类课程发展与教育的问题,评价的价值及其伦理问题已经成为评价领域的重要问题。

1957年苏联卫星发射成功的事件之后,联邦政府制定了《国防教育法》(NationalDefenseEducationAct,1958)。整个时期,联邦政府开始关注到教育的质量问题,开始资助大规模的评价计划,评价开始从“作为行业(industry)的评价到依靠税收的职业(profession)”。学科专家组织了科学和数学的课程发展计划(curriculumdevelopmentproject),不过很快人们就发现这些课程没有发挥其真正的力量,而且评价者的论著既无助于课程研制,也不对有效性的检测负责。1963年,心理测量专家克龙巴赫(LeeJ.Cronbach)针对人们的抱怨,批评评价缺乏相关性和应用性,主张《通过评价提升课程》(Courseimprovementthroughevaluation),认为测验项目的分析和汇报有利于教师的教学,并建议课程评价必须聚焦于课程研制过程中课程专家的决策。但是,这并未引起美国教育评价领域学者的关注。

几年之后,情况变得不同了。1965年,肯尼迪总统智囊团的主席休伯特·汉弗莱议员(SenatorHubertHumphrey)和约翰逊总统(PresidentLyndonJohnson)对贫穷问题展开争论,人们开始将目光转移到社会福利的改革。20世纪早期积累的财富促使联邦政府开始资助这些福利计划。《初等和中等教育法案》(1964)(TheElementaryandsecondaryeducationActof1964,简称ESEA)首次拨出特定联邦资金用于地区教育系统,教育被视为州的责任。随着联邦资金对地区教育的投入,国家开始干涉资金的运用效果。很多资金投入并未如地方宣称的那么理想,因此这些都要求教育者将教育评价转移到实践等支持性研究,学校开始接受ESEA的定期检测。由于评价可以终止或辅助课程项目,因此课程评价研究变得如此重要。费黛奥塔·卡朋(PhiDeltaKappa)联合会建立了“国家评价研究委员会”(NationalStudyCommitteeonEvaluation),针对评价存在的问题进行调查。1960年后期,大部分美国教育学者都在着手于教育评价的研究,各类人员从不同的领域开始进入到教育评价领域,重新审视教育评价的本质概念。教育评价研究开始进入概念化(conceptualization)过程,这意味着对评价目标、评价对象、实施建议、服务过程,以及测量预定和非预定的结果等问题展开讨论。

1967年,美国教育研究协会(AmericanEducationResearchAssociation,简称AERA)的罗伯特·斯蒂克(RobertStake)对课程评价的研究引发了公众的关注。此时,评价者大多为心理测验学和实验设计人员,因此被人批评为缺乏教育问题的鉴赏力。其实,在1962年AERA会议之后,随着AERA的专论的出版,评价是教育测验的假设已经逐渐被摧毁。争论由此扩大化,就连泰勒(RalphTyler)、斯克里文(MichaelScriven)和斯蒂克(RobertStake)也开始批评心理测验手段是否可以用于满足评价的目的。1967年,斯克里文区分了形成性评价和终结性评价,“形成性评价”不仅仅是作为一种评价形式而被提出,它开启对过程与未来目标的重视。评价不再是单纯的心理测量技术,它需要容纳伦理的、政治的各种价值。到了20世纪70年代,就连专门从事测量的学者伯汉姆(Popham)也在提醒学生要关注伦理维度的新问题。接着,课程实施的过程开始容纳进入课程评价的眼帘。斯克里文的《应答性评价》(ResponsiveEvaluation,1974)、麦克唐纳(McDonald)的《民主的教育》(DemocraticEducation,1974)、里庇(Rippey)的《交互式评价》(Transactionaleducation,1973)论著发表,这些论著鼓励参与者通过各种表达形式参与到课程改革中来,将课程改革拓展到更广泛的参与层面。

三、重构价值:关注评定的“综合”时代

1973年,评价领域开始成为一个专业研究和测验的领域。教育评价者的计划在20世纪70年代开始凸显,例如专业杂志《教育评价和政策分析》(EducationalEvaluationandPolicyAnalysis)、《评价研究》(StudiesinEvaluation)、《评价和方案计划》(EvaluationandProgramPlanning)、《评价新闻》(EvaluationNews)等陆续产生。专业机构如“五月十二日”(TheMay12thGroup)、H区域(DivisionHofAERA)、评价网络(theEvaluationNetwork)以及评价研究社会(TheEvaluationResearchSociety)专攻评价研究。许多大学也开始设计评价方法的课程(不同于研究方法),例如伊利诺斯州立大学(UniversityofIllinois)、斯坦福大学(StanfordUniversity)、波士顿学院(BostonCollege)、加利福尼亚大学洛杉矶分校(UCLA)、明尼苏达州立大学(theUniversityofMinnesota)、西密歇根大学(WesternMichiganUniversity)。各种形式的专业研究机构开始组建,如UCLA的评价研究中心(CenterforthestudyofevaluationatUCLA)、西北地区教育实验室(NorthwestRegionalEducationalLaboratory)、斯坦福评价联盟(theStanfordEvaluationConsortium)、伊利诺斯州教学研究和课程评价中心(theCenterforInstructionalResearchandCurriculumEvaluationatTheUniversityofIllinois)、西密西根大学的评价中心(theEvaluationCenteratWesternMichiganUniversity)、测验研究中心(theCenterfortheStudyofTesting)、波士顿大学评价和教育政策机构(EvaluationandEducationalPolicyatBostonCollege)等。交流会导致各种嘈杂的声音,专业机构之间的合作虽然增多,新的专业组织加强了交流,并降低了评价领域的碎片化。这些机构对评价进行研究,甚至出现了对评价质量进行研究的元研究(meta-evaluation)。学者们在不断寻求适当的方法,增加交流和理解,评价的技术得到发展。

版权声明: 请尊重本站原创内容,如需转载本范文,请注明原文出处:中国范文模板网
原文地址:http://www.fanwenmuban.com/lw/jyll/200559.html

    相关评论

    评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)