首轮高校本科教学评估在人们热议中已经过去三年有余,人们将期待的目光投向新一轮评估。首轮评估受到的过分关注和责难,驱使人们对下一轮评估的思维方向是:如何改进?许多高等教育研究学者和实践者都在探讨这一问题,但大多只从评估本身的视角谈改进,甚至只从水平评估的视角谈改进。本文拟超越评估,从构建我国高等教育质量保证体系的视角,对新一轮评估的方案设计谈一些想法。
一、再反思首轮评估
首轮评估被指责最多的是:分类不够、指标单一、形式主义和弄虚作假等。如果换一个视角,可能会看到首轮评估的一些更深层次的问题。
一是模式选择失当。首轮评估采用的是分等模式,这种模式与评估的实际目的并不完全适应,这就降低了方法论与目的性之间的契合度,造成了评估设计上的一个固有缺陷。每一种评估模式都有其固有特性,如表1所示,评估模式本身并没有优劣之分,关键在它与评估目的的契合度。契合度越高,所选择的评估模式就越好。
认证模式判断的是与规定标准相比“差不差”和“有多差”,关注的是“差者”(或“差项”)。也就是说,是用“差者”(或“差项”)与规定标准比较,因此其基本取向是向下的。这种模式能驱使“差者”(或“差项”)达标。分等模式判断的是与规定标准相比“好不好”和“有多好”,关注的是“优者”(或“优项”),基本取向是向上的,它能驱使争优。审核模式判断的是“是不是”,即该说的“是不是”说了(目标),说了的“是不是”做了(做法),做了的“是不是”有效(效果),无效的“是不是”改了(改进)。关注的是学校自身,不做高校间的比较,基本取向是用自己的尺寸衡量自己,它能驱使学校自律。
首轮评估是在我国高等教育得到跨越式发展,规模扩张与办学投入之间的矛盾凸现,为了保证基本办学质量而进行的教学评估。在这种情况下,采用认证模式进行合格评估,其评估模式和评估目的就会达到高度契合。但遗憾的是,上一轮评估采用了分等模式。这种模式具有选优和比较功能,是一种总结性的评估模式。正是这种模式的选优功能,催生了“优秀情结”,弄虚作假、形式主义等就有了滋生土壤;正是这种模式的比较功能,评估分类就显得尤为重要,不同类型、不同层次的学校怎么能在同一把尺子下比较呢?
二是推进节奏太快。首轮评估用5年左右的时间评估了589所学校,平均每年118所,这种推进节奏在世界高等教育评估史上实属罕见,如表2所示。其间,2008年评估了198所学校,相当于每月评估20所。如此密集的评估,为评估专家的遴选和培训造成了困难。评估专家的水平参差不齐,其中不乏“歪嘴和尚”。一支好的评估专家队伍,即便评估方案存在一些缺陷,也会即时补上漏洞。
三是政府主导过强。首轮评估是靠政府自上而下地强势推进,这种推进的必要性不言而喻,但其弊端也是显而易见的。由于政府与高校之间的特殊关系,使评估主客体间关系从认知性变成了实践性,客体处于被动地位,评估失去了内动力。国外一百来年的评估历史业已表明,成功的教学评估必然是自下而上驱动的(文化机制)而不是自上而下的(科层机制)。高校教学评估的科层机制一定要让位于文化机制,实践性评估主客体关系一定要还原为认识性主客体关系。政府永远不应充当质量和质量保证主体的角色,外部质量保证永远不能代替内部质量保证发挥作用。
四是各方期望太高。评估的本质是价值判断,评估对象就是价值[1]。价值是一个关系范畴,它表明价值主客体之间的一种特定关系,即价值主体的需求与价值客体的属性之间的关系。显然,评估的功能与作用是有限的,它不可能具备教育管理的功能,更不可能具备高等教育的功能。只有当评估的结果被用于管理时,才会产生管理效果。在首轮评估中,人们将评估与高等教育存在的问题直接对应,期望通过评估来解决所有这些问题,将优秀率与教学质量问题直接对应,认为优秀就说明质量没有任何问题。
高校扩招后由于办学条件、教学投入、师资力量和教学管理等不足而引发的教学质量问题,其根源是错综复杂的。有些是高校自身的原因,而有些是客观原因,甚至是高等教育系统外部的原因,有些则是高等教育发展到一定阶段必然要面对的。这些问题有些是一“促进”就能解决的,但有些即是多年积累而需要一个过程才能解决的,有些恐怕是高校“力不从心”的。将评估作为一剂“猛药”,来诊治所有这些症状,显然有些勉为其难。高等教育和高等学校的许多问题,还需要通过其他途径解决,不要给评估搭载得太多,也不要对评估期望得太高,要用平常心对待评估。否则,超载就可能覆舟,药猛就可能会有副作用。
二、超越评估看评估
像上述这些深层次问题,很难通过对原评估方案改一改就能解决。设计新一轮评估方案,不能打“补丁”,而要“超越”,要跳出评估,站在更高的层面来思考。只有想清楚为什么要评估,才能处理好怎样评估,这需要站在高等教育质量保证体系的层面来思考。
1.欧美的经验
20世纪末期,欧美国家的高等教育发展从大众化阶段进入了普及阶段。高等教育规模与投入,特别是传统质量标准与多元化和多样化之间的矛盾凸显,在新公共管理运动的催生下,欧美国家掀起了一场高等教育质量保证热潮。
美国的高等教育保证制度已有近百年的历史,受高等教育地方分权和高校自制传统的影响,其高等教育质量保证制度呈现两个明显特色:一是自下而上,以地方和学校为基础;二是多样性和多元化。经过长期发展,美国已形成了教育质量保证的多种形式,包括院校认证、专业认证、联邦政府数据收集、学术项目定期评审、从业资格证书考试、大学排名和学生学习效果调查以及毕业生跟踪调查等。由于地方和高校有很大的自主权,这给各地各校提供了因地制宜发展各种质量保证制度和措施的可能性,从而形成了美国高等教育质量保证制度的多样性和多元化。正是这种多样性和多元化,使得每一所美国高校都能够找到自己的位置,根据自身的条件,办出特色,较好地满足了社会多样化的需求。
欧盟国家于1999年开始执行博洛尼亚进程,2000年前后几年所有欧洲国家都成立了国家级高等教育保证机构,2002年组建了欧洲高等教育质量保证协会。该协会质量保证体系是在吸收美国经验的基础上,在欧盟和国家层面上建立的质量保障体系,以相对统一和规范为特色。
该协会制定了一套高等教育质量保证标准[2],即《欧洲地区高等教育质量保证标准和指南》,其包括四个标准,①内外部高等教育质量保证活动的共同标准(即质量保证总标准)。②供高校使用的内部质量保证标准(即内部质量保证标准)。③供校外评估机构使用的外部质量保证标准(即外部质量保证标准)。④供国家或社会机构检查外部质量评估机构的评估标准(即元评估标准)。这是一套比较完整的质量保证标准,从内部到外部再到元评估,三者构成了一种递进和制约关系,且都必须与质量保证总标准保持一致。其特点之一是强调统一性,这必然要以牺牲多样性为代价。欧洲经济互助组织的研究表明:该协会的这种高等教育质量保证体系强化了政府和学校的一级权力,弱化了院系和专业的权力,妨碍了学术发展的多样化,不利于高等教育的长期发展。
2.我们的选择
建立中国特色的高等教育质量保证体系是必然的,也是必需的。但首先要回答的问题是,建立一个什么样的质量保证体系。欧洲和美国的体系,尽管各自都存在缺陷,但经过多年的发展与完善,总体上较好地适应了各自国情及其高等教育发展需要。事实上,欧洲和美国体系都有可借鉴之处。我们不必完全拒绝欧洲体系的统一性和美国体系的多样性,而是要结合我国国情,在统一性和多样性之间寻找平衡点。欧洲体系的重心较高,在欧盟和国家层面;而美国体系的重心较低,在院系和专业层面。欧洲体系被批评为以牺牲学校和基层学术组织的多样性来换取国家和欧盟的统一性。它忽视了高校“底部沉重”这个基本特征,必然会遭到来自底部的抵抗。美国的高等教育能表现出较大的活力,则在于大学自治、学术自由和多样化被认为是其法宝。在借鉴欧美体系时,还需考虑行政模式的差别。在高度分权的美国,要在国家层面建立统一标准是比较困难的,而我国的行政模式与欧洲比较接近。就高等教育质量保证体系建设而言,美国、欧洲和中国形成了一个先后时序。显然,最适合我们借鉴的是欧洲而不是美国。因此,我国高等教育质量保证体系的建设思路应是:第一阶段,借鉴欧洲体系建立起重心较高的以规范性和统一性为特点的体系框架;第二阶段,逐渐转变,向美国体系低重心的多元化方向发展。为了使这两个发展阶段能前后衔接,顺利过渡,要在第一阶段的框架中为第二阶段的多元化留下足够的发展空间。
3.体系框架
根据上述我国高等教育质量保证体系建设思路,可提出一个“143”的高等教育质量保证体系建设框架:即1套质量保证标准、4种考察方式和3层管理模式。这个体系框架要在第一阶段(至2020年)搭建完成,同时为第二阶段向更加多样化的方向发展留有空间。
1套质量保证标准:标准是统一的前提。我国高等教育刚刚经历了以规模扩张为主要特征的跨越式发展,规范化仍是质量保证的基本要求。加之我国市场机制对高等教育的牵动尚不突出,在国家(地方)办和国家(地方)管的体制下,行政主导很强势,建立一套类似于欧洲的质量保证标准是可行的,也是十分必要的,它是现阶段质量保证的基础。这套质量保证标准的构成及其逻辑关系如图1所示。
这套标准,对高校内外部质量保证活动均做出了规范与要求。高校内部质量保证是基础、是核心,外部质量保证通过内部质量保证才能发挥作用。“高校是质量保证的主体,要对高等教育质量和质量保证负责。形成质量文化,建立完善有效的高校内部质量保证体系,是高校内部质量保证的核心。质量保证体系在体现统一性和规范化的同时,应特别强调多样化和创新。对外部评估机构及其评估行为做出规范与要求,一方面是外部评估制度的内在要求(所谓元评估),另一方面也为评估主体的多元化和发展第三方评估留下了空间。
4种考察方式:第一阶段应重点采用院校合格评估、院校审核评估、专业评估和高校办学状况信息系统4种考察方式。
一是关于院校合格评估。对未经历首次评估的新建院校采用院校合格评估方式进行评估,它大体相当于美国的院校认证,采用的是认证模式。合格评估要设定一个最低质量标准,基本上起到“准入”的作用,是高等教育的“守门员”。对新建院校实行合格评估要坚持“4个促进、3个基本、4个引导”。4个促进:即促进教学投入,促进教学建设,促进管理规范,促进质量提高。3个基本:即教学条件基本达标,教学管理基本规范,教学质量基本保证。4个引导:即引导学校找准办学定位,引导学校明确培养目标,引导学校增强质量意识,引导学校谋求特色发展。此外,还应该探讨将新建院校的合格评估前移,用合格评估的方式来审定新建院校办学资格的可能性。
二是关于院校审核评估。对通过合格评估的院校进行审核评估,这是英国及其原殖民地国家比较成功的做法。从国(境)外审核评估实践和成功经验来看,审核评估评的是学校内部的质量保证体系。审核评估的基础是学校自评,它是一种由外部推动内部的评估模式,其要义是对自评结果进行“核实”,其特点是不分类、不设指标体系、不做结论[3]。由于是按照学校自设的目标与标准进行评估,故从理论上讲每一所被评学校就是一个类。因此,审核评估自身就可解决评估中的“分类”问题。由于审核评估是用“自己的尺子量自己”,外部审核只是看“尺子对不对”、“量得准不准”,故它只需规定一个评估范围,无需设置指标体系。审核时,就“范围”中的每一项关注“四个如何”,即如何说的(目标),如何做的(做法),效果如何(效果)和如何改进(改进)。也就是说,针对每一项内容要考察4个问题:目标是什么?如何达到目标的?如何证明达到了目标?如何进行改进的?由于学校的目标不同,这种以检查学校自身目标达成度的评估,必将起到鼓励学校办出特色的作用。由于审核评估不设统一的指标体系,不与其他学校比较,是被评学校自己比自己,故不做评估结论,评估结果用写实性的审核报告来反映,肯定成绩,指出不足,提出改进建议。因此,审核评估还能解决分等评估中的“攀比”问题。
三是关于专业评估。对于通过合格评估的院校,在开展院校审核评估的同时,还要进行专业评估。院校审核评估和专业评估是两种相对独立、互为补充的评估方式,很难相互替代或合二为一。例如,美国院校认证和专业认证独立并行,且要求通过院校认证后方可进行专业认证。从国(境)外评估理论与实践来看,院校评估侧重于管理(management),而专业评估侧重于学术(academic)。将院校评估与专业评估分开独立进行,至少有如下几个优点:①可以提高评估的针对性。一个侧重于管理,另一个则侧重于学术。②可以减小评估专家的“认知距离”。一个选择管理专家,另一个选择学术专家。③可以减少对评估院校的干扰。专业评估会起到化整为零、变总体“干扰”为局部“干扰”的作用。由于考察范围较小、问题相对集中,考察时间也会缩减。④可以精简评估专家队伍。
四是关于高校办学状况信息系统。建立高校办学状况信息系统,是高等教育质量保证的重要内容。其实,信息系统本身就是一种评估。这种评估,不受时间和空间的限制,人人都是评估专家,依据是所公布的信息,标准是每个人的价值尺度。我国也在建立高校本科教学状态数据库,已初见成效。但有两个问题值得引起重视:一是数据库不要太复杂;二是要与其他数据统计衔接。此外,建议数据库的建立不要与新一轮评估直接挂钩,或为了评估而建立一个数据库。当然,评估要核实高校信息公布的及时性和准确性,但并不是依据这些信息进行评估。
除了上述在第一阶段需要政府重点推行的几种评估形式外,要适当鼓励和引导一些民间的评估形式,如高校和专业排名、专项调查等,为第二阶段过渡到多元化评估做好准备。
3层管理模式:根据我国的行政模式和高等教育管理体制,政府对高校外部质量保证的主导作用是不宜削弱的。在上述的4种评估方式中,高校办学状态信息系统当然要在国家层面建立,而其余3种评估方式可按照“谁办谁管”的原则分3层管理,即教育部以高等教育教学评估中心为主体负责开展教育部所属院校的评估;省级教学行政主管部门负责开展地方院校的评估;行业和专业协会负责开展专业评估。
在第一阶段,要构建一个高等教育质量保证管理体系。以教育部高等教育教学评估中心为主体组建全国高等教育质量保证机构,例如“全国高等教育质量保证协会”(用“协会”强调其学术性且有利于向民间组织过渡);以省、部委以及全国性专业协会为单位组建成员机构,例如“XX省高等教育质量保证协会”。全国协会除了开展教育部所属院校的评估外,还要负责对下属成员协会的管理及定期评估。全国协会还要有一支学术队伍,开展高等教育质量保证研究、制订质量保证标准、推动评估基础(文化、制度、法律、政策等)建设等。这个管理体系的建立会为第二阶段向多元主体过渡打下基础。
三、审视新一轮高等教育评估——审核评估
有观点认为,审核评估方案设计也要分类、要设立指标体系。问题的关键在于:如何把握新一轮评估,如何把握审核评估。也就是说,新一轮评估到底要达到什么目的。我们认为美国高等教育认证协会(CHEA)坚持的做法是值得我们借鉴的,即当学校通过首轮评估达到合格标准以后,就应该将评估的重点转向考察学校办学目标的达成度,以帮助学校改进工作,鼓励学校办出特色,维护高等教育的多样性。审核评估模式就体现了这种思想。既然选择了审核评估模式,就应该从首轮水平评估的框框中跳出来,不要总想在审核评估方案的设计中如何体现对水平评估中存在问题的改进。事实上,这是两种不同的评估模式,由于它们有不同的特性,一种评估模式的缺点,在另一种评估模式中可能会自动消除(例如分类问题)。另外,也不宜将一种评估模式的做法套用到另一种评估模式中去(例如指标体系),以免破坏评估模式的固有特性。因此,在新一轮审核评估方案设计时要在思想观念上有两个突破:一是要跳出评估看评估;二是要跳出水平评估看审核评估。基于这种观点,新一轮审核评估方案设计应该是又一征程的“接力棒”而不是“打补丁”。
所以,新一轮审核评估的名称建议为:普通高等学校本科教学审核评估。审核评估的目的是:保证和提升本科教学质量。审核评估的指导思想是:促进内涵建设,推动改革创新,完善保障机制,引导特色发展。
1.审核评估的基本原则
审核评估坚持以下基本原则:主体性原则、多样性原则、发展性原则和合目标性原则。
主体性原则。高校是教学质量的主体。保证教学质量的责任在高校,在高校内部与教学质量相关的所有组织和个人。高校内部质量保证是内因,外部质量保证是外因,外因只有通过内因才能发挥作用。审核评估应是主动式评估,应是高校内部质量保证基础上的外部质量保证的一种方式。
多样性原则。要充分尊重高校的办学自主权,充分考虑高校办学和人才培养的多样性以及教学质量的多元化。引导高校根据国家和社会需要,结合自身条件,进行培养定位、确立培养目标、制定质量标准,形成培养特色。不是用一把“尺子”衡量所有的高校,而是用学校自己的“尺子”衡量自身。审核评估不做学校之间的横向比较,只做学校自身的纵向比较。
发展性原则。审核评估更加注重过程与结果之间的关系,更加注重资源的有效利用,更加注重过程的改进和内涵的提升。审核评估应以质量改进为导向,评估不是为了发现质量问题,而是为了使这些问题得到解决,使质量得到持续提升。
合目标性原则。合目标性是审核评估的基本方法论。审核评估实际上是一种目标导向的评估,主要围绕着“四个如何”展开,即学校是如何确定自己的目标的(如何说的)?学校是如何达到自己的目标的(如何做的)?学校是如何证明自己达到目标的(效果如何)?学校是如何改进(目标、做法、效果)的(如何改进”
2.审核评估方案基本框架
审核评估方案基本框架可以简称为“113”,即1个“标准”(《普通高等学校本科教学质量保证标准》,以下简称《质量保证标准》)、1个“办法”(《普通高等学校本科教学审核评估办法》,以下简称《评估办法》)、3个“指南”(《普通高等学校本科教学审核评估校内自评指南》、《普通高等学校本科教学审核评估专家进校考察指南》和《普通高等学校本科教学审核评估审核报告编写指南》,以下分别简称《自评指南》、《考察指南》和《编写指南》)。
关于《质量保证标准》。与首轮评估一样,审核评估也有三个重要阶段:学校自评、专家进校考察和形成审核报告。学校自评是审核评估的基础,所谓审核主要是对自评报告进行“核实”。无论学校自评,还是专家进校考察,都需要一个依据,这个依据就是《质量保证标准》,它可起到“评估标准”的作用。
关于《评估办法》。《评估办法》是审核评估的总纲,反映了对审核评估活动的基本要求与规范。具体包括审核评估的目的、指导思想、评估原则、审核范围、评估程序(主要环节及时间节点)、专家遴选与培训、学校自评、评估报告和评估保持等。
关于《自评指南》。自评是审核评估的基础。白评工作是否到位,是审核评估能否见实效的关键。《自评指南》指导学校做好自评工作,具体包括自评工作的组织、程序、环节和要求等,并从格式和内容上对自评报告的编写提出要求。
关于《考察指南》。《考察指南》是对专家进校考察行为提出要求与规范。具体包括考察内容、方式方法、日程安排和工作纪律等。
关于《编写指南》。评估报告是审核评估工作面向公众的“脸面”,审核评估的价值及可信度在很大程度上是通过评估报告反映出来的。因此,评估报告的编写对审核评估至关重要。《编写指南》主要包括评估报告的内容、格式及其编写与发布程序等。
3.审核评估的实施要点
审核评估不是打“补丁”,而是超越,是我国高等教学评估实践的进步与发展,也是我国高等教育质量保证体系的进步与发展。要上一个新台阶,就会面临新问题。就新一轮审核评估实施而言,必须重视如下四个方面的问题:
一是校内质量保证体系。质量形成于过程,保证质量靠的是质量保证体系。审核评估重在过程,而其指向是质量保证体系。也就是说,审核评估不是直接评质量(结果),而是前移至过程,通过评质量保证体系来间接评质量。这也是国(境)外高等教育评估的一个重要趋势。尽管首轮本科教学评估有力地促进了教学管理,高校初步建立了内部质量保证体系,但它还不完善。我国高校的内部质量保证体系,还只停留在教学管理层面,是对教学环节进行质量监控的一种手段,缺乏对人才培养的顶层设计和资源保障,没有涵盖人才培养的全过程和所有要素。此外,我国高校的内部质量保证体系只是初步具备了监督、调控功能,但缺乏改进功能。一个具有完善功能的内部质量保证体系应该具备“闭环”特征,即通过监督功能发现偏差,通过调控功能纠正这些偏差,再通过改进功能分析产生这些偏差的原因,并对系统进行改进。通过审核评估,引导高校完善内部质量保证体系,是新一轮评估的重要目标[4]。为了达到更好的效果,应该尽快研究制定前述的《高校内部质量保证标准》,以指导高校建立和完善内部质量保证体系。
二是评估专家的遴选与培训。审核评估是一个基于事实判断的同行专家评审过程。它不是用一把统一的尺子去量所有的学校,而是用学校自己的尺子去量学校自身。也就是说,对于每一所学校,评估专家都要面临新问题。此外,审核评估除了首轮评估所关心的“量得准不准”的问题外,还要关心“尺子对不对”的问题,所以对评估专家的要求更高了。因此,评估专家的遴选与培训,是审核评估成功的关键因素之一。评估专家组成除了教育教学专家外,适当考虑系统外(例如企业)专家和学生参与,也是国(境)内外高等教育评估发展的一个趋势。
三是专业评估。专业评估与院校评估是一种互补关系。如果能在推进院校审核评估的同时积极推进专业评估,将会收到良好的整体效果。我国在专业评估上已有良好的基础,关键是如何进一步规划和整合。
四是信息系统。普通高校办学状况信息系统不仅是高等教育质量保证体系建设的重要内容,而且与审核评估也有互补作用。院校收集、利用和公布信息,已经成为国外审核评估的重要内容。我国正在研制普通高等学校本科教学状态数据库,这对信息系统建设具有重要意义。但尚需从有效性(例如突出核心数据)、完整性(例如不限于本科教学)和可靠性(例如保证原始数据的真实性)等方面进行改进。
四、结束语
首轮本科教学评估存在一些深层次的问题,属于顶层设计的问题,难以通过修改和完善原评估方案就能解决。进行新一轮评估方案设计需要超越评估,要以构建我国高等教育质量保证体系的视角来思考与规划。考虑到我国高等教育的发展现状和行政模式,在构建我国高等教育质量保证体系时,首先要借鉴欧洲模式建立起一个重心较高的以规范性和统一性为特点的体系框架,然后逐渐转变,向美国模式重心较低的多元化方向发展。我国高等教育质量保证体系的构建,应在原有基础上,尽快制定一套国家层面的质量保证标准。应重点推行院校合格评估、院校审核评估、专业评估和高校办学状况信息系统等4种评估方式。尽快建立教育部、地方教育行政主管部门和行业(专业)协会等3个层面的评估管理机制。