“SCI指标”退下神坛后人情会泛滥吗?

2020-03-19本站

  近日,教育部、科技部印发了《关于规范高等学校SCI论文相关指标使用 树立正确评价导向的若干意见》,这将对中国的学术评价体系造成巨大影响。本文全面梳理了SCI的历史渊源、选文机制和相关的学术异化问题,也评估了该意见对中国学术界可能造成的影响。

  近日,教育部、科技部印发了一份文件《关于规范高等学校SCI论文相关指标使用 树立正确评价导向的若干意见》(以下简称《意见》),可能将在学术圈掀起一场大地震。

  《意见》提出, 当前SCI论文相关指标存在片面、过度、扭曲使用的现象,需要整顿“唯论文”“SCI至上”的风气,并列举一系列相应的纠偏举措:加大发表国内高质量期刊论文的要求、降低 SCI 和影响因子在学术评标准中的地位、收紧论文发表费用、推行论文代表作制度、不将 SCI 论文指标作为招聘和毕业的前置条件。

  SCI是国内外广泛使用的科技文献索引系统。过去二十年来,国内学术界逐渐流行一种做法,把在SCI期刊上发表的论文,称为“SCI论文”,以发表“SCI论文”的数量,评价学者与高校的研究贡献。这种重论文发表数量、影响因子的评价导向常被称之为学界的“SCI至上”或“SCI崇拜”。

  《意见》发布后在民间和学界引发了热议,可以说是有人欢喜有人忧。在微博、豆瓣等社交平台上,不少网友为此叫好,直言“早该打破SCI崇拜了”“SCI害人不浅”。

  在微信公众号“科研圈”上,不少硕博士生表达了自己的顾虑。评价标准改变之后,毕业会不会变得更困难了?推行论文代表作制度后,学生想要毕业,导师却想追求代表作,如何平衡之间的矛盾?还有些博士生则担心今后自己论文能否顺利在国际期刊上发表。

  面对这场评价体系改革,几所高校在接到新京报记者询问时表示目前没有正式返岗复学,还未制定或改变相应举措。

  高校教师与研究人员的心情更为复杂。一方面,“SCI至上”的风气严重制约了学者多样化研究的能力与贡献。另一方面,尽管SCI论文指标存在各类问题,仍不失为衡量一位学者的学术水平、高等院校研究能力的硬性指标。

  一些高校教授在接受媒体采访时便发问,一旦SCI论文指标权重下降,如何保障职称评定、人员聘用评价中的公正性?新京报记者就此采访了同济大学高等教育研究所副教授张端鸿,他谈到很多学者对此产生顾虑的原因:国内的同行评价制度还远未成熟,在这个过程中可能会出现人情泛滥的现象。“过去是单一化的标准,如今不能变成没有标准。”

  SCI在学术圈是绕不过去的词,但很多人并不清楚SCI的内涵,甚至有人误以为SCI是一本或一系列期刊。

  SCI是世界三大科技文献检索系统之一,也是国际公认的进行科学统计与科学评价的主要检索工具。SCI的出版形式包括印刷版期刊、光盘版及联机数据库,还发行了互联网上Web版数据库,其中收录了全世界出版的数、理、化、农、林、医、生命科学、天文、地理、环境、材料、工程技术等自然科学各学科的核心期刊约3500种。此外,美国科学信息研究所还创建了姊妹篇SSCI和A&HCI,分别收录社会科学和艺术与人文学科的期刊。

  作为一部检索工具,SCI没有采取通过主题或分类途径检索文献的常规做法,而是设置了独特的“引文索引”(Citation Index),即通过先期的文献被当前文献的引用,来说明文献之间的相关性及先前文献对当前文献的影响力。这种独特的做法,使得SCI不只是用来检索文献的数据库,也为其用来衡量期刊的科研水平铺下了基石。

  SCI创始人尤金·加菲尔德(1925.9.16—2017.2.26)并不认同以作为检索工具的SCI评价科研人员,“因为它是一个国际标准数据库,用它来评估我们科研人员。在世界上许多国家也是这样做。但是它并不合理。”

  从事高等教育研究的张端鸿与SCI创始人尤金·加菲尔德(Eugene Garfield)、SCI原运营方汤森路透比较熟悉,据张端鸿介绍,SCI每年所收录的期刊经过了非常严格的选刊标准和评估程序。期刊能否入选SCI,往往要经过三道门槛:

  首先,入选SCI的期刊需要是一本严格的同行评价期刊。期刊可以有少量约稿,但绝大部分论文需要经过同行评价的程序,编委会需要将投稿的论文以匿名形式发送给多位相同领域的专家学者来评议,判断其是否达到刊载在本期刊的学术水准。没有严格的同行评价程序的学术期刊就不符合SCI选刊的标准。

  其次,一本期刊能否入选SCI,还需要考察它在国际学术平台上能否得到充分认可。在这其中,学术语言的影响不容忽视。张端鸿介绍道,非英文的SCI期刊非常少,大概百分之一,而将近99%的SCI期刊都是采用英文表述,这当然也涉及英语霸权的问题。

  如果一本期刊符合规范的同行评价,在通用语言中的学术传播力也比较强,最后就要比较期刊的影响因子(Impact Factor,IF)。影响因子是国际通行的期刊评价指标,具体算法是以某期刊前两年发表的论文在该报告年份中被引用总次数除以该期刊在这两年内发表的论文总数。刊载被引用率高的论文的期刊就容易进入SCI。

  通过这些门槛来划定收录的期刊,SCI每年都会做出增减期刊的动态调整。经过几十年的沉淀,SCI已经从一种单纯的文献检索工具,逐渐发展为了衡量期刊学术水平高低的评价标准。

  学术评价体系下,伪造实验数据、篡改图片等事件屡次发生。图为记录小保方晴子事件的日本纪录片《调查报告:“STAP细胞”学术造假真相》(調査報告 STAP細胞 不正の深層 2014)画面。中国科研人员韩春雨也面临过同样的质疑。

  SCI自创立以来已经历大半个世纪,但在上世纪90年代以前,中国学界的很多人对SCI知之甚少。

  上世纪80年代末,南京大学率先引进了SCI,原副校长董健教授建议将其作为科学评价的重要指标。1995年国务院批准启动了“211”工程(以及之后的“985”工程)之后,建设世界一流的大学、世界一流的学科成为高等教育的重中之重。想要获得国际社会和学界的认可,SCI论文的标准就看作是适合中国高等教育发展的一项评价指标。

  由此,SCI论文发表数不再只是学术期刊的评价标准,也成为了高等院校的研究能力、学者的学术水平的评价指标。中国SCI论文的发表也从此走上了极速飙升的轨道。

  据相关报道,1949年中国学者的SCI论文数只有470篇。到1995年,中国的SCI、SSCI和A&HCI论文数首次超过了1万篇。2018年,中国科研人员发表SCI论文的总数已达到39万余篇,较2017年(33万余篇),约增长18.2%,数量上连续10年排名世界第二。根据SCI运营方科睿唯安公司2019年发布的报告,在过去11年里,中国一共发表了29037篇高被引论文,在数量上也仅次于美国。

  考虑到SCI倾向于收录英文发表的期刊,教育主管部门也同时推进中文引文索引工具的建设,“中国科学引文索引”(CSCI)、“南大核心”(CSSCI)、“北大核心”等一系列数据库也在这样的背景下孕育而生。

  从作为索引工具的数据库,到变成筛选高质量期刊的标准,再成为评价具体学者与机构学术能力的指标,SCI在中国的这些年与设计者的初衷渐行渐远。

  对于行政管理人员来说,SCI为他们衡量学术水平、考核评定人员提供了一条快车道,简单又便捷,省去了很多麻烦。

  在大学老师评职称过程中,SCI论文数量是非常重要的指标。按照一般“211”高校的要求,只要能在中科院期刊分区表上的二区以上的期刊发表3到6篇SCI就可以破格提升为副教授,5到8篇则可以直接申请评选教授。

  不同的高校还设有分门别类的激励制度。一些“985”高校规定,学者在《Nature》《Science》等顶级期刊上发表一篇论文,就可获得2万元至15万元不等的现金奖励。有些高校更是明码标价,论文的影响因子大于2奖励6000元,小于2则奖励3000元。

  除了高校资源以外,SCI也与地方政府的人才引进计划息息相关。以2019年深圳市颁布的“孔雀计划”为例,近5年以第一作者(含与第一作者具有同等贡献作者)或唯一通讯作者,在国际高水平科技期刊(期刊所在各专业领域位于《期刊引用报告》JCR一区)发表论文3篇,就可以申报C类人才,同时奖励160万元。

  当行政主管部门把数据作为评定科研机构、筛选聘用学者、划定津贴奖励的硬性指标以后,这种功利性导向让发表SCI论文彻底沦为了一场无关乎论文本身、只追逐数字的狂飙竞速。

  被扭曲的SCI指标也常被指为种种学术圈乱象的始作俑者。论文代写,枪手横行,抄袭造假,这些乱象早已老生常谈。为了达到足够的SCI论文数,不少国内学者不吝重金“购买”国外期刊的版面费,前些年有媒体爆料,单在这一项上,中国每年向国外输出的资金多达数十亿元。版面费贿赂、论文挂名已经形成了一条灰色利益链。

  今年一月,国外权威期刊上的一篇“鸟屎论文”轰动一时,该文作者亲身试验来讥讽学术圈层出不穷的灌水现象。石墨烯、人工智能、机器学习,这些热门课题背后总有一大堆粗制滥造、毫无价值的灌水论文。

  而早在2005年,不少研究人士已经发文警示,中国的SCI论文的规模虽然庞大,但论文被引用率远低于国际平均水平。

  前不久,国内两本核心期刊相继爆出“师娘赞”“父子文”的奇葩现象,似乎只是学术乱象的冰山一角。部分学术期刊为了提高自身的影响因子,要求论文作者大量引用本刊的文章。在SCI指标的威逼利诱之下,这种“自我引用”也已经成为国内学界公开的秘密。

  张端鸿,同济大学高等教育研究所副教授、同济大学教育政策研究中心主任。主要从事教育政策与法规、院校战略与评估领域、教学促进与教师发展的研究。

  新京报:很多读者知道SCI论文数量与学者的职称与科研经费挂钩,但并不了解高校的职称评定与人员聘用的具体流程。你能简单介绍一下,一般高校的人员录用流程是怎样的吗?SCI指标在其中扮演着什么样的角色?

  张端鸿:在理工科人员聘用的过程当中,一般分为三个阶段。高校的人事处会设置一个基本门槛,先排除一批SCI等指标不达标的申请人。剩下的达到资格的学者,就送出去给外校的同行进行评审,这是第二个阶段。外校同行经过匿名评审,判断候选人是否达到了该校的标准,作为一个参考意见。最后,本校同学科的教授会通过投票来表决,是否录用这位学者。

  在这三个环节中,SCI指标都在发挥主导作用。首先,SCI论文数是一个前置性的准入条件,达不到标准就不具备资格。在外校与本校的同行评议中,SCI仍然是一个重要的参考指标。如果两位学者的学术能力在各方面相差无几,SCI论文数量就成为了同行作为判断的依据。甚至,在最后的环节中,即使科系通过录用程序上报给学校时,学校仍然能以SCI不达标为由否决科系的人事聘用。层层叠加的影响,让SCI在高校评定和考核中的实际影响力不断被放大。

  新京报:有些学者认为,高校与科研机构当初把SCI论文数列入职称评定的指标,初衷是为了矫正学风,用相对客观的硬性指标减少“开后门,靠人情”的因素。你认同这种说法吗?

  张端鸿:以SCI作为衡量学术水平的标准,与国内学界的同行评价制度不够完善有很大的关系。

  在评价一个学者的学术能力时,同行评价发挥着重要的作用。一篇专业学术论文的水平高低与否,往往只有相关领域的同行才有资格和能力给予公允的评价。以国外的经验来看,同行评价制度的完善与学术共同体的建立,往往需要几百年的时间。

  中国的学术与科研从改革开放才慢慢步入正轨,前后只有几十年。即使在今天,同行评价无法得到业内与社会的信任。让学术同行评判学者,在学术管理部门看来仍然存在很多漏洞。中国学术圈常见“武大郎开店”的现象,一些高校教授、系主任由于担心自己的职称评定与科研经费受到影响,时常不能容纳、有意排挤比自己学术水平更高的学者。

  为了遏制高校学科内的逆向淘汰现象,行政主管部门在考核评定时需要设立一些相对客观的硬性指标,避免受到人情因素的影响,规避“武大郎开店”现象的产生。基于这样的考虑,SCI与评价方法的制定者也就一拍即合了。初衷也许是好的,但追求SCI论文数量的不良风气愈演愈烈,却是政策制定者始料未及的了。

  新京报:原本作为一个索引工具的SCI,被不断异化,变成争名逐利的目标,你觉得主要的问题出在哪里?

  张端鸿:我一直认为,SCI主要发挥的是索引功能,而不是评价功能。这是其一。第二,SCI也好,SSCI也好,即便它具有一定的评价作用,实际上最关键的是对期刊的评价,因此你不能把它用来评价论文,也不能把它用来评价学者或大学。我和SCI的创建者们做过非常多的交流,他们也都认同这个观点,也认为这是中国的学术管理对SCI的一种误用。问题不在于SCI本身,而是整个社会的评价体系出现了问题。

  我们在看一所大学究竟好不好,往往缺少非常直观的依据。各类大学排名似乎给了我们快捷的比较方式,人们乐意去看,媒体愿意宣传,结果就对社会、政府和大学自身造成了很大的潜在影响。

  然而,大学排名靠谱吗?以SCI为主的科学计量指标是大学排名的核心指标,对整个排名的结果影响很大,因为它可以做全球范围内的比较。从大学排名的角度来说,这些数据可以用比较低的成本来获得。作为数据库的提供商,他们也很乐意把数据提供给大学排名,因为你一旦使用了我的数据,它就变成了一个指挥棒,左右着社会对大学的评价。

  一些高等教育专家虽然探讨过,建议让联合国教科文组织出面,制定一些规范和标准,对大学盘排名这件事进行引导,但是操作起来确实太难了,无法真正实施。

  从政府的角度来说,教育和科技主管部门在评判大学和研究机构的时候,需要进行国际比较,所以在国家层面,每年都会统计各大学一年发了多少篇SCI论文,这是政府的统计排序。政府主管部门下属的事业单位(比如教育部学位与研究生教育发展中心)也会进行大学的学科评估。这不仅仅是社会第三方的排名,也有政府部门背书,增加了权威性,实际上已经影响到了大学管理者对此的基本判断。SCI同样是学科评估的核心指标。除此之外,很多省份在“双一流”建设的地方投入中,也会把SCI作为一项考核指标。

  从校领导的角度来说,他们必须要重视这件事,于是就会抓SCI论文的总量。但是,能够真正产出SCI论文的学科毕竟是有限的,有一些学科的成果发表不适用于SCI论文的形式。然而学校仍然以这样的指标去评价这些学科,最后相关领域的学者只能被逼去发一些SCI论文。

  我们可以发现,SCI论文的主力来自理科和医科,一所大学的理科和医科比较强,它在这个指标里就会好看。如果这所大学是以人文社科或工程为主,你的指标就永远不会高。从全国的布局来看,以理科和医科作为主干学科的大学,在中国高校中所占比重其实并不高。但是迫于无奈,这些大学为了让自己的数据更好看,只能硬着头皮去建理学院和医学院,同时丢失了自己原来的特色。

  理工教师想要申请课题,评长江学者、“杰青”、“优青”等人才计划,等等,都需要有SCI发表数作为底子。所以从评价大学到评价学科,再到评价学者,几乎每一个环节都把它作为核心的依据和指标,最终,从上至下的叠加影响,导致我们高校和学者的行为产生了比较大的偏差。

  新京报:SCI最初是在美国创建的文献索引工具,之后逐渐在全球范围内得到了普遍的认可。国外的高校与学者是如何看待SCI的?

  张端鸿:国外的大学需要分情况来说,应用技术类大学肯定是不关心SCI指标的。至于国外顶尖的研究型大学,应该说在学术管理中也是重视SCI的。因为SCI指标可以帮助筛选一批学者,能够让学科拥有非常强的学术竞争力。

  与国内不同的是,国外高校对SCI的重视,主要停留在学科层面,也就是说,它的管理重心是很往下的。从学校层面来讲,他们非常尊重各个学科的自主裁量权,不会去管这么细致的事情。这就有一个好处,不同学科可以制定自己的标准。

  物理、化学、材料、生命科学、医学等学科的管理者,当然会重视SCI指标,不然用什么来评价呢?

  但在人文社科领域就不同了。我访谈过一些人文社科领域的国外学者,他们认为自己的研究成果发表在什么样的期刊上根本不重要,重要的是有没有人来看你的作品。他们关心的是作品本身。比如说,一位社会科学领域的学者,没有发表任何SCI或SSCI论文,但编了一本具有国际影响力的工具书。在国外学界看来,他的学术贡献并不比论文等身的学者少。

  一位访谈者提到,有些国外学者多年没有发表任何论文和著作,只有未完成的手稿。他们认为,即使是手稿,也可以作为评判学者能力的依据。另一位学者主编了一本院系内部的电子刊物,甚至没有正式刊号,数据库都查不到。但是这本刊物在圈内的影响力很大,其他学者纷纷引用,这样的学术成果也能得到认可。所以说,在国外,不同学科的评价体系大相径庭,评价的方式也比较多样化。

  新京报:《意见》出台之后,一些教授已经对外表示了顾虑,担心SCI指标的权重降低之后,评价体系的标准变得模糊,会出现更多“走后门”的情况。

  张端鸿:这些年来,很多人早就看到了“SCI至上”带来的弊端,这些弊端甚至在伤害学术的根本,在掐断学术创新的源泉。这些负面因素大家都认识得很清楚。但是仍然有大量的学者会认同SCI,不希望把这个标准废掉。

  我们常说,两害相权取其轻。在“以刊评文”的前提之下,每一个个体通过自己的努力和运作,至少是有机会实现个人的目标。但是,如果你把这个指标废掉之后,又该如何去评判呢?

  更多的学者对中国目前的同行评价体系是没有信心的。因为同行评价制度还远未成熟,那么在这个过程中,最后就可能会出现人情泛滥的现象。这是很多的学者产生顾虑的原因。过去是单一化的标准,如今不能变成没有标准。新的标准必须是硬杠杆,而不是所谓的院系全体教师投票决定,或者由外部同行专家来进行评定。因为在实际运作中,这会造成很多潜在的不公平。

  张端鸿:本轮政策应该属于降温,对被误用过度的指标进行纠偏。它并不是说意味着我们要彻底去改变原来既定的方针。

  在我看来,《意见》要求更多的是指向各层级的学术管理部门。作为教育主管部门,在修订评价标准时注重不同学科评价的差异化需求,不要过分地看重所谓的大学排名,政府下属的专业机构也不要过度地采信。尽管社会民众爱看排行,但相关部门需要降低它的杠杆作用,消减负面影响。

  从政府管理的角度来讲,尽量少地“掀锅盖”。比如“双一流”项目,政府投入上千亿资金,不找证据来证明投入的有效性,似乎说不过去,但实际上这是没有必要的。高等教育的投入是一个长周期行为,需要给予大学信任和空间。管理模式转变之后,大学也会回归学术初心去办学。

  在评判学科的时候,主管部门不能以公司化的绩效管理来要求各个学科。学科承担过多不必要的压力,最终都会转嫁到每个老师身上。放松学科的管理,教师的学术生产方式就会多样化,学术活动就会更加自由,学术的创造力才会被释放。

  不同领域、不同形态的学术都应该获得“最高的学术表达”。如果一位学者喜欢做实验科学,他可能发表很多的SCI论文。有的学者一心扑向古籍的修缮和整理,他没有发很多SCI论文,但是让遗落的史料得以传世,这不也是重要的学术贡献吗?如果一个学者不喜欢写论文,他只喜欢写书,那么著作就应该成为评价他的重要方式。有的学者喜欢做政策咨询,如果他的报告能够对政府的决策产生重要影响,我们也就应该认可他。

留言与评论(共有 0 条评论)
   
验证码:

搜索