- 中国人民大学复印报刊资料转载指数排名研究报告2015
- 武宝瑞
- 2932字
- 2020-08-30 02:08:46
第二节 研制步骤与数据处理
一、研制步骤
转载排名的研制工作主要包括整理和规范基础数据,组织专家在线论文评分,制作排名榜并核查数据和撰写转载排名研究报告四个步骤。2014年转载排名的研制步骤具体如下:
(一)整理和规范基础数据
需要整理和规范的数据包括如下四类(数据处理规则详见本节第二部分):
(1)复印报刊资料学术专题刊数据。整理和规范复印报刊资料专题,确定复印报刊资料系列期刊中哪些为学术专题期刊。只有被学术专题期刊全文转载的论文才计入转载排名的转载量中。
(2)论文基本信息。整理和规范被复印报刊资料转载论文的主标题、副标题、作者、作者机构、原发期刊及其版别、原发刊期、转载专题号、转载专题名称等信息,确保其规范化和标准化。
(3)作者机构数据。修改、规范与补充复印报刊资料转载论文作者的机构信息(一级单位和所属院所),确保作者机构信息的完整性、准确性、规范性和标准化。
(4)报刊基本信息。整理和规范被复印报刊资料转载论文涉及的原发报刊名称、版别、国际刊号、国内刊号、报刊品种、是否核心期刊、是否重点期刊、报刊出版地、发文数、主办单位及其所属系统、特色院校等信息,确保这些报刊的基本信息完整、准确、规范和标准化。
(二)组织专家在线论文评分
在整理和规范数据后,依据评价研究中心研制的“人文社科论文质量评估指标体系实施方案”(注:由中国人民大学人文社会科学学术成果评价研究中心研制的《人文社会科学论文质量评估指标体系及实施方案》,详见:http://www.zlzx.org/files/otherFiles/2011rssi.pdf.,)组织复印报刊资料编辑和顾问等同行专家,在“人文社科论文质量评估系统”中,对每篇论文的学术创新程度、论证完备程度、社会价值、难易程度四个方面进行评分,指标的含义与评估内容见表1—1。
同行评议指标还有两个辅助指标,分别是课题立项和发表载体,也体现了论文形成和发表过程中同行专家的评估意见,一般都与论文质量关系密切,将由系统按客观数据直接赋分。
课题立项是指资助单位所处的层级,包括国家级(21分)、省部级(14分)、其他立项(8分)、无立项(1分)四种。国际、横向和商业项目,将由评委根据实际情况,确定相应等级。由于国际项目较少,不再单独设置细分等级,根据国际资助机构层级,归入国家级、省部级或其他立项;高等院校研究基金资助项目,统一归入“其他立项”。
发表载体是指论文发表当年被认定的报刊分级结果,包括核心报刊(21分)和非核心报刊(11分)。2014年转载排名的“核心报刊”指以下“四大评估体系”中任何一个体系所认定的报刊:(1)北京大学《核心期刊要目总览》(2011);(2)南京大学CSSCI来源期刊(2014图5—2015);(3)《中国人文社会科学核心期刊要览》(2013);(4)复印报刊资料重要转载来源期刊(2014)。
在“人文社科论文质量评估系统”中,论文的刊载报刊信息、所属学科、作者机构名称、评价指标权重等已实现了标准化的元数据管理,还可以通过统计算法辅助评委了解评分分布情况,修正不同评委的不合理评分,完成论文总分的合成计算,自动计算形成每篇论文各指标的得分和总分。
(三)制作排名数据表并核查数据
“人文社科论文质量评估系统”不仅提供了所有被转载论文的按指标得分,还自动统计了期刊和作者机构的转载量、转载率、篇均得分、综合指数等数据。我们按照一系列数据处理规则和制表要求(详见本节第二部分),从“人文社科论文质量评估系统”中导出数据用以制作排名发布的基础数据表。经过对基础数据表进行反复核查,并提供给熟知相关领域学术期刊和机构发展状况的复印报刊资料编辑和顾问审议,分别形成期刊或作者机构的转载量排名表、转载率排名表和综合指数排名表。
(四)撰写转载排名报告
通过对转载数据的统计分析,确定每年转载排名报告的主题,撰写复印报刊资料转载系列年度研究报告,探讨当年中国人文社会科学期刊和学术机构学术布局、学术创新态势、竞争合作状况等呈现出的新特征,为人文社会科学的研究和发展提供参考。2014年的研究报告引入了近年来在多个学科领域中广泛应用的可视化方法,以转载排名的数据作样本,绘制出一系列复印报刊资料转载学术地图,从一个新的视角展示中国人文社会科学研究现状,并通过分析揭示新的发展规律。
二、数据处理
如前所述,我们选取复印报刊资料93种学术系列刊,每年1—12月期间全文转载原发期刊学术论文的转载数据和评分数据,作为研制转载排名的数据样本。受发行周期和编辑出版过程的影响,原发期刊当年刊发的文章,有一部分被选入下年的复印报刊资料中,因此,每年发布的转载排名数据都以复印报刊资料出版年而非原发期刊的出版年为准。
2014年共有1444种原发期刊(不含报纸、图书)被复印报刊资料转载论文1篇以上。因为一种期刊被转载1篇或2篇论文的情况具有较大的偶然性和随机性,统计意义不大,并且被转载论文数量呈现出集聚趋势,即约25%的学术期刊被转载了约85%的学术论文(注:详见《2011年复印报刊资料转载学术论文指数分析报告》,http://www.zlzx.org/newsDetail.action?newsId=cd3f586db73241799e65a3625584746c。),所以我们选取2014年中被复印报刊资料转载论文不少于3篇的期刊和机构作为进入排行榜的基本标准。
在统计转载数和发文数、处理论文分数和排名次序时,遵循以下原则:
(1)严格按国家新闻出版广电总局批准的正式刊号逐一统计。对于一号多版的期刊,转载数、发文数一律合并计算,如《美与时代·创意》、《美与时代·美术学刊》、《美与时代·Beauty》均为同一刊号的不同版本,合并计算其转载数及发文数;对同一家学报有两个刊号、两个版的情况,发文数分开计算,如《武汉大学学报(哲学社会科学版)》和《武汉大学学报(人文科学版)》分别拥有各自刊号,因而,分别计算各自的转载数和发文数。
(2)“增刊”论文不在统计范围。
(3)对于图书、报纸上发表的论文,不纳入期刊排名的转载量统计。
(4)剔除会议消息、报道、花絮、补白等明显的非学术性文章。
(5)被复印报刊资料不同专题刊重复转载的论文,转载量不重复计算,在各学科期刊或机构排名时,取论文最高得分。
(6)在同一种期刊上的论文被拆分为两篇及以上在不同刊期上发表时,转载量按复印报刊资料的实际转载量统计。
(7)在期刊排名的转载量统计中,若组文中的某篇论文少于3000字,则该组论文数相应减1;以此类推。若组文中的每篇论文都不足3000字,则一组文章按1篇计算。
(8)复印报刊资料系列刊转载论文一般比原发报刊出版延迟3个月,如复印报刊资料2013年第1期转载的绝大部分论文是原发报刊2012年第10期刊发的论文,因此,期刊当年“总发文数”指上年10月至当年9月各期发文数之和。
(9)机构排名中,作者所属单位按照“第一作者的第一单位”进行统计。
(10)关于单篇论文得分,针对不同评委在按照“指标体系”对论文进行评分过程中容易出现“松紧程度不一”的情况,在计算期刊或机构的综合指数之前,首先通过“数据修正公式”,将同一评委对同一篇论文的打分,除以该论文平均值并乘以修正系数,以减少这一因素对评分结果的影响。(注:公式详情请参见《人文社科论文质量评估指标体系实施方案(试行)》,见http://www.zlzx.org/files/otherFiles/2011rssi.pdf。)
(11)当期刊转载量相同时,按发文数从小到大排列(当转载量和发文数都相同时,按音序排列);当期刊排名榜的末尾出现并列名次且不能全部进入排名榜的范围时,删掉年发文数量相对较大的期刊;当期刊/机构的转载量、转载率或综合指数得分完全相同时,按音序排列。