我国社会学期刊文数据引用行为

时间:2024-02-23 点赞:45710 浏览:89370 作者原创标记本站原创

本文是一篇社会学论文范文,社会学有关毕业论文格式模板,关于我国社会学期刊文数据引用行为相关硕士学位毕业论文范文。适合社会学及数据及社会科学方面的的大学硕士和本科毕业论文以及社会学相关开题报告范文和职称论文写作参考文献资料下载。

摘 要:文章选取《社会学研究》和《中国人口科学》2003~2014年间每年第1期刊载的论文为样本,对其数据引用行为进行统计分析,研究了我国社会学领域期刊论文的数据引用现状,比较了不同期刊的数据引用行为,统计了领域内论文数据引用的频次分布及高数据引用论文的特点.研究发现社会学领域内数据引用行为较多,引用不规范的情况大量存在.各种年鉴及人口调查资料是社会学研究的主要数据来源,但其中的不规范引用也相对较多,而对已发表的论文中数据的引用,其引用行为通常较为规范.

关 键 词:数据引用社会学学术规范

中图分类号:G250.25文献标识码:A文章编号:1003-6938(2014)06-0088-06

DataCitationBehiorintheJournalPapersofSociologyinChina

AbstractAsampleofarticlerom“SociologicalStudies”and“ChineseJournalofPopulationScience”during2003-2012wasselectedthroughsystematicsamplingmethod.Thedatacitationsinthesearticleswerecountedandanalyzed.TheauthorsstudiedthedatacitationbehiorinthejournalpapersofSociologyinChina,andparedthedatacitationbehiorbetweendifferentjournals.Thedistributionofdatacitationwasanalyzedandthetopdatacitingpapersarepresentedwiththeircharacteristics.TheresultshowedthedatacitationsinSociologyarefrequent,butinwhichmanynon-standardsituationsoccurred.AllkindsofyearbooksandtabulationsonthepopulationcensusarethemajorsourceofdataforSociologicalstudieollowedwithmanynon-standardcitations.Ontheotherside,datacitationrompublishedjournalpapersareusuallymorenormative.

Keywordsdatacitation,sociology,academicnorm

1引言

在已有数据的基础上开展研究是科研的基本模式之一,数据共享是现代科学发展的必然需求[1],而数据引用则是数据共享的成果体现.早在1982年,著名的科学计量学家HowardD.White就指出社会科学学者应该在著作中像引用图书或论文一样以规范化的格式引用他们所使用的数据[2].然而光阴荏苒,文献引用虽已发展极为成熟,其重要性也得到各领域的公认,但数据引用却始终未受到充分重视.

要完善数据引用规范,并进一步发挥数据引用在科学评价中的作用,首先要了解当前的数据引用状况.国内外目前关于数据引用行为的研究才刚起步,且已有研究所选取的样本通常较小,很难全面、真实地反映各个学科的数据引用现状.从已公开发表的成果来看,ValerieE选取了6种期刊上的500篇文献作为样本进行研究,其样本量相对较大,经统计后发现只有14%的文献给出了所使用的数据集的唯一标识,12%的文献提到了其他要素如数据集作者和数据仓储的名称,很少有文献将其对数据集的引用纳入到参考文献中[3].此外,HaileyM和MarkP从人文科学、社会科学和自然科学三个类别中选取了44种期刊进行有关数据引用声明及格式要求的调查,发现约有一半的期刊给出了数据引用指南,但经过对其中65篇论文进行内容分析后,发现大部分论文在数据引用方面有较大的缺陷[4].国内的相关研究目前还尚为少见,墨愚曾选取《新华文摘》2001至2003年间的60篇有数据引用行为的经济类论文进行了统计,发现在这些论文所涉及的所有281个(组)数据中,78.15%的数据没有任何实质性出处说明,从而说明数据引用的问题较为严重,有学术失范之虞[5].需指出的是墨愚的调查以数据(组)为单位,而非以论文为单位,且研究关注点主要在于数据引用方面的学术规范、编辑责任和出版物质量.

从已有研究成果可以看出,目前的关注点主要在于数据引用是否规范.然而对数据引用行为的研究,其意义绝不仅限于规范问题,还能从中发现学科内数据引用的特征,分析其变化趋势,从而有助于理清学科发展的脉络.

全球领先的信息供应商汤森路透推出的数据引用索引(DataCitationIndex,DCI)中,生命科学、物理学的数据占大多数,社会科学的数据约占五分之一[6].而在社会科学中,社会学(含人口学)的数据又是其主要组成部分.这说明数据引用对于社会学研究独特的重要性,同时也说明在对我国社会科学的数据引用现状进行分析时,社会学是重要的研究领域.首先,社会学是一个与数据密切相关的学科,对该学科的数据引用行为进行分析研究不但有利于提升学科数据引用的规范性,还可以促进学科研究与发展.另一方面,大数据时代,学术研究的主导范式已经转向了以数据为主导的研究范式,各学科研究要注重对数据的重视,在这方面,社会学可以为其他学科提供较好的借鉴.国内外目前尚无针对社会学数据引用行为的相关研究.本文拟对我国社会学期刊的数据引用进行分析研究,以达到以下目的:了解社会学期刊论文的数据引用现状,分析该学科数据引用行为的特征及变化趋势,对现状及特征的产生原因进行探讨,从而加深对学科的认识,促进该学科数据引用规范的统一和完善,达到解决数据引用规范问题的目的.2样本选择与数据搜集、处理

本文拟选取《社会学研究》和《中国人口科学》两种期刊2003~2014年共12年间每年第1期刊载的论文为样本,研究该学科期刊论文的数据引用情况,共计期刊24册,论文256篇.

通过期刊网站的《稿约》可了解二者的基本情况和定位:《社会学研究》由中国社会科学院社会学研究所主办,强调以规范的经验研究为基础,提炼学术思想,开设的主要栏目有:专题研究、理论方法方法论、学术论文、学术争鸣、学者对谈、社会学笔谈、研究新秀、学术信息等[7],《中国人口科学》则是由中国社会科学院人口与劳动经济研究所主办,着重刊登具有较高质量的人口及相关领域的研究论文、综述、调查报告,内容包括:人口理论与政策研究、人口统计、人口与经济、人力资本与劳动经济、社会保障研究、人口与社会、国际人口比较、人口与生态环境、少数民族人口及计划生育理论与实践等[8].《社会学研究》和《中国人口科学》同为国家社科基金首批资助期刊,在我国社会学领域内享有较高声誉,其品质和地位受到公认,是领域内的顶级期刊,影响因子排名也居于学科前列.根据这两种期刊栏目设置上的差异,并结合本研究在数据搜集过程中的体验,可发现两种期刊在研究方法上有较为明显的定性和定量之别,《社会学研究》注重案例研究和理论探讨,《中国人口科学》则倾向于采用统计学方法及工具进行数据比较和数据分析,两者在研究对象、研究方法和风格定位上形成了各自明显的研究特征,又同时达到国内同领域的最高水平,因此以此两种期刊作为统计对象,可有效考察社会学领域的数据引用行为.

由于数据引用还没有规范的格式及可靠的自动识别方法,本研究主要采用人工识别的方式搜集数据并进行归类整理.这种方式虽然耗费时间、精力,但深入文献内容,不但能保证数据的准确、可靠,而且能加深对本领域研究内容的了解,丰富感性认识,保证对数据结果分析的有效进行.以往文献计量学论文通常在数据库中大量下载数据,然后通过数据库提供的分析工具或者自己根据需要进行编程以“瞬间”获得结果,虽然充分利用了技术的方便快捷,却缺乏对内容的感性认识,对分析结果的说明也容易流于数字枚举,并在阐释结果时可能与事实相距甚远.

另一方面,规避人工处理的主观性负面影响,保证结果的可靠性,建立明确、细致的数据处理规范也十分重要.类似于文献引用,数据引用也包括作者、数据标题、出版机构、出版时间、访问地址等数据,根据这些数据的完整程度,本文将引用行为划分为三种:规范引用、部分引用和无引用.在判断引用行为是否属于规范引用时,将能否根据标注直接而明确地找到原始数据作为指导原则,对于那些标注不完整、未给出精确来源的引用行为,将其归入部分引用,无引用则是出现引用数据但未给出任何来源信息的引用行为.

需注意的是,对于那些只在参考文献中列出数据来源,但文中未加标注的引用行为,由于无法建立所引数据与参考文献之间的关联,故而归为无引用.此外,若一个表格或其它形式的数据集,其引用来源不只一处,则使用著者标注的数据来源数量作为该数据集的引用次数,并根据每个来源的元数据标注情况确定引用行为类别.另外,在一些以数据分析为主体的论文中,作者往往会在论文开头交代使用数据来源,但在实证分析时不再一一标注.对于这种情况,我们以作者注明的数据来源作为数据引用行为.

数据引用的识别并非数字识别那么简单,为减少标引员的判断偏差,本研究在正式标引前先进行试查,反复讨论,补充细节,完善标准,对标引员进行培训,以保证分析结果的可靠性和客观性.在处理过程中,对各种情况进行仔细判别,例如:

(1)区分数据引用与事实陈述.在进行事实陈述尤其是背景介绍时,往往会出现数字,如提到年份,此时虽然有数字出现,但是并非数据引用的范畴.而有时数据引用与事实陈述的界限会比较模糊,可以以数据是否为表达的中心和主体作为依据.

(2)区分数据引用与数据提供.一些学者进行某些案例分析或者受某机构所托进行针对该机构的某方面调研时,会在论文中使用一些数据,但这些数据不是为了印证作者的观点而被引用的数据,此时,学者是数据的拥有者,即提供方,因此,此状况下的数据也不属于数据引用范畴.

(3)区分论文与非论文.由于学科性质的影响,有时期刊会特别邀请相关部门的领导针对某项新政进行政策解析,此类文章尽管信息量很大,数据繁多,但缺乏摘 要、关 键 词等基本要素,也不具备研究特性,因此不属于本文的统计行列.

3数据分析

3.1总体数据与分析

经数据处理并汇总,得到本研究中社会学领域数据引用的基本情况(见表1).


可以看出,本文选用的两种期刊12年间第一期共刊登论文256篇,总数据个数达到1561之多,平均每篇文章数据引用超过6次,说明社会学研究对数据的依赖程度较高,也证明对该领域的数据引用行为研究具有重要意义.总体来看,规范引用比率平均$

本文是一篇社会学论文范文,社会学有关毕业论文格式模板,关于我国社会学期刊文数据引用行为相关硕士学位毕业论文范文。适合社会学及数据及社会科学方面的的大学硕士和本科毕业论文以及社会学相关开题报告范文和职称论文写作参考文献资料下载。

798;到55.80%,也即超过一半的数据引用行为较为规范,但是不规范的数据引用行为仍然大量存在,这也说明了规范其数据引用行为的重要性.在非规范引用中,部分引用比率为24.28%,高于无引用比率的19.92,假如将规范引用和部分引用相加,则已超过80%.这也说明大部分学者已经意识到了在进行数据引用时应对来源加以说明,但由于对数据引用规范性认识的不足,加上当前数据引用统一标准的缺失,导致著录要素不齐全,标引来源较为随意,无法通过作者的著录追溯到原始数据.

从社会学领域引用趋势(见图1)可以看出,在引用行为中规范引用比率2004年达到最高,为75.74%,而在2014年最低,只有34.15%.2014年的低规范引用率主要是由于当年的部分引用率较高,事实上,当年的无引用率很低,只有4.88%,说明当年期刊都注意到了数据标引的必要性,但是由于大量数据标引不完全,造成部分引用率过高,超过了60%,直接影响到了当年的规范引用比率.3.2期刊比较分析

经数据处理并汇总,综合观察《社会学研究》和《中国人口科学》这两种期刊的数据引用情况(见表2,表3),发现:两种期刊12年来的每年第1期的发文量非常接近,为9~12篇,统计出来的总量也相等,均为128篇,这也增强了两种期刊的可比性.

在篇均数据个数上,《中国人口科学》为8.39,明显高于《社会学研究》的3.80,这主要是由于《中国人口科学》具有明显的统计学特征和计量风格,很多论文建立在大量的数据引用基础上,可以说根据他人数据或机构数据处理、推导出自己的结论成为论文的重要构成部分.而《社会学研究》样本中每一期都有一部分属于没有数据的论文,这部分论文主要进行纯粹理论研究或讨论,同时,每一期中都有1~3篇数据出现个数非常多的论文,而且在这部分论文中存在一种引用行为的倾向性,即或者全部都是规范引用行为,或者全部都是无引用行为.这一点可以从统计数据看出来,这些论文的引用行为会导致同期全部论文引用行为平均数值表现出相应的倾向性,其他论文对平均数值中的影响被弱化.即便有部分论文没有数据引用行为,《社会学研究》的篇均数据个数也超过了3,以理论研究和案例分析为特征的《社会学研究》无疑具备了相当史料色彩,因此对数据的需求也不可小视.综合来看,对数据的重视使得社会学和人文社会科学中的其他学科相比,显得更加理性和科学.

《社会学研究》的规范引用比率除了2011和2013年外,均超过50%,基本上一直高于非规范引用(包括部分引用和和无引用)比率.《中国人口科学》规范引用比率则变动较大,2014年只有7.55%,这主要是由于当年个别论文的表格在数据标引时过于笼统,导致当年部分引用比率过高达到88.68%造成的.总体而言,《社会学研究》规范引用的平均比率为70.64%,远高于《中国人口科学》的49.07%,说明前者的数据引用规范程度明显更高.

3.3论文比较分析

从社会学领域论文数据引用的频次分布(见表4)可以看出,在所有被统计的论文中,没有数据引用的论文、数据引用1~5次的论文和数据引用6次以上的论文大概各占三分之一左右,这也说明了该学科数据引用行为的普遍性,同时,有将近18%的论文引用数据超过10次,说明数据在其论文中起了至关重要的作用.

社会学领域总引用数据个数超过20的论文共计24篇(见表5),其中17篇来源于《中国人口科学》,这个结果和之前对两种期刊的特征分析以及《中国人口科学》的篇均数据个数较高相吻合.

4讨论

社会学论文在数据引用方面除了数据引用量大、数据引用规范度不高之外,也表现出其他一些特征.例如在数据来源方面,社会学论文需求的数据往往是宏观数据,体系庞大,内容完整,属于个人或团体难以独立搜集获取的数据,因此更多引用已有数据.其中最常见的有两种:人口调查资料,如各年全国人口普查资料、全国1%人口抽样调查资料等,各种年鉴,如《中国统计年鉴》、《中国人口年鉴》和《中国科技统计年鉴》等.这些提供大量统计数据的正式出版物权威、系统、完整、丰富.因此,大量引用这些正式出版的数据是社会学论文的一大特点.

本研究在数据统计中也发现,对已发表的论文中数据的引用,其引用行为通常较为规范,但对上述调查资料、年鉴以及政策的标引,存在着较多的不规范行为,尤其是对表格中数据进行标引时,不规范的行为更是大量存在.如统计年鉴的引用没有标明页数、国家政策没有注明发布机构和时间、直接引用国家的统计数据或地区的背景数据但没有注明任何出处,等等.

判断数据标引是否规范可以用以下两点为参考:一是该数据是否有根据标引内容便可追溯查找到的可能,以达到规避学术不端或者使后来者重现研究过程的目的,二是该引用行为是否具有可进一步标引的可能.尽管目前尚无统一的数据引用格式或规范,但相关机构和组织也已经在诸如数据引用的必备要素等重要问题上达成了一定的共识.汤森路透建议采取以下数据引用格式:作者(出版年份):数据标题.出版机构.访问地址.如:国务院人口普查办公室、国家统计局人口和就业统计司(2012):中国2010年人口普查资料.中国统计出版社.对于已被收录进数据仓储的数据集,还可以加上其网络访问地址或数字对象标识符(DigitalObjectIdentifier,DOI).

5结语

社会学领域数据引用行为较为常见,特别是人口学方面的研究数据特征表现更为明显.对数据的重视使得社会学领域的研究兼具定性和定量特征,从而凸显其科学性.但由于当前数据引用统一标准的缺失,以及研究人员对数据引用规范性认识的不足,导致不规范的引用行为仍大量存在.各种年鉴及人口调查资料是社会学研究的主要数据来源,但其中的不规范引用也相对较多,而对已发表的论文中数据的引用,其引用行为通常较为规范.在本研究选取的《社会学研究》和《中国人口科学》样本中,《社会学研究》中的论文数据引用规范程度相对更高.同时,对社会学领域期刊论文数据引用行为的分析研究可以为其他学科提供借鉴作用,以在大数据时代提升数据共享、交流及利用的能力,加快科学发现与创新的步伐.

相关论文

我国社会治安管理的现状

本文是一篇社会治安论文范文,关于社会治安毕业论文范文,关于我国社会治安管理的现状相关毕业论文提纲范文。适合社会治安及法律法规及市场经。

我国社会医疗保险的法律缺陷与

本论文是一篇医疗有关保险相关论文,关于我国社会医疗保险的法律缺陷与相关开题报告范文。免费优秀的关于医疗及保险制度及法律方面论文范文。

我国社会医疗保险改革文献综述

该文为社会医疗保险有关函授毕业论文范文,与我国社会医疗保险改革文献综述相关论文参考文献哪里找,可作为参考文献专业社会医疗保险论文写。

完善我国社会保障体系的措施

本文是一篇社会保障制度论文范文,关于社会保障制度相关毕业论文格式模板,关于完善我国社会保障体系的措施相关在职研究生毕业论文范文。适合。

我国社会信用法律体系的构建

该文为关于法律制度类硕士学位毕业论文范文,与我国社会信用法律体系的构建相关法本毕业论文,可作为法律事务毕业专业法律制度论文写作研究。

转型期我国社会管理的若干问题

这篇社会论文范文属于农村研究免费优秀学术论文范文,社会有关学士学位论文,与转型期我国社会管理的若干问题相关论文的格式。适合社会及组织。

健全我国社会征信体系问题

为您写信用毕业论文和职称论文提供信用类有关开题报告范文,与健全我国社会征信体系问题相关论文范文集,包括关于信用及政府及信息方面的论文。

我国社会治安隐患其防范

该文为社会治安方面开题报告范文,与我国社会治安隐患其防范相关毕业论文,可作为社会学理论专业社会治安论文写作研究的大学硕士与本科毕业。