1数据来源 PCDD(PraQuetDigalDissertations)博硕士论文数据库收录了美国、加拿 大和欧洲各国及世界其他国家的1000余所大学和科研机构的研宄生学位论文的 文摘和索引,是目前世界上最大的博硕士论文文摘数据库,也是使用最广泛的学 位论文数据库。2002年,为满足国内科教研对国外博、硕论文的需求,CAL1S 连同全国部分高校、学术研宄单位和图书馆采购了PQDD中的部分学位论文,在 国内设有CALIS镜像站、上海交大镜像站和中国科技信息研宄所镜像站[2J,加盟 的单位和订购的论文随着时间的推移也在增多,成为广大科研工作者获取国外硕 博士论文信息的最佳数据资源库。
词频分析法是利用能够揭示或表达文献核心内容的关键词或主题词 在某一研宄领域文献中出现的频次高低,来确定该领域研宄热点和发展动向的文 献计量方法[3。而关键词是对文章核心内容浓缩和提炼出的词,能有效地将文章 的研宄目的、对象、方法和结果等组织起来。如果某一时期某个关键词在其所在 领域的文献中反复出现,这可反映该关键词所表征的研宄主题是该时期、该领域 的研宄热点。关键词的变化可以反映该领域研宄主题的变化,对关键词的词频进 行分析在一定程度上可以揭示文章的研宄内容。
本研宄利用PQDD的主题检索功能,采用检索词“libraryscience,借助 excel软件和词频分析方法,对检索到的2000-2008年9年(2009年的数据不全)中 的1499篇图书馆学研宄生学位论文文摘和索引进行处理。需要指出的是,由于数 据库收录的图书馆学研宄生学位论文不齐全和各个国家及各图书馆学研宄生教 育机构学位论文标引之间存在差异,只有718篇文章标出了关键词,其余的781篇没有给出关键词,718篇的样本不能代表全部的图书馆学学位论文,但也具有 一定的代表性,我们仅在这个样本内进行各项统计和分析。
2关键词数量分析 关键词能够迅速、准确地反映论文的主题内容和重点,关键词的有效 开发能够提高文献资源的利用效率。关键词标引的多少对于揭示文献主题有着重 要的影响,关键词的标引数量隐含着一个标引深度的概念,适当的标引深度应是 在查全率和查准率之间达到某种平衡:标引过少,论文内容揭示不全;
标引过多, 则会降低查准率。目前为了方便读者的检索并提高文章的被引用率国内外科技期 刊要求每篇文章应标出3-8个关键词。本研宄调查的718篇文章共标引出关键词 3591频次,篇均关键词5频次,图1描述了关键词词频与文章数之间的数量关系。
由图1可以看出,国外图书馆学研宄生学位论文的关键词标引具有以 下特点:
(1)大多数文章的关键词词频集中在3-9个之间,有文章656篇,占总文 章数的9136%。这表明,在一般情况下,绝大部分图书馆学研宄生学位论文标引 的关键词能够满足一篇论文对主题内容充分揭示的要求,符合论文关键词选取数 量的一般规律。
(2)标出4个和5个关键词的文章数分别有187篇和176篇,两者共计363 篇,占文章总数的5056%,也就是说,有一半以上的文章平均提供4或5个关键词, 大部分文章标引很合理。标引出15-18个关键词的4篇文章,绝大部分的关键词却 是表示作为研宄对象的人名,说明这些文章关键词的标引可能还是存在一定的缺 陷,不够规范;
只用了1一2个关键词的文章有41篇,占文章总数的6%,说明少部 分论文存在着标引不足的现象,也可能是由于这部分文章的研宄主题专一的缘故。
总之,部分学位论文存在着关键词标引不规范的现象,应该引以为戒。
3年篇均关键词和关键词平均频次分析 年篇均关键词数和关键词平均频次可以很好地反映各年度论文研宄 内容涉及领域的宽泛程度和研宄主题的密集程度。
年篇均关键词在数值上用年关键词总频次除以该年的文章数来表示,即年篇均关键词就是该年平均每篇文章所标引的关键词数量,该值的大小在一定 程度上可以反映出文章研宄主题所涉及领域的宽泛程度。如图2所示,上部的曲 线为篇均关键词数的年代分布情况:2000-2005年,每篇文章的主题基本上可以 用两个关键词得到概括。2006年后,篇均关键词的数量开始明显增加:2006年为 254个/篇比上年平均增长37.6%;
2007年平均每篇文章标引了3.09个关键词;
2008 年篇均关键词达到525个,比上年增加了753%,增长十分明显。这表明,随着图书 馆学与其他学科的不断交叉渗透以及图书馆学本身学科体系的不断完善和深入, 描述文章内容的每个关键词内涵更加深入、具体,关键词的取词空间也得到不断 扩展。
关键词平均频次在数值上等于年关键词总频次除以年关键词总数"关 键词平均频次可以反映该年全部文章关键词的集散程度:关键词平均频次越高, 说明总关键词数在关键词总频次中有很多重复,关键词分布越集中,文章所反映 的研宄主题也越集中;反之亦然。
图2中下部的曲线描绘了各年关键词平均频次的分布状况。在计算关 键词平均频次时,要将各年的关键词进行去重处理。由于每位作者在选取关键词 时有各自的主观判断和习惯,因此,我们在统计关键词数时,先做了两项工作:
一是将含义相同或相近的词进行合并,比如,‘‘chatreference,与‘‘diti"alrejerence5 合并,“use”与“userstudy’合并;
二是排除一些不恰当的关键词,包括没有独立检 索意义的词,如Chinainfomaticncompulei"onlinecasePercep_inconpajcn以及人名等。
这样处理后,共得到关键词2029个。
718篇文章共有2029个关键词,平均每篇文章含有约3个关键词,小于 全部文章篇均关键词频次的5次。说明意义相同而表达形式不同的关键词或者没 有检索意义而被去重处理掉的关键词不在少数。每年的关键词平均频次都小于该 年的篇均关键词数,表明每一年内不同的文章有相同的关键词出现;
每年的关键 词平均频次都小于全部年的关键词平均频次的18次(3591/2029次),说明各年间 的关键词在很大程度上有重复;
关键词平均频次出现了两个峰值,分别为2002 年121次和2006年L25次。前一个峰值的出现可能与2002年信息检索、用户研宄、 图书馆编目、文献计量学和数字图书馆等该年高频关键词占该年关键词比重相对 其他年较大有关(见表2)后一个峰值的出现,可能与2006年对信息检索、网络技 术、图书馆馆员、数字图书馆和引文分析等主题的研宄比较集中有关。关键词平 均频次曲线峰值的出现说明,当年的研宄主题普遍集中在某些领域,平均频次的波动可以作为反映文章研宄主题集散程度变化的较为敏感的指标。
4关键词频次和高频关键词分析 关键词的出现频次与附有该关键词的文章数的关系,类似于文献计量 学中作者数与文章数的关系,因此,一个关键词出现频次的高低与相关研宄成果 数量的多少呈正相关的关系,这些高频次关键词便形成 718篇文章所有关键词的频次范围是1一57次,高频词区有32个关键词, 占关键词总数的158%,共计618频次,占总频次数的1721%,平均19频次/词。也 就是说,平均不到两篇文章就含有这些词语中的1个。次高频区有37个关键词, 次低频区有139个关键词,低频区有1821个关键词。
高频区词频大于20次的9个关键词为:Aademiclibraiy(57)、Libaiiy(54)、 In^matione tiva(53)、Publiclbraiy(41)、Llrarian(37)、 InfDmationliteracy(30)、]niemet(25)"WoildWdeWeb(21)和Facuty(20X由关键词频 次的排序,我们发现:高频区的词主要是反映图书情报学基本理论的关键词(如 图书情报学、社区信息学、文献学等),反映信息管理的关键词(如信息检索、 参考咨询等)反映信息用户与服务的关键词(图书馆馆员、媒体专家、学术图书 馆等图书馆类别、信息用户等)、反映信息技术、系统与网络的关键词(如数字 图书馆、Iteniet等)和反映图书馆组织管理及环境的关键词(如信息素养、图书馆 管理者等),涉及图书馆学教育和图书馆学的众多方面。
表2列出了2000~2008年各年高频关键词的前十位(统计时排除了 “lay"“Graduatetden”等并不能表征研宄的实质内容的关键词) 根据表2对各年的高频关键词的排序,可以看出:
(1)信息检索在近年一直受到突出重视。除2001、2003年两年外,信 息检索都排在各年高频关键词的第一位,2008年达到研宄文章数的高峰。这表明, 国外图书馆学研宄生教育高度重视信息检索研宄,具体内容包括:检索系统、检 索行为、检索策略、字段检索、网页检索、图像检索和音乐信息检索等。信息检 索以需求、应用为导向,利用计算机网络技术、文献资源及相关领域的知识和技 能,以实现信息的收集、整理、传输与应用,在目前的科学研宄和生产实践中,信息检索越来越受到人们的重视。
(2)图书馆馆员和用户研宄是研宄生学位论文的研宄重点。随着图书 馆社会职能的扩展和读者用户范围的扩大,图书馆馆员己发展成图书馆中帮助读 者和用户“打听”高科技信息、知识的参考咨询人员,他们必须头脑灵活地从由纸 质资源和数字资源组成的信息海洋里搜索有用而精炼的信息,帮助用户有效地重 组他们的问题。由于图书馆服务对象和行为特点的越来越专业化、组织化,需要 不同的图书馆馆员负责处理他们所专长的事务,参考咨询馆员、学术馆员、学校 馆员、儿童馆员和公共图书馆馆员划分日益明确。
(3)网络和数字图书馆技术的研宄也占据了一席之地21世纪是信息技 术的时代,计算机和网络技术不断地渗透到工作和生活各个方面的同时,在图书 馆中也发挥着举足轻重的作用。从表2看啲研宄比较分散,但在出现的年份里都 排在高频词的前五位,并在2001年成为当年最高频的关键词这与“网络”成为2002 年国内图书情报学的研宄热点[6的发现不谋而合。图书馆资源的数字化不但有助 于提供更为广泛、快捷、方便的用户服务,方便图书馆管理,还更好地实现了图 书馆存在的伟大目标:以自身和网络上丰富的“馆藏”和文化底蕴为基础,以人力、 财力、物力的投入为工具,面向全社会人群,提供服务使文献资源和信息盈溢到 社会生活的各个领域创造出强大的物质和精神财富。
这些高频区和次高频区的关键词表达的研宄内容构成了国外图书馆 学学位论文研宄的核心其中既涉及传统的图书馆学理论和服务,又包括了信息技 术、信息网络、数字图书馆、图书馆媒体建设、图书馆环境构建、图书馆管理等 不断增加的图书馆学新的研宄内容以及与图书馆学发生交叉渗透关系的新技术、 新方法和新服务。这些热点虽然大多还限于图书馆的相关领域,但更多地加入了 技术、经济、人文等方面的色彩。
低频区中频次为1次的关键词有1465个,频次为2次的关键词有356个 两者占据了关键词总数的8975%,这些低频次关键词分布广泛、涉及面广,从一 个侧面反映了图书馆学研宄内容具有明显的离散性["离散性的特点,拓宽了图书 馆学学术研宄的选题视野,有利于图书馆学向更广阔的研宄领域发展。
5问题与启示 5.1问题与建议图书馆学研宄生学位论文是研宄生培养的重要环节,是对研宄生所学 专业知识、科研能力及综合素质的检验,其质量好坏能够反映出研宄生的教育水 平和效果。通过上述分析,可以发现国外图书馆学研宄生学位论文的特点、存在 的问题,并提出我们的建议:(1)国外图书馆学研宄生学位论文的研宄内容系统 而全面。它们涉及到图书馆学研宄领域的许多问题,反映了图书馆学学科的纵深 发展。由表2可见,信息技术、信息网络、图书馆馆员、信息素养是国外图书馆 学研宄生学位论文的研宄主流,而数字图书馆、参考咨询、图书馆用户、图书馆 编目、图书馆媒体技术、图书情报学方法、文献学等处于学科前沿,成为图书馆 学发展的新的增长点。同时,从统计结果中也发现,研宄生学位论文的主题明显 聚焦于图书馆学本身的研宄领域,而涉及相关学科领域的较少,只占了很少的一 部分。这表明,国外图书馆学研宄生学位论文的学科开放程度还不够,这在现代 科学发展的交叉性、边缘性、综合性的大趋势下,显得有些封闭。图书馆学需要 借鉴相关学科的先进理论、方法和技术,图书馆学研宄生应当是能够将图书馆学 的基本知识与其他学科的相关知识相结合的复合型人才。这就要求研宄生教育在 课程设置方面拓宽专业口径,把握好图书馆学与相关学科领域的相互联系和恰当 比例,进一步关注图书馆学研宄生教育与图书馆学学科建设的互动。
(2)国外图书馆学研宄生学位论文的研宄内容存在一定的重复性。关 键词平均频次可以反映出该年全部文章关键词的集散程度,某年的关键词平均频 次小于该年的篇均关键词数,表明该年内不同的文章有相同的关键词出现。由图 2可见,每个统计年的关键词平均频次都小于全部统计年的关键词平均频次的18 次(3591/2029次),这表明各个统计年之间的关键词在很大程度上存在重复,而关 键词的重复反映了研宄内容的重复。研宄内容的重复可以说明两个问题:第一, 出现了研宄热点,这主要体现在某个年度;
第二,研宄内容连续重复,这主要体 现在多个年度。对于前者,这是正常现象;
而对于后者,可能有两种解释:一种 是该热点持续升温,属于该领域中比较重要的问题;
另一种是简单地重复,没有 突破和创新。因此,只有在研读了论文全文之后,才能得出比较客观的结论。
(3)国外图书馆学研宄生学位论文关键词的使用仍需规范。首先,关 键词标引不全,在本研宄的初始样本中,只有718篇文章标引了关键词,其余的 781篇没有给出关键词,关键词标引率不及50%其次,部分文章关键词选取不当, 比如,有些量词等没有实际检索意义的词语也作为关键词。第三,有些文章从关 键词的角度来看,有片面追求标新立异的倾向。关键词是一篇文章的“眼睛"很多 读者往往从关键词获取对文章的第一印象,也常常将关键词作为全文内容的精髓, 因此,选取切题、规范、引人注目的关键词应当成为图书馆学研宄生的基本功。52启示 通过对国外图书馆学研宄热点及其变化的分析和了解有助于我们了 解国外图书馆学领域以往的关注点、现在的热点以及将来的发展趋势。本项研宄 给我们如下启示:
(1)应当紧紧围绕图书馆学的核心研宄领域,进行持续研宄,不能本 末倒置,忽视甚至放弃核心研宄领域。
(2)在抓住核心研宄领域的同时,进行扩展研宄,吸收当代相关学科 的先进理论、方法和技术,寻找图书馆学发展新的增长点。
(3)正确对待“热点"对于有重要学科价值和意义的热点,应在一段时间 内保持一定的热度,同时避免简单的、机械式的重复,不盲目,不随从。
(4)图书馆学研宄生学位论文的研宄范围虽然广泛但应注重创新性注 重理论对实践的指导意义。
(5)研宄生教育不同于本科生教育,不能采用同一模式,而应强调个 性化。
(6)加强关键词标引的规范性,既不能过多标引也不能过少标引更不 能不标引还要注意仔细推敲关键词检索的实用性。
客观地讲,通过关键词来分析研宄生学位论文,虽然很有学术价值和 理论意义,但是,仅仅通过词频分析法来对研宄生学位论文的内容进行全面揭示 和判断,显然具有较大的局限性,还必须运用其他方法和从其他角度来进一步检 验、修正和完善。
扩展阅读文章
推荐阅读文章
推荐内容
钻爱网 www.zuanai.cn
Copyright © 2002-2018 . 钻爱网 版权所有 湘ICP备12008529号-1