一、大数据背景下科研档案及其特征 在大数据背景下,随着移动互联网、社交新媒体、电子商务等的迅猛 发展,科研档案数字化建设全面推进,作为科研创新活动真实记录的科研档案也 初步具备了大数据特征。
1.科研档案数据规模巨大,增长迅速。当前,科研档案数据资源正呈 现爆炸性增长,这主要源于“增量科研档案电子化和存量科研档案数字化”两个原 因。一方面,随着信息化的推进,特别是OA办公及各种信息管理软件的广泛应 用,大量的科研档案归档方式由传统的纸质归档转变为纸质电子双轨归档制;
另 一方面,通过扫描、翻拍纸质科研档案、照片等新兴技术,馆藏科研档案数字化 进程正如火如荼地推进着。目前,科研档案数据资源呈几何速度增长,科研档案 大数据在逐步形成之中。
2.科研档案数据种类繁杂,多元异构。在大数据背景下,随着数据采 集、存储和挖掘技術的不断发展,科研档案资源将广泛地存在于不同的信息系统 中,呈现出结构化、半结构化和非结构化数据相融合的发展态势。从总体上看, 有以下几大类科研档案数据。第一类是科研文书档案,主要指的是各种有关科研 活动的政策、法规、通知等文件材料;
第二类是科研项目档案,主要指的是科学 技术研究人员在基础理论研究、技术研究、应用研究和软科学研究等方面的具体科学研究档案;
第三类是科研成果档案,主要指的是科研活动中形成,作为科研 成果上报,具有保存价值的各种载体的材料归档后形成的档案材料;
第四类是科 研人员档案,主要指的是从事科研活动的科研人员自身有关材料,主要包括学术 背景、研究方向、科研项目、研究成果、科研获奖等相关档案。基于这四类科研 档案形成的大数据具有明显的异构性,对数据处理能力提出了更高的要求。
3.科研档案数据潜在价值大,但开发利用率低。作为国家和社会精心 保存的历史记录,科研档案是一种最正式、最可靠、最具权威性与凭证性的原生 信息资源,其中蕴藏着巨大的潜在价值。但是,长期以来,科研档案数据管理水 平有限,重保存轻利用,总体开发利用水平很低,造成巨大的数据资源浪费。原 发改委副主任张晓强表示,我国科技成果转化率仅为10%,远低于发达国家40% 的水平[1]。这样低的转化率与大多数科研成果进入了档案室(馆)作为档案保 存起来,成为“独享”的内部资料有一定的关系。这种落后的管理模式容易导致信 息不对称局面:一方面企业对先进科研成果的需要十分迫切;
另一方面大量科研 成果被“锁”在档案柜里,无人知晓。科研院所档案馆承担的服务社会的责任根本 无法体现,科研档案信息共享利用不容乐观。2014年,中办、国办发布《关于加 强和改进新形势下档案工作的意见》,对档案工作的新要求:利用档案,服务民 生,服务群众。在大数据背景下,对海量的科研档案数据进行高效地开发、为资 政参考、服务企业、造福民生提供更加多元化、个性化的服务,已经成为摆在档 案人面前的全新课题。
二、大数据背景下科研档案管理变革 大数据时代,数据已经成为重要的战略性资源,正在对社会管理的思 维方式、管理行为、决策模式等各个环节产生不可思议的影响,同样,对于科研 档案管理形成的冲击和挑战自然也不言而喻。
1.收集。推进科研档案大数据化。在大数据时代,要树立大数据理念, 积极推进科研档案数字化向科研档案大数据化转型,积极建设科研档案大数据这 一核心资产。第一,要树立科研档案大数据理念,普及科研大(泛)档案观和科 研档案大服务观。一方面,树立科研大(泛)档案观,即将科学研究创新活动中 一切具有保存价值的文件、数据、视频和实物等都视为科研档案,并经过加工处 理成为科研档案数据;
另一方面,普及科研档案大服务,即科研档案管理的理念 由传统的“保藏”为主要目的转变为以“利用”为主要目的,从资料管理收藏转变为 科技知识的管理和服务,形成大数据背景下科研档案大服务新格局。第二,要加强科研档案数据立法。国家主管部门应将科研档案数据开 发和利用作为国家推进大数据发展战略一部分,尽快制定和实施有关大数据的法 律法规,通过法律手段和行政手段,先强制、后自觉地逐步冲破部门、行业、领 域、学科、专业之间的藩篱和壁垒,不断规范和推动科研档案大数据的建设、开 放、共享与利用。同时要充分考虑到知识产权、数据安全、隐私保护等有关问题, 为科研档案大数据的开发利用创造良好的法律和社会环境。
第三,要积极扩充科研档案的数据类别和总量。继续落实科研档案“存 量数字化,增量电子化”要求,健全完善科研文书档案数据库、科研项目档案数 据库、科研成果档案数据库、科研人员档案数据库,推进科研档案管理由传统纸 质馆藏模式向现代数据存储模式转变,推动科研档案数字化向科研档案大数据化 转型。
2.管理。建立科研档案大数据平台。在云计算、物联网与大数据的背景下, 各类相关科研档案数据得以有效存储、整合、共享、利用和分析,从而形成一个 包含大数据处理系统、新型知识服务模式、智能决策支持系统等在内的科研档案 大数据平台,这一平台能够为科研档案管理提供全流程、动态化管理和服务,科 研人员可以处理和共享海量的科研数据,社会公众可以获取有关科研活动信息和 知识,科研管理者也可以动态跟踪监管科研活动的全过程。科研档案管理大数据 平台的建立,是一项系统工程,涉及技术实施、数据标准、共享机制、数据安全、 产权保护、管理制度等一系列问题,而数据标准、共享机制和数据安全是其中尤 为重要的三个问题。
第一,建立统一的科研档案数据标准体系。当前,由于科研档案数据 本身种类繁杂,结构多元,再加上科研档案数据化缺乏全局性的统筹规划和监督 管理,并且科研档案本身具有保密性和科研人员共享意愿的不足,导致了不同科 研机构在研发或引进科研档案管理系统时各自为政,所使用的数据库、程序开发 语言、档案数据行业标准和档案软件支撑平台都各不相同,科研档案管理软件的 通用性较差,从而形成了大量的“数据孤岛”,为科研档案数据共享埋下了重大隐 患。因此,要建设科研档案大数据平台,当务之急要建立一个统一的行业标准体 系。可以从科研档案数据的采集标准、科研档案数据加工标准、科研档案数据安 全标准、科研档案数据化技术标准等方面入手,针对当前的科研管理需求和科研 档案开发利用需求加以补充完善,形成一个各级科研档案部门可以共享的统一的 标准体系和有效的区域共享平台,从而更好地推进各类科研档案数据的共享利用。
第二,構建科研档案协同联动共享机制。一方面,转变传统单一的科研档案管理模式为科研项目组、科研管理部门、档案馆“三位一体”的科研档案协 同管理新模式。科研档案的协同管理,就是对科研档案的管理要素、管理结构、 管理职能及其内在联系进行创造性的整合重构,实现科研档案管理各要素的最优 配置和整体部署,形成“三位一体,统一规范,各司其职,资源共享,相互促进, 协同高效”的科研档案协同管理模式,从而对科研档案的收集、整理、归档、保 管、利用全过程进行有效的管理和控制[2]。另一方面,运用大数据技术,通过 对全方位、多结构化的实时科研档案数据和历史科研档案数据,特别是隐藏于表 象数据之后行为特征数据的在线收集和实时分析,为科研人员及科研管理者进行 全局性的管理及决策提供支持。
第三,维护科研档案大数据平台的数据安全。首先,要建立统一的科 研档案数据安全标准,建立严格的针对科研档案管理的分级保密制度,有重点、 有区分地对部分涉及机密级重要科研成果的档案,严格限制其传播范围,确保其 安全性和保密性。其次,要建立科研档案大数据平台数据安全制度,防止出现非 法传播、盗用等侵权行为,注明各类档案的保密级别和相应的使用范围。最后, 不断提高科研档案大数据平台安全技术水平,严格定期维护和升级,确保科研档 案数据不受非法侵犯、攻击和泄露,切实维护科研档案大数据平台的数据安全[3]。
3.利用。科研档案服务智能化。大数据时代是信息社会发展的更高阶 段,科学研究创新活动的方式也将发生翻天覆地的变化。大数据时代背景下,传 统的科研档案服务方式已不能适应时代的新要求,而是要基于科研档案大数据平 台大力推动科研档案服务智能化。
第一,科研推送精准化。大数据技术可以帮助人们从海量的科研档案 数据中发现科学研究活动的发展动态,寻找到科学研究活动的基本规律和发展走 向,还可以通过个人移动终端或社交媒体,收集、储存、整理、分析科研项目和 科研人员的有关信息,甚至可以关注每个科研项目的进展程度和每一个科研人员 的态度、能力和思维方式,从而帮助管理者及时、准确地为科研人员提供所需要 的各种资源、指导和帮助,使科研档案管理服务真正实现个性化的精准推送服务。
第二,科研选题科学化。运用大数据技术,可以对科研档案大数据进 行深入挖掘和研究,从而推进科研选题更加科学化、合理化。一方面,大数据技 术可以帮助挖掘出社会对科学技术的实际需求情况,使得科研选题更加具有针对 性、科学化和合理化;
另一方面,大数据技术通过数据共享可以协助科研机构与 社会企事业单位开展联合选题和开展科研工作,使不同实体能够联合起来共享资 源、共同发展。第三,科研成果转化及时化。现今科研工作从选题开始就将研究团队 已有的研究基础作为基本立足点,科研机构与科技成果需求群体之间缺乏必要的 沟通和交流,这往往就导致科研成果与社会实际需求相互脱离,科研成果转化率 长期处于不高状态。在大数据环境下,大数据技术大量应用于科研档案大数据的 开发共享,可以使科研成果与社会需求之间实现有效对接,从而促进科研成果的 及时有效转化,最大化发挥科研成果的经济和社会效益。
第四,科研评价体系客观化。长期以来,由于科学活动的复杂性,以 及科研评价理念和方法的偏差,从科研项目的立项到科研成果的鉴定都带有浓厚 的主观色彩,很难实现科研成果评价的客观公正。大数据背景下,基于科研档案 大数据平台的科研评价体系,可以使科研成果评价从结果评价走向全过程动态评 价,从而实现主观评价向客观评价的转变。首先,对于科研成果的评价方式不再 是传统的主观经验判断方式,而是通过海量科研档案数据的动态实时分析,量化 反映出研究成果所具有的地位和作用。其次,通过科研档案大数据平台可以对科 研成果进行多向评价和多方评价,优化科研成果评价的指标权重,拓展科研成果 评价参与主体范围。最后,通过科研档案大数据平台可以使科研成果的评价跳出 结果评价的困境,真正实现过程动态评价,切实反映科研成果的转化利用水平。
大数据时代正在悄然到来,云计算、物联网和大数据技术正在深刻改变经济社会 发展面貌,同时也深刻改变着人们的思维方式、工作方式和生活方式。毫无疑问, 大数据不仅改变着科研创新活动方式,也正在显著改变传统的科研档案管理模式。
近年来,随着科研档案管理信息化程度不断提高,初步奠定了科研档 案大数据管理的前期基础,可以说,当前科研档案已初步具备大数据的时代特 征:规模巨大,增长迅速;
种类繁杂,多元异构;
数据价值大,但开发利用率低。
大数据背景下,科研档案管理需发生变革,一是在科研档案收集上需要加快推进 档案信息大数据化进程,二是在科研档案管理上需要统筹建立大数据管理平台;
三是在科研档案利用上需要推进服务智能化。
综上,在大数据背景下,如何将海量的、分散的科研档案数据收集归 档完善;
如何管理、开发、共享和利用多元异构的科研档案数据,解决科研档案 “数据孤岛”“数据割据”问题;
如何利用大数据技术深度挖掘科研档案数据潜在价 值,推动科研档案服务智能化,将是档案学界今后很长一段时间需要深入研究和 探讨的重要课题。
扩展阅读文章
推荐阅读文章
推荐内容
钻爱网 www.zuanai.cn
Copyright © 2002-2018 . 钻爱网 版权所有 湘ICP备12008529号-1