山东高校档案管理专业委员会2015年年会(研讨材料)
大数据时代高校的大档案大服务
山东理工大学 谢怡
内容提要:新的信息技术的兴起,使人类迈向了崭新的大数据时代。面对海量的档案大数据,高校传统的档案管理模式和服务方式显得无所适从。本文分析了大数据时代高校档案收集、整理、服务工作面临的挑战,提出了大档案、大服务的应对策略。
关键词:大数据 高校档案 大档案 大服务
随着物联网、云计算、移动互联网等新技术的不断兴起与快速发展,数据正在以一种超乎想象的速度爆发式的增长。根据联合国的研究报告,全球的数据存量从2005年的150EB增长到2010年的1200EB,并将以40%的年增长率持续增长,2020年将达到2007年的44倍。毋庸置疑,人类社会的信息化进程自经历了计算机时代和互联网时代后,正在迈向一个全新的历史阶段——大数据时代。2013年被国外媒体称为“大数据元年”。大数据如浪潮一般席卷世界,在政府办公、企业服务、公共安全、医疗卫生、交通旅游、环境治理等不同领域展示了它超凡的功能和广阔的前景。档案部门作为主管历史记录和信息资源的职能机构,肩负着“为党管档、为国守史、为民服务”的神圣使命。在2013年的全国数字档案馆(室)建设推进会上,国家档案局局长杨冬权指出,数字化、网络化、信息化已深刻地影响了人们的工作、学习、生活和娱乐,数字不再只和计算有关,更使人们的生存方式发生了巨变,我们已不可逆转的进入了大数据时代。随着存量档案的数字化和增量电子档案的不断接收,档案数据必将形成海量规模。档案大数据将使档案工作人员在管理理论、管理观念、管理技术、组织机构、业务环节等方方面面面临着前所未有的巨大机遇和挑战。
一、大数据
对于大数据,目前学术界还没有一个公认的定义。维克托·迈尔-舍恩伯格和肯尼斯·库克耶认为:大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。研究机构Gartner将大数据定义为:大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。麦肯锡的定义是:大数据指无法在一定时间内用传统数据库软件工具对其内容进行采集、存储、管理和分析的数据集合。维基百科对大数据的解释是:大数据是指所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理并整理成为人类所能解读的信息。虽然现有文献对大数据的表述不尽相同,但透过这些定义,我们不难找出大数据的基本特征(4V):数据体量巨大、数据类型繁多、价值密度低、处理速度快。
二、高校档案与大数据的关系
科学技术的进步与发展,使高校档案数据资源数量呈爆炸性增长。一方面,伴随着高校各项管理工作的新的原生电子文件正在快速产生,另一方面,馆藏传统载体档案的数字化正在如火如荼的进行。从数据结构来看,高校档案数据资源既有数据库等结构化数据,又有邮件、报表等半结构化数据,还有视频、音频、图片、文档等非结构化数据。这些结构化、半结构化、非结构化档案数据资源虽然具有较高的历史价值,但是长期处于“沉睡”状态,利用率较低,大部分没有发挥任何价值。也正因为如此,用户对高校档案利用提出了更高的要求,即在海量的档案数据中快速找到并推送所需要的信息。可见高校档案数据数量巨大、种类繁多、价值密度低、处理速度需求快,已基本具备了大数据的特征,可以用大数据技术进行管理。
新事物的产生,将带来新的机遇,同时也伴随着新的挑战。大数据也不例外,它影响到高校档案管理工作的方方面面。本文拟从档案的收集、整理和利用服务层面尝试性的探索高校档案部门的应对策略。
(一)大数据对档案收集整理工作的挑战
迫于物质和技术条件限制,在小数据时代,我们无法对产生的所有成果(档案)全部归档和保存,因而有必要制定一个归档范围,即确定哪些要归档保存,哪些不要归档保存;同时对归档保存的信息和数据要根据其价值,确定不同的保管期限以节省人力和物力。这种传统的管理模式,在当时的档案收集、鉴定、整理等各项工作中发挥了显著作用,保持了档案之间的历史联系,区分了档案数据的不同价值,方便了档案的保管和利用。但大数据时代,高校档案数量激增、类型多样。在这样的形势下,高校传统的档案管理模式将无法对档案大数据进行科学的管理,继续沿用原有模式必将导致收集不齐全,分类不系统。面对如此海量的数据,我们该如何确定档案的归档范围,如何鉴定档案的保存价值?
(二)大数据对档案服务工作的挑战
大数据时代,用户对高校档案利用需求从对象、载体、内容到手段都发生了翻天覆地的变化,主要表现在:一是用户多元化,高校档案部门的服务对象不再局限于学校内部,任何一个外来人员都有可能成为其潜在用户;二是载体多样化,需求的载体不再仅局限于纸质档案,而是越来越多的趋向方便快速查询的电子档案;三是内容集成化、个性化,用户对档案信息的需求不再满足于单一事项,而是趋向于多元的融合,不再追求信息量的广泛,而是希望在大量的信息中得到直接的、有价值的知识;四是服务便捷化,知识更新周期的缩短,科技竞争的激烈,使用户对高效、快捷的档案利用需求变得更加强烈,希望能够在一个综合服务平台上获取所需要的全部信息;五是手段自助化,互联网技术的不断成熟与发展,使用户希望能够突破时间和空间的限制,随时随地、自由方便地获取各种信息。显然,高校档案利用需求正在趋于多元化、个性化、实时性、时效性,而与之相对的服务工作却明显滞后:服务方式主要停留在查阅、复印、扫描等,且以实地服务为主;服务时间仅限于工作日,档案数据资源没有上网发布,无法全天候实时异地查询;服务对象局限于高校内部和毕业校友,和社会联系较少。这种现行的被动封闭的档案利用服务模式,导致了档案利用率低下,档案的价值不能充分显现,档案的作用不能有效发挥。
三、应对策略
(一)大档案
高校档案部门要树立大档案的观念,科学管理档案大数据,做到应收尽收,应管尽管。
1.扩大数据总量。在过去的50年中,数字存储成本大约每两年就削减一半,而存储密度则增加了5000万倍。在这样一个数据价值远高于其存储介质价值的时代,大数据技术为我们提供了庞大的存储空间。在此技术的支持下,档案收集整理工作不再受归档范围和保管期限的限制,高校从事招生、教学、科研、管理等活动形成的不同载体的任何数据,都应被收集归档。也就是说,不论是高校管理活动中形成的原生档案数据,或是存量档案数字化过程中形成的电子数据,还是门户网站上的大量信息资源,一切具有保存价值的文件、数据、视频、实物都应视为档案,档案部门都要做好收集工作,形成档案信息资源大数据集。
2.整合数据资源。2007年教育部颁布实施了《高等学校档案管理办法》,但在信息化建设方面却没有专门的行政法规或者文件,高校档案建设意识淡薄,重视程度低,信息化建设一盘散沙,各自为政,缺乏规范性、专门性和统一性的引导与规划,增加了资源联合统一和共享的难度。目前,高校内部各部门管理信息系统标准不统一,大量的异构数据形成了“信息孤岛”,成为档案数据整合的瓶颈,严重阻碍了档案数据的共享。因此各高校应统筹规划,统一标准,开放数据,破除信息孤岛,实现档案大数据共享。另外,大数据时代,高校档案部门不能封闭自守、置身事外,要加强与其他高校之间、与地方之间的馆际交流与合作。同时要加强档案馆与图书馆、博物馆、互联网运营商之间的合作,包括技术、人才、资源建设等方面的合作,打破各自孤立的、散落的、互不相连通的数据库之间的壁垒,充分实现资源共享,使大数据价值得以最大化实现。
(二)大服务
为有效缓解当前高校档案利用的供需矛盾,档案部门要树立大服务的理念,朝着开放性、个性化、多元化、网络化和智能化方向发展。
1.放宽眼界,扩大服务对象。高校档案是高校在教学、科研、行政管理等各项活动中形成的,内容丰富,记录了高校的历史变迁,学生的成长经历和教学科研的创新发展等,载体多样,包含了纸质、照片、录音、录像、光盘、磁盘等各种形式。这些资源不仅对学校的规划发展起着参谋、决策作用,对学生的学历审核起着依据、凭证作用,对教师的教学科研起着参考、借鉴作用,而且对校外的团体、组织和个人起着辐射、育人作用。因此,高校档案在服务好本校师生和校友这个根本面的同时,要勇于突破,积极主动地接触社会、服务公众,将服务领域从本校扩大到本地区、本行业乃至全社会。
2.借助技术,创新服务方式。信息科学的发展,为我们提供了移动互联网、云计算、大数据等先进技术。运用这些技术,将有助于高校档案部门实现知识挖掘服务、统计分析服务、在线互动服务、移动平台服务等多维信息服务方式。借助云计算、数据挖掘等技术,高校档案部门可以从海量的档案数据中,发现馆藏档案的核心价值,找出看似无关的数据之间的联系与规律,预测事物的发展变化趋势,从而为用户提供知识挖掘、统计分析服务。如将学生的录取表、学籍表、成绩表与毕业调配表的相关数据进行关联,将有助于我们了解学生的生源地、专业、家庭背景、成绩等对其就业的影响,从而有针对性地开展就业指导工作,提高高校的就业率;将学校各年度的基层报表、科研统计报表、资产统计报表等各项结构化数据相关联,将有助于了解学校的发展变化趋势,为学校科学规划提出建设性的意见。借助互联网、物联网技术,高校档案部门可以搭建用户互动平台,增进档案部门与用户之间的交流,及时了解用户的利用需求,判断用户的行为习惯、推测用户的行动轨迹,以便更加个性化的服务用户、留住用户。借助移动互联网技术,高校档案部门可以推出微信平台服务,普及档案知识,提供在线咨询,推介馆藏信息,传播档案文化。
3.加强管控,优化服务效果。
档案服务工作是否有效,服务质量是标准;服务是否有质量,满足用户需求的程度是标尺。高校档案部门要提高服务水平,优化服务效果,必须以用户需求为中心,以用户满意为尺度,建立事前预防、事中控制、事后评估的档案服务质量全过程监管与考核体系。事前,要通过互动交流、用户行为数据分析等方式,全面熟悉、准确把握用户需求;事中,要运用先进技术手段,迅速、准确地满足用户需求,事后,要采取现场评价、电话回访、网络调查等手段,收集用户反馈信息,及时修改、完善档案服务流程。
(作者为山东理工大学档案馆技术信息部主任,副研究馆员)
通讯地址:淄博市张周路12号;邮编:255049
联系电话:0533-2780013
参考文献
[1]宁燕子.大数据对高校档案工作的影响分析及对策研究[J].科技视界,2015(1)。
[2]周才云.大数据时代高校档案的信息化建设探析[J].兰台世界,2015(4)。
[3]周枫.大数据时代档案馆的特征及发展策略[J].档案与建设,2013(8)。
[4]顼迎芳.构建大服务理念下的档案服务循环推进模式[J].档案建设,2012(3)。