数据挖掘技术在图书馆中的应用研究

王伟聪

(三亚学院图书馆 海南三亚 572000)

就图书馆发展历程而言,其经历了印刷纸张、自动化集成到数字化等发展阶段。图书馆作为信息存储、信息服务的中心,在信息化浪潮中逐步累积了海量的信息资源。随着社会的不断发展,图书馆需要不断创新发展,为读者提供更为优质的服务,满足读者不断提升的图书借阅、信息获取需求。数据挖掘技术是一项新兴的计算机信息技术,可依托相应方式分析出有价值的信息,因而近年来在众多行业领域得到广泛推广,其中也包括在图书馆中的应用。数据挖掘技术的出现,让图书馆各项管理服务工作得到了有效改善,通过数据挖掘技术可从数据库中提炼出未知的、有价值的信息,进而为读者提供更优质的服务,让读者可以结合自身需求高效便捷地获取信息资源,并推动图书馆资源的有效利用[1]。因此,该文将对数据挖掘技术在图书馆中的应用进行研究分析。

图书馆工作主要涉及馆藏系统、工作系统、读者系统等多个方面。随着现代信息技术的不断发展与应用,图书馆各系统可集成至一个共有系统中,并产生大量的数据信息,基于这些数据信息开展图书馆工作,将使图书馆工作质量、效率得到有效提升。需要注意的是,现阶段图书馆各项工作开展中仍存在一系列问题,如图书馆图书管理、利用效率不足;
不少书目、文献缺乏实用性或大部分读者喜爱的书目数量有限,难以满足读者的需求等。因此,有必要引入先进技术,为图书馆各项工作提供支持,提升图书馆整体的管理质量、服务水平。

2.1 数据挖掘技术

随着科学技术的飞速发展,信息加工处理逐渐成为信息化的重要技术支撑。现如今,众多行业领域的问题均可通过数据挖掘技术进行解决,数据挖掘技术在人们生产生活中得到越来越广泛的应用。数据挖掘技术主要是指基于海量的数据信息,依托一系列技术应用及模型构建以开展既有数据分析处理,进而建立起一个预测性的模型及相关系统。作为一项新兴的计算机信息技术,数据挖掘技术通过对数据信息的加工处理,可为相关人员做出合理的工作选择及决策提供有效帮助。

2.2 数据挖掘技术类型

依据数据结构方式不同,可将数据挖掘技术划分为以下几种类型。

2.2.1 文本数据挖掘

文本数据挖掘指的是利用计算机技术从文本数据中挖掘出有价值的数据信息。文本数据挖掘一般可分为文本信息挖掘、文档类信息挖掘这两种,对于文本数据挖掘而言,主要涉及对文本信息特征的提取、对文本信息进行分类以及对文本数据进行分析等。在对文本数据挖掘开展应用过程中,通常会应用到词串表示法、词集合算法、贝叶斯分类算法等技术手段,以此为数据信息相关工作提供有力支持[2]。

2.2.2 Web数据挖掘

根本上而言,Web 数据挖掘即为数据挖掘技术在Web页面的应用,主要涉及了对Web数据等数据信息,诸如用户信息、Web 页面结构等数据信息,开展提炼、优化页面设置,了解访问用户行为、内容。通过Web数据挖掘,可为用户提供一系列更为优质的服务,并基于服务目的及服务内容的不同,对不同个体开展差异化挖掘,主要包括Web日志挖掘、Web内容挖掘以及Web架构挖掘等。

2.2.3 数值数据挖掘

数值数据挖掘主要是指对数值数据进行挖掘,主要作用于描述数值数据、预测数值数据。数值数据挖掘可实现概念描述功能,并着重开展分类分析、预测分析,常见应用方法包括有遗传算法、归纳法以及模糊数学方法等。

3.1 助力图书馆资源建设管理

长期以来,资源建设管理一直是图书馆工作中的重要一环,其对图书馆所提供资源的质量有重要影响,决定着图书馆资源可否满足读者的实际需求。随着如今图书馆信息化建设的不断推进,不论是传统纸质资源还是数字资源,都需要通过信息化管理。总体而言,图书馆资源建设管理重中之重在于满足读者阅读需求,保障资源管理质量、效率两大方面。通过对数据挖掘技术的应用,图书馆资源建设管理在以下两方面均得到有效优化,进一步为图书馆可持续健康发展提供有力支持。首先,在满足读者阅读需求方面,图书馆应建立起对读者阅读需求的有效认识,除了要满足大多数读者的阅读需求,还应就少许读者提供相应资源,尽可能让每位读者都可获取到自身需求的资源[3]。数据挖掘技术在图书馆中的应用,可帮助图书馆更为全面深入、高效便捷地挖掘读者相关信息,有效了解读者阅读需求,有针对性地进行图书采购、数字资源购置等工作,推进图书馆资源建设管理。其次,在提升图书馆资源管理质量、效率方面,数据挖掘技术同样有着十分突出的应用优势。在当前信息化时代下,图书馆资源数量不断增多,同时资源类型不断趋于多元化、复杂化,由此一定程度上加大了资源管理难度,传统管理模式不足以实现对各项资源的高质高效管理。数据挖掘技术的应用可深入分析资源内在联系,继而完善资源管理逻辑,实现对资源的高质高效管理。

3.2 提升图书馆服务水平

提升图书馆服务水平不仅是如今图书馆发展的大方向,还是图书馆充分秉持人本理念,使广大读者获得更优质借阅体验的重中之重。特别是随着近年来个性化服务的不断发展应用,可就不同读者提供更为满足他们需求的服务,全面提升读者的满意度。在图书馆传统服务管理模式下,个性化服务并不易于实现,究其原因主要在于缺乏对读者信息、需求等的有效了解,难以为每位读者提供有针对性的服务。图书馆通过对数据挖掘技术的有效应用,针对在图书馆开展借阅或使用网上图书馆的读者开展全面采集挖掘,全面深入了解每位读者的实际需求,并为每位读者建立特定的个性化数据库,进一步依托个性化消息推送等方式,为读者提供更有针对的、个性化的借阅服务[4]。

4.1 图书资源利用率不足

图书资源利用率不足作为现阶段图书馆广泛存在的问题,一些地方在建设图书馆时,一味地追求增加图书馆馆藏图书数量,但对其基本职能,也就是服务读者的职能,却缺乏有效关注。比如:对一项热门的书籍或前沿的技术资料,往往在最初上架时便被借阅一空,而一些冷门书籍在书架上则常年无人问津。现如今,图书馆已然成为学生的自习室,学生在图书馆占位并非为了借阅图书进行阅读,而更多是进行与自身学业相关的学习,这一定程度上违背了图书馆建设的初衷。除此之外,图书馆工作人员在采购图书时,由于缺乏对读者反馈信息的有效掌握,因而难以有效满足读者需求。虽然有读者会进行反馈,但因为信息反馈不及时,造成该工作难以进行及时调整。

4.2 管理技术难以跟上时代脚步

在图书馆运营发展中,表现出管理技术难以跟上时代前进脚步的问题。新时期,网络信息技术、移动终端设备迅猛发展,为图书馆管理工作提出了更为严格的要求。一些图书馆还未能实现图书信息管理数字化,读者需要在图书馆进行图书检索,难以通过网络平台进行检索,同时也难以通过网络获取最新的图书信息及文献资料。除此之外,图书借阅、归还仍偏向于人工方式,自动借阅及归还功能不完善,读者获得的阅读体验不佳。

4.3 图书馆个性化服务水平不足

现阶段,图书馆大多采用的是汇文文献信息服务系统,可为读者提供相应的推荐服务,系统也配有数据挖掘工具,可通过算法为读者推送相应的全文链接、专题报告等,还可通过数据分析及相关算法,对当前系统中的数据开展简单统计。然而其数据挖掘、统计分析仍停留在相对浅层次的阶段,在实际应用及读者体验中仍缺乏充分体现,同时对信息检索能力的提升也不明显。数据挖掘在这一系统中的价值并未得到充分发挥,如今一些图书馆的管理系统还具备集成数据分析功能。

5.1 在图书馆图书管理中的应用

数据挖掘技术在图书馆图书管理中的应用,主要可从以下几方面工作入手。

(1)在图书馆图书采购管理中的应用。图书采购管理作为图书馆资源建设的重要一环,唯有依托科学合理的采购管理,图书馆资源方可切实满足广大读者的多元需求,让每位读者均可在图书馆获取到自身需求的信息资源。总体而言,图书馆图书采购管理一般需要考虑读者需求、自身发展方向两方面内容,在此过程中,图书馆应借助数据挖掘技术对读者相关信息进行全面充分挖掘,进而从海量数据信息中有效掌握读者需求,为图书采购管理工作开展提供可靠依据。同时,图书馆还应借助数据挖掘技术对政策信息、市场进行深度挖掘,综合分析为自身建设特色图书馆提供可靠数据支持,进一步以颇具特色的资源打造独特的图书馆品牌。

(2)在图书馆文献管理中的应用。通过对数据挖掘技术的有效应用,可显著提升图书馆文献利用效率,依托对文献的优化管理,以提升文献重复利用效率,同时对于使用率偏低的文献资源,可依托结构性优化对相关文献资源采取收藏、淘汰等手段,做到恰当处理[5]。

(3)在图书馆文献排架工作中的应用。图书馆传统排架方式大多为依据书目的分类号开展排架,该种排架方式为图书使用带来了一定便利,但并非最佳的书目排架方式。基于数据挖掘技术可实现图书排架方式的有效创新,让读者阅读图书变得更为便捷。实践表明,基于数据挖掘技术开展图书排架,可为提供趋于个性化的阅读选择,提升图书资源的使用效率。

5.2 在图书馆信息化建设中的应用

信息化时代背景下,图书馆不断提高对信息化建设的重视度,并通过投入大量的人力、物力、财力,以推进图书馆信息化建设。图书馆信息化建设一项复杂的系统工作,不仅体现在硬件设备建设方面,还体现在信息化资源及信息化功能的建设完善。数据挖掘技术在图书馆中的应用,同样可为图书馆信息化建设管理提供有力支持,并重要体现于硬件设备、数字资源、信息化功能等方面。首先,图书馆应加大数据挖掘力度,对图书馆信息化发展、传统管理模式进行全面比较研究,综合分析并建立科学合理的发展规划,开展好硬件设备建设工作,为图书馆信息化建设提供基础支持。其次,图书馆还应加大数字资源建设管理力度,一方面要从网络渠道购置引入更多样、更丰富的数字资源,还应加强途径传统纸质资源向数字资源的转化,并借助数据挖掘技术对该过程进行全面管理,有效发现数字资源中存在的不足并进行改进。再次,图书馆还应借助数据挖掘技术对图书馆信息化功能予以建设完善,深度挖掘全球范围内优秀图书馆信息化功能、读者需求及数字图书馆相关数据信息,不断优化图书馆信息化功能。比如:利用数据挖掘技术,打造科学适用的Web导航平台。Web信息量有着繁杂、无序的特征,对Web中的信息开展全面充分筛选存在不小的难题。基于此,对读者搜索的关键词、浏览资源类型与大小及浏览时长等,Web 日志应对其开展全面分析并提炼其中的联系,同时,借助authority方法对相应学科的权威页面开展挖掘,以提取Web站点访问路径,接着对图书馆网页链接予以有效调整,为读者有效了解学科发展趋势及获取学科前沿知识创造有效便利[6]。

5.3 在图书馆个性化服务中的应用

新时期,图书馆已经不再局限于为读者提供信息查询、信息反馈等单一服务,而需要结合读者的实际需求、兴趣偏好等,主动向读者提供个性化的信息服务。对于数据挖掘技术在图书馆个性化服务中的应用,可从以下几方面内容入手。

(1)确立数据挖掘目标,并建立数据库。确立数据挖掘目标使开展数据挖掘的首要环节,依托分析读者的实际需求,建立有效且合理的数据挖掘目标。在确立完毕数据挖掘目标后,即转投数据准备工作,即为从海量数据信息中提炼一个与目标相关联的样板数据子集,并基于此建立一个储存各类数据挖掘需求数据的数据库。将数据挖掘技术应用于图书馆个性化服务中,首要步骤即为建立两个数据库,分别为读者数据库和图书馆特色资源数据库,例如:读者接受图书馆服务时,会留下借阅记录、网站访问痕迹等数据,这些数据蕴藏着大量有用的信息[7]。

(2)分析调整数据库中的数据。在数据库建立完毕后,需要对两个数据库中的数据进行分析调整。如果原始数据质量偏低,则尽管建立的数据模型很可靠,也会对最终预测结果造成不利影响。因此,需要对数据库中的数据开展抽取、清洗、转换等工作。其中,数据抽取即为搜索出与数据挖掘目标相关的各类数据信息,数据清洗是指对数据重复记录等予以消除,并对计算缺值数据开展推到。数据转换是指对数据维数开展精减,由数据初始特征中提炼有价值的部分特征,以此有效缩减在数据挖掘中要考虑的变量数。

(3)选取适用的算法,建立相关数据挖掘模型。针对挖掘中的某项任务,往往可采用不同的算法。为此,应结合数据特征及实际运行系统要求或读者需求,来进行算法选择,比如:有的读者需求的是预成型知识,有的读者需求的是描述型知识或者易于理解的知识等。在选择完毕算法后,继而要建立相关的数据挖掘模型,也就是依托聚类、分类且采用时序模型,提炼出读者个性化、普遍性需求,接着对关联规则模型开展构建。需要注意的是,对于建立的相关模型,还应开展必要的验证、试用,以此选定能有效解决目标问题的最理想模型[8]。

(4)数据挖掘结果处理。在采用算法规则建立数据挖掘模型后,还应利用这一算法再开展计算,进一步获取数据挖掘结果。图书馆应当对结果开展可视化处理,即为将抽象的数据结果转化成易于理解的结果,进而一方面为图书馆制定管理决策提供依据,另一方面为读者提供更优质的服务。

综上所述,图书馆作为一项公共基础设施,是教育事业中不可或缺的部分,是公众获取信息资源的重要方式,依托数据挖掘技术有效发现图书馆各项管理服务工作中存在的问题,将其应用于图书馆管理,应用于图书馆信息化建设中,应用于图书馆个性化服务中,对推动图书馆的可持续健康发展具有十分积极的意义。

猜你喜欢数据挖掘图书图书馆探讨人工智能与数据挖掘发展趋势大众投资指南(2021年35期)2021-02-16图书推荐南风(2020年22期)2020-09-15欢迎来到图书借阅角小学生优秀作文(低年级)(2019年5期)2019-04-25图书馆小太阳画报(2018年1期)2018-05-14班里有个图书角小学阅读指南·低年级版(2017年12期)2017-12-26基于并行计算的大数据挖掘在电网中的应用电力与能源(2017年6期)2017-05-14一种基于Hadoop的大数据挖掘云服务及应用信息通信技术(2015年6期)2015-12-26去图书馆小天使·一年级语数英综合(2014年8期)2014-06-26基于GPGPU的离散数据挖掘研究电子设计工程(2014年18期)2014-02-27

推荐访问:数据挖掘 馆中 研究