数据挖掘----图书馆员应掌握的基本工具-搜索引擎技术

王绿园 康梅英 广州解放军体育学院 510502
  摘 要:本文揭示了在未来数字图书馆中图书馆员进行信息服务的一种方式;论述了数据挖掘和WEB挖掘的基本原理和方法;强调图书馆员应掌握数据挖掘这项新技术的必要性。
关键词:数据挖掘、WEB、INTERNET、信息服务、图书馆员
  一、引言
  随着信息时代的到来、INTERNET技术的发展,图书馆未来的功能变得越来越多样化。由于WEB技术的巨大成功,人们越来越多地依靠INTERNET来获取知识、信息。显然,人们到图书馆的次数和时间已越来越少,总有一天,人们再也不会亲自跑到图书馆去借一本书或咨询某个问题。面临着如此巨大的挑战,从事图书馆工作的人们提出了数字图书馆的设想。经过艰苦的研究已成功地建立了数字图书馆。数字图书馆是一个标准的电子信息基础设施,它采用分布数据存储,用户可以通过各种链接和操作在一个较大的地域范围内搜索和检索出自己所需的信息,而且整个操作对用户是开放的。也就是说,数字图书馆能够把数据存储在多个站点中,用户只须一个简单的操作就可从这些站点中搜索信息。数字图书馆是传统图书馆在信息时代的发展,它不但包含了传统图书馆的功能,还提供综合的信息访问服务。人们希望,数字图书馆将成为未来图书馆的信息中心和枢纽。
  但是,从网络技术角度来看,数字图书馆与其它WEB信息源没有两样,它们都是建立在INTERNET上的信息站点。从用户的角度来看,他们关心的是从INTERNET上获得信息和知识,他们不能体会到你是数字图书馆还是INTERNET上的一般站点。但是要从成千上万的WEB信息站点中检索到有用的信息是不容易的,有时甚至是不可能的,更何况信息的索要者往往没有多少时间在茫茫的数据海洋中漫游。我们知道在数字图书馆中,图书馆员是信息专家,他们是信息组织者、信息生产者、信息服务者和信息管理者。正是通过图书馆员的信息服务活动使数字图书馆有别于其它信息站点。那么,图书馆员特别是院校图书馆中的图书馆员在二十一世纪的数字图书馆中应如何进行信息服务?图书馆员须掌握什么先进技术工具为用户服务?这是当前图书馆界应该研究的重要问题。
  二、技术的选择
  WEB是一个非常成功的信息系统。这个系统为信息在全球范围发布和传播提供了机会,它允许任何人在任何地点任何时间传播和获取信息。WEB的非结构化信息传播和获取方式引发了信息爆炸。大量的非结构化的信息分散在整个INTERNET中。大量信息在给人们带来方便的同时也带来了许多问题:信息过量,难以消化;信息真假难以辨识;信息安全难以保证;信息形式不一致,难以统一处理。在信息的海洋中,即使是最先进的 搜索引擎也只能从1/3可以索引的WEB站点中获取信息。人们开始提出一个新的口号:“要学会抛弃信息”。人们开始考虑:“如何才能不被信息淹没,而是从中及时发现有用的知识、提高信息利用率?”事实上,作为一个非专业的信息管理人员,要从茫茫的信息海洋中获取本专业最新、最权威知识和较为全面的信息,并从中得到有用的知识几乎变得不可能。要知道,各高等院校或研究所里的专家教授们由于研究课题计划的紧迫,他们急需本专业领域的最新最权威的知识和信息,他们没有时间在成千上万的站点中的数不清的页面中查找所需的信息。所以在信息的提供者与信息的消费者之间应有一个中间环节,通过这个环节,信息消费者能够快捷方便地得到想要的信息,正是这种迫切需要为图书馆员提供了展现才华的机会。图书馆员们运用信息管理技能,直接为用户提供有用信息。图书馆员们应抓住机会,认真考虑在INTERNET环境中,如何使其服务领域得以扩宽,从桌面咨询服务扩展到基于WEB信息空间电子咨询服务。

时间: 2024-12-02 21:10:01

数据挖掘----图书馆员应掌握的基本工具-搜索引擎技术的相关文章

数据挖掘----图书馆员应掌握的基本工具

中介交易 SEO诊断 淘宝客 云主机 技术大厅 王绿园 康梅英 广州解放军体育学院 510502 摘 要:本文揭示了在未来数字图书馆中图书馆员进行信息服务的一种方式:论述了数据挖掘和WEB挖掘的基本原理和方法:强调图书馆员应掌握数据挖掘这项新技术的必要性.  关键词:数据挖掘.WEB.INTERNET.信息服务.图书馆员 一.引言  随着信息时代的到来.INTERNET技术的发展,图书馆未来的功能变得越来越多样化.由于WEB技术的巨大成功,人们越来越多地依靠INTERNET来 获取知识.信息.显

测试应选择什么测试工具进行学习?

问题描述 测试应选择什么测试工具进行学习? 女生,想转测试,但是不知道从何学起,现在的工作类似于实施 解决方案 做测试?游戏测试还是应用测试,建议学学压力测试工具比如tomcat,jemter等工具,然后掌握shell脚本 解决方案二: 看你做什么测试了,白盒还是黑盒,有很多成熟的测试工具,可以学习下使用方法,比如VU 解决方案三: C++Test,收费软件,用的还是比较多的 解决方案四: QTPLoadRunner等等!

进行数据挖掘的8个最佳开源工具

数据挖掘,又称为资料探勘.数据采矿.它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤,是一个挖掘和分析大量数据并从中提取信息的过程.其中一些应用包括市场细分 - 如识别客户​​从特定品牌购买特定产品的特征,欺诈检测 - 识别可能导致在线欺诈的交易模式等.在本文中,我们整理了进行数据挖掘的 8 个最佳开源工具. 1.Weka WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理

最有前途的软件开发技术——搜索引擎技术

搜索技术发展及未来趋势 搜索技术仍不能满足需求 Internet的迅速发展和广泛应用导致了网上信息爆炸性地增长.据权威机构统计,网上约有数十亿的网页,甚至有些专家宣称网页总数已达5500亿,这一数字仍然在不断地快速增长.因此,如何在庞大的Internet上获得有价值的信息已成为网民日益关注的问题.搜索技术的出现为网民从Internet上快速找到所需信息带来了福音.搜索引擎是一种用于帮助Internet用户查询信息的搜索工具,它以一定的策略在Internet中搜集.发现信息,对信息进行理解.提取.

搜索引擎在网络信息挖掘中的应用-搜索引擎技术

     随着网络信息资源的急剧增长,人们越来越多地关注如何快速有效地从海量的网络信息中,抽取出潜在的.有价值的信息,使之有效地在管理和决策中发挥作用.搜索引擎技术解决了用户检索网络信息的困难,目前搜索引擎技术正成为计算机科学界和信息产业界争相研究.开发的对象.本文旨在探讨搜索引擎技术在网络信息挖掘方面的应用.     一.数据挖掘的研究现状     讨论网络信息挖掘,首先要从传统的数据挖掘谈起.     1.什么是数据挖掘     根据W.J.Frawley和G.P.Shapiro等人的定义,

搜索引擎技术及趋势

中介交易 SEO诊断 淘宝客 云主机 技术大厅 李晓明:1982年毕业于哈尔滨工业大学,1986年毕业于美国史蒂文斯理工学院计算机系,获博士学位.现任北京大学计算机科学技术系教授,博士生导师,系主任. 研究方向为计算机并行与分布处理. 刘建国:北京大学计算机系副教授. 随着因特网的迅猛发展.WEB信息的增加,用户要在信息海洋里查找信息,就象大海捞针一样,搜索引擎技术恰好解决了这一难题(它可以为用户提供信息检索服务).目前,搜索引擎技术正成为计算机工业界和学术界争相研究.开发的对象. 搜索引擎(S

搜索引擎的价值来源-搜索引擎技术

电子邮件和搜索引擎长期以来一直是两项最受欢迎.最热门的互联网业务.CNNIC截止2003年6月底的统计表明,互联网用户使用电子邮件和搜索引擎的比率分别为91.8%和70.0%,在近30种网络服务中高居前两位.用户对搜索引擎的满意度也很高,其中,对搜索引擎服务表示非常满意和比较满意的分别为23.4%和50.3%(居各项服务之首),表示不太满意和很不满意的仅为3.9%和0.9%(居各项服务之末).搜索引擎在互联网世界的重要地位由来已久.当年,Yahoo作为门户网站奇迹般崛起所仰仗的正是搜索引擎.在日

网络搜索的技术、模式与竞争走势-搜索引擎技术

搜索市场,扩疆拓土者众,彼此间的竞争上升为"白热化".这是因为搜索已经成为互联网第二大应用,并被称为"电子商务的基石"."互联网的战略核心",而Google名利双收的示范效应,更加剧了狂热的追逐. 若待天下瓜分完毕,故事就缺少了悬念,于是有了这篇妄自揣测未来格局的文章.我们最关注的是预估2006年将达到23亿美元的中文搜索引擎市场,本土企业在国际巨头的"大棒+黄油"攻击下,下一步的发展可能. 搜索市场还存在两大变数:核心技术与

未来搜索市场王者——个性搜索的技术与市场-搜索引擎技术

2003年2月,Google 收购了全球最大的Blog 服务之一Blogger.com 的提供商Pyra Labs:2003年9月,Google收购了一家制作个性化和上下文关联搜索工具的新兴企业Kaltix:2003年10月,Google收购在线广告网络公司Sprinks:2004年7月,Google宣布收购加州的Picasa数字相片管理厂商:2004年10月,Google收购了总部位于加州的数字地图服务商Keyhole:2004年12月,Google宣布同世界领先的研究图书馆及牛津大学达成协议