网络搜索引的比较研究课题 论文(报告、案例分析)
院 系 信息学院 专 业 电子商务 班 级 电子商务1班 学生姓名 王烁晨 薛越洋 学 号 2010211013 2010211190 任课教师 师鸣若
2013年 1月 19日
网络搜索引擎的比较研究
学生姓名: 王烁晨 2010211013 薛越洋2010211190
摘要: 搜索引擎已成为中国互联网用户获取网络信息的主要工具,利用搜索引擎查询网上信息资源已成为解决网络资源利用的有效方式, 信息界亦掀起了搜索引擎研究的热潮. 文中简单介绍了搜索引擎及其在全球与中国的现状, 并以目前国内外排名靠前的搜索引擎Google、百度和雅虎为研究对象, 从界面、内容、问答、用户结构、经营等多个角度进行比较, 旨在挖掘3者各自的特殊, 为搜索引擎的个性化比较研究提供依据. 最后作出总结并提出了搜索引擎的未来发展趋势及本文不足之处. 关键词: 搜索引擎; Google;百度;雅虎; 比较研究 引言
Internet 与全球电信的迅猛发展使信息资源的“生产”、“传播”与“消费”出现了新的格局. 信息资源如雨后春笋, 信息在网络上的传播速度跨数量级的提升, 使得上网用户获取真正有用的信息越来越难. 如何在网上快速、有效地获取信息资源, 已经成为信息查询者的一大难题, 因此网络搜索引擎应运而生.
搜索引擎已成为中国互联网用户获取网络信息的主要工具, 它对迅速筛选所需信息起到很重要的作用. 如今世界上的搜索引擎数以万计, 因此, 选择合适的搜索引擎就成为重中之重. Google、百度和雅虎中国是目前比较有影响力的三种著名的搜索引擎, 本文将对其主要的性能指标进行分析比较, 以期抛砖引玉, 使现有的中文搜索引擎发展得更快更好.
1网络搜索引擎的含义及分类
网络搜索引擎又称为网络检索引擎, 其英文译名为Search Engine. 广义上是指一种基于Internet的信息查询系统, 包括信息抓取、信息管理和信息检索; 狭义上是指一种为搜集Internet上的网页而设计的检索软件. 现有的网络搜索引擎基本上分为3 类:
(1)独立搜索引擎(Single search engine). 其特点是仅在搜索引擎的本身数据库中查询, 如我们经常使用的Google、百度、雅虎等.
(2)元搜索引擎(Meta search engine). 所谓元搜索引擎是对分布于网络的各种检索工具的全局控制机制, 它通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作. 其特点是对查询得到的结果进行不同程度的处理, 如:删除重复结果、检验连接、结果按相关
1
度排序等. 元搜索引擎本身按照其工作方式的不同又分为并行处理引擎和串行处理引擎.
(3)网络搜索软件(Net search software). 其特点是网络用户可将相应的搜索软件下载至本地计算机上安装查询, 是一种具有网络查询功能的离线浏览器.
2网络搜索引擎的搜索原理
网络搜索引擎实际上是个专用的WWW服务器, 它存有庞大的索引数据库, 收集了全世界上百万甚至上千万个WWW 主页的文字信息. 为了收集这些信息, 有个自动检索程序(Robots)沿着WWW 的超文本链经常搜索整个WWW 上的主页, 然后为这些主页上的每个文字建立索引并送加集中管理的索引数据库. 索引信息包括文档的WWW 地址、每个文档中单词出现的频