网络搜索引擎应用研究论文_毕业论文

毕业论文

题 目:网络搜索引擎应用研究 _ 学 院: 学生姓名: 指导教师: 起讫日期: ___________

第 1 页 共 31 页

摘 要

搜索引擎,通常指的是收集了因特网上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列,方便用户查找。

如何更加快捷、准确地查找到用户所需的网络信息资源,是各大搜索引擎服务提供商和计算机网络研究人员的研究热点。作为计算机专业的学生,搜索引擎技术对我们有很大的诱惑力,了解搜索引擎的发展现状、原理和技术手段,从算法的角度来认识搜索引擎,是我们必须掌握的知识之一。

本文主要研究搜索引擎的基本原理、搜索算法及实现技术。 关键字:搜索引擎、基本原理、搜索算法、技术。

第 2 页 共 31 页

目 录

摘 要…………………………………………………………………………………… 1 第一章 引言…………………………………………………………………………… 5 1.1搜索引擎的初现与发展…………………………………………………………… 6 1.1.1搜索引擎的初显……………………………………………………………… 6 1.1.2搜索引擎的发展……………………………………………………………… 6 1.2 搜索引擎在我国的发展现状………………………………………………………8 1.2.1我国搜索引擎的背景………………………………………………………… 8 1.2.2 搜索引擎的现状………………………………………………………………9 1.3本文的研究内容…………………………………………………………………10 第二章 搜索引擎的原理…………………………………………………………… 11 2.1搜索引擎的原理概述…………………………………………………………… 11 2.2搜索引擎的实现原理…………………………………………………………… 12 2.2.1从互联网上抓取网页……………………………………………………… 12 2.2.2建立索引数据库…………………………………………………………… 12 2.2.3在索引数据库中搜索……………………………………………………… 13 2.2.4对搜索结果进行处理排序………………………………………………… 13 2.3垂直搜索引擎的工作原理……………………………………………………… 14 2.3.1垂直搜索引擎的基本原理………………………………………………… 14 2.3.2垂直搜索引擎的技术原理………………………………………………… 14 2.3.3垂直搜索引擎技术框架…………………………………………………… 15 第三章 搜索引擎的核心--网络蜘蛛……………………………………………… 16 3.1网络蜘蛛………………………………………………………………………… 16 3.1.1网络蜘蛛的介绍…………………………………………………………… 16 3.1.2网络蜘蛛的工作原理……………………………………………………… 16 3.2网络蜘蛛的结构分析…………………………………………………………… 17 3.2.1如何解析HTML……………………………………………………………… 17 3.2.2Spider程序结构…………………………………………………………… 19 3.2.3如何构建Spider程序………………………………………………………19 3.2.4如何提高程序性能………………………………………………………… 20

第 3 页 共 31 页

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4