搜索引擎的设计与实现(四)

目录

[6 系统测试](#6 系统测试)

6.1测试重要性

6.2测试用例

[结 论](#结 论)

[参 考 文 献](#参 考 文 献)


前面内容请移步

搜索引擎的设计与实现(三)

免费源代码&毕业设计论文

搜索引擎的设计与实现

6 系统测试

6.1测试重要性

该项目是在本地服务器上进行运行和调试,首先是对Java环境的安装及配置,以及对数据库环境的安装与配置,安装完毕后将文件导入根目录,以后才可以在浏览器上进行运行、测试。

在项目开发过程中,会遇到那种错综复杂的问题,所以,测试在软件开发过程中起到了至关重要的作用,它的影响力不比任何开发的环节低,因为软件的开发是一项巨大的工程,不仅耗时,而且开发人员也不可能会预料到所有可能出现的情况,这样就会导致每个时期都难免会产生一系列的错误,而测试人员的主要职责就是,检查与发现程序在运行的程中的错误;一个优异的测试用例,就说明这个测试用例可以有极大地概率找出系统中目前还没有被觉察到的错误;找出目前还没有觉察到的错误,这就是成功的测试的标准。本系统的测试和纠错信息流程如图6.1所示。

图6-1 测试和纠错信息流程图

软件测试,又称为多模块测试,一共有四个阶段:

表6-1 测试阶段的介绍表

|---------|---------------------------------------------------------|
| 单元测试 | 单元测试的用例从单元详细设计中导出。 功能性测试与结构性测试可用于单元测试。 |
| 集成、确认测试 | 这一阶段的任务,是通过把单元测试中的各个模块按要求整合到一起,通过调试等步骤,获得一套可以满足用户需求的软件。 |
| 系统测试 | 本阶段中所寻找的错误通常是与目标需求之间存在的差距。通常是属于功能性测试的。 |

图6-2 层次测试的信息流程图

6.2测试用例

通过输入关键字进行查询,然后根据搜索结果判断系统是否存在问题.

例:搜索"在",反馈结果如图6-2所示:

图6-3 搜索结果图1

可见搜索结果是正确的,并且关键字都已高亮度显示。

结 论

本次设计主要就是通过利用Lucene技术,来实现搜索引擎的设计和实现的过程。其中用到了开源工具有MyEcipse(提供项目运行的Java环境,编写程序空间)、sql server2008(数据库,用户前端展示信息的支撑,是数据的存储地)、tomcat(服务器,用户提交检索请求,由它来进行接收、处理)他们分别管控的自身的部分,同时也相互协调配合,这一功能得以正常运行和实现,是缺一不可的。

本项目是对一个基于Lucene技术的搜索引擎设计与实现的过程,通过开源库Lucene的支持,快速地实现了海量信息的搜索功能,它不仅实现了文件快速查找的功能,而且还实现了全文搜索,还能实现类似百度的分词搜索效果,效果颇佳。同时加入了数据库处理。

该系统可以通过扩展或改造然后适用于站内搜索,这样可以使用户快速的找到自己想浏览的信息,提高用户体验和网站流量。

到此搜索引擎的基本功能都已基本完成,但是还有待改进或加强的地方,例如如果把分词做到最优最人性化,怎样分才是最合理,都需要进一步研究。

参 考 文 献

  • 1.] 李刚,宋伟,邱哲.征服Ajax+Lucene构建搜索引擎.北京:人民邮电出版社,2006.
  • 2.] 邱哲,符滔滔.开发自己的搜索引擎-Lucene2.0+Heritrix.北京:人民邮电出版社,2007.
  • 3.] 孙承杰.基于统计的网页正文信息抽取方法的研究.中文信息学报,2004,18(5):17-22.
  • 4.] http://www.docin.com/p-1436638591.html基于Lucene全文检索引擎的应用研究与实现.
  • 5.] 朱明.数据挖掘.合肥:中国科学技术大学出版社,2002.
  • 6.] Hu Y H, Li H, Cao Y B et al. Automatic extraction of titles from general documents using machine learning. Information Processing and Management, 2005, 42 (5):1276-1293.
  • 7.] 王德峰,李东.搜索引擎Google的体系结构及其核心技术研究.哈尔滨商业大学学报(自然科学版),2006,(01).
  • 8.] 吕平.基于Ajax的IP网络管理系统的研究与实现:(硕士学位论文).北京:北京交通大学, 2007.
  • 9.] 陈兵国.基于AJAX的网站设计与实现.福建电脑,2007,(12).
  • 10.] 张校乾,金玉玲,侯丽波.一种基于Lucene检索引擎的全文数据库的研究与实现.现代图书情报技术,2005.
  • 11.] 杨海东.基于Ajax技术的异步搜索引擎研究与实现:(硕士学位论文).南京信息工程大学,2007.
  • 12.] 周珍娟,张字平,陆玲.基于Lucene2.0的电子文献全文检索系统.电脑知识与技术(学术交流),2007.
  • 13.] 朱永盛,武港山.基于Web的新闻信息抽取.计算机工程,2006,32(10):74-76.
  • 14.] 刘迁,贾惠波.中文信息处理中自动分词技术的研究与展望.计算机工程与应用,2006.
  • 15.] 丁承.基于字表的中文搜索引擎分词系统的设计与实现.计算机工程,2001.
相关推荐
爱上语文1 分钟前
Maven快速入门及其POM
java·maven
搬砖的小码农_Sky3 分钟前
C语言:树
c语言·开发语言·数据结构
ZmyCoder10 分钟前
SpringBoot中忽略实体类中的某个属性不返回给前端的方法
java
哎呦没11 分钟前
英语知识网站开发:Spring Boot框架技巧
spring boot·后端·性能优化
是小博同学鸭11 分钟前
【面向对象的程序设计——集合框架】主要接口
java·开发语言
荔家大少12 分钟前
海外媒体发稿:根据您的要求编写二十个文案标题方法-华媒舍
大数据·搜索引擎·新媒体运营·传媒·媒体
世间万物皆对象15 分钟前
Spring Boot Web应用开发:数据访问
java·数据库·spring boot
顽疲34 分钟前
springboot vue 开源 会员收银系统 (9) 库存管理 结算时扣库存
vue.js·spring boot·后端
神秘的t35 分钟前
MySQL基础知识大总结
数据库·mysql