【Boost搜索引擎项目】

文章目录


一、项目流程

1.编写数据去标签模块--parser.cc

将去标签之后干净文档以title\3content\3url\ntitle\3content\3url\n格式放入同一文件中。

2.建立索引模块--index.hpp

读取处理好的行文本文件进行分词、权重计算等操作,在内存中构造出正排索引和倒排索引。

3.编写搜索引擎模块--searcher.hpp

对查询词进行分词、触发,依据相关度对结果进行排序,并以Json 格式进行包装后序列化为字符串返回

4.编写http_server模块--http_server.cc

通过 HTTP 服务器搭载搜索页面,为外部提供服务。

5.编写前段模块--index.html


二、项目展示

这里以搜索"split"为例:

点击标题进行跳转,以第一个标题为例:


相关推荐
光算科技2 天前
网站301搬家后|谷歌一直不收录新页面怎么办
搜索引擎
中國龍在廣州2 天前
现在人工智能的研究路径可能走反了
人工智能·算法·搜索引擎·chatgpt·机器人
后端小张2 天前
【AI 学习】从0到1深入理解Agent AI智能体:理论与实践融合指南
人工智能·学习·搜索引擎·ai·agent·agi·ai agent
零基础的修炼3 天前
[项目]基于正倒排索引的Boost搜索引擎---编写搜索引擎模块 Searcher
搜索引擎
老友@3 天前
RAG 的诞生:为了让 AI 不再“乱编”
人工智能·搜索引擎·ai·语言模型·自然语言处理·rag
Elastic 中国社区官方博客4 天前
开始使用 Elastic Agent Builder 和 Microsoft Agent Framework
数据库·人工智能·elasticsearch·microsoft·搜索引擎·ai·全文检索
yangmf20404 天前
APM(三):监控 Python 服务链
大数据·运维·开发语言·python·elk·elasticsearch·搜索引擎
yangmf20404 天前
APM(二):监控 Python 服务
大数据·python·elasticsearch·搜索引擎