【Boost搜索引擎项目】

文章目录


一、项目流程

1.编写数据去标签模块--parser.cc

将去标签之后干净文档以title\3content\3url\ntitle\3content\3url\n格式放入同一文件中。

2.建立索引模块--index.hpp

读取处理好的行文本文件进行分词、权重计算等操作,在内存中构造出正排索引和倒排索引。

3.编写搜索引擎模块--searcher.hpp

对查询词进行分词、触发,依据相关度对结果进行排序,并以Json 格式进行包装后序列化为字符串返回

4.编写http_server模块--http_server.cc

通过 HTTP 服务器搭载搜索页面,为外部提供服务。

5.编写前段模块--index.html


二、项目展示

这里以搜索"split"为例:

点击标题进行跳转,以第一个标题为例:


相关推荐
策知道9 小时前
依托政府工作报告准备省考【经验贴】
大数据·数据库·人工智能·搜索引擎·政务
TracyCoder12311 小时前
ElasticSearch内存管理与操作系统(一):内存分配底层原理
大数据·elasticsearch·搜索引擎
春日见16 小时前
Autoware使用教程
大数据·人工智能·深度学习·elasticsearch·搜索引擎·docker·容器
会员源码网17 小时前
Elasticsearch从零启动指南:安装、配置、启停与排坑全解析
大数据·elasticsearch·搜索引擎
uyeonashi18 小时前
Boost搜索引擎测试报告
功能测试·selenium·搜索引擎
洛阳纸贵1 天前
JAVA高级工程师--Elasticsearch安装以及内置分词器、IK分词器
大数据·elasticsearch·搜索引擎
历程里程碑1 天前
子串----和为K的子数组
大数据·python·算法·leetcode·elasticsearch·搜索引擎·哈希算法
Elastic 中国社区官方博客2 天前
使用 LangGraph 和 Elasticsearch 构建 人机协同( HITL )AI agent
大数据·人工智能·elasticsearch·搜索引擎·ai·机器人·全文检索
YXWik62 天前
openManus更改搜索方式Google改为国内搜索引擎
搜索引擎
历程里程碑2 天前
滑动窗口-----找到所有字母异位词
大数据·python·算法·elasticsearch·搜索引擎·flask·tornado