【Boost搜索引擎项目】

文章目录


一、项目流程

1.编写数据去标签模块--parser.cc

将去标签之后干净文档以title\3content\3url\ntitle\3content\3url\n格式放入同一文件中。

2.建立索引模块--index.hpp

读取处理好的行文本文件进行分词、权重计算等操作,在内存中构造出正排索引和倒排索引。

3.编写搜索引擎模块--searcher.hpp

对查询词进行分词、触发,依据相关度对结果进行排序,并以Json 格式进行包装后序列化为字符串返回

4.编写http_server模块--http_server.cc

通过 HTTP 服务器搭载搜索页面,为外部提供服务。

5.编写前段模块--index.html


二、项目展示

这里以搜索"split"为例:

点击标题进行跳转,以第一个标题为例:


相关推荐
LaughingZhu6 分钟前
PH热榜 | 2025-02-23
前端·人工智能·经验分享·搜索引擎·产品运营
silianpan21 小时前
文档检索服务平台
elasticsearch·搜索引擎·开源
(; ̄ェ ̄)。1 天前
在nodejs中使用ElasticSearch(二)核心概念,应用
大数据·elasticsearch·搜索引擎
一个儒雅随和的男子1 天前
Elasticsearch除了用作查找以外,还能可以做什么?
大数据·elasticsearch·搜索引擎
Elastic 中国社区官方博客1 天前
Elasticsearch Open Inference API 增加了对 Jina AI 嵌入和 Rerank 模型的支持
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·jina
API_technology1 天前
电商搜索API的Elasticsearch优化策略
大数据·elasticsearch·搜索引擎
飞火流星020272 天前
ElasticSearch公共方法封装
elasticsearch·搜索引擎·es鉴权·es代理访问·es公共方法封装·es集群访问·判断es索引是否存在
Elastic 中国社区官方博客2 天前
Elasticsearch 自动补全搜索 - autocomplete
大数据·数据库·elasticsearch·搜索引擎·全文检索
Elastic 中国社区官方博客2 天前
Elasticsearch 混合搜索 - Hybrid Search
大数据·人工智能·elasticsearch·搜索引擎·ai·语言模型·全文检索