【Boost搜索引擎项目】

文章目录


一、项目流程

1.编写数据去标签模块--parser.cc

将去标签之后干净文档以title\3content\3url\ntitle\3content\3url\n格式放入同一文件中。

2.建立索引模块--index.hpp

读取处理好的行文本文件进行分词、权重计算等操作,在内存中构造出正排索引和倒排索引。

3.编写搜索引擎模块--searcher.hpp

对查询词进行分词、触发,依据相关度对结果进行排序,并以Json 格式进行包装后序列化为字符串返回

4.编写http_server模块--http_server.cc

通过 HTTP 服务器搭载搜索页面,为外部提供服务。

5.编写前段模块--index.html


二、项目展示

这里以搜索"split"为例:

点击标题进行跳转,以第一个标题为例:


相关推荐
xmst11 小时前
短视频如何引流?抖音小红书视频号的引流策略
搜索引擎
Elastic 中国社区官方博客1 天前
释放专利力量:Patently 如何利用向量搜索和 NLP 简化协作
大数据·数据库·人工智能·elasticsearch·搜索引擎·自然语言处理
hostpai1 天前
FebHost:科技公司选择.TECH域名的魅力
人工智能·科技·搜索引擎·国外域名·科技域名·.tech域名
hostpai1 天前
FebHost:.COM域名对于初创科技公司的优势
网络·科技·搜索引擎·网站·域名注册
LKID体2 天前
Elasticsearch核心概念
大数据·elasticsearch·搜索引擎
笔墨登场说说2 天前
git sonar maven 配置
大数据·elasticsearch·搜索引擎
溯Sec3 天前
搜索引擎之shodan(一):初始化及安装
网络·安全·web安全·搜索引擎·网络安全·系统安全·安全架构
铭毅天下3 天前
基于 Canal + Elasticsearch 的业务操作日志解决方案
大数据·elasticsearch·搜索引擎·全文检索·jenkins
Elastic 中国社区官方博客3 天前
什么是 OpenTelemetry?
大数据·数据库·elasticsearch·搜索引擎·全文检索·可用性测试
Watermelo6173 天前
从模糊搜索到语义搜索的进化之路——探索 Chroma 在大模型中的应用价值
python·机器学习·搜索引擎·语言模型·自然语言处理·数据挖掘·nlp