技术栈
高并发架构设计
小熊学Java
10 个月前
java
·
elasticsearch
·
搜索引擎
·
高并发架构设计
【搜索引擎设计:信息搜索怎么避免大海捞针?
在前面我们提到了网页爬虫设计:如何下载千亿级网页?中,我们讨论了大型分布式网络爬虫的架构设计,但是网络爬虫只是从互联网获取信息,海量的互联网信息如何呈现给用户,还需要使用搜索引擎完成。因此,我们准备开发一个针对全网内容的搜索引擎,产品名称为“Bingoo”。