活动预告|字节跳动大规模搜索技术应用实践分享

在人工智能迅猛发展和数据要素市场化建设的浪潮下,为进一步推动全球数据库产业进步,由中国通信标准化协会、大数据技术标准推进委员会主办的"2024 可信数据库发展大会"将于 2024 年 7 月 16-17 日在北京线下举办。

火山引擎云原生中间件团队受邀参与【搜索与分析型数据库 & 多模数据库】分论坛,资深架构师桂峰将带来《火山引擎云搜索服务大规模技术应用实践 主题演讲,与参会者共同探讨随着大模型的兴起、向量数据库的应用,火山引擎云搜索团队在实践过程中积累和沉淀的基于向量检索技术和传统文本匹配搜索的混合搜索方案。

议题介绍

火山引擎云搜索服务大规模技术应用实践

桂峰 - 火山引擎云搜索资深架构师

案例背景

在字节跳动内部对 ES 的大规模应用中,当前内部计算资源已超过 100 万核 。随着集团业务的快速发展,数据规模急剧膨胀,应用场景也愈发复杂多样,内部各业务对弹性资源、成本优化和多机房容灾等需求也越加迫切。此外,随着大模型的兴起,向量数据库的应用也越来越普遍,早在 2020 年,字节跳动云搜索团队就基于开源 k-NN 技术在 ES 7 上加入了向量搜索能力并应用到生产环境,在实践过程中积累和沉淀了基于该向量检索技术和传统文本匹配搜索的混合搜索方案。本次分享将介绍火山引擎云搜索服务在弹性资源、成本优化、容灾能力和混合搜索等方面的实践。听众收益:

  • 了解 100+ 万核 ES 服务规模下的挑战和应对方法
  • 大模型时代如何结合向量搜索和传统文本匹配搜索充分释放搜索引擎的潜力

火山引擎云搜索服务 兼容 OpenSearch、Elasticsearch、OpenSearch DashBoard、Kibana 等软件及常用开源插件,支持全文搜索、向量搜索、混合搜索、时空检索 等。提供结构化、非结构化文本的多条件检索、统计、报表,可以实现一键部署、弹性扩缩、简化运维,快速构建日志分析、信息检索分析等业务能力。更多详情一键了解

相关推荐
Elasticsearch1 天前
如何使用 Agent Builder 排查 Kubernetes Pod 重启和 OOMKilled 事件
elasticsearch
Elasticsearch2 天前
通用表达式语言 ( CEL ): CEL 输入如何改进 Elastic Agent 集成中的数据收集
elasticsearch
海兰4 天前
离线合同结构化提取与检索:LangExtract + 本地DeepSeek + Elasticsearch 9.x
大数据·elasticsearch·django
yumgpkpm4 天前
AI视频生成:Wan 2.2(阿里通义万相)在华为昇腾下的部署?
人工智能·hadoop·elasticsearch·zookeeper·flink·kafka·cloudera
Sheffield4 天前
如果把ZooKeeper按字面意思比作动物园管理员……
elasticsearch·zookeeper·kafka
嗝屁小孩纸4 天前
ES索引重建(零工具纯脚本执行)
大数据·elasticsearch·搜索引擎
Elastic 中国社区官方博客4 天前
使用 Jina Embeddings v5 和 Elasticsearch 构建“与你的网站数据聊天”的 agent
大数据·人工智能·elasticsearch·搜索引擎·容器·全文检索·jina
Elastic 中国社区官方博客4 天前
Elastic 公共 roadmap 在此
大数据·elasticsearch·ai·云原生·serverless·全文检索·aws
码云数智-大飞4 天前
像写 SQL 一样搜索:dbVisitor 如何用 MyBatis 范式颠覆 ElasticSearch 开发
sql·elasticsearch·mybatis