【2023云栖】郭瑞杰:阿里云搜索产品智能化升级

本文根据 2023 云栖大会演讲实录整理而成,演讲信息如下:

演讲人:郭瑞杰 | 阿里云资深技术专家、搜索负责人

演讲主题:阿里云搜索产品智能化升级发布

近日在2023云栖大会上,阿里云搜索负责人郭瑞杰对阿里云搜索产品智能化升级发布,在全场景的搜索细分领域,提供智能化产品能力,包括基于大模型的开放搜索(OpenSearch)LLM智能问答版和向量检索版,以及面向日志和文本分析场景的Elasticsearch Serverless版等。

基于企业专属大模型的对话式搜索

开放搜索(OpenSearch)LLM智能问答版是一站式SaaS化对话式搜索解决方案,内置通义千问以及第三方开源大语言模型,用户可基于业务数据搭建企业专属模型。产品内部集成了段落切分、向量化模型、向量引擎、检索增强大模型等对话式搜索的全链路能力,并可以做到分钟级PoC,小时级正式上线。与开源大模型相比,有更高的准确率基线,答案准确率提升大概20%,幻觉减少40%。开放搜索做了大量的推理优化,token生成速度提升2-3倍,GPU资源使用量减少50%。

识林是一个专注在制药合规领域进行知识收集整理的平台,为药企提供从药物研发、生产到变更等全生命周期的法律法规检索、咨询服务。在今年上半年,识林基于OpenSearch构建了大语言模型的智能问答体系,现在已经无需用户通过关键词反复的检索,通过浏览法律法规原文获取答案,而是以自然语言的方式向提问,识林平台理解问题意图,通过大模型快速的到最终答案,并清晰的展示参考依据。

同时,阿里云推出了基于开放搜索问答版构建的智能学术论文助手SmartArxiv,支持学术调研、速读论文、方法对比、文献综述等功能,帮助解决学术界"信息过载"的问题。目前已在ModelScope官网创空间上线,用户可免费使用。

modelscope.cn/studios/sma...

相比开源引擎,向量检索性能提升3倍

开放搜索向量检索版在本次的全新升级中,从原来的PaaS形态演化成了Serverless形态,易用性显著改善。核心引擎升级到新引擎VectorStore,性能大幅提升,支持千亿数据毫秒级响应,实时数据秒级更新,与业界主流开源向量引擎相比检索性能提升3倍以上,内存占用降低到50%。并支持标签+向量混合检索等能力,提供从图像向量化到向量存储查询的端到端图搜场景解决方案。

VectorStore差异化特点是高性能,做了大量的向量检索算法的性能优化,千亿级别向量数据毫秒级查询响应,向量更新秒级可见。做了大量数据压缩优化,支持非全内存加载,更低的成本。作为阿里自研的向量引擎,在淘宝个性化搜索、推荐、多模态搜索,以及近期的各种大模型应用中广泛应用。VectorStore的执行框架基于Havenask引擎,后面也将在Havenask中完整开源。

成本降低70%的Elasticsearch Serverless版

阿里云检索分析服务 Elasticsearch 正式推出兼容开源、按需使用的Serverless产品,用户不再需要手动分配资源,平台会根据业务流量波动,自动调度决定资源的增加或缩减,秒级弹性扩缩,真正实现负载与资源动态匹配的按量付费,减少闲置资源冗余成本支出。基于Indexing Service索引构建服务以及OpenStore存储服务,阿里云从硬件选型、集群架构、内核性能进行了全方位优化,实现写入性能提升150%,单位数据存储成本降低70%。同时,阿里云Easticsearch已集成最新的8.9版本,并基于ESRE组件(Elasticsearch Relevance Engine)提供AI增强能力,包括RRF混合排序算法,第三方模型集成、部署和管理等。

相关推荐
学习使我快乐——玉祥7 小时前
es查询语法
大数据·elasticsearch·搜索引擎
txtsteve11 小时前
es由一个集群迁移到另外一个集群es的数据迁移
大数据·elasticsearch·搜索引擎
苹果cms插件专题11 小时前
苹果CMS插件:优化蜘蛛访问内容,提升百度收录率
搜索引擎·百度
Lill_bin1 天前
深入理解ElasticSearch集群:架构、高可用性与数据一致性
大数据·分布式·elasticsearch·搜索引擎·zookeeper·架构·全文检索
RwTo1 天前
Elasticsearch 聚合搜索
大数据·elasticsearch·搜索引擎·全文检索
檀越剑指大厂1 天前
【Elasticsearch系列六】系统命令API
大数据·elasticsearch·搜索引擎
Lill_bin3 天前
ElasticSearch底层原理解析
大数据·分布式·elasticsearch·搜索引擎·zookeeper·云原生·jenkins
Chen_leilei3 天前
ES机制原理
大数据·elasticsearch·搜索引擎
西岭千秋雪_3 天前
谷粒商城のElasticsearch
java·大数据·服务器·spring boot·elasticsearch·搜索引擎
小魏冬琅4 天前
如何通过编程工具提升工作效率
大数据·elasticsearch·搜索引擎