检索

deephub2 天前
人工智能·python·rag·检索
向量搜索系统的三个核心优化维度:速度、精度与规模当数据集膨胀到数百万甚至数十亿量级的向量时,怎么让搜索在这种规模下依然又快又准就成了一个实实在在的工程难题。这篇文章要聊的就是向量搜索系统的三个核心优化方向——性能调优、混合搜索和可扩展架构。
deephub3 天前
人工智能·大语言模型·rag·检索
RAG 中分块重叠的 8 个隐性开销与权衡策略RAG 分块重叠提升了召回率但增加了隐藏成本,比如说索引膨胀、Embedding 开销、延迟、重排序负载和评估漂移。
XLYcmy5 天前
ai·chatgpt·llm·prompt·检索·gpt-4o·doi
chatgpt数据库检索文献 上请帮助我进行文献检索,请协助完成以下步骤:第一步:主题可行性验证请先帮我评估"数字经济赋能城市低碳治理路径研究"这个主题的:
XLYcmy6 天前
ai·chatgpt·llm·prompt·agent·检索·多轮对话
chatgpt数据库检索文献 下以下是关于“数字经济赋能城市低碳治理路径研究”的第一批高质量文献(共6篇),符合您提出的时间范围、文献类型和质量标准。每篇文献均标注了DOI,您可通过DOI链接或所在期刊的官方网站获取原文。
XLYcmy6 天前
数据库·ai·llm·prompt·agent·检索·万方
智能体大赛 目录目 录... I一 开发背景... 11.1选题背景... 11.1.1 背景介绍... 11.1.2 现有解决方案的不足... 2
XLYcmy6 天前
ai·llm·app·prompt·agent·检索·万方数据库
智能体大赛 总结与展望 未来展望“智研星图”智能体的当前版本,标志着我们向着人机协同科研新范式迈出了坚实的第一步。然而,这绝非终点,而是一个充满潜力的起点。展望未来,我们将以现有核心功能为基石,围绕技术纵深、功能广度、模式创新与生态构建四大维度进行持续迭代与战略布局,旨在将“智研星图”从一个卓越的工具,演进为一个开放的、进化的、全球领先的科研智能基础设施。
XLYcmy8 天前
ai·llm·json·prompt·api·检索·万方数据库
智能体大赛 实现逻辑 大容量数据预处理机制在实际的学术研究场景中,用户发起的检索请求往往范围广泛,万方数据库作为涵盖海量学术资源的平台,其API返回的文献列表可能包含数百甚至上千条记录。这些结果通常以结构化的JSON格式返回,包含每条文献的标题、作者、摘要、关键词、发表年份、来源出版物和DOI等丰富元数据。当直接将这些完整的JSON数据作为上下文注入到LLM的Prompt中时,极其容易超出智能体开发平台对单次请求输入字符串的长度限制,从而导致请求失败、处理中断或生成质量显著下降。为解决这一严峻的技术瓶颈,我们设计并实现了一套高效、鲁棒的大容量数据
XLYcmy10 天前
数据库·ai·llm·prompt·agent·检索·万方
智能体大赛 核心功能 惊喜生成”——创新灵感的催化器“惊喜生成”功能是“智研星图”智能体设计中最具独创性与人文色彩的核心模块,其设计初衷是突破传统学术工具冰冷、刻板的固有范式,旨在模拟真实学术生态中那些最能激发创新火花的“非正式讨论”——如实验室茶歇间的趣闻分享、学术会议后的咖啡角辩论、或是跨领域学者间的灵感碰撞。该功能直面科研工作者在长期高强度、程式化研究中难以避免的认知疲劳与思维定式问题,通过精心设计的“可控随机性”内容,主动激发用户的好奇心、想象力和跨界思考能力,使AI从被动的信息工具转变为主动的“灵感催化剂”,服务于科学研究的最高目标——颠覆性创新
XLYcmy11 天前
数据库·ai·llm·prompt·知识图谱·agent·检索
智能体大赛 核心功能 可信文献检索与系统性知识梳理如图3-1所示,“智研星图”的核心功能围绕三个相互关联且层层递进的模块展开,共同构成了一个完整的研究闭环。
deephub14 天前
人工智能·深度学习·大语言模型·rag·检索
RAG 文本分块:七种主流策略的原理与适用场景检索是 RAG 系统的搜索引擎,分块则是这个搜索引擎的基础。分块太长、太短、有噪声、切错了位置——随便犯哪个错LLM 都会有问题。行业里有句话流传很广:“分块决定了 RAG 质量的 70%。”
uncle_ll20 天前
llm·rag·检索·llamaindex
RAG 系统性能跃迁:LlamaIndex 索引优化实战指南在构建检索增强生成(RAG)系统时,很多开发者会遇到这样的困境:明明用了最先进的大语言模型,检索结果却总是差强人意 —— 要么答非所问,要么遗漏关键信息。其实,RAG 的性能瓶颈往往不在 LLM 本身,而在索引环节。本文基于 LlamaIndex 的生产级方案,深入解析两种核心索引优化策略,帮你突破检索精度与生成质量的双重瓶颈。
uncle_ll20 天前
milvus·多模态·向量数据库·ann·rag·搜索·检索
Milvus介绍及多模态检索实践:从部署到实战全解析在AI技术高速迭代的今天,多模态数据(文本、图像、音频、视频)爆发式增长,如何高效存储、检索这些非结构化数据,成为解锁AI应用落地的关键。向量数据库作为非结构化数据检索的核心载体,其中Milvus凭借生产级的稳定性、高扩展性,成为大规模向量检索场景的首选工具。
摸鱼仙人~2 个月前
后端·python·rag·检索
企业级 RAG 问答系统开发上线流程分析该项目从企业级应用的角度,可以划分为 四个主要阶段:数据与知识库准备(ETL)、核心功能开发与优化、系统工程化与部署,以及测试与持续优化。
G皮T3 个月前
大数据·elasticsearch·搜索引擎·全文检索·索引·index·检索
【ELasticsearch】索引字段设置 “index”: false 的作用在上一篇博客《【Elasticsearch】动手创建一个索引》中,我们了解到可以通过设置 "index": false,让索引字段禁止被搜索。
Ytadpole4 个月前
数据库·mysql·优化·索引·查询·检索·表设计
MySQL 数据库优化设计:优化原理和数据库表设计技巧在构建高性能应用程序时,一个优化的数据库设计是地基。MySQL 优化不仅是关于编写更快的 SQL,更关键的是从 数据结构、索引策略 和 存储引擎 三个维度进行设计。
大千AI助手7 个月前
人工智能·大模型·llm·微调·rag·检索·ragfoundry
RAGFoundry:面向检索增强生成的模块化增强框架本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
G皮T8 个月前
大数据·elasticsearch·搜索引擎·查询·检索·自定义评分·_score
【Elasticsearch】自定义评分检索自定义评分(Score Customization)是指通过编程方式修改或覆盖 Elasticsearch 默认的相关度评分算法,以满足特定业务需求的过程。
G皮T8 个月前
大数据·elasticsearch·搜索引擎·scroll·检索·深度分页·search_after
【Elasticsearch】深度分页及其替代方案深度分页 指的是在 Elasticsearch 中查询结果集 非常靠后的页码(例如第 1000 1000 1000 页,每页 10 10 10 条数据,即 from=10000)。它通常表现为使用 from + size 参数组合来获取远端的分页数据。例如:
G皮T8 个月前
大数据·elasticsearch·搜索引擎·排序·分页·检索·深度分页
【Elasticsearch】检索排序 & 分页首先,我们创建一个名为 blog_posts 的索引,并插入一些测试数据:能排序的字段都具备正排索引,单 text 类型字段是不可以排序的。如果要使 text 字段支持排序、聚合,则需要开启 fielddata。