LangChain4j 项目实战——idea快捷键搜索

LangChain4j 项目实战------idea快捷键搜索

传统的快捷键搜索

idea集成开发环境是很多java开发者使用的开发工具之一,它有很多快捷键。传统的方法检索快捷键的步骤:

  1. 打开设置 ctrl + alt + s
  2. 移动到 Keymap导航栏 ↓
  3. 切换到搜索框 Tab

idea 快捷键搜索应用介绍

项目说明

  1. 支持中文检索快捷键
  2. 支持相似文本搜索快捷键

运行环境

JDK 21

技术选型

  1. LangChain4j,大模型框架,有免费的api接口可以试用,适合学习试用。Java开发者的福音,类似于Python的LangChain框架
  2. DuckDB, 内嵌项目的数据库,不需要网络连接,支持向量检索
  3. 大模型API接口,翻译idea的英文快捷键
  4. 向量化模型API接口,向量化文本,存储到向量库,相似文本搜索

源码地址

  1. github:https://github.com/shootercheng/idea-shortcut-key.git
  2. gitee: https://gitee.com/3281328128/idea-shortcut-key

代码说明

项目结构

  1. database 目录, duckdb 文件存储目录
  2. keymap 目录,idea 快捷键 xml 配置文件
  3. src目录,有2个主要的类: (1)InitStore 负责解析xml,翻译idea英文到中文,保存解析数据到DuckDb数据库,初始化运行一次就够了(2)KeyMapSearch负责检索使用

使用说明

  1. 新建配置文件 model.properties,路径 /config/shortcut-key/model.properties
java 复制代码
private static final String MODEL_CONFIG_PATH = "/config/shortcut-key/model.properties";

当然也可以修改对应的路径,代码地址 org.scd.InitStore#MODEL_CONFIG_PATH

  1. 删除keymap目录的xml配置文件,将本地的idea快捷键配置复制到对应的目录,查找快捷键xml配置文件请查看 https://blog.csdn.net/modelmd/article/details/148201731
  2. InitStore 主函数只需要初始化运行,如果快捷键有变更才需要重新初始化
  3. KeyMapSearch 如果想调整查找的精确度,可以调整score的大小
java 复制代码
 var queryEmbedding = InitStore.embeddingModel.embed(userQuery).content();
                var request = EmbeddingSearchRequest.builder()
                        .queryEmbedding(queryEmbedding)
                        .minScore(0.8D)
                        .maxResults(20).build();

minScore 最小的分数,符合要求的数据项 >= 0.8 分,完全相似是1分,分数越大越相似

演示

运行 KeyMapSearch

总结

刚开始使用本地向量化模型 AllMiniLmL6V2QuantizedEmbeddingModel 发现对中文的相似搜索不准确,英文是可以的,后来切换成 text-embedding-v3 中文相似搜索比较准确

相关推荐
Mahir085 小时前
Spring 循环依赖深度解密:从问题本质到三级缓存源码级解析
java·后端·spring·缓存·面试·循环依赖·三级缓存
RyFit6 小时前
SpringAI 常见问题及解决方案大全
java·ai
石山代码6 小时前
C++ 内存分区 堆区
java·开发语言·c++
绝知此事6 小时前
【算法突围 01】线性结构与哈希表:后端开发的收纳术
java·数据结构·算法·面试·jdk·散列表
无风听海6 小时前
C# 隐式转换深度解析
java·开发语言·c#
一只大袋鼠7 小时前
Git 进阶(二):分支管理、暂存栈、远程仓库与多人协作
java·开发语言·git
德思特8 小时前
从 Dify 配置页理解 RAG 的重要参数
java·人工智能·llm·dify·rag
YOU OU8 小时前
Spring IoC&DI
java·数据库·spring
один but you9 小时前
从可变参数到 emplace:现代 C++ 性能优化的核心组合
java·开发语言
是码龙不是码农9 小时前
ThreadPoolExecutor 7 个核心参数详解
java·线程池·threadpool