GitHub 上的 Khoj 项目:打造你的专属 AI 第二大脑

在信息爆炸的时代,高效管理和利用个人知识变得愈发重要。GitHub 上的 Khoj 项目为我们提供了一个强大的解决方案,它能成为你的 "AI 第二大脑",帮你轻松整合、搜索和运用知识。今天,就来详细了解下 Khoj。​

Khoj 是什么,能做什么?​

Khoj 是一个开源的个人 AI 项目,旨在通过创建始终在线的智能代理来扩展用户的能力。它具备以下强大功能:​

  1. 多源数据整合:能理解并整合多种格式的文件,像 PDF、Markdown、纯文本、GitHub 和 Notion 文件等不在话下,还能将这些本地文档数据与在线信息相结合。例如,你在写一篇工作汇报,它可以同时从你本地的项目文档和网络上的行业资料中获取信息,为你提供全面的参考。
  1. 自然语言处理:借助先进的自然语言处理技术,Khoj 可以理解用户的各种问题,并给出相关建议和答案。你不用再费力组织复杂的关键词搜索,直接用日常语言提问,它就能精准理解你的需求,比如问 "上个月我们部门销售业绩突出的原因有哪些",它能迅速给出分析结果。
  1. 离线优先设计:考虑到网络状况可能不佳,Khoj 采用离线优先原则,在没有网络或者网络信号弱时,依然可以正常工作,保证你随时都能获取所需信息,不耽误任何事情。
  1. 自托管支持:对于注重数据隐私的用户来说,Khoj 允许你在自己的服务器上自行托管。这样一来,你的数据完全由自己掌控,不用担心隐私泄露问题,还可以根据自身需求定制知识管理系统。
  1. 多平台访问:提供了丰富的访问方式,支持从桌面应用程序、Emacs 编辑器、Obsidian,到移动应用程序、网络平台,甚至通过 WhatsApp 都能操作。不管你是在办公室办公,还是外出途中,都能随时随地便捷地使用 Khoj。
  1. 模型集成:你既可以选择集成在线 AI 模型,如 GPT-4,也能部署私有的本地大型语言模型,像 Llama3 等,以此提高搜索和回答的准确性,灵活满足不同场景下的需求。

如何使用 Khoj​

官网使用​

你可以直接通过官网便捷地使用 Khoj。打开浏览器,访问 Khoj 官网https://khoj.dev/ 。进入官网后,简洁直观的界面会引导你快速上手。在首页,通常会有清晰的提示,指导你如何进行数据添加、提问等操作。例如,在数据添加部分,你能找到上传本地文档(如 PDF、Markdown 等格式)的入口,也能链接到你的 GitHub、Notion 等账户,同步相关数据。提问时,在搜索框输入自然语言问题,比如 "去年的年度总结文档内容要点是什么",系统会快速在你已添加的数据中搜索,并呈现出相关结果,包括文档片段、相关链接等,就像在本地部署使用一样方便。​

本地下载安装​

Khoj 的下载和安装有多种方式,这里介绍常见的两种:​

  1. 通过 GitHub 克隆:
  • 首先,确保你已经安装了 Git 工具。如果没有安装,可以从Git 官下载并安装,根据操作系统选择对应的版本,按照提示完成安装步骤。
  • 打开命令行终端,进入你想要存放项目的目录。例如,你想把项目放在桌面上的 "khoj_project" 文件夹中,先在命令行输入cd C:\Users\你的用户名\Desktop\khoj_project(Windows 系统)或者cd ~/Desktop/khoj_project(Mac 系统)。
  • 然后输入命令

    bash 复制代码
    git clone https://github.com/khoj-ai/khoj.git

    ,等待克隆完成,这一步会将 Khoj 项目的代码下载到你指定的目录中。

  1. 使用 Docker 部署(如果你熟悉 Docker):
  • 安装 Docker,根据你的操作系统,从Docker 官网下载并安装 Docker Desktop,安装过程中按照默认设置即可,安装完成后启动 Docker。
  • 在命令行输入docker pull khojai/khoj,下载 Khoj 的 Docker 镜像。
  • 下载完成后,通过docker run -p 8000:8000 khojai/khoj命令运行 Khoj 容器,其中-p 8000:8000表示将容器内的 8000 端口映射到本地的 8000 端口,你可以根据实际情况修改端口号。

简单使用教程​

  1. 首次设置:
  • 如果你是通过 GitHub 克隆的项目,进入项目目录,例如cd C:\Users\你的用户名\Desktop\khoj_project\khoj(Windows 系统)或者cd ~/Desktop/khoj_project/khoj(Mac 系统)。
  • 安装项目依赖,根据 Khoj 项目文档中的说明,通常使用

    bash 复制代码
    pip install -r requirements.txt

    命令来安装所需的 Python 库。

  • 运行 Khoj,输入python khoj/app.py命令启动程序。如果一切正常,你可以在浏览器中访问http://localhost:8000(如果之前修改了端口号,这里也要相应修改),进入 Khoj 的用户界面。
  1. 添加和管理数据:
  • 在 Khoj 的用户界面中,找到 "添加数据" 或类似功能入口,你可以上传本地的文档,如 PDF、Markdown 文件等,也可以连接你的 GitHub 仓库、Notion 账户等,让 Khoj 获取更多数据。
  • 对上传的数据进行分类、标记等操作,方便后续搜索和管理,比如你可以将工作相关的文档标记为 "工作",学习资料标记为 "学习"。
  1. 提问与获取答案:
  • 在搜索框中输入你的问题,用自然语言表达即可,例如 "我去年写的关于市场分析的文档在哪里" 或者 "最新的行业报告中有哪些关键信息"。
  • Khoj 会快速分析你的问题,在你添加的数据以及联网信息(如果有设置联网搜索)中进行搜索,然后将相关结果呈现给你,可能包括具体的文档内容、相关链接等。
相关推荐
suke1 分钟前
Qwen2.5-Omni 全能旗舰 VS 国产小钢炮 MiniCPM-V:参数、硬件、资源、优势全解析
人工智能·程序员·开源
用户3157476081352 分钟前
MCP的出现,是对Function Calling的“书同文、车同轨”吗?
人工智能·面试·mcp
君莫笑∽GL7 分钟前
脑疾病分类的疑惑【6】:脑疾病分类比较适合使用具有哪些特点的模型?
人工智能·分类·数据挖掘
人类群星闪耀时10 分钟前
区块链与AI的融合:技术交汇的未来之路
人工智能·区块链
www_pp_13 分钟前
# 基于 OpenCV 的选择题自动批改系统实现
人工智能·opencv·计算机视觉
鸭鸭鸭进京赶烤17 分钟前
物联网革新,智慧城市未来揭秘
人工智能·物联网·智慧城市·能源·边缘计算·信息与通信·交通物流
Flash Bomb42221 分钟前
自然语言处理(21:(第六章1.)基于RNN生成文本)
人工智能·rnn·深度学习·神经网络·自然语言处理
梦姐的编程日志26 分钟前
从研究动机视角对无监督图像去雾论文的分类
图像处理·人工智能·深度学习·算法·计算机视觉
Y1nhl28 分钟前
搜广推校招面经六十二
人工智能·pytorch·python·算法·机器学习·推荐算法·搜索算法
进取星辰1 小时前
PyTorch 深度学习实战(28):对比学习(Contrastive Learning)与自监督表示学习
人工智能·深度学习