r.jina.ai 使用指南:一键提取网页核心内容

提取网页内容

r.jina.ai 使用指南:一键提取网页核心内容

无需代码、无需注册,让任意网页变成 AI 友好的干净文本


简介

r.jina.ai 是由 Jina AI 提供的免费网页内容提取服务。它能在几秒钟内将复杂的网页转换为结构清晰、易于阅读的 Markdown 格式,自动去除广告、导航栏、弹窗等干扰元素。

r.jina.ai 都能帮你快速获取网页的核心信息。


一、基础用法:三步上手

第 1 步:复制目标网页链接

找到你想提取内容的网页,复制完整的 URL。

复制代码
例如:https://github.com/MoonshotAI/Kimi-K2.5/blob/master/README.md

第 2 步:在 URL 前添加 r.jina.ai/

复制代码
https://r.jina.ai/https://github.com/MoonshotAI/Kimi-K2.5/blob/master/README.md

第 3 步:访问新链接

在浏览器中打开组合后的链接,即可看到提取后的干净内容。


二、输出格式说明

r.jina.ai 默认返回 Markdown 格式 的内容,包含以下结构:

markdown 复制代码
# 文章标题

> 元数据(作者、发布时间等)

## 正文标题

正文段落内容...

### 子标题

- 列表项 1
- 列表项 2

> 引用块内容

![图片描述](图片链接)

特点

特性 说明
✅ 保留格式 标题层级、列表、代码块、引用等
✅ 提取图片 保留文章中的关键图片
✅ 去除噪音 自动过滤广告、导航、评论区等
✅ 处理动态内容 支持 JavaScript 渲染的网页

三、进阶技巧

技巧 1:通过 API 调用

除了直接在浏览器使用,你还可以通过程序调用:

cURL 示例:

bash 复制代码
curl https://r.jina.ai/http://example.com

Python 示例:

python 复制代码
import requests

url = "https://r.jina.ai/http://example.com"
response = requests.get(url)
content = response.text
print(content)

技巧 2:配合 AI 工具使用

提取的 Markdown 内容可以直接发送给 Claude、GPT 等 AI 助手:

复制代码
请帮我总结以下网页的核心观点:

---
[paste r.jina.ai 提取的内容]
---

技巧 3:批量处理多个链接

如果你需要处理多个网页,可以编写简单的脚本:

python 复制代码
import requests
import time

urls = [
    "https://example.com/article-1",
    "https://example.com/article-2",
    "https://example.com/article-3"
]

for url in urls:
    jina_url = f"https://r.jina.ai/{url}"
    response = requests.get(jina_url)
    
    # 保存到文件
    filename = url.split('/')[-1] + ".md"
    with open(filename, 'w', encoding='utf-8') as f:
        f.write(response.text)
    
    print(f"已保存: {filename}")
    time.sleep(1)  # 礼貌性地间隔 1 秒

四、实际应用场景

场景 1:快速阅读长文

遇到一篇感兴趣的深度文章,但时间有限?

  1. r.jina.ai 提取内容
  2. 发送给 AI:"请用 3 句话总结这篇文章的核心观点"

场景 2:为 AI 提供上下文

当需要让 AI 分析某个网页时:

复制代码
基于以下网页内容,分析作者的观点和论据:

[粘贴 r.jina.ai 提取的内容]

场景 3:内容存档与笔记

将重要文章转换为 Markdown,存入 Obsidian、Notion 等笔记软件:

  1. r.jina.ai 提取内容
  2. 复制 Markdown
  3. 粘贴到笔记软件,添加个人批注

四、使用限制与注意事项

免费版限制

项目 说明
速率限制 建议不要高频并发请求
内容长度 超长网页可能会被截断
登录内容 无法提取需要登录才能查看的内容

最佳实践

  1. 尊重版权 --- 提取的内容仅供个人学习使用
  2. 检查完整性 --- 复杂网页建议人工核对提取结果
  3. 礼貌使用 --- 批量处理时添加适当延迟

五、相关工具推荐

工具 用途 链接
r.jina.ai 网页内容提取 https://r.jina.ai
s.jina.ai 搜索 + 内容提取 https://s.jina.ai
g.jina.ai 搜索结果事实核查 https://g.jina.ai

结语

r.jina.ai 是一个简单却强大的工具,它解决了"如何让 AI 读懂网页"这个痛点。无论你是做研究、写博客,还是日常阅读,它都能帮你节省大量时间。

现在就试试: 打开浏览器,在任意文章链接前加上 https://r.jina.ai/,体验一键提取的便捷!


💡 小提示:把这个链接格式加入浏览器书签,随时快速提取网页内容。


相关推荐
Elastic 中国社区官方博客8 天前
DevRel 通讯 — 2026 年 2 月
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·jina
Elastic 中国社区官方博客18 天前
Jina Rerankers 为 Elastic 推理服务(EIS)带来了快速、多语言的重排序能力
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·jina
Elastic 中国社区官方博客1 个月前
JINA AI 与 Elasticsearch 的集成
大数据·人工智能·elasticsearch·搜索引擎·全文检索·jina
Elastic 中国社区官方博客1 个月前
jina-embeddings-v3 现已在 Elastic Inference Service 上可用
大数据·人工智能·elasticsearch·搜索引擎·ai·jina
Elastic 中国社区官方博客1 个月前
使用 jina-embeddings-v3 和 Elasticsearch 进行多语言搜索
大数据·数据库·人工智能·elasticsearch·搜索引擎·全文检索·jina
Elastic 中国社区官方博客1 个月前
Elasticsearch:Jina Reranker v3
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·jina
Elastic 中国社区官方博客1 个月前
Elasticsearch:Jina Reader
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·jina
Elastic 中国社区官方博客2 个月前
Jina Reranker v3:用于 SOTA 多语言检索 的 0.6B 列表式重排序器
大数据·人工智能·elasticsearch·搜索引擎·ai·jina
Elastic 中国社区官方博客2 个月前
Jina 模型的介绍,它们的功能,以及在 Elasticsearch 中的使用
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·jina