手把手教你使用 mcp-server —— vscode + 多款 MCP Server 实现豆瓣图书 TOP250 读取并保存至 Excel

手把手教你使用 mcp-server ------ vscode + 多款 MCP Server 实现豆瓣图书 TOP250 读取并保存至 Excel

Author:Gorit

Date:2025 年 4 月 18 日

目标:看完这篇文章你就能学会 mcp-server 如何用啦!

免责声明:本仓库所有代码示例仅用于学习交流,请勿用于商业用途!!!

项目地址

MCP Server 最佳实践

项目介绍

本项目使用 vscode 和多个 MCP Server 实现了豆瓣图书 TOP250 的数据抓取,并将数据保存至 Excel 文件。主要功能包括:

  • 自动访问豆瓣图书 TOP250 页面
  • 提取图书相关信息(书名、作者、出版社、出版日期、价格、评分)
  • 将数据保存为格式化的 Excel 文件

环境准备

环境要求:

  • Windows 11
  • VSCode 1.99 版本(或者其他支持 mcp-server 的客户端,比如 Cursor 等)
  • Github 账号(已开通 Copilot, 模型选择:Claude 3.5 Sonnet)
  • VSCode 已安装 Github Copilot
  • Node.js 版本 >= 20.0
  • NPX 支持(需要自行切换 npm 镜像或解决网络问题)

MCP Server 配置

创建一个空项目,然后在项目根目录下创建 .vscode/mcp.json 文件,配置如下内容:

json 复制代码
{
  "servers": {
    "filesystem": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-filesystem",
        "C:\\Users\\Administrator\\Desktop", // 当前目录是 windows 的示例
        "D:\\workspace"
      ]
    },
    "playwright": {
      "command": "npx",
      "args": ["@playwright/mcp@latest", "--vision"]
    },
    "excel": {
      "command": "npx",
      "args": ["--yes", "@negokaz/excel-mcp-server"],
      "env": {
        "EXCEL_MCP_PAGING_CELLS_LIMIT": "4000"
      }
    }
  }
}

项目结构

shell 复制代码
.
├── README.md           # 项目说明文档
├── .gitignore         # Git忽略配置
└── .vscode/            # 豆瓣图书抓取相关代码
    └── mcp.json   # mcp服务配置

使用步骤

打开 Github Copilot 对话框,选择 agent 模式,选择 Claude 3.5 Sonnet 输入如下提示词:

shell 复制代码
在桌面创建一个 excel 表,添加 标题,豆瓣图书top250,第二行设置图书名称,作者,出版社,出版日期,价格,评价 等信息。

然后打开 https://book.douban.com/top250。

查找 如下信息

title: 图书名称

url: 图书详情页链接

rating: 评分(如"9.1")

ratingCount: 评价人数(如"12345人评价")

pubInfo: 出版信息(如"[美] 卡勒德·胡赛尼 / 李继宏 / 上海人民出版社 / 2006-5 / 29.00元")

bookId: 豆瓣图书ID;然后数据写入 excel 中

然后等模型运行,不停点 continue 即可,以下是模型运行时,生成的参考命令

  1. 安装依赖
bash 复制代码
cd douban
npm install
  1. 安装 Playwright 浏览器
bash 复制代码
npx playwright install chromium
  1. 运行脚本
bash 复制代码
node scrapeDouban.js

运行完成后,数据将保存在 douban/data.xlsx 文件中。

数据格式

Excel 文件包含以下字段:

  • 书名:图书标题
  • 作者:图书作者信息
  • 出版社:出版单位
  • 出版日期:图书出版时间
  • 价格:图书定价
  • 评分:豆瓣评分(10 分制)

注意事项

  1. 确保网络连接稳定
  2. 首次运行时需要等待安装相关依赖
  3. 运行过程中会启动浏览器,请勿关闭
  4. 抓取频率过高可能会触发豆瓣反爬机制

运行结果

当你看到Excel 中有数据时,说明运行成功了

相关推荐
AiTop10028 分钟前
腾讯推出AI CLI工具CodeBuddy,国内首家同时支持插件、IDE和CLI三种形态的AI编程工具厂商
ide·人工智能·ai·aigc·ai编程
SamDeepThinking3 小时前
彻底让Cursor不要格式化Java代码
ai编程·cursor
大侠Luffy4 小时前
我用Trae从0到1上架了个Chrome插件,并开源了代码
ai编程·trae
SamDeepThinking5 小时前
使用Cursor生成【财务对账系统】前后端代码
后端·ai编程·cursor
QT 小鲜肉5 小时前
【QT随笔】结合应用案例一文完美概括QT中的队列(Queue)
c++·笔记·qt·学习方法·ai编程
叫我詹躲躲7 小时前
开发提速?Vue3模板隐藏技巧来了
前端·vue.js·ai编程
用户4099322502127 小时前
如何用FastAPI玩转多模块测试与异步任务,让代码不再“闹脾气”?
后端·ai编程·trae
云起SAAS7 小时前
贪吃蛇鱼小游戏抖音快手微信小程序看广告流量主开源
ai编程·贪吃蛇
AIGC小火龙果9 小时前
OpenAI的开源王牌:gpt-oss上手指南与深度解析
人工智能·经验分享·gpt·搜索引擎·aigc·ai编程
SamDeepThinking9 小时前
在Windows 11上配置Cursor IDE进行Java开发
后端·ai编程·cursor