手把手教你使用 mcp-server ------ vscode + 多款 MCP Server 实现豆瓣图书 TOP250 读取并保存至 Excel
Author:Gorit
Date:2025 年 4 月 18 日
目标:看完这篇文章你就能学会 mcp-server 如何用啦!
免责声明:本仓库所有代码示例仅用于学习交流,请勿用于商业用途!!!
项目地址
项目介绍
本项目使用 vscode 和多个 MCP Server 实现了豆瓣图书 TOP250 的数据抓取,并将数据保存至 Excel 文件。主要功能包括:
- 自动访问豆瓣图书 TOP250 页面
- 提取图书相关信息(书名、作者、出版社、出版日期、价格、评分)
- 将数据保存为格式化的 Excel 文件
环境准备
环境要求:
- Windows 11
- VSCode 1.99 版本(或者其他支持 mcp-server 的客户端,比如 Cursor 等)
- Github 账号(已开通 Copilot, 模型选择:Claude 3.5 Sonnet)
- VSCode 已安装 Github Copilot
- Node.js 版本 >= 20.0
- NPX 支持(需要自行切换 npm 镜像或解决网络问题)
MCP Server 配置
创建一个空项目,然后在项目根目录下创建 .vscode/mcp.json
文件,配置如下内容:
json
{
"servers": {
"filesystem": {
"command": "npx",
"args": [
"-y",
"@modelcontextprotocol/server-filesystem",
"C:\\Users\\Administrator\\Desktop", // 当前目录是 windows 的示例
"D:\\workspace"
]
},
"playwright": {
"command": "npx",
"args": ["@playwright/mcp@latest", "--vision"]
},
"excel": {
"command": "npx",
"args": ["--yes", "@negokaz/excel-mcp-server"],
"env": {
"EXCEL_MCP_PAGING_CELLS_LIMIT": "4000"
}
}
}
}
项目结构
shell
.
├── README.md # 项目说明文档
├── .gitignore # Git忽略配置
└── .vscode/ # 豆瓣图书抓取相关代码
└── mcp.json # mcp服务配置
使用步骤
打开 Github Copilot 对话框,选择 agent
模式,选择 Claude 3.5 Sonnet
输入如下提示词:
shell
在桌面创建一个 excel 表,添加 标题,豆瓣图书top250,第二行设置图书名称,作者,出版社,出版日期,价格,评价 等信息。
然后打开 https://book.douban.com/top250。
查找 如下信息
title: 图书名称
url: 图书详情页链接
rating: 评分(如"9.1")
ratingCount: 评价人数(如"12345人评价")
pubInfo: 出版信息(如"[美] 卡勒德·胡赛尼 / 李继宏 / 上海人民出版社 / 2006-5 / 29.00元")
bookId: 豆瓣图书ID;然后数据写入 excel 中
然后等模型运行,不停点 continue
即可,以下是模型运行时,生成的参考命令
- 安装依赖
bash
cd douban
npm install
- 安装 Playwright 浏览器
bash
npx playwright install chromium
- 运行脚本
bash
node scrapeDouban.js
运行完成后,数据将保存在 douban/data.xlsx
文件中。
数据格式
Excel 文件包含以下字段:
- 书名:图书标题
- 作者:图书作者信息
- 出版社:出版单位
- 出版日期:图书出版时间
- 价格:图书定价
- 评分:豆瓣评分(10 分制)
注意事项
- 确保网络连接稳定
- 首次运行时需要等待安装相关依赖
- 运行过程中会启动浏览器,请勿关闭
- 抓取频率过高可能会触发豆瓣反爬机制
运行结果

当你看到Excel 中有数据时,说明运行成功了
