本地部署Firecrawl+Dify调用踩坑记录

最近自己研究Dify,使用到Firecrawl这个比较好用的工具。用Firecrawl官网的不知道为什么总是卡住得不到结果,于是我打算自己去本地部署一个。好家伙真给我人搞麻了,太多问题了。

我是在京东云上面租的一台服务器。

首先就是docker的安装,这里个人建议选个比较新的版本,因为我有个服务器装了个旧一点的版本的docker 装到后面给我报rust版本错误了。不知道啥原因,由于这个服务器要跑dify就没在这个服务器上面弄了。

error: failed to parse lock file at: /app/sharedLibs/html-transformer/Cargo.lock Caused by: lock file version `4` was found, but this version of Cargo does not understand this lock file, perhaps Cargo needs to be updated?

如果有rust版本错误的,可以去修改firecrawl/apps/api/Dockerfile这个文件的内容

把FROM rust:1-slim AS rust-base 该为 FROM rust:1.70 AS rust-base

然后就是 GO访问不了外网的问题

Get "https://proxy.golang.org/github.com/tomkosm/html-to-markdown/@v/v0.0.0-20250128162844-2f19490e042d.zip": dial tcp 142.250.217.81:443: i/o timeout

firecrawl/apps/api/Dockerfile中

RUN cd /app/sharedLibs/go-html-to-md && \

go mod tidy && \

go build -o html-to-markdown.so -buildmode=c-shared html-to-markdown.go && \

chmod +x html-to-markdown.so

前面加上一行 设置国内代理

ENV GOPROXY=https://goproxy.cn,direct

最后当我部署完成之后用dify调用,总是说未授权,找了很久发现是开始设置环境配置文件.env 的时候里面的参数有问题。我是从apps/api 里面复制 .env.example过来的的.env

把你在firecrawl目录下配置的 .env文件中的 USE_DB_AUTHENTICATION 设置为false

还有就是部署过程中有些包下载的很慢,需要耐心等待

最后感谢下面这些文章,帮助我解决了很多问题。也感谢通义和Gemini 的帮助

https://blog.csdn.net/zjw529507929/article/details/146218875

https://blog.csdn.net/Lb_jay/article/details/147632780

https://docs.firecrawl.dev/contributing/self-host

https://blog.csdn.net/weixin_51455837/article/details/145712180

相关推荐
丁学文武21 分钟前
大模型原理与实践:第二章-Transformer架构_第2部分Encoder-Decoder架构
人工智能·深度学习·transformer
liliangcsdn33 分钟前
基于ollama运行27b gemma3解决ffmpeg命令生成问题
人工智能·ffmpeg
云雾J视界43 分钟前
算法偏见的解药:将敏捷“灵魂”注入AI伦理
人工智能·算法·谷歌·伦理债·算法偏见·高效程序员·ai决策系统
码界奇点2 小时前
京东JoyAgent-JDGenie开源多智能体系统如何重塑AI应用落地新范式
人工智能·ai·智能手机·开源
小Tomkk2 小时前
AI 提效:利用 AI 从前端 快速转型为UI/UX设计师和产品
前端·人工智能·ui
王哥儿聊AI2 小时前
CompLLM 来了:长文本 Q&A 效率革命,线性复杂度 + 缓存复用,推理速度与效果双丰收
人工智能·深度学习·机器学习·语言模型
minhuan2 小时前
构建AI智能体:四十六、Codebuddy MCP 实践:用高德地图搭建旅游攻略系统
人工智能·mcp·codebuddy·高德api
不当菜鸡的程序媛3 小时前
https://duoke360.com/post/35063
人工智能
IT_陈寒3 小时前
SpringBoot3踩坑实录:一个@Async注解让我多扛了5000QPS
前端·人工智能·后端
_Meilinger_3 小时前
碎片笔记|生成模型原理解读:AutoEncoder、GAN 与扩散模型图像生成机制
人工智能·生成对抗网络·gan·扩散模型·图像生成·diffusion model