本地部署Firecrawl+Dify调用踩坑记录

最近自己研究Dify,使用到Firecrawl这个比较好用的工具。用Firecrawl官网的不知道为什么总是卡住得不到结果,于是我打算自己去本地部署一个。好家伙真给我人搞麻了,太多问题了。

我是在京东云上面租的一台服务器。

首先就是docker的安装,这里个人建议选个比较新的版本,因为我有个服务器装了个旧一点的版本的docker 装到后面给我报rust版本错误了。不知道啥原因,由于这个服务器要跑dify就没在这个服务器上面弄了。

error: failed to parse lock file at: /app/sharedLibs/html-transformer/Cargo.lock Caused by: lock file version `4` was found, but this version of Cargo does not understand this lock file, perhaps Cargo needs to be updated?

如果有rust版本错误的,可以去修改firecrawl/apps/api/Dockerfile这个文件的内容

把FROM rust:1-slim AS rust-base 该为 FROM rust:1.70 AS rust-base

然后就是 GO访问不了外网的问题

Get "https://proxy.golang.org/github.com/tomkosm/html-to-markdown/@v/v0.0.0-20250128162844-2f19490e042d.zip": dial tcp 142.250.217.81:443: i/o timeout

firecrawl/apps/api/Dockerfile中

RUN cd /app/sharedLibs/go-html-to-md && \

go mod tidy && \

go build -o html-to-markdown.so -buildmode=c-shared html-to-markdown.go && \

chmod +x html-to-markdown.so

前面加上一行 设置国内代理

ENV GOPROXY=https://goproxy.cn,direct

最后当我部署完成之后用dify调用,总是说未授权,找了很久发现是开始设置环境配置文件.env 的时候里面的参数有问题。我是从apps/api 里面复制 .env.example过来的的.env

把你在firecrawl目录下配置的 .env文件中的 USE_DB_AUTHENTICATION 设置为false

还有就是部署过程中有些包下载的很慢,需要耐心等待

最后感谢下面这些文章,帮助我解决了很多问题。也感谢通义和Gemini 的帮助

https://blog.csdn.net/zjw529507929/article/details/146218875

https://blog.csdn.net/Lb_jay/article/details/147632780

https://docs.firecrawl.dev/contributing/self-host

https://blog.csdn.net/weixin_51455837/article/details/145712180

相关推荐
金井PRATHAMA21 分钟前
意象框架:连接感知与认知的统一信息结构分析——基于上古汉语同源词意义系统的词源学与认知语言学探索
人工智能·自然语言处理
聚客AI28 分钟前
🧠深度解析模型压缩革命:减枝、量化、知识蒸馏
人工智能·深度学习·llm
SHIPKING39335 分钟前
【机器学习&深度学习】Ollama、vLLM、LMDeploy对比:选择适合你的 LLM 推理框架
人工智能·深度学习·机器学习
zzywxc7871 小时前
AI 行业应用:金融、医疗、教育、制造业领域的落地案例与技术实现
android·前端·人工智能·chrome·金融·rxjava
新智元1 小时前
刚刚,GPT-5 Pro 自证全新数学定理!OpenAI 总裁直呼颠覆,大佬们集体转发
人工智能·openai
新智元1 小时前
28 岁华人执掌 1.85 万亿科技巨头 AI 大权!一觉醒来,图灵奖得主也要向他汇报
人工智能·openai
居然JuRan1 小时前
从LoRA到QLoRA再到全量微调
人工智能
腾讯云开发者1 小时前
数字化下半场:数智融合如何驱动增长新势能?
人工智能
机器之心1 小时前
字节开源Seed-OSS-36B模型,512k上下文
人工智能·openai
北极的树1 小时前
从源码看Google LangExtract如何应对长文本数据挖掘的挑战
人工智能