26k star开源AI项目测试——Screenshot to Code

最近在电报上了解到一个很强的开源项目------Screenshot to Code

只需要一张截图,AI就能免费帮你快速把网页截图变成代码,非常神奇🐮。

Github 霸榜第一,单日2500+ Star🌟。

只需上传截图,就能轻松获得前端代码,包括HTML、Tailwind CSS 和 JavaScript,这极大地提高了开发效率和体验。该项目可借助 GPT-4 Vision 的能力,并利用 DALL-E 3 的图像生成能力,生成外观相似的图像。

正好最近我有一个项目在做,于是我决定亲自试一试效果。没想到安装之路有点曲折,于是这篇文章做个记录。

安装教程

首先放上该项目的开源地址:

github.com/abi/screens...

然后我们先将项目克隆到本地

git clone https://github.com/abi/screenshot-to-code.git

官方给出了两种启动项目的方式,一种是通过命令行分别启动前后端,一种是放在docker中启动,我选择前者,因为我的windows没有安装docker,再去折腾一个docker虚拟环境就太麻烦了。

后端

项目后端是 Python 写的,用的是fastapi 框架。该仓库使用的是poetry来管理依赖,需要我们先安装它。

github文档上告诉我们使用pip install,但实际上poetry官方并不推荐使用这种安装方式,我们来到poetry官网:

python-poetry.org/docs/

官方给出了windows的安装命令,我们按这个来,完整命令:

(Invoke-WebRequest -Uri https://install.python-poetry.org -UseBasicParsing).Content | py -

我并不记得我的python是通过microsoft store安装的,但是终端给我报错

那就将py改成python,成功了

注意:这个命令最好在powershell中执行,否则可能会出现"此处不应该有.Content"的报错。

接着还没完,装是装完了,但是此时输入poetry --version仍然会报错,因为想要在终端中使用poetry命令,需要在windoes的"系统"中安装poetry,也就是说我们还需要将刚刚安装的poetry添加到windows的环境变量。

这部分命令行也给了提示:

我们只需要把这个路径复制下来,然后添加到系统环境变量path中即可(不要忘了点确定哟)。

然后我们打开另一个终端,在原来的终端还是会显示安装失败 ,输入poetry --version

安装成功!!

然后我们按照Github上的指示安装poetry依赖

接下来我们使用poetry shell命令开启python环境隔离

最后根据文档提示使用poetry run uvicorn main:app --reload --port 7001命令启动后端项目

后端成功运行在本地的7001端口。

前端

首先新建一个终端,将目录切换到前端目录:cd frontend

然后使用yarn安装项目的依赖。

安装成功后,使用yarn dev命令启动前端项目。

实际效果测试

当前后端都成功启动之后,我们在浏览器打开5173端口,右上角mobile按钮可以模拟手机上显示的效果,code按钮可以展示网页代码,下面进行实际测试:

我上来就截取了一个网站的整个界面,可以看到我上传的照片里面有很多复杂的元素,但是该模型只关注了中间的一小部分(尽管绘制效果倒是很不错)

于是我灵机一动,如果我把一个页面"揉碎了"喂给它,会不会效果更好一点?

然后我截取了页面的导航栏,可以看到最终绘制的效果还是很棒的。

这是另外一部分的效果:

这么看该模型对于有棱有角的模块绘制效果还是niu的,但是像下面这种抽象一点的图形就不尽人意了。

实际效果:

最后,一句话总结这个项目的效果------虽然仍有缺陷,但别想着一口喂成个胖子,它就绝对能惊艳你。

相关推荐
可夫小子3 小时前
OpenClaw实战-NAS配置从0到1详细教程及踩坑记录
aigc·ai编程
von Neumann3 小时前
大模型从入门到应用——HuggingFace:Transformers-[零基础快速上手:自然语言处理任务]
人工智能·python·ai·自然语言处理·大模型·aigc·transformer
AiTop1003 小时前
OpenAI发布GPT-5.4:支持百万Token上下文与原生电脑操作
人工智能·gpt·ai·aigc
lzq6034 小时前
文本驱动数据可视化新范式:图表狐5个跨行业实战案例深度解析
信息可视化·自然语言处理·数据分析·aigc·数据可视化
哪 吒4 小时前
GPT-5.4上线,编程能力超过Claude Opus 4.6
gpt·ai·chatgpt·openai·claude·gemini
安逸sgr4 小时前
16-OpenClaw数据分析与可视化
人工智能·数据挖掘·数据分析·大模型·aigc·agent·openclaw
GEO_Huang4 小时前
广佛莞深RPA定制,数谷智能科技让软件操控自动化?
大数据·人工智能·aigc·rpa·geo
明月(Alioo)4 小时前
AgentScope 框架源码深度解读:ReAct = Reasoning + Acting 的实现原理
机器学习·aigc·agent
Cobyte5 小时前
面试官:大模型是怎么调用工具的呢 ?
前端·后端·aigc
Codefengfeng5 小时前
如何本地部署大模型(以PaddleOCR-VL-1.5为例)
vscode·visualstudio·docker·语言模型·aigc·ocr