26k star开源AI项目测试——Screenshot to Code

最近在电报上了解到一个很强的开源项目------Screenshot to Code

只需要一张截图,AI就能免费帮你快速把网页截图变成代码,非常神奇🐮。

Github 霸榜第一,单日2500+ Star🌟。

只需上传截图,就能轻松获得前端代码,包括HTML、Tailwind CSS 和 JavaScript,这极大地提高了开发效率和体验。该项目可借助 GPT-4 Vision 的能力,并利用 DALL-E 3 的图像生成能力,生成外观相似的图像。

正好最近我有一个项目在做,于是我决定亲自试一试效果。没想到安装之路有点曲折,于是这篇文章做个记录。

安装教程

首先放上该项目的开源地址:

github.com/abi/screens...

然后我们先将项目克隆到本地

git clone https://github.com/abi/screenshot-to-code.git

官方给出了两种启动项目的方式,一种是通过命令行分别启动前后端,一种是放在docker中启动,我选择前者,因为我的windows没有安装docker,再去折腾一个docker虚拟环境就太麻烦了。

后端

项目后端是 Python 写的,用的是fastapi 框架。该仓库使用的是poetry来管理依赖,需要我们先安装它。

github文档上告诉我们使用pip install,但实际上poetry官方并不推荐使用这种安装方式,我们来到poetry官网:

python-poetry.org/docs/

官方给出了windows的安装命令,我们按这个来,完整命令:

(Invoke-WebRequest -Uri https://install.python-poetry.org -UseBasicParsing).Content | py -

我并不记得我的python是通过microsoft store安装的,但是终端给我报错

那就将py改成python,成功了

注意:这个命令最好在powershell中执行,否则可能会出现"此处不应该有.Content"的报错。

接着还没完,装是装完了,但是此时输入poetry --version仍然会报错,因为想要在终端中使用poetry命令,需要在windoes的"系统"中安装poetry,也就是说我们还需要将刚刚安装的poetry添加到windows的环境变量。

这部分命令行也给了提示:

我们只需要把这个路径复制下来,然后添加到系统环境变量path中即可(不要忘了点确定哟)。

然后我们打开另一个终端,在原来的终端还是会显示安装失败 ,输入poetry --version

安装成功!!

然后我们按照Github上的指示安装poetry依赖

接下来我们使用poetry shell命令开启python环境隔离

最后根据文档提示使用poetry run uvicorn main:app --reload --port 7001命令启动后端项目

后端成功运行在本地的7001端口。

前端

首先新建一个终端,将目录切换到前端目录:cd frontend

然后使用yarn安装项目的依赖。

安装成功后,使用yarn dev命令启动前端项目。

实际效果测试

当前后端都成功启动之后,我们在浏览器打开5173端口,右上角mobile按钮可以模拟手机上显示的效果,code按钮可以展示网页代码,下面进行实际测试:

我上来就截取了一个网站的整个界面,可以看到我上传的照片里面有很多复杂的元素,但是该模型只关注了中间的一小部分(尽管绘制效果倒是很不错)

于是我灵机一动,如果我把一个页面"揉碎了"喂给它,会不会效果更好一点?

然后我截取了页面的导航栏,可以看到最终绘制的效果还是很棒的。

这是另外一部分的效果:

这么看该模型对于有棱有角的模块绘制效果还是niu的,但是像下面这种抽象一点的图形就不尽人意了。

实际效果:

最后,一句话总结这个项目的效果------虽然仍有缺陷,但别想着一口喂成个胖子,它就绝对能惊艳你。

相关推荐
Moment37 分钟前
Cursor 2.0 支持模型并发,我用国产 RWKV 模型实现了一模一样的效果 🤩🤩🤩
前端·后端·openai
用户5191495848452 小时前
原型污染攻击工具揭秘:Prototype Pollution Gadgets Finder
人工智能·aigc
mortimer5 小时前
视频翻译中的最后一公里:口型匹配为何如此难
openai·音视频开发·视频编码
安思派Anspire5 小时前
构建一个自主深度思考的RAG管道以解决复杂查询--通过网络搜索扩充知识(6)
aigc·openai·agent
ZEGO即构开发者7 小时前
【ZEGO即构开发者日报】Soul AI Lab开源播客语音合成模型;腾讯混元推出国内首个交互式AI播客;ChatGPT Go向用户免费开放一年......
人工智能·aigc·语音识别·实时音视频
新智元9 小时前
他发明了价值万亿的 AGI,如今穷困潦倒
人工智能·openai
Baihai_IDP10 小时前
怎样为你的 RAG 应用选择合适的嵌入模型?
人工智能·llm·aigc
机器之心10 小时前
AI太空竞赛?英伟达H100刚上天,谷歌Project Suncatcher也要将TPU送上天
人工智能·openai
新智元10 小时前
全球首个「导航大脑」上线!一句话让机器人自己找路回家
人工智能·openai
视觉&物联智能10 小时前
【杂谈】-制造业变革:机器人与自动化引领新时代
人工智能·ai·机器人·自动化·aigc·agi·deepseek