Chain-of-Zoom :64 倍超分辨率在线体验

谷歌 SignGemma 实现手语与文本实时互译

谷歌最新发布 SignGemma 手语翻译模型,基于 Gemma,专用于美国手语(ASL)与英语的实时双向互译。目前只开放了申请测试[1],预计今年晚些时候才会正式发布。

Darwin Godel Machine:开源的自进化 AI Agent 系统

DGM(Darwin Godel Machine)[2]是一个基于达尔文进化论原理的智能 Agent 系统。它能够通过递归重写自身代码来实现自我进化,并在每次修改后自动评估性能提升效果。

目前该项目已在 GitHub 开源。

Fal 推出基于 FLUX-1 Kontext 的 AI 图像编辑模板套件

Fal 推出了基于FLUX-1 Kontext 开发的 AI 图像编辑模板[3],包含老照片修复、背景替换、风格转换、水印去除等实用功能,能够快速实现多种专业效果。

佬们可以在左上角轻松切换不同模板,每次运行仅需 0.04 美元(约合人民币 0.3 元)。

FLUX.1 Kontext 社区用例

Replicate 最新发布的博文[4]展示了 FLUX.1 Kontext 的强大功能 - 它让原本需要复杂 ComfyUI 工作流才能完成的任务变得轻而易举。

从换发型、生成职业照,到老照片修复、比例调整和水印去除,Kontext 都能轻松搞定。

官方还贴心地发布了对应的 flux-kontext-apps[5] 示例库,佬们可以亲自上手体验。

如果觉得还是麻烦?不妨试试 Replicate 完全免费的 Kontext Chat[6],无需登录就能使用,可比 Fal AI 良心多了!

Chain-of-Zoom :64 倍超分辨率在线体验

还记得之前介绍的 Chain-of-Zoom[7] 技术吗?

现在它终于有了非官方在线演示[8]!详细介绍可以看之前的日报。

相关推荐
山烛4 天前
OpenCV 银行卡号识别
人工智能·opencv·计算机视觉·图像识别·数字识别
中科逸识10 天前
OCR识别在媒资管理系统的应用场景剖析与选择
图像识别·图片文字识别·文字识别·媒资管理·ocr识别
小Lu的开源日常13 天前
Mathcheap v0.9.x 发布的第一个月,从想法到 MVP(最小可行性产品)
前端·图像识别·next.js
用户561299910191 个月前
逆天!AiPy 打进专业图像生成阵营,实力够格和主流平台抗衡
图像识别
用户6120414922131 个月前
C语言做的停车场车牌识别系统
c语言·后端·图像识别
汤姆yu1 个月前
基于图像识别与分类的中国蛇类识别系统
人工智能·分类·数据挖掘·图像识别
万俟淋曦1 个月前
人工智能图像生成的道德利弊
人工智能·aigc·图像识别
泰Tai1 个月前
【YOLOv8学习】WSL2中安装标注软件X-AnyLabeling
python·图像识别
阿宙ppppp1 个月前
基于yolov5+LPRNet+flask+vue的车牌识别(2)
后端·图像识别
阿宙ppppp1 个月前
基于yolov5+LPRNet+flask+vue的车牌识别(1)
后端·图像识别