Chain-of-Zoom :64 倍超分辨率在线体验

谷歌 SignGemma 实现手语与文本实时互译

谷歌最新发布 SignGemma 手语翻译模型,基于 Gemma,专用于美国手语(ASL)与英语的实时双向互译。目前只开放了申请测试[1],预计今年晚些时候才会正式发布。

Darwin Godel Machine:开源的自进化 AI Agent 系统

DGM(Darwin Godel Machine)[2]是一个基于达尔文进化论原理的智能 Agent 系统。它能够通过递归重写自身代码来实现自我进化,并在每次修改后自动评估性能提升效果。

目前该项目已在 GitHub 开源。

Fal 推出基于 FLUX-1 Kontext 的 AI 图像编辑模板套件

Fal 推出了基于FLUX-1 Kontext 开发的 AI 图像编辑模板[3],包含老照片修复、背景替换、风格转换、水印去除等实用功能,能够快速实现多种专业效果。

佬们可以在左上角轻松切换不同模板,每次运行仅需 0.04 美元(约合人民币 0.3 元)。

FLUX.1 Kontext 社区用例

Replicate 最新发布的博文[4]展示了 FLUX.1 Kontext 的强大功能 - 它让原本需要复杂 ComfyUI 工作流才能完成的任务变得轻而易举。

从换发型、生成职业照,到老照片修复、比例调整和水印去除,Kontext 都能轻松搞定。

官方还贴心地发布了对应的 flux-kontext-apps[5] 示例库,佬们可以亲自上手体验。

如果觉得还是麻烦?不妨试试 Replicate 完全免费的 Kontext Chat[6],无需登录就能使用,可比 Fal AI 良心多了!

Chain-of-Zoom :64 倍超分辨率在线体验

还记得之前介绍的 Chain-of-Zoom[7] 技术吗?

现在它终于有了非官方在线演示[8]!详细介绍可以看之前的日报。

相关推荐
德育处主任1 天前
地表最强“慧眼”,给大模型戴上智能眼镜 PaddleOCR-VL
人工智能·机器学习·图像识别
OpenBayes2 天前
教程上新|重新定义下一代 OCR:IBM 最新开源 Granite-docling-258M,实现端到端的「结构+内容」统一理解
人工智能·深度学习·机器学习·自然语言处理·ocr·图像识别·文档处理
阿杆2 天前
国产神级开源 OCR 模型,登顶全球第一!再次起飞!
后端·github·图像识别
胡耀超22 天前
PaddleLabel百度飞桨Al Studio图像标注平台安装和使用指南(包冲突 using the ‘flask‘ extra、眼底医疗分割数据集演示)
人工智能·百度·开源·paddlepaddle·图像识别·图像标注·paddlelabel
databook22 天前
让YOLO飞起来:从CPU到GPU的配置指南
人工智能·python·图像识别
山烛25 天前
OpenCV :基于 Lucas-Kanade 算法的视频光流估计实现
人工智能·opencv·计算机视觉·音视频·图像识别·特征提取·光流估计
南方者1 个月前
当小学生的手写体也能识别出来,PP-OCRv5 稳了!
后端·图像识别
德育处主任1 个月前
文字识别:辛辛苦苦练模型,不如调用PP-OCRv5
后端·图像识别
阿杆1 个月前
国产神级开源 OCR 模型,GitHub 55k Star!再次起飞!
后端·github·图像识别
山烛1 个月前
OpenCV 银行卡号识别
人工智能·opencv·计算机视觉·图像识别·数字识别