Ideogram API 重磅推出角色一致性功能,告别LoRA训练烦恼

OpenAI 发布 GPT-5:多榜单第一,性能超越 Gemini 2.5 Pro

OpenAI 正式发布其下一代旗舰模型 GPT-5[1],在 LMArena 多个类别榜单中均排名第一,超越了 Google 的 Gemini 2.5 Pro 和 OpenAI 上一代模型 o3。

其 API 提供了三个不同版本,定价与 Gemini 2.5 Pro 相当,但均需通过 KYC 才能调用。

虽然 GPT-5 的性能提升显著,但我个人感觉没有那种断档式提升。

Cursor 重磅推出 Cursor CLI 工具(Beta 版)

Cursor 发布了其全新的命令行工具(Beta 版)Cursor CLI[2] ,类似 Claude Code 和 Gemini CLI,开发者能直接在终端中跨多种 IDE 运行 AI 编码工作流和自动化任务,集成了最新上线的 GPT-5 模型。

似乎大家都在卷 CLI,Cursor 也是坐不住了,赶紧推出了自己的解决方案。

ComfyUI 重磅推出子图与部分执行功能,工作流开发更高效

ComfyUI 正式发布了「子图」(Subgraph)[3] 和「部分执行」(Partial Execution) 两大新功能。

  • 「子图」功能允许用户将一组复杂的节点流程打包成单一的可复用节点。
  • 「部分执行」功能则让开发者能够只运行工作流中的特定分支。

这两个功能确实非常实用!能极大简化复杂工作流的开发和调试过程,是俺期待已久的更新。

海螺 Speech 2.5 震撼发布:40 种语言支持 + 跨语种音色复刻

MiniMax 正式发布新一代语音生成模型 Speech 2.5,该模型支持语种扩展至 40 种,并提升了跨语种音色复刻能力和多语种表达的自然度。

详情佬们可以看官方推文介绍[4],也可以直接去官网体验

Ideogram API 重磅推出角色一致性功能,告别LoRA训练烦恼

Ideogram AI最新推出的 角色一致性功能(Character)[5],开发者现在可以直接通过 API 创建具有稳定外观特征的角色,无需额外训练 LoRA 模型。

当然,这个接口的成本也不低 - 是 Flux Kontext Max 的 2.5 倍,还是蛮贵的。

相关推荐
win4r1 天前
🚀保姆级教程!GitHub Copilot CLI横空出世,支持MCP扩展+自动PR创建,让AI编程效率提升1000%,开发者必看!开发完整应用实战演示!
aigc·openai·github copilot
x007xyz2 天前
🚀🚀🚀前端的无限可能-纯Web实现的字幕视频工具 FlyCut Caption
前端·openai·音视频开发
机器之心3 天前
首个代码世界模型引爆AI圈,能让智能体学会「真推理」,Meta开源
人工智能·openai
安思派Anspire3 天前
这不是炒作——Claude Code证明未来已然到来
aigc·openai
机器之心4 天前
大模型七连发,外国人馋透了!阿里云栖大会全栈升级够狠
人工智能·openai
机器之心4 天前
Sam Altman发文,透露OpenAI正在干的大事业
人工智能·openai
鸽芷咕4 天前
告别Excel熬夜!基于LazyLLM框架打造财报分析Agent 副本
openai·agent
新智元4 天前
奥特曼刚刚发文,10GW 核爆级算力!每周一座核电站,五座新城官宣
人工智能·openai
机器之心9 天前
英伟达50亿美元入股英特尔,将发布CPU+GPU合体芯片,大结局来了?
人工智能·openai
新智元9 天前
芯片大地震,黄仁勋355亿入股!英特尔要为老黄造CPU,股价狂飙30%
人工智能·openai