Ideogram API 重磅推出角色一致性功能,告别LoRA训练烦恼

OpenAI 发布 GPT-5:多榜单第一,性能超越 Gemini 2.5 Pro

OpenAI 正式发布其下一代旗舰模型 GPT-5[1],在 LMArena 多个类别榜单中均排名第一,超越了 Google 的 Gemini 2.5 Pro 和 OpenAI 上一代模型 o3。

其 API 提供了三个不同版本,定价与 Gemini 2.5 Pro 相当,但均需通过 KYC 才能调用。

虽然 GPT-5 的性能提升显著,但我个人感觉没有那种断档式提升。

Cursor 重磅推出 Cursor CLI 工具(Beta 版)

Cursor 发布了其全新的命令行工具(Beta 版)Cursor CLI[2] ,类似 Claude Code 和 Gemini CLI,开发者能直接在终端中跨多种 IDE 运行 AI 编码工作流和自动化任务,集成了最新上线的 GPT-5 模型。

似乎大家都在卷 CLI,Cursor 也是坐不住了,赶紧推出了自己的解决方案。

ComfyUI 重磅推出子图与部分执行功能,工作流开发更高效

ComfyUI 正式发布了「子图」(Subgraph)[3] 和「部分执行」(Partial Execution) 两大新功能。

  • 「子图」功能允许用户将一组复杂的节点流程打包成单一的可复用节点。
  • 「部分执行」功能则让开发者能够只运行工作流中的特定分支。

这两个功能确实非常实用!能极大简化复杂工作流的开发和调试过程,是俺期待已久的更新。

海螺 Speech 2.5 震撼发布:40 种语言支持 + 跨语种音色复刻

MiniMax 正式发布新一代语音生成模型 Speech 2.5,该模型支持语种扩展至 40 种,并提升了跨语种音色复刻能力和多语种表达的自然度。

详情佬们可以看官方推文介绍[4],也可以直接去官网体验

Ideogram API 重磅推出角色一致性功能,告别LoRA训练烦恼

Ideogram AI最新推出的 角色一致性功能(Character)[5],开发者现在可以直接通过 API 创建具有稳定外观特征的角色,无需额外训练 LoRA 模型。

当然,这个接口的成本也不低 - 是 Flux Kontext Max 的 2.5 倍,还是蛮贵的。

相关推荐
机器之心18 小时前
Adam的稳+Muon的快?华为诺亚开源ROOT破解大模型训练「既要又要」的两难困境
人工智能·openai
魁首20 小时前
AI Agent 协议演进:从 MCP 到 ACP 的架构对比与未来展望
openai·gemini·mcp
Jim86021 小时前
使用自定义API接入OpenAI CodeX配置教程
openai
机器之心2 天前
小米开源首个跨域具身基座模型MiMo-Embodied,29个榜单SOTA
人工智能·openai
重整旗鼓~2 天前
2.LangChain4j+springboot+大模型整合
openai·springboot·ollama·langchain4j
win4r3 天前
昨夜炸场!Claude Opus 4.5 发布,Chrome 插件“夺舍”浏览器,实测这7大功能令人头皮发麻
aigc·openai·claude
机器之心3 天前
从推荐算法优化到AI4S、Pico和大模型,杨震原长文揭秘字节跳动的技术探索
人工智能·openai
机器之心3 天前
哈工大深圳团队推出Uni-MoE-2.0-Omni:全模态理解、推理及生成新SOTA
人工智能·openai
带刺的坐椅3 天前
(让 Java IA & MCP 更简单 )Solon AI v3.7.2 发布
ai·chatgpt·openai·solon·mcp
爱吃的小肥羊3 天前
GPT-5.1-Codex-Max正式发布,超越Gemini 3,编程能力第一!(附使用方法)
后端·aigc·openai