人工智能领域、图欧科技、IMYAI智能助手2025年10月更新月报


IMYAI 平台 2025 年 10 月主要更新与模型上新汇总

2025年10月27日
服务与功能更新

  • 绘画板块多项更新
    1. 通义千问绘画:新增支持上传1~3张参考图进行组合生成,并优化了单图输入时的人脸、商品特征及文字编辑的一致性。现已原生支持ControlNet,可通过深度图、边缘图等实现精细控制。
    2. 即梦4.0:现支持单次生成4张图像。
    3. GPT4o绘画:故障已修复。
    4. 谷歌绘画:已切换至官方API,新增多种尺寸比例选项(如2:3、3:4等)。原"HD高清"功能因渠道切换暂时下线。

2025年10月23日
新功能与新模型

  • DeepSeek-OCR上线:该开源视觉-语言模型专为高效OCR设计,支持通过对话处理图片中的文本,并能以Markdown格式输出,涵盖多语言、表格等复杂布局。用户可在对话板块选择使用。
  • 深度研究功能:"Gemini-Deep-Research"功能恢复,并新增上线"Grok-4-DeepSearch"。
  • 视频板块更新:Veo3.1模型新增多图参考功能,并对输入界面进行了UI优化。

2025年10月20日
绘画与视频板块更新

  • 绘画板块
    1. 即梦4.0模型新增"4K高清"生成选项。
    2. 即梦图片尺寸调整新增滑块控制与"智能比例"选项。
  • 视频板块:Sora及Veo3.1模型新增支持"首尾帧"功能。
  • 近期新增模型汇总
    1. Claude Haiku 4.5:更快速、低成本的小型模型,在编程等基准测试中表现接近旗舰模型。
    2. 蚂蚁百灵-Ling-1T:万亿参数MoE架构的非思考模型,在代码与数学推理方面表现突出。
    3. 蚂蚁百灵-Ring-1T:基于Ling-1T训练的开源思想模型,专注于深度推理能力。
    4. 豆包-doubao-Seed-1.6系列:支持256K上下文的新系列,包含思考版、快速版与标准版。
    5. GLM-4.6:最新开源的355B参数MoE模型,代码与长文推理能力提升。
    6. Runway Gen-4:新一代视频生成模型,主打"世界一致性"与高保真度。
    7. Runway Aleph:支持通过文字提示对视频进行多种编辑的生成式模型。
    8. Runway Act-Two:第二代AI动作捕捉模型,可从视频生成高质量的全身动画。

2025年10月18日
会员体系更新

  • Sora-Pro直连站上线:提供更高额度的Sora官方Pro会员服务。同步支持"故事板(Storyboard)"等新功能。永久会员首发期间限时限量供应。

2025年10月17日
视频模型更新

  • 主站模型更新:Sora 2模型新增15s时长版本。
  • 新模型上线 :谷歌Veo 3.1Veo 3.1 Pro模型上线,支持原生音频生成、更长时长及"首尾帧"衔接等功能。
  • 直连站福利:Sora永久会员可限时体验Pro模型功能。

2025年10月09日

服务升级与客户端更新

  • Sora直连站/主站升级:已全面升级至Sora 2,支持横竖屏切换及在提示词中通过"@sama"进行互动。主站生成视频已支持无水印。
  • iOS客户端更新:发布了新版本的iOS客户端,提供了多个下载地址供用户选择。

2025年10月01日

重磅模型上新

  • Sora 2:OpenAI新一代AI视频生成模型,在物理交互、角色一致性、多镜头控制及音画同步方面有显著提升。
  • Claude Sonnet 4.5:Anthropic最新大型语言模型,在专业领域推理、代码执行及文件创建方面能力增强,并提升了安全性。
  • DeepSeek-V3.2-Exp:DeepSeek推出的实验性模型,引入了新的稀疏注意力机制以提升长文本处理效率。


相关推荐
墨染天姬1 小时前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
AI成长日志1 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
2501_948114242 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠2 小时前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
黎阳之光2 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
小超同学你好2 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型
智星云算力2 小时前
本地GPU与租用GPU混合部署:混合算力架构搭建指南
人工智能·架构·gpu算力·智星云·gpu租用
jinanwuhuaguo2 小时前
截止到4月8日,OpenClaw 2026年4月更新深度解读剖析:从“能力回归”到“信任内建”的范式跃迁
android·开发语言·人工智能·深度学习·kotlin
xiaozhazha_2 小时前
效率提升80%:2026年AI CRM与ERP深度集成的架构设计与实现
人工智能
枫叶林FYL2 小时前
【自然语言处理 NLP】7.2.2 安全性评估与Constitutional AI
人工智能·自然语言处理