1. 微软开源TRELLIS.2工具,一键实现图片到高精度3D模型快速转换
微软正式开源图像到3D模型生成工具TRELLIS.2,该工具采用4B模型,支持512³至1536³分辨率图像处理,在NVIDIA H100显卡支持下生成对应分辨率3D模型仅需3秒至1分钟,效率出众,生成的.glb格式文件可兼容Blender、Unity等主流平台,且附带PBR四件套贴图,能满足电商产品展示、游戏开发、虚拟现实等多场景需求,为用户快速制作高质量3D内容提供了便捷解决方案。
Hugging Face:https://huggingface.co/microsoft/TRELLIS.2-4B
GitHub:https://github.com/microsoft/TRELLIS.2
2. 谷歌发布Gemini 3 Flash模型:高性价比AI实现速度与智能双突破
谷歌正式推出轻量级模型Gemini 3 Flash,作为其年度收官之作。该模型在保持低成本(输入每百万token 0.5美元)的同时,性能显著提升,多项基准测试接近甚至超越Gemini 3 Pro和GPT-5.2等前沿模型,尤其在多模态推理和代码生成任务中表现突出。Gemini 3 Flash响应速度达1秒以内,已设为Gemini应用及搜索AI模式的默认模型,面向全球用户开放。
3. 港中大(深圳)提出LoFA框架:秒级预测LoRA参数,实现大模型即时个性化适配
香港中文大学(深圳)GAP-Lab团队提出新型框架LoFA,通过直接从用户指令前馈式预测完整LoRA参数,将视觉生成模型的个性化适配时间从数小时缩短至秒级,且效果媲美甚至超越传统LoRA优化。该框架利用响应图谱引导的两阶段学习,无需冗长微调即可在视频动作定制、风格化生成等任务中实现高质量输出,推动大模型进入"即时适配"时代。
论文:https://arxiv.org/abs/2512.08785
项目主页:https://jaeger416.github.io/lofa/
GitHub:https://github.com/GAP-LAB-CUHK-SZ/LoFA
4. 小米开源大模型MiMo-V2-Flash登顶代码能力榜首,以高效架构实现智能体实用化突破
小米发布309B参数的MoE模型MiMo-V2-Flash,凭借滑动窗口注意力、多层Token预测等技术,在实现2.6倍推理加速的同时,以极低成本(输入每百万token 0.7元)跻身开源第一梯队。该模型在SWE-Bench代码评测中以73.4%的成绩超越主流模型,兼具高情商对话能力,旨在为"人车家"生态打造可精准操控硬件的物理AGI基座。
Hugging Face:https://huggingface.co/XiaomiMiMo/MiMo-V2-Flash
技术报告:https://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf
在线体验:https://aistudio.xiaomimimo.com
5. OpenAI发布最强编程AI模型GPT-5.2-Codex,以智能体能力革新软件开发与网络安全
OpenAI推出专为智能体编程优化的GPT-5.2-Codex,融合GPT-5.2的专业知识处理与GPT-5.1-Codex-Max的终端操作能力,在SWE-Bench Pro等基准测试中刷新纪录,支持长周期代码重构与跨平台任务。该模型具备业界顶尖的网络安全防御能力,已成功协助挖掘React高危漏洞,即日起向付费用户开放。
6. 谷歌联手Meta启动"TorchTPU"计划,以PyTorch兼容性挑战英伟达CUDA生态垄断
谷歌正联合Meta推进代号"TorchTPU"的战略行动,旨在优化PyTorch框架在谷歌TPU芯片上的运行效率,通过降低开发者的迁移门槛直接冲击英伟达以CUDA构筑的软件生态护城河。此举试图将TPU打造为GPU的替代方案,并借助Meta在PyTorch生态的影响力,为AI算力市场提供多元化选择,打破英伟达的长期硬件垄断格局。
参考