GLM-4.6与DeepSeek-V3.2-Exp发布

GLM-4.6

GLM-4.6是智谱AI于2025年9月30日发布并开源的新一代大模型,在核心能力上实现显著提升,尤其在代码生成、长上下文处理及智能体应用等方面表现突出.

image

GLM-4.6 是智谱最新的旗舰模型,其总参数量 355B,激活参数 32B。GLM-4.6 所有核心能力上均完成了对 GLM-4.5 的超越,具体如下:

高级编码能力:在公开基准与真实编程任务中,GLM-4.6的代码能力对齐Claude Sonnet 4,是国内已知的最好的Coding模型。

上下文长度:上下文窗口由128K→200K,适应更长的代码和智能体任务。

推理能力:推理能力提升,并支持在推理过程中调用工具。

搜索能力:增强了模型在工具调用和搜索智能体上的表现,在智能体框架中表现更好。

写作能力:在文风、可读性与角色扮演场景中更符合人类偏好。

多语言翻译:进一步增强跨语种任务的处理效果。

CodeGeeX已集成GLM4.6

image

生成单测

image

DeepSeek V3.2 Exp

DeepSeek-V3.2-Exp是深度求索公司于2025年9月29日发布的实验性大模型,核心创新与特点如下:

技术架构

‌稀疏注意力机制‌:引入自研的DeepSeek Sparse Attention(DSA),通过细粒度稀疏化处理长文本,显著提升训练和推理效率,计算成本降低近9倍

该机制采用128维FP8精度Lightning Indexer优化索引过程,同时保留FP16核心计算精度

‌性能验证‌:在公开评测集上表现与前代V3.1-Terminus持平,长序列上下文支持达160K(华为云适配)

成本优化

‌API降价‌:调用成本降低50%以上,新价格为每百万tokens输入0.2元(缓存命中)/2元(未命中),输出3元

‌开源生态‌:模型及GPU算子(TileLang/CUDA版本)已在Hugging Face和ModelScope平台开源,支持国产芯片(寒武纪、昇腾、海光DCU)深度协同

image
DeepSeekV3.2

参考

docs.bigmodel.cn

github.com/deepseek-ai...

相关推荐
IT·小灰灰1 小时前
基于DMXAPI与GLM-4.7-Flash构建零成本AI编程工作站:从API选型到流式生成实战
人工智能·aigc·ai编程
快降重021 小时前
剖析AIGC降重:你的论文智能“重构师”
人工智能·自然语言处理·重构·aigc·论文降重·降ai率·快降重
熵减纪元1 小时前
OpenClaw gateway start 报 401 Invalid API key?一个环境变量的坑
人工智能·aigc
147API3 小时前
60,000 星的代价:解析 OpenClaw 的架构设计与安全教训
人工智能·安全·aigc·clawdbot·moltbot·openclaw
feasibility.13 小时前
混元3D-dit-v2-mv-turbo生成3D模型初体验(ComfyUI)
人工智能·3d·aigc·三维建模·comfyui
PaperRed ai写作降重助手15 小时前
AI 论文写作工具排名(实测不踩坑)
人工智能·aigc·ai写作·论文写作·智能降重·辅助写作·降重复率
阿杰学AI18 小时前
AI核心知识80——大语言模型之Slow Thinking和Deep Reasoning(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·慢思考·深度推理
SmartBrain19 小时前
OCR 模型在医疗场景的选型研究
人工智能·算法·语言模型·架构·aigc·ocr
阿杰学AI20 小时前
AI核心知识79——大语言模型之Knowledge Conflict(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·rag·知识冲突
PaperRed ai写作降重助手1 天前
主流 AI 论文写作工具排名(2026 最新)
人工智能·aigc·ai写作·论文写作·论文降重·论文查重·辅助写作