GLM-4.6与DeepSeek-V3.2-Exp发布

GLM-4.6

GLM-4.6是智谱AI于2025年9月30日发布并开源的新一代大模型,在核心能力上实现显著提升,尤其在代码生成、长上下文处理及智能体应用等方面表现突出.

image

GLM-4.6 是智谱最新的旗舰模型,其总参数量 355B,激活参数 32B。GLM-4.6 所有核心能力上均完成了对 GLM-4.5 的超越,具体如下:

高级编码能力:在公开基准与真实编程任务中,GLM-4.6的代码能力对齐Claude Sonnet 4,是国内已知的最好的Coding模型。

上下文长度:上下文窗口由128K→200K,适应更长的代码和智能体任务。

推理能力:推理能力提升,并支持在推理过程中调用工具。

搜索能力:增强了模型在工具调用和搜索智能体上的表现,在智能体框架中表现更好。

写作能力:在文风、可读性与角色扮演场景中更符合人类偏好。

多语言翻译:进一步增强跨语种任务的处理效果。

CodeGeeX已集成GLM4.6

image

生成单测

image

DeepSeek V3.2 Exp

DeepSeek-V3.2-Exp是深度求索公司于2025年9月29日发布的实验性大模型,核心创新与特点如下:

技术架构

‌稀疏注意力机制‌:引入自研的DeepSeek Sparse Attention(DSA),通过细粒度稀疏化处理长文本,显著提升训练和推理效率,计算成本降低近9倍

该机制采用128维FP8精度Lightning Indexer优化索引过程,同时保留FP16核心计算精度

‌性能验证‌:在公开评测集上表现与前代V3.1-Terminus持平,长序列上下文支持达160K(华为云适配)

成本优化

‌API降价‌:调用成本降低50%以上,新价格为每百万tokens输入0.2元(缓存命中)/2元(未命中),输出3元

‌开源生态‌:模型及GPU算子(TileLang/CUDA版本)已在Hugging Face和ModelScope平台开源,支持国产芯片(寒武纪、昇腾、海光DCU)深度协同

image
DeepSeekV3.2

参考

docs.bigmodel.cn

github.com/deepseek-ai...

相关推荐
kailp3 小时前
OpenAI发布AI浏览器Atlas:探索下一代网页交互新可能
人工智能·大模型·云计算·aigc·算力
Mintopia5 小时前
🤖 算法偏见修正:WebAI模型的公平性优化技术
前端·javascript·aigc
墨风如雪16 小时前
OpenAI重磅发布ChatGPT Atlas:告别传统浏览器的AI新纪元!
aigc
win4r20 小时前
🚀DeepSeek又放大招!这个OCR模型让文档识别效率倍增!本地部署+客观实测DeepSeek-OCR!OCR识别准确率97%,支持100+语言,每天处理3
llm·aigc·deepseek
王中阳Go20 小时前
挑战一周用 AI 开发商业化项目!4 大痛点反思 + 新手专属提示词分享
后端·aigc·openai
win4r20 小时前
🚀彻底改写浏览器自动化!ChatGPT Atlas浏览器深度评测:Agent模式自动操作网页太疯狂!跨网页理解+长文秒懂+图片识别,论文工作流被改写!看完你会
chatgpt·aigc·openai
猫头虎1 天前
DeepSeek刚刚开源了一个3B的 OCR模型:什么是DeepSeek-OCR?单张A100-40G每天可以处理20万+页文档
人工智能·开源·whisper·prompt·aigc·ocr·gpu算力
自由生长20241 天前
使用AI的思考-为什么大模型不会主动提问
aigc·ai编程
Mintopia1 天前
⚖️ AIGC版权确权技术:Web内容的AI生成标识与法律适配
前端·javascript·aigc
用户5191495848452 天前
使用Python ConfigParser解析INI配置文件完全指南
人工智能·aigc