DeepSeek-V3 非推理模型首次登顶排行榜,开源模型里程碑时刻啊!

DeepSeek-V3 非推理模型首次登顶排行榜

DeepSeek 前天低调发布了 V3-0324 模型更新,昨天终于发布了官方公告[3]。

主要更新内容包括:

  1. 借鉴 DeepSeek-R1 模型大幅提升推理能力
  2. 在前端开发任务(如 HTML 等代码生成)上表现更出色,代码可用性和设计美观度都有提升。(前端佬们又要失业了
  3. 中文写作基于 R1 的写作水平进一步优化,特别提升了中长篇内容质量
  4. 中文搜索能力显著优化

此外,在工具调用、角色扮演、问答闲聊等方面也有明显的能力提升。

该模型目前在 Artificial Analysis 排行榜中成为得分最高的非推理模型 - 这也是开源非推理模型的首次领先,是开源模型的里程碑时刻啊!

OpenAI 推出了 GPT-4o 的图像生成功能

OpenAI 推出了 GPT-4o 的图像生成功能,它取代了此前使用的DALL-E 3模型,利用GPT-4o的原生多模态能力,能够支持渲染文本,支持从写实风格到艺术插图的多种风格,能处理复杂的用户指令,并保持一致性,还能通过多轮对话逐步调整和完善图像。

目前,该功能已集成到 ChatGPT 中,所有人都可以在对话中输入生图请求即可使用,API 将在未来几周内提供。当然这玩意不是万能的,偶尔会出现幻觉(hallucination)、数学图表生成不够准确,以及多语言文本支持有限。

更多细节和演示可以看官方介绍[1]。

谷歌 Gemini 2.5 Pro 实验版发布:登顶 Chatbot Arena

谷歌正式推出 Gemini 2.5 Pro 实验版(gemini-2.5-pro-exp-03-25),这是一款推理模型,在 Chatbot Arena 评测中荣登榜首。

它支持高达 100 万 token 的上下文窗口,能够处理和理解多模态内容------包括文本、音频、图像、视频甚至整个代码库。

佬们可以在 ai.dev 上免费试用(官方博客[2]有完整更新细节),不过免费版本注意速率限制:每分钟 2 次请求,每天上限 50 次请求。

相关推荐
AC赳赳老秦4 小时前
代码生成超越 GPT-4:DeepSeek-V4 编程任务实战与 2026 开发者效率提升指南
数据库·数据仓库·人工智能·科技·rabbitmq·memcache·deepseek
小白狮ww7 小时前
要给 OCR 装个脑子吗?DeepSeek-OCR 2 让文档不再只是扫描
人工智能·深度学习·机器学习·ocr·cpu·gpu·deepseek
realhuizhu16 小时前
为什么程序员配出的颜色像"斑斓的灰"?因为你还在靠直觉
前端开发·ai工具·ui设计·deepseek·程序员提升
逐梦苍穹21 小时前
速通DeepSeek论文mHC:给大模型装上物理阀门的架构革命
人工智能·deepseek·mhc
realhuizhu3 天前
你有多少次对着设计稿说"感觉不对,但说不上来"?
提示词工程·设计效率·deepseek·ai设计工具·品牌logo
AC赳赳老秦3 天前
DeepSeek一体机部署:中小企业本地化算力成本控制方案
服务器·数据库·人工智能·zookeeper·时序数据库·terraform·deepseek
Elwin Wong3 天前
浅析DeepSeek-OCR v1&v2
人工智能·大模型·llm·ocr·deepseek
AI刀刀4 天前
千问 文心 元宝 Kimi公式乱码
ai·pdf·豆包·deepseek·ds随心转
aihuangwu4 天前
deepseek图表怎么导出
人工智能·ai·deepseek·ds随心转
QUDONG_biubiubiu4 天前
DeepSeek推出OCR 2模型!瞄准高难度文档识别
人工智能·深度学习·deepseek·deepseek-ocr 2