ai

ofoxcoding37 分钟前
gpt·ai
MiniMax M2.7 API 调用实测:和 GPT-5、Claude Sonnet 4.6、Gemini 3 放一起比,结果有点意外上周团队在做一个多模型路由的 RAG 项目,需要选一个性价比高的长上下文模型。MiniMax 刚发了 M2.7,号称百万级上下文、推理能力大幅提升,我寻思正好拉过来跟手头常用的几个模型做个横评。
张忠琳2 小时前
ai·架构·vllm
【vllm】(五)vLLM v1 Attention — 模块超深度分析之五AMD ROCm平台的标准注意力后端:forward() 方法:这是attention模块中最大的单个后端文件。
网络工程小王2 小时前
笔记·学习·ai·智能体·hermes
【hermes多智能体协作】个人学习笔记与LangGraph 那种“强编排”的流程图模式不同,Hermes 的多智能体协作更偏向于“联邦制” (Federated) 和 “自进化” (Self-Evolving)。它的核心优势在于:不仅能让多个智能体一起干活,还能让它们把干活的经验沉淀下来,下次干得更好。
俊哥V2 小时前
人工智能·ai
每日 AI 研究简报 · 2026-04-22(本文借助 AI 大模型及工具辅助整理)一句话总结:Anthropic Mythos 网络安全模型引发白宫关注,Google 推出 Deep Research Max 企业级研究 Agent,具身智能与 VLA 框架成为学术热点,AI 编码竞赛进入白热化阶段。
yyk的萌2 小时前
linux·运维·服务器·ai·claude code
Claude Code 命令大全输入 / 即可查看所有可用斜杠命令,支持边输入边筛选。费用参考:/doctor 检查项:三种工作模式(Shift+Tab 切换):
zs宝来了2 小时前
机器学习·ai·基础设施
PyTorch DDP:分布式训练与梯度同步深入解析PyTorch DistributedDataParallel的实现原理、源码剖析与实战技巧随着深度学习模型规模的爆炸式增长(GPT-3拥有1750亿参数,训练数据量达45TB),单卡训练已无法满足需求。分布式训练成为必然选择。在PyTorch生态中,DistributedDataParallel(DDP) 是工业级分布式训练的首选方案,相比DataParallel(DP),它具备更优的性能和更强的扩展性。
张忠琳2 小时前
人工智能·深度学习·ai·架构·vllm
【vllm】(五)vLLM v1 Attention — 模块超深度分析之二selector.py(165行)是后端选择的入口模块,负责根据运行时配置选择最优注意力后端。设计意图:
九章智算云3 小时前
人工智能·ai·大模型·agent·ai工具·claude code·vibe-coding
一份CLAUDE.md,为何能让GitHub榜首项目狂揽6万星?大家好,我是小九。上周,我被GitHub上的一个奇观给整不会了。一个叫 andrej-karpathy-skills 的项目,没有一行代码,就一个不到200行的Markdown文件,冲上了全球GitHub Trending日榜榜首。
AiTop1004 小时前
人工智能·ai·架构
跨数据中心的创新:Moonshot AI与清华大学提出PrfaaS架构Moonshot AI 与清华大学的研究团队最近推出了一种新架构--PrfaaS架构说实话,这个架构的思路挺聪明的。大型语言模型的推理一直是个头疼问题——计算资源需求大,传统架构又受限于数据中心。现在 Moonshot AI 和清华大学提出了一个新方案:把预填充和解码拆开,跨数据中心处理。
深藏功yu名4 小时前
人工智能·python·ai·pycharm
大模型推理加速实战技术Ollama 是本地大模型一键运行工具,底层做了基础的显存优化、模型量化,适合日常本地使用,但推理速度、并发能力有上限。
catoop4 小时前
ai
AI RAG 问答质量测评 Answer Correctness 指标详解Ragas 框架中"答案正确性"评估指标的技术解读Answer Correctness 用 “像不像”(语义相似度) 和 “对不对”(事实准确度) 两个维度,综合判断 AI 回答的质量。
TheRouter4 小时前
gpt·ai·ai作画·llm·openai
gpt-image-2发布第一天,我用它替换了文章配图的整套流程OpenAI 昨天(4月21日)发布了 gpt-image-2,中文文字渲染准确率据说到了 99%。我之前的文章配图一直用 HTML 写信息图 → Playwright 截图的土办法。今天花了一下午实测:gpt-image-2 能不能把这套笨重流程干掉?
程序员鱼皮4 小时前
ai·程序员·编程·ai编程·rag
RAG 是什么?16 种 RAG 方案一次讲清!AI 应用开发必学 | 万字干货大家好,我是程序员鱼皮。最近这两年,只要你接触过 AI 编程,大概率听过一个词,RAG(Retrieval-Augmented Generation)。
謓泽5 小时前
ai
2026 年 Cursor 订阅模式全解析与 AI 工具链布局本文旨在为职业开发者提供 2026 年最清晰的 AI 编程工具选型建议,涵盖 Cursor 的定价细节及其与 Claude、Gemini、Codex 等主流模型的本质区别。
Bruce_Liuxiaowei5 小时前
人工智能·ai·音视频·智能体·workbuddy
让AI帮你“看懂”文件:批量重命名、会议纪要、视频翻译全攻略摘要:本文详细介绍 WorkBuddy 在文档识别、会议纪要整理、外文视频翻译等场景的实际应用。通过具体案例和指令示例,展示如何用 AI 高效处理各类文件内容,适合 AI 工具爱好者学习参考。
Agent产品评测局5 小时前
人工智能·ai·chatgpt·架构
老旧电力系统没有API接口,Agent能不能在不改造系统的情况下分析巡检数据? —— 2026企业级智能体非侵入式落地实测与架构深度解析站在2026年电力行业数字化转型的深水区,我们发现一个普遍的“深水炸弹”: 大量服役中的变电站、配电房及矿山供电系统,其底层架构仍停留在10甚至20年前。 这些系统缺乏现代化的RESTful API或标准的微服务接口,数据如同被锁在“黑盒”中。 传统的数字化手段往往要求昂贵的系统改造或停机升级,这在保障供电可靠性的前提下几乎不可行。 然而,随着企业级智能体(Agent)技术的成熟,这一僵局正在被打破。 本文将立足2026年的技术视角,深度解析Agent如何在不触动原有系统代码的前提下,实现巡检数据的自动化
仓颉编程语言5 小时前
华为·ai·ai编程·鸿蒙·仓颉编程语言
直播预告 |【仓颉社区】第44期WORKSHOP议题介绍仓颉社区介绍仓颉编程语言社区致力于为仓颉编程语言开发者打造活跃、开放、高质量的社区环境,社区鼓励开发者知识分享、思想碰撞、技术互助和交流讨论,社区会定期开展Workshop、三方库招募和技术沙龙等开发者活动,鼓励开发者在更多场景使用仓颉编程语言展开应用。欢迎更多开发者加入仓颉编程语言社区!
老王谈企服5 小时前
数据库·人工智能·ai
[信创选型] 2026国产化替代进入应用层:有没有通过国产化认证、能在麒麟系统上跑的合规Agent?2026年,中国信息技术应用创新(信创)产业已从底层的“骨架替换”(CPU、服务器、操作系统)全面迈向顶层的“灵魂注入”(业务应用、AI智能体)。 在金融、政务、能源等关键领域,企业对自动化和智能化的需求不再局限于简单的脚本执行,而是追求能够深度嵌入国产环境、具备自主决策能力且符合严苛合规标准的Agent数字员工。 然而,在麒麟(KylinOS)等国产操作系统上,如何寻找既能通过官方认证、又能解决长链路业务迷失问题的Agent,成为当前数字化转型的核心焦点。
ofoxcoding6 小时前
人工智能·gpt·ai
GPT image-2 怎么调用?2026 完整接入教程 + 踩坑实录上周接了个小活,甲方要做批量生成商品主图的工具。需求很明确:传一段文字描述,出一张高质量商品图。我第一反应是 DALL·E 3,但试了几张发现文字渲染还是拉胯,英文勉强能看,中文直接乱码。然后想起 OpenAI 前阵子放出来的 GPT image-2 —— 就是 ChatGPT 里那个画图贼强的模型,现在 API 终于开放了。折腾了两天,踩了不少坑,总算跑通了整个流程,写篇文章记录一下。
俊哥V6 小时前
人工智能·ai
AI一周事件 · 2026年4月15日–4月21日(本文借助 AI 大模型及工具辅助整理)Anthropic 以网络安全为突破口与特朗普政府关系出现转机,同时 OpenAI 发布 ChatGPT Images 2.0 在多模态图像生成领域掀起新一轮竞争高潮;企业 AI 治理问题浮出水面,超过七成企业自认有 AI 管控能力实为"治理幻象"。