大模型

龙侠九重天2 小时前
人工智能·ai·系统架构·大模型·llm·openclaw·hermes
OpenClaw 与 Hermes 有何异同?——从系统架构到用户体验的全面对比在过去几年间,AI 技术经历了从云端大模型到端侧智能体的范式跃迁。曾几何时,我们与 AI 的交互仅限于网页对话框,而如今,AI Agent——能够自主规划、执行和迭代的智能体——正在成为每个人桌面和手机上的新"同事"。
山林竹笋2 小时前
人工智能·大模型·ai编程·技术趋势
人工智能领域开源TOP20项目(2026.04.20-2026.04.26)
是Yu欸4 小时前
android·数据库·大模型·github·昇腾·sglang·qwen3
SGLang 推理服务基础性能评测版权声明:本文为原创,遵循 CC 4.0 BY-SA 协议。转载请注明出处。SGLang 推理服务基础性能评测
guslegend5 小时前
人工智能·大模型·rag
第17节:模型忽略关键实体怎么办?注意力权重分配机制引导生成拒绝重点RAG与Agent性能调优:17.模型忽略关键实体怎么办?注意力权重分配机制引导生成拒绝重点Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
Thanks_ks5 小时前
自动化测试·大模型·llm·研发效能·模型微调·rag·提示词工程
从辅助编码到架构重塑:基于 LLM 的智能开发工作流落地实战在人工智能技术爆发的时代,AI 工具、大模型及行业应用正深刻改变开发者的工作模式与各领域的发展格局。从早期的单行代码补全,到如今的复杂逻辑推演、自动化测试生成,再到基于大模型的垂直行业解决方案,AI 已经不再仅仅是一个 “高级玩具”,而是正切实成为提升研发效能、驱动业务创新的核心引擎。
Luca_kill6 小时前
大模型·moe·deepseek·ai架构·v4·混合注意力·流形约束
深度拆解 DeepSeek V4:混合注意力 + 流形约束超连接如何重塑万亿 MoE 架构2026 年 4 月 24 日,DeepSeek V4 预览版正式发布,同步开源了 V4-Pro(总参数 1.6 万亿,激活 490 亿)和 V4-Flash(总参数 2840 亿,激活 130 亿)两个版本。这组数据本身已经足够震撼,但更让技术圈沸腾的是它交出的成绩单:
CoderJia程序员甲7 小时前
ai·大模型·llm·github
GitHub 热榜项目 - 日榜(2026-04-27)生成于:2026-04-27共发现热门项目: 13 个榜单类型:日榜Token赞助:siliconflow
龙侠九重天7 小时前
人工智能·ai·大模型·llm·agent·多智能体·multi-agent
什么是多 Agent 系统?——从单体 AI 到群体智能过去几年,AI 助手已经从实验室走向千家万户。从智能客服到代码辅助工具,从文档生成到数据分析,AI 正在重塑软件开发和业务运营的方方面面。ChatGPT、Claude、Cursor 等工具让开发者能够用自然语言描述需求,AI 随即生成代码、撰写文档、解释技术概念。
New_Horizons6661 天前
大模型·claude code
Claude Code的安装和使用(Win10)整体是 TypeScript + Node.js 项目,采用模块化架构,你可以把它理解为:大脑(agent) + 工具链(tools) + 界面(ui) + 共享逻辑(shared)。
GPUStack1 天前
大模型·ascend·模型推理·deepseek·gpustack
Day 0 部署:昇腾 910B DeepSeek-V4 部署指南与压测表现随着 DeepSeek 正式发布 DeepSeek-V4 系列,大模型的工程边界再次被明显推高。该系列基于 MoE 架构,提供了 DeepSeek-V4-Flash 284B 和 DeepSeek-V4-Pro 1.6T 两种规格,同时在推理阶段仅激活数十亿参数,在性能与成本之间取得了新的平衡。配合百万级上下文窗口与全新的注意力优化机制,其在长文本理解、复杂推理以及智能体任务中的表现,已经开始逼近甚至挑战当前主流闭源模型。
庄小焱1 天前
大模型·rag·ai模型·模型结果格式化
【AI模型】——RAG格式集成本文系统介绍了大语言模型格式化生成技术,涵盖Output Parsers、LlamaIndex结构化输出、提示工程技巧及Function Calling等核心方法,并对比了提示词约束、JSON模式、控制生成等RAG场景下的格式优化实现路径。
AVA洋1 天前
人工智能·python·大模型
初识Coze(扣子)工作流,ai视频自动化制作Coze 工作流是字节跳动 Coze 平台的可视化、低代码 AI 流程编排工具,核心是用拖拽节点的方式,把大模型、插件、代码、判断逻辑等能力串成完整任务链,快速做复杂 AI 应用Coze Plus。
翔云1234561 天前
ai·大模型
claude-context 本地部署方案(全程离线/内网可用,无任何云端依赖:本地向量库、本地嵌入模型、本地MCP、本地运行的 Claude-Code 客户端)
庄小焱1 天前
人工智能·大模型·知识图谱·rag·ai模型·ai系统
【AI模型】——基于知识图谱的RAG本文系统介绍了GraphRAG(基于知识图谱的检索增强生成)技术,从传统RAG的局限性出发,阐述了知识图谱赋能RAG的核心优势与范式革新,涵盖GraphRAG的三阶段架构、方法论分类,以及Microsoft GraphRAG、LightRAG等前沿框架,并讨论了性能评估指标、生产部署挑战与选型建议。
zhayujie1 天前
ai·大模型·agent·deepseek-v4
DeepSeek V4模型的Agent能力实测DeepSeek V4 系列发布之后,关于它能不能用、好不好用的讨论很多,但大部分评测还停留在普通对话或编码上。CowAgent 作为一个中立的 Agent 框架,则更关心模型在 Agent 链路中的真实表现,包括工具调用、长上下文、长期记忆、浏览器自动化、知识组织,本文用这 6 个真实场景在 CowAgent 中对 DeepSeek V4 模型做了全面测试。
一几文1 天前
人工智能·机器学习·ai·大模型·算力·碳基·硅基
什么是硅基时间?什么是碳基时间?为何两者总是同时被提起?这两个概念之所以经常被放在一起讨论,是因为它们代表了两种截然不同的生命形态和存在方式。简单来说,“碳基时间”是生物的、感性的、受生理节律限制的;而“硅基时间”则是数字的、理性的、连续且极速的。
guslegend1 天前
人工智能·大模型·rag
第16节:如何科学调节切片长度与滑动窗口,结合倒排索引与向量锁引对比优化RAG与Agent性能调优:16.如何科学调节切片长度与滑动窗口,结合倒排索引与向量锁引对比优化Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
AI原来如此2 天前
人工智能·ai·大模型·编程
AI 编程助手常见问题 10 问 10 答很多人觉得AI编程助手是程序员专属工具,普通人根本用不上,其实完全错了。现在的AI已经能帮普通人搞定80%的轻量代码需求:Excel宏、简单爬虫、自动化小工具都不在话下。本文整理了大家用AI写代码时最常遇到的10个问题,从工具选择、prompt写法到避坑技巧全覆盖,看完就能上手。【问答篇第107期】
Captain_Data2 天前
人工智能·python·ai·大模型·芯片设计·risc-v
AI 12小时设计CPU完整解析:从219字到RISC-V内核的技术突破2026年4月,AI芯片设计初创公司Verkor.io发布了一项震动行业的研究成果:其AI智能体系统Design Conductor,仅凭一份219字的需求文档,在12小时内自主完成了一款RISC-V CPU核心的全流程设计。
前端摸鱼匠2 天前
人工智能·ai·面试·大模型·求职招聘
【AI大模型春招面试题27】字节对编码(BPE)的分词过程?如何处理未登录词(OOV)?你好!咱们直接切入正题。这道题在 LLM 相关的面试中属于**“必考基础,但能分出深浅”**的题目。很多候选人只会背“BPE 是合并高频字符对”,但一旦问到**“具体怎么算的?”或者“遇到训练集里完全没有的生僻字怎么办?”**就容易卡壳。