大模型

GPUStack2 小时前
大模型·ascend·模型推理·deepseek·gpustack
Day 0 部署:昇腾 910B DeepSeek-V4 部署指南与压测表现随着 DeepSeek 正式发布 DeepSeek-V4 系列,大模型的工程边界再次被明显推高。该系列基于 MoE 架构,提供了 DeepSeek-V4-Flash 284B 和 DeepSeek-V4-Pro 1.6T 两种规格,同时在推理阶段仅激活数十亿参数,在性能与成本之间取得了新的平衡。配合百万级上下文窗口与全新的注意力优化机制,其在长文本理解、复杂推理以及智能体任务中的表现,已经开始逼近甚至挑战当前主流闭源模型。
庄小焱2 小时前
大模型·rag·ai模型·模型结果格式化
【AI模型】——RAG格式集成本文系统介绍了大语言模型格式化生成技术,涵盖Output Parsers、LlamaIndex结构化输出、提示工程技巧及Function Calling等核心方法,并对比了提示词约束、JSON模式、控制生成等RAG场景下的格式优化实现路径。
AVA洋3 小时前
人工智能·python·大模型
初识Coze(扣子)工作流,ai视频自动化制作Coze 工作流是字节跳动 Coze 平台的可视化、低代码 AI 流程编排工具,核心是用拖拽节点的方式,把大模型、插件、代码、判断逻辑等能力串成完整任务链,快速做复杂 AI 应用Coze Plus。
翔云1234564 小时前
ai·大模型
claude-context 本地部署方案(全程离线/内网可用,无任何云端依赖:本地向量库、本地嵌入模型、本地MCP、本地运行的 Claude-Code 客户端)
庄小焱4 小时前
人工智能·大模型·知识图谱·rag·ai模型·ai系统
【AI模型】——基于知识图谱的RAG本文系统介绍了GraphRAG(基于知识图谱的检索增强生成)技术,从传统RAG的局限性出发,阐述了知识图谱赋能RAG的核心优势与范式革新,涵盖GraphRAG的三阶段架构、方法论分类,以及Microsoft GraphRAG、LightRAG等前沿框架,并讨论了性能评估指标、生产部署挑战与选型建议。
zhayujie4 小时前
ai·大模型·agent·deepseek-v4
DeepSeek V4模型的Agent能力实测DeepSeek V4 系列发布之后,关于它能不能用、好不好用的讨论很多,但大部分评测还停留在普通对话或编码上。CowAgent 作为一个中立的 Agent 框架,则更关心模型在 Agent 链路中的真实表现,包括工具调用、长上下文、长期记忆、浏览器自动化、知识组织,本文用这 6 个真实场景在 CowAgent 中对 DeepSeek V4 模型做了全面测试。
一几文4 小时前
人工智能·机器学习·ai·大模型·算力·碳基·硅基
什么是硅基时间?什么是碳基时间?为何两者总是同时被提起?这两个概念之所以经常被放在一起讨论,是因为它们代表了两种截然不同的生命形态和存在方式。简单来说,“碳基时间”是生物的、感性的、受生理节律限制的;而“硅基时间”则是数字的、理性的、连续且极速的。
guslegend7 小时前
人工智能·大模型·rag
第16节:如何科学调节切片长度与滑动窗口,结合倒排索引与向量锁引对比优化RAG与Agent性能调优:16.如何科学调节切片长度与滑动窗口,结合倒排索引与向量锁引对比优化Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
AI原来如此17 小时前
人工智能·ai·大模型·编程
AI 编程助手常见问题 10 问 10 答很多人觉得AI编程助手是程序员专属工具,普通人根本用不上,其实完全错了。现在的AI已经能帮普通人搞定80%的轻量代码需求:Excel宏、简单爬虫、自动化小工具都不在话下。本文整理了大家用AI写代码时最常遇到的10个问题,从工具选择、prompt写法到避坑技巧全覆盖,看完就能上手。【问答篇第107期】
Captain_Data1 天前
人工智能·python·ai·大模型·芯片设计·risc-v
AI 12小时设计CPU完整解析:从219字到RISC-V内核的技术突破2026年4月,AI芯片设计初创公司Verkor.io发布了一项震动行业的研究成果:其AI智能体系统Design Conductor,仅凭一份219字的需求文档,在12小时内自主完成了一款RISC-V CPU核心的全流程设计。
前端摸鱼匠1 天前
人工智能·ai·面试·大模型·求职招聘
【AI大模型春招面试题27】字节对编码(BPE)的分词过程?如何处理未登录词(OOV)?你好!咱们直接切入正题。这道题在 LLM 相关的面试中属于**“必考基础,但能分出深浅”**的题目。很多候选人只会背“BPE 是合并高频字符对”,但一旦问到**“具体怎么算的?”或者“遇到训练集里完全没有的生僻字怎么办?”**就容易卡壳。
山顶夕景1 天前
python·大模型·llm·agent·多模态·vlm
【VLM】结合Python沙箱的以图思辨S1-VL模型【多模态推理大模型进展】基于Qwen3-VL-32B-Thinking做的面向数学、物理、化学、天文、地理、生物六大学科的科学多模态推理模型,主要特点是Python 沙箱执行图像裁剪、缩放、标注等代码,多轮迭代推理。S1-VL: Scientific Multimodal Reasoning Model with Thinking-with-Images,https://arxiv.org/pdf/2604.21409,https://huggingface.co/ScienceOne-AI,https:
龙侠九重天1 天前
ai·大模型·rag·检索增强生成
RAG 检索增强生成:原理与应用场景2022 年底,ChatGPT 的横空出世让全世界见识到了 AI 的强大能力。它能够写诗、作画、编写代码,甚至能与人类进行流畅的对话。一时间,「人工智能将改变世界」成为共识,无数开发者争相将大模型接入自己的产品。
前端摸鱼匠1 天前
人工智能·学习·算法·面试·大模型·求职招聘
【AI大模型春招面试题29】对比学习(Contrastive Learning)在大模型预训练中的应用?你好!面对“对比学习在大模型预训练中的应用”这道面试题,你不能只停留在背诵定义的层面。面试官想考察的是你对表征学习本质、大模型训练范式以及多模态对齐机制的深度理解。
CoderJia程序员甲1 天前
ai·大模型·llm·产品运营·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-25)生成于:2026-04-25共发现热门项目: 12 个榜单类型:日榜Token赞助:siliconflow
Irissgwe1 天前
人工智能·langchain·大模型·llm
LangChain之聊天模型核心能力大语言模型 (LLM) 在各种与语言相关的任务(例如文本生成、翻译、摘要、问答等)中表现出色。 现代 LLM 通常通过聊天模型接口访问,该接口将消息列表作为输入,并返回消息作为输出,而不是使 用纯文本。
故乡de云1 天前
大模型·ai编程·策略模式·claude·cursor·claude code
Cursor + Claude Code 接入 API 实战:国内稳定使用 Claude 4.7 配置全攻略官方 API 国内直连必败,本文给出 Cursor 和 Claude Code 两套完整配置方案, 图文步骤可直接照做,配置完成后无需代理,延迟稳定在 200ms 以内。
刘大猫.1 天前
人工智能·ai·大模型·谷歌·算力·无屏健身手环·fitbit air
谷歌或将推出无屏健身手环 Fitbit Air,主打 AI 数字化健康教练在智能穿戴市场竞争日益激烈的当下,谷歌似乎准备另辟蹊径。据科技媒体披露,谷歌有望在 2026 年 5 月 16 日正式发布一款名为 Fitbit Air 的无屏健身手环。这款产品定位清晰,意在挑战高端无屏追踪器品牌 Whoop,预估起售价定在 99 美元(约合人民币 676 元)。
前端摸鱼匠1 天前
人工智能·ai·面试·大模型·求职招聘
【AI大模型春招面试题26】大模型的“上下文窗口”(Context Window)是什么?长度对模型性能的影响?你好!咱们直接切入正题。这道题在现在的面试里属于“必考题”,但很多候选人只能背定义,讲不出底层原理和工程权衡。
ACCELERATOR_LLC1 天前
人工智能·深度学习·大模型·transformer·gpu
【DataWhale组队学习】DIY-LLM Task4 GPU和GPU相关的优化原文链接这一章讲GPU发展、A100、SM、Warp、Tensor Core、FlashAttention、PageAttention等等,重点是理解为什么LLM训练和推理会天然走向GPU,以及为什么那么多优化都会回到访存、并行调度和IO上。 本章的展开也很科学,先讲GPU架构与执行模型,再讲内存模型和性能优化,最后讲FlashAttention与PageAttention具体工程案例。