技术栈
大模型
DogDaoDao
10 小时前
人工智能
·
深度学习
·
开源
·
大模型
·
ai agent
·
智能体
·
openhuman
【AI Agent 深度解析】OpenHuman 开源项目全面分析 — 打造你的个人 AI 超级智能助手
在 AI Agent(智能代理)快速发展的今天,我们面临着一个核心问题:大多数 AI 助手需要从零开始学习用户,需要花费数天甚至数周才能真正了解你的技术栈和工作流。
龙骑士baby
10 小时前
深度学习
·
ai
·
大模型
·
llm
·
ai生态
重建 AI 认知第 1 篇:基础认知——一张地图看懂 AI Landscape
先解决一个最基础、但也最容易混淆的问题:AI、ML、DL、GenAI、AGI,它们到底是什么关系?很多人以为它们是并列的,或者是一个路线上的几个阶段。其实不是,它们是套娃结构:
牧子川
11 小时前
大模型
·
格式化输出
016-Structured-Output-Practical
💡 摘要:结合 Pydantic 数据验证、JSON 格式控制和函数调用,掌握 with_structured_output() 高级 API 和手动 Chain 构建两种方案,构建可靠的 AI 结构化输出系统。
龙侠九重天
12 小时前
人工智能
·
深度学习
·
数据挖掘
·
大模型
·
llm
·
embedding
·
聚类
Embedding 模型深度使用——语义搜索与聚类
Embedding(嵌入)是一种将离散、高维的符号数据映射到连续、低维向量空间的技术。在自然语言处理领域,Embedding 将文字、句子或文档转换为数值向量,使得语义相近的内容在向量空间中拥有相似的位置关系。
AndrewHZ
13 小时前
人工智能
·
深度学习
·
大模型
·
openai
·
claude
·
gemini
·
deepseek
【大模型通关指南】3. 全球主流大模型全栈对比(含Google I/O最新Gemini,2026.05.20)
截至 2026年5月20日(Google I/O 当日),全球大模型已从“闭源三强垄断”演进为国际闭源旗舰 + 国产开源/闭源双强 + 欧美开源生力军的多极格局。 本文基于官方技术文档、SWE-bench、Terminal Bench、GPQA、MMLU等权威实测数据,覆盖 GPT、Claude、Gemini、DeepSeek、Minimax、GLM、Qwen、Kimi、Mistral、Grok、豆包、文心、星火、混元 等15+主流模型,从架构、上下文、推理速度、编码、推理、多模态、成本、私有化八大维度做
魔乐社区
13 小时前
人工智能
·
开源
·
大模型
基于昇腾 MindSpeed LLM 玩转 DeepSeek-V4-Flash
MindSpeed LLM作为昇腾AI生态的重要技术支撑,专为大规模语言模型设计,具有超强的计算能力和灵活的开发支持。MindSpeed LLM实现了DeepSeekV4-Flash模型的定长数据场景下的预训练支持,并同步开放源代码。本文给各位开发者提供预训练的复现部署参考,帮助大家快速上手。MindSpeed LLM快速部署与应用教程已上线魔乐社区,欢迎开发者体验!
Terrence Shen
14 小时前
人工智能
·
大模型
·
agent
·
rag
·
智能体
·
大模型技术
Agent面试八股文(系列之三)
面向:大模型应用开发、RAG 工程师、Agent 工程师、AI 平台岗位 核心目标:把 RAG 从“向量库 demo”讲到“企业级知识系统”
绵满
1 天前
大模型
·
推荐系统
"Sample Is Feature: Beyond Item-Level, Toward Sample-Level Tokens for Unified Large Recommender Models" 论文笔记
美团精排 Scaling 的工作 SIF,目前挂在 Arxiv 26.04 上,提出了将历史序列 token 从 item-level 升级到 sample-level 的新思路,实现了更强的信息利用和模型效果
山屿落星辰
1 天前
大模型
昇腾NPU上的FlashAttention:让大模型“算得快“又“记得准“
刚接触 FlashAttention 那会,我被一个困惑砸懵了:明明 Attention 机制的计算量已经是 O(n²) 了,业界还在拼命优化它,图什么?
AI绘画哇哒哒
1 天前
人工智能
·
学习
·
ai
·
程序员
·
大模型
·
产品经理
·
转行
Agent三种思考模式深度解析:CoT/ReAct/Plan-and-Execute,小白程序员必看,助你轻松掌握大模型精髓(收藏版)
同一个任务交给三个Agent,结果可能完全不同——不是因为它们"知道的"不一样,而是"想问题的方式"不一样。这篇用一个出差准备的真实场景,带你看懂CoT、ReAct、Plan-and-Execute三种主流思考模式的本质区别。
海的辽阔
1 天前
macos
·
大模型
·
ecomgpt
如何在MAC下安装EcomGpt模型
如果安装过了就可以跳过,没有需要进行安装这边也可以去python官网进行下载安装包下载如果使用上述命令安装出现卡顿Auto-updating Homebrew,则可能是homebrew在更新,执行先禁止更新
赢乐
1 天前
langchain
·
大模型
·
agent
·
function_call
·
工具(tools)
·
tool装饰器
·
定义工具
AI大模型学习笔记:LangChain核心组件-工具(Tools)
LangChain 的 工具(Tools) 是其核心组件之一,用于扩展大语言模型(LLM)的能力,使其能够与外部系统、API 或自定义函数交互,从而完成仅靠文本生成无法实现的任务,如查询天气、执行计算、搜索数据库等。
前端小超人rui
2 天前
人工智能
·
大模型
·
prompt
Prompt 提示词原理/组成/编写原则/编写技巧
一个有效的Prompt 可以:
哥本哈士奇(aspnetx)
2 天前
大模型
LangChain DeepAgents 学习笔记
LangChain的DeepAgents已经发布有段时间了,最近的几个版本基本覆盖了大多数智能体都应该有的功能。本笔记基于 LangChain 的 DeepAgents 框架,演示如何构建了一个具有角色扮演能力的 AI 助手,并集成了自定义技能系统。以此方便后续的knowledge review以及vibe coding的reference。
Mr.朱鹏
2 天前
python
·
gpt
·
langchain
·
大模型
·
llm
·
rag
9-检索增强生成RAG详解
**RAG (Retrieval-Augmented Generation,检索增强生成) **是目前大模型应用的核心技术。
Soari
2 天前
开源
·
大模型
·
webrtc
·
实时音视频
·
voiceagent
·
语音智能体
·
dograh
挑战 100ms 延迟极限:深度拆解 dograh,构建企业级开源 WebRTC 实时语音智能体平台
发布日期: 2026-05-18标签: #VoiceAgent #WebRTC #语音智能体 #dograh #大模型 #实时音视频
AI玫瑰助手
2 天前
pdf
·
大模型
·
知识库
·
表格
·
md
·
文字识别
·
paddleocr
PDF 转 Markdown 主力方案怎么选:PaddleOCR-VL-1.5、MinerU、HunyuanOCR 与 MonkeyOCR 实测对比
本文对比了四种主流PDF转Markdown工具(PaddleOCR-VL-1.5、MinerU、HunyuanOCR和MonkeyOCR)的性能表现。测试基于OmniDocBench和MDPBench数据集,评估维度包括文本块识别、阅读顺序、表格和公式处理等结构化要素。结果显示PaddleOCR-VL-1.5综合表现最优,在两个数据集上都保持稳定性能,特别在表格和公式处理方面表现突出。HunyuanOCR在复杂文档解析上单集表现优异但部署门槛高,MinerU工程系统能力强但分数略低,MonkeyOCR轻量
AI原来如此
2 天前
学习
·
ai
·
大模型
·
ai编程
[特殊字符]2026AI Agent入门学习路径
⚡效率篇 | 本文面向普通职场人、学生、想转AI方向的开发者,结合2026年最新行业趋势和工具生态,给出分人群的适配学习路径,还有可直接复制的7天实操步骤,不用啃复杂技术原理,普通人也能快速用AI Agent提升工作效率,抓住2026年AI Agent落地的第一波红利。
魔乐社区
2 天前
人工智能
·
开源
·
大模型
小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区,基于昇腾的部署教程来了
继一周前Qwen3.6-35B-A3B模型开源发布后,千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型,也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式,在智能体编程方面达到了旗舰级表现,全面超越前代开源旗舰 Qwen3.5-397B-A17B(总参数397B / 激活参数17B的MoE模型)。作为稠密架构,它无需MoE路由即可部署,是开发者在实用、可广泛部署规模上获取顶尖编程能力的理想选择。
damo王
3 天前
大模型
·
agent
·
token
·
向量模型
·
open claw
·
coding plan
·
agent plan
极简Agent plan指南
在使用agent时,既需要推理模型让它思考,也需要VLM模型生成图片,更想有视频模型直接生成视频,还想要向量模型做向量数据库,还得让它写代码。