技术栈
大模型
牧子川
22 分钟前
大模型
·
tools
·
functioncalling
016-Function-Calling
💡 摘要:通过工具注册、模型决策、工具执行和结果整合四步流程,让大语言模型能够调用外部工具,突破知识限制,实现实时数据查询和业务系统集成。
这是谁的博客?
2 小时前
ai
·
大模型
·
kimi
·
长上下文
·
月之暗面
·
国产ai
[模型解析] Kimi: 模型架构与长上下文能力分析
Kimi 是月之暗面开发的大语言模型,以其超长上下文处理能力著称。本文将分析 Kimi 的技术架构与核心能力。
这是谁的博客?
2 小时前
gpt
·
ai
·
chatgpt
·
大模型
·
gpt-3
·
openai
[模型解析] GPT: 模型演进分析从GPT-3到GPT-5.5
OpenAI 的 GPT 系列模型在过去几年经历了快速演进,从 2020 年的 GPT-3 到 2026 年的 GPT-5.5,每一次迭代都带来了显著的能力提升和架构创新。本文将系统分析 GPT 模型的演进路径与技术特点。
养肥胖虎
3 小时前
大模型
·
llm
·
学习路线
完整学习LLM(一):为什么我要系统学习大模型
好家伙,最近这几天一直在写 RAG.从"让大模型先查资料再回答",写到"微调和 RAG 的区别",又写到"为什么攻击力大于 50 这种问题不能只靠 RAG".
这是谁的博客?
3 小时前
ai
·
架构
·
大模型
·
moe
·
开源模型
·
deepseek
·
国产ai
[模型解析] DeepSeek: 技术创新与架构解析
DeepSeek 作为国产大模型的代表,在开源领域取得了显著突破。本文将深入分析 DeepSeek 的技术创新与架构设计。
这是谁的博客?
3 小时前
ai
·
google
·
架构
·
大模型
·
多模态
·
视频生成
·
gemini
[模型解析] Gemini: 多模态技术架构深度解析
Google 在 2026 年 I/O 大会上发布了 Gemini 3.5 和 Gemini Omni,标志着多模态 AI 进入全新的发展阶段。本文将从技术架构角度深入解析 Gemini 的多模态能力设计。
程序猿编码
4 小时前
linux
·
python
·
ai
·
大模型
大模型的“文字障眼法“:FlipAttack 文本反转越狱技术全解析
想象一下,有个调皮的小孩想带进游乐园一个违禁品。安检人员耳朵很尖,一听到"炸弹""刀具"这些词就会拦人。于是小孩想了个办法——把话说反。
DogDaoDao
1 天前
人工智能
·
深度学习
·
开源
·
大模型
·
ai agent
·
智能体
·
openhuman
【AI Agent 深度解析】OpenHuman 开源项目全面分析 — 打造你的个人 AI 超级智能助手
在 AI Agent(智能代理)快速发展的今天,我们面临着一个核心问题:大多数 AI 助手需要从零开始学习用户,需要花费数天甚至数周才能真正了解你的技术栈和工作流。
龙骑士baby
1 天前
深度学习
·
ai
·
大模型
·
llm
·
ai生态
重建 AI 认知第 1 篇:基础认知——一张地图看懂 AI Landscape
先解决一个最基础、但也最容易混淆的问题:AI、ML、DL、GenAI、AGI,它们到底是什么关系?很多人以为它们是并列的,或者是一个路线上的几个阶段。其实不是,它们是套娃结构:
牧子川
1 天前
大模型
·
格式化输出
016-Structured-Output-Practical
💡 摘要:结合 Pydantic 数据验证、JSON 格式控制和函数调用,掌握 with_structured_output() 高级 API 和手动 Chain 构建两种方案,构建可靠的 AI 结构化输出系统。
龙侠九重天
1 天前
人工智能
·
深度学习
·
数据挖掘
·
大模型
·
llm
·
embedding
·
聚类
Embedding 模型深度使用——语义搜索与聚类
Embedding(嵌入)是一种将离散、高维的符号数据映射到连续、低维向量空间的技术。在自然语言处理领域,Embedding 将文字、句子或文档转换为数值向量,使得语义相近的内容在向量空间中拥有相似的位置关系。
AndrewHZ
1 天前
人工智能
·
深度学习
·
大模型
·
openai
·
claude
·
gemini
·
deepseek
【大模型通关指南】3. 全球主流大模型全栈对比(含Google I/O最新Gemini,2026.05.20)
截至 2026年5月20日(Google I/O 当日),全球大模型已从“闭源三强垄断”演进为国际闭源旗舰 + 国产开源/闭源双强 + 欧美开源生力军的多极格局。 本文基于官方技术文档、SWE-bench、Terminal Bench、GPQA、MMLU等权威实测数据,覆盖 GPT、Claude、Gemini、DeepSeek、Minimax、GLM、Qwen、Kimi、Mistral、Grok、豆包、文心、星火、混元 等15+主流模型,从架构、上下文、推理速度、编码、推理、多模态、成本、私有化八大维度做
魔乐社区
1 天前
人工智能
·
开源
·
大模型
基于昇腾 MindSpeed LLM 玩转 DeepSeek-V4-Flash
MindSpeed LLM作为昇腾AI生态的重要技术支撑,专为大规模语言模型设计,具有超强的计算能力和灵活的开发支持。MindSpeed LLM实现了DeepSeekV4-Flash模型的定长数据场景下的预训练支持,并同步开放源代码。本文给各位开发者提供预训练的复现部署参考,帮助大家快速上手。MindSpeed LLM快速部署与应用教程已上线魔乐社区,欢迎开发者体验!
Terrence Shen
1 天前
人工智能
·
大模型
·
agent
·
rag
·
智能体
·
大模型技术
Agent面试八股文(系列之三)
面向:大模型应用开发、RAG 工程师、Agent 工程师、AI 平台岗位 核心目标:把 RAG 从“向量库 demo”讲到“企业级知识系统”
绵满
2 天前
大模型
·
推荐系统
"Sample Is Feature: Beyond Item-Level, Toward Sample-Level Tokens for Unified Large Recommender Models" 论文笔记
美团精排 Scaling 的工作 SIF,目前挂在 Arxiv 26.04 上,提出了将历史序列 token 从 item-level 升级到 sample-level 的新思路,实现了更强的信息利用和模型效果
山屿落星辰
2 天前
大模型
昇腾NPU上的FlashAttention:让大模型“算得快“又“记得准“
刚接触 FlashAttention 那会,我被一个困惑砸懵了:明明 Attention 机制的计算量已经是 O(n²) 了,业界还在拼命优化它,图什么?
AI绘画哇哒哒
2 天前
人工智能
·
学习
·
ai
·
程序员
·
大模型
·
产品经理
·
转行
Agent三种思考模式深度解析:CoT/ReAct/Plan-and-Execute,小白程序员必看,助你轻松掌握大模型精髓(收藏版)
同一个任务交给三个Agent,结果可能完全不同——不是因为它们"知道的"不一样,而是"想问题的方式"不一样。这篇用一个出差准备的真实场景,带你看懂CoT、ReAct、Plan-and-Execute三种主流思考模式的本质区别。
海的辽阔
2 天前
macos
·
大模型
·
ecomgpt
如何在MAC下安装EcomGpt模型
如果安装过了就可以跳过,没有需要进行安装这边也可以去python官网进行下载安装包下载如果使用上述命令安装出现卡顿Auto-updating Homebrew,则可能是homebrew在更新,执行先禁止更新
赢乐
2 天前
langchain
·
大模型
·
agent
·
function_call
·
工具(tools)
·
tool装饰器
·
定义工具
AI大模型学习笔记:LangChain核心组件-工具(Tools)
LangChain 的 工具(Tools) 是其核心组件之一,用于扩展大语言模型(LLM)的能力,使其能够与外部系统、API 或自定义函数交互,从而完成仅靠文本生成无法实现的任务,如查询天气、执行计算、搜索数据库等。
前端小超人rui
3 天前
人工智能
·
大模型
·
prompt
Prompt 提示词原理/组成/编写原则/编写技巧
一个有效的Prompt 可以: