技术栈
llm
小Pawn爷
26 分钟前
llm
·
llama
·
fingpt
11.大模型评估
n- gram:它是一种基于概率的模型.用来预测在一个词序列(句子)中,下一个词出现的可能性BLEU 分数 = B P ⋅ exp ( ∑ n = 1 N W n log P n ) \text{BLEU 分数}=BP\cdot\exp(\sum_{n=1}^{N}W_{n}\log P_{n}) BLEU 分数=BP⋅exp(n=1∑NWnlogPn)
人工干智能
1 小时前
llm
OpenAI中,索引取值与点取值:message.content[0].text.value
在“OpenAI”中,我们常用message.content[0].text.value之类的取值语句, 这里有 content[0](列表索引取值)和 text.value(对象属性点取值)的场景,本文仔细分析像 message.content[0].text.value 这种综合写法的底层逻辑——核心要分清「列表的索引取值([])」和「对象的属性点取值(.)」的适用场景,这也是初学者在处理 OpenAI API 返回数据时最常遇到的问题。
太空眼睛
2 小时前
spring boot
·
ai
·
llm
·
sse
·
mcp
·
mcp-client
·
streamable
【MCP】使用SpringBoot基于Streamable-HTTP构建MCP-Client
先来看看大语言模型工具调用的时序图MCP(模型上下文协议,Model Context Protocol),通常更广义地理解为基于上下文的工具使用(Context-based Tool Usage) 或 提示工程中的工具使用(Tool Use via Prompt Engineering)。它的核心原理是将工具的描述、使用说明和示例直接作为上下文(Prompt)的一部分,输入给大模型。模型不“调用”工具,而是根据其通用语言能力,“理解”并“生成”使用工具所需的指令或参数。
小霖家的混江龙
2 小时前
人工智能
·
llm
·
aigc
不再费脑, 拆解 AI 的数学工具, 诠释函数, 向量, 矩阵和神经网络的关系
大家好, 我是印刻君. 今天我们来聊一个很多 AI 爱好者容易困惑的问题, 函数, 向量, 矩阵与神经网络之间到底是什么关系?
kaizq
12 小时前
python
·
sqlite
·
llm
·
sse
·
mcp
·
cherry studio
·
fastmcp
AI-MCP-SQLite-SSE本地服务及CherryStudio便捷应用
咨询:用一个文件基于FastMcp库本地编码搭建简单MCP服务,实现本地SQLite数据库的基本访问,所有功能可以在浏览器窗口测试。在Cherry Studio可视环境做MCP部署与运行。
亚里随笔
16 小时前
人工智能
·
游戏
·
llm
·
rl
·
agentic
GenEnv:让AI智能体像人一样在_游戏_中成长
GenEnv框架通过在LLM智能体与可扩展的生成式环境模拟器之间建立难度对齐的协同进化博弈,实现了数据效率的显著提升。该框架将智能体训练视为一个两玩家课程游戏,通过动态调整任务难度来最大化学习信号,使7B参数模型在多个基准测试中性能提升高达40.3%。
彼岸花开了吗
18 小时前
人工智能
·
python
·
llm
构建AI智能体:八十、SVD知识整理与降维:从数据混沌到语义秩序的智能转换
信息时代,每天都面临着爆炸式的数据增长,以文本数据为例,一个中等规模的文档集合可能涉及数千个不同的词语,每个文档都可以表示为一个高维向量。这种"词袋"表示方法虽然直观,却存在着严重的维度灾难问题。
栀秋666
19 小时前
react.js
·
llm
·
ollama
智能驱动的 Git 提交:基于 Ollama 大模型的规范化提交信息生成方案
摘要 在现代软件开发中,清晰、规范的 Git 提交信息不仅是版本控制的核心组成部分,更是团队协作、代码审查、项目复盘和自动化流程的重要依据。然而,传统手动编写提交信息的方式存在效率低、格式不统一、语义模糊等问题,尤其对新手开发者而言,掌握如 Angular 规范等标准格式门槛较高。
AI架构师易筋
1 天前
开发语言
·
人工智能
·
llm
·
aiops
·
rag
AIOps 告警归因中的提示工程:从能用到可上生产(4 阶梯)
适用对象:做生产运维 / SRE / 平台工程 / ITSM 流程治理的团队,想把 LLM 用在 告警归因(Root Cause Analysis, RCA) 上,并且做到“可控、可复用、可评测”。
小小宫城狮
1 天前
算法
·
llm
BPE 算法原理与训练实现
BPE 的核心思想是从基础词汇单元(字符 / 字节)出发,反复迭代地合并出现频率最高的相邻字符对(字节对),将其作为新的子词单元,直到达到预设的词汇表大小或没有可合并的字符对为止。
且去填词
1 天前
人工智能
·
自动化
·
llm
·
ast
·
agent
·
策略模式
·
deepseek
DeepSeek :基于 AST 与 AI 的遗留系统“手术刀”式治理方案
在软件工程中,最令人头秃的不是写新代码,而是维护**“遗留系统” (Legacy System)。那些长达 2000 行的 utils.py,那些嵌套了 10 层 if-else 的“上帝函数”,就像一颗颗定时炸弹。
且去填词
1 天前
运维
·
人工智能
·
python
·
自动化
·
llm
·
deepseek
·
deepeval
构建基于 DeepEval 的 LLM 自动化评估流水线
在 AI 开发圈子里,有一种很危险的现象叫 “Vibe-based Development”(凭感觉开发)。
CoderJia程序员甲
2 天前
开源
·
大模型
·
llm
·
github
·
ai教程
GitHub 热榜项目 - 日榜(2026-1-9)
生成于:2026-1-9共发现热门项目: 15 个榜单类型:日榜本期GitHub热榜显示AI智能体开发工具全面爆发,Claude Code终端助手和Chrome DevTools MCP等工具通过自然语言命令显著提升编码效率。项目热点集中在为AI智能体构建长效记忆层,如memvid和claude-mem用精简架构替代复杂RAG管道,实现会话上下文持久化。同时VideoRAG和MiroThinker推动多模态搜索智能体发展,强化视频理解和深研能力。趋势表明开发者正着力解决智能体实践中的记忆瓶颈和工具集成难题
树獭非懒
2 天前
llm
·
aigc
·
ai编程
AI大模型小白手册|如何像工程师一样写Prompt?
从“人工智障”到“全能助手”,你可能只差这一步你是不是也有过这样的经历:满怀期待地向ChatGPT或DeepSeek提问:“帮我写个Python函数吧!”
视觉&物联智能
2 天前
ai
·
llm
·
agent
·
智能体
·
人工 智能
【杂谈】-多智能体系统的效能悖论:协作优势的认知边界
多智能体架构的设计灵感源于人类社会分工协作机制。面对复杂问题时,工作流被拆解为若干子任务,由专业化单元并行处理后再整合输出。初期验证实验显示,在数学解题、代码生成等封闭域任务中,采用讨论协商或投票表决的多智能体方案普遍优于单模型表现。
AI架构师易筋
2 天前
人工智能
·
llm
·
多模态
·
多模态llm
多模态 LLM 与本地多模态检索 PoC:从原理到工程落地(图片 / 视频关键帧 / LaTeX 公式)
本文目标:用 4 种难度梯度递增 的方式解释什么是多模态 LLM(Multimodal LLM),并系统说明 数学公式、图片、视频 在真实工程中如何被 存储、查询(检索)、创造(生成)。随后给出一套 本地可跑的多模态检索 PoC(FAISS + SQLite + OpenCLIP),包含 数据结构、向量库选型、索引参数、评估指标(Recall@K、nDCG、latency),以及可直接运行的最小 Repo 结构与用法。
且去填词
3 天前
人工智能
·
python
·
语言模型
·
llm
·
agent
·
deepseek
DeepSeek API 深度解析:从流式输出、Function Calling 到构建拥有“手脚”的 AI 应用
在上一波 AI 浪潮中,我们见识了 DeepSeek-V3 和 R1 的强大。对于开发者而言,DeepSeek 最大的吸引力在于:它完全兼容 OpenAI 格式的 API,且价格仅为 GPT-4o 的几十分之一。
EdisonZhou
3 天前
llm
·
aigc
·
agent
·
.net core
MAF快速入门(11)并行工作流
大家好,我是Edison。最近我一直在跟着圣杰的《.NET+AI智能体开发进阶》课程学习MAF的开发技巧,我强烈推荐你也上车跟我一起出发!
进击的松鼠
3 天前
python
·
langchain
·
llm
LangChain 实战 | 快速搭建 Python 开发环境
uv 是一个用 Rust 编写的 极快的 Python 包管理器和项目管理器。它整合了 Python 开发者常用的多种工具到一个 CLI 中,非常像 Node.js 生态里的 npm/pnpm。
悟乙己
3 天前
机器学习
·
大模型
·
llm
·
时间序列
·
预测
使用TimeGPT进行时间序列预测案例解析
摘要:原文探讨了TimeGPT,一个为时间序列预测而设计的生成式预训练Transformer模型。文章详细介绍了其零样本推理、微调能力、API访问、外生变量支持、多序列预测等功能,并提供了使用Python进行数据准备、预测、趋势分类和不确定性量化的代码示例。