llm

冬奇Lab12 小时前
人工智能·llm·agent
Agent 系列(21):Harness 测试工程——45 个测试怎么设计,以及它发现了什么 bug普通业务逻辑测试覆盖"应该发生什么",Harness 测试还要覆盖"不应该发生什么":这类负向测试用业务逻辑测试框架很难自然写出来;专门的 Harness 测试套件才是第一公民。
harykali17 小时前
人工智能·llm
Hello-ROCm:Gemma4微调 #Datawhale #AMDev这一篇文章是Datawhale Hello-ROCm的课程笔记,主要记录了了Gemma4微调的过程简单来说,我们这次的目标是微调把Gemma4从一个通用模型调整(Fine-Turning)为一个可以准确识别情绪的崔志领域模型,或者更加概括的来说也可以说是通过微调让Gemma4猜得更加准确一些,具体的实现形式上我们会输入一个句子,然后预测这个句子中所包含的情绪
DigitalOcean18 小时前
llm·aigc·agent
砍掉 60% AI 推理成本:深度解构 DigitalOcean 推理路由器的 MoE 门控与智能分流机制这是刚打到你们生产 API 的一个请求:一个语法检查。答案是:没有,没问题。任何 $0.10/百万 token 档次的模型都能在一秒内正确回答。
羞儿18 小时前
llm·调试·显存·构建
llm-algo-1涵盖了 Attention 机制原理、PyTorch Profiling 性能分析、显存优化 以及 数值调试技巧。这四个模块并非孤立存在,它们共同构成了 “LLM 底层系统工程” 的基石。要从“学会知识点”进阶到“构建体系化能力”,需要将这四块内容重组为一条 “正确性 → 可观测性 → 效率上限” 的工程闭环。以下是循序渐进认知与实践框架:
AndrewHZ18 小时前
人工智能·语言模型·大模型·llm·cot·思维链·icl
【LLM技术全景】大模型能力探秘:In-Context Learning与思维链(CoT)摘要:本文是《LLM技术全景:从Token到部署》系列第七篇。为什么大模型"看几个例子就能举一反三",而无需任何参数更新?为什么只是加上"Let’s think step by step",数学推理准确率就能翻倍?本文深度解析两大神秘能力——In-Context Learning(上下文学习)与Chain-of-Thought(思维链),拆解其工作机制,探讨涌现现象背后的规律,并给出实用的Prompt工程指南。
枫子有风19 小时前
面试·职场和发展·llm·agent
LLM-Agent智能体(大厂面试常问)今年26年,如果想找开发类的工作,基本了解agent已经成为标配了。**Function Call 到底怎么实现的?MCP 解决什么问题?A2A 和 MCP 什么关系?**这些搞不清楚,面试官一深挖就原形毕露。
昵称好难啊19 小时前
人工智能·llm·agent
7.OpenClaw源码解析——可靠消息投递上节课我们主要学习了 OpenClaw 的 heartbeat 和 cron 两种异步任务机制,有如下特点:
董厂长1 天前
大数据·人工智能·驱动开发·llm
Loop Engineering:停止手动提示,开始设计自动提示的系统Boris Cherny 说:“我不再手动提示 Claude 了。我有循环在运行,它们提示 Claude 并自己弄清楚该做什么。我的工作是编写循环。”
把你拉进白名单1 天前
人工智能·llm·agent
7.OpenClaw源码解析——可靠消息投递上节课我们主要学习了 OpenClaw 的 heartbeat 和 cron 两种异步任务机制,有如下特点:
武子康1 天前
人工智能·opencv·计算机视觉·chatgpt·llm·向量化
调查研究-180 roboflow/supervision:计算机视觉工程里的“胶水层“,为什么值得关注?摘要:roboflow/supervision 不是一个训练框架,也不是新的视觉模型,而是一个面向计算机视觉应用开发的 Python 工程库。它的核心价值,是把 YOLO、SAM、Transformers、Roboflow Inference、Detectron2、MMDetection、VLM 等不同来源的模型输出,统一成 sv.Detections,再围绕这个统一对象做可视化、过滤、跟踪、区域计数、视频处理、数据集转换和指标评估。对于正在做视觉 demo、视频分析、机器人视觉、工业质检、交通统计、安防
Liigo1 天前
ai·llm·deepseek·liigo·faking
【AI对话实录】大模型自行删减原文并编造虚假URL链接翻译此文并支持中英文对照。 https://kerkour.com/async-rust-cooperative-scheduling-tokio
chenjim2 天前
llm·agent
你的 Agent 是个黑箱:eBPF 如何看见它真正在做什么沙箱防逃逸,审批防越权,但 Agent 拿到合法权限后的行为——没人看得见。 本文首发地址 h89.cn/archives/62…
Lkstar2 天前
数据库·人工智能·llm
万字长文Query改写与多路召回实战|从HyDE到RRF融合,召回率提升22%的完整方案Query 改写的本质,是在用户意图和检索系统之间搭一座桥。用户的原始 query 往往是口语化、不完整的,而检索系统需要的是结构化、语义明确的"搜索语言"。
AI语宙漫游指南2 天前
深度学习·llm
从 CV 扩散到 NLP:详解 Google DiffusionGemma 架构、推理机制与优劣最近发现个好玩的大模型 DiffusionGemma-26B-A4B-it,这个模型有什么特别的呢?可以先看下下面这张图。
程序员cxuan2 天前
ai·llm·agi
瑞幸出 CLI 了,这会是迈向 AGI 的第一步吗?昨天晚上刷到一个东西,瑞幸开放了 CLI,我第一反应是:这年头点杯咖啡也要进终端了?瑞幸出了 AI 开放平台,里面有 MCP、CLI、Skill。
智泊AI2 天前
llm
为什么现在大家都在扎堆转 Agent 流程架构师?现在做大模型相关应用,比拼的核心早就不是模型参数量多大、或是写得多精巧的提示词,真正拉开差距的关键,是你给大模型搭出来的整套运行流程好不好。
去伪存真2 天前
前端·pytorch·llm
如何将没有字幕的英文视频转换成中文视频?不管是学习还是娱乐,看视频时,难免会遇到一些没有中文字幕而自己又比较好奇讲了什么的英文视频,怎么办呢?今天教你一招,如何利用VideoLingo, 将没有字幕的英文视频转换成中文视频。先展示一下成果:
qcx232 天前
人工智能·ai·llm·agent·agi
【AI Daily 2026-06-05】 AI 方向的基础设施化,能力从模型层下沉到工具链和工作流今天 AI 工程最值得关注的是 AI 方向的基础设施化:Inverse Rubric Optimization: A testb、发布Linux 7.1内核大版本更新、andrewyng/aisuite 代表能力正在从模型层下沉到工具链和工作流。
DO_Community2 天前
运维·服务器·开源·llm·agent
百亿参数开源模型托管成本账:从按 Token 计费到单卡 GPU 服务器怎么选?对于一个百亿参数以下的模型,难点不在于能不能托管——几乎任何服务商都能提供一台能跑得动的机器;真正的挑战在于找到与你的流量模式、定制需求和预算相匹配的托管方案。大多数人的目光都集中在大模型上,这很正常:它们因为参数规模大而性能最强。但越来越多的用户发现,随着 LLM 技术的进步,较小的模型已经能很好地满足他们的需求了。
大佐不会说日语~2 天前
windows·docker·容器·llm·ollama
在 Windows 本地用 Docker 部署向量模型(bge-m3)在 CMD 里执行:检查输出中是否有 bge-m3。如果是空的或只有其他模型,请执行下一步。注意:务必盯紧日志,看到success才算成功。