技术栈
语言模型
如此这般英俊
2 小时前
人工智能
·
python
·
ai
·
语言模型
手搓Claude Code-第二章 tool_use
第二章,shareai讲述了给agent扩展工具的流程。完整代码见 https://github.com/shareAI-lab/learn-claude-code/tree/main/s02_tool_use 我们的任务是: 1,扩展四个工具,手把手感受整个过程 2,构建沙箱,了解沙箱为什么重要。 3,感受claude code处理并发的操作
Sirius Wu
3 小时前
人工智能
·
深度学习
·
算法
·
机器学习
·
语言模型
·
架构
MoE与Fengyu-Dense_架构对比及训练方案
MOE 架构的基本思想是在传统 Transformer 模型中,将每个前馈网络(FFN)层替换为一个 MOE 层。一个 MOE 层通常由两个关键部分组成:
MartinYeung5
3 小时前
人工智能
·
学习
·
语言模型
[论文学习]大型语言模型中个人可识别资讯(PII)的机器遗忘技术:UnlearnPII 基准与 PERMU 方法的分析
Machine Unlearning of Personally Identifiable Information in LLMs (D. Parii et al., 2025, ACL/NLLP)
hixiong123
3 小时前
人工智能
·
语言模型
·
自然语言处理
C# LLamaSharp部署大语言模型实例
nuget安装 LLamaSharp、LLamaSharp.Backend.Cpu(或者Cuda版本)
LoserChaser
4 小时前
人工智能
·
语言模型
·
transformer
大语言模型基础-语言模型与 Transformer 架构
语言模型 (Language Model, LM) 是自然语言处理的核心,其根本任务是计算一个词序列(即一个句子)出现的概率。 在多智能体系统中,语言模型是智能体理解人类指令、生成回应的基础。
我爱cope
4 小时前
人工智能
·
设计模式
·
语言模型
·
职场和发展
【Agent智能体22 | 构建AI工作流的技巧-延迟、成本优化】
声明:本篇博客是以吴恩达的【Agent智能体】教程为基础,并对其中的内容做了笔记整理以及个人收获的总结。
Yuk丶
4 小时前
c++
·
人工智能
·
语言模型
·
开源
·
ue4
·
语音识别
·
游戏开发
厌倦了假AI对话?本地 LLM 语音对话 + 口型同步系统 2.0(已开源!)
系列文章:1.0 文字对话版上一篇文章介绍了如何在 UE4.27 中接入本地 LLM 实现 NPC 文字对话。本篇在此基础上,新增完整的语音链路:
我爱cope
5 小时前
人工智能
·
设计模式
·
语言模型
·
职场和发展
【Agent智能体21 | 构建AI工作流的技巧-优化组件的常用方法】
声明:本篇博客是以吴恩达的【Agent智能体】教程为基础,并对其中的内容做了笔记整理以及个人收获的总结。
xingyuzhisuan
6 小时前
人工智能
·
ai
·
语言模型
·
语音识别
多模态聚合API核心技术:如何统一处理文本、图像与语音请求
当前AI产业已从单模态推理转向多模态融合应用,文本问答、图像识别、语音转写、视觉生成等能力成为企业AI业务的基础模块。多数企业的技术架构存在模型接口碎片化问题,文本、图像、语音模型分属独立API服务,具备不同的请求协议、参数规范、数据格式、返回结构与鉴权逻辑。
子非鱼@Itfuture
16 小时前
ai
·
语言模型
·
ai编程
LM Studio 全解(定义、地址、配置、使用、功能、Ollama对比)类似Ollama的工具
LM Studio是跨平台桌面可视化本地大模型运行软件,基于llama.cpp推理内核,主打图形化零代码本地部署GGUF/MLX格式大模型,无需命令行即可完成模型下载、加载对话、本地API服务、简易RAG文档问答,个人免费商用,面向新手、本地AI爱好者快速落地端侧LLM。
清辞853
20 小时前
大数据
·
人工智能
·
深度学习
·
学习
·
语言模型
入门大模型工程师第十课----学习总结
通过前面课程的学习,你已经从认识大模型开始,一步步知道怎么把任务讲清楚,怎么给 AI 补资料,怎么让 Agent 读文件、用工具、沉淀 Skill,也知道复杂任务做完后还要核对结果、守住安全边界。
zhangfeng1133
20 小时前
人工智能
·
深度学习
·
安全
·
语言模型
·
gpu算力
·
芯片
那nvidia orim车载gpu tee安全飞地 和天垓 100 gpgpu的 飞地 ,大概有多大存储量 ,解密流程
前提说明:英伟达 DRIVE Orin 与天数智芯天垓100 是两类完全不同的芯片。Orin 是车载 SoC(单片集成 CPU+GPU+安全引擎),天垓100 是数据中心 PCIe GPGPU 加速卡(需配合外部 CPU 使用)。两者的安全架构无法直接套用同一模板,必须分情况讨论。
大写-凌祁
21 小时前
人工智能
·
语言模型
·
云计算
·
腾讯云
·
agi
RS-Claw & XSkill 深度分析
现有RS Agent采用被动工具选择范式:RS-Claw的核心论点: Agent应该是工具空间中的主动探索者(active explorer),而非被动接收者。
大模型任我行
21 小时前
人工智能
·
计算机视觉
·
语言模型
·
论文笔记
蚂蚁:无师自通的视觉记忆增强
📖标题:AtlasVA: Self-Evolving Visual Skill Memory for Teacher-Free VLM Agents 🌐来源:arXiv, 2605.17933v1
Omics Pro
21 小时前
数据库
·
人工智能
·
机器学习
·
语言模型
·
自然语言处理
「自兹以往」动物肠道微生物组
动物肠道微生物组由细菌、古菌、真菌、病毒与原生生物共同构成,是宿主演化、生理稳态及生态系统稳定性的关键基础。本文综述21世纪全动物类群肠道微生物组在物种多样性、时空分布规律与生理功能方面的研究进展。高通量宏基因组技术推动本领域快速发展,但现有研究存在明显采样偏倚:研究对象多集中于家养脊椎动物与粪便样品,野生动物、无脊椎动物及非细菌类群中仍存在大量未探明的「微生物暗物质」。本文系统阐述肠道微生物介导宿主适应低氧、温度胁迫、外源毒素等极端环境的作用,以及工业化活动破坏共生菌群、加剧生物多样性衰减与动物患病风险
lifallen
1 天前
人工智能
·
ai
·
语言模型
·
ai编程
第六章 MCP:把能力接入协议化
Skill 解决的是系统内部的复用:一类任务反复出现时,系统怎样把局部经验收束成稳定协议,不再每次从工具原语重新拼装。但方法可以复用,并不等于能力已经可以迁移。能力仍然可能散落在不同宿主、不同工具栈、不同运行环境里:一个 Agent 会用,另一个 Agent 不会用;这个宿主已经接好了权限,另一个宿主还要重接一遍;同一套资源在本地能跑,换个环境又要重新适配。系统开始撞上的,不再只是“怎样复用方法”,而是“怎样复用能力接入本身”。
Jump 不二
1 天前
人工智能
·
语言模型
·
系统架构
Memory-os 7 层记忆架构深度解析:让 Hermes Agent 真正 “记住并使用“ 知识
久等啦,最近实在是有点忙,好久没更新,今天带新的干货来啦~最近在 Github 上看到一个给 Hermes-Agent 专门做的记忆升级系统 memory-os,三天648星,这个增速还是相当可观的。
龙侠九重天
1 天前
开发语言
·
人工智能
·
语言模型
·
自然语言处理
·
大模型
·
agent
·
智能体
C# 构建 AI Agent 系统 — 我的实践笔记
📝 写在前面:这是一篇学习日记+实战笔记。我最近在研究如何用 C# 和 .NET 8 从零构建一个 AI Agent 系统。整个过程踩了不少坑,也积累了很多实战经验。于是我把整个学习过程和代码实现记录下来,分享给同样对 C# AI 开发感兴趣的同学。
zhangfeng1133
1 天前
人工智能
·
深度学习
·
语言模型
·
架构
·
机器人
·
gpu算力
·
芯片
把权重写死在芯片的架构 Taalas(HC1)芯片:车载 GPU / 智能驾驶 / 机器人 / 算力卡适配总结
Taalas 不是通用GPU,是模型硬连线ASIC专用推理芯片(一芯片绑定一个固定大模型,HC1原生固化Llama3.1-8B),细分场景高度适配、全场景无法替代通用车载GPU,分三大场景拆解:
lifallen
1 天前
人工智能
·
ai
·
语言模型
·
agi
第五章 从 Tool 到 Skill:认知复用如何发生
上一章讨论的是连续性:系统怎样把一次任务里的局部结果、上下文和状态接起来,避免每一轮都从零开始。连续工作一旦真的出现,新的压力很快也会跟着出现。memory 能保存这次发生过什么,却不能自动回答下一次该怎样做。它更像库存,保存的是结果、线索和局部经验;可当同一类任务反复出现时,系统真正想复用的已经不只是某条结论,而是到达结论的方法。