技术栈
语言模型
Timer@
10 小时前
人工智能
·
语言模型
·
langchain
·
前端框架
LangChain 教程 01|概述:AI 应用开发的新范式
📖 本篇导读:这是 LangChain 系列教程的第 1 篇。如果你是 AI 开发新手,想快速了解 LangChain 能做什么、为什么选择它,这篇文章就是为你准备的。读完预计需要 5 分钟。
懒麻蛇
10 小时前
人工智能
·
语言模型
·
自然语言处理
用大语言模型生成心理学范式 2.0
去年写过一篇“用大语言模型生成心理学范式”,当时的生成思路更像是找一个和目标任务逻辑相近的范式,在原有结构上修改和调整。对于一些结构相似的任务,比如基于flanker生成ANT,这样确实可以生成出可运行的任务,但问题也很明显。
AI产品备案
11 小时前
人工智能
·
语言模型
·
自然语言处理
生成式人工智能(大语言模型)上线备案表【模版分享+填报指南】
《生成式人工智能(大语言模型)上线备案表》是大模型上线备案的核心基础档案,核心围绕主体合规、技术真实、服务安全、评估达标四大原则设计。以下是表格核心模块、填写要点与合规要求。
龙腾AI白云
11 小时前
人工智能
·
语言模型
·
自然语言处理
·
tornado
如何利用大语言模型的能力进行实体关系抽取
如何利用大语言模型的能力进行实体关系抽取一、 任务定义:什么是实体关系抽取? 二、 LLM 赋能关系抽取的三大核心策略 三、 典型方法分类 四、 提升效果的关键实践要点 五、 局限性与应对策略 六、 典型应用场景
有为少年
14 小时前
人工智能
·
语言模型
·
自然语言处理
ArXiv 2603 | 用神经元胞自动机训练语言模型:合成数据能超越自然语言吗?
论文:Training Language Models via Neural Cellular Automata 作者:Dan Lee, Seungwook Han, Akarsh Kumar, Pulkit Agrawal(MIT · Improbable AI Lab) 链接:arXiv:2603.10055 · 代码
韭菜盖饭
14 小时前
语言模型
·
自然语言处理
·
面试
·
transformer
大模型常见八股集合(带答案)
整理一些常见八股问题,用于面试复习。因为 点积的数值会随着向量维度 (d_k) 增大而变大,如果不除以 d k \sqrt{d_k} dk ,softmax 很容易进入“过于尖锐”的区域,导致训练不稳定、梯度变小。
人工智能培训
15 小时前
大数据
·
人工智能
·
深度学习
·
语言模型
·
自然语言处理
·
大模型
·
数字孪生
如何利用大语言模型的能力进行实体关系抽取
#实体关系抽取#大语言模型#提示工程#微调#
大写的z先生
15 小时前
深度学习
·
语言模型
【深度学习 | 论文精读】MMTC:融合社交网络特征与图文信息的多模态虚假新闻检测
在生成式 AI(GAI)爆炸的今天,虚假新闻已经从“五毛特效”进化到了“工业级水准”。内容造假:AI 换脸、Stable Diffusion 绘图,让图文匹配度达到巅峰。
jinanwuhuaguo
16 小时前
运维
·
人工智能
·
语言模型
·
自然语言处理
·
visual studio code
·
openclaw
OpenClaw v2026.3.22-beta.1 深度技术分析报告:从单智能体操作系统到多智能体协作平台的范式跃迁
报告版本: 1.0分析基准: v2026.3.13 (稳定版) -> v2026.3.22-beta.1 (预发布版)
啥都鼓捣的小yao
16 小时前
人工智能
·
语言模型
·
prompt
What is Prompt Engineering —— 提示词工程是什么?
本文基于Google 官方《Prompt Engineering》白皮书拆解,深入解析提示工程的底层数学原理、核心采样算法、进阶推理范式、代码工程化落地体系与工业级最佳实践。
前进的李工
16 小时前
开发语言
·
人工智能
·
语言模型
·
langchain
·
agent
LangChain使用之Model IO(提示词模版之FewShotPromptTemplate)
在构建提示词时,可以通过少量样本示例来进一步格式化,在一些情况下可以显著提高模型的性能。少量示例提示模版由一组示例或一个负责从定义的集合中选择一部分示例的示例选择器构建。
小柒77777
17 小时前
人工智能
·
深度学习
·
语言模型
PEFT(Parameter-Efficient Fine-Tuning)---LoRa方法
1.四种范式提示:如何更好的和大语言模型对话peft涉及对模型参数的改变和学习:如何得到更好的大语言模型
心前阳光
17 小时前
unity
·
语言模型
Unity使用豆包语言模型
使用日期:2026.3.23 OS:Windows10 引擎:Unity2021.3.45RequestChat类设置使用的语言模型以及问题列表。 Message类中设置提问角色以及问题。 使用UnityWebRequest发送请求,接收响应信息。 使用过程中响应时间比较漫长,大概30秒收到响应。
小龙报
17 小时前
人工智能
·
深度学习
·
机器学习
·
语言模型
·
自然语言处理
·
github
·
aigc
【Coze-AI智能体平台】解锁 Coze 工作流:逻辑控制・数据处理・AIGC 多媒体全场景实战
🔥小龙报:个人主页 🎬作者简介:C++研发,嵌入式,机器人方向学习者 ❄️个人专栏:《coze智能体开发平台》 ✨ 永远相信美好的事情即将发生
jbb0523
18 小时前
语言模型
国内三家大模型修图能力对比
因为工作需要,想找一个UART数据帧的图片做PPT用,于是就在网上搜了一下,最后感觉下面这张图最合适:
小超同学你好
1 天前
人工智能
·
语言模型
·
langchain
Langgraph 18. Skill 四种形态 —— Inline / File-based / External / Meta(含代码示例)
摘要:本文介绍 Agent Skills 的四种形态——Inline(内联)、File-based(文件型)、External(外部型)、Meta(元技能),帮助架构师根据场景选择合适形态、实现可复用技能库。案例介绍:配套 demo 实现一个「技能工厂」智能体,具备四类能力——(1) Inline 形态的快速格式化规则;(2) File-based 形态的博客写作与 SEO 技能;(3) External 形态的社区研究技能(模拟从 awesome-claude-skills 拉取);(4) Meta 形
Tadas-Gao
1 天前
人工智能
·
语言模型
·
自然语言处理
·
架构
·
大模型
·
llm
·
transformer
Mem0分层记忆系统:大语言模型长期记忆的架构革命与实现范式
当前的主流大语言模型(如GPT系列、LLaMA等)虽然在单轮对话中表现出色,但在处理多轮、长程对话任务时,面临严重的记忆衰减和上下文长度限制问题。传统的做法是将整个对话历史作为上下文输入,但这会带来几个关键问题:
吴佳浩 Alben
1 天前
运维
·
人工智能
·
pytorch
·
语言模型
·
transformer
·
vllm
GPU 生产环境实践:硬件拓扑、显存管理与完整运维体系
本篇是系列第三篇。前两篇解决了 GPU 编号的问题。本篇进一步讨论生产环境中影响 GPU 性能的其他关键因素,包括硬件拓扑、PCIe 带宽、温度功耗、显存碎片化、混合精度选择,以及如何建立完整的服务启动、健康检查和日志管理运维体系。同时收录了排查过程中遇到的 chmod -r 事故,以及数据加载瓶颈的分析方法。
lifallen
1 天前
人工智能
·
语言模型
从零推导多 Agent 协作网络 (Flow Agent)
在简单的场景中,一个拥有各种工具的单体 Agent(如我们在 react.md 中推导的那样)就足够了。 但当业务变得复杂时,单体 Agent 很容易出现一些系统性问题:
KG_LLM图谱增强大模型
1 天前
人工智能
·
语言模型
·
自然语言处理
MedHELM:真实临床医疗任务大语言模型的整体评估框架
MedHELM: Holistic Evaluation of Large Language Models for Medical Tasks