gpt-3

z小猫不吃鱼9 天前
人工智能·深度学习·算法·机器学习·语言模型·自然语言处理·gpt-3
15 InstructGPT 论文精读:SFT + RLHF 如何让模型听懂指令?在前面的文章中,我们已经讲到了 GPT-1、GPT-2、GPT-3、In-Context Learning、Prompt Engineering 和 Scaling Law。
z小猫不吃鱼10 天前
人工智能·语言模型·自然语言处理·gpt-3
10 GPT-3 论文精读:Few-shot Learning 为什么会出现?在上一篇文章中,我们精读了 GPT-2。GPT-2 的核心思想是:也就是说,当一个语言模型在足够大、足够多样的网页文本上进行训练后,它可能会从自然语言中自动学到许多任务模式,并在没有下游任务微调的情况下完成部分 NLP 任务。GPT-2 已经开始展示 zero-shot 能力,但这种能力还比较初级。它更多是通过文本续写的方式,在某些任务上表现出“像是在做任务”的能力。
code_pgf12 天前
人工智能·gpt-3·bert
BERT 与 GPT-3 模型结构及语言理解/生成能力对比BERT 的核心定位是“读懂文本”:采用双向 Transformer Encoder,通过同时查看目标词左右两侧上下文,学习适合分类、匹配、信息抽取和阅读理解的语义表示。
迁旭16 天前
前端·javascript·chrome·机器学习·语言模型·gpt-3
Claude Code 项目 /init 命令详解本文档详细讲解 Claude Code 项目中 /init 命令的源码实现、执行流程、生成文件的层级体系及相关机制。
迁旭16 天前
前端·javascript·人工智能·react.js·机器学习·gpt-3·文心一言
Claude Code /status 功能技术文档本文档详细讲解 Claude Code 项目中 /status 命令的实现方式、功能细节和相关设计决策。
这是谁的博客?18 天前
gpt·ai·chatgpt·大模型·gpt-3·openai
[模型解析] GPT: 模型演进分析从GPT-3到GPT-5.5OpenAI 的 GPT 系列模型在过去几年经历了快速演进,从 2020 年的 GPT-3 到 2026 年的 GPT-5.5,每一次迭代都带来了显著的能力提升和架构创新。本文将系统分析 GPT 模型的演进路径与技术特点。
迁旭22 天前
人工智能·机器学习·gpt-3·文心一言
Claude Code Skill(技能)系统机制与运行原理报告报告日期:2026-05-12 分析范围:Claude Code CLI 项目完整 skill 系统Skill(技能)是 Claude Code 中的一种可扩展的 prompt 注入机制。每个 skill 本质上是一个 Markdown 文件(或程序化定义的 prompt 生成器),当被触发时,会将预定义的指令内容注入到当前对话上下文中,指导 Claude 模型执行特定任务。
野生的程序媛1 个月前
人工智能·深度学习·神经网络·机器学习·chatgpt·ai作画·gpt-3
关于我做了一个玩偶姐姐桌宠codex desktop最新版更新了一个宠物的功能 下面是操作流程: 首先确保你是最新的版本然后在settings -> 外观,下拉到最下面就可以看到宠物选项
迁旭1 个月前
人工智能·语言模型·gpt-3·知识图谱
claude code 提示词项目使用 SystemPromptBuilder 动态构建完整的系统提示词,参考了 TypeScript 版 Claude Code 的 prompts.ts 结构。按以下顺序组装:
迁旭1 个月前
人工智能·机器学习·语言模型·gpt-3
OpenAI API 请求与响应 核心总结HTTPS + HTTP,就是普通的 REST API 调用,无任何特殊协议。流式返回是 HTTP SSE,同样基于 HTTP。
Jinkxs2 个月前
gpt-3
从GPT-3到GPT-4:大模型应用开发的演进之路👋 大家好,欢迎来到我的技术博客! 📚 在这里,我会分享学习笔记、实战经验与技术思考,力求用简单的方式讲清楚复杂的问题。 🎯 本文将围绕人工智能这个话题展开,希望能为你带来一些启发或实用的参考。 🌱 无论你是刚入门的新手,还是正在进阶的开发者,希望你都能有所收获!
Roselind_Yi2 个月前
人工智能·python·面试·职场和发展·langchain·gpt-3·agent
【吴恩达2026 Agentic AI】面试向+项目实战(含面试题+项目案例)-1🎯 博主前言:本笔记专为面试与项目实战设计,聚焦吴恩达2026 Agentic AI教程中的高频考点与核心项目。内容以“面试题+标准回答”和“项目实战+亮点解析”为主线,帮助您在面试中脱颖而出,同时具备从零搭建智能体的实操能力。
AI-Ming2 个月前
人工智能·pytorch·深度学习·机器学习·chatgpt·nlp·gpt-3
程序员转行学习 AI 大模型: 模型微调| 附清晰概念分类本文是 程序员 转行学习AI大模型的第16个核心知识点笔记,附清晰业务流程示例。 当前阶段:还在学习知识点,由点及面,从 0 到 1 搭建 AI 大模型知识体系中。 系列更新,关注我,后续会持续记录分享转行经历~
慵懒的猫mi3 个月前
linux·人工智能·ai·gpt-3·飞书·文心一言·deepin
deepin UOS AI 助手接入飞书(Feishu)配置指南本指南用于把 UOSAI 助手 接入到 飞书(Feishu)。你只需要照着做:创建应用 → 加机器人能力 → 配权限 → 拿到 App ID/Secret → 在UOSAI 后台填入 → 配事件订阅 → 发布 → 测试。
HXIWbeyzus3 个月前
gpt-3
面向削峰填谷的电动汽车多目标优化调度策略 关键词:电动汽车 削峰填谷 多目标 充放电优化 参考...面向削峰填谷的电动汽车多目标优化调度策略 关键词:电动汽车 削峰填谷 多目标 充放电优化 参考文档:自己整理的说明文档,公式、约束、数据齐全,可联系我查看 仿真平台:MATLAB YALMIP+CPLEX 优势:代码注释详实,出图效果非常好,说明文档细致详细,模型精准 主要内容:代码主要实现了考虑电动汽车参与削峰填谷的场景下,电动汽车充放电策略的优化,是一个多目标优化,目标函数一方面考虑了电动汽车综合负荷以及电池退化损耗成本,一方面考虑了削峰填谷的峰谷差和负荷波动最低,所以为三目标约束,最后通过赋权值以及
老刘说AI3 个月前
人工智能·深度学习·神经网络·机器学习·语言模型·gpt-3·集成学习
初识神经网络与机器学习承接上一章初遇Open AI,深入了解大语言模型训练范式,对大模型训练范式的宏观认知,今天让我们潜入技术深水区,从算法工程师的视角,详细拆解LLM如何通过数学公式逐步进化为智能系统。
小雨中_4 个月前
人工智能·gpt·深度学习·机器学习·自然语言处理·gpt-3
3.1 GPT 系列:Generative Pre-Training(从 GPT-1 到 GPT-3)GPT 系列的主线非常清晰:用自回归语言建模(Language Modeling)作为通用学习目标,先在大规模文本上做生成式预训练(Generative Pre-Training),再通过不同方式把能力迁移到下游任务上。 从 GPT-1 的“预训练 + 有监督微调”,到 GPT-2 的“预训练 + zero-shot 多任务”,再到 GPT-3 的“预训练 + few-shot / in-context learning”,迁移方式逐步从“参数更新”走向“仅提示(prompt)驱动”。
pvIaUtLZ4 个月前
gpt-3
永磁同步电机自适应抗扰的ADRC控制模型研究永磁同步电机自抗扰控制模型ADRC永磁同步电机(PMSM)控制最头疼的就是各种扰动——负载突变、参数漂移、模型非线性,这时候自抗扰控制(ADRC)就派上用场了。这玩意儿不跟你死磕精确数学模型,反而直接暴力拆解系统里的各种干扰,今天咱们就扒一扒它的实现套路。
zhaosuyuan4 个月前
gpt·语言模型·llm·gpt-3
InstructGPT 2022详细解读InstructGPT 2022 decoder onlyInstructGPT是大语言模型对齐人类意识的里程碑工作,解决模型幻觉等问题,更能理解符合人类的期望。 核心思想:通过人类反馈feedback微调模型,使其输出更听话、更安全、更有用helpful, honest, harmless。 InstructGPT 训练分为三阶段:
后端小张5 个月前
人工智能·深度学习·学习·自然语言处理·gpt-3·claude·skill
【AI 学习】解锁Claude Skills:开启AI应用新维度Claude Skills 是 Anthropic 公司为其人工智能模型 Claude 打造的一项创新性的功能扩展机制。从 Anthropic 的官方阐述来看,它本质上是一种标准化的、可复用的模块化系统,旨在赋予 Claude 执行特定领域复杂任务的能力 。通过 Claude Skills,用户能够让 Claude 迅速化身为专业领域的 “专家”,完成从常规的文本处理到复杂的业务流程自动化等多样化任务。