gpt

*星星之火*18 小时前
gpt
【GPT入门】第56课 大模型分布式训练的三种方式、模型层介绍及DeepSpeed ZeRO的支持在深入了解分布式训练之前,有必要先了解大模型(尤其是Transformer架构)的核心层结构,这有助于理解为何需要不同的并行策略:
算法_小学生18 小时前
gpt
GPT 模型详解:从原理到应用在自然语言处理(NLP)的发展历程中,GPT(Generative Pre-trained Transformer) 系列模型占据了里程碑式的地位。它基于 Transformer 架构,通过大规模语料的预训练与下游任务的微调,成功推动了语言生成和理解的边界。本文将从原理、架构、训练方式到应用场景,对 GPT 系列进行系统介绍。
*星星之火*1 天前
gpt
【GPT入门】第51课 将hf模型转换为GGUF下文把Lora微调后的模型转为gguf格式,目的是可以让模型在ollama支持的机器上运行,用到llamacpp项目做格式转换,并使用ollama运行模型测试
魔乐社区3 天前
人工智能·gpt·深度学习·开源·大模型
OpenAI重新开源!gpt-oss-20b适配昇腾并上线魔乐社区2025年8月5日,OpenAI发布了两款全新的开源权重语言模型,均为混合专家(MoE)架构,其规模设计可在消费级GPU和云端的多种硬件上高效运行。这些模型采用 Apache 2.0 许可协议,因此可用于蒸馏到其他推理模型中、部署到商业产品里,且无下游使用限制。这两款模型分别是规模较小的 gpt-oss-20b(总参数 210 亿,激活参数 36 亿)和规模较大的 gpt-oss-120b(总参数1170亿,激活参数 51 亿)。此次发布的亮点在于,OpenAI 推出的这两款开源模型在性能和策略上带来了显
*星星之火*4 天前
gpt
【GPT入门】第49课 LlamaFacotory 训练千问下载后:避坑经验:发现先安装vllm后安装LlamaFactory有依赖冲突,改为先安装LlamaFacotory后安装vllm
PythonPioneer6 天前
人工智能·gpt
颠覆性进化:OpenAI正式发布GPT-5,AI大模型进入“超级智能”时代2025年8月8日·旧金山全球人工智能领域迎来历史性时刻——OpenAI今日凌晨正式推出新一代大语言模型GPT-5。此次发布的不仅是技术参数的跃升,更是AI实用化进程的关键转折点。在GPT-4发布两年半后,这款被业界称为“最接近通用人工智能”的系统,正以颠覆性的能力重构人机交互边界。
唐天下文化6 天前
人工智能·gpt
bit-Agent正式接入GPT-5,九科信息智能体能力再升级!近日,OpenAI发布GPT-5,又给全球科技圈带来了一点小小的震撼。OpenAI创始人Sam Altman说:“测试完GPT-5,我感觉自己一无是处。”GPT的前代产品已足够惊艳,但在Altman的眼里,“GPT-3像个高中生,GPT-4像个大学生,而GPT-5则已经变成了一名专家,一名各个领域的专家。”
lisuwen1166 天前
大数据·人工智能·gpt·chatgpt
GPT-5 上线风波深度复盘:从口碑两极到策略调整,OpenAI 的变与不变摘要: 近日,备受瞩目的 GPT-5 正式上线,却意外地在社区引发了两极化争议。面对技术故障与用户质疑,OpenAI 迅速推出一系列补救措施。本文将深度复盘此次发布风波,解析其背后的技术挑战与应对策略,并探讨这一事件对开发者生态的深远影响。
funfan05176 天前
人工智能·gpt
GPT-5博士级AI使用教程及国内平替方案先说说最直观的感受:GPT-5像个刚拿到博士学位的助手,不仅懂的多,还会主动思考。官方数据说它的幻觉率比GPT-4o降低45%,实测下来确实靠谱——上周让它写一篇关于"分布式系统一致性算法"的技术博客,引用的6篇论文全是真实存在的,连页码都标对了。
z千鑫7 天前
人工智能·gpt·语言模型·aigc
【OpenAI】 GPT-4o-realtime-preview 多模态、实时交互模型介绍+API的使用教程!GPT-4o-realtime-preview是OpenAI GPT-4系列的升级版,主打多模态全能性和实时交互能力。它不仅能处理文本,还支持音频、图像、视频四种模态的混合输入输出,且响应速度快到令人惊讶。
Code_流苏7 天前
人工智能·gpt·gpt5·deepseek r2·ai热点·本周周报
AI热点周报(8.10~8.16):AI界“冰火两重天“,GPT-5陷入热议,DeepSeek R2模型训练受阻?名人说:博观而约取,厚积而薄发。——苏轼《稼说送张琥》 创作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)
oe10197 天前
笔记·gpt·学习
读From GPT-2 to gpt-oss: Analyzing the Architectural Advances(续)本篇由来,在COC上我当面感谢了组委会和姜宁老师,随即被姜宁老师催稿,本来当天晚上写了一个流水账,感觉甚为不妥。于是决定慢慢写,缓缓道来。要同时兼顾Show me the code,Show me the vide。希望能形成一个从不同侧面观测我自己Community Over Code 2025参会心的,收获的内容集合。 感觉这个系列正慢慢变成一场开发过程的图文慢直播,肯能有助于大家一步一步的从零开始构建自己的Agent。 我定了一个番茄钟,每天写稿大概1~2个钟,写到哪儿算哪儿。 今天也对内容进行了调
小白杨树树7 天前
人工智能·gpt·语言模型
【LLM】文献阅读-ISOLATE GPT:基于大语言模型的执行隔离架构原文链接:[2403.04960] IsolateGPT: An Execution Isolation Architecture for LLM-Based Agentic Systems
*星星之火*7 天前
人工智能·gpt
【GPT入门】第47课 大模型量化中 float32/float16/uint8/int4 的区别解析:从位数到应用场景在大模型量化中,float32、float16、uint8、int4 这些术语表示不同的数据存储格式,核心区别在于占用位数(数字即表示位数)、数值范围、精度和计算效率,直接影响模型的大小、速度和性能。
迈火8 天前
人工智能·gpt·3d·ai·stable diffusion·aigc·midjourney
ComfyUI-3D-Pack:3D创作的AI神器部分节点如下:三平面高斯变换器:VAST-AI-Research/TriplaneGaussianVAST-AI-Research
张飞的猪大数据9 天前
gpt·chatgpt
OpenAI 发布了 GPT-5,有哪些新特性值得关注?国内怎么使用GPT5?GPT-5很强,在LMAreana上获得了1481分,超过Gemini 2.5 Pro,夺回第一。国内怎么使用GPT5?-> zhangfeidezhu.com/?p=1033
AI大模型10 天前
gpt·程序员·llm
AI大模型选择指南:从ChatGPT到国产新秀,一文看懂如何选对你的AI助手本文较长,建议点赞收藏。更多AI大模型开发学习视频籽料, 都在这>>Github<<随着AI技术的爆发式发展,大语言模型已经从实验室走向千家万户。然而,面对GPT-5、Claude 4、Gemini 2.5等数十个模型,许多用户陷入了选择困境。
努力还债的学术吗喽10 天前
gpt·大模型·llm·gpt-3·大语言模型·few-shot·zero-shot
2020 GPT3 原文 Language Models are Few-Shot Learners 精选注解本文为个人阅读GPT3,部分内容注解,由于GPT3原文篇幅较长,且GPT3无有效开源信息 这里就不再一一粘贴,仅对原文部分内容做注解,仅供参考 详情参考原文链接 原文链接:https://arxiv.org/pdf/2005.14165
盼小辉丶10 天前
gpt·深度学习·transformer
Transformer实战(11)——从零开始构建GPT模型GPT-2 (Generative Pretrained Transformer 2) 是由 OpenAI 开发的大语言模型 (Large Language Model, LLM)。它标志着自然语言处理 (Large Language Model, NLP) 领域的一个重要里程碑,并为更复杂的模型的发展奠定了基础。GPT-2 是对 GPT-1 的改进,旨在根据给定的提示生成连贯且具有上下文相关性的文本,展示了在多个风格和主题中模仿人类生成文本的卓越能力。 GPT-2 基于 Transformer 架构。然