技术栈
gpt
量子位
4 小时前
人工智能
·
gpt
GPT-4.1 偷偷开跑?神秘模型上线三天已被玩疯,网友发现大量 OpenAI 痕迹
上线仅三天的神秘模型,已经鲨疯了!大模型聚合平台 OpenRouter 新推出的 Optimus Alpha,已经处理了 772 亿 Token,平均每天超过 200 亿。
风筝超冷
6 小时前
gpt
·
深度学习
·
decoderblock
GPT - TransformerDecoderBlock
本节代码定义了一个 TransformerDecoderBlock 类,它是 Transformer 架构中解码器的一个基本模块。这个模块包含了多头自注意力(Multi-Head Attention)、前馈网络(Feed-Forward Network, FFN)和层归一化(Layer Normalization)。
仙人掌_lz
1 天前
python
·
gpt
·
ai
·
llm
·
rag
·
问答
·
年报
企业年报问答RAG挑战赛冠军方案:从零到SotA,一战封神
任务是基于企业年报构建问答系统。比赛日的流程简而言之:所有问题必须有明确答案类型,例如:每个答案必须附带证据页码,确保系统真实检索而非杜撰。
码农耕地人~go
2 天前
gpt
一个插件,免费使用所有顶级大模型(Deepseek,Gpt,Grok,Gemini)
DeepSider是一款集成于浏览器侧边栏的AI对话工具,可免费使用所有顶级大模型包括GPT-4o,Grok3,Claude 3.5 Sonnet,Claude 3.7,Gemini 2.0,Deepseek R1满血版等
我还没秃,还能学
2 天前
gpt
大模型day1 - 什么是GPT
全称 Generative Pre-trained Transformer 是一种基于 Transformer 架构的大规模 预训练 语言模型,由OpenAI研发,但GPT仅仅只是借鉴了Transformer 中 Decoder 的部分,并且做了升级
AIBox365
2 天前
人工智能
·
gpt
·
aigc
GPT文生图模型新玩法
GPT-4o发布了最新的生图模型GPT-4o-Image,在图像控制力、一致性上实现了显著提升,其表现甚至展现出超越Midjourney的潜力。这款模型不仅能读懂细致的指令,还能赋予照片艺术化的新生命。接下来,我们将介绍几个有趣的实践方向,带你一同探索这项技术,创造属于你的专属视觉回忆。使用方法如下:
风筝超冷
3 天前
gpt
·
深度学习
·
attention
GPT - 多头注意力机制(Multi-Head Attention)模块
本节代码实现了一个多头注意力机制(Multi-Head Attention)模块,它是Transformer架构中的核心组件之一。
橙色小博
3 天前
人工智能
·
python
·
gpt
·
深度学习
·
神经网络
·
transformer
GPT:Transformer的专精产品
目录1. 前言2. GPT与Transformer的对比2.1 Transformer架构2.2 GPT架构
不搬砖的程序员不是好程序员
3 天前
gpt
DB-GPT 源码安装部署 0基础
DB-GPT 项目介绍DB-GPT是一个开源的AI原生数据应用开发框架(AI Native Data App Development framework with AWEL(Agentic Workflow Expression Language) and Agents)。目的是构建大模型领域的基础设施,通过开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单,更方便。
kfepiza
3 天前
linux
·
windows
·
笔记
·
gpt
硬盘分区格式之GPT(GUID Partition Table)笔记250406
GPT(GUID Partition Table)硬盘分区格式详解 GPT(GUID Partition Table)是替代传统 MBR 的现代分区方案,专为 UEFI(统一可扩展固件接口)系统设计,解决了 MBR 的容量限制、分区数量限制和数据安全性问题。
zq.xidian
3 天前
人工智能
·
gpt
【开发工具】科研开发中的主流AI工具整理及如何使用GPT润色英文论文
AI技术发展至今已经逐渐成熟,并可以取代一部分科研和开发中的简单工作,并为复杂工作提高辅助,除此之外也是更高级的信息检索工具。熟练掌握 AI 工具在当前市场理应具有竞争优势,目前笔者在科研和开发中接触过AI工具的使用体验整理如下:
仙人掌_lz
3 天前
开发语言
·
python
·
gpt
·
llm
·
gpt-4o
·
deepseek
详解如何从零用 Python复现类似 GPT-4o 的多模态模型
“学习不是装满一桶水,而是点燃一把火。” —— 叶芝我的博客主页: https://lizheng.blog.csdn.net
仙人掌_lz
4 天前
开发语言
·
python
·
gpt
·
自然语言处理
·
llm
·
token
·
deepseek
利用python从零实现Byte Pair Encoding(BPE):NLP 中的“变形金刚”
BPE:NLP 界的“变形金刚”,从零开始的奇幻之旅在自然语言处理(NLP)的世界里,有一个古老而神秘的传说,讲述着一种强大的魔法——Byte Pair Encoding(BPE)。它能够将普通的文本“变形”成机器能够理解的神奇符号,就像《变形金刚》里的汽车人和霸天虎一样,瞬间从一个形态切换到另一个形态,瞬间从“人类语言”变成“机器语言”。
ai大师
4 天前
gpt
·
claude
·
metagpt
·
中转api
·
apikey
·
中转apikey
·
免费apikey
开源智能体MetaGPT记忆模块解读
MetaGPT 是一个多智能体协作框架,通过模拟软件公司组织架构与工作流程,将大语言模型(LLM)转化为具备专业分工的智能体,协同完成复杂任务。其最大特点是能够将自然语言需求转化为完整的数字产品交付物(用户故事/竞品分析/API文档/代码文件等)。
梦道长生
4 天前
人工智能
·
windows
·
笔记
·
gpt
GPT-SoVITS Windows 配置与推理笔记(自用)
这是给自己留的备份,方便下次查。Windows 端配置和推理为主,代码为核心,直接干货。Git 下载(可选):
偏执网友
4 天前
服务器
·
gpt
记录IBM服务器检测到备份GPT损坏警告排查解决过程
服务器设备:IBM x3550 M4 ServerIMM默认IP地址:192.168.70.125用户名:USERID 密码:PASSW0RD(注意是零0)
Nicolas893
4 天前
gpt
·
大模型
·
生成模型
·
生成式
·
判别式
·
监督生成式
·
无监督生成式
【大模型理论篇】关于生成式模型中联合分布概率学习必要性以及GPT是生成式模型的讨论
之前我们在《生成式模型与判别式模型对比(涉及VAE、CRF的数学原理详述)》以及《生成式模型算法原理深入浅出(涉及Stable Diffusion、生成对抗网络、高斯混合模型、隐马尔可夫模型、朴素贝叶斯等算法原理分析及生成式模型解释)》中,我们对一些常见的算法做了分析。刚好最近和同事聊天,聊起生成式模型,这里做一些额外信息的补充。
量子位
5 天前
人工智能
·
gpt
GPT-4o 图像生成架构被 “破解” 了?自回归主干 + 扩散解码器,还有 4o 图像生成全面测评基准
GPT-4o 图像生成架构被 “破解” 了!最近一阵,“万物皆可吉卜力” 让 GPT-4o 的图像生成功能一炮而红,人们随之好奇:
kfepiza
6 天前
笔记
·
gpt
MGR 和 GPT 笔记250406
以下是 MBR(Master Boot Record) 和 GPT(GUID Partition Table) 的详细对比
@MrLiu
6 天前
gpt
·
架构
·
gpt架构
# 深入理解GPT:架构、原理与应用示例
GPT(Generative Pre-trained Transformer)系列模型自2018年问世以来,凭借其强大的文本生成能力和多任务适应性,彻底改变了自然语言处理(NLP)领域。本文将从架构设计、训练方法到实际应用,结合代码示例与架构图,带您全面理解GPT的核心原理。