技术栈
gpt
John159151
9 小时前
gpt
·
llm
·
nlp
·
deepseek
#Paper Reading# DeepSeek-R1
论文题目: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning 论文地址: https://arxiv.org/pdf/2501.12948 论文发表于: arXiv 2025年1月 论文所属单位: DeepSeek
江鸟1998
1 天前
人工智能
·
gpt
·
ai
·
chatgpt
·
大模型
AI日报 · 2025年05月02日 | 再见GPT-4!OpenAI CEO 确认 GPT-4 已从 ChatGPT 界面正式移除
在处理 GPT-4o 更新问题的同时,OpenAI CEO Sam Altman 于 5 月 1 日在 X 平台发文,正式确认初代 GPT-4 模型已从 ChatGPT 主用户界面中移除。此举遵循了 OpenAI 此前公布的计划,即在 4 月底前完成 GPT-4 的界面替换,由 GPT-4o 等更新的模型接替其位置。Altman 在帖文中向 GPT-4 致敬,称其“开启了一场革命”,并表示会妥善保存其权重。
江鸟1998
2 天前
人工智能
·
gpt
·
大模型
·
agent
·
智能体
AI日报 · 2025年04月30日|OpenAI 回滚 GPT-4o 更新以解决“谄媚”问题
过去24小时,全球人工智能领域持续快速发展。从模型行为调整到平台工具更新,再到行业安全规范的探讨,以下是为您精选的重点动态:
深度学习视觉
2 天前
gpt
CosyVoice、F5-TTS、GPT-SoVITS、Fish-Speech声音模型项目深度对比:选型指南
在数字人、虚拟助手、智能客服等应用快速发展的背景下,文本转语音(TTS)和语音克隆技术已成为AI领域的核心技术之一。本文将对目前主流的四个开源语音合成项目——CosyVoice、F5-TTS、GPT-SoVITS 和 Fish-Speech进行全方位对比分析,帮助你根据实际需求选择最合适的工具。
zm-v-15930433986
3 天前
gpt
·
arcgis
ArcGIS+GPT:多领域地理分析与决策新方案
前言综述 在数字化和智能化快速发展的时代,地理信息系统(GIS)与生成式预训练模型(GPT)的融合成为推动众多领域进步的关键力量。ArcGIS 作为 GIS 领域的佼佼者,具备强大的空间数据处理、分析和可视化能力,广泛应用于城市规划、环境监测、交通管理等多个学科领域。而 GPT 在自然语言处理、文本生成等方面的优势,为 ArcGIS 的智能化发展开辟了新方向。二者的融合为科研人员、专业从业者提供了更高效、智能的工具,能够更深入地挖掘地理数据价值,为决策提供有力支持。
winner8881
3 天前
人工智能
·
gpt
·
bert
·
encoder
·
decoder
从 BERT 到 GPT:Encoder 的 “全局视野” 如何喂饱 Decoder 的 “逐词纠结”
在深度学习领域,Encoder(编码器)与Decoder(解码器)是序列处理任务的核心组件,二者通过不同的注意力机制设计,形成了“理解-生成”的黄金搭档。本文从基础功能、注意力机制差异、典型案例及工程实践等维度,解析这对架构的核心设计逻辑。
金木讲编程
5 天前
gpt
·
ai编程
用Function Calling让GPT查询数据库(含示例)
在本文中,我们通过一个简单的示例,介绍了 GPT模型结合Function Calling技术查询数据库 的基本流程。 Function Calling 是OpenAI推出的一项功能,允许大模型根据用户提问,自动生成函数调用指令,并由程序端实际执行外部操作(如数据库查询、API调用),再将结果返回给模型,最终组织成自然语言回复用户。
Tech Synapse
7 天前
人工智能
·
gpt
·
flask
打造企业级AI文案助手:GPT-J+Flask全栈开发实战
在数字化营销时代,内容生产效率成为企业核心竞争力。据统计,营销人员平均每天需要撰写3.2篇文案,而传统人工创作存在三大痛点:
MonkeyKing_sunyuhua
8 天前
gpt
·
架构
2.2 主流大模型架构:GPT、DeepSeek、GLM、Claude、QwQ、Qwen2.5-Max等模型的比较与应用场景
大语言模型(Large Language Models, LLMs)的快速发展深刻改变了企业运营模式,推动了智能化自动化、数据驱动决策和创新商业模式的实现。OpenAI的GPT系列、DeepSeek的R1和R2、清华大学GLM、Anthropic的Claude、阿里巴巴的QwQ以及Qwen2.5-Max代表了当前大模型技术的顶尖水平。这些模型主要基于Transformer架构,但在设计理念、训练策略和应用优势上各有特色,为企业提供了多样化的解决方案。本节将深入分析这些模型的架构原理、技术特点、性能指标和企
@PHARAOH
8 天前
gpt
·
交互
HOW - 如何模拟实现 gpt 展示答案的交互效果
使用一些 gpt 平台时,“一点点展示出答案”的效果是怎么实现的?其实,这并不是真的“慢慢显示”,而是首先在产品设计维度,有意在结构化和节奏上做了设计,让内容读起来更像是一场轻松、有节奏的对话。
未来智慧谷
9 天前
人工智能
·
gpt
大模型工业化元年:GPT-5开启通用AI新纪元,中国技术如何破局?
过去一周,AI领域的焦点无疑是OpenAI发布的GPT-5预览版,以及全球大模型技术从实验室迈向工业化的关键转折。这场变革不仅标志着通用人工智能(AGI)的进一步逼近,更掀起了全球产业链的竞争与反思。本文将从技术突破、产业落地、中美博弈三个维度,解读这一里程碑事件的意义与挑战。
樱花穿过千岛湖
10 天前
人工智能
·
python
·
gpt
·
学习
·
ai
第六章:Multi-Backend Configuration
在上一章任务工作流编排,我们学会了如何像指挥家一样协调任务。但就像变形金刚能切换不同形态应对环境变化一样,你的AI代理也需要能灵活切换存储、数据库和部署环境。本章将教你如何用多后端配置让代理像变形金刚一样“一机多用”!
量子位
10 天前
人工智能
·
gpt
·
aigc
北大团队引领 3D 生成与对齐革新:OctGPT 打破扩散模型垄断
近年来,智能三维形状生成(3D AIGC)技术迅速崛起,正成为推动数字内容创作革新的关键力量,特别是在游戏、影视、虚拟现实和工业设计等领域表现出巨大的应用潜力。
web守墓人
12 天前
java
·
gpt
·
golang
【gpt生成-其二】以go语言为例,详细讲解 并发模型:线程/协程/ Actor 实现
概念 线程是操作系统调度的最小单位,每个线程拥有独立的栈和寄存器上下文,但共享进程的内存空间。线程的创建、切换和同步需要较高的系统开销。
剑客的茶馆
12 天前
gpt
·
llm
·
llama
·
选择大模型
GPT,Genini, Claude Llama, DeepSeek,Qwen,Grok,选对LLM大模型真的可以事半功倍!
基于公开的技术报告、基准测试结果、在线反馈及用户使用情况,深入探讨各模型的特点、擅长领域及典型应用场景,为用户和开发者选择和应用合适的模型提供参考。
web守墓人
13 天前
前端
·
gpt
·
golang
【gpt生成-其一】以go语言为例,详细描述一下 :语法规范BNF/EBNF形式化描述
在 Go 语言中通过 EBNF 形式化描述语法规范需要结合语言规范文档的结构,以下是详细实现方法及标准规范示例:
ai_大师
13 天前
gpt
·
claude
·
cursor
·
apikey
·
中转apikey
·
免费apikey
Cursor怎么使用,3分钟上手Cursor:比ChatGPT更懂需求,用聊天的方式写代码,GPT4、Claude 3.5等先进LLM辅助编程
在人工智能工具井喷的今天,大家早已习惯用AI辅助编程,但大多数工具要么停留在“问答式”交互,要么对复杂代码逻辑束手无策。而Cursor——这款专为开发者设计的AI编程工具,凭借对代码上下文的深度理解、一键生成完整函数甚至模块的能力,正在成为新宠。只需3分钟,你就能用它解锁高效编码体验(文中有彩蛋)。
移动安全星球
13 天前
人工智能
·
gpt
·
claude
·
本地知识库
·
deepseek
从零开始:CherryStudio 打造专属本地 AI 知识库全攻略
1、首先去 硅基(点我去注册) 注册个账号,因为需要配置 Embedding(嵌入式模型),注册成功后你会获得2000W Token
bingbingyihao
14 天前
gpt
·
ui
GPT对话UI--通义千问API
一个基于 GPT 的智能对话界面,提供简洁优雅的用户体验。本项目使用纯前端技术栈实现,无需后端服务器即可运行。