大模型

龙侠九重天4 小时前
人工智能·ai·大模型·llm·token
Token是什么?深入理解计费与上下文窗口如果你正在使用 ChatGPT、Claude、文心一言、通义千问等大模型产品,或者在你的应用中集成了 OpenAI API、Azure OpenAI、阿里云百炼等服务,那么你一定遇到过"Token"这个词。
CoderJia程序员甲4 小时前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-23)生成于:2026-04-23共发现热门项目: 12 个榜单类型:日榜Token赞助:siliconflow
AI算法沐枫4 小时前
人工智能·深度学习·神经网络·计算机视觉·大模型·rag
OpenAI Operator vs Claude Act:两大厂商Agent对比最近两年,大家都可以看到AI的发展有多快,我国超10亿参数的LLM,在短短一年之内,已经超过了100个,现在还在不断的发掘中,时代在瞬息万变,我们又为何不给自己多一个选择,多一个出路,多一个可能呢?
人工小情绪5 小时前
人工智能·gpt·大模型·transformer
GPT-1 论文深度解读论文标题:Improving Language Understanding by Generative Pre-Training 论文作者:Alec Radford, Karthik Narasimhan, Tim Salimans, Ilya Sutskever (OpenAI) 发布时间:2018年 核心贡献:提出了“半监督学习”框架,即在大规模无标注文本上进行生成式预训练(Generative Pre-Training),然后在特定下游任务上进行有监督微调(Supervised Fine-Tunin
AI算法沐枫5 小时前
人工智能·深度学习·学习·大模型·agent·智能体·ai应用开发
从客服转行AI Agent:半年学习与求职复盘现在很多大学生都有转AI的想法,但每天做的却是收藏一堆教程、刷一堆概念、看一堆“LLM 从入门到精通”,然后继续焦虑、继续拖沓、继续投简历没回音。我就是双非野鸡二本经济学转Agent的,结果把 Agent 这条路跑通之后,简历项目亮点直接写满,后面成功拿到offer30kLLM工作最近还发了2w多的年终奖,舒坦!
淡海水6 小时前
人工智能·大模型
【AI模型】概念-MCP【AI&游戏】专栏-直达MCP(模型上下文协议,Model Context Protocol)是由Anthropic提出的开放标准,旨在标准化AI模型与外部工具、数据源之间的通信方式。MCP被称为AI领域的"USB-C"——就像USB接口统一了硬件设备的连接方式一样,MCP统一了AI应用与各种工具的连接方式。
谷哥的小弟6 小时前
人工智能·深度学习·机器学习·大模型·强化学习·智能体
大模型核心基础知识(03)—大模型的分类方法与应用场景大模型并不是单一形态的技术对象。随着模型结构、训练方式和应用目标不断扩展,人们通常从不同角度对大模型进行分类。分类的目的,不只是给模型贴上标签,更在于帮助使用者从任务对象、训练路径和功能定位三个层面理解模型的差异,进一步判断不同模型各自适合处理什么问题,适合落到什么场景中。
AI机器学习算法15 小时前
人工智能·深度学习·cnn·大模型·ai学习路线
深度学习模型演进:6个里程碑式CNN架构目录1. LeNet(90/98)诞生于1990年,在手写体字符识别领域创造性的引入了卷积神经网络的基本操作,意义重大,可以说是现代卷积神经网络的发展起点。1.1思路引入卷积层+池化层等结构1.2 网络结构输入图像分辨率:28x28结构:(1)卷积层1:5x5 --->输出4个24×24大小的特征图;(2)池化层1:平均池化层 2x2;(3)卷积层2:5x5 --->输出12个8x8大小的特征图;(4)池化层2:2x2(5)全连接层 ---->输出1.3 LeNet-5诞生于1998年,在LeNet初期版
Ztopcloud极拓云视角15 小时前
人工智能·阿里云·大模型·token·中美ai
从 OpenRouter 数据看中美 AI 调用量反转:统计口径、模型路由与多云应对方案2026年4月20日,大模型API聚合平台 OpenRouter 发布最新周报:美国近两个月首次反超,背景是 GPT-6 发布后第一个完整统计周。
ACCELERATOR_LLC18 小时前
人工智能·pytorch·深度学习·大模型
【DataWhale组队学习】DIY-LLM Task2 PyTorch 与资源核算原文链接这一章表面上在讲pytorch的张量、矩阵乘法、反向传播、参数初始化、数据加载、优化器、训练循环,但真正的重点应该是从资源的角度重新理一遍这些本来就会写的代码。
刘大猫.20 小时前
人工智能·gpt·大模型·openai·算力·gpt-oss-120b·gpt-oss-20b
OpenAI通过两个开源模型GPT-OSS-120B和GPT-OSS-20B重新拥抱开放性TLDR : OpenAI推出了两个新开源权重语言模型gpt-oss-120B和gpt-oss-20B,这些模型在推理任务上表现出色,并兼容各种应用,包括智能助手。尽管之前存在安全问题,这些模型集成了先进的过滤机制,以最大程度地减少公共使用的风险。
九章智算云1 天前
人工智能·ai·大模型·agent·ai工具·claude code·vibe-coding
一份CLAUDE.md,为何能让GitHub榜首项目狂揽6万星?大家好,我是小九。上周,我被GitHub上的一个奇观给整不会了。一个叫 andrej-karpathy-skills 的项目,没有一行代码,就一个不到200行的Markdown文件,冲上了全球GitHub Trending日榜榜首。
谷哥的小弟1 天前
人工智能·深度学习·机器学习·大模型·智能体
大模型核心基础知识(02)—大模型的主要特征与能力边界大模型之所以在人工智能领域形成广泛影响,并不只是因为参数数量更大,而是因为它在表示学习、任务迁移、内容生成和跨模态处理等方面表现出比传统模型更强的综合能力。随着模型规模、训练数据和计算资源不断扩展,大模型的性能通常会随之提升,这也是近年来大模型快速发展的重要原因之一。与此同时,大模型的能力并不等于没有边界。模型规模的增长能够带来更强的理解与生成能力,但并不能自动消除事实错误、推理偏差、可解释性不足和高资源消耗等问题。
谷哥的小弟1 天前
人工智能·深度学习·机器学习·大模型·智能体
大模型核心基础知识(01)—大模型的发展历程与技术演进大模型并不是孤立出现的技术产物,而是在人工智能、神经网络、深度学习和预训练方法持续演进的基础上逐步形成的。回顾大模型的发展历程,可以看到一条较为清晰的技术演进路径:早期人工智能研究奠定问题意识,神经网络研究提供结构基础,深度学习推动表示学习能力提升,预训练方法和Transformer架构则进一步促成了现代大模型的形成。
xiaotao1311 天前
人工智能·深度学习·大模型·指令微调
03-深度学习基础:指令微调与RLHF指令微调 vs RLHF:发展历程:记住:
DavidSoCool1 天前
java·spring·ai·大模型·springboot·mcp
Springboot AI 创建MCP Server使用springboot AI实现一个伪查询天气的MCP Server,协议是Stdio。系统:win11
程序员柒叔1 天前
人工智能·大模型·openclaw·clawbot·motlbot
OpenClaw 一周动态-2026-W17日期范围: 2026-04-15 - 2026-04-21 摘要: 本周以 2026.4.15 稳定版为核心——默认升级至 Claude Opus 4.7、新增 Gemini TTS、Control UI 模型鉴权状态卡等重磅功能;4.19 beta 系列密集修复嵌套 Agent 阻塞与 Codex token 虚报;HN 社区"Ask: 谁在用 OpenClaw?"(337pts)和反讽长文(274pts)同步引爆讨论,生态工具(ArmorClaw、Palmier、Viche)扎堆涌现。
xiaotao1311 天前
人工智能·深度学习·大模型
03-深度学习基础:模型部署与量化部署流程总结:最佳实践:
xiaotao1311 天前
人工智能·深度学习·大模型·agent
03-深度学习基础:Agent与工具调用Agent开发流程:记住: