LLM基础

LLM:

AGI 通用人工智能

计算不可约性原理

监督微调、奖励建模

饶毅关于gpt https://mp.weixin.qq.com/s/Govj_KD_afL_nK9T16nE0w

gpt2 windows :https://matters.town/@tianci/63096-教你如何在自己的电脑上运行使用gpt-2-2020-07-bafyreihimyaazpasxf6m5nb2f52pkvvv7rkz3eb6uoze4u42kka7qd7a4e

this is chat gpt

https://writings.stephenwolfram.com/2023/02/what-is-chatgpt-doing-and-why-does-it-work/#its-just-adding-one-word-at-a-time
1 adding one word each time

(1) ask for the following word

chatGPT is always asking given the text,whats the next word(token which could be part of word )

chatgpt 在做的是对文本合理的延续, 合理指的是 全网数据学习后,要能知道接下来应该是什么字词,

eg: The best thing about AI is its ability to ...

chatgpt looks for meaningful things, and generate a ranked list of words that might follow, together with "probabilities":

(2)随机选词

randomly choose a word in ranked list ,instead of the word with highest posibility;if gpt choose the best one everytime then it lose the creativity and generate massive repeated content

randomness means the same prompt produces different result

(3) "language model" neural net:

Image

i generate next word with probability

ii randomly choose a word for producing different result

2 Where Do the Probabilities Come From?

calculate how often every letter in a content text

相关推荐
weigangwin1 小时前
用 GPT Researcher 前,先验证“资料来源合同”
gpt
带娃的IT创业者2 小时前
深度解析 GPT-5.6 Sol:当 AI 模型开始具备“物理世界“的感知力
人工智能·gpt·大模型·技术演进·gpt-5.6·物理世界感知·认知架构
自律懒人5 小时前
三强争霸:GPT-5.6 Sol vs Claude Fable 5 vs 豆包Seed-2.1 Pro——最新Agent模型实测横评
前端·人工智能·gpt
_codemonster5 小时前
从零手搓大模型(三)从零实现一个 GPT 模型
gpt
Ai 码农‍15 小时前
GPT 5.6 正式上线?
gpt
阿洛学长20 小时前
Cursor下载安装使用教程(最新详细图文)
人工智能·gpt·深度学习·ai·ai编程
奇牙coding20 小时前
企业大模型 API 真实账单深度测算:deepseek-v4-pro、gpt-5.4、claude-opus-4.8 成本对比与接入方案(2026)
gpt·ai
ArkAPI2 天前
Loop详解:Claude、GPT、Mira,以及真正的作业的方法(译)
人工智能·gpt·chatgpt·大模型·claude·loop·arkapi