CSDN 大模型 笔记

AI 3大范式:计算 发发 交互


L1 生成代码 复制到IDEA (22年12-23年6,7月份)

L2 部分自动编程 定义class 设计interface 让其填充实现 (23年7,8月份)

L3 通用任务 CRUD (24年)

L4 高度自动编程 通用领域专有任务,进行推理,接企业数据库,项目集自动化 (25年)

deepseek 最大创新

预训练→推理能力


软件开发特点

1、复杂性:最小化复杂性,解耦合,抽象

2、动态性:瀑布模型(静态开发) → 敏捷开发(动态开发)。

3、协作性:谷歌的软件工程,Titus winters。编程不是软件工程。多人多版本开发。

推理范式解决的是软件的复杂性。 95%快思考,5%慢思考。 软件开发里慢思考占据99%。

解决复杂性2个手段:分解,抽象(例如设计模式)。抽象靠强大的推理支持。

推理是的大模型从 码农编程→架构师

(R1/O1 已具备)

学习开发过程解决动态性,而不是直接看现成的代码。

协调性上,大模型的组织能力还不行,组织者。


有了AI以后,岗位危险程度:开发<架构师<产品经理<项目经理

mult person multi version, 以后 person 被 Agent 代替,但是谁来组织呢? Agent要靠什么协作?


Open AI 5级能力

1级 聊天机器人 完成

2级 推理者 具有人类推理水平

3级 Agent

4级 innovator 创新者

5级


deepseek 8篇论文

相关推荐
EulerBlind18 分钟前
【运维】SGLang 安装指南
运维·人工智能·语言模型
我不是大佬zvj2 小时前
解决使用vscode连接服务器出现“正在下载 VS Code 服务器...”
语言模型
ReinaXue5 小时前
大模型【进阶】(五):低秩适配矩阵LORA的深度认识
人工智能·深度学习·神经网络·语言模型·自然语言处理·transformer
静心问道5 小时前
BitDistiller:通过自蒸馏释放 Sub-4-Bit 大语言模型的潜力
人工智能·语言模型·模型加速·ai技术应用
alex1006 小时前
AI Agent开发学习系列 - langchain之LCEL(5):如何创建一个Agent?
人工智能·python·语言模型·langchain·prompt·向量数据库·ai agent
DisonTangor9 小时前
Mistral AI开源 Magistral-Small-2507
人工智能·语言模型·开源·aigc
PPIO派欧云1 天前
PPIO上线阿里旗舰推理模型Qwen3-235B-A22B-Thinking-2507
人工智能·语言模型
IT古董1 天前
【第四章:大模型(LLM)】01.Embedding is all you need-(6)从 Word2Vec 到推荐/广告系统,再到大语言模型(LLM)
语言模型·embedding·word2vec
门前云梦1 天前
ollama+open-webui本地部署自己的模型到d盘+两种open-webui部署方式(详细步骤+大量贴图)
前端·经验分享·笔记·语言模型·node.js·github·pip
莫彩1 天前
【大模型论文阅读】2503.01821_On the Power of Context-Enhanced Learning in LLMs
论文阅读·人工智能·语言模型