CSDN 大模型 笔记

AI 3大范式:计算 发发 交互


L1 生成代码 复制到IDEA (22年12-23年6,7月份)

L2 部分自动编程 定义class 设计interface 让其填充实现 (23年7,8月份)

L3 通用任务 CRUD (24年)

L4 高度自动编程 通用领域专有任务,进行推理,接企业数据库,项目集自动化 (25年)

deepseek 最大创新

预训练→推理能力


软件开发特点

1、复杂性:最小化复杂性,解耦合,抽象

2、动态性:瀑布模型(静态开发) → 敏捷开发(动态开发)。

3、协作性:谷歌的软件工程,Titus winters。编程不是软件工程。多人多版本开发。

推理范式解决的是软件的复杂性。 95%快思考,5%慢思考。 软件开发里慢思考占据99%。

解决复杂性2个手段:分解,抽象(例如设计模式)。抽象靠强大的推理支持。

推理是的大模型从 码农编程→架构师

(R1/O1 已具备)

学习开发过程解决动态性,而不是直接看现成的代码。

协调性上,大模型的组织能力还不行,组织者。


有了AI以后,岗位危险程度:开发<架构师<产品经理<项目经理

mult person multi version, 以后 person 被 Agent 代替,但是谁来组织呢? Agent要靠什么协作?


Open AI 5级能力

1级 聊天机器人 完成

2级 推理者 具有人类推理水平

3级 Agent

4级 innovator 创新者

5级


deepseek 8篇论文

相关推荐
U盘失踪了2 小时前
Embedding 模型 和 大语言模型(LLM)的区别
语言模型·embedding
ABCDEEE79 小时前
2.神经网络、大语言模型初识
语言模型
AI人工智能+10 小时前
不动产权证书识别技术:融合了计算机视觉、自然语言处理(NLP)和人工智能的深度技术栈
人工智能·计算机视觉·语言模型·ocr·不动产权证书识别
DisonTangor10 小时前
【字节拥抱开源】ByteDance-Seed开源连续潜在扩散语言模型——Cola DLM
人工智能·语言模型·自然语言处理
Mr_sst12 小时前
Codex 部署、使用教程 & Vibe Coding 实战指南
java·ai·语言模型·chatgpt·ai编程
qq_5255137513 小时前
第七章 指令微调学习(三)为指令数据集创建数据加载器;加载预训练的大语言模型
人工智能·学习·语言模型
前端小超人rui15 小时前
ModelScope和DashScope对比
语言模型·大模型调用·ai 大模型
AI技术控1 天前
RAG 怎么做 Query 改写?从工程实践看检索增强生成的第一道关键关卡
人工智能·语言模型·自然语言处理·oracle·nlp
XD7429716362 天前
大模型可解释性-颠覆认知:大语言模型在预训练中并非“稳定变聪明”
人工智能·机器学习·语言模型
技术钱2 天前
大语言模型出现幻觉的原因与缓解方案
人工智能·python·语言模型·自然语言处理