CSDN 大模型 笔记

AI 3大范式:计算 发发 交互


L1 生成代码 复制到IDEA (22年12-23年6,7月份)

L2 部分自动编程 定义class 设计interface 让其填充实现 (23年7,8月份)

L3 通用任务 CRUD (24年)

L4 高度自动编程 通用领域专有任务,进行推理,接企业数据库,项目集自动化 (25年)

deepseek 最大创新

预训练→推理能力


软件开发特点

1、复杂性:最小化复杂性,解耦合,抽象

2、动态性:瀑布模型(静态开发) → 敏捷开发(动态开发)。

3、协作性:谷歌的软件工程,Titus winters。编程不是软件工程。多人多版本开发。

推理范式解决的是软件的复杂性。 95%快思考,5%慢思考。 软件开发里慢思考占据99%。

解决复杂性2个手段:分解,抽象(例如设计模式)。抽象靠强大的推理支持。

推理是的大模型从 码农编程→架构师

(R1/O1 已具备)

学习开发过程解决动态性,而不是直接看现成的代码。

协调性上,大模型的组织能力还不行,组织者。


有了AI以后,岗位危险程度:开发<架构师<产品经理<项目经理

mult person multi version, 以后 person 被 Agent 代替,但是谁来组织呢? Agent要靠什么协作?


Open AI 5级能力

1级 聊天机器人 完成

2级 推理者 具有人类推理水平

3级 Agent

4级 innovator 创新者

5级


deepseek 8篇论文

相关推荐
imbackneverdie9 分钟前
Science最新文章:大型语言模型时代的科学生产
人工智能·语言模型·自然语言处理·aigc·ai写作
P-ShineBeam12 分钟前
八卡A100服务器坏卡引发 CUDA initialization: cudaGetDeviceCount()异常
运维·服务器·人工智能·语言模型
m0_6038887121 分钟前
Scaling Trends for Multi-Hop Contextual Reasoning in Mid-Scale Language Models
人工智能·算法·ai·语言模型·论文速览
Toky丶27 分钟前
【文献阅读】Pretraining Large Language Models with NVFP4
人工智能·语言模型·自然语言处理
颜值博主28 分钟前
新一代大模型范式: Inner Tools
人工智能·ai·语言模型
狮子座明仔2 小时前
MiMo-V2-Flash 深度解读:小米 309B 开源 MoE 模型如何用 15B 激活参数吊打 671B 巨头?
人工智能·语言模型·自然语言处理
waterfeeling3 小时前
AGI时代如何选取合适的LLM(大语言模型)? -- 浅谈LLM评测
人工智能·语言模型·agi
Toky丶4 小时前
【文献阅读】BitNet Scaling 1-bit Transformers for Large Language Models
人工智能·语言模型·自然语言处理
且去填词4 小时前
DeepSeek-R1 实战:数据分析
人工智能·python·mysql·语言模型·deepseek·structured data
reesn5 小时前
模型转ONNX流程指南
人工智能·语言模型