CSDN 大模型 笔记

AI 3大范式:计算 发发 交互


L1 生成代码 复制到IDEA (22年12-23年6,7月份)

L2 部分自动编程 定义class 设计interface 让其填充实现 (23年7,8月份)

L3 通用任务 CRUD (24年)

L4 高度自动编程 通用领域专有任务,进行推理,接企业数据库,项目集自动化 (25年)

deepseek 最大创新

预训练→推理能力


软件开发特点

1、复杂性:最小化复杂性,解耦合,抽象

2、动态性:瀑布模型(静态开发) → 敏捷开发(动态开发)。

3、协作性:谷歌的软件工程,Titus winters。编程不是软件工程。多人多版本开发。

推理范式解决的是软件的复杂性。 95%快思考,5%慢思考。 软件开发里慢思考占据99%。

解决复杂性2个手段:分解,抽象(例如设计模式)。抽象靠强大的推理支持。

推理是的大模型从 码农编程→架构师

(R1/O1 已具备)

学习开发过程解决动态性,而不是直接看现成的代码。

协调性上,大模型的组织能力还不行,组织者。


有了AI以后,岗位危险程度:开发<架构师<产品经理<项目经理

mult person multi version, 以后 person 被 Agent 代替,但是谁来组织呢? Agent要靠什么协作?


Open AI 5级能力

1级 聊天机器人 完成

2级 推理者 具有人类推理水平

3级 Agent

4级 innovator 创新者

5级


deepseek 8篇论文

相关推荐
什么都想学的阿超10 小时前
【大语言模型 02】多头注意力深度剖析:为什么需要多个头
人工智能·语言模型·自然语言处理
MARS_AI_16 小时前
云蝠智能VoiceAgent:AI赋能售后服务场景的创新实践
人工智能·语言模型·自然语言处理·人机交互·信息与通信
亚里随笔1 天前
稳定且高效:GSPO如何革新大型语言模型的强化学习训练?
人工智能·机器学习·语言模型·自然语言处理·llm·rlhf
Struart_R1 天前
SpatialVLM和SpatialRGPT论文解读
计算机视觉·语言模型·transformer·大语言模型·vlm·视觉理解·空间推理
skywalk81632 天前
LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。
人工智能·语言模型·自然语言处理
果粒橙_LGC2 天前
自学大语言模型之Transformer的Tokenizer
人工智能·语言模型·transformer
静心问道2 天前
CacheBlend:结合缓存知识融合的快速RAG大语言模型推理服务
人工智能·语言模型·模型加速
guidovans2 天前
基于大语言模型的爬虫数据清洗与结构化
人工智能·爬虫·语言模型·自然语言处理
月岛雫-2 天前
Revisiting Character-level Adversarial Attacks for Language Models
人工智能·语言模型·自然语言处理
m0_621966013 天前
飞书文档定时自动同步至百炼知识库
语言模型·飞书