机器学习(笔记)

1. 人工智能

1.1 人工智能三要素

人工智能有三要素:数据、算法、计算力。

1.2 CPU和GPU

CPU主要适合I\O密集型的任务,主要是输入和输出。

GPU主要适合计算密集型的任务。

1.3 什么样的程序适合在GPU上运行

计算密集型的程序和易于并行的程序

1.4 人工智能、机器学习、深度学习的关系

机器学习是人工智能的一个实现途径。

深度学习是机器学习的一个方法(神经网络)发展而来的。

2. 机器学习

2.1 什么是机器学习

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测

2.2 机器学习工作流程

机器学习的工作流程:

  1. 获取数据
  2. 数据基本数据
  3. 特征工程
  4. 机器学习(模型训练)
  5. 模型评估(达到要求后,就可以上线服务。达不到要求就重复2~5)

2.2.1 数据集

数据集是由特征值和目标值构成,然而部分数据集也存在没有目标值的情况。例如:分类

数据集中一行数据称为一个样本,一列数据称为一个特征。

数据集分为训练数据和测试数据,一般训练数据占比为70%~80%,测试数据占比为20%~30%

2.2.2 模型评估

模型评估中会出现,过拟合和欠拟合。

过拟合是指,学的特征太多,不好泛化。

欠拟合是指,学的特征太少。

3. jupyter notebook安装

3.1 环境变量

在磁盘中创建一个文件夹,例如:G:\AI

创建一个系统变量WORKON_HOME,变量值为新建的文件夹

3.2 安装virtualenv和virtualenvwrapper-win

powershell 复制代码
pip install virtualenv
pip install virtualenvwrapper-win

安装完成后,在新建的目录下面,用管理员的方式打开cmd,然后执行mkvirtualenv ai

此时会新建一个ai的虚拟环境,在对应的目录下面会新增一个ai的文件夹。

3.3 安装相关Python库

进入ai虚拟环境,命令为:workon ai

powershell 复制代码
pip install matplotlib
pip install numpy
pip install pandas
pip install tables
pip install jupyter

3.4 执行jupyter

首先要进入虚拟环境,然后运行jupyter

powershell 复制代码
workon ai
jupyter notebook

然后访问http://localhost:8888/tree就可以打开了。

3.5 汉化

安装语言包:pip install jupyterlab-language-pack-zh-CN

相关推荐
yuhaiqiang2 小时前
为什么我建议你不要只问一个AI?🤫偷偷学会“群发”,答案准到离谱!
人工智能·后端·ai编程
踩着两条虫4 小时前
AI 智能体如何重构开发工作流
前端·人工智能·低代码
大模型真好玩4 小时前
大模型训练全流程实战指南工具篇(八)——EasyDataset问答数据集生成流程
人工智能·langchain·deepseek
Johny_Zhao5 小时前
OpenClaw中级到高级教程
linux·人工智能·信息安全·kubernetes·云计算·yum源·系统运维·openclaw
比尔盖茨的大脑7 小时前
AI Agent 架构设计:从 ReAct 到 Multi-Agent 系统
前端·人工智能·全栈
后端小肥肠8 小时前
OpenClaw 实战|多 Agent 打通小红书:数据收集 + 笔记编写 + 自动发布一步到位
人工智能·aigc·agent
银河系搭车客指南8 小时前
OpenClaw 多 Agent 实战指南:Multi-Agent Routing 与 Sub-Agents 的正确打开方式
人工智能
手机不死我是天子8 小时前
拆解大模型二:Transformer 最核心的设计,其实你高中就学过
人工智能·llm
gustt8 小时前
MCP协议进阶:构建多工具Agent实现智能查询与浏览器交互
人工智能·agent·mcp
Halo咯咯8 小时前
Claude Code 的工程哲学:缓存与工具设计的真实教训 | 经验分享
人工智能