机器学习(笔记)

1. 人工智能

1.1 人工智能三要素

人工智能有三要素:数据、算法、计算力。

1.2 CPU和GPU

CPU主要适合I\O密集型的任务,主要是输入和输出。

GPU主要适合计算密集型的任务。

1.3 什么样的程序适合在GPU上运行

计算密集型的程序和易于并行的程序

1.4 人工智能、机器学习、深度学习的关系

机器学习是人工智能的一个实现途径。

深度学习是机器学习的一个方法(神经网络)发展而来的。

2. 机器学习

2.1 什么是机器学习

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测

2.2 机器学习工作流程

机器学习的工作流程:

  1. 获取数据
  2. 数据基本数据
  3. 特征工程
  4. 机器学习(模型训练)
  5. 模型评估(达到要求后,就可以上线服务。达不到要求就重复2~5)

2.2.1 数据集

数据集是由特征值和目标值构成,然而部分数据集也存在没有目标值的情况。例如:分类

数据集中一行数据称为一个样本,一列数据称为一个特征。

数据集分为训练数据和测试数据,一般训练数据占比为70%~80%,测试数据占比为20%~30%

2.2.2 模型评估

模型评估中会出现,过拟合和欠拟合。

过拟合是指,学的特征太多,不好泛化。

欠拟合是指,学的特征太少。

3. jupyter notebook安装

3.1 环境变量

在磁盘中创建一个文件夹,例如:G:\AI

创建一个系统变量WORKON_HOME,变量值为新建的文件夹

3.2 安装virtualenv和virtualenvwrapper-win

powershell 复制代码
pip install virtualenv
pip install virtualenvwrapper-win

安装完成后,在新建的目录下面,用管理员的方式打开cmd,然后执行mkvirtualenv ai

此时会新建一个ai的虚拟环境,在对应的目录下面会新增一个ai的文件夹。

3.3 安装相关Python库

进入ai虚拟环境,命令为:workon ai

powershell 复制代码
pip install matplotlib
pip install numpy
pip install pandas
pip install tables
pip install jupyter

3.4 执行jupyter

首先要进入虚拟环境,然后运行jupyter

powershell 复制代码
workon ai
jupyter notebook

然后访问http://localhost:8888/tree就可以打开了。

3.5 汉化

安装语言包:pip install jupyterlab-language-pack-zh-CN

相关推荐
Lei活在当下11 分钟前
【AI手记系列-2026/6/18】iSparto & Harness,Caveman 以及AI时代的生存指南
人工智能·llm·openai
冬奇Lab2 小时前
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite
数据库·人工智能·llm
冬奇Lab2 小时前
Agent 系列(22):Context Engineering 深度——三种上下文管理策略的量化对比
人工智能·agent
hboot2 小时前
AI工程师第二课 - 数据处理
人工智能·python·数据分析
程序员cxuan2 小时前
DeepSeek 杀入多模态,识图功能正式上线!
人工智能·后端·程序员
米小虾4 小时前
告别单打独斗:2026年多Agent协作架构实战指南
人工智能·agent
IT_陈寒5 小时前
SpringBoot这个自动配置坑我跳了三次
前端·人工智能·后端
Larcher5 小时前
AI Loop:让AI像人一样自主完成任务的核心机制
javascript·人工智能·设计模式
牧艺6 小时前
从零到协同:构建类飞书在线文档系统的五个技术重难点
前端·人工智能