快速上手大模型:机器学习1

本专栏旨在快速上手大模型相关内容,补齐大模型相关基础。

1 什么是机器学习

1.1 Arthur Samuel(1959)

Field of study that gives computers the ability to learn without being explicitly programmed.

让计算机在没有明确编程情况下具有学习能力。

1.2 Tom Mitchell (1998)

A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.

计算机程序从经验E中学习,解决任务T,进行某一性能衡量P,通过P测定在T上的表现因经验E而提高。

1.3 示例
1.3.1 跳棋游戏

E:算法 VS 我 的n次跳棋经验

T:下跳棋

P:与新对手下跳棋时的胜率

1.3.2 垃圾邮件分类

2 主要学习算法分类

2.1 监督学习(Supervised Learning)
2.1.1 定义

学习x到y,即输入、输出映射算法。提供学习算法示例以供学习,其中包括正确答案(给定输入x的正确标签y),并且通过查看输入x和输出标签y的正确匹配对,最终达到只有输入x时预测出y。监督学习有回归和分类算法。

2.1.2 回归算法 (Regression)

从无数可能的数字中预测一个数字。
示例:

房价预测,输入房子平方数,输出预测房价。

2.1.3 分类算法(Classification)

对一个类别作出预测。
示例:

统计医院检查肿瘤良性、恶性情况,根据肿瘤大小、病人年纪划分出高风险患癌区域。

2.2 无监督学习(Unsupervised Learning)

和监督学习比较,最大特点是无标签,其根据数据结构进行区分。肿瘤检查示例中,无监督学习只会将良性、恶性肿瘤分成两块,但它也不知道这两块数据是什么(如聚类算法、异常检测算法)。

2.3 其他

强化学习(Reinforcemen Learning)、推荐系统(Recommender Systems)

3 VSCode下使用Jupyter Notebooks

Jupyter Notebooks用于后续机器学习代码编译学习,其安装好类似于浏览器,亦可在VS Code上使用。

3.1 确认python版本

博主使用Ubuntu20.04,python默认版本3.8.10

复制代码
python3 --version

如果没有,如下指令安装:

复制代码
sudo apt update && sudo apt upgrade -y
sudo apt install python3 python3-pip -y
3.2 VS Code安装

博主已安装,安装指令如下:

复制代码
sudo snap install code --classic
3.3 安装Jupyter Notebook

博主在虚拟环境下使用Jupyter Notebook,方法如下。

3.3.1 安装venv模块()
复制代码
sudo apt install python3-venv -y
3.3.2 激活虚拟环境
复制代码
source ~/myenv/bin/activate
3.3.3 安装notebook和jupyterlab
复制代码
pip install --upgrade pip
pip install "notebook==7.2.2" "jupyterlab==4.2.5"
3.3.4 测试Jupyter Notebook安装成功
复制代码
jupyter notebook

安装成功会打开一个网页。

3.3.5 建立与VS Code联系

(1)安装Jupyter与Python

(2)下载课程学习代码

https://download.csdn.net/download/weixin_45728280/92130674

(3)设置解释器

按:Ctrl + Shift + P

输入:Python: Select Interpreter,回车

输入解释器路径-查找,博主安装路径为/home/ch/myenv/bin/python,此处改为自己虚拟环境安装位置。

(4)打开课程代码

找到work,点击带.jpynb后缀的文件即可。

相关推荐
小鸡吃米…6 分钟前
机器学习 - K - 中心聚类
人工智能·机器学习·聚类
好奇龙猫43 分钟前
【AI学习-comfyUI学习-第三十节-第三十一节-FLUX-SD放大工作流+FLUX图生图工作流-各个部分学习】
人工智能·学习
沈浩(种子思维作者)1 小时前
真的能精准医疗吗?癌症能提前发现吗?
人工智能·python·网络安全·健康医疗·量子计算
minhuan1 小时前
大模型应用:大模型越大越好?模型参数量与效果的边际效益分析.51
人工智能·大模型参数评估·边际效益分析·大模型参数选择
Cherry的跨界思维1 小时前
28、AI测试环境搭建与全栈工具实战:从本地到云平台的完整指南
java·人工智能·vue3·ai测试·ai全栈·测试全栈·ai测试全栈
MM_MS1 小时前
Halcon变量控制类型、数据类型转换、字符串格式化、元组操作
开发语言·人工智能·深度学习·算法·目标检测·计算机视觉·视觉检测
ASF1231415sd1 小时前
【基于YOLOv10n-CSP-PTB的大豆花朵检测与识别系统详解】
人工智能·yolo·目标跟踪
水如烟2 小时前
孤能子视角:“意识“的阶段性回顾,“感质“假说
人工智能
Carl_奕然2 小时前
【数据挖掘】数据挖掘必会技能之:A/B测试
人工智能·python·数据挖掘·数据分析
旅途中的宽~2 小时前
《European Radiology》:2024血管瘤分割—基于MRI T1序列的分割算法
人工智能·计算机视觉·mri·sci一区top·血管瘤·t1