本专栏旨在快速上手大模型相关内容,补齐大模型相关基础。
1 什么是机器学习
1.1 Arthur Samuel(1959)
Field of study that gives computers the ability to learn without being explicitly programmed.
让计算机在没有明确编程情况下具有学习能力。
1.2 Tom Mitchell (1998)
A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
计算机程序从经验E中学习,解决任务T,进行某一性能衡量P,通过P测定在T上的表现因经验E而提高。
1.3 示例
1.3.1 跳棋游戏
E:算法 VS 我 的n次跳棋经验
T:下跳棋
P:与新对手下跳棋时的胜率
1.3.2 垃圾邮件分类
2 主要学习算法分类
2.1 监督学习(Supervised Learning)
2.1.1 定义
学习x到y,即输入、输出映射算法。提供学习算法示例以供学习,其中包括正确答案(给定输入x的正确标签y),并且通过查看输入x和输出标签y的正确匹配对,最终达到只有输入x时预测出y。监督学习有回归和分类算法。
2.1.2 回归算法 (Regression)
从无数可能的数字中预测一个数字。
示例:房价预测,输入房子平方数,输出预测房价。
2.1.3 分类算法(Classification)
对一个类别作出预测。
示例:统计医院检查肿瘤良性、恶性情况,根据肿瘤大小、病人年纪划分出高风险患癌区域。
2.2 无监督学习(Unsupervised Learning)
和监督学习比较,最大特点是无标签,其根据数据结构进行区分。肿瘤检查示例中,无监督学习只会将良性、恶性肿瘤分成两块,但它也不知道这两块数据是什么(如聚类算法、异常检测算法)。
2.3 其他
强化学习(Reinforcemen Learning)、推荐系统(Recommender Systems)
3 VSCode下使用Jupyter Notebooks
Jupyter Notebooks用于后续机器学习代码编译学习,其安装好类似于浏览器,亦可在VS Code上使用。
3.1 确认python版本
博主使用Ubuntu20.04,python默认版本3.8.10
python3 --version
如果没有,如下指令安装:
sudo apt update && sudo apt upgrade -y sudo apt install python3 python3-pip -y
3.2 VS Code安装
博主已安装,安装指令如下:
sudo snap install code --classic
3.3 安装Jupyter Notebook
博主在虚拟环境下使用Jupyter Notebook,方法如下。
3.3.1 安装venv
模块()
sudo apt install python3-venv -y
3.3.2 激活虚拟环境
source ~/myenv/bin/activate
3.3.3 安装notebook和jupyterlab
pip install --upgrade pip pip install "notebook==7.2.2" "jupyterlab==4.2.5"
3.3.4 测试Jupyter Notebook安装成功
jupyter notebook
安装成功会打开一个网页。
3.3.5 建立与VS Code联系
(1)安装Jupyter与Python
(2)下载课程学习代码
https://download.csdn.net/download/weixin_45728280/92130674
(3)设置解释器
按:Ctrl + Shift + P
输入:Python: Select Interpreter,回车
输入解释器路径-查找,博主安装路径为/home/ch/myenv/bin/python,此处改为自己虚拟环境安装位置。
(4)打开课程代码
找到work,点击带.jpynb后缀的文件即可。