快速上手大模型:机器学习1

本专栏旨在快速上手大模型相关内容,补齐大模型相关基础。

1 什么是机器学习

1.1 Arthur Samuel(1959)

Field of study that gives computers the ability to learn without being explicitly programmed.

让计算机在没有明确编程情况下具有学习能力。

1.2 Tom Mitchell (1998)

A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.

计算机程序从经验E中学习,解决任务T,进行某一性能衡量P,通过P测定在T上的表现因经验E而提高。

1.3 示例
1.3.1 跳棋游戏

E:算法 VS 我 的n次跳棋经验

T:下跳棋

P:与新对手下跳棋时的胜率

1.3.2 垃圾邮件分类

2 主要学习算法分类

2.1 监督学习(Supervised Learning)
2.1.1 定义

学习x到y,即输入、输出映射算法。提供学习算法示例以供学习,其中包括正确答案(给定输入x的正确标签y),并且通过查看输入x和输出标签y的正确匹配对,最终达到只有输入x时预测出y。监督学习有回归和分类算法。

2.1.2 回归算法 (Regression)

从无数可能的数字中预测一个数字。
示例:

房价预测,输入房子平方数,输出预测房价。

2.1.3 分类算法(Classification)

对一个类别作出预测。
示例:

统计医院检查肿瘤良性、恶性情况,根据肿瘤大小、病人年纪划分出高风险患癌区域。

2.2 无监督学习(Unsupervised Learning)

和监督学习比较,最大特点是无标签,其根据数据结构进行区分。肿瘤检查示例中,无监督学习只会将良性、恶性肿瘤分成两块,但它也不知道这两块数据是什么(如聚类算法、异常检测算法)。

2.3 其他

强化学习(Reinforcemen Learning)、推荐系统(Recommender Systems)

3 VSCode下使用Jupyter Notebooks

Jupyter Notebooks用于后续机器学习代码编译学习,其安装好类似于浏览器,亦可在VS Code上使用。

3.1 确认python版本

博主使用Ubuntu20.04,python默认版本3.8.10

复制代码
python3 --version

如果没有,如下指令安装:

复制代码
sudo apt update && sudo apt upgrade -y
sudo apt install python3 python3-pip -y
3.2 VS Code安装

博主已安装,安装指令如下:

复制代码
sudo snap install code --classic
3.3 安装Jupyter Notebook

博主在虚拟环境下使用Jupyter Notebook,方法如下。

3.3.1 安装venv模块()
复制代码
sudo apt install python3-venv -y
3.3.2 激活虚拟环境
复制代码
source ~/myenv/bin/activate
3.3.3 安装notebook和jupyterlab
复制代码
pip install --upgrade pip
pip install "notebook==7.2.2" "jupyterlab==4.2.5"
3.3.4 测试Jupyter Notebook安装成功
复制代码
jupyter notebook

安装成功会打开一个网页。

3.3.5 建立与VS Code联系

(1)安装Jupyter与Python

(2)下载课程学习代码

https://download.csdn.net/download/weixin_45728280/92130674

(3)设置解释器

按:Ctrl + Shift + P

输入:Python: Select Interpreter,回车

输入解释器路径-查找,博主安装路径为/home/ch/myenv/bin/python,此处改为自己虚拟环境安装位置。

(4)打开课程代码

找到work,点击带.jpynb后缀的文件即可。

相关推荐
handsomestWei1 分钟前
RAG知识图谱简介
人工智能·知识图谱·rag·lightrag
IT_陈寒1 分钟前
Python的异步陷阱:我竟然被await坑了一整天
前端·人工智能·后端
中钧科技1 分钟前
数字化的本质、核心、重点各是什么?
大数据·人工智能
硅农深芯5 分钟前
解析RF信号的调制方式
人工智能·语音识别·信号处理·rf·射频·调制
连线Insight6 分钟前
林俊旸离开后,吴泳铭猛补AI课
人工智能
拓端研究室7 分钟前
2026中国医疗健康行业趋势报告:投融资回暖、AI渗透与产业链提价|附100+份报告PDF、数据、可视化模板汇总下载
人工智能·物联网·microsoft
机器学习之心8 分钟前
基于CNN卷积神经网络的轴承剩余寿命预测MATLAB实现
人工智能·matlab·cnn·轴承剩余寿命预测
墨染天姬9 分钟前
【AI】开源skill
人工智能
没有梦想的咸鱼185-1037-166310 分钟前
AI大模型支持下的顶刊绘图|散点图、气泡图、柱状图、热力图、柱状图、热力图、箱线图、热力图、云雨图、韦恩图、瀑布图、神经网络图、时间序列或分布展示
人工智能·神经网络·arcgis·信息可视化·数据分析·r语言·ai写作