使用colab完成机器学习记录

步骤 1:打开电脑浏览器,登录并创建你的"笔记本"

打开 Colab:在地址栏输入 colab.research.google.com 并回车。

新建笔记本:点击页面上的"新建笔记本"按钮。

⚙️ 步骤 2:为项目开启"涡轮增压"(设置 GPU)

进入设置:点击顶部菜单栏的 运行时 -> 更改运行时类型。

选择 GPU:在"硬件加速器"下拉菜单中选择 GPU,然后点击"保存"。

验证生效:用快捷键 Shift + Enter 运行下面这个代码单元,如果最后一行输出 True,就说明成功啦。🎉

python

import torch

print(torch.cuda.is_available())

💡 小提示:如果你使用的是简体中文界面,菜单会是"代码执行程序"->"更改运行时类型"。

📁 步骤 3:把本地代码和数据"搬"到云端

Colab 的服务器是临时环境,所以需要手动把文件传上去。

在笔记本里操作:在新建的代码单元里运行下面这段代码,它会自动弹出一个窗口让你选择本地的文件。

python

from google.colab import files

先上传到谷歌云端硬盘

把谷歌硬件云端的导入到colab这边

运行后会弹出窗口让你选文件

uploaded = files.upload()

文件上传后,会保存在 /content/ 目录下。

通过云盘同步:如果你在 Google Drive 里已经把文件整理好了,那直接在笔记本里挂载,能省不少事。

运行下面的代码,点击弹出的链接授权,并把授权码粘贴到出现的输入框里:

python

from google.colab import drive

drive.mount('/content/drive')

挂载成功后,你 Drive 里的所有文件就在 /content/drive/MyDrive/ 这个目录下了。

直接从网上下载:如果数据集有个直接的下载链接(URL),用 !wget 命令下载是最快的方法。

bash

记得把下面的下载链接换成你真正的

!wget -O dataset.zip "YOUR_DATASET_DOWNLOAD_URL"

⚙️ 步骤 4:在"实验室"里跑起训练

输入项目代码:把之前准备好的 GAN 代码,直接复制或写入到 Colab 的代码单元里。

一键开跑:点击代码单元左边的"播放"按钮,或者用快捷键 Shift + Enter 来执行。

无缝衔接:可以利用 GitHub 快速导入项目。Colab 支持直接从 GitHub 打开 .ipynb 文件(比如李宏毅老师课程的代码文件),省去上传的步骤。

👀 步骤 5:如何监控训练进展

直接打印:在训练循环里用 print(f'Epoch: {epoch}, Loss: {loss}') 直接看。

实时绘图:在同一个代码单元里,用 Matplotlib 实时绘制损失曲线也是个办法。

python

import matplotlib.pyplot as plt

在训练循环里...

loss_D_list.append(loss_D.item()) # 记录判别器损失

loss_G_list.append(loss_G.item()) # 记录生成器损失

每个 epoch 结束后画个图

plt.figure(figsize=(10,5))

plt.title("Generator and Discriminator Loss During Training")

plt.plot(loss_G_list, label="Generator")

plt.plot(loss_D_list, label="Discriminator")

plt.xlabel("iterations")

plt.ylabel("Loss")

plt.legend()

plt.show()

专业工具:还可以使用 torch.utils.tensorboard 来记录日志,然后在 Colab 里用 %load_ext tensorboard 和 %tensorboard --logdir logs/ 命令启动 TensorBoard 面板。这种方式的信息更全。

💾 步骤 6:保存模型与防中断技巧

防止断连:在浏览器中按 F12 打开"开发者工具",切换到"控制台"粘贴下面这段代码并回车。这会让页面每隔 55 秒模拟一次点击,避免因空闲超时而断连。

javascript

function ClickConnect(){

console.log("保持连接中...");

document.querySelector("colab-connect-button").click()

}

setInterval(ClickConnect, 55000)

不过请留意,这个脚本只能防止"空闲断开",无法绕过 Colab 12 小时的强制断开会话限制。

保存模型到云盘:挂载 Drive 后,可以直接把训练好的模型(.pth)存进去。

python

假设你的模型叫 G

torch.save(G.state_dict(), '/content/drive/MyDrive/my_gan_generator.pth')

下载到本地:模型较小的话,也可以直接用下面的代码下载到本地:

python

from google.colab import files

files.download('/content/my_gan_generator.pth')

📝 一个小结

简单来说,流程就是:

登录 Colab -> 新建笔记本 -> 启用 GPU -> 用代码单元写/传代码 -> 挂载 Drive 读数据 -> 运行训练(print/plot监控) -> 把模型存回 Drive 或下载到本地。

相关推荐
浑手营销2 小时前
浑手科技案例分享:133个精准询盘短视频玩法
前端·人工智能·科技
IT_陈寒2 小时前
SpringBoot自动配置的坑,差点让我加班到天亮
前端·人工智能·后端
俊哥V2 小时前
每日 AI 研究简报 · 2026-05-18
人工智能·ai
lwf0061642 小时前
【AI工具推荐】OpenSpec:让 AI 编程从“碰运气“变成“可预测“
人工智能
Wanderer X3 小时前
【LLM】code agent bench
人工智能
互联科技报3 小时前
2026年幻视AI数字工牌与全域零售AI解决方案官方指南
人工智能·零售
悟乙己3 小时前
构建金融级 AI Agent:Claude for Financial Services 架构解析
人工智能·金融·架构
烈风逍遥3 小时前
基于 Vue 3+Spring Boot 构建 RAG 智能知识库
人工智能
机器之心3 小时前
1/10成本、Opus 4.7级表现,Cursor甩出了性价比之王Composer 2.5
人工智能·openai