使用colab完成机器学习记录

步骤 1:打开电脑浏览器,登录并创建你的"笔记本"

打开 Colab:在地址栏输入 colab.research.google.com 并回车。

新建笔记本:点击页面上的"新建笔记本"按钮。

⚙️ 步骤 2:为项目开启"涡轮增压"(设置 GPU)

进入设置:点击顶部菜单栏的 运行时 -> 更改运行时类型。

选择 GPU:在"硬件加速器"下拉菜单中选择 GPU,然后点击"保存"。

验证生效:用快捷键 Shift + Enter 运行下面这个代码单元,如果最后一行输出 True,就说明成功啦。🎉

python

import torch

print(torch.cuda.is_available())

💡 小提示:如果你使用的是简体中文界面,菜单会是"代码执行程序"->"更改运行时类型"。

📁 步骤 3:把本地代码和数据"搬"到云端

Colab 的服务器是临时环境,所以需要手动把文件传上去。

在笔记本里操作:在新建的代码单元里运行下面这段代码,它会自动弹出一个窗口让你选择本地的文件。

python

from google.colab import files

先上传到谷歌云端硬盘

把谷歌硬件云端的导入到colab这边

运行后会弹出窗口让你选文件

uploaded = files.upload()

文件上传后,会保存在 /content/ 目录下。

通过云盘同步:如果你在 Google Drive 里已经把文件整理好了,那直接在笔记本里挂载,能省不少事。

运行下面的代码,点击弹出的链接授权,并把授权码粘贴到出现的输入框里:

python

from google.colab import drive

drive.mount('/content/drive')

挂载成功后,你 Drive 里的所有文件就在 /content/drive/MyDrive/ 这个目录下了。

直接从网上下载:如果数据集有个直接的下载链接(URL),用 !wget 命令下载是最快的方法。

bash

记得把下面的下载链接换成你真正的

!wget -O dataset.zip "YOUR_DATASET_DOWNLOAD_URL"

⚙️ 步骤 4:在"实验室"里跑起训练

输入项目代码:把之前准备好的 GAN 代码,直接复制或写入到 Colab 的代码单元里。

一键开跑:点击代码单元左边的"播放"按钮,或者用快捷键 Shift + Enter 来执行。

无缝衔接:可以利用 GitHub 快速导入项目。Colab 支持直接从 GitHub 打开 .ipynb 文件(比如李宏毅老师课程的代码文件),省去上传的步骤。

👀 步骤 5:如何监控训练进展

直接打印:在训练循环里用 print(f'Epoch: {epoch}, Loss: {loss}') 直接看。

实时绘图:在同一个代码单元里,用 Matplotlib 实时绘制损失曲线也是个办法。

python

import matplotlib.pyplot as plt

在训练循环里...

loss_D_list.append(loss_D.item()) # 记录判别器损失

loss_G_list.append(loss_G.item()) # 记录生成器损失

每个 epoch 结束后画个图

plt.figure(figsize=(10,5))

plt.title("Generator and Discriminator Loss During Training")

plt.plot(loss_G_list, label="Generator")

plt.plot(loss_D_list, label="Discriminator")

plt.xlabel("iterations")

plt.ylabel("Loss")

plt.legend()

plt.show()

专业工具:还可以使用 torch.utils.tensorboard 来记录日志,然后在 Colab 里用 %load_ext tensorboard 和 %tensorboard --logdir logs/ 命令启动 TensorBoard 面板。这种方式的信息更全。

💾 步骤 6:保存模型与防中断技巧

防止断连:在浏览器中按 F12 打开"开发者工具",切换到"控制台"粘贴下面这段代码并回车。这会让页面每隔 55 秒模拟一次点击,避免因空闲超时而断连。

javascript

function ClickConnect(){

console.log("保持连接中...");

document.querySelector("colab-connect-button").click()

}

setInterval(ClickConnect, 55000)

不过请留意,这个脚本只能防止"空闲断开",无法绕过 Colab 12 小时的强制断开会话限制。

保存模型到云盘:挂载 Drive 后,可以直接把训练好的模型(.pth)存进去。

python

假设你的模型叫 G

torch.save(G.state_dict(), '/content/drive/MyDrive/my_gan_generator.pth')

下载到本地:模型较小的话,也可以直接用下面的代码下载到本地:

python

from google.colab import files

files.download('/content/my_gan_generator.pth')

📝 一个小结

简单来说,流程就是:

登录 Colab -> 新建笔记本 -> 启用 GPU -> 用代码单元写/传代码 -> 挂载 Drive 读数据 -> 运行训练(print/plot监控) -> 把模型存回 Drive 或下载到本地。

相关推荐
小雨下雨的雨3 小时前
井字棋AI机器人实现详解 - Minimax算法实战-鸿蒙PC Electron框架完成
前端·人工智能·算法·华为·electron·鸿蒙
我没胡说八道6 小时前
高校论文AI检测优化工具对比研究与实测分析(2026)
人工智能·深度学习·机器学习·计算机视觉·aigc·论文
秦亚伟6 小时前
AI浪潮重塑融资租赁行业新格局
人工智能
love530love6 小时前
LiveTalking 数字人项目 Windows 部署完全指南(EPGF 架构)
人工智能·windows·python·架构·livetalking·epgf
元启数宇6 小时前
喷淋AI布点实战:8小时人工布点→20分钟自动出图
人工智能
哈哈,柳暗花明6 小时前
人工智能专业术语详解(H)
人工智能·专业术语
圣殿骑士-Khtangc6 小时前
AI 编程工具 2026 实战横评:Cursor 3 vs Claude Code vs Copilot,开发者选型完全指南
人工智能·copilot
云器科技6 小时前
云器Lakehouse 2026年5月版本发布:拥抱 AI Agent,重塑数据智能开发新范式
人工智能
小鹰-上海鹰谷-电子实验记录本6 小时前
第六届党建引领科创生态座谈会 | 邓光辉博士出席分享AI赋能创新药科研新范式
人工智能·ai·电子实验记录本·药企合规
极客老王说Agent6 小时前
2026电信IDC机房巡检深度报告:人工巡检频次和深度够吗?实在Agent重塑智慧运维新范式
人工智能·ai·chatgpt