Azure 机器学习 - 使用 Jupyter Notebook 探索 Azure 机器学习

目录

本文介绍如何创建并连接到安全的 Azure 机器学习工作区。 本文中的步骤使用 Azure 机器学习托管虚拟网络围绕 Azure 机器学习使用的资源创建安全边界。
关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人。

一、前言

在本教程中,你将完成以下任务:

  • 创建配置为使用托管虚拟网络的 Azure 机器学习工作区。
  • 创建 Azure 机器学习计算群集。 在云中训练机器学习模型时会用到计算群集。

完成本教程后,你将拥有以下体系结构:

  • 使用专用终结点的 Azure 机器学习工作区,用于使用托管网络进行通信。

  • 借助使用专用终结点的 Azure 存储帐户,可以让存储服务(如 Blob 和文件)使用托管网络进行通信。

  • 使用专用终结点的 Azure 容器注册表通过托管网络进行通信。

  • 使用专用终结点的 Azure Key Vault 通过托管网络进行通信。

  • 受托管网络保护的 Azure 机器学习计算实例和计算群集。

  • Azure 订阅。 如果没有 Azure 订阅,请在开始操作前先创建一个免费帐户。 试用免费版或付费版 Azure 机器学习


二、创建跳转盒 (VM)

可以通过多种方式连接到安全的工作区。 本教程中将会用到跳转盒。 跳转盒是 Azure 虚拟网络中的虚拟机。 可以使用 Web 浏览器和 Azure Bastion 连接到它。

下表列出了可以连接到安全工作区的其他几种方法:

方法 说明
Azure VPN 网关 通过专用连接将本地网络连接到 Azure 虚拟网络。 工作区的专用终结点将在该虚拟网络中创建。 通过公共 Internet 建立连接。
ExpressRoute 通过专用连接将本地网络连接到云。 使用连接提供程序建立连接。

重要

使用"VPN 网关"或"ExpressRoute"时,需要规划名称解析在本地资源与云端资源之间的工作方式。 有关详细信息,请参阅使用自定义 DNS 服务器

使用以下步骤创建 Azure 虚拟机以用作跳转盒。 然后,可以从 VM 桌面使用 VM 上的浏览器连接到托管虚拟网络内的资源,例如 Azure 机器学习工作室。 或者,可以在 VM 上安装开发工具。

提示

以下步骤将创建 Windows 11 企业版 VM。 根据要求,可能需要选择不同的 VM 映像。 如果需要将 VM 加入组织的域,Windows 11(或 10)企业版映像非常有用。

  1. Azure 门户中,选择左上角的门户菜单。 从菜单中选择"+ 创建资源",然后输入"虚拟机"。 选择"虚拟机"条目,然后选择"创建"。

  2. 从"基本信息 "选项卡中,选择要在其中创建服务的订阅资源组区域。 提供以下字段的值:

    • 虚拟机名称:VM 的唯一名称。

    • 用户名:将用于登录 VM 的用户名。

    • 密码:用户名的密码。

    • 安全类型:标准。

    • 映像:Windows 11 企业版。

      提示

      如果 Windows 11 企业版不在映像选择列表中,请使用"查看所有映像"_。 找到 Microsoft 的"Windows 11"条目,然后使用"选择"下拉菜单选择企业版映像。

    可将其他字段保留为默认值。

  1. 选择"网络"。 查看网络信息,确保它未使用 172.17.0.0/16 IP 地址范围。 如果使用了,请选择其他范围,例如 172.16.0.0/16;172.17.0.0/16 范围可能会导致与 Docker 冲突。

    备注

    Azure 虚拟机将创建自己的 Azure 虚拟网络以实现网络隔离。 此网络独立于 Azure 机器学习使用的托管虚拟网络。

  1. 选择"查看 + 创建"。 确认信息无误,然后选择"创建"。

为 VM 启用 Azure Bastion

使用 Azure Bastion,可通过浏览器连接到 VM 桌面。

  1. 在 Azure 门户中,选择之前创建的 VM。 在页面的"操作"部分中,选择"Bastion",然后选择"部署 Bastion"。
  1. 部署 Bastion 服务后,会看到一个连接页面。 暂时保留此对话框中的内容。

三、创建工作区

  1. Azure 门户中,选择左上角的门户菜单。 从菜单中,选择"+ 创建资源 ",然后输入"Azure 机器学习 "。 选择"Azure 机器学习 "条目,然后选择"创建"。

  2. 从"基本信息 "选项卡中,选择要在其中创建服务的订阅资源组区域 。 对于"工作区名称",请输入唯一名称。 让其余字段保留默认值;将为工作区创建所需服务的新实例。

  1. 在"网络"选项卡中,选择"Internet 出站专用"。
  1. 在"网络"选项卡的"工作区入站访问"部分中,选择"+ 添加"。
  1. 在"创建专用终结点"窗体的"名称"字段中输入唯一值。 选择之前使用 VM 创建的虚拟网络,并选择默认子网。 将其余字段保留为默认值。 选择"确定",以保存此终结点。
  1. 选择"查看 + 创建"。 确认信息无误,然后选择"创建"。

  2. 创建工作区后,选择"转到资源"。


四、连接到 VM 桌面

  1. Azure 门户中,选择之前创建的 VM。

  2. 在"连接"部分中,选择"Bastion"。 输入为 VM 配置的用户名和密码,然后选择"连接"。


五、连接到机器学习工作室

此时,已创建工作区,但尚未创建托管虚拟网络。 托管虚拟网络是在创建工作区时配置的,但不会在创建第一个计算资源或手动预配之前完成创建。

请遵循以下步骤来创建计算实例。

  1. 在 VM 桌面上,使用浏览器打开 Azure 机器学习工作室并选择之前创建的工作区。

  2. 在工作室中,依次选择"计算 "、"计算实例 "和"+ 新建"。

  1. 在"配置所需设置 "对话框中,为"计算名称"输入唯一值。 让其余选择保留默认值。

  2. 选择"创建" 。 创建计算实例需要几分钟时间。 计算实例是在托管网络中创建的。

    提示

    创建第一个计算资源可能需要几分钟时间。 导致此延迟的原因是托管虚拟网络也在创建中。 在创建第一个计算资源之前,不会创建托管虚拟网络。 后续托管计算资源的创建速度要快得多。

允许工作室访问存储

由于 Azure 机器学习工作室部分运行在客户端的 Web 浏览器中,因此客户端需要能够直接访问工作区的默认存储帐户来执行数据操作。 若要启用该功能,请使用以下步骤:

  1. Azure 门户中,选择之前创建的跳转盒 VM。 从"概述 "部分复制"公共 IP 地址"。

  2. Azure 门户中,选择之前创建的工作区。 从"概述"部分选择"存储"条目的链接。

  3. 从存储帐户中选择"网络 ",然后将跳转盒的_公共_ IP 地址添加到"防火墙"部分。

    提示

    在使用 VPN 网关或 ExpressRoute 而不是跳转盒的情况下,可以将存储帐户的专用终结点或服务终结点添加到 Azure 虚拟网络。 使用专用终结点或服务终结点,通过 Azure 虚拟网络连接的多个客户端就可以通过工作室成功执行存储操作。

    此时,可以使用该工作室以交互方式在计算实例上使用笔记本,并运行训练作业。 如需相关教程,请参阅教程:模型开发


六、停止计算实例

当它运行(启动)时,计算实例会继续向你的订阅收费。 为了避免额外成本,请在未使用时停止运行。

在工作室中,选择"计算 "、"计算实例",然后选择计算实例。 最后,从页面顶部选择"停止"。


七、清理资源

如果打算继续使用安全的工作区和其他资源,请跳过本部分。

若要删除本教程中创建的所有资源,请执行以下步骤:

  1. 在 Azure 门户中,选择"资源组"。

  2. 从列表中选择你在本教程中创建的资源组。

  3. 选择"删除资源组"。

  1. 输入资源组名称,然后选择"删除"。

关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人。

相关推荐
幻风_huanfeng17 分钟前
线性代数中的核心数学知识
人工智能·机器学习
volcanical25 分钟前
LangGPT结构化提示词编写实践
人工智能
weyson1 小时前
CSharp OpenAI
人工智能·语言模型·chatgpt·openai
RestCloud1 小时前
ETLCloud异常问题分析ai功能
人工智能·ai·数据分析·etl·数据集成工具·数据异常
IT古董1 小时前
【机器学习】决定系数(R²:Coefficient of Determination)
人工智能·python·机器学习
鲜枣课堂2 小时前
5G-A如何与AI融合发展?华为MBBF2024给出解答
人工智能·5g·华为
武子康3 小时前
大数据-213 数据挖掘 机器学习理论 - KMeans Python 实现 距离计算函数 质心函数 聚类函数
大数据·人工智能·python·机器学习·数据挖掘·scikit-learn·kmeans
武子康3 小时前
大数据-214 数据挖掘 机器学习理论 - KMeans Python 实现 算法验证 sklearn n_clusters labels
大数据·人工智能·python·深度学习·算法·机器学习·数据挖掘
封步宇AIGC4 小时前
量化交易系统开发-实时行情自动化交易-Okex K线数据
人工智能·python·机器学习·数据挖掘
DisonTangor4 小时前
微软的新模拟器将为 Windows on Arm 带来更多游戏
arm开发·游戏·microsoft