Azure ML Studio 入门
介绍
Azure 机器学习工作室 (ML Studio) 是 Microsoft 推出的一款图形化、协作式、拖放式 Web 界面,用于构建机器学习模型。它不需要 R 或 Python 的编码知识,并且可以使用云界面通过 ML Studio 构建模型。
ML Studio 包含设计、开发、训练、评估和共享机器学习模型所需的所有必要功能。在本指南中,您将了解 Azure ML Studio 的基础知识。它附带免费订阅,并提供足够的免费空间来遵循本指南中涵盖的主题。为了创建免费订阅,您可以访问此链接。
以下部分将指导您完成使用 Azure ML Studio 构建机器学习模型的六个步骤。
第一步:加载数据
完成订阅程序并打开 ML Studio 后,您将看到以下窗口。
在上图中,左侧边栏列出了许多功能。您将使用实验功能来构建机器学习模型。
首先,单击“实验”选项,然后单击“新建”按钮。接下来,单击空白实验,将显示以下屏幕。
您已准备好加载数据。有许多可用于数据导入的选项。例如,如果您想从本地系统上传文件,请单击新建,然后选择数据集选项,如下所示。
上述选择将打开下面显示的窗口,可用于从本地系统上传数据集。
您还可以使用 ML Studio 中提供的内置数据集。为此,请单击工作区中的“已保存的数据集”选项,如下所示。
这将打开 ML Studio 中可用的数据集列表。
将成人人口普查收入二元分类数据集从已保存的数据集列表拖到工作区中,并将其命名为“Azure ML Studio 入门”。
理解数据
成人人口普查收入二元分类数据集是 1994 年人口普查数据库的一个子集,使用年龄在 16 岁以上且调整后收入指数大于 100 的在职成年人。该数据用于分类机器学习问题,其目标是使用人口统计数据对人群进行分类,以预测一个人的年收入是否超过 50,000 美元。数据来自UCI 机器学习存储库。
要了解有关数据的更多信息,您可以右键单击并选择“可视化”选项,如下所示。
上面的选择打开了如下所示的窗口。有 32561 行和 15 列。选择任何变量都会显示其统计数据,如下所示。
向下滚动将显示所选变量的可视化效果。在本例中,显示的是年龄的直方图。
第二步:准备建模数据
在构建分类模型之前,需要准备数据。首先,将字符串变量转换为分类变量。首先在搜索栏中输入“编辑元数据”以找到编辑元数据模块,然后将其拖到工作区中。
下一步是单击位于工作区右侧的启动列选择器选项,然后从可用列中选择字符串变量。这将生成下面的输出。
做出选择后,所选列将显示在工作区中。接下来,从Categorical下的下拉选项中选择Make categorical选项。接下来,单击工作区底部的Run按钮,该按钮用于在 ML Studio 中执行工作区中的模块。如果任何模块都没有错误,则实验运行完成,您将看到一个绿色的勾号。
缺失值处理
常见的数据准备任务之一是处理缺失值。首先搜索并将清理缺失数据模块拖到实验工作区中。
接下来,将编辑元数据模块的输出端口与清理缺失数据模块的输入端口连接起来。
在工作区的右侧,有不同的选项可用于执行“清理缺失数据”操作。有几种处理缺失值的方法。其中一种高级技术是使用MICE技术。MICE 代表通过链式方程进行多元插补,它通过为多元缺失数据创建多个插补(替换值)来工作。在“清理模式”选项卡下,选择“使用 MICE 替换”选项,如下所示。将所有其他选项保留为默认值。
接下来,单击“运行”选项卡,并选择“运行所选”选项。这将仅运行尚未执行的模块。
缺失数据操作已执行,从模块中的绿色勾号可以看出。
第三步:创建训练和测试数据集
您将使用拆分数据模块将数据分为训练数据集和测试数据集。
在工作区右侧显示的“拆分数据”选项中,将“第一个拆分的行数”选项卡下的值更改为 0.7。这意味着您将 70% 的数据保留在训练集中,而其余 30% 将保留在测试集中。接下来,单击“运行”选项卡并选择“运行所选”。
执行完成后,Split Data模块的两个输出端口将包含训练和测试数据集。左侧输出端口包含训练数据,右侧输出端口包含测试数据集。
第四步:建立模型
第一步是训练模型。首先将训练模型模块拖到工作区中,如下所示。
由于目标变量是二进制的,因此您将构建一个二元分类算法。ML Studio 中有许多可用的分类算法。您将选择并将Two-Class Logistic Regression模块拖到工作区中。
接下来,将拆分数据模块的右端口输出连接到训练模型模块的左输入端口。此外,将二类逻辑回归模块与<font sty
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~