Azure ML Studio 中的高级机器学习建模
介绍
在处理复杂的数据科学问题时,数据科学家必须了解先进的机器学习算法。一些实际用例包括文本表征、基于生物属性的患者分类、图像识别和股市预测。这些先进的算法可以处理复杂的数据,并用于医疗保健、银行、教育、电信和零售等行业。
在本指南中,您将学习如何使用 Azure 机器学习工作室构建和评估高级机器学习模型,例如支持向量机和神经网络。
数据
在本指南中,您将使用 Azure 机器学习工作室中提供的 Pima Indian 糖尿病数据集。该数据最初来自美国国家糖尿病、消化和肾脏疾病研究所。该数据集由多个变量组成,例如患者的怀孕次数、BMI、胰岛素水平、年龄等。您可以在此处查看这些数据。
首先加载数据。
加载并探索数据
登录 Azure 机器学习工作室帐户后,单击左侧栏列出的“实验”选项,然后单击“新建”按钮。
接下来,单击一个空白实验并将实验命名为Advanced ML。在Saved datasets下,将Pima Indians Diabetes数据集拖到工作区中。
加载数据后,下一步就是探索它。为此,请右键单击并选择“可视化”选项,如下所示。
数据包含 768 行和 9 列。选择不同的变量以检查其基本统计数据。例如,下图显示了Class 变量的详细信息。
支持向量机
支持向量机 (SVM) 是一种先进的机器学习算法,可用于分类和回归机器学习问题。SVM 算法的工作原理是创建一个 n 维特征空间(称为超平面),用于分析和识别输入数据中的模式。在此数据中,模型将创建一个具有八个独立变量的超平面,并且该超平面将以最明显的方式划分目标变量的各个类别。
在 Azure 机器学习工作室中,双类支持向量机模块用于创建支持向量机算法。首先搜索模块并将其拖到工作区中。
工作区中已有模块,下一步是对其进行配置。在“创建训练器模式”中,选择“单参数”选项,该选项在您知道如何配置算法时使用。第二个参数是“迭代次数”,表示构建模型时使用的迭代次数。将此值设置为 3。Lambda 值用于调整模型参数。选择“规范化特征”选项,它将规范化特征。在“随机数种子”中键入一个整数值以确保可重复性。
您已设置好模型,下一步是模型验证。一种流行的交叉验证技术是 k 折交叉验证。在 k 折交叉验证中,数据被分成 k 折。模型在 k-1 折上进行训练,其中一折用于测试。
例如,如果将 k 设置为 10,则数据将被分成十个相等的部分。之后,将在前九个部分上构建模型,而评估将在第十个部分或折叠上进行。重复此过程以确保数据集的每个折叠都有机会成为保留集。完成此过程后,您可以使用平均值或标准差来总结评估指标。
交叉验证模型模块在 Azure 机器学习工作室中执行此任务。搜索并将交叉验证模型模块拖到工作区中,如下所示。
您已加载模块,下一步是连接它们。如下所示。
可以看到Cross Validate Model旁边有红旗,需要修正。点击Launch 列选择器选项,选择目标变量Class variable,如下图所示。
运行实验。
模型评估
模型建立完成后,下一步就是了解模型结果。模型评估结果可以在右侧输出端口中查看,其中显示了按折叠(数据集)的评估结果。
右键单击并选择可视化选项。
将显示以下输出,以按折叠显示评估结果。共有十个折叠,从零到九,每个折叠都有多个指标的结果,例如准确率、精确率、召回率等。
如果向下滚动,您将看到十倍的平均结果。
从上面的输出中,可以推断出该支持向量机模型的平均准确度、F 分数和 AUC 值分别为 0.77、0.63 和 0.83。
神经网络
Azure 机器学习工作室中的二分类神经网络模块用于训练二元分类的神经网络算法。
神经网络是一组互连的层,用于解决高级机器学习和人工智能问题。神经网络通常比传统算法表现更好,因为它们具有非线性、变量交互和自定义的优势。对于本指南中使用的数据,此算法会创建一个由输入层、输出层和隐藏层组成的网络,以对目标变量(类变量)进行预测。
搜索并将模块拖入工作区。
下一步是将交叉验证模型模块拖入工作区并按下图所示连接模块。
运行实验。如果成功运行,所有模块都会出现绿色勾号。
模型评估
要评估模型性能,请右键单击并选择“可视化”选项。
如前所述,共有 10 个折叠,并按折叠显示评估结果。
如果向下滚动,您将看到十倍的平均结果。
从上面的输出中,可以推断出神经网络模型的平均准确度、F 分数和 AUC 值分别为 0.76、0.60 和 0.83。
两种算法的比较
两种机器学习算法都表现良好,但支持向量机算法在准确率、F 分数和 AUC 值等评估指标上的表现略优于神经网络模型。
结论
在本指南中,你学习了两种高级机器学习算法(支持向量机和神经网络)的基础知识。你还学习了如何在 Azure 机器学习工作室中配置和评估这两种算法。
要了解有关使用 Azure 机器学习工作室进行数据科学和机器学习的更多信息,请参阅以下指南:
<a href="https://www-pluralsight-com.translate.goog/resources/blog/guides/classification-modeling-with-azure-ml-studio?_x_tr_sl=en&_x_tr_tl=zh-CN&_
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~