云认证:AWS 认证机器学习 - 专业
介绍
本指南涵盖 AWS Certified Machine Learning - Specialty 认证和机器学习术语的基本细节,并提供最佳实践的推荐资源。
需要了解的术语
人工智能 (AI)是计算机科学的一个广泛分支,主要致力于开发能够像人类一样智能思考的系统。开发人工智能系统的技术多种多样,可分为不同的子集,例如机器学习 (ML) 和深度学习 (DL)。
机器学习是使计算机系统能够自动学习并随着时间的推移逐步提高其性能的过程。通常,机器使用结构化数据样本进行训练,例如具有重量、颜色、形状和类型(标签)属性等详细信息的蔬菜。然后,训练后的模型将学习应用于未标记的数据以识别蔬菜的类型。
深度学习是让机器能够像人脑一样思考和处理数据的过程,即通过识别模式和分类技术(例如识别图像中的动物类型)。
数据类型
数据是机器学习的一个关键方面。数据可分为两类:
标记数据包含有关对象的详细信息以及所需结果的详细信息。结果(标签或标记)列的详细信息通常由人工获得,这就是标记数据集获取成本更高的原因。
未标记数据不包含任何结果列,因此无法用于训练机器。有各种机器学习技术可用于识别类似类型的数据并创建组,例如,从未标记数据中创建盈利或亏损的股票组。
机器学习技术
有许多类型的 ML 技术可以应用于不同类型的数据和问题。
- 监督学习是最常用的方法。它使用标记的样本数据集来训练模型,常用于图像识别、推荐系统、数据分析等。它对数值数据使用回归技术,对分类数据使用分类建模技术。一些流行的监督学习算法是线性回归、逻辑回归、决策树和随机森林。
- 无监督学习用于未标记的数据,通过识别常见模式或结构来为相似类型的数据创建组。它通常在没有可用的标记数据集时使用,例如,用于识别相同类型的文章组、产品推荐组等。它使用聚类技术(例如 k 均值、均值漂移、DBSCAN、期望最大化、凝聚层次聚类)和关联技术来查找数据之间的关系。其他技术包括异常检测(用于查找有问题的数据)和潜在变量模型(用于数据降维)。
- 强化学习需要来自环境的输入(通过人或机器)来确定每一步的正分和负分。一个简单的例子可能是一场国际象棋比赛,需要人类的输入来根据不同的国际象棋变体和策略提供正分或负分。它经常用于游戏、导航和机器人技术。最常见的算法是 Q 学习、SARSA、DQN 和 DDPG。
先决条件和推荐技能
AWS Certified Machine Learning - Specialty 认证面向数据科学家或专业机器学习开发人员。此认证侧重于使用 AWS 服务和工具进行数据操作和最佳机器学习解决方案开发的深度方面。
参加考试没有任何先决条件,但此认证需要基本的 STEM 知识以及解决问题和分析的能力。在机器学习领域取得成功所建议的技能包括:
- 数学:这包括对高中水平数学技能的深入了解,例如线性代数、统计学、概率、多元微积分、矩阵、算法等。
- 数据结构:数据通常借助预定义的数据结构(如矩阵、数组、列表、地图、图形等)进行处理和操作。
- 数据管理:数据是开发机器学习解决方案的重要组成部分。应使用数据建模、数据清理(归纳、异常值、分箱和规范化)和数据转换(CSV、流、JSON)技术来转换数据,以获得最佳结果。
- 算法:机器学习模型可以使用各种数学优化技术进行优化,例如凸优化、坐标或梯度下降、二次规划等。
- 领域特定知识:这不是一个硬性要求,但机器学习解决方案通常需要特定环境技能的知识,例如,制药行业的知识,以开发基于机器学习的药物发现解决方案。
- 性能:机器学习解决方案的评估是强制性的。有多种方法可用于评估机器学习解决方案的性能,例如精度和召回率、F1 分数、混淆矩阵等。
认证技术堆栈
AWS 为机器学习解决方案开发提供了各种工具和服务,包括:
- SageMaker:一项功能齐全的服务,可立即构建、训练和开发机器学习模型。它提供内置的 Sagemaker Studio IDE、Notebook(如 Jupyter)、用于构建数据集的 Ground Truth 服务、用于超参数调整的自动模型、内置算法、调试器和性能监控服务。
- 存储:数据存储服务,例如用于存储结构化或非结构化数据的 Data Lake、用于文件存储的 S3、用于 No-SQL 数据库的 DynamoDB、用于 SQL 数据库的关系数据库服务 (RDS)、用于块级存储(如硬盘)的弹性块存储 (EBS) 和用于数据仓库的 Redshift。
- 数据处理:可以使用 Amazon Glue 处理数据,从各种资源中提取、转换和加载数据,使用 Kinesis(Firehose、Streams、Analysis)进行实时数据(流)处理,使用 Athena 进行数据分析,使用 QuickSight 进行可视化和分析,使用 Elastic MapReduce(EMR)用于大数据框架,如 Apache Spark、Presto、Hive 等。
- 机器学习服务:AWS 包括针对不同领域的各种机器学习服务,例如用于语言处理(文本)的 Comprehend、用于面部检测的 Rekognition、用于语言翻译的 Translate、用于创建数字助理的 Lex、用于文本转语音的 Polly 以及用于语音转文本的 Transcribe。
- 其他服务:建议了解整体 AWS 和机器学习范式。了解身份和访问管理、弹性计算云、用于私有网络的 VPC、用于数据传输的管道、步骤函数、批处理等服务,以便设置自定义或混合设置。
除了 AWS 机器学习服务之外,AWS Certified Machine Learning - Specialty 认证还需要其他领域的知识,例如编程语言、数据库等。
认证流程详细信息
彻底学习培训和练习材料后,最后一步就是安排考试。考试的关键属性是:
形式:考试为多项选择题,答案可以有多个正确选项。只有选出正确的选项才会得分。
分数:及格分数标准通过统计分析(比例评分模型)确定,可能会发生变化。答错不扣分。
方法:考试可以在线进行(监考考试),也可以在PSI或 Pearson VUE 提供的实体考试中心进行。选择实体考试中心的好处是有机会结识其他开发人员并建立新联系。
对于在线监考考试,考生必须能够用英语与监考人员沟通,监考人员将监控考试环境。中国大陆、日本、斯洛文尼亚或韩国的考生无法参加在线监考考试。更多详细信息请见此处。有关系统要求和政策的更多信息请见此处。
由于 COVID-19,考试提供商已发布严格的安全措施指南。请遵循此处的PSI 指南和此处的Pearson VUE 指南,了解考试中心的可用性和安全措施。
时间:考试时间为 170 分钟,但根据内容不同,考试时间可能会有所变化。
费用:AWS Certified Machine Learning - Specialty 考试一次性费用为 300 美元,模拟考试费用为 40 美元。
Beta 计划:亚马逊有一个认证 Beta 计划,该计划会更改考试大纲或推出新认证。有限数量的考生可以提前参加 Beta 考试(先到先得),他们可以参加 Beta 考试以及 Beta 结束后的稳定考试。这允许考生参加两次考试而无需支付任何额外费用。Beta 计划还提供标准考试价格 50% 的折扣优惠。
其他详细信息:考试时间前 24 小时可以重新安排;否则将不予退款,下一次考试只能在 24 小时后安排。如果考试失败,下一次考试可以在 14 天后安排,费用相同,但您可以使用代金券重新参加考试。
AWS Certified Machine Learning - Specialty 认证有效期为三年。考试结果呈阳性后,证书将在五个工作日内发放。
有关内容和定价的详细信息有所不同,因此请务必在此处验证。
就业市场
机器学习是就业市场上最需要的技能之一,AWS Certified Machine Learning - Specialty 认证可让您有资格担任数据科学家和机器学习工程师等各种职位。
根据payscale.com和LinkedIn 的数据,机器学习工程师的平均薪酬在 111,297 美元至 132,000 美元之间。
截至 2020 年 6 月,LinkedIn上发布了 9000 多个职位, indeed.com上发布了 3000 多个职位。
Pluralsight 资源
Pluralsight提供了有关 AWS Certified Machine Learning Specialty 的丰富资源。精选的学习路径包括:
Pluralsight 的角色和技能智商也是衡量技能水平的绝佳资源,通过分析,它可以推荐学习机会来填补空白,以达到更高的水平:
其他资源
有用资源列表,例如 AWS 白皮书和最佳实践和见解的学习材料。
学习资料
白皮书和电子书
结论
- AWS Certified Machine Learning - Specialty 认证主要关注机器学习解决方案的整体架构和特定问题的最佳方法。
- 机器学习解决方案非常适合处理高度结构化和干净的数据。Kaggle是探索和使用不同数据集进行实践的绝佳资源。
- 仔细研究非常重要的白皮书。
- 为最后的审查做具体且结构化的笔记。
希望本指南能解释 AWS Certified Machine Learning - Specialty 认证所需的详细信息。祝您顺利通过认证。
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~