介绍 Web抓取是从HTML/XML内容中提取结构化数据的特定信息的过程。数据科学家和研究人员通常需要从众多网站获取和提取数据,以创建数据集、测试或训练算法、神经网络和机器学习模型。通常
时间:
2019-01-08 08:00:00
浏览量:
1536
介绍 描述性统计是数据科学的基石。如果不分析关键指标的描述性统计,高级分析通常就不完整。简单来说,描述性统计可以定义为总结给定数据的度量,这些度量可以进一步细分为集中趋势度量和离散度量。
时间:
2019-07-19 08:00:00
浏览量:
1233
介绍 作为处理现实世界数据的数据科学家,在您的职业生涯中,您将面临构建不平衡数据机器学习模型的挑战。您需要对许多问题做出明智的决策,从选择正确的指标到确保您的模型在小类上得到充分的训练。
时间:
2020-06-17 08:00:00
浏览量:
1214
您是大数据分析方面的新手吗?使用 Red Sqirl 作为您数据科学的秘密武器,无需成为彻头彻尾的专家。
时间:
2019-01-10 08:00:00
浏览量:
1156
介绍 从不同来源导入数据是数据科学和机器学习的基础。丰富的高质量数据不仅可以省去许多预处理步骤,还可以决定模型成功预测合理结果的可能性。PythonPanda库是数据科学家处理表格或矩阵
时间:
2019-01-15 08:00:00
浏览量:
1247
介绍 深度学习是当今数据科学领域最热门的话题之一。这并不奇怪,因为大量令人着迷的应用程序正在使用深度学习进行开发,例如自动驾驶汽车、色彩恢复、自然语言处理、自动机器翻译、图像分类等等。
时间:
2019-03-20 08:00:00
浏览量:
1167
基础 用Python编写应用程序有时需要快速进行代码实验。无论是数据科学问题、机器学习问题还是任何其他Python项目,在很多情况下,我们都会重新考虑我们的逻辑是否可行。那一刻,你会感觉
时间:
2019-06-06 08:00:00
浏览量:
1286
介绍 在数据科学项目中,数据准备通常占用数据科学家80%的时间,这强调了其在机器学习生命周期中的重要性。 在本指南中,您将学习下面提到的几种数据准备技术的基础知识和实施: 处理错误条目
时间:
2019-06-24 08:00:00
浏览量:
1249
介绍 建立预测模型或开展数据科学研究取决于制定假设并使用统计测试得出结论。在本指南中,您将了解如何使用统计编程语言“R”执行这些测试。 本指南涵盖了最广泛使用的推断统计技术,如下所示:
时间:
2019-08-16 08:00:00
浏览量:
1172
介绍 理解和量化分类变量之间的关系是数据科学中最重要的任务之一。这不仅在构建预测模型时有用,而且在数据科学研究工作中也很有用。一种可以做到这一点的统计检验是卡方独立性检验,它用于确定两个