数据分析师的 Python
介绍
对于那些希望进入数据分析领域的人来说,有几种语言占据主导地位。我更喜欢 Python。它简单、易学,更重要的是,容易记住。本指南将讨论数据分析师的 Python 基础知识。
变量
如果您以前使用过 C# 或 Java 等语言,那么您已经了解变量的一般概念,其中一些概念也适用于 Python。但也存在一些显著差异。首先,在 Python 中声明变量不需要类型说明符:
i = 42
变量的类型是根据赋值推断出来的。因此,上述代码将声明一个名为i的int类型变量(表示整数),并为其赋值 42。
此外,Python 中的变量是动态类型的。这意味着变量的类型可以随其值而改变。
i = 42
i = 'Hello world'
在静态类型的 C# 或 Java 中尝试此操作将导致编译器错误。在 Python 中,它只是将i的类型从int更改为str(字符串)。另外,请注意,Python 中的字符串可以是双引号或单引号,并且语句不以分号结尾。
这超出了本指南的范围,但从 Python 3.5 开始,类型提示已受支持。但您今天看到的大多数 Python 代码仍然是动态类型的,没有使用提示。
类型
Python 具有精简的类型系统。除了int类型之外,float和complex还构成了数字类型的集合。
前面讨论了str类型和变量,但值得注意的是 Python 中没有字符类型。因此,单引号中的单个字符是字符串:
ch = 'a'
字符串的常见任务是格式化。使用format方法可以轻松完成此任务。
first_name = 'John'
last_name = 'Johnson'
message = 'Hello {} {}'.format(first_name, last_name)
您可能已经猜到该消息将被分配为Hello John。在 Python 3.6 中,我们有了 'f-string',它使格式化变得更加容易。
message = f'Hello {first_name} {last_name}'
这与format方法效果相同。还有一种较旧的样式也可以使用,但我建议您不要在新项目中使用它。
message = 'Hello %s %s' % (first_name, last_name)
boolean 或bool类型将为True或False 。请注意, bool的值是大写的。空值None(其类型为NoneType)也是大写的,其他内置 Python 值也是如此。
收藏
Python 还支持多种可以有多个值的类型,也称为集合。最常用的是列表,它是有效 Python 值的线性集合:
my_list = [42, 'hello world', False, 3.14159, None]
Python列表由方括号括起来,值之间用逗号分隔。列表中的值通过以下方法管理:
- append :将值添加到列表末尾
- pop :删除并返回列表末尾的值
- index :返回列表中某个值从 0 开始的位置,如果不存在则返回 -1
列表的值可以添加或删除,也可以更改。列表中的值通过从 0 开始的索引访问:
pi = my_list[3]
my_list[4] = 'snafu'
列表的一部分可通过切片获得。要对列表进行切片,请提供起始索引和终止索引,并以冒号分隔。
five_ws = ['who', 'what', 'why', 'when', 'where']
three_ws = five_ws[1:4]
three_ws的值将是列表 ['what', 'why', 'when'] 。请注意,停止索引不包含在切片中。如果省略起始索引,则假定为 0,如果省略停止索引,切片将延伸到列表的末尾。
列表的近亲是元组,它看起来像用括号括起来的列表:
my_tuple = (42, 'hello world', False, 3.14159, None)
元组及其值不可更改。因此它的长度是固定的且不可变的。可以通过从 0 开始的索引访问值。
元组的一个有趣特性是解构或解包。
address = ('http', 'pluralsight.com', 80)
protocol, domain, port = address
这会按顺序将元组中的值分配给左侧的变量。如果一个或多个值不需要,则将它们分配给一次性变量或下划线。
protocol, domain, _ = address
内置的len函数接受列表或元组并返回值的数量:
items = len(my_tuple) # 5
Python 中的单行注释以井号 ( # ) 开头。使用三重引号括住多行注释即可创建多行注释:
"""
A
multi-line
comment
"""
字典是键/值对的集合。键和值用冒号分隔,键/值对用逗号分隔,集合用花括号分隔:
my_dict = {
'one': 1,
'two': 2,
'three': 3,
'four': 4
}
字典的值可以通过键访问:
number_one = my_dict['one']
my_dict['ten'] = 10
运算符
Python 中包含了常见的运算符,但也有少数例外。所有算术运算符均有,但指数部分添加了双星号 ( ** ):
eight = 2 ** 3 # 8
请注意,从 Python 3.0 开始,两个整数相除可能会得到一个浮点数:
two_and_a_half = 5 / 2 # 2.5
使用双斜杠运算符(//)进行整数除法:
two = 5 // 2 # 2
Python 不包含增量(++)和减量(-- )运算符。
Python 中的一些运算符实际上是关键字,例如not、and、 and or:
negative = not True # False
除了否定相等之外,您还可能会看到以下内容:
not a == 1
而不是
a != 1
<font style="vertical
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~