Pandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。
Series 由索引(index)和列组成,函数如下:
pandas.Series( data, index, dtype, name, copy)
参数说明:
data:一组数据(ndarray 类型)。
index:数据索引标签,如果不指定,默认从 0 开始。
dtype:数据类型,默认会自己判断。
name:设置名称。
copy:拷贝数据,默认为 False。
实例:
import pandas as pd
data=['李光地','张红云','王鹏']
s=pd.Series(data=data,index=[1,2,3]) # 可以自己指定索引值,若不指定则是0,1,2....
print(s)
'''
1 李光地
2 张红云
3 王鹏
dtype: object
'''
print(type(s))
# <class 'pandas.core.series.Series'>
data数据也可以是字典类型(键为标签),可以通过 index 来控制字典类型的输出,对于不存在的索引,默认值为NaN。
import pandas as pd
sites = {1: "Google", 2: "Runoob", 3: "Wiki"}
myvar = pd.Series(sites, name="RUNOOB-Series-TEST" )
print(myvar)
'''
1 Google
2 Runoob
3 Wiki
Name: RUNOOB-Series-TEST, dtype: object
'''
myvar1 = pd.Series(sites, index = [1, 3, 4])
print(myvar1)
'''
1 Google
3 Wiki
4 NaN
dtype: object
'''
'''
我们可以指定标签索引也可以指定位置索引。
import pandas as pd
data=[90,98,87]
index=['张三','李四','王五']
s=pd.Series(data=data,index=index)
print(s)
'''
张三 90
李四 98
王五 87
dtype: int64
'''
print(s['张三']) # 90
print(s[1]) # 98
位置索引切片不包含end,标签索引切片包含end
import pandas as pd
data=[90,98,87]
index=['张三','李四','王五']
s=pd.Series(data=data,index=index)
print(s)
'''
张三 90
李四 98
王五 87
dtype: int64
'''
print(s[0:2:1]) #位置索引切片 含头不含尾
'''
张三 90
李四 98
dtype: int64
'''
print(s['张三':'王五']) # 标签索引切片 含头含尾
'''
张三 90
李四 98
王五 87
dtype: int64
'''
获取索引 s.index
获取值 s.values
import pandas as pd
data=[90,98,87]
index=['张三','李四','王五']
s=pd.Series(data=data,index=index)
print(s)
'''
张三 90
李四 98
王五 87
dtype: int64
'''
print(s.index) # Index(['张三', '李四', '王五'], dtype='object')
print(list(s.index)) # ['张三', '李四', '王五']
print(s.values) # [90 98 87]
print(type(s.values)) # <class 'numpy.ndarray'>