(1)集合类型是一个元素集合,元素之间无序,相同元素在集合中唯一存在。
(2)Python中的集合类型与数学中的集合概念一致,即包含0个或多个数据项的无序组合,集合中的元素不可重复,元素类型只能是不可变数据类型,例如整数、浮点数、字符串、元组等。(列表、字典和集合类型本身都是可变数据类型,不可作为集合的元素)
(1)序列类型是一维元素向量,元素之间存在顺序关系,通过序号访问其中的元素,元素之间不排他(也就是可以有相同元素)。
(2)Python提供了多种序列数据类型,比较重要的是字符串类型、列表类型和元组类型。字符串类型可以看成是单一字符的有序组合,属于序列类型;元组和列表是可以使用多种类型元素的序列类型(换句话说,它们每个元素类型不一定都要相同)
(3)序列类型使用相同的索引体系,即正向递增序号和反向递减序号,这个体系在第三章“字符串的索引”一节有介绍,该体系同样适用于列表和元组(切片操作也和字符串基本相同,把字符串的每个字符当成一个元素即可)。
(4)序列类型有一些通用的操作符和函数,如下所示:
操作符 | 描述 |
in | x in s,如果x是s的元素,返回True,否则返回False |
not in | x not in s,如果x不是s的元素,返回True,否则返回False |
+ | s + t,返回连接s和t的结果 |
* | s * n 或n * s,返回序列s赋值n次的结果 |
s[i] | 索引,返回序列的第i个元素 |
s[i:j] | 切片,返回包含序列s第i到j个元素的子序列(不包含第j个元素) |
s[i:j:k] | 步骤切片,返回包含序列s第i到j个元素以k为步长的子序列 |
len(s) | 返回序列s的元素个数(序列s的长度) |
min(s) | 返回序列s中的最小元素 |
max(s) | 返回序列s中的最大元素 |
s.index(x) | 返回序列s中第一次出现元素x的位置 |
s.count(x) | 返回序列s中出现x的总次数 |
(1)映射类型是“键-值”数据项的组合,每个元素是一个键值对,表示为(key,value),元素之间是无序的。
(2)键值对(key,value)是一种二元关系,源于属性和值的映射关系。键(key)表示一个属性,也可以理解为一个类别或项目,值(value)是属性的内容。键值对将映射关系结构化,用于存储和表达。
(3)映射类型是序列类型的一种扩展,在序列类型中,采用从0开始的正向递增序号进行具体元素值的索引,而映射类型则由用户来定义序号(即键),用其去索引具体的值。
(4)Python提供了专门的映射类型,即字典类型。
(1)Python中的集合是元素的无序组合,其类型用大括号{}表示,它没有索引和位置的概念,集合中的元素可以动态增加或删除。由于集合中的元素是无序的,集合的输出顺序与定义顺序可以不一致。
(2)集合中的元素不可重复,元素类型只能是固定数据类型(可理解为C语言中的常量)。由于集合元素独一无二,使用集合类型能够过滤掉重复元素。
(3)type函数返回的集合类型标记为’set’。
(1)直接赋初值创建集合:
①利用大括号({})直接创建集合。
②由于集合类型和字典类型都用大括号标记,所以采用大括号方式创建集合时必须赋初值,不能创建空集合(否则只能创建空字典)。
(2)set函数创建集合:
①set(x)函数可以根据参数x创建集合类型,要求参数x是组合数据类型,如列表或字符串等。
②如果参数x中存在重复元素,创建后的集合会自动去重。
③空集合用set()表示。
(3)set函数只接收1个参数,它会分解该参数(将输入的序列分解为多个元素,然后进行去重),形成集合;{}可以接收多个参数,每个参数会被当作一个独立元素,不会再被分解。
操作符的运算 | 描述 |
S-T | 返回一个新集合,包括在集合S中但不在集合T中的元素 |
S&T | 返回一个新集合,包括同时在集合S和T中的元素 |
S^T | 返回一个新集合,包括集合S和T中的非共同元素 |
S|T | 返回一个新集合,包括集合S和T中的所有元素 |
函数或方法 | 描述 |
S.add(x) | 如果数据项x不在集合S中,将x增加到S中 |
S.clear() | 移除S中所有数据项 |
S.discard(x) | 移除指定元素x,指定元素不存在不会报错 |
S.pop() | 随机移除并返回某个元素 |
S.remove(x) | 如果x在集合S中,移除该元素;如果不在则产生KeyError异常 |
S.update(S1) | 将一个集合S1中的元素加入另一个集合S中 |
len(S) | 返回集合S的元素个数 |
x in S | 如果x是S的元素,返回True;否则返回False |
x not in S | 如果x不是S的元素,返回True;否则返回False |
(1)List(列表)是Python中使用最频繁的数据类型,在其它语言中通常叫做数组。
(2)列表用“[]”定义,数据之间使用“,”分隔。
(3)列表的索引从0开始。
①索引就是数据在列表中的位置编号,又称为下标。
②从列表中取值时,如果超出索引范围,程序会报错。
(1)列表的基本使用:
name_list = ["zhangsan", "lisi", "wangwu"] # 创建列表
# 1. 取值和取索引
# list index out of range - 列表索引超出范围
# 列表指定的索引超出范围,程序会报错!
# 例如:print(name_list[3])
print(name_list[2])
# 知道数据的内容,想确定数据在列表中的位置(如果该数据出现多次,会得到第一次出现的位置)
# 使用index方法需要注意,如果传递的数据不在列表中,程序会报错!
print(name_list.index("wangwu"))
# 2. 修改
name_list[1] = "李四"
# list assignment index out of range
# 列表指定的索引超出范围,程序会报错!
# 例如:name_list[3] = "王小二"
# 3. 增加
# append 方法可以向列表的末尾追加数据
name_list.append("王小二")
# insert 方法可以在列表的指定索引位置插入数据
name_list.insert(1, "小美眉")
# extend 方法可以把其他列表中的完整内容,追加到当前列表的末尾
temp_list = ["孙悟空", "猪二哥", "沙师弟"]
name_list.extend(temp_list)
# 4. 删除
# remove 方法可以从列表中删除指定的数据
name_list.remove("wangwu")
# pop 方法默认可以把列表中最后一个元素删除
name_list.pop()
# pop 方法可以指定要删除元素的索引
name_list.pop(3)
# clear 方法可以清空列表
name_list.clear()
print(name_list)
(2)del关键字:
name_list = ["张三", "李四", "王五"]
# (知道即可)使用 del 关键字(delete)删除列表元素
# 提示:在日常开发中,要从列表删除数据,建议使用列表提供的方法
del name_list[1]
# del 关键字本质上是用来将一个变量从内存中删除的
name = "小明"
del name
# 注意:如果使用 del 关键字将变量从内存中删除
# 后续的代码就不能再使用这个变量了
# print(name)
print(name_list)
(3)列表的数据统计:
name_list = ["张三", "李四", "王五", "王小二", "张三"]
# len(length 长度) 函数可以统计列表中元素的总数
list_len = len(name_list)
print("列表中包含 %d 个元素" % list_len)
# count 方法可以统计列表中某一个数据出现的次数
count = name_list.count("张三")
print("张三出现了 %d 次" % count)
# 从列表中删除第一次出现的数据,如果数据不存在,程序会报错
name_list.remove("张三")
print(name_list)
(4)列表排序:
name_list = ["zhangsan", "lisi", "wangwu", "wangxiaoer"]
num_list = [6, 8, 4, 1, 10]
# 升序
name_list.sort()
num_list.sort()
# 降序
name_list.sort(reverse=True)
num_list.sort(reverse=True)
# 逆序(反转)
name_list.reverse()
num_list.reverse()
print(name_list)
print(num_list)
(5)列表遍历:
name_list = ["张三", "李四", "王五", "王小二"]
# 使用迭代遍历列表
"""
顺序的从列表中依次获取数据,每一次循环过程中,数据都会保存在
my_name 这个变量中,在循环体内部可以访问到当前这一次获取到的数据
for my_name in 列表变量:
print("我的名字叫 %s" % my_name)
"""
for my_name in name_list:
print("我的名字叫 %s" % my_name)
(6)对于基本的数据类型,如整数或字符串,可以通过等号实现元素赋值,但对于列表类型,使用等号是无法实现真正的赋值的(如下所示,Is=It语句并不是拷贝It中的元素给变量Is,而是新关联了一个引用,即Is和It所指向的是同一套内容),要想达到复制列表的效果,需要借助copy方法。
It = ["2005","08","03"]
Is = It
It.clear() # 清空It
print(Is)
It = ["2005","08","03"]
Is = It.copy()
It.clear() # 清空It
print(Is)
(1)Tuple(元组)与列表类似,不同之处在于元组在创建完之后就不能修改。
(2)元组用“()”定义,元素之间使用“,”分隔。
(3)元组的索引从 0 开始,索引就是数据在元组中的位置编号。
(1)创建普通元组:
info_tuple = ("zhangsan", 18, 1.75)
(2)创建空元组:
info_tuple = ()
(3)创建只包含一个元素的元组:(需要在那一个元素后面添加逗号,否则创建的数据类型不是元组)
info_tuple = ("zhangsan",)
(1)元组的基本使用和数据统计:
info_tuple = ("zhangsan", 18, 1.75, "zhangsan")
# 1. 取值和取索引
# 根据下标访问元组中的元素
print(info_tuple[0])
# 已经知道数据的内容,希望知道该数据在元组中的索引
print(info_tuple.index("zhangsan"))
# 2. 统计计数
# 统计元组中某个元素出现的次数
print(info_tuple.count("zhangsan"))
# 统计元组中包含元素的个数
print(len(info_tuple))
(2)元组遍历:(在实际开发中,除非能够确认元组中的数据类型,否则针对元组的循环遍历需求并不是很多)
info_tuple = ("zhangsan", 18, 1.75)
"""
# for 循环内部使用的变量 in 元组
for item in info:
循环内部针对元组元素进行操作
print(item)
"""
# 使用迭代遍历元组
for my_info in info_tuple:
print(my_info)
(1)函数的参数和返回值:一个函数可以接收任意多个参数(参数类型为元组类型,其中的元素就是需要接收的参数),或者一次返回多个数据(返回值类型为元组类型,其中的元素就是需要返回的数据)。
def measure():
"""测量温度和湿度"""
print("测量开始...")
temp = 39
wetness = 50
print("测量结束...")
# 元组-可以包含多个数据,因此可以使用元组让函数一次返回多个值
# 如果函数返回的类型是元组,小括号可以省略
# return (temp, wetness)
return temp, wetness
# 元组
result = measure()
print(result)
# 需要单独的处理温度或者湿度 - 不方便
print(result[0])
print(result[1])
# 如果函数返回的类型是元组,同时希望单独的处理元组中的元素
# 可以使用多个变量,一次接收函数的返回结果
# 注意:使用多个变量接收结果时,变量的个数应该和元组中元素的个数保持一致
gl_temp, gl_wetness = measure()
print(gl_temp)
print(gl_wetness)
(2)让列表不可以被修改,以保护数据安全。
(3)格式字符串:格式化字符串后面的“()”本质上就是一个元组。
info_tuple = ("小明", 21, 1.85)
# 格式化字符串后面的 `()` 本质上就是元组
print("%s 年龄是 %d 身高是 %.2f" % info_tuple)
info_str = "%s 年龄是 %d 身高是 %.2f" % info_tuple
print(info_str)
(4)在Python中,可以将一个元组使用赋值语句同时赋值给多个变量(变量的数量需要和元组中的元素数量保持一致)。
# 交换两个数字
a = 6
b = 100
# 解法1:-使用其他变量
# c = a
# a = b
# b = c
# 解法2:-不使用其他的变量
# a = a + b
# b = a - b
# a = a - b
# 解法3:-Python 专有
# a, b = (b, a)
# 提示:等号右边是一个元组,只是把小括号省略了
a, b = b, a
print(a)
print(b)
(1)使用list函数可以把元组转换成列表(列表作为返回值,不影响原本的元组):
变量名 = list(元组)
(2)使用tuple函数可以把列表转换成元组(元组作为返回值,不影响原本的列表):
变量名 = tuple(列表)
(1)dictionary(字典)是除列表以外 Python之中最灵活的数据类型。
(2)字典同样可以用来存储多个数据,通常用于存储描述一个物体的相关信息。
(3)和列表的区别:列表是有序的对象集合,字典是无序的对象集合。
(4)字典用“{}”定义。
(5)字典使用键值对存储数据,键值对之间使用“,”分隔。
①键(key)是索引,值(value)是数据。
②键和值之间使用“:”分隔。
③键必须是唯一的,也就是不能有重复。
④值可以取任何数据类型,但键只能使用字符串、数字或元组。
{<键1>:<值1>,<键2>:<值2>,…,<键n>:<值n>}
(6)可以简单地把字典看成元素是键值对的集合。
# 字典是一个无序的数据集合,使用print函数输出字典时,通常
# 输出的顺序和定义的顺序是不一致的!
xiaoming = {"name": "小明",
"age": 18,
"gender": True,
"height": 1.75,
"weight": 75.5} # 创建字典
print(xiaoming)
(1)基本使用:
xiaoming_dict = {"name": "小明"} # 创建字典
# 1. 取值
print(xiaoming_dict["name"])
# 在取值的时候,如果指定的key不存在,程序会报错!
# print(xiaoming_dict["name123"])
# 2. 增加/修改
# 如果key不存在,会新增键值对
xiaoming_dict["age"] = 18
# 如果key存在,会修改已经存在的键值对
xiaoming_dict["name"] = "小小明"
# 3. 删除
xiaoming_dict.pop("name")
# 在删除指定键值对的时候,如果指定的key不存在,程序会报错!
# xiaoming_dict.pop("name123")
print(xiaoming_dict)
(2)其它操作:
xiaoming_dict = {"name": "小明",
"age": 18}
# 1. 统计键值对数量
print(len(xiaoming_dict))
# 2. 合并字典
temp_dict = {"height": 1.75,
"age": 20}
# 注意:如果被合并的字典中包含已经存在的键值对,会覆盖原有的键值对
xiaoming_dict.update(temp_dict)
# 3. 清空字典
xiaoming_dict.clear()
print(xiaoming_dict)
(3)循环遍历:
xiaoming_dict = {"name": "小明",
"qq": "123456",
"phone": "10086"}
# 迭代遍历字典
# 变量k是每一次循环中,获取到的键值对的key
for k in xiaoming_dict:
print("%s - %s" % (k, xiaoming_dict[k]))
(1)字符串就是 一串字符,是编程语言中表示文本的数据类型。
(2)在Python中可以使用一对双引号或者 一对单引号定义一个字符串。
(3)可以使用索引获取一个字符串中指定位置的字符,索引计数从0开始;也可以使用for 循环遍历字符串中每一个字符。
str1 = "hello python"
str2 = '我的外号是"大西瓜"'
print(str2)
print(str1[6])
# 字符串的遍历
for char in str2:
print(char)
(1)字符串的统计操作:
hello_str = "hello hello"
# 1. 统计字符串长度
print(len(hello_str))
# 2. 统计某一个小(子)字符串出现的次数
print(hello_str.count("llo"))
print(hello_str.count("abc"))
# 3. 某一个子字符串出现的位置
print(hello_str.index("llo"))
# 注意:如果使用index方法传递的子字符串不存在,程序会报错!
print(hello_str.index("abc"))
(2)字符串的判断方法:
# 1. 判断空白字符
space_str = " \t\n\r"
print(space_str.isspace())
# 2. 判断字符串中是否只包含数字
# 1> 以下三个方法都不能判断是否包含小数
# num_str = "1.1"
# 2> unicode 字符串
# num_str = "\u00b2"
# 3> 中文数字
num_str = "一千零一"
print(num_str)
print(num_str.isdecimal())
print(num_str.isdigit())
print(num_str.isnumeric())
(3)查找和替换:
(4)大小写转换:
(5)文本对齐:
(6)去除空白字符:
(7)拆分和连接:
注意:
①in在对字典操作时,判断的是字典的键。
②in和not in被称为成员运算符,成员运算符用于测试序列中是否包含指定的成员。
③in和not in也支持集合数据类型,上表中没有体现。