day9-字符串
1字符和字符串
1.什么是字符串(str)
? 1)字符串是容器型数据类型:将’’、""、’’’’’’、“”“”“”作为容器标志。里面直接是多个符号,每个符号就是字符串的一个元素:‘元素1元素2元素3…’
? 2)字符串是不可变的;字符串是有序的
? 3)对元素的要求:所有的符号都可以作为字符串的元素;字符串中的元素又叫字符,字符分为普通字符和转义字符
str1 = '123adfSACVD😀$%我的未来不是梦'
str1 = ''
str2 = ""
str3 = """"""
str4 = ''''''
str1 = """abc
123
456"""
print('abc' == 'acd')
2字符串中的元素 - 字符
? 1)普通字符:符号在字符串中表示符号本身的字符就是普通字符
? 2)转义字符:在特定符号前加\表示特殊的功能或者特殊意义的字符
"""
\n - 换行
\t - 水平制表符(相当于Tab键)
\' - 表设计一个普通的单引号
\" - 表示一个普通的双引号
\\ - 表示一个普通的反斜杠\
"""
str1 = 'abc\n123'
str2 = '\tabc\t123\n456'
str1 = '\u4e00abc'
print(str1)
3字符编码
? 1)计算机在存储数据的时候只能存数字(数字的二进制补码)
? 2)为了能够让计算机存储字符,给每一个字符对应一个固定数字。每次在存储这个字符的时候就存储这个字符对应的数字,每个字符对应的数字就是这个字符的编码值
4编码表
常用的编码表:ASCII码表、Unicode编码表(Python)
? 1)ASCII码表
? a.只记录了美国的符号(没有记录中文)
? b.数字字符(48 ~ 57)在大写字母(65 ~ 90)的前面,大写字母在小写字母(97 ~ 122)的前面,并且这三类符号之间不连续。
? 2)Unicode编码表:
? a.是ASCII码表的扩展(包含了ASCII码表),记录了世界上所有国家所有民族的所有语言的符号。
? b.中文范围:4e00 ~ 9fa5
a = 0x9fa5 - 0x4e00
print(a)
5编码值的使用
? 1)chr函数
? chr(编码值) :获取编码值对应的字符
print(chr(97))
print(chr(0x5fa5))
count = 0
for x in range(0x4e00, 0x9fa5 + 1):
count += 1
print(chr(x), end=' ')
if count == 20:
print()
count = 0
? 2)ord函数
? ord(字符) :获取字符对应的编码值
print(ord('a'))
? 3)编码字符
? \u四位的十六进制编码值
print('a\u0061')
c = '是'
if '\u4e00' <= c <= '\u9fa5':
print('是中文')
补充:进制
? 1)十进制
"""
十进制
基数:0 ~ 9
表示方式:直接写
转换函数:直接用print(数据)函数进行打印即可
"""
num = 123
print(num)
? 2)二进制
"""
基数:0 ~ 1
表示方式:加前缀0b/0B
转换方式:bin(数据) - 将数据转换成二进制
"""
num = 0b101
print(num)
print(bin(6))
? 3)八进制
"""
基数:0 ~ 7
表示方式;0o/0O
转换函数:oct(数据)
"""
num = 0o23
print(num)
print(oct(19))
? 4)十六进制
"""
基数:0 ~ 9,a ~ f (A ~ F)
表示方式:加前缀0x/0X
转换函数:hex(数据)
"""
num = 0xaf2
print(num)
print(hex(15))
6字符串相关操作和相关函数
1.查 - 获取字符
? 字符串获取字符和列表获取元素的语法一样
? 注意:一个转义字符的长度是1
str1 = 'how are you? i am fine! thank you! and you?'
print(str1[2:])
print(str1[1:7:2])
print(str1[1:6])
print(str1[-1:2])
2.+、*
print('abc' + 'hello')
print('abc' * 3)
3.比较运算
? 1)两个字符串比较大小:比较的是第一对不相等字符的编码值得大小
? 2)两个字符比较大小,比较的是字符的编码值的大小
"""
一个字符x:
判断是否是数字字符 - '0' <= X <= '9'
判断是否是小写字母 - 'a' <= x <= 'z'
判断是否是大写字母 - 'A' <= x <= 'Z'
判断是否是字母:'a' <= x <= 'z' or 'A' <= x <= 'Z'
判断是否是中文:'\u4e00' <= x <= '\u9fa5'
"""
print('abc' == 'acb')
print('abc' > 'Abc123')
print('你好' > 'hello')
str1 = '-==sh是uM09K你好!'
count = 0
for x in str1:
if '\u4e00' <= x <= '\u9fa5':
count += 1
print('str1中中文出现的次数为:', count)
str2 = input('请输入字符串:')
for x in str2:
if not '0' <= x <= '9':
print('不是纯数字字符串')
break
else:
print('是纯数字字符串')
4.in 和 not in
? 字符串1 in 字符串2 :判断字符串1是否是字符串2的子串
print('a' in 'abc123')
print('ac' in 'abc123')
print('abc' in 'abc123')
5.相关函数
? 1)len(字符串) :获取字符串的长度
? 2)str(数据) :将数据转换成字符串(python中的任何类型的数据都可以转换成字符串,转换的时候直接在数据的打印值外面加引号)
print(str([10, 20]))
print(str{'a': 10, 'b': 20})
|