Python基础学习(八)
一、字符串和字符
1. 什么是字符串(str)
容器型数据类型; 容器标志:’’、""、’’’’’’、"""""" 引号中的每个符号就是字符串的元素 ‘’’’’'和""""""在表示字符串内容的时候,如果要在内容中换行可以不使用转义字符,而是直接按回车 字符串不可变,不支持增删改 字符串是有序的,支持下标操作 元素:引号中的单独的每个符号都是字符串的元素(又叫字符),字符可以是任何符号 字符分为两类:普通字符、转义字符
str1 = '90,100'
str2 = 'asd+-*/cadas增加客户?'
str3 = 'abc\n123'
str4 = '''abc
123'''
str5 = """abc
123
xy
“”“
2. 字符串的元素 - 字符
字符分为普通字符和转义字符两种 转义字符 - 在特定符号前加’'让符号具备特殊的功能,常用转义字符如下: \n - 换行 \t - 水平制表符(相当于tab键的功能) ’ - 表示一个普通的单引号 " - 表示一个普通的双引号 \ - 表示一个普通的反斜杠 \u4位的十六进制数 - 编码字符
str6 = '\tabc\n123'
print(str6)
str7 = 'it\'s me!'
print(str7)
str8 = "it's me!"
print(str8)
str9 = "I say:\"Hello world!\""
print(str9)
str10 = 'I say:"Hello world!"'
print(str10)
str11 = 'abc\\name\u4eff'
print(str11)
3. 字符编码
1)编码
计算机只能直接存储数字(而且保存的数字的二进制的补码),文字符号是无法直接存储到计算机中的。 为了能够让计算机具备存储文字符号的能力,我们给所有的文字符号对应了一个固定的数字,每次要存储文字符号的时候,就把文字符号对应的数字存起来 文字符号对应的数字就是文字符号的编码值
2)编码表 - 保存符号和数字对应关系的表
1)ASCII码表 a. 总共有128个字符(美国符号) b. 数字在字母的前面;大写字母在小写字母前面;大写字母和小写字母之间有其他符号
3)Unicode编码表(Python)
a. Unicode编码表是对ASCII码表的扩展,包含了世界上所有的国家所有的民族所有的语言的符号(又称万国码),总共:65536个 b. 中文范围:4e00 ~ 9fa5
4)编码值在Python中的使用
a. chr函数: chr(编码值) - 获取编码值对应的字符 b. ord函数: ord(字符) - 获取字符串的编码值 c. 编码字符: \u4e00(4e00就是一个16进制的编码值) 注:python中需要字符的地方都必须使用长度为1的字符串赋值
chr
print(chr(35))
print(chr(0x4e00), chr(0x9fa5))
ord
print(ord('张'), ord('三'))
二、字符串相关操作
1. 查 - 获取字符串中的字符
字符串获取字符的语法和列表获取元素的语法一模一样
str1 = '\tabc\n123\'+-'
print(str1[1])
print(str1[-1])
print(str1[5:8], str1[5:-3])
print(str1[1:], str1[::-1])
for x in str1:
print(x)
for index in range(len(str1)):
print(str1[index])
for index, item in enumerate(str1):
print(index, item)
2. 数学运算符:+、*
print('Hello' + ' World!')
print('Hello' * 2)
name = '小明'
print('姓名:' + name)
练习:提取字符中小写字母
str2 = 'ss试试看78,mvn0-k=上课23'
new_str2 = ''
for x in str2:
if 'a' <= x <= 'z':
new_str2 += x
print(new_str2)
new_str2 = [x for x in str2 if 'a' <= x <= 'z']
print(new_str2)
3. 比较运算符
1)比较是否相等:==、!=
print('abc' == 'adf')
print('abc' == 'abc')
2)比较大小:>、<、>=、<=
两个字符串比较大小,比较的是第一对不相等的字符的编码值的大小 char = ? 判断是否是数字字符:‘0’ <= char <=‘9’ 判断是否是小写字母:‘a’ <= char <= ‘z’ 判断是否是大写字母:‘A’ <= char <= ‘Z’ 判断是否是字母:‘a’ <= char <= ‘z’ or ‘A’ <= char <= ‘Z’ 判断是否是中文:’\u4e00’ <= char <= ‘\u9fa5’
print('MNxy' > 'ab')
print('你好吗' > 'hello')
print('123' > 'KM123')
练习2: 1)统计中文字符的个数
str3 = '你好loe--23=sks;M9JHkyu是-12山卡拉'
count = 0
for char in str3:
if '\u4e00' <= char <= '\u9fa5':
count += 1
print('中文个数:', count)
2)打印字符串中所有的数字字符
for char in str3:
if '0' <= char <= '9':
print(char, end='')
print()
3)提取字符串中所有的字母
word = ''
for char in str3:
if 'a' <= char <= 'z' or 'A' <= char <= 'Z':
word += char
print('所有的字母:', word)
4. in 和 not in
字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)
print('1' in 'abc123')
print('abc' in 'abc123')
print(10 in [10, 20, 30])
print([10, 20] in [10, 20, 30])
print('ac' in 'abc123')
5. r语法(r-string) - 在字符串(引号)的前面加’r’
如果在字符串(引号)的前面加’r’,那么字符串中所有的转义字符的功能都会消失
str4 = r'\tabc\n12\'3\\'
print(str4)
path = r'c:\User\name\test\a.txt'
print(path)
6. 相关函数
len(字符串) str(数据) - 将数据转换成字符串(任何类型的数据都可以转换成字符串;转换的时候是在数据的打印值的外面加引号)
str(15)
str(12.5)
str([10, 20, 30])
str({'a': 10, 'b': 20})
str({'a': 10, "b": 20})
str(lambda x: x*2)
eval(字符串) - 去掉字符串中的引号,获取数据(如果去掉引号后不是一个数据而是一个表达式,则会计算表达式的结果),即将字符串中的元素变为原来的意义
result1 = eval('100')
print(result1, type(result1))
result2 = eval('[10, 20, 30]')
print(result2, type(result2))
result3 = eval('10 + 20')
print(result3)
result4 = eval('type(10)')
print(result4)
str5 = """{
'student':[
{'name': '小明', 'age': 18},
{'name': '张三', 'age': 20},
],
'name': 'python2104'
}
"""
result5 = eval(str5)
print(result5, result5['student'][0], sep='\n')
三、字符串相关方法
1. join
字符串.join(序列) - 将序列中的元素用指定的字符串拼接成一个字符串(序列中的元素必须是字符串)
list1 = ['abc', 'name', '123', 'sdf']
result = ''.join(list1)
print(result)
result1 = '+'.join(list1)
print(result1)
result2 = '123'.join('abc')
print(result2)
练习1:将list2中所有的元素拼接成一个字符串
list2 = ['abc', 100, True, 'hello']
result3 = ''.join(str(x) for x in list2)
print(result3)
练习2:将list2中所有的字符串拼接成一个字符串
result4 = ''.join(x for x in list2 if type(x) == str)
print(result4)
2. count
字符串1.count(字符串2) - 统计字符串1中字符串2出现的次数
message = 'how are you? I am fine! Thank you! and you?'
result5 = message.count('you')
print(result5)
3. index/find
字符串1.index(字符串2) - 获取字符串2第一次出现在字符串1中的位置(位置是从0开始的下标值) 字符串1.find(字符串2) - 获取字符串2第一次出现在字符串1中的位置(位置是从0开始的下标值) 字符串2不存在的时候index会报错,find会不报错并且返回-1 rindex/rfind - 是从右往左找,找到的是最后一个字符串2
result6 = message.index('you')
print(result6)
result7 = message.find('you')
print(result6)
result8 = message.rfind('you')
print(result8)
4. split
字符串1.split(字符串2) - 将字符串1中所有的字符串2作为切割点对字符串1进行切割 字符串1.split(字符串2, N) - 最多切N次 注:无论切割点怎么分布,切完后小字符串的个数都是切割点的数量加1
message = 'mnabc123abcxyzabcoop'
result9 = message.split('abc')
print(result9)
message = 'abcmnabc123abcxyzabcoop'
print(message.split('abc'))
message = 'mnabc123abcxyzabcoop'
print(message.split('abc', 1))
5. replace
字符串1.replace(字符串2, 字符串3) - 将字符串1中所有的字符串2都替换成字符串3 字符串1.replace(字符串2, 字符串3, N) - 只替换前N个
message = 'how are you? I am fine! Thank you! and you?'
result10 = message.replace('you', 'me')
print(result10)
result11 = message.replace('you', 'me', 2)
print(result11)
6. center\rjust\ljust\zfill
字符串1.center(长度, 填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符填充,原字符串居中显示 字符串1.rjust(长度, 填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符填充,原字符串居右显示 字符串1.ljust(长度, 填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符填充,原字符串居左显示 字符串1.zfill(长度) == 字符串1.rjust(长度, ‘0’)
str1 = 'abc'
print(str1.center(9, '0'))
print(str1.center(8, 'x'))
print(str1.rjust(9, '0'))
print(str1.ljust(9, '0'))
7. strip/rstrip/lstrip
strip - 同时去点字符串两边的所有的空白 rstrip - 去掉字符串右边的所有空白 lstrip - 去掉字符串左边的所有空白
str2 = '\t abc 123 \n'
print('-------原字符串--------')
print(str2)
print('-------去掉两边的字符串--------')
print(str2.strip())
print('-------单独去掉左边的字符串--------')
print(str2.lstrip())
print('-------单独去掉右边的字符串--------')
print(str2.rstrip())
练习
-
输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符) 例如: 输入**'abcd1234 ’ ** 输出**‘bd24’** str1 = input('请输入一个字符串:')
print(str1[1::2])
-
输入用户名,判断用户名是否合法(用户名长度6~10位) str1 = input('请输入用户名:')
l = len(str1)
if l < 6 or l > 10:
print('用户名不合法!')
else:
print('用户名合法')
-
输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成) 例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法 str1 = input('请输入用户名:')
if str1.isalnum():
for char in str1:
if chr(0x4e00) <= char <= chr(0x9f5a):
print('用户名不合法')
break
else:
print('用户名合法')
else:
print('用户名不合法')
-
输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母) 例如: ‘abc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法 str1 = input('请输入用户名:')
if str1.isalnum():
for char in str1:
if chr(0x4e00) <= char <= chr(0x9f5a):
print('用户名不合法')
break
else:
if str1[0].isupper():
print('用户名合法')
else:
print('用户名不合法')
else:
print('用户名不合法')
-
输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串 例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’ str1 = input('请输入一个字符串:')
print(''.join(x for x in str1 if '0' <= x <= '9'))
-
输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现) 例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+' str1 = input('请输入一个字符串:')
print(str1.upper())
str1 = input('请输入一个字符串:')
print(''.join(chr(ord(x) - 32) if 'a' <= x <= 'z' else x for x in str1))
-
输入一个小于1000的数字,产生对应的学号 例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’** str1 = input('请输入小于1000的数字:')
print('py1901' + str1.rjust(3, '0'))
-
输入一个字符串,统计字符串中非数字字母的字符的个数 例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3 str1 = input('请输入一个字符串:')
str2 = ''
for char in str1:
if char.isalnum() and not (chr(0x4e00) <= char <= chr(0x9f5a)):
continue
else:
str2 += char
print(len(str2))
-
输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串 例如: 输入字符串**‘abc123’, 输出’+bc12+’** str1 = input('请输入一个字符串:')
print(str1[1:-1].center(len(str1), '+'))
-
输入字符串,获取字符串的中间字符 例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’** str1 = input('请输入一个字符串:')
long = len(str1)//2
if long % 2 == 0:
print(''.join(str1[long-1:long+1]))
else:
print(''.join(str1[long]))
-
写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置) 例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8 str1 = input('请输入一个字符串1:')
str2 = input('请输入一个字符串2:')
i = j = 0
l1, l2 = len(str1), len(str2)
index = 0
while i < l2:
while j < l1:
if str1[j] == str2[i]:
if str1[j:(l2+j)] == str2:
index = j
break
else:
j += 1
else:
j += 1
i += 1
print(index)
str1 = input('请输入一个字符串1:')
str2 = input('请输入一个字符串2:')
list1 = str1.split(str2):
print(len(list1[0]))
-
获取两个字符串中公共的字符 例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3 same_str = ''
str1 = input('请输入一个字符串1:')
str2 = input('请输入一个字符串2:')
for char in str1:
if str2.find(char) >= 0:
same_str += char
print('字符串1和字符串2相同的部分:', same_str)
|