预览
1<2<3>2>1 (func1 if a>b else func2)(a,b) c = [*a,*b] c = {**a, **b} a,b = b,a [x**2 for x in range(10)] [x**2 for x in range(10) if x%3==0] {str(i):i for i in range(5)} {x**2 for x in range(-5,5)} eval('[1,2,3]') ast.literal_eval('1+1') itertools.chain(*a) map(lambda x: lst[x * size:x * size + size], list(range(0, ceil(len(lst) / size))))) list(zip(*lst)) max(set(lst),key=lst.count) len(lst) == len(set(lst)) list(set(A).difference(B)) return [a for a in A if fn(a) not in set(map(func, B))] list(filter(func,myList)) list(enumerate(orders,2)) 'python'*4 s == s[::-1] "python".title() string[0].lower() + string[1:] '-'.join(['2021','3','10']) len(len(re.findall(r [aeiou] , str, re.IGNORECASE))) Counter(first) == Counter(second) (len(string.encode('utf-8')) dict([[1,2],[4,5],[6,7]]) dict(zip(myDict.values(),myDict.keys())) a.update(b) sys.getsizeof(variable) id(val) time.time()-tStart calendar.prmonth(2021,3)
语法特性
链式比较
比较运算符可以像普通运算符一样链式使用,但其运算顺序类似于“并行”,例如下列代码
>>> 1<2<3<4>3>2
True
>>> 3<5<4
False
对于类似a<b<c 的代码,其结果等价于(a<b)&(b<c) 。
三元表达式
对于如下表达式
def judge(a,b,func1,func2):
if a>b:
return func1(a,b)
else:
return func2(a,b)
可以简化成
def judge(a,b,func1,func2):
return (func1 if a>b else func2)(a,b)
或者
judge = lambda a,b,f1,f2 : (f1 if a>b else f2)(a,b)
星号索引
在python中没有指针,但有时*可以起到类似指针的功能,对结构体中的数据进行索引,从而完成合并的操作。
例如,对于列表数据,可用单星号索引,表示如下
>>> a = [1,2,3]
>>> b = [4,5,6]
>>> [*a,*b]
[1, 2, 3, 4, 5, 6]
对于字典数据,采用双星号索引,如
>>> a = {"x" : 1, "y" : 2}
>>> b = {"y" : 3, "z" : 4}
>>> c = {**a, **b}
>>> c
{'x': 1, 'y': 3, 'z': 4}
>>>
交换元素位置
在python中 交换元素值并不需要中间变量
a = 3
b = 4
a,b = b,a
这是因为python中默认的复制方式是将一个元组赋值给另一个元组
>>> a = 3,4
>>> a
(3, 4)
>>> (a,b) = [3,4]
>>> a,b
(3, 4)
推导式
在python中可以通过推导式快速生成list、dict等数据结构。其表达式为
[表达式 for 迭代变量 in 可迭代对象 if 条件表达式]
例如
>>> [x**2 for x in range(10)]
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
>>> [x**2 for x in range(10) if x%3==0]
[0, 9, 36, 81]
>>> {str(i):i for i in range(5)}
{'0': 0, '1': 1, '2': 2, '3': 3, '4': 4}
>>> {x**2 for x in range(-5,5)}
{0, 1, 4, 9, 16, 25}
追根溯源会发现,推导式得到的实际上是一个生成器。
>>> gen = (x**2 for x in range(10))
>>> next(gen)
0
>>> next(gen)
1
>>> next(gen)
4
>>> list(gen)
[9, 16, 25, 36, 49, 64, 81]
字符串转为表达式
在python中,可以通过eval 将字符串转为表达式
>>> eval('[1,2,3]')
[1, 2, 3]
>>> eval('1+1')
2
eval 功能过于强大,这里不建议使用。比较推荐ast 包中的literal_eval 函数。相对于eval 来说,literal_eval 可以鉴别非法输入,以提高安全性。
from ast import literal_eval
>>> literal_eval('[1,2,3]')
[1, 2, 3]
>>> literal_eval('1+1')
ValueError: malformed node or string: <_ast.BinOp object at 0x000001A402566E20>
列表操作
改变维度
列表展开
对于形如[1, [2], [[3], 4], 5] 的列表,将其展开为[1,2,3,4,5] 。算法思路为,遍历列表A0中的元素,如果该元素A1仍为列表,则将A1的元素追加到A0的末尾。
def flatten(lst):
i = 0
while(i<len(lst)):
if isinstance(lst[i],list):
lst.extend(lst[i])
i += 1
return [n for n in lst if not isinstance(n,list)]
>>> lst = [1, [2], [[3], 4], 5]
>>> flatten(lst)
[1, 5, 2, 4, 3]
列表降维
当列表中的所有数据均为列表时,可以通过单星号索引之后,用itertools 中的chain 函数进行拼接。
>>> from itertools import chain
>>> a = [[1, 2], [3, 4], [5, 6]]
>>> chain(*a)
[1, 2, 3, 4, 5, 6]
列表分块
python内置了map 函数,可以遍历列表并对每个元素进行映射。对于list(map(func,myList)) ,等价于[func(e) for e in myList] 。根据这个特性,可以对列表进行分块。
from math import ceil
def chunkByFor(lst, size):
return [lst[x*size:x*size+size]
for x in range(0,ceil(len(lst)/size))]
def chunkByMap(lst, size):
return list(
map(lambda x: lst[x * size:x * size + size],
list(range(0, ceil(len(lst) / size)))))
chunk([1,2,3,4,5],2)
列表转置
zip 可以像拉链一样将数组中对应的值缝合起来,以元组的形式重新存储。根据这个特性,可完成列表的"转置"。
>>> lst = [[1,2], [3,4], [5,6]]
>>> list(zip(*lst))
[(1, 3, 5), (2, 4, 6)]
查找与检测
查找众数
list 封装了count 方法,可以统计元素个数,例如
>>> lst = [1,2,1,2,3,2,1,4,2]
>>> lst.count(1)
3
而最大值选取函数max 中有一个参数key ,表示选取最大值的依据,例如
>>> x = [-2,-1,0,1,2]
>>> def test(x): return x**2-2*x
...
>>> max(x,key=test)
-2
表示选出当函数test 值最大时的自变量。
根据这两个特点,可以得到查找列表中出现次数最多元素的方法为
>>> lst = [1,2,3,4,5,2,3,2,1,2,4]
>>> max(set(lst),key=lst.count)
2
判断重复
借助set 中元素不重复的特性,可以检验非set 数据中是否有重复数据。
def isUnique(lst):
return len(lst) == len(set(lst))
>>>x = [1,2,3,4,5,5]
>>>y = [1,2,3,4,5]
>>>isUnique(x)
False
>>>isUnique(y)
True
比较元素差异
在python中,集合set 提供了类似做差的操作difference 。对于集合A 和B 而言,若想实现A-B 的功能,可采取A.difference(B) 的方案。
对于其他数据结构,可先转为set 再行做差。且difference 会自动将输入变量转为set 。
>>> A = [1,2,3]
>>> B = [1,2,4]
>>> list(set(A).difference(B))
[3]
比较列表计算后的差异
现有一函数func ,对于两组数据A 和B ,如果希望得到func(A) 和func(B) 的差别,也可以采用set 的特性。
def funcMinus(A, B, func):
B = set(map(func, B))
return [a for a in A if fn(a) not in B]
筛选数据
filter 是python的内置函数,用于过滤不符合条件的数据。list(filter(func,myList)) 等价于[e for e in myList if func(e)==1] 。
索引和运算符
为列表添加索引
enumerate 可以将列表、元组等组合为索引序列,并可以声明初始值,例如
>>> orders = ['first','second','third']
>>> list(enumerate(orders))
[(0, 'first'), (1, 'second'), (2, 'third')]
>>> list(enumerate(orders,2))
[(2, 'first'), (3, 'second'), (4, 'third')]
>>>
这可以非常方便地应用到for 循环中
>>> for i,val in enumerate(orders,1):
... print(i,val)
...
1 first
2 second
3 third
字符串和列表的加法与乘法
在python中,字符串或者list 可以进行加法和数乘运算,前者表示拼接,后者表示叠加。
>>> s = 'python'
>>> s+s
'pythonpython'
>>> s*4
'pythonpythonpythonpython'
回文
在python中,对列表或者字符串采用: 进行索引,例如a:b 指的是从a到b的数据;当采用双引号:: 时,引号间的值的意义就发生了变化,例如a:b:c 表示从a到b,间隔为c的数据。
据此,可以得到::-1 表示将字符串颠倒过来,据此可以判断一个字符串是否为回文结构
>>> s = "abcde"
>>> s[::-1]
'edcba'
>>> s == s[::-1]
False
字符串操作
首字母大小写
python中,字符串内置title() 函数,可以将字符串内每个词进行首字母大写。
"python".title()
python字符串提供了.lower 和.upper 函数,可以进行大小写转换。据此可以将首字母重新变为小写。
>>> def deCapitalize(string):
... return string[0].lower() + string[1:]
...
>>> capitalize("Hello")
'hello'
字符串拼接
可以通过字符串的内置函数join 将一个字符串加入到 列表中的多个符串中
>>> date = ['2021','3','10']
>>> '-'.join(date)
'2021-3-10'
通过正则表达式统计字母个数
re 为python中的正则表达式包,其中re.findall 可将正则表达式所选中的内容挑出。在正则表达式中,方括号[] 内部的字符彼此之间是“或”的关系。
据此,我们可以统计字符个数。例如我们希望统计元音字母[aeiou] 的个数,可用如下方法
import re
def count_vowels(str):
return len(len(re.findall(r [aeiou] , str, re.IGNORECASE)))
count_vowels( foobar )
count_vowels( gym )
变位词
如果两个单词中出现的字母相同,且每个字母出现的次数也相同,则这两个单词互为变位词(Anagram)。
collections 中的Counter 函数可以统计数据中的元素个数,其返回值为dict ,可根据这个特性来对比两个字符串是否互为变位词
from collections import Counter
def isAnagram(first, second):
return Counter(first) == Counter(second)
计算字节大小
将字符串转化为utf-8 编码后,其长度即为字节大小。
以下方法将以字节为单位返回字符串长度。
def byte_size(string):
return(len(string.encode('utf-8')))
byte_size("我爱你")
字典操作
字典生成
dict 函数可以通过列表生成字典,其要求为列表中的元素为[key,value] 的形式。例如
>>> dict([[1,2],[4,5],[6,7]])
{1: 2, 4: 5, 6: 7}
那么对于两个列表keys 和values ,可通过zip 进行缝合,然后生成字典。
>>> keys = [1,2,3]
>>> values = [4,5,6]
>>> dict(zip(keys,values))
{1: 4, 2: 5, 3: 6}
键值对互换
根据列表生成字典的方法,可以快速实现字典键值对呼唤的操作。
>>> myDict = {"one":"1","two":"2"}
>>> dict(zip(myDict.values(),myDict.keys()))
{'1': 'one``2': 'two'}
字典合并
python中的dict 数据内置函数update ,可合并两个字典,这个过程会覆盖原有的key 。
>>> a = {"x" : 1, "y" : 2}
>>> b = {"y" : 3, "z" : 4}
>>> a.update(b)
>>> a
{'x': 1, 'y': 3, 'z': 4}
此外也可以用双星号索引进行合并。
字典实现case 功能
import operator
def calc(a,b,flag):
flags = {
"add": operator.add,
"sub": operator.sub,
"truediv": operator.truediv,
"mul": operator.mul,
}
return flags[flag](a,b)
>>> calc(1,2,'add')
3
系统调用
内存信息
sys 中的getsizeof 可以检查变量所占内存大小。
import sys
variable = 30
print(sys.getsizeof(variable))
id 函数可以返回变量在内存中的位置。
>>> val = "abcde"
>>> id(val)
1803924712368
时间日期
记录程序运行时间
time.time() 可以获取当前的系统时间,据此可以记录算法的运行时间。
import time
tStart = time.time()
a = [n**2 for n in range(10000)]
tEnd = time.time()
print(tStart-tEnd)
打印日历
python中的calendar 可以提供日历。其中calendar(2021) 以字符串的形式返回2021年的日历,calendar.month(2021,3) 以字符串的形式返回2021年3月份的日历。而prmonth ,prcal 可以直接将日历打印出来,例如
import calendar
>>> calendar.prmonth(2021,3)
March 2021
Mo Tu We Th Fr Sa Su
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
|