第一章:详解用Python实现数据md5、sha加密
本文分享知识:
- pandas读取Excel数据 read_excel()
- 使用Python的加密库 hashlib
- pandas中map方法使用
- pandas写入Excel数据 to_excel()
代码均在 jupyter 环境下运行,公众号《帅帅的Python》回复《数据加密》获取源码
我这里有一份客户的Excel数据,里面有客户的手机号和身份证号信息,这些信息不能泄露,你加密一下发给我。
面对经理紧急安排的任务,小凡不敢懈怠,暂时放下手中正在处理的任务,将精力集中到数据加密这件事情上。
小凡思考了一会,数据加密,常用的加密算法有:md5和sha,既然没有要求,那就选择最简单的md5加密吧。
不一会,小凡脑海中就构思出了两种解决办法:
1、在Excel中调用md5加密函数,但这个需要安装加密文件,时间上可能来不及
2、用Python中的加密库,只需要读取Excel中的数据,再将加密好的数据导出为Excel即可
经过慎重的考虑,小凡决定使用Python进行数据加密。
一、用 pandas 读取 Excel 数据
import pandas as pd
excel_path = "./test.xlsx"
df = pd.read_excel(excel_path)
df.sample(5)
read_excel() 常用参数:
io:excel文件地址
sheet_name:默认为第一个表格
header:头部(列名)从第几行开始,默认第一行
除了用pandas还可以用xlrd库读取Excel,xlwt将数据写入Excel,详情请看:第三章内容
二、加密库 hashlib
获取到数据后,开始加密。我们先学习一下如何使用加密库hashlib,加密一个客户的身份证号?
import hashlib
string = "730763747019734357"
utf_8_str = str(string).encode("utf8")
encry_result = hashlib.md5(utf_8_str).hexdigest()
encry_result
这样就把一个字符串用 md5 的方法加密完成啦。让我们稍微修饰一下,编写一个加密的函数。
def encryption_str(string, encry_model="md5_32", encry_style=True):
# 加密为 utf-8 编码
utf_8_str = str(string).encode("utf8")
# 函数字典
param_dict = {
"md5_32": hashlib.md5(utf_8_str),
"md5_16": hashlib.md5(utf_8_str),
"sha1": hashlib.sha1(utf_8_str),
"sha224": hashlib.sha224(utf_8_str),
"sha256": hashlib.sha256(utf_8_str),
"sha512": hashlib.sha512(utf_8_str)
}
encry_result = param_dict[encry_model].hexdigest()
if encry_model == 'md5_16':
encry_result = encry_result[8:-8]
# 返回结果
return encry_result if encry_style == "小写" else encry_result.upper()
嗯,只是稍微修改一下。
三、 pandas中的 map() 方法
现在有1000多条数据,怎样才能将这么多的数据一次性加密完成呢?
这就需要用到 map() 方法:
pandas.series.map(arg,na_action=None),arg为一个函数,将series中的每一个数据作为arg函数的参数
经常与 lambda 函数连用,即:
df[“列名”].map(lambda x:func(x))
表示将该列的每一个数据 x,传递给 func(),并把函数的返回值组成新的列
df["手机号_md5"] = df["手机号"].map(lambda x:encryption_str(x))
df["身份证号_md5"] = df["身份证号"].map(lambda x:encryption_str(x))
df.sample(5)
数据已经加密完成啦,接下来就把数据重新保存为 Excel 发给经理。
pandas.DataFrame.to_excel() 常用参数:
sheet_name:工作表名,默认为 sheet1
index:是否输入索引,默认为 True
df.to_excel("./客户数据_md5加密.xlsx")
整个过程耗时15分钟,小凡检查了一下加密后的数据,确定没有问题,便将Excel发给经理。
见经理一直没有回消息,小凡继续做着先前的数据报告。
数据加密工具
过了一会,经理过来啦。
做的很好,能告诉我怎么做的吗?经理问。
小凡将自己如何用Python加密数据的步骤讲给经理听,但是经理好像听不太懂。
有没有什么工具,直接就将excel数据加密完成,不用写代码?经理期待的问到。
没有吧,网上的工具都只能加密一个字符串,没有直接加密excel文件的工具。不过,有什么是Python不能实现的呢?
小凡将自己如何用Python加密数据的步骤讲给经理听,但是经理好像听不太懂。
有没有什么工具,直接就将excel数据加密完成,不用写代码?经理期待的问到。
没有吧,网上的工具都只能加密一个字符串,没有直接加密excel文件的工具。不过,有什么是Python不能实现的呢?
于是,小凡决定用Python做个加密工具,这样操作起来就很方便啦。
|