项目由来
在现实工作中,我们肯定和Excel打过很多交道,其中你一定用到过单元格格式,例如让数字保留两位小数,或者换为百分数等等。
今天的分享就和格式化单元格有关,如表所示,是每个点位的纬度(数据是我随便生成的,没有任何实际意义),最后我想要的结果是 分位数保留2位,秒数小数位保留两位,整数保留两位。
例如,30° 1' 1.599" N,格式化后要变为30° 01' 01.60" N。
Excel肯定能做,就是我不会,有会的联系我教教我,我这里用Python来实现。
解题思路
(1)首先我们需要对数据清洗,这里主要就是度分秒的符号问题,有的是中文的,有的是英文的,我们需要统一替换为一种就行,在Excel中完成就行。
(2)第二步,要做的就是把度分秒的数字提取出来,分别处理。这里用split函数,或者正则表达式都行,看自己,我这里用正则表达式。
(3)格式化就用format函数,例如保留两位就用:02d即可。
实现代码
大概思路弄明白了,接下来我们就考虑用什么方法,这次我打算用pandas库,然后定义一个格式化函数,使用apply函数就可以很方便的完成,我们来看代码。
import pandas as pd
import re
df = pd.read_excel('1.xlsx', sheet_name = 'Sheet1')
def get(x):
degree = re.findall('(\d+)°', x)[0]
minute = re.findall('° (\d+)', x)[0]
second = re.findall('''' (.*?)"''', x)[0]
return '''{}°{:02d}'{:05.2f}" N'''.format(degree, int(minute), float(second))
df['lat'] = df['纬度'].apply(get)
df
最后输出到本地即可,是不是很简单了。
本次的分享就到这了,我们下期再见咯。