大家好,我是小五🚀
大家谈及用Pandas 导出数据,应该就会想到to.xxx 系列的函数。
这其中呢,比较常用的就是pd.to_csv() 和pd.to_excel() 。但其实还可以将其导成Html网页格式,这里用到的函数就是pd.to_html() !
读取Excel
今天我们要实现Excel转为html格式,首先需要用读取Excel中的表格数据。
import pandas as pd
data = pd.read_excel('测试.xlsx')
查看数据
data.head()
下面我们来学习把DataFrame转换成HTML表格的方法。
生成Html
to_html() 函数可以直接把DataFrame转换成HTML表格,只需一行代码即可实现:
html_table = data.to_html('测试.html')
运行上面代码后,工作目录中多了测试.html 文件,使用网页浏览器打开它,显示内容如下👇
print(data.to_html())
通过print打印,可以看到DataFrame的内部结构被自动转换为嵌入在表格中的<TH> ,<TR> ,<TD> 标签,保留所有内部层级结构。
调整格式
我们还可以自定义修改参数,来调整生成HTML的格式。
html_table = data.to_html('测试.html',header = True,index = False,justify='center')
再次打开新生成的测试.html 文件,发现格式已经发生了变化。
如果想对格式进行进一步调整(增加标题、修改颜色等),就需要一些HTML知识了,可以对生成的测试.html 文件中的文本进行调整。
对于有些小伙伴可能需要进行页面展示,就要搭配Flask库来使用了。
小结
Pandas提供read_html() ,to_html() 两个函数用于读写html格式的文件。这两个函数非常有用,一个轻松将DataFrame等复杂的数据结构转换成HTML表格;另一个不用复杂爬虫,简单几行代码即可抓取Table表格型数据,简直是个神器!
今天篇幅很短,主要讲了Pandas中to_html() 这个函数。使用该函数最大的优点是:我们在不了解html知识的情况下,就能生成一个表格型的HTML。
end
如果大家对另一函数(Pandas如何来爬虫)感兴趣的话,就给本文右下角点个👍吧!
本文赞数超过15个!就给大家写一下read_html() 的详细参数!
|