前面在介绍过当PowerBI遇到了Python会擦出怎样的火花,那么今天就来介绍下使用Python来连接PowerBI数据集。
adodbapi库
首先安装这个库
pip install adodbapi
连接工作区中数据
如果是高级容量工作区,则可以通过直接连接线上工作区中的数据集,数据集的连接字符串获取方式可参考
PowerBI数据集单表刷新(一),这里还有点要注意,连接方式中并没有指定账号信息,运行代码时会弹框让填写账号和密码。
连接本地文件
使用dax studio来获取报表文件的连接信息
其实,不仅可以运行dax查询语句,也可以运行DMV,详细可参考PowerBI 中使用DMV获取数据
虽然,我们如果是高级容量工作区则可以使用XMLA方式连接数据集,但这种方式对性能有一定要求。所以更推荐使用连接本地文件的方式。
pythonnet
这是另一个库,也可实现类似的功能,
先安装,如果pip安装有问题,可从附件下载解压后,进解压目录安装
pip install pythonnet
另外有国外大牛封闭了一个库ssas_api可供使用,可从附件下载下来放到代码所在目录或者直接放到python.exe的根目录,我是使用的anaconda安装的,所以直接放在了anaconda的安装目录
查看工作区中所有数据集信息
连接本地文件
当然,也可以连接本地文件
总结
这里也是举了两个简单的例子,借助于这两个库还可以做很多事情,比如导出数据,比如和seaborn等其他可视化库结合使用做可视化等等,这具体要看你的需求是什么了。工具就在这里,要看我们怎么使用了。
附件可通过阅读原文去笔记区自取。
|