[大数据] （成功解决）Python连接clickhouse

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> （成功解决）Python连接clickhouse -> 正文阅读

[大数据]（成功解决）Python连接clickhouse

第一次尝试用Python连接clickhouse数据库，踩了不少坑，特此记录，帮助后人少犯错！

运行环境：

python 3.8.3
clickhouse_driver==0.2.3
clickhouse_sqlalchemy==0.2.0
sqlalchemy==1.4.32

clickhouse_driver连接的两种方式

1.Client

借鉴网上的方法

from clickhouse_driver import Client

client = Client(host=host, port=8123, database=database,user=user ,password=pw)
sql = 'SHOW TABLES'
res = client.execute(sql)

报错：UnexpectedPacketFromServerError: Code: 102
原因：端口问题，HTTP协议(默认端口8123)；TCP (Native)协议（默认端口号为9000），Python里的clickhouse_driver用的tcp端口9000，DBeaver使用的是HTTP协议所以可以使用8123端口。

修改后

from clickhouse_driver import Client

client = Client(host=host, port=9000, database=database,user=user ,password=pw)
sql = 'SHOW TABLES'
res = client.execute(sql)

报错：SocketTimeoutError: Code: 209.
原因：这里贴上 GitHub 上作者说的解决方案，传送门
在这里插入图片描述
发现这个错误的原因，也是因为没有设置9000端口？感觉很懵比。于是放弃了Client，试了一下另一种连接方式。

2.connect

from clickhouse_driver import connect

#账号:密码@主机名:端口号/数据库
conn = connect(f'clickhouse://{user}:{pw}@{host}:9000/{database}')
cursor = conn.cursor()
cursor.execute('SHOW TABLES')

报了一样的错误，服了。
最后放弃了clickhouse_driver，尝试用clickhouse_sqlalchemy与sqlalchemy成功解决

clickhouse_sqlalchemy

直接附上成功连接的代码。

from clickhouse_sqlalchemy import make_session
from sqlalchemy import create_engine
import pandas as pd

conf = {
    "user": "xxx",
    "password": "xxx",
    "server_host": "xx.xxx.xx.xxx",
    "port": "8123",
    "db": "xxx"
}

connection = 'clickhouse://{user}:{password}@{server_host}:{port}/{db}'.format(**conf)
engine = create_engine(connection, pool_size=100, pool_recycle=3600, pool_timeout=20)

sql = 'SHOW TABLES'

session = make_session(engine)
cursor = session.execute(sql)
try:
    fields = cursor._metadata.keys
    df = pd.DataFrame([dict(zip(fields, item)) for item in cursor.fetchall()])
finally:
    cursor.close()
    session.close()

大数据最新文章

实现Kafka至少消费一次

亚马逊云科技：还在苦于ETL？Zero ETL的时代

初探MapReduce

【SpringBoot框架篇】32.基于注解+redis实现

Elasticsearch：如何减少 Elasticsearch 集

Go redis操作

Redis面试题

专题五 Redis高并发场景

基于GBase8s和Calcite的多数据源查询

Redis——底层数据结构原理

加:2022-03-24 00:37:48 更:2022-03-24 00:39:48

360图书馆购物三丰科技阅读网日历万年历 2026年5日历

-2026/5/11 2:23:07-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码