python连接hive报错:TypeError: can‘t concat str to bytes

目录

一、完整报错

二、解决

[三、 其他报错](#三、 其他报错)

四、impala方式连接hive


或者直接使用 pip install pyhive[hive] 安装。需要先 pip uninstall pyhive。

一、完整报错

Traceback (most recent call last):

File "D:/Gitlab/my_world/hive2csv.py", line 18, in <module>

conn = hive.Connection(host=host, port=port, username=username, password=password, database=database, auth=auth)

File "D:\Anaconda3\lib\site-packages\pyhive\hive.py", line 269, in init

self._transport.open()

File "D:\Anaconda3\lib\site-packages\thrift_sasl\init.py", line 82, in open

self._send_message(self.START, chosen_mech)

File "D:\Anaconda3\lib\site-packages\thrift_sasl\init.py", line 103, in _send_message

self._trans.write(header + body)

TypeError: can't concat str to bytes

二、解决

2.1、进入D:\Anaconda3\lib\site-packages\thrift_sasl\init.py文件

2.2、添加如下代码到第101行之前

python 复制代码
if (type(body) is str):
    body = body.encode()

2.2,修改后情况

然后就可以运行了。

三、 其他报错

报错:AttributeError: 'TSaslClientTransport' object has no attribute 'readAll'

解决:pip install thrift_sasl==0.3.0

其他报错可以参考文章:python连接hive

四、impala方式连接hive

4.1、依赖包

python 复制代码
pip install six bit_array thrift thrift_sasl sqlalchemy impyla -i https://pypi.tuna.tsinghua.edu.cn/simple

4.2、代码

python 复制代码
from impala.dbapi import connect

conn = connect(host=host,port=port,user=username,password=password,auth_mechanism=auth,database=database)
def get_sql_result(sql):
    # 鎵ц鏌ヨ骞惰幏鍙栫粨鏋?    cursor = conn.cursor()
    cursor.execute(sql)
    result = cursor.fetchall()
    columns = [desc[0] for desc in cursor.description]

    return result,columns


if __name__ == '__main__':

    hive_sql = 'show databases'
    result,columns = get_sql_result(hive_sql)

    df = pd.DataFrame(result,columns=columns)
相关推荐
陈苏同学12 分钟前
4. 将pycharm本地项目同步到(Linux)服务器上——深度学习·科研实践·从0到1
linux·服务器·ide·人工智能·python·深度学习·pycharm
唐家小妹16 分钟前
介绍一款开源的 Modern GUI PySide6 / PyQt6的使用
python·pyqt
羊小猪~~1 小时前
深度学习项目----用LSTM模型预测股价(包含LSTM网络简介,代码数据均可下载)
pytorch·python·rnn·深度学习·机器学习·数据分析·lstm
Marst Code1 小时前
(Django)初步使用
后端·python·django
985小水博一枚呀1 小时前
【对于Python爬虫的理解】数据挖掘、信息聚合、价格监控、新闻爬取等,附代码。
爬虫·python·深度学习·数据挖掘
立秋67892 小时前
Python的defaultdict详解
服务器·windows·python
萧鼎2 小时前
Python第三方库选择与使用陷阱避免
开发语言·python
白拾2 小时前
使用Conda管理python环境的指南
开发语言·python·conda
Data 3172 小时前
Hive数仓操作(十七)
大数据·数据库·数据仓库·hive·hadoop
是刃小木啦~2 小时前
三维模型点云化工具V1.0使用介绍:将三维模型进行点云化生成
python·软件工程·pyqt·工业软件