python连接hive报错:TypeError: can‘t concat str to bytes

目录

一、完整报错

二、解决

[三、 其他报错](#三、 其他报错)

四、impala方式连接hive


或者直接使用 pip install pyhive[hive] 安装。需要先 pip uninstall pyhive。

一、完整报错

Traceback (most recent call last):

File "D:/Gitlab/my_world/hive2csv.py", line 18, in <module>

conn = hive.Connection(host=host, port=port, username=username, password=password, database=database, auth=auth)

File "D:\Anaconda3\lib\site-packages\pyhive\hive.py", line 269, in init

self._transport.open()

File "D:\Anaconda3\lib\site-packages\thrift_sasl\init.py", line 82, in open

self._send_message(self.START, chosen_mech)

File "D:\Anaconda3\lib\site-packages\thrift_sasl\init.py", line 103, in _send_message

self._trans.write(header + body)

TypeError: can't concat str to bytes

二、解决

2.1、进入D:\Anaconda3\lib\site-packages\thrift_sasl\init.py文件

2.2、添加如下代码到第101行之前

python 复制代码
if (type(body) is str):
    body = body.encode()

2.2,修改后情况

然后就可以运行了。

三、 其他报错

报错:AttributeError: 'TSaslClientTransport' object has no attribute 'readAll'

解决:pip install thrift_sasl==0.3.0

其他报错可以参考文章:python连接hive

四、impala方式连接hive

4.1、依赖包

python 复制代码
pip install six bit_array thrift thrift_sasl sqlalchemy impyla -i https://pypi.tuna.tsinghua.edu.cn/simple

4.2、代码

python 复制代码
from impala.dbapi import connect

conn = connect(host=host,port=port,user=username,password=password,auth_mechanism=auth,database=database)
def get_sql_result(sql):
    # 鎵ц鏌ヨ骞惰幏鍙栫粨鏋?    cursor = conn.cursor()
    cursor.execute(sql)
    result = cursor.fetchall()
    columns = [desc[0] for desc in cursor.description]

    return result,columns


if __name__ == '__main__':

    hive_sql = 'show databases'
    result,columns = get_sql_result(hive_sql)

    df = pd.DataFrame(result,columns=columns)
相关推荐
Flittly1 小时前
【从零手写 ClaudeCode:learn-claude-code 项目实战笔记】(4)Subagents (子智能体)
python·agent
明月_清风7 小时前
Python 装饰器前传:如果不懂“闭包”,你只是在复刻代码
后端·python
明月_清风7 小时前
打破“死亡环联”:深挖 Python 分代回收与垃圾回收(GC)机制
后端·python
ZhengEnCi1 天前
08c. 检索算法与策略-混合检索
后端·python·算法
明月_清风1 天前
Python 内存手术刀:sys.getrefcount 与引用计数的生死时速
后端·python
明月_清风1 天前
Python 消失的内存:为什么 list=[] 是新手最容易踩的“毒苹果”?
后端·python
Flittly2 天前
【从零手写 ClaudeCode:learn-claude-code 项目实战笔记】(3)TodoWrite (待办写入)
python·agent
千寻girling2 天前
一份不可多得的 《 Django 》 零基础入门教程
后端·python·面试
databook2 天前
探索视觉的边界:用 Manim 重现有趣的知觉错觉
python·动效
明月_清风2 天前
Python 性能微观世界:列表推导式 vs for 循环
后端·python