Python 从Maxcompute导出海量数据到文本文件(txt)或Excel

由于直接从Maxcompute导出数据有条数限制,最多只能导出一万条,如果数据量太大,则不能直接从页面上导出。可以通过以下脚本把数据导出到文本文件或者Excel.

导出到文本文件脚本如下:

python 复制代码
# coding=utf-8
import datetime
from odps import ODPS
import time

odps = ODPS('access_key', 'access_secret', 'namespace',
            endpoint='http://service.cn-hangzhou.maxcompute.aliyun.com/api')
sql = "SELECT DISTINCT mobile FROM xxxx.sms  WHERE pt>='20250107' AND pt<='20250631';"

save_path = "/Users/xxxx/Desktop/mobiles.txt"

with open(save_path, 'w', encoding='utf-8') as f:  # 使用UTF-8编码打开文件
    # 写入表头(可选)
    # f.write("Mobile\n")
    
    with odps.execute_sql(sql).open_reader() as reader:
        for data in reader:
            # 使用制表符分隔数据,并用换行符分隔记录
            line = f"{data['mobile']}\n"
            f.write(line)

exit(0)

导出到Excel脚本如下:

python 复制代码
# coding=utf-8
import datetime
from odps import ODPS
import time
import xlwt
import openpyxl

odps = ODPS('access_key', 'access_secret', 'namespace',
            endpoint='http://service.cn-hangzhou.maxcompute.aliyun.com/api')
sql = " SELECT mobile, FROM xxx.sms WHERE pt>='20250801' AND pt<='20250804' ;"


outwb = openpyxl.Workbook()  # 打开一个将写的文件
outws = outwb.create_sheet(index=0)  # 在将写的文件创建sheet

i = 1
with odps.execute_sql(sql).open_reader() as reader:
    for data in reader:
        print(data)
        outws.cell(i, 1).value = data['mobile']
        i += 1
saveExcel = "/Users/xxx/Desktop/mobiles.xlsx"
outwb.save(saveExcel)  # 一定要记得保存

exit(1)
相关推荐
B站_计算机毕业设计之家11 分钟前
猫眼电影数据可视化与智能分析平台 | Python Flask框架 Echarts 推荐算法 爬虫 大数据 毕业设计源码
python·机器学习·信息可视化·flask·毕业设计·echarts·推荐算法
PPPPPaPeR.15 分钟前
光学算法实战:深度解析镜片厚度对前后表面折射/反射的影响(纯Python实现)
开发语言·python·数码相机·算法
JaydenAI19 分钟前
[拆解LangChain执行引擎] ManagedValue——一种特殊的只读虚拟通道
python·langchain
骇城迷影23 分钟前
Makemore 核心面试题大汇总
人工智能·pytorch·python·深度学习·线性回归
长安牧笛26 分钟前
反传统学习APP,摒弃固定课程顺序,根据用户做题正确性,学习速度,动态调整课程难度,比如某知识点学不会,自动推荐基础讲解和练习题,学习后再进阶,不搞一刀切。
python·编程语言
码界筑梦坊38 分钟前
330-基于Python的社交媒体舆情监控系统
python·mysql·信息可视化·数据分析·django·毕业设计·echarts
森焱森43 分钟前
详解 Spring Boot、Flask、Nginx、Redis、MySQL 的关系与协作
spring boot·redis·python·nginx·flask
he___H1 小时前
双色球红球
python
deephub1 小时前
机器学习特征工程:分类变量的数值化处理方法
python·机器学习·特征工程·分类变量