【Python】数据导入

Python数据导入的方法有很多,以下是八种常见的方法:

  1. 使用Pandas read函数

Pandas库提供了一种通用的方式来导入各种数据类型,如CSV,Excel,JSON,SQL,等等。

复制代码
import pandas as pd
 
# 导入CSV文件
df = pd.read_csv('filename.csv')
 
# 导入Excel文件
df = pd.read_excel('filename.xlsx')
 
# 导入JSON文件
df = pd.read_json('filename.json')
  1. 使用Python内置的open和csv模块

Python的内置模块提供了基本的文件读写能力,配合csv模块可以读取CSV文件。

复制代码
import csv
 
with open('filename.csv', mode='r') as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)
  1. 使用Python的numpy.loadtxt或numpy.genfromtxt函数

这两个函数可以读取数据,并可选择性地转换数据类型。

复制代码
import numpy as np
 
# 读取CSV文件
data = np.loadtxt('filename.csv', dtype=np.float, delimiter=',')
  1. 使用SQLAlchemy模块

SQLAlchemy是Python的一个数据库工具。它允许你使用Python的语法连接和操作数据库。

复制代码
from sqlalchemy import create_engine
 
engine = create_engine('sqlite:///database.db')
 
# 导入CSV文件到SQL数据库
df = pd.read_csv('filename.csv')
df.to_sql(name='table_name', con=engine, if_exists='replace', index=False)
  1. 使用Python的pickle模块

pickle模块可以用来序列化和反序列化Python的对象结构。

复制代码
import pickle
 
# 写入对象到文件
with open('filename.pkl', 'wb') as file:
    pickle.dump({'key': 'value'}, file)
 
# 从文件读取对象
with open('filename.pkl', 'rb') as file:
    data = pickle.load(file)
  1. 使用Python的sqlite3模块

sqlite3是Python的内置数据库,适用于简单的数据存储。

复制代码
import sqlite3
 
conn = sqlite3.connect('database.db')
 
# 创建一个Cursor:
cursor = conn.cursor()
 
# 执行一条SQL语句:
cursor.execute('SELECT * FROM table_name')
 
# 使用fetchall()获取所有数据:
values = cursor.fetchall()
 
cursor.close()
  1. 使用Python的h5py模块

h5py是用于读取和写入HDF5文件的Python库,HDF5是一种用于存储和组织大量数据的文件格式。

复制代码
import h5py
 
# 写入数据到HDF5文件
with h5py.File('filename.h5', 'w') as file:
    file.create_dataset('dataset_name', data=[1, 2, 3, 4, 5])
 
# 读取HDF5文件的数据
with h5py.File('filename.h5', 'r') as file:
    print(file['dataset_name'][:])
  1. 使用Python的pymysql模块

pymysql是用于Python中与MySQL数据库进行交互的一个库。

复制代码
import pymysql
 
# 连接数据库
conn = pymysql.connect(host='localhost', user='user', password='passwd', db='db', charset='utf8')
 
# 创建游标对象
cursor = conn.cursor()
相关推荐
鸽芷咕15 分钟前
DrissionPage 成 CANN 仓库爆款自动化工具:背后原因何在?
运维·python·自动化·cann
爱学习的阿磊17 分钟前
使用Fabric自动化你的部署流程
jvm·数据库·python
少云清37 分钟前
【金融项目实战】7_接口测试 _代码实现接口测试(重点)
python·金融项目实战
深蓝电商API38 分钟前
爬虫IP封禁后的自动切换与检测机制
爬虫·python
m0_5500246339 分钟前
持续集成/持续部署(CI/CD) for Python
jvm·数据库·python
B站_计算机毕业设计之家1 小时前
豆瓣电影数据采集分析推荐系统 | Python Vue Flask框架 LSTM Echarts多技术融合开发 毕业设计源码 计算机
vue.js·python·机器学习·flask·echarts·lstm·推荐算法
渣渣苏1 小时前
Langchain实战快速入门
人工智能·python·langchain
lili-felicity1 小时前
CANN模型量化详解:从FP32到INT8的精度与性能平衡
人工智能·python
数据知道1 小时前
PostgreSQL实战:详解如何用Python优雅地从PG中存取处理JSON
python·postgresql·json
ZH15455891312 小时前
Flutter for OpenHarmony Python学习助手实战:面向对象编程实战的实现
python·学习·flutter