MongoDB +Dataframe+excel透视表

读取MongoDB中的表

复制代码
from pymongo import MongoClient
import pandas as pd
client = MongoClient('IP地址', 27017)

db = client['AOI']
collection = db['表名'] #替换为实际的名称
document = collection.find({'time':{'$gte':'2023-08-15 15:26:06'}})#筛选数据
df = pd.DataFrame(list(document))#转换为python常用的dataframe
# df = df[(df["time"] >= '2023-08-15 15:26:06')]
df["marks"] = df["marks"].astype('str')
df = df[df["marks"].str.contains("name")] #筛选数据
df = df.loc[:, ['_id', 'id', 'marks', 'time']] #选择想要的列
df.to_csv('path.csv', index=False)

Dataframe合并:

  1. 横向合并(增加列数)(跟据共同列来合并,如果有不同列则添加列)

(数据库的某些表数据太多无法保存到本地,直接merge取交集)

on='串号': 根据共同列进行合并,一定要保证有相同列名,不然会报错。

how='inner':取交集

复制代码
df1 = pd.read_csv('D:\df1.csv', encoding='gbk')
df2 = pd.read_csv('D:\df2.csv', encoding='gbk')
df_merge = pd.merge(df1, df2, on=['串号'], how='inner')
df_merge.to_csv('D:\df3.csv')
  1. 纵向合并(增加行数)

    merge_df = pd.concat([df1, df2], ignore_index=True)
    merge_df.to_csv('D:\df_merge.csv', index=False)

Dataframe去重:(我发现老是去重失败,不知道为啥)

复制代码
df = pd.read_csv('D:\AOI\df_merge_expert.csv', encoding='gbk')
df.drop_duplicates(keep='first', inplace=True)
df.to_csv('D:\AOI\df_merge_expert1.csv', index=False)
相关推荐
苏渡苇18 分钟前
Redis 持久化——RDB 快照 vs AOF 日志
数据库·redis·缓存·redis持久化·aof vs rdb
l1t36 分钟前
DeepSeek总结的使用 PEG 实现运行时可扩展的 SQL 解析器
数据库·sql
这个DBA有点耶40 分钟前
COUNT进阶(续):超大表去重计数的极致优化
数据库·架构·代码规范
爱喝水的鱼丶1 小时前
SAP-ABAP:SAP 简单报表输出开发系列(共6篇) 第四篇:SAP 报表异常处理机制:数据校验与消息提示规范落地
开发语言·数据库·学习·算法·sap·abap
_1_71 小时前
SQL SERVER闪退问题解决
数据库·sqlserver
ZengLiangYi1 小时前
sql.js WASM 深度解析
javascript·数据库·后端
一 乐1 小时前
人口老龄化社区服务与管理平台|基于springboot+vue的人口老龄化社区服务与管理平台(源码+数据库+文档)
java·数据库·vue.js·spring boot·论文·毕设·人口老龄化社区服务与管理平台
梓䈑2 小时前
【MySQL】表的操作(数据表的创建、查看 和 修改)
数据库·mysql
小碗羊肉2 小时前
【Redis | 第六篇】Redisson
数据库·redis·缓存
诸葛务农2 小时前
共沸脱水技术及其在光刻胶用PGMEA纯化中的应用(中)
linux·数据库·人工智能