PandasAI—让AI做数据分析

安装

pip install pandasai

!pip install --upgrade pandas pandasai

导入依赖项

复制代码
import pandas as pd

from pandasai import PandasAI

from pandasai.llm.openai import OpenAI

使用pandas创建一个数据框

复制代码
df = pd.DataFrame({
    "country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
    "gdp": [21400000, 2940000, 2830000, 3870000, 2160000, 1350000, 1780000, 1320000, 516000, 14000000],
    "happiness_index": [7.3, 7.2, 6.5, 7.0, 6.0, 6.3, 7.3, 7.3, 5.9, 5.0]
})

实例化LLM

复制代码
OPENAI_API_KEY = "YOUR API KEY"
llm = OpenAI(api_token=OPENAI_API_KEY)

使用提供的大语言模型实例化PandasAI,并运行

复制代码
pandas_ai = PandasAI(llm, conversational=False)
pandas_ai.run(df, prompt='What are the 5 happiest countries')

图表展示

复制代码
pandas_ai.run(df, "Plot the histogram of countries showing for each the gpd, using different colors for each bar")

询问涉及多个数据框的问题

复制代码
employees_data = {
    'EmployeeID': [1, 2, 3, 4, 5],
    'Name': ['John', 'Emma', 'Liam', 'Olivia', 'William'],
    'Department': ['HR', 'Sales', 'IT', 'Marketing', 'Finance']
}

salaries_data = {
    'EmployeeID': [1, 2, 3, 4, 5],
    'Salary': [5000, 6000, 4500, 7000, 5500]
}

employees_df = pd.DataFrame(employees_data)
salaries_df = pd.DataFrame(salaries_data)

pandas_ai([employees_df, salaries_df], "Who gets paid the most?")
相关推荐
薛定e的猫咪6 分钟前
【论文精读】ICLR 2023 --- 作为离线强化学习强表达能力策略类的扩散策略
人工智能·深度学习·机器学习·stable diffusion
连线Insight15 分钟前
当考公遇上AI,粉笔能吸引用户付费吗?
人工智能
●VON19 分钟前
开源 vs 商业:主流AI生态概览——从PyTorch到OpenAI的技术格局之争
人工智能·pytorch·开源
用户414292960723937 分钟前
批量商品信息采集工具获取商品详情的完整方案
爬虫·数据挖掘·数据分析
乾元1 小时前
AI 在网络工程中的 12 个高频场景深度实战(Cisco / Huawei 双体系)
人工智能
用户41429296072391 小时前
淘宝实时商品API接口:采集竞品商品详情页的价格、SKU 规格、库存数量、卖点文案、图文内容、售后政策(运费、退换货规则)、评价核心标签
数据挖掘·数据分析·数据可视化
子午2 小时前
【食物识别系统】Python+TensorFlow+Vue3+Django+人工智能+深度学习+卷积网络+resnet50算法
人工智能·python·深度学习
Dev7z2 小时前
基于深度学习和图像处理的药丸计数与分类系统研究
图像处理·人工智能·深度学习
Mxsoft6192 小时前
某次联邦学习训练模型不准,发现协议转换字段映射错,手动校验救场!
人工智能
shayudiandian3 小时前
用PyTorch训练一个猫狗分类器
人工智能·pytorch·深度学习