PandasAI—让AI做数据分析

安装

pip install pandasai

!pip install --upgrade pandas pandasai

导入依赖项

复制代码
import pandas as pd

from pandasai import PandasAI

from pandasai.llm.openai import OpenAI

使用pandas创建一个数据框

复制代码
df = pd.DataFrame({
    "country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
    "gdp": [21400000, 2940000, 2830000, 3870000, 2160000, 1350000, 1780000, 1320000, 516000, 14000000],
    "happiness_index": [7.3, 7.2, 6.5, 7.0, 6.0, 6.3, 7.3, 7.3, 5.9, 5.0]
})

实例化LLM

复制代码
OPENAI_API_KEY = "YOUR API KEY"
llm = OpenAI(api_token=OPENAI_API_KEY)

使用提供的大语言模型实例化PandasAI,并运行

复制代码
pandas_ai = PandasAI(llm, conversational=False)
pandas_ai.run(df, prompt='What are the 5 happiest countries')

图表展示

复制代码
pandas_ai.run(df, "Plot the histogram of countries showing for each the gpd, using different colors for each bar")

询问涉及多个数据框的问题

复制代码
employees_data = {
    'EmployeeID': [1, 2, 3, 4, 5],
    'Name': ['John', 'Emma', 'Liam', 'Olivia', 'William'],
    'Department': ['HR', 'Sales', 'IT', 'Marketing', 'Finance']
}

salaries_data = {
    'EmployeeID': [1, 2, 3, 4, 5],
    'Salary': [5000, 6000, 4500, 7000, 5500]
}

employees_df = pd.DataFrame(employees_data)
salaries_df = pd.DataFrame(salaries_data)

pandas_ai([employees_df, salaries_df], "Who gets paid the most?")
相关推荐
Francek Chen14 小时前
【自然语言处理】预训练05:全局向量的词嵌入(GloVe)
人工智能·pytorch·深度学习·自然语言处理·glove
这张生成的图像能检测吗14 小时前
(论文速读)LyT-Net:基于YUV变压器的轻量级微光图像增强网络
图像处理·人工智能·计算机视觉·低照度
许泽宇的技术分享14 小时前
AI黑客来袭:Strix如何用大模型重新定义渗透测试游戏规则
人工智能
Oxo Security14 小时前
【AI安全】检索增强生成(RAG)
人工智能·安全·网络安全·ai
少林码僧15 小时前
2.3 Transformer 变体与扩展:BERT、GPT 与多模态模型
人工智能·gpt·ai·大模型·bert·transformer·1024程序员节
shayudiandian15 小时前
如何使用 DeepSeek 帮助自己的工作
人工智能
程序猿追15 小时前
轻量级云原生体验:在OpenEuler 25.09上快速部署单节点K3s
人工智能·科技·机器学习·unity·游戏引擎
@小码农16 小时前
2025年北京海淀区中小学生信息学竞赛第一赛段试题(附答案)
人工智能·python·算法·蓝桥杯
程序猿追16 小时前
异腾910B NPU实战:vLLM模型深度测评与部署指南
运维·服务器·人工智能·机器学习·架构
York·Zhang16 小时前
Ollama:在本地运行大语言模型的利器
人工智能·语言模型·自然语言处理·ollama