拍拍贷数据分析-逾期情况分析

数据背景

所提供数据来自拍拍贷真实业务数据,从2015-01-01到2017-01-30的所有信用标的10%sample样本。数据集包含LC.csv(标的特征表数据)和LP.csv(标的还款计划和还款记录表)数据。详情如下:

数据字典

1.LC.csv 数据大小:50.7MB

LC (Loan Characteristics) 表为标的特征表,每支标一条记录。共有21个字段,包括一个主键(listingid)、7个标的特征和13个成交当时的借款人信息,全部为成交当时可以获得的信息。

2.LP.csv 数据大小:198MB

LP (Loan Periodic) 表为标的还款计划和还款记录表,每支标每期还款为一条记录。 还款记录和状态更新至2017年2月22日。共有10个字段,包括两个主键(listingid和期数),3个还款计划字段和4个还款状态字段

字段序号 字段名 字段注释

数据预览

1.LC.csv

LP.csv

  1. 计算整体逾期情况
  2. 月逾期人数、金额
  3. 不同年龄、性别、初试信用评级的逾期情况
  4. 影响逾期率因素分析

1计算整体逾期情况

逾期率 = 逾期期数/(正常还款期数+逾期还款期数)

scala 复制代码
    //逾期还款次数/(yuqi_times+normal_times) 0.081
    df_all_counts.agg(functions
      .sum("yuqi_times")/
      (functions.sum("yuqi_times")+
        functions.sum("normal_times")))

2月逾期用户、金额


随着时间的增加,逾期人数未归还金额越来越多,平台风险增大。

3不同年龄、性别、初试信用评级等的逾期情况

年龄

25岁以下借款人逾期率普遍高于整体逾期率,30-40岁借款人逾期率最低。

性别

女性逾期率略高于男性。

认证个数

认证个数大于3个的逾期率较低,小于三个逾期率较高。

初始信用评级

初始信用评级越高,逾期率越低。

贷款类型

普通贷款类型逾期率最高。

贷款金额

贷款金额低于1万元时逾期率较低。

根据逾期情况提出运营建议

平台随着时间增加,逾期人数和金额都在增加,平台风险变大。根据各类型的逾期情况改变贷款策略。年龄低于25岁、认证个数小于三个、初试信用等级低于D和贷款金额较大的用户都应谨慎放贷。

相关推荐
哈里谢顿5 分钟前
Python 依赖注入详解
python
冬天vs不冷32 分钟前
Java基础(九):Object核心类深度剖析
java·开发语言·python
TS的美梦33 分钟前
【1:1复刻R版】python版火山图函数一键出图
开发语言·python·r语言·scanpy·火山图
CF14年老兵1 小时前
Python万物皆对象:从懵懂到顿悟的奇妙之旅
后端·python·trae
这里有鱼汤1 小时前
发现个用《道德经》+价值投资大咖的智慧,做A股的AI诊股神器,居然还开源了
python
陈天伟教授1 小时前
(二)Python + 地球信息科学与技术 (GeoICT)=?
开发语言·python
之歆2 小时前
大模型微调分布式训练-大模型压缩训练(知识蒸馏)-大模型推理部署(分布式推理与量化部署)-大模型评估测试(OpenCompass)
人工智能·笔记·python
人工干智能2 小时前
pygame的帧处理中,涉及键盘的有`pg.event.get()`与`pg.key.get_pressed()` ,二者有什么区别与联系?
python·游戏·计算机外设·pygame
R-G-B2 小时前
【P18 3-10】OpenCV Python—— 鼠标控制,鼠标回调函数(鼠标移动、按下、。。。),鼠标绘制基本图形(直线、圆、矩形)
python·opencv·计算机外设·鼠标回调函数·鼠标控制·鼠标移动·鼠标绘制图形
IT古董5 小时前
第四章:大模型(LLM)】06.langchain原理-(3)LangChain Prompt 用法
java·人工智能·python