R语言进行K折交叉验证问题

在使用R语言进行模型参数评估优化时候,会使用K折交叉验证,其中会遇到各种各样问题:

错误: C5.0 models require a factor outcome
> (1-mean(E0));(1-mean(E1))
[1] 1
[1] 1

报错说明C5.0模型需要因子变量输出,源代码如下:

### 10折交叉验证 ###
# 导入car数据集
car <- read.table("car.data",sep = ",")
# 对变量重命名
colnames(car) <- c("buy","main","doors","capacity",
                   "lug_boot","safety","accept")

# 手动构建10折交叉验证
#下面构造10折下标集
library(caret)
ind<-createFolds(car$accept,k=10,list=FALSE,returnTrain=FALSE)
# 下面再做10折交叉验证,这里仅给出训练集和测试集的分类平均误判率。
E0=rep(0,10);E1=E0
library(C50)
for(i in 1:10){
  n0=nrow(car)-nrow(car[ind==i,]);n1=nrow(car[ind==i,])
  a=C5.0(accept~.,car[!ind==i,])
  E0[i]=sum(car[!ind==i,'accept']!=predict(a,car[!ind==i,]))/n0
  E1[i]=sum(car[ind==i,'accept']!=predict(a,car[ind==i,]))/n1
}
(1-mean(E0));(1-mean(E1))

针对报错,将 a=C5.0(accept~.,car[!ind==i,])代码前面加上因子变量:

car$accept<-as.factor(car$accept)

修改代码如下:

### 10折交叉验证 ###
# 导入car数据集
car <- read.table("car.data",sep = ",")
# 对变量重命名
colnames(car) <- c("buy","main","doors","capacity",
                   "lug_boot","safety","accept")
# 手动构建10折交叉验证
#下面构造10折下标集
library(caret)
ind<-createFolds(car$accept,k=10,list=FALSE,returnTrain=FALSE)
# 下面再做10折交叉验证,这里仅给出训练集和测试集的分类平均误判率。
E0=rep(0,10);E1=E0
library(C50)
car$accept<-as.factor(car$accept)
for(i in 1:10){
    n0=nrow(car)-nrow(car[ind==i,]);n1=nrow(car[ind==i,])
    a=C5.0(accept~.,car[!ind==i,])
    E0[i]=sum(car[!ind==i,'accept']!=predict(a,car[!ind==i,]))/n0
    E1[i]=sum(car[ind==i,'accept']!=predict(a,car[ind==i,]))/n1
}
(1-mean(E0));(1-mean(E1))

这样就输出了正确结果。

附:利用caret包中的trainControl函数完成交叉验证。

# 利用caret包中的trainControl函数完成交叉验证
#install.packages("caret")
library(ROCR)
library(caret)
control <- trainControl(method="repeatedcv",number=10,repeats=3)
model <- train(accept~.,data=car,method="rpart",
               trControl=control)
model
plot(model)
相关推荐
许苑向上41 分钟前
Java八股文(下)
java·开发语言
菜鸟一枚在这1 小时前
深入解析设计模式之单例模式
开发语言·javascript·单例模式
独孤求败Ace1 小时前
第44天:Web开发-JavaEE应用&反射机制&类加载器&利用链&成员变量&构造方法&抽象方法
java·开发语言
计算机-秋大田1 小时前
基于Spring Boot的农产品智慧物流系统设计与实现(LW+源码+讲解)
java·开发语言·spring boot·后端·spring·课程设计
matlabgoodboy1 小时前
Matlab代编电气仿真电力电子电机控制自动化新能源微电网储能能量
开发语言·matlab·自动化
镰圈量化1 小时前
当电脑上有几个python版本Vscode选择特定版本python
开发语言·vscode·python
背太阳的牧羊人2 小时前
RAG检索中使用一个 长上下文重排序器(Long Context Reorder) 对检索到的文档进行进一步的处理和排序,优化输出顺序
开发语言·人工智能·python·langchain·rag
ITPUB-微风2 小时前
美团MTSQL特性解析:技术深度与应用广度的完美结合
java·服务器·开发语言
Want5952 小时前
C/C++跳动的爱心
c语言·开发语言·c++
水瓶丫头站住2 小时前
Qt中QDockWidget的使用方式
开发语言·qt