R语言进行K折交叉验证问题

在使用R语言进行模型参数评估优化时候,会使用K折交叉验证,其中会遇到各种各样问题:

复制代码
错误: C5.0 models require a factor outcome
> (1-mean(E0));(1-mean(E1))
[1] 1
[1] 1

报错说明C5.0模型需要因子变量输出,源代码如下:

复制代码
### 10折交叉验证 ###
# 导入car数据集
car <- read.table("car.data",sep = ",")
# 对变量重命名
colnames(car) <- c("buy","main","doors","capacity",
                   "lug_boot","safety","accept")

# 手动构建10折交叉验证
#下面构造10折下标集
library(caret)
ind<-createFolds(car$accept,k=10,list=FALSE,returnTrain=FALSE)
# 下面再做10折交叉验证,这里仅给出训练集和测试集的分类平均误判率。
E0=rep(0,10);E1=E0
library(C50)
for(i in 1:10){
  n0=nrow(car)-nrow(car[ind==i,]);n1=nrow(car[ind==i,])
  a=C5.0(accept~.,car[!ind==i,])
  E0[i]=sum(car[!ind==i,'accept']!=predict(a,car[!ind==i,]))/n0
  E1[i]=sum(car[ind==i,'accept']!=predict(a,car[ind==i,]))/n1
}
(1-mean(E0));(1-mean(E1))

针对报错,将 a=C5.0(accept~.,car[!ind==i,])代码前面加上因子变量:

复制代码
car$accept<-as.factor(car$accept)

修改代码如下:

复制代码
### 10折交叉验证 ###
# 导入car数据集
car <- read.table("car.data",sep = ",")
# 对变量重命名
colnames(car) <- c("buy","main","doors","capacity",
                   "lug_boot","safety","accept")
# 手动构建10折交叉验证
#下面构造10折下标集
library(caret)
ind<-createFolds(car$accept,k=10,list=FALSE,returnTrain=FALSE)
# 下面再做10折交叉验证,这里仅给出训练集和测试集的分类平均误判率。
E0=rep(0,10);E1=E0
library(C50)
car$accept<-as.factor(car$accept)
for(i in 1:10){
    n0=nrow(car)-nrow(car[ind==i,]);n1=nrow(car[ind==i,])
    a=C5.0(accept~.,car[!ind==i,])
    E0[i]=sum(car[!ind==i,'accept']!=predict(a,car[!ind==i,]))/n0
    E1[i]=sum(car[ind==i,'accept']!=predict(a,car[ind==i,]))/n1
}
(1-mean(E0));(1-mean(E1))

这样就输出了正确结果。

附:利用caret包中的trainControl函数完成交叉验证。

复制代码
# 利用caret包中的trainControl函数完成交叉验证
#install.packages("caret")
library(ROCR)
library(caret)
control <- trainControl(method="repeatedcv",number=10,repeats=3)
model <- train(accept~.,data=car,method="rpart",
               trControl=control)
model
plot(model)
相关推荐
九转成圣1 小时前
Java 性能优化实战:如何将海量扁平数据高效转化为类目字典树?
java·开发语言·json
SmartRadio1 小时前
ESP32-S3 双模式切换实现:兼顾手机_路由器连接与WiFi长距离通信
开发语言·网络·智能手机·esp32·长距离wifi
laowangpython1 小时前
Rust 入门:GitHub 热门内存安全编程语言
开发语言·其他·rust·github
我叫汪枫1 小时前
在后台管理系统中,如何递归和选择保留的思路来过滤菜单
开发语言·javascript·node.js·ecmascript
_.Switch1 小时前
东方财富股票数据JS逆向:secids字段和AES加密实战
开发语言·前端·javascript·网络·爬虫·python·ecmascript
软件技术NINI1 小时前
webkit简介及工作流程
开发语言·前端·javascript·udp·ecmascript·webkit·yarn
Brendan_0011 小时前
JavaScript的Stomp.over
开发语言·javascript·ecmascript
念2341 小时前
f5 shape分析
开发语言·javascript·ecmascript
苍穹之跃2 小时前
某量JS逆向
开发语言·javascript·ecmascript
思茂信息2 小时前
CST软件如何进行参数化扫描?
运维·开发语言·javascript·windows·ecmascript·软件工程·软件需求