R-随机抽样选取训练集与验证集
来源:互联网 发布:三菱plc与伺服编程实例 编辑:程序博客网 时间:2024/05/16 12:12
在分类中,常常要将数据集分为两部分,一部分作为训练数据集,一部分作为验证数据集(测试数据集);R语言中的sample()函数能够从数据集中有放回或者无放回的抽取大小为n的一个随机样本。
用法:
sample(x, size, replace = FALSE, prob = NULL)
说明:
x表示一个或多个要选择的元素的向量;size表示要抽取元素的个数;replace = FALSE表示无放回抽样(默认),值为TRUE则为有放回抽样;
示例:
①sample(1:nrow(leadership))
nrow(leadership)是leadership这个数据集的行数(可能就是样本数),1:nrow(leadership) 是一个向量,从1到nrow(leadership),sample(1:nrow(leadership)) 是将里面的这个向量进行随机排列了,不是之前那样的顺序了。sample(1:nrow(leadership))表示原来的数据集的序号被打乱了,但还是原来的数据集。
②train <- sample(nrow(df), 0.7*nrow(df))
表示从df数据集中随机抽取70%的数据的序号;
df.train <- df[train,]
df.validate <- df[-train,]
按照前面随机抽取的数据序号提取出来作为训练集,剩下的部分作为验证集。
阅读全文
0 0
- R-随机抽样选取训练集与验证集
- R随机抽样
- R语言随机抽样
- R语言随机抽样sample
- R语言实现数据抽样&创建训练集和测试集
- R语言实现数据抽样&创建训练集和测试集
- 【分享】YouTube随机抽样用户数据集
- R 语言与抽样分布
- python-Pandas学习 如何对数据集随机抽样?
- python-Pandas学习 如何对数据集随机抽样?
- [置顶]R语言 分层抽样---分层随机抽样(SRS)(二 )
- R-抽样
- R语言重抽样与自助法
- R语言重抽样与自助法
- R语言重抽样与自助法
- 谷歌面试题:从无穷尽的流中随机的选取1000个关键字(蓄水池抽样)
- 谷歌面试题:从无穷尽的流中随机的选取1000个关键字(蓄水池抽样)
- sklearn之训练数据和测试数据随机选取
- 解析cifar的python数据集中的图片
- XzmSqlite3WtlApp--工程配置
- Eclipse中实现JS代码提示功能
- 欢迎使用CSDN-markdown编辑器
- 表单(四)表单序列化
- R-随机抽样选取训练集与验证集
- BZOJ 1095 Hide 捉迷藏 详解(动态点分治 堆维护)
- java 将字符串追加到文件已有内容后面
- Linux文件系统编程
- 第四章:Django模型——在 admin 后台管理页面上面添加 Event 发布会名称
- ubuntu network is unreachable 解决记
- java 多线程Thread与Runnable的区别
- android studio 工作区间背景颜色设置眼睛保护色
- Acer主板装系统报reboot and select proper boot device