您可以使用dplyr包中的函数使用以下方法在 R 数据框中选择随机行:
方法 1:选择随机行数
df %>% sample_n( 5 )此函数从数据框中随机选择5行。
方法 2:选择随机部分行
df %>% sample_frac( .25 )此函数随机选择数据框中所有行的25% 。
以下示例展示了如何在 R 中使用以下数据框实际使用每种方法:
#create data framedf % sample_n( 5 ) team points rebounds1 F 15 112 to 10 83 D 6 34 G 12 75 B 10 8请注意,从数据框中随机选择五行。
示例 2:选择行的随机部分我们可以使用以下代码随机选择数据框中所有行的25% :
library (dplyr)#randomly select 25% of all rows from data framedf %>% sample_frac( .25 ) team points rebounds1 E 15 102 G 12 7由于原始数据框有 8 个总计值,因此 8 的 25% 等于 2。
因此,从数据帧中随机选择两行。
注意:您可以在此处找到 dplyr 中的sample_n和sample_frac函数的完整文档。
其他资源以下教程解释了如何在 dplyr 中执行其他常见操作:
如何使用 dplyr 按索引选择列如何使用 dplyr 按组选择第一行如何使用 dplyr 按多个条件进行过滤如何使用 dplyr 过滤包含特定字符串的行
关于作者本杰明·安德森博大家好,我是本杰明,一位退休的统计学教授,后来成为 Statorials 的热心教师。 凭借在统计领域的丰富经验和专业知识,我渴望分享我的知识,通过 Statorials 增强学生的能力。了解