Java 学习之路

0 votes

answers

views

用dplyr计算分组二进制数据的置信区间

我对R以及分析二进制数据都相当新，目前正试图评估参与者的焦虑率是否与他们暴露于风险因素有关 . 为此，我最初计划计算每个暴露组中参与者的比例，这些参与者被诊断出患有95％置信区间的焦虑，并绘制这些参与者 . 但是我的置信区间计算不正确，我无法弄清楚原因 . 我的数据集的简化版本如下： library(tidyverse) anxietytable <- tibble( id = c(1...

r binary dplyr confidence-interval
100 votes

answers

views

在dplyr中替换“重命名”

我喜欢plyr的重命名功能 rename . 我最近开始使用dplyr，并想知道是否有一种简单的方法可以使用dplyr中的函数重命名变量，这与plyr的 rename 一样容易使用？

r rename dplyr
1 votes

answers

views

使用dplyr对data.fram进行分组会影响除dplyr谓词之外的任何其他操作吗？

也许这是一个多余的问题，但在看了下面的问题之后我有点好奇：Error selecting a column after grouping the dataframe using group_by from dplyr 0.3.02 . 这在dplyr的更高版本中似乎不是问题 . 重新运行示例（dplyr 0.4.3）时，我没有得到“Index out of bounds”消息，我可以选择列（虽然输...

r dplyr
21 votes

answers

views

使用OR来使用dplyr过滤数据帧的更好方法是什么？

我在 R 中有一个数据框，其中列 subject1 和 subject2 （其中包含美国国会图书馆主题 Headers ） . 我想通过测试主题是否与批准的列表匹配来过滤数据框 . 比如说，我有这个数据框 . data <- data.frame( subject1 = c("History", "Biology", "Physics&q...

r dataframe dplyr
4 votes

answers

views

R：将Anova应用于一个数据集的不同子集并收集输出的功能

一个常见的任务是必须在数据集的不同子集上执行某种统计分析（如anova，glm或混合模型），并将输出表与汇总系数和p值组合在一个数据帧中 . 我正在寻找一个通用函数，它将采用模型类型（例如 aov(...) 或 lm(...) 或 glm(...) 或 glmer(...) ）以及根据每个重复分析必须为其返回系数和p值的特定输出项 . 一个数据集中的一些分组变量 . 假如我有一个数据帧，我想在数据...

r dplyr glm anova broom
5 votes

answers

views

dplyr group_by和cummean函数

我希望下面的代码输出一个包含三行的数据框，每行代表计算每组 cyl 的平均值后的mpg累积平均值： library(dplyr) mtcars %>% arrange(cyl) %>% group_by(cyl) %>% summarise(running.mean.mpg = cummean(mpg)) 这就是我预期会发生的事情： mean_cyl_4 <- mtcar...

r dplyr
40 votes

answers

views

使用group_by（多个变量）时dplyr问题

我想开始使用dplyr代替ddply，但我无法理解它是如何工作的（我已经阅读了文档） . 例如，为什么当我尝试mutate（）时，“group_by”函数不能正常工作？看着mtcars：库（车）假设我创建了一个data.frame，它是mtcars的摘要，按“cyl”和“gear”分组： df1 <- mtcars %.% group_by(cyl, gear)...

r group-by dplyr compound-key
39 votes

answers

views

dplyr：如何在函数中使用group_by？

我想在另一个函数中使用 dplyr::group_by 函数，但我不知道如何将参数传递给这个函数 . 有人能提供一个有效的例子吗？ library(dplyr) data(iris) iris %.% group_by(Species) %.% summarise(n = n()) # ## Source: local data frame [3 x 2] ## Species n ...

r dplyr
2 votes

answers

views

Dplyr：如何group_by（全部）

正如我在某处看到的那样，当有多个group_by（）层时，一个summary（）剥离了一层分组 . 在sql中，有“所有人分组” . 我想知道是否有办法取消dplyr中的所有分组（例如，我们可以获得最大值，而不是每组）例： library(dplyr) library(car) mtcars %>% select(cyl, gear, carb) %>% group_by(...

r group-by dplyr
2 votes

answers

views

Dplyr group_by日期

我很困惑dplyr group_by函数如何处理Date对象 . 这是一个按预期工作的示例 . library(data.table); library(dplyr); library(lubridate) DT <- data.table(A = sample(1:100,12), B = (c("7-1-2015", "7-2-2015", &...

r group-by dplyr plyr
-3 votes

answers

views

R：在dplyr中应用group_by

我刚刚开始使用dplyr，我有以下两个问题，这应该很容易用 group_by 解决，但我不明白 . 我的数据看起来像这样： data <- data.frame(cbind("year" = c(2010, 2010, 2010, 2011, 2012, 2012, 2012, 2012), "institution&q...

r group-by dplyr
2 votes

answers

views

group_by mutate在dplyr中不起作用

我非常有信心这是“操作员错误”，但我会很感激任何帮助 . 我有一个（示例）数据框 foo <- data.frame("School"=c(1,1,1,1,2,2,2,2,3,3,3,3), "Grade"=c(1,2,3,4,1,2,3,4,1,2,3,4), "e200...

r group-by dplyr
0 votes

answers

views

字符串输入到dplyr group_by

我需要了解如何在dplyr的group_by函数中输入字符串值（NSE） . 我的数据集和下面的代码适用于“group_by”，但不适用于“group_by_”版本 . 在这方面我无法找到我的错误 . ID,Region,Dimension,BlogsInd.,BlogsNews,BlogsTech,Columns 1,PK,Dim1,-4.75,NA,NA,NA 2,PK,Dim1,-5.69,...

r group-by dplyr nse
2 votes

answers

views

在函数中使用dplyr group_by

我试图在本地函数中使用dplyr的group_by，例如： testFunction <- function(df, x) { df %>% group_by(x) %>% summarize(mean.Petal.Width = mean(Petal.Width)) } testFunction(iris, Species) 我得到一个错误“...未知变量分组依据：x”...

r function group-by dplyr nse
2 votes

answers

views

dplyr function group_by error

我有库dplyr函数的问题 . 我想按各种值（“group_by”）对数据帧进行分组 . 其中一些值是固定的（总是相同的），有些是通过向量引入的 . 该向量具有可变维度 . 当数据框将被分组时，我想应用函数“mutate” . 我尝试过不同的方式 . 第一个复制在下面，并包含一个遍历向量campToAgregate的循环（其中找到了对数据帧进行分组所需的值）： campToAgregate = c...

r group-by dplyr
2 votes

answers

views

总结不再分组

我认为dplyr太棒了 . 但是我最近更新了这个软件包，似乎总结不再是按组汇总的 . 类似于以下用于在升级之前按组汇总的代码： iris_tdt <- tbl_dt(iris) iris_tdt %.% group_by(Species) %.% summarise(avg_petal_width = mean(Petal.Width)) avg_petal_width 1 ...

r dplyr
16 votes

answers

views

当我在`dplyr`之后加载`plyr`时，为什么汇总或变异不能用于group_by？

注意：此问题的 Headers 已经过编辑，以便在 plyr 函数掩盖其 dplyr 对应项时将其作为问题的规范问题 . 问题的其余部分保持不变 . 假设我有以下数据： dfx <- data.frame( group = c(rep('A', 8), rep('B', 15), rep('C', 6)), sex = sample(c("M", "F...

r dplyr plyr r-faq
5 votes

answers

views

dplyr总结了嵌套的group_by

我有这样的数据框： Date Amount Category 1 02.07.15 1 1 2 02.07.15 2 1 3 02.07.15 3 1 4 02.07.15 4 2 5 03.07.15 5 2 6 04.07.15 6 3 7...

r group-by nested dplyr group-summaries
0 votes

answers

views

在dplyr包中总结与summarise_each函数

我试图用dplyr包将group_by分割成数据后总结一个变量的值，下面的代码工作正常，下面列出了输出，但我不能用_859224_替换 summarise_each 甚至只需要计算一列，我想知道为什么？ iris %>% group_by(Species) %>% select(one_of('Sepal.Length')) %>% ...

r dplyr
2 votes

answers

views

dplyr / tidyr - 用条件汇总数据

Problem 我正在尝试使用dyplr＆tidyr来实现一个输出表（就像我认为的列联表），它将这些数据汇总到频率中（例如， Headers ，描述和主体的数量是负数，中性和正数） . 我尝试了许多不同的方法，我能找到的最接近的例子是Using Tidyr/Dplyr to summarise counts of groups of strings . 但这完全不合适 . Example Data...

r dplyr tidyr
-2 votes

answers

views

DPLYR |如何在分组后总结字符列？

目前我在R中使用data.table包来分组后汇总或折叠行 . 我想知道如何使用dplyr实现相同并总结所有内容？使用数据表 obs_dt <- obs_dt[, lapply(.SD, paste0, collapse=" "), by=list(GroupID, Patient.Identifier, Gender, Age...

r dplyr
0 votes

answers

views

dplyr group由多个变量按多个变量汇总

R的新手 . 使用dplyr，尝试group_by多个变量，由多个变量，多个函数汇总 . 这按预期工作 mtcars %>% + group_by(cyl,hp) %>% + summarise(min_mpg = min(mpg) , min_disp = min(disp), max_mpg = max(mpg) , max_disp = max(disp)) ...

r dplyr rstudio tidyverse
-4 votes

answers

views

如何按R中的性别和唯一ID计算[关闭]

我'm trying to count the number of females, males and N/A in the column '性别'在数据框 trips . 然而就是返回我的行数而不是 . library(dplyr) count(trips, vars = "gender") # A tibble: 1 × 2 # vars n # &...

r dplyr
0 votes

answers

views

对所有组相对于“基线”组进行分组操作，并进行多次观察

从包含每个组的多个观察的数据开始，如下所示： set.seed(1) my.df <- data.frame( timepoint = rep(c(0, 1, 2), each= 3), counts = round(rnorm(9, 50, 10), 0) ) > my.df timepoint counts 1 0 44 2 0 ...

r data.table dplyr
0 votes

answers

views

按组重复观察的百分比

我有一个随时间变化的公司员工数据集，看起来像这样 data.table(firm = c(rep("A", 8), rep("B", 8)), employee = c(1, 2, 3, 4, 1, 2, 3, NA, 5, 6, NA, NA, 5, 6, 7, 8), year = c(rep(1, 4), ...

r dplyr data.table
1 votes

answers

views

以离散属性值为条件对观察进行分组

每个观察我有3个离散属性 . 如果对于2个观察值，这些属性中至少有2个采用相同的值，那么我想将它们组合在一起（实际上总是最多2个属性是相同的） . 我的想法是 Build 一个分组矩阵 . 每行和每列代表一个观察 . 行和列的交叉表示两个观测值的"similarity"，如果至少两个属性值相同，则应采用值 TRUE ，否则为 FALSE . 这是我所做的可重复的示例（ a ，...

r dplyr data.table cluster-analysis
3 votes

answers

views

如果每个观察可以属于多个组，则进行聚合

我想按组聚合日期 . 然而，每个观察可以属于几个组（例如，观察1属于组A和B） . 我找不到用 data.table 实现这个目标的好方法 . 目前，我为每个可能的组创建了一个逻辑变量，如果观察属于该组，则该变量的值为 TRUE . 我正在寻找一种比下面提供的更好的方法 . 我也想知道如何用 tidyverse 实现这一目标 . library(data.table) # Data set.se...

r dplyr data.table tidyverse
0 votes

answers

views

在R中的某些观察之前选择组

说 data=structure(list(x1 = c(88L, 88L, 94L, 82L, 68L, 72L, 43L, 84L, 65L, 91L, 65L, 80L, 82L, 63L, 67L, 58L, 100L, 32L, 75L, 66L, 30L, 12L, 97L, 58L, 14L, 64L), group = structure(c(2L, 2L, 2L, 2L, ...

r dplyr data.table
0 votes

answers

views

在通过将R中的var分组来分隔某些观察之前选择组

在本主题的延续select group before certain observations in R我有分组var - add （x或y） data=structure(list(add = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L...

r dplyr data.table
46 votes

answers

views

如何在每个组中创建滞后变量？

我有一个data.table： set.seed(1) data <- data.table(time = c(1:3, 1:4), groups = c(rep(c("b", "a"), c(3, 4))), value = rnorm(7)) data # grou...

r data.table plyr dplyr

热门问题