首页 文章
  • 0 votes
     answers
     views

    用dplyr计算分组二进制数据的置信区间

    我对R以及分析二进制数据都相当新,目前正试图评估参与者的焦虑率是否与他们暴露于风险因素有关 . 为此,我最初计划计算每个暴露组中参与者的比例,这些参与者被诊断出患有95%置信区间的焦虑,并绘制这些参与者 . 但是我的置信区间计算不正确,我无法弄清楚原因 . 我的数据集的简化版本如下: library(tidyverse) anxietytable <- tibble( id = c(1...
  • 100 votes
     answers
     views

    在dplyr中替换“重命名”

    我喜欢plyr的重命名功能 rename . 我最近开始使用dplyr,并想知道是否有一种简单的方法可以使用dplyr中的函数重命名变量,这与plyr的 rename 一样容易使用?
  • 1 votes
     answers
     views

    使用dplyr对data.fram进行分组会影响除dplyr谓词之外的任何其他操作吗?

    也许这是一个多余的问题,但在看了下面的问题之后我有点好奇:Error selecting a column after grouping the dataframe using group_by from dplyr 0.3.02 . 这在dplyr的更高版本中似乎不是问题 . 重新运行示例(dplyr 0.4.3)时,我没有得到“Index out of bounds”消息,我可以选择列(虽然输...
  • 21 votes
     answers
     views

    使用OR来使用dplyr过滤数据帧的更好方法是什么?

    我在 R 中有一个数据框,其中列 subject1 和 subject2 (其中包含美国国会图书馆主题 Headers ) . 我想通过测试主题是否与批准的列表匹配来过滤数据框 . 比如说,我有这个数据框 . data <- data.frame( subject1 = c("History", "Biology", "Physics&q...
  • 4 votes
     answers
     views

    R:将Anova应用于一个数据集的不同子集并收集输出的功能

    一个常见的任务是必须在数据集的不同子集上执行某种统计分析(如anova,glm或混合模型),并将输出表与汇总系数和p值组合在一个数据帧中 . 我正在寻找一个通用函数,它将采用模型类型(例如 aov(...) 或 lm(...) 或 glm(...) 或 glmer(...) )以及根据每个重复分析必须为其返回系数和p值的特定输出项 . 一个数据集中的一些分组变量 . 假如我有一个数据帧,我想在数据...
  • 5 votes
     answers
     views

    dplyr group_by和cummean函数

    我希望下面的代码输出一个包含三行的数据框,每行代表计算每组 cyl 的平均值后的mpg累积平均值: library(dplyr) mtcars %>% arrange(cyl) %>% group_by(cyl) %>% summarise(running.mean.mpg = cummean(mpg)) 这就是我预期会发生的事情: mean_cyl_4 <- mtcar...
  • 40 votes
     answers
     views

    使用group_by(多个变量)时dplyr问题

    我想开始使用dplyr代替ddply,但我无法理解它是如何工作的(我已经阅读了文档) . 例如,为什么当我尝试mutate()时,“group_by”函数不能正常工作? 看着mtcars: 库(车) 假设我创建了一个data.frame,它是mtcars的摘要,按“cyl”和“gear”分组: df1 <- mtcars %.% group_by(cyl, gear)...
  • 39 votes
     answers
     views

    dplyr:如何在函数中使用group_by?

    我想在另一个函数中使用 dplyr::group_by 函数,但我不知道如何将参数传递给这个函数 . 有人能提供一个有效的例子吗? library(dplyr) data(iris) iris %.% group_by(Species) %.% summarise(n = n()) # ## Source: local data frame [3 x 2] ## Species n ...
  • 2 votes
     answers
     views

    Dplyr:如何group_by(全部)

    正如我在某处看到的那样,当有多个group_by()层时,一个summary()剥离了一层分组 . 在sql中,有“所有人分组” . 我想知道是否有办法取消dplyr中的所有分组(例如,我们可以获得最大值,而不是每组) 例: library(dplyr) library(car) mtcars %>% select(cyl, gear, carb) %>% group_by(...
  • 2 votes
     answers
     views

    Dplyr group_by日期

    我很困惑dplyr group_by函数如何处理Date对象 . 这是一个按预期工作的示例 . library(data.table); library(dplyr); library(lubridate) DT <- data.table(A = sample(1:100,12), B = (c("7-1-2015", "7-2-2015", &...
  • -3 votes
     answers
     views

    R:在dplyr中应用group_by

    我刚刚开始使用dplyr,我有以下两个问题,这应该很容易用 group_by 解决,但我不明白 . 我的数据看起来像这样: data <- data.frame(cbind("year" = c(2010, 2010, 2010, 2011, 2012, 2012, 2012, 2012), "institution&q...
  • 2 votes
     answers
     views

    group_by mutate在dplyr中不起作用

    我非常有信心这是“操作员错误”,但我会很感激任何帮助 . 我有一个(示例)数据框 foo <- data.frame("School"=c(1,1,1,1,2,2,2,2,3,3,3,3), "Grade"=c(1,2,3,4,1,2,3,4,1,2,3,4), "e200...
  • 0 votes
     answers
     views

    字符串输入到dplyr group_by

    我需要了解如何在dplyr的group_by函数中输入字符串值(NSE) . 我的数据集和下面的代码适用于“group_by”,但不适用于“group_by_”版本 . 在这方面我无法找到我的错误 . ID,Region,Dimension,BlogsInd.,BlogsNews,BlogsTech,Columns 1,PK,Dim1,-4.75,NA,NA,NA 2,PK,Dim1,-5.69,...
  • 2 votes
     answers
     views

    在函数中使用dplyr group_by

    我试图在本地函数中使用dplyr的group_by,例如: testFunction <- function(df, x) { df %>% group_by(x) %>% summarize(mean.Petal.Width = mean(Petal.Width)) } testFunction(iris, Species) 我得到一个错误“...未知变量分组依据:x”...
  • 2 votes
     answers
     views

    dplyr function group_by error

    我有库dplyr函数的问题 . 我想按各种值(“group_by”)对数据帧进行分组 . 其中一些值是固定的(总是相同的),有些是通过向量引入的 . 该向量具有可变维度 . 当数据框将被分组时,我想应用函数“mutate” . 我尝试过不同的方式 . 第一个复制在下面,并包含一个遍历向量campToAgregate的循环(其中找到了对数据帧进行分组所需的值): campToAgregate = c...
  • 2 votes
     answers
     views

    总结不再分组

    我认为dplyr太棒了 . 但是我最近更新了这个软件包,似乎总结不再是按组汇总的 . 类似于以下用于在升级之前按组汇总的代码: iris_tdt <- tbl_dt(iris) iris_tdt %.% group_by(Species) %.% summarise(avg_petal_width = mean(Petal.Width)) avg_petal_width 1 ...
  • 16 votes
     answers
     views

    当我在`dplyr`之后加载`plyr`时,为什么汇总或变异不能用于group_by?

    注意:此问题的 Headers 已经过编辑,以便在 plyr 函数掩盖其 dplyr 对应项时将其作为问题的规范问题 . 问题的其余部分保持不变 . 假设我有以下数据: dfx <- data.frame( group = c(rep('A', 8), rep('B', 15), rep('C', 6)), sex = sample(c("M", "F...
  • 5 votes
     answers
     views

    dplyr总结了嵌套的group_by

    我有这样的数据框: Date Amount Category 1 02.07.15 1 1 2 02.07.15 2 1 3 02.07.15 3 1 4 02.07.15 4 2 5 03.07.15 5 2 6 04.07.15 6 3 7...
  • 0 votes
     answers
     views

    在dplyr包中总结与summarise_each函数

    我试图用dplyr包将group_by分割成数据后总结一个变量的值,下面的代码工作正常,下面列出了输出,但我不能用_859224_替换 summarise_each 甚至只需要计算一列,我想知道为什么? iris %>% group_by(Species) %>% select(one_of('Sepal.Length')) %>% ...
  • 2 votes
     answers
     views

    dplyr / tidyr - 用条件汇总数据

    Problem 我正在尝试使用dyplr&tidyr来实现一个输出表(就像我认为的列联表),它将这些数据汇总到频率中(例如, Headers ,描述和主体的数量是负数,中性和正数) . 我尝试了许多不同的方法,我能找到的最接近的例子是Using Tidyr/Dplyr to summarise counts of groups of strings . 但这完全不合适 . Example Data...
  • -2 votes
     answers
     views

    DPLYR |如何在分组后总结字符列?

    目前我在R中使用data.table包来分组后汇总或折叠行 . 我想知道如何使用dplyr实现相同并总结所有内容? 使用数据表 obs_dt <- obs_dt[, lapply(.SD, paste0, collapse=" "), by=list(GroupID, Patient.Identifier, Gender, Age...
  • 0 votes
     answers
     views

    dplyr group由多个变量按多个变量汇总

    R的新手 . 使用dplyr,尝试group_by多个变量,由多个变量,多个函数汇总 . 这按预期工作 mtcars %>% + group_by(cyl,hp) %>% + summarise(min_mpg = min(mpg) , min_disp = min(disp), max_mpg = max(mpg) , max_disp = max(disp)) ...
  • -4 votes
     answers
     views

    如何按R中的性别和唯一ID计算[关闭]

    我'm trying to count the number of females, males and N/A in the column '性别'在数据框 trips . 然而就是返回我的行数而不是 . library(dplyr) count(trips, vars = "gender") # A tibble: 1 × 2 # vars n # &...
  • 0 votes
     answers
     views

    对所有组相对于“基线”组进行分组操作,并进行多次观察

    从包含每个组的多个观察的数据开始,如下所示: set.seed(1) my.df <- data.frame( timepoint = rep(c(0, 1, 2), each= 3), counts = round(rnorm(9, 50, 10), 0) ) > my.df timepoint counts 1 0 44 2 0 ...
  • 0 votes
     answers
     views

    按组重复观察的百分比

    我有一个随时间变化的公司员工数据集,看起来像这样 data.table(firm = c(rep("A", 8), rep("B", 8)), employee = c(1, 2, 3, 4, 1, 2, 3, NA, 5, 6, NA, NA, 5, 6, 7, 8), year = c(rep(1, 4), ...
  • 1 votes
     answers
     views

    以离散属性值为条件对观察进行分组

    每个观察我有3个离散属性 . 如果对于2个观察值,这些属性中至少有2个采用相同的值,那么我想将它们组合在一起(实际上总是最多2个属性是相同的) . 我的想法是 Build 一个分组矩阵 . 每行和每列代表一个观察 . 行和列的交叉表示两个观测值的"similarity",如果至少两个属性值相同,则应采用值 TRUE ,否则为 FALSE . 这是我所做的可重复的示例( a ,...
  • 3 votes
     answers
     views

    如果每个观察可以属于多个组,则进行聚合

    我想按组聚合日期 . 然而,每个观察可以属于几个组(例如,观察1属于组A和B) . 我找不到用 data.table 实现这个目标的好方法 . 目前,我为每个可能的组创建了一个逻辑变量,如果观察属于该组,则该变量的值为 TRUE . 我正在寻找一种比下面提供的更好的方法 . 我也想知道如何用 tidyverse 实现这一目标 . library(data.table) # Data set.se...
  • 0 votes
     answers
     views

    在R中的某些观察之前选择组

    说 data=structure(list(x1 = c(88L, 88L, 94L, 82L, 68L, 72L, 43L, 84L, 65L, 91L, 65L, 80L, 82L, 63L, 67L, 58L, 100L, 32L, 75L, 66L, 30L, 12L, 97L, 58L, 14L, 64L), group = structure(c(2L, 2L, 2L, 2L, ...
  • 0 votes
     answers
     views

    在通过将R中的var分组来分隔某些观察之前选择组

    在本主题的延续select group before certain observations in R我有分组var - add (x或y) data=structure(list(add = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L...
  • 46 votes
     answers
     views

    如何在每个组中创建滞后变量?

    我有一个data.table: set.seed(1) data <- data.table(time = c(1:3, 1:4), groups = c(rep(c("b", "a"), c(3, 4))), value = rnorm(7)) data # grou...

热门问题