首页 文章
  • 3 votes
     answers
     views

    R 3.4.1 - 为RSiteCatalyst排队报告智能使用while循环

    实际 我一直在使用RSiteCatalyst包一段时间了 . 对于那些不了解它的人来说,这使得通过API从Adobe Analytics获取数据的过程变得更加容易 . 到目前为止,工作流程如下: 提出请求,例如: key_metrics <- QueueOvertime(clientId, dateFrom4, dateTo, metrics = c...
  • 76 votes
     answers
     views

    dplyr可以连接多个列或复合键吗?

    我意识到 dplyr v3.0允许你加入不同的变量: left_join(x, y, by = c("a" = "b") 将匹配 x.a 至 y.b 但是,是否可以加入变量组合或者我必须事先添加复合键? 像这样的东西: left_join(x, y, by = c("a c" = "b d") 以匹配[ x.a 和 ...
  • 8 votes
     answers
     views

    dplyr中分组变量的相关矩阵

    我有一个带有50个数字列的分组数据框(使用 dplyr ),使用其中一列将其拆分成组 . 我想计算所有非分组列和一个特定列之间的相关矩阵 . mtcars 数据集的示例: data(mtcars) cor(mtcars[,2:11], mtcars[,2]) 返回每个帆船的里程数与其他变量之间的相关性列表 . 但是,我想说,我希望计算每组气缸的相同相关性,例如: library(dplyr) m...
  • 0 votes
     answers
     views

    如何使用dplyr包将列转换为折叠dataest中的列表

    在R中,我想根据条件(比如虹膜数据集中的Species变量)拆分数据框,然后为每个列我想将它们转换为list,这允许我将它作为结构输出到matlab中,我试过了这与基础包使用 split 命令,如何理解 split 命令中使用的 interaction 参数,以获得我想要的12个切片?如何使用dplyr包实现这一目标? data <- split(unlist(iris[,c(1:4)]),...
  • 3 votes
     answers
     views

    dplyr或矢量化方法中的动态变量评估

    通常情况下,我会通过运行一个循环来处理这类问题(可能还不是最好的解决方案),但我正在处理一个非常大的数据集(780万个观测值),并且我一直在尝试更有效地编程它 . 这是我的数据集的一个非常小的子集: df = data.frame(STATE = c("PA", "PA", "MD","MD", "MO&qu...
  • 3 votes
     answers
     views

    TraMineR:从基于SPELL的序列数据中提取相等状态之间的事件

    Context 这个问题涉及使用 TraMineR 包的序列分析 . 该包提供时间序列(时间上的状态)到事件序列的自动转换(状态在时间之间的变化) . 我的分析中经常出现的问题之一涉及区分相同状态之间变化事件的选项 . Question-specific example 假设我们有一系列的就业状况,例如:工作,失业,不活动,退休 . 分析侧重于职业转型,区分稳定职业和过渡职业 . 各种过渡都是相关...
  • 2 votes
     answers
     views

    如何从回归树中识别每个叶子中的序列?

    使用biofam数据集 library(TraMineR) data(biofam) lab <- c("P","L","M","LM","C","LC","LMC","D") biofam.seq <- seqdef(biof...
  • 5 votes
     answers
     views

    查找序列中的特定模式

    我正在使用R包TraMineR进行一些学术研究序列分析 . 我想找到一个模式,定义为某人在目标公司,然后出去,然后回到目标公司 . (简化)我将州A定义为目标公司; B作为外部工业公司,C作为内部工业公司 . 所以我想要做的是找到具有特定模式A-B-A或A-C-A的序列 . 在查看此问题(Strange number of subsequences?)并阅读用户指南后,特别是以下段落: 4.3....
  • 2 votes
     answers
     views

    替换序列中的NA值以获取状态代码

    我使用的数据集是一个已经制作成长形的数据集 . 它包括年轻人的工作状态,是部分或全职 Contract 的字母表 . 所有 NA 值都被视为另一个州:失业 . 检查TramineR user's guide和 seqdef() 帮助似乎可以在 seqdef() 创建STS对象时直接执行,因为supporting documents中对此进行了简要说明: left:缺失值的行为出现在每个序列中第一...
  • 1 votes
     answers
     views

    计算TraMiner中每个序列的转换率

    有没有办法为数据集中的所有序列(即id)生成转换矩阵? 在我的情况下,我的数据是TSE格式,所以我使用了 TraMineRextras 包的一些功能 . 我的意图是遍历每个序列,但是当我想计算给定id的转换速率时,执行 TSE_to_STS() 函数后会出现以下错误: 'rownames'中的错误< - ('tmp',value =“1”):尝试在没有维度的对象上设置'rownames' ...
  • 1 votes
     answers
     views

    R如何删除序列中的不一致值

    如之前的question所述,我每隔五天收集一次关于植物发育或物候的数据(使用分类变量'Code'进行编码),沿着横断面划分为78个连续区段 . 每个物种都在每个区段的横断面上进行调查 . 我在收集数据时没有考虑的另一个问题是,有时候观察者可能会错过现场的观察结果,影响他们选择的代码,或者他们只是犯了一个错字 . 具体来说,他们使用的代码是: b1 = single flower b2 = spa...
  • 1 votes
     answers
     views

    如何使用TraMineR将噪声引入序列数据?

    我想随机更改序列数据集中的状态以进行模拟 . 目标是了解群集质量的不同度量如何在数据中具有不同的结构度 . 如果我要引入missings,TraMineRextras中有一个方便的 seqgen.missing() 函数,但它只添加了缺失状态 . 我如何随机选择一个比例 p 的序列并随机插入一个随机选择的字母表元素,用 p_g , p_l 和 p_r 概率将它们插入中间,左侧和右侧?
  • 0 votes
     answers
     views

    计算已运行的条件数

    我有一些来自实验的数据,其中每个主题都使用18个不同的列表之一运行 . 我需要找出每个列表运行的次数 . data.frame的结构如下: Subject1 List1 Trial1 stuff Subject1 List1 Trial2 stuff Subject2 List2 Trial1 stuff ... Subject22 List1 ...
  • 376 votes
     answers
     views

    从命令行运行R脚本

    我有一个名为 a.r 的文件,它的 chmod 为755, sayHello <- function(){ print('hello') } sayHello() 如何通过命令行运行?
  • 1 votes
     answers
     views

    如何为数据框列表制作条形图?

    我有一个数据框列表,我想为每个数据框制作一个条形图 . 详细信息 sum 是条形的高度,而 users 是每个条形的标签 . 结果12 [[1]] users sum 1 00250902DC7D 34 2 00250902FA92 34 3 00250902FB05 34 4 002509030C41 34 5 002509030E53 34 [[2]] ...
  • 0 votes
     answers
     views

    如何在数据帧中 Build 用户网络?

    嗨,我是新来的r我有一个问题,即从一个名为w2的数据框中找到用户(uID)和文章网络(faID)的网络 faID uID 1 1256 1 54789 1 547821 2 3258 2 4521 2 4528 3 98745 3 1256 ...
  • 0 votes
     answers
     views

    根据列表中data.frame中因子变量的值选择行

    我感觉我很接近,但我无法让它工作,你的帮助将不胜感激 . 我的目标是根据1个因子的值对列表中的数据进行子集化 . 它是关于在不同时间点暴露于刺激的受试者的数据 . 现在我想为每个刺激的所有主题的所有变量的数据进行子集化 . 刺激的变量称为“刺激” . 刺激的名称例如“Happy 8” . 所以示例路径:SubjList $ Subject1 $ Stimulus [“Happy 8”](虽然这也行...
  • 0 votes
     answers
     views

    从bbmle的ICtab()函数中提取信息

    我在从 bbmle 包的ICtab()函数中提取信息时遇到了一些麻烦 . 基本上我要做的是在一系列glm模型上运行此函数,然后将该输出添加到主data.frame对象 . 但是,虽然我可以从ICtab()输出中提取$ dqAIC和$ df参数,但我无法找到一种方法来提取行名称本身(即输入到ICtab中的模型的名称) . 这是一个问题,因为ICtab()输出按$ dqAIC的升序排序 - 因此,我无...
  • 2 votes
     answers
     views

    在qqplot和Shiny中命名传奇

    我试图用闪亮的名字命名一个ggplot的传说 . 问题是,由于用户可以关闭和在线上更改每行的名称,因此图例的名字与第一个可见行相关联 . 我需要一种方法来重命名传说 . 数据: data_raw < - 结构(列表(组1)=结构(c(1L,2L,3L,4L,5L,6L,7L,1L,2L,3L,4L,5L,7L,1L,2L,3L,4L, 5L,6L,7L),. Label = c(“2016...
  • 1 votes
     answers
     views

    在R中按行名称组合不同长度的数据帧列表

    我有一个不同长度的数据框列表(df),按年份索引,以便数据的代理如下所示: df $df1 X..i.. 1999 10 1998 13 1997 14 $df2 X..i.. 1999 20 1998 11 $df3 X..i.. 1999 ...
  • 0 votes
     answers
     views

    如何从R中的多维数据结构的汇总统计创建绘图

    最近,我一直在使用包含各种类型的多维数据的数据结构 . 就我而言,数组中的主题录音包含以下维度: 主题ID(dim = 9) 型号(昏暗= 8) 试验(昏暗= 30) 每次试用样品(昏暗= 30) 在实验期间,受试者从前15个试验的分布A接收数据,然后在最后15个试验中接收分布B,反之亦然 . 这在我的数据中表示为“AB”组或“BA”组 . 受试者1,3,4,5,7,8,9在A...
  • 1 votes
     answers
     views

    R - 按小时聚合,最大值为秒

    我有数据,我想在时间步骤上聚合,另外想要计算该组中另一个值的最大值 . 为了聚合,我运行以下代码: s_stats <- lapply(s_df_array, function(x) { aggregate(x, by=list(unique.values=x$start), length) }) s_df_array是一个数据帧表,代码可以很好地计算x $ start中每个值的条目出现次...
  • 1 votes
     answers
     views

    如何使用ggplot混合条形堆栈条形图和点图?

    我有一个data.frame,格式如下: X Y min max year perc1 perc2 perc3 1 10 50 3 4 1 40 50 10 2 20 60 2 5 1 20 40 40 3 30 50 4 6 1 35 35 30 我正在使用下一页(http://r...
  • 48 votes
     answers
     views

    创建堆叠条形图,其中每个堆栈按比例缩放为100%

    我有一个像这样的data.frame: df <- read.csv(text = "ONE,TWO,THREE 23,234,324 34,534,12 56,324,124 34,234,124 ...
  • 0 votes
     answers
     views

    如何使用R-base在堆积条形图中标记百分比值

    我是R的新手 . 我希望其他人请向我解释如何使用基本的R绘图功能(R base)以一致的方式在单个堆叠条中添加绝对值 . 我试图使用R base绘制一个堆积的条形图,但是这些值以不一致/不合逻辑的方式显示,使得它对于每个村庄应该是100%,但它们总和不是100% . 以下是我正在处理的数据: Village 100 200 300 400 500 Male ...
  • 0 votes
     answers
     views

    Barplot与堆积的时间序列

    我有一些月度时间序列,可以求和(通常是权重,但在这里不重要)来获得索引的值 . 这是我的数据的摘录: 01.2009 02.2009 03.2009 04.2009 05.2009 06.2009 07.2009 aaa 321.5743 323.7106 323.9933 326.1296 329.6482 328.3287 328.9571 bbb 322.0770 324.464...
  • 0 votes
     answers
     views

    ggplot2将叠加的条形图添加到热图

    我想将功能信息添加到HeatMap(geom_tile) . 我有以下简化的DataFrame和R代码生成一个HeatMap和一个单独的堆叠BarPlot(按照正确的顺序,对应于HeatMap) . Question: 如何将BarPlot添加到Heatmap的右边/边?它不应与任何图块重叠,并且BarPlot的图块应与HeatMap的图块对齐 . Data: AccessionNumber &l...
  • 1 votes
     answers
     views

    ggplot自上次更新后没有订购级别

    我想在这里制作这个情节: 但是右边的顺序变得混乱了 . 在每条水平线上有两个堆叠的条形图,一个是正的,一个是负的 . 每个人都有自己的数据帧 . df1表示左侧,df2表示右侧 . 中间类别分为两半,部分位于左侧,另一半位于右侧 . 我试图重新排序因子df2 $ level,它保存右侧barplot的顺序,但它没有改变一个东西(当然我从ggplot2调用中取出了order = as.numer...
  • 0 votes
     answers
     views

    (ggplot)带有两个分类变量的堆积条形图中的Pecentage标签

    我发现在100%堆积条形图中绘制两个分类变量时,无法创建合适的标签 . 考虑下面的代码(重现我的问题的虚构数据集): data <- data.frame( gender=sample(c("M", "F"), 40, replace=TRUE), football=sample(c("Yes", "No&quot...
  • 1 votes
     answers
     views

    基于另一个数据集绘制基于dplyr的数据集子集的错误

    我有两个数据帧 df1 和 df2 . 我想基于两个数据集之间的子集生成堆积条形图 . df1 包含两个任何项目之间的距离 . set.seed(123) df1 <- data.frame(col.x=rep(LETTERS[1:6], each=10), col.y=rep(LETTERS[1:6], times=10), ...

热门问题