首页 文章
  • 1 votes
     answers
     views

    回归与分类的特征选择

    新机器学习所以请耐心等待,谢谢!我有三个问题要问,所以如果你在回答时提到问题编号会有所帮助 . 所以我想在应用机器学习算法之前对我的训练数据进行特征选择 . 我将使用相同的数据集在许多不同的ML算法上运行以确定什么是最好的,这样如果我可以只进行一次特征选择并将新数据集传递给各种算法,它将更有效 .注意:我在Python3中编码,我将使用BorutaPy进行功能选择 . [https://gith...
  • 5 votes
     answers
     views

    当损耗是均方误差(MSE)时,什么函数定义了Keras的准确度?

    当损失函数是均方误差时,如何定义准确度?是绝对百分比误差 - en.wikipedia.org/wiki/Mean_absolute_percentage_error? 我使用的模型输出activatoin linear,并使用loss = mean_squared_error进行编译 model.add(Dense(1)) model.add(Activation('linear')) # ...
  • 1 votes
     answers
     views

    在scikit-learn中实现R随机森林特征重要性得分

    我正在尝试为sklearn中的随机森林回归模型实现R的特征重要性评分方法;根据R的文档: 第一个度量是根据置换OOB数据计算的:对于每个树,记录数据的袋外部分的预测误差(分类的错误率,回归的MSE) . 然后在置换每个预测变量之后完成相同的操作 . 然后将两者之间的差异在所有树上进行平均,并通过差异的标准偏差进行归一化 . 如果变量的差异的标准偏差等于0,则不进行除法(但在这种情况下平均值几乎总...
  • 6 votes
     answers
     views

    使用回归模型重复测量anova(LM,LMER)

    我想使用回归模型而不是'Analysis of Variance'(AOV)函数在R中运行重复测量anova . 以下是我的AOV代码中3个主题内因素的示例: m.aov<-aov(measure~(task*region*actiontype) + Error(subject/(task*region*actiontype)),data) 有人可以给我使用回归模型运行相同分析的确切语法吗...
  • 0 votes
     answers
     views

    在R中滚动虚拟回归

    我有一个关于r的回归分析的问题 . #Datei einlesen residual <- read.csv2("E:***Input-R_Renditen.csv",header=TRUE,sep=";") #Firmen alist <- list() for (a in 2:11){ #Länge Gesamtzeit t &lt...
  • 0 votes
     answers
     views

    使用Data.table滚动回归 - 更新?

    我试图在data.table中运行滚动回归 . 有许多问题可以解决我想要做的事情,但它们一般都是3岁,并提供不优雅的答案 . (参见:here,例如) 我想知道是否有任何更新data.table包,使这更直观/更快? 这是我想要做的 . 我的代码看起来像这样: DT<-data.table( Date = seq(as.Date("2000/1/1"), by = ...
  • 0 votes
     answers
     views

    用dplyr和lsfit滚动回归

    我正试图用 dplyr 进行滚动回归 . 我正在使用包 zoo 和 lsfit 中的 rollapplyr 作为我尝试过的'm only interested in the beta of the regression. Here': library(dplyr); library(zoo) df1 = expand.grid(site = seq(10), ...
  • 0 votes
     answers
     views

    在R中滚动逐步回归

    我有一个12个预测变量的数据框和一个名为BEI的数字列表(我想预测) . 我想对每12行数据进行逐步选择,例如1:12,2:13等 . 对于每次滚动,我想返回系数并使用系数来预测BEI . 以下是我的代码: k = length(BEI) coef.list <- numeric() predicted.list <- numeric() for(i in 1:(k-11)){ B...
  • 0 votes
     answers
     views

    按组滚动时间序列回归

    我正在研究R中的以下数据: # Getting stock data library(quantmod) tickers <- c("ASC.OL", "AFG.OL", "AKA.OL", "AKER.OL", "AKERBP.OL", "AKSO.OL&quot...
  • 2 votes
     answers
     views

    R /滚动回归与扩展数据框架

    你好我正在使用以下代码进行回归分析: for (i in 1:ncol(Ret1)){ r2.out[i]=summary(lm(Ret1[,1]~Ret1[,i]))$r.squared } r2.out 此代码对第一列中的数据框中的每列运行简单的OLS回归,并提供这些回归的R ^ 2 . At the Moment 回归使用列的所有数据点 . What I Need 现在是代...
  • 1 votes
     answers
     views

    滚动回归和多重共线性

    EIDTED!数据结构是 > str(ALLX) 'data.frame': 240 obs. of 21 variables: $ Date : Factor w/ 240 levels "1998-01-01","1998-02-01",..: 1 2 3 4 5 6 7 8 9 10 ... $ IM : num...
  • 3 votes
     answers
     views

    用于R中的回归的ddply

    I 'm I have a data frame that contains an '输出',100个城市的平均温度,湿度和时间(给定为24因子,不连续)数据(由代码给出) . 我想应用回归公式来根据温度,湿度和时间数据预测每个城市的输出 . 我希望得到100种不同的回归模型 . 我使用了ddply函数,并在this thread的帮助下提出了以下代码行 . df = ddply(data, &q...
  • 0 votes
     answers
     views

    按组滚动回归

    嗨,我有一个面板数据集 . 我想为每个公司做一个滚动窗口回归并提取独立变量的系数 . y是依赖var,x是独立var . 滚动窗口为12.即,第一个回归使用第1行到第12行数据,第二个回归使用第2行到第13行数据等 . 使用Rollapply . 这是一个与我遇到的完全相同的错误的问题:Rolling by group in data.table R关于这个问题的幸运之处在于它只需要一列但我的回...
  • 0 votes
     answers
     views

    在Stata的esttab中,省略模型名称行

    我正在使用Stata生成带有esttab的回归表,我想在Latex文档中包含这些表 . 我正在制作一个这样的回归表: sysuse auto eststo: regress price weight eststo: regress price weight mpg eststo: regress price weight mpg headroom eststo: regress price we...
  • 2 votes
     answers
     views

    有目的地过度拟合神经网络

    从技术上讲,考虑到足够复杂的网络和足够的时间,是否总是可以将任何数据集过度拟合到训练误差为0的点?
  • 0 votes
     answers
     views

    R:多个子样本回归的约束系数和误差方差[关闭]

    我正在和R一起研究145个观察样本 . 我创建了五个子样本,每个子样本有29个观察值,而响应变量 q 已经排序 . 结果,subset1包含具有最低输出的29行数据帧,subset2包含以下29行等 . 我正在回归预测变量 x1 , x2 ans x3 上的变量 q . 我现在需要进行两个实验: 约束所有子样本的误差方差相同; 约束 x2 和 x3 上的系数以及5个OLS回归中的误差...
  • 3 votes
     answers
     views

    R中的有效循环逻辑回归

    我正在尝试对每个~400k预测变量进行多个逻辑回归分析 . 我想将每次运行的输出捕获到输出表的行/列中 . 我的数据分为两部分 . 我有一个400000 x 189双矩阵( mydatamatrix ),其中包含我在189个人( P1 )中测量的每个400000预测变量的观察/数据 . 我还有第二个189 x 20数据框( mydataframe ),其中包含结果变量和另一个预测变量( O1 和 ...
  • 0 votes
     answers
     views

    回归循环和存储系数

    我将(1)多次循环回归某个标准; (2)从每个回归中存储一定的系数 . 这是一个例子: clear sysuse auto.dta local x = 2000 while `x' < 5000 { xi: regress price mpg length gear_ratio i.foreign if weight < `x' est sto model_`x...
  • 2 votes
     answers
     views

    多个线性回归模型使用data.table和模式与grep

    我正在尝试使用单个data.table使用模式 grep() 运行多个线性回归模型,并使用 by= 将模型应用于表的每个部分 这是我到目前为止所得到的 . d <- data.table(label=rep(c('a','b','c'), c(10,10,10)),resp1=rnorm(30),resp2=rnorm(30),x1=runif(30),x2=runif(30)) ...
  • 1 votes
     answers
     views

    R中的多元回归:协变对因子的影响还是相反?

    我知道对于具有统计背景的人来说,这可能是一个非常简单的问题 . 然而,我找不到适合我(不是那样)特殊情况的明确答案:( 我有一个回归模型,有两个分类预测因子(A,有两个级别A1和A2和B,有两个级别B1和B2),还有一个数字预测器Z. 我对Z和B之间的相互作用感兴趣,但特别是在A的一个级别(A1,我的参考级别) . 因此,我安装了以下型号: lm(Y ~ A/B*Z, data=df) 这让我想...
  • 0 votes
     answers
     views

    循环或应用多个回归,将系数和p值提取到数据框中

    我有一个包含3个相关(LHS)变量和4个独立(RHS)变量的数据框 . 我想在每个RHS变量上运行每个LHS变量的线性回归,并将每个回归的结果作为一行存储在数据框中,列为:lhs,rhs,Estimate,Std . 错误,t值,Pr(> | t |) . 例如,使用mtcars,我考虑了一个嵌套循环: lhs <- c('mpg', 'cyl', 'disp') rhs <- ...
  • 2 votes
     answers
     views

    使用predict.glm返回什么标准错误(...,type =“response”,se.fit = TRUE)?

    在执行逻辑回归后,我将根据excellent example中提供的关于如何计算响应的95%置信区间的数据拟合模型: foo <- mtcars[,c("mpg","vs")]; names(foo) <- c("x","y") mod <- glm(y ~ x, data = foo, family...
  • 0 votes
     answers
     views

    计算置信区间的误差稳健回归(二项式)

    对于一个项目,我想用R中的“鲁棒”包进行稳健的回归 . 数据包括X轴和Y轴上某些突变的普遍性,因此我使用了二项式族 . 问题是,每当我尝试计算置信区间时,我都会收到错误: predict.glmRob中的错误(mod,newdata = dfPred,type =“response”):尝试应用非功能 这是我运行的R代码: mod <- glmRob(pop2 ~ pop1, ...
  • 2 votes
     answers
     views

    使用stargazer导出回归表:$ operator对原子向量无效

    我正在尝试使用stargazer导出回归表 . 回归输出来自glm,看起来像: Call: glm(formula = formula, family = binomial(logit), data = data) Deviance Residuals: Min 1Q Median 3Q Max -1.2913 -0.11888 -0.3239 ...
  • 2 votes
     answers
     views

    plot.lm错误:$运算符对原子向量无效

    我有以下回归模型与转换: fit <- lm( I(NewValue ^ (1 / 3)) ~ I(CurrentValue ^ (1 / 3)) + Age + Type - 1, data = dataReg) plot(fit) 但是 plot 给了我以下错误: Error: $ operator is invalid for atomic vectors 关...
  • 3 votes
     answers
     views

    R [重复]中的约束线性回归系数

    这个问题在这里已有答案: R : constraining coefficients and error variance over multiple subsample regressions [closed] 1回答 我估计R中的几个普通最小二乘线性回归 . 我想约束回归中的估计系数,使它们相同 . 例如,我有以下内容: z1 ~ x + y z2 ~ x + y 我希望第一次回归中y的...
  • 0 votes
     answers
     views

    'fitnlm'或'lsqcurvefit'用于非线性最小二乘回归?

    我试图使用最小二乘法将实验数据拟合到三次多项式方程 . 我有两个自变量和一个因变量,这使它成为一个非线性拟合 . 我用函数'fitnlm'和'lsqcurvefit'计算了系数,两者都推荐用于非线性回归拟合 . 虽然我输入了相同的初始系数(猜测)值,但我从两个函数中获得了不同的系数值 . 请建议两个功能中的哪一个更好,哪些系数可以信任 . 并且,如何在使用lsqcurvefit时检查均方根误差的值...
  • 1 votes
     answers
     views

    使用Numpy的最小二乘法进行线性回归后的奇怪图

    我正在使用多个变量进行线性回归 . 为了获得thetas(系数),我使用了Numpy的最小二乘 numpy.linalg.lstsq 工具 . 在我的数据中,我有 n = 143 功能和 m = 13000 训练示例 . 我想根据区域绘制房价并显示此功能的拟合线 . 数据准备代码(Python): import pandas as pd import numpy as np import matp...
  • 1 votes
     answers
     views

    Dplyr差异在group_by中变异和总结

    我对一些基线理解很困难 . 下面的数据框包含一个列,以后应该提供聚合方法 . 还有一个加权变量 n.group . structure(list(hosptg = structure(c(3L, 3L, 1L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L,...
  • 0 votes
     answers
     views

    Stata - 使用forvalues回归和估计商店

    我试过重复以下过程: forvalues i=1990(1)2013 { reg a b c if year==`i',r est sto G`i' } 但是,Stata回归并且不存储每个回归的系数 . 也许, forvalues 不知道哪种编码更好 .

热门问题