首页 文章
  • 3 votes
     answers
     views

    pytorch:如何直接找到渐变w.r.t.失利

    在theano中,很容易得到某些变量的梯度w.r.t.给定的损失: loss = f(x, w) dl_dw = tt.grad(loss, wrt=w) 我得到了pytorch的不同范式,你可以做以下事情: loss = f(x, w) loss.backwards() dl_dw = w.grad 问题是我可能不希望通过图形进行完全向后传播 - 只需沿着需要到达w的路径 . 我知道你可以用...
  • 0 votes
     answers
     views

    在pytorch中有theano.tensor.switch的模拟吗?

    我想强制将矢量的所有元素归零,这些元素都低于某个阈值 . 而且我想这样做,以便我仍然可以通过非零传播渐变 . 例如,在theano我可以写: B = theano.tensor.switch(A < .1, 0, A) 在pytorch中有解决方案吗?
  • 2 votes
     answers
     views

    当测试和训练数据集来自不同来源时,为什么测试精度保持不变并且不会增加二进制分类

    我有来自两个不同来源的 train 数据集和 test 数据集 . 我的意思是他们来自两个不同的实验,但两者的结果都是相同的生物图像 . 我想使用 deep CNN 进行二进制分类,并且我对测试精度和训练精度有以下结果 . 蓝线显示列车精度,红线显示近250个时期后的测试精度 . 为什么测试精度几乎是恒定的而不是提高?是因为 Test 和 Train 数据集来自不同的发行版? 编辑:在我添加了dr...
  • 1 votes
     answers
     views

    使用keras和theano的python的MemoryError

    我试过this keras教程 . 我在我的另一个项目中使用theano,所以我改变keras使用theano而不是tenorflow . 但是当我运行本教程时,我首先得到这个错误: nvcc致命:在PATH中找不到编译器'cl.exe' 过了一段时间,在第一个Epoch(满分3分)中,样本号13056(满分25000)我得到了这个错误: 文件“test_keras.py”,第28行,在mo...
  • 7 votes
     answers
     views

    简单的MLP时间序列训练产生未出现的平均线结果

    我正在尝试简单的时间序列预测 . 给定输入数量(1Min滴答)Net应该尝试预测下一个 . 我训练了3个不同设置的网来说明我的问题: 在右侧,您可以看到3个训练师MLP - 随机命名和颜色编码,以及一些训练统计数据 . 在左边 - 这些网络做出的预测图和白色的实际验证数据 . 这个图是通过验证数据的每个刻度(白色),将30 | 4 | 60(Nancy | Kathy | Wayne)之前的刻...
  • 3 votes
     answers
     views

    使用Keras / Theano和LSTM进行多标签文本分类

    尝试使用Keras / Theano运行LSTM多标签文本分类 . 我有一个文本/标签csv . 文本是纯文本,标签是数字,总共9个,从1到9 . 我想我没有为这个问题正确配置模型 . 我的代码到目前为止: import keras.preprocessing.text import numpy as np Using Theano backend. from keras.prepro...
  • 0 votes
     answers
     views

    keras中Convolution1D中的input_shape参数不匹配错误

    我想在keras中使用Convulation1D对数据集进行分类 . DataSet Description : 训练数据集大小= [340,30];样本数= 340,样本维数= 30 测试数据集大小= [230,30];样本数= 230,样本维数= 30 标签尺寸= 2 拳头我使用keras网站https://keras.io/layers/convolutional/的信息尝试使用以下代码 b...
  • 0 votes
     answers
     views

    Keras层输出尺寸的计算

    我目前正在尝试使用theano后端在Keras中实现GoogLeNet架构(InceptionV1),因为我想使用GoogLeNet模型为CUB数据集生成功能 . 我在Keras here找到了一个实现 . 但是,它基于早期版本的Keras,我不得不根据Keras版本2对图层进行更改 . 现在,模型正确构建 . 但是,predict()函数失败,错误为 ValueError:CorrMM图像和内...
  • 1 votes
     answers
     views

    PyMC 3中的确定性变量和Fortran Scipy函数

    我正在尝试构建一个简单的PyMC 3模型,其中我估计两个切割点和潜在双变量高斯密度中的相关参数,产生(多项式)计数向量的四个预测概率 . (我希望,这将成为一个更大模型的一部分,在这个模型中,对于许多潜在的多元高斯密度估计这些和其他参数 . ) 因此,我想将切割点cx和cy建模为正常的随机变量,并将相关参数rho建模为缩放的Beta随机变量(作为旁注,我希望听到更好的方法来处理rho - 做P...
  • 3 votes
     answers
     views

    在我的单个样本的训练数据上过度拟合我的模型

    我试图在我的训练数据上过度拟合我的模型,该训练数据只包含一个样本 . 训练精度为1.00 . 但是,当我预测包含相同单个训练输入样本的测试数据的输出时,结果不准确 . 该模型已经训练了100个时期和损失~1e-4 . 可能的错误来源是什么?
  • 10 votes
     answers
     views

    神经网络的显着性图(使用Keras)

    我有一个完全连接的多层感知器在Keras训练 . 我给它一个N维特征向量,它预测输入向量的M类中的一个 . 培训和预测运作良好 . 现在我想分析输入特征向量的哪个部分实际负责特定类 .例如,假设有两个类 A 和 B ,以及一个输入向量 f . 向量 f 属于类 A ,网络正确预测它 - 网络的输出是 A=1 B=0 . 因为我有一些领域知识,我知道整个 f 实际上不对属于 A 的 f 负责,只...
  • 2 votes
     answers
     views

    由于自定义丢失功能,Keras会抛出DisconnectedInputError

    我正在尝试使用theano后端在Keras中实现improved WGAN training的渐变范数的正则化项 . 基本上我想根据它与1的距离来惩罚渐变的l2范数 . 我正在实现这样的自定义损失: def get_gradient_norm(model, y_pred): weights = model.trainable_weights gradients = model.op...
  • 2 votes
     answers
     views

    Keras / theano的最大保证金损失

    我想在Keras中训练神经网络(使用theano作为后端),使用每个正样本的一个负样本,使用最大边距损失函数: max(0,1 -pos_score +neg_score) 我有一个神经网络,它接受两个参数 i 和 j 并返回得分 base(i,j) . 对于给定的 i ,我有一个正样本 j 和负样本 k . 所以,我想计算以下内容: max(0, 1 - base(i, j) + base...
  • 0 votes
     answers
     views

    为什么我们需要在递归神经网络中微调字嵌入?

    在theano的关于RNN的教程中,最后一部分提到了这一点 我们通过在每次更新后对它们进行规范化,将单词嵌入保留在单位范围内: self.normalize = theano.function(inputs=[], updates={self.emb: ...
  • 0 votes
     answers
     views

    加载RNN的数据

    在RNN训练示例中,我注意到输入数据和目标数据都是三维数组,需要定义输入和输出之间的时间步长延迟 . input_seqs = np.zeros((num_batches, num_time_steps, batch_size), dtype=floatX) target_seqs = np.zeros((num_batches, num_time_steps, batch_size), dtyp...
  • 2 votes
     answers
     views

    卷积神经网络 - 可视化权重

    Main Problem 我无法理解特定图层权重的图 . 我使用了无学习的方法: plot_conv_weights(layer, figsize=(6, 6)) 我使用 lasagne 作为我的神经网络库 . 情节很好,但我不知道我应该如何解释它 . Neural Network Structure 我使用的结构: InputLayer 1x31x31 Conv2DLayer 20x3x3 ...
  • 0 votes
     answers
     views

    Keras:Theano和Tensorflow之间不兼容

    请注意:这个问题在github上也是issue . UPDATE: 我试图在Keras中实现一个自定义层:一个通过卷积计算其门的GRU层 . 该代码有效,但仅限于Theano后端 . 在github上,我得到了在keras.json中将“image-layout”切换为“tf”的提示 . 事实上,我已经硬编码了“th”图像布局,所以我不得不修复我的代码中的一些问题 . 现在它支持“th”和“tf”...
  • 0 votes
     answers
     views

    CNN图层如何添加其偏差值?

    我需要将我的CNN模型编写为Theano函数,我的权重已经由Keras设置(Tensorflow作为后端),但我不确定如何添加与每个层相关联的偏差值 . 这个解决方案How can I get a 1D convolution in theano可以很好地将单个层写为Theano函数,但我需要将权重与每个层的偏差叠加在一起 我的代码的简化版本: model = Sequential([ ...
  • 0 votes
     answers
     views

    计算KERAS中神经网络的最优输入和提取权重

    我使用带有Tensorflow后端的Keras进行时间序列预测(主要是3-6个输入,1个输出) . 它们在预测任务中表现良好,但我想从训练有素的网络中提取知识 . 1. Calculation of optimal input sets 我想使用网络为给定的所需输出提供最佳输入集 . 有没有可能这样做?我只知道有关最大或最小输出的推导的方法 . 2. Extraction of ALL weigh...
  • 0 votes
     answers
     views

    使用来自pip local的包而不是pip global

    我安装了Theano库 /usr/local/lib/python2.7/dist-packages/theano/ 但Theano安装是旧的,我使用的是一些无法导入某些软件包的库 . 所以我尝试使用安装新的 pip install --user theano in ~/.local 但每次我导入theano时,版本都是旧版本 /usr/local/lib/python2.7/... 所以我...
  • 1 votes
     answers
     views

    从theano中的给定pmf中选择一个数字

    假设我有一个数组 p = [ 0.27, 0.23, 0.1, 0.15, 0.2 ,0.05] . 设 p 是随机变量 X 的概率质量函数 . 现在,我正在编写一个theano代码,我在每次迭代时生成一个 p ,我也有 n 权重矩阵 . (这里 [n = 6] . ) 现在,在每次迭代中,我想要选择这些权重矩阵中的一个用于进一步传播 . 有人可以帮忙解决如何编写这段代码的问题 . 我不确定...
  • 0 votes
     answers
     views

    theano.test()错误:test_grad GradientError:数值梯度和分析梯度超出容差

    我在Ubuntu 14.04上安装了Theano 0.8.2,运行 theano.test() 并收到以下错误 . 这个错误的可能原因是什么? ================================================= =====================错误:test_grad(theano.tensor.tests.test_basic.ArctanhInpla...
  • 9 votes
     answers
     views

    在AMD Radeon上尝试使用OpenCL Theano时,获取“pygpu已配置但无法导入”错误

    我遵循了以下说明: https://gist.github.com/jarutis/ff28bca8cfb9ce0c8b1a 但是当我尝试时:THEANO_FLAGS = device = opencl0:0 python test.py在测试文件上我收到错误: 错误(theano.sandbox.gpuarray):pygpu已配置但无法导入Traceback(最近一次调用最后一次):文件“/h...
  • 1 votes
     answers
     views

    'Wrong major API version for gpuarray:',-9997,'Make sure Theano and libgpuarray/pygpu are in sync.'

    错误(theano.sandbox.gpuarray):无法初始化pygpu,支持禁用 Traceback(最近一次调用最后一次): 文件“/home/mesayantan/.local/lib/python2.7/site-packages/theano/sandbox/gpuarray/ init .py”,第95行,in init_dev(config.device) 在init_de...
  • 3 votes
     answers
     views

    Theano:如何将训练数据提供给神经网络

    我正在尝试为Theano中的“逻辑和”创建一个简单的多层感知器(MLP) . 输入和输出之间有一层 . 结构是这样的: 2值输入 - >乘以权重,加偏置 - > softmax - > 1值输出 尺寸的变化是由权重矩阵引起的 . 该实现基于本教程:http://deeplearning.net/tutorial/logreg.html 这是我的Layer类: class Lay...
  • 0 votes
     answers
     views

    TensorFlow:通过点积收缩两个张量的维数

    我有两个张量,排名4的 a 和排名1的 b . 我想通过"contracting"产生 aprime ,排名为"contracting",最后一个轴的轴,用它的点积替换为 b . 在numpy中,这就像 np.tensordot(a, b, 1) 一样简单 . 但是,我无法想出在Tensorflow中做到这一点的方法 . 如何用等于该轴的点积的值替换张量...
  • 1 votes
     answers
     views

    Keras与Caffe的常客

    我在KERAS编辑了一个AlexNet,试图学习一个单独的课程(即狗/面孔或不是狗/面孔) . 我有 correct 图像的训练样本,所以Ytrain是 [1, 0] 和 incorrect 图像所以Ytrain是 [0,1] . 目标是知道图像是否是狗(例如) . 而训练损失非常大~100,000,000 所以我删除了常规行,它有效... activity_regularizer=Activi...
  • 0 votes
     answers
     views

    如何在theano中计算梯度wrt连接变量

    我有一个损失函数 y 这是多个 shared variables theta1 , theta2 的函数,... 然后, y wrt theta 的梯度下降可以简单地写成 import theano.tensor as T theta_list = [theta1, theta2, theta3, theta4] grad_list = T.grad(y, theta_list) for ...
  • 0 votes
     answers
     views

    在Theano中计算Rnn的梯度问题

    我正在玩vanilla Rnn's,使用渐变下降训练(非批量版本),我对(标量)成本的梯度计算有问题;这是我的代码的相关部分: class Rnn(object): # ............ [skipping the trivial initialization] def recurrence(x_t, h_tm_prev): h_t = T.tanh(T.dot(x...
  • 0 votes
     answers
     views

    Theano继续训练

    我正在寻找关于如何在theano继续训练的一些建议 . 例如,我有以下内容: classifier = my_classifier() cost = () updates = [] train_model = theano.function(...) eval_model = theano.function(...) best_accuracy = 0 while (epoch < n_...

热门问题