-
3 votesanswersviews
ValueError:检查目标时出错:期望dense_3具有形状(1,)但是得到了具有形状的数组(6,)
我正在尝试使用以下ANN模型运行多类分类: classifier = Sequential() classifier.add(Dense(units = 9, kernel_initializer = 'uniform', activation = 'relu', input_dim = 18)) classifier.add(Dense(units = 9, kernel_initializer... -
0 votesanswersviews
Keras中的不 balancer 数据分类
我有一个由 A , B 和 D 类组成的数据集 . 有100个样本 A ,26个样本 B 和1个样本 D 出127.如果我忽略样本D,则ANN的精确度约为%95 . 但是,我想 Build 一个模型,可以正确分类样本D,并成功预测未来 D 样本 . 有什么建议吗? -
0 votesanswersviews
Multinomial Naive Bayes分类器如何处理类别特征?
我学会了如何使用MLE来获得朴素贝叶斯中类别特征的似然发生概率 . watermelon quality prediction example: color texture quality 1 green clear good 2 black clear good 3 white blur good 4 green blur bad 5 black blur bad ... -
-2 votesanswersviews
如何为SVM,sklearn,python选择合适的C.
众所周知,C参数告诉SVM优化你想要避免错误分类每个训练样例的程度 . 对于较大的C值,如果超平面能更好地将所有训练点分类正确,则优化将选择边距较小的超平面 . 相反,非常小的C值将导致优化器寻找更大边距的分离超平面,即使该超平面错误分类更多的点 . 对于非常小的C值,您应该得到错误分类的示例,即使您的训练数据是线性可分的 . 因此,仍有一个问题仍然没有答案,或者至少是一个我无法找到答... -
0 votesanswersviews
使用Cross_Val_score的原因
我对使用cross_val_score的原因感到困惑 . 根据我的理解,cross_val_score告诉我的模型是'overfitting'还是'underfitting' . 而且,它不训练我的模型 . 因为我只有1个特征,所以它是tfidf(稀疏矩阵) . 如果它不合适,我不知道该怎么办 . Q1: Did I use it in wrong order? I've seen both 'c... -
0 votesanswersviews
用caffe分类图像
我正在尝试使用Caffe构建二进制分类器 . 首先,我通过稍微修改样式识别模型的微调来训练我自己的图像数据集 . 但是当我尝试对单个图像进行分类时,它给出了两个类的概率为50% . 为了分类,我使用了相同的deploy.prototxt,只是将output_number更改为2.这很奇怪,因为在训练时我得到准确度~85% . 我尝试了python(classify.py)和cpp(classifi... -
1 votesanswersviews
Scikit train_test_split by a indice
我有一个按日期索引的 pandas 数据框 . 让's assume it from Jan-1 to Jan-30. I want to split this dataset into X_train, X_test, y_train, y_test but I don' t想要混合日期,所以我希望火车和测试样本除以某个日期(或索引) . 我尝试着 X_train, X_test, y_trai... -
1 votesanswersviews
用于性别分类的SVM:使用线性内核100%正确结果,但使用RBF的结果更差
我根据 image of a face 为 gender classification 制作了一个小程序 . 我使用Yale face databse(男性为175张图像,女性为相同数字),将它们转换为灰度和均衡直方图,因此在预处理后图像如下所示: 我运行以下代码来测试结果(它使用SVM和 linear 内核): def run_gender_classifier(): Xm, Ym =... -
0 votesanswersviews
内核函数的级联/线性组合
我有一个关于机器学习和特别是内核函数的问题 . 假设我们有一个Kernel函数,比如K(x),还有另一个不同的函数,比如K'(x) . 我想知道K(K'(x))是一个内核函数吗?也就是说,如果将内核函数的输出提供给另一个内核,它意味着什么?它有意义吗? 另一个问题是关于众所周知的核的线性组合的预期行为,例如RBF,多项式和MLP . 假设MLP内核在分类任务中产生60%的准确度,而RBF产生85%... -
0 votesanswersviews
SVM参数调整
我是使用svm进行分类的新手 . 我想在EmguCV中通过 .TrainAuto 函数调整svm参数 . 但我不知道我应该给这个函数搜索的以下参数的范围(最小 - 最大值)是多少: 1- C(用于poly和RBF内核) 2-Gamma(用于poly和RBF内核) 3- Coeficient(用于多核) 4-度(对于多核) 这些参数的范围是多少? 这些范围取决于样本数量吗? 当我收到内存分配错误时,... -
3 votesanswersviews
Scikit-从分段时间序列中学习标记的数据集创建
INTRO 我有一个Pandas DataFrame,代表不同用户的时间序列 segmented (即user1和user2) . 我想用提到的DataFrames训练一个scikit-learn分类器,但是我可以跳过分段的描述,因为它是由an algorithm提供的 . 我们举一个例子,其中user1和user2都有2个段: print df username voltage ... -
2 votesanswersviews
如何根据分类树概率绘制ROC曲线
我试图用分类树概率绘制ROC曲线 . 但是,当我绘制曲线时,它不存在 . 我试图绘制ROC曲线,然后从曲线下面的区域找到AUC值 . 有谁知道如何解决这一问题?谢谢你,如果可以的话 . 二进制列表Risk代表风险错误分类,我认为这是我的标签 . 我应该在我的代码中的不同点应用ROC曲线方程吗? 这是数据框: library(ROCR) data(Risk.table) pred =... -
0 votesanswersviews
计算B和| V |在朴素贝叶斯文本分类
我找到了关于多项式朴素贝叶斯分类器的链接 multinomial naive bayes link 我们如何计算 B' 或 |V| ? 该页面说它是词汇表中的术语数量 . 在它的例子中,我们如何为 B 获得 6 ?这是所有学期的计算吗? “中国”,“北京”,“上海”,“meacao”,“东京”,“日本” 还有一个问题,如果新术语出现在测试文档中会怎么样?例如,在doc 6中出现“曼谷”或以前从... -
0 votesanswersviews
使用拦截模型进行逻辑分类
我的儿子和我正在试图弄清楚如何进行后勤分类,但只包括一个拦截 . 我想出了以下内容,它使用x1到x4执行分类,然后仅使用拦截模型 . 代码运行并且看起来像我想要的那样 . 但他们是否采用更简约的方法来执行仅限拦截分类? import numpy as np import pandas as pd from sklearn import preprocessing from sklearn.line... -
17 votesanswersviews
Keras分类 - 物体检测
我正在使用Keras和Python进行分类然后对象检测 . 我已经对猫/狗进行了80%的准确度分类,我现在的结果还不错 . 我的问题是如何从输入图像中检测到猫或狗?我完全糊涂了 . 我想使用自己的高度,而不是来自互联网的预训练 . 这是我目前的代码: from keras.preprocessing.image import ImageDataGenerator from keras.models... -
9 votesanswersviews
loss,val_loss,acc和val_acc在所有时期都不会更新
我创建了一个用于序列分类(二进制)的LSTM网络,其中每个样本具有25个时间步长和4个特征 . 以下是我的keras网络拓扑: 上图中,Dense层之后的激活层使用softmax函数 . 我使用binary_crossentropy作为损失函数,使用Adam作为编译keras模型的优化器 . 使用batch_size = 256,shuffle = True和validation_split = ... -
344 votesanswersviews
人工神经网络相对于支持向量机有什么优势? [关闭]
ANN(人工神经网络)和SVM(支持向量机)是监督机器学习和分类的两种流行策略 . 通常不清楚哪种方法对特定项目更好,而且我确定答案总是“它取决于” . 通常,使用两者的组合以及贝叶斯分类 . 有关ANN和SVM的问题已经在Stackoverflow上提出过: ANN and SVM classification what the difference among ANN, SVM and KNN... -
5 votesanswersviews
获取keras中所有已知类别的vgg-16的列表
我使用Keras预训练的VGG-16型号 . 到目前为止我的工作源代码是这样的: from keras.applications.vgg16 import VGG16 from keras.preprocessing.image import load_img from keras.preprocessing.image import img_to_array from keras.applica... -
1 votesanswersviews
Keras密集网过度拟合
我试图使用keras从加速度计信号构建活动分类器 . 然而,即使使用最简单的模型,我也会遇到极度过度拟合的数据 . 输入数据具有形状(10,3)并且包含来自加速度计的大约0.1秒的3维数据 . 模型很简单 model = Sequential() model.add(Flatten(input_shape=(10,3))) model.add(Dense(2, activation='softma... -
0 votesanswersviews
如何修改Scikit-Learn中决策树算法中的分裂标准(gini / entropy)?
我在二元分类问题上使用决策树算法,目标是最小化分类的误报(最大化 positive predicted value )(诊断工具的成本非常高) . 有没有办法在gini /熵分裂标准中引入 weight 来惩罚误报错误分类? Here例如,修改后的Gini索引如下: 因此,我想知道是否有任何方法可以在Scikit-learn中实现它? EDIT 使用 class_weight 产生了以下结果: ... -
-1 votesanswersviews
为什么我的精确回忆和ROC曲线不平滑?
我有一些标记为0或1的数据,我试图使用随机森林预测这些类 . 每个实例都标有20个用于训练随机森林的特征(约30.000个训练实例和~6000个测试实例) . 我正在使用以下代码绘制精确调用和ROC曲线: precision, recall, _ = precision_recall_curve(y_test, y_pred) plt.step(recall, precision, color='... -
2 votesanswersviews
使用Keras进行二进制分类:性能不佳
我正在尝试使用Keras来开发用于二进制分类目的的多层感知器,我对我获得的(差)性能(训练集的准确率为57%)感到惊讶 . 逻辑回归正确地对100%的样本进行分类 . 我创建了一个带有2个输入的数据集:输入A是一个正弦函数 . 输入B =输入A加滞后 . 当输入A> =输入B时,输出= 1.否则,输出= 0 . SIN SIN-1 Direction 0 0 1 0.062790... -
1 votesanswersviews
使用多层感知器对不 balancer 数据集进行分类
我在分类问题上遇到了麻烦 . 我有两个标签训练数据中有近40万个向量,我想训练MLP将数据分为两类 . 但是,数据集是如此不 balancer . 95%的人有标签1,其他人有标签0.准确性随着训练的进展而增加,并在达到95%后停止 . 我想这是因为网络预测所有向量的标签为1 . 到目前为止,我尝试删除0.5个概率的图层 . 但是,结果是一样的 . 有没有办法提高准确性? -
1 votesanswersviews
是否可以使用STATEFUL Recurrent NN(LSTM)进行分类
我有一个数据集 C 50,000 (二进制)样本 128 每个 . 类标签也是二进制 1 或 -1 . 例如,样本看起来像这样 [1,0,0,0,1,0, .... , 0,1] [-1] . 我的目标是根据二进制类(即1或-1)对样本进行分类 . 我想尝试使用Recurrent LSTM 来生成一个好的分类模型 . 为此,我使用 Keras 库编写了以下代码: tr_C, ts_C, ... -
1 votesanswersviews
Keras二进制图像分类器即使使用训练集也会返回1个类
我目前正在使用带有Python的keras构建二进制图像分类器 . 数据均匀分配,用于训练和测试 . 我一直有问题,准确率为50%,这意味着它在训练期间猜测一个 class . 我介绍了渐变剪辑,带动量的BatchNormalization和Leaky Relu来解决一些问题 . 有了这些,我得到了一个具有高训练精度(领域为95%)和低损失(大约0.05)的分类器 . val_acc通常比训练精... -
1 votesanswersviews
计算朴素贝叶斯分类中的概率
我有一个由分类和连续属性组成的数据集 . 我想应用Naive Bayes分类方法对数据进行分类 . 如何计算这两种类型的概率? 我应该使用计数方法计算分类数据并假设一些分布并根据连续数据进行计算吗? -
7 votesanswersviews
多项式朴素贝叶斯参数alpha设置? scikit学习
在进行朴素贝叶斯分类时,有没有人知道如何设置alpha的参数? 例如 . 我首先使用了一堆词来构建特征矩阵,矩阵的每个单元都是单词的计数,然后我使用tf(术语频率)对矩阵进行归一化 . 但是当我使用朴素贝叶斯构建分类器模型时,我选择使用多项式N.B(我认为这是正确的,而不是伯努利和高斯) . 默认的alpha设置是1.0(文档说拉普拉斯平滑,我不知道是什么) . 结果非常糟糕,只有21%的人回想起... -
4 votesanswersviews
二进制Crossentropy惩罚单热矢量的所有分量
我知道二元交叉熵与两类的分类交叉熵相同 . 此外,我很清楚softmax是什么 .因此,我看到分类交叉熵只会惩罚应该为1的一个分量(概率) . 但是为什么,不能或不应该在单热矢量上使用二进制交叉熵? Normal Case for 1-Label-Multiclass-Mutual-exclusivity-classification: ################ pred ... -
0 votesanswersviews
使用LIBSVM进行分类的准确率为100% - 可能出现什么问题?
我正在 Build 一个使用LIBSVM对恶性乳腺肿瘤进行分类的模型 . 这是我遵循的算法: 使用向后消除功能选择 . 使用网格搜索计算每组要素的C和gamma . 使用10倍交叉验证得出最佳的C和gamma . 使用上述步骤,找到最佳功能子集和最大精度 . 问题是我使用LIBSVM在80:20数据集上获得100%的准确率 . 我没有排除任何功能,我不是在训练和测试相同的数据 ... -
11 votesanswersviews
文本[多级]具有多个输出的分类
Problem Statement: 将文本文档分类到它所属的类别,并将类别最多分为两个级别 . Sample Training Set: Description Category Level1 Level2 The gun shooting that happened in Vegas killed two Crime | High Crime High Donald Tru...