首页 文章
  • -2 votes
     answers
     views

    如何处理客户商店推荐问题

    3个文件:用户配置文件,商店配置文件,事务历史记录 . 我有100k客户的用户档案(年龄,性别,地点,工资,忠诚度积分等)和35家商店的店铺简介(地点,收入,每天销售等) . 此外,交易集(cust_id,store_id,location,revenue,item_cout等)包含客户在任何商店进行的所有购买(550k交易) . 一些新的商店被打开,商店简介被给出(类似于其他35个商店),没有交...
  • 5 votes
     answers
     views

    (穷人的)产品推荐实施

    我正在尝试为网上商店 Build 一个穷人的推荐系统 . 我想要意识到那种亚马逊“买了这个项目的顾客也买了”的功能,我读了很多关于它的内容 . 我知道有Apache Mahout的事情,但我无法以这种方式调整服务器 . 然后会有谷歌预测API,但它需要花钱,所以我开始尝试自己 . 我得到了250.000项的orderhistory,我写了一个嵌套的MySQL查询来查找包含当前文章的订单,对其他订单...
  • -2 votes
     answers
     views

    机器学习工作推荐人

    我是机器学习的新手,目前正在尝试 Build 一个职业推荐系统 . 我想知道是否有任何可用的职位空缺数据集 . 谢谢
  • -1 votes
     answers
     views

    协同过滤方法,提供与注册课程相关的提示/建议

    我正在寻找一个特定的问题,我需要 Build 一个推荐人 . 广义问题如下,每个用户都注册了(比方说)x课程(c1,c2,c3,.. cx)根据每个课程,我需要向用户提供(比如说)前5个提示/建议(例如学习可能有用的材料等)我需要应用协作元素来了解哪些推荐对用户有用 .我查看了像Apache Mahout Taste这样的推荐引擎,但是我无法以一种看起来像示例的方式来模拟我的问题 . (用户与一...
  • 21 votes
     answers
     views

    使用机器学习来重复数据

    我有以下问题,并认为我可以使用机器学习但我不完全确定它将适用于我的用例 . 我有一个大约一亿条记录的数据集,其中包含客户数据,包括姓名,地址,电子邮件,电话等,并希望找到一种方法来清理这些客户数据并识别数据集中可能存在的重复数据 . 大多数数据都是使用没有验证的外部系统手动输入的,因此很多客户在我们的数据库中最终得到了多个配置文件,有时每条记录中都有不同的数据 . 对于实例我们可能为客户John ...
  • 5 votes
     answers
     views

    实施无监督学习推荐系统

    我一直在研究有关推荐系统的文章和书籍以及建议它们建议的方法 . 在其中许多人中,Netflix比赛就是一个例子 . 在Netflix用户评价电影(从1到5) . 在该竞赛中,竞争者被给予用户的电影和相应评级的数据库,并且他们应该实现最能预测电影评级的系统,并且使用该评级将向用户推荐电影 . 对于评估,他们建议使用使用预测和实际评级作为参数的度量进行交叉验证 . 使用用户的历史记录和他对电影的评分来...
  • 7 votes
     answers
     views

    Apache Spark ALS建议方法

    尝试使用Spark MLLib的ALS构建推荐系统 . 目前,我们正在尝试每天为所有用户预建建议 . 我们使用简单的隐式反馈和ALS . 问题是,我们有20M用户和30M产品,并且要调用主要的predict()方法,我们需要为用户和产品进行笛卡尔连接,这太大了,并且可能需要几天才能生成连接 . 有没有办法避免笛卡尔联合使流程更快? 目前我们有8个带64Gb RAM的节点,我认为它应该足够用于数据 ...
  • 1 votes
     answers
     views

    冷启动的推荐方法和算法

    我们正在寻找为我们全新的学习管理系统构建推荐系统 . 有一大堆用户和项目(学习模块)已经上架,但还没有评级 - 典型的冷启动问题 . 首先,我们考虑使用项目属性(标签,类别等)使用简单的基于项目的相似性 . 当收视率开始进入时,我们的想法是切换到更强大的协同过滤 . 问题: 这是一个好方法吗?是否有推荐的ML模式来处理这种冷启动条件? 实现基于项目的相似性,这是正确的算法?比方说,余弦相似...
  • 0 votes
     answers
     views

    Sytem没有评级数据的建议

    我正在试图弄清楚如何解决客户给我的任务 . 客户是将书籍分发到最终商店(书店)的公司 . 它想知道它可以通过哪种方式向其销售部门提供服务,从假设我们可以识别出与其销售的客户相似的商店集群,然后在子市场需求中类似 . 推荐系统所依赖的数据是关于单本书的特征(作者,流派,出版日期等)的数据以及商店向公司做出的过去书籍订单的历史数据 . 有了这些数据,是否可以设置推荐系统?如果是,我应该使用哪种方法? ...
  • 1 votes
     answers
     views

    用于创建协作过滤产品推荐的矩阵的方法

    我正在探索python中的推荐系统,到目前为止,我已经使用KNN模型来推荐具有'users like you also purchased...'方法的品牌 . 我的数据表每个客户都有一行,每个品牌都有一列,填充 1 或 0 表示客户是否购买了该品牌 . 我现在想把这个推向产品级别的建议,但是很难看出这种方法如何扩展 . 我尝试了相同的方法,但无法使用足够大的查询来查询我的数据库(BigQuery...
  • 1 votes
     answers
     views

    推荐火柴盒

    我读到了Matchbox推荐器,但我不明白该模型是否以及如何能够逐步考虑我的反馈 . 我的意思是,我可以创建我的模型并通过Web服务使用它,但如果我对其他项目进行评级,我的模型会根据我的新费率实时更新吗? 问候 安德里亚
  • 0 votes
     answers
     views

    Azure机器学习建议

    我正在尝试使用Azure ML创建推荐服务,更具体地说是使用Train Matchbox推荐器和Score Matchbox推荐器 . 基本上,我想要做的是用户过去购买的,而不是推荐其他人购买的商品 . 在上图中,实验配置为推荐来自评级项目的项目,然后评估推荐者评估结果 . 在每一步中我都将数据保存到sqlserver中,这样我就可以自己检查结果并查看它是否有效 . 上面我们在第一个数据集中有...
  • 1 votes
     answers
     views

    使用R了解产品推荐的SNA分析

    如果这个问题没有得到很好的解释,请道歉 . 我正在试验我的新手R技能,以分析SNA来自SNAP的电子商务数据 . 我获得了产品共同购买信息的大数据集 . 除了其他交易详细信息(其中包含有关产品的推荐详细信息)之外,该数据集还包含#FromNode和#ToNode信息的详细信息 . 我希望测试一些网络参数的数据,如紧密度中心性,中介性,自我中心性,密度等 . 以下是我在数据集上尝试的第一个代码,我对...
  • 0 votes
     answers
     views

    是否有声誉系统旨在根据相对排名提供绝对分数?

    (Meta:不确定这个问题是否适合StackOverflow,它有一个AI /统计倾斜 . 随意推荐哪个StackExchange站点更合适 . ) 许多声誉系统,如eBay,Slashdot,AirBnB和StackOverflow,都是基于用户的努力获得的积极和消极评价的基础 . 在这些情况下,用户基于好/坏信号投票给其他人,例如投票或投票 . 在大多数情况下,这是绝对评级:答案是有帮助的,或...
  • 12 votes
     answers
     views

    从API获取Google Analytics“访客流”数据

    我跟踪用户点击的次数,例如,从第A页到第B页 . 目前我可以使用 previousPagePath = '/A' 和 nextPagePath = '/B' 衡量Google Analytics上的 A -> B 过渡,但我真正想回答的问题是,"Of all the visits to the site that included viewing page A, how many ...
  • 2 votes
     answers
     views

    基于主题的推荐系统的用户配置文件

    我正在尝试提出一个基于主题的推荐系统来向用户推荐相关的文本文档 . 我在维基百科语料库上使用gensim训练了一个潜在的语义索引模型 . 这使我可以轻松地将文档转换为LSI主题分发 . 我现在的想法是以同样的方式代表用户 . 然而,当然,用户具有观看文章的历史以及文章的评级 . 所以我的问题是:如何代表用户? 我的想法如下:将用户表示为所有查看文档的聚合 . 但如何考虑评级? 有任何想法吗? 谢谢...
  • 0 votes
     answers
     views

    如何使用基于许多功能的Azure ML构建电影推荐系统?

    Azure ML Studio上的Train Matchbox推荐模型需要三元组用户项评级,例如电影客户的评级 . 但事实上,我需要使用用户或项目的许多功能来推荐电影不仅评级 . 那么如何使用许多功能在Azure ML上构建推荐系统?
  • 1 votes
     answers
     views

    如何使用增量SVD推荐系统创建建议书

    我正在测试一个根据Simon Funk算法构建的推荐系统 . (由Timely Dev撰写.http://www.timelydevelopment.com/demos/NetflixPrize.aspx) 问题是,所有增量SVD算法都试图预测user_id和movie_id的评级 . 但在实际系统中,这应该为活动用户生成一个新项目列表 . 我看到有些人在增量SVD之后使用了kNN,但是如果我不...
  • 0 votes
     answers
     views

    如何向已购买N件商品的用户推荐K类似商品?

    假设用户从我的网站购买了n个项目;我需要一个算法或方法(使用Mahout可能?怎么样?)这样我就可以向用户推荐类似的k项 . 我没有用户评分 . k推荐需要基于用户的购买历史(他的n项) . 这些项目有“名称”,“作者”,“关键字”字段,例如,我需要推荐最相似的项目 . 如果我添加用户评级会怎么样?我该如何考虑到这一点? 我已经阅读了Mahout文档,但似乎总是需要某种评级 . 我如何提供评级,...
  • 4 votes
     answers
     views

    在Mahout中实现SVD推荐器

    我有一个包含5000万用户偏好的数据集,其中包含800万个不同的用户和180K个不同的产品 . 我目前正在使用布尔数据模型,并且具有基本的基于tanimoto相似性的推荐器 . 我正在尝试探索不同的算法以获得更好的建议,并开始使用带有ALSWR因子分解器的SVD . 我使用mahout中提供的基本SVD推荐器如下 . DataModel dataModel = new FileDataModel(...
  • 6 votes
     answers
     views

    Spark - 如何在 生产环境 中使用经过培训的推荐模型?

    我正在使用Spark来构建推荐系统原型 . 经过一些教程后,我能够从我的数据中训练 MatrixFactorizationModel . 然而,Spark mllib训练的模型只是一个 Serializable . 如何使用此模型为真实用户推荐?我的意思是,如果用户数据增加,我怎样才能将模型保存到某种数据库中或更新它? 例如,由Mahout推荐库训练的模型可以存储到像Redis这样的数据库中,...
  • 0 votes
     answers
     views

    建议书服务是否允许使用新数据丰富现有模型?

    我们能够提供初始培训模型并征求建议 . 在询问建议时,我们可以提供新的使用事件 . 这些是否一直存在于模型中?他们根本操纵模型吗? 有没有其他方式可以更新数据,还是每次我们想要丰富模型时我们是否需要重新训练新模型? https://azure.microsoft.com/en-us/services/cognitive-services/recommendations/ 编辑:我们正在尝试使用&q...
  • 1 votes
     answers
     views

    如何评价svd类似物品?

    对于像为用户推荐项目这样的任务,我可以将数据集拆分为两个:训练和测试数据集,我可以使用平均绝对误差来评估结果 . 但是,当我需要找到项目的类似项目时,我不知道如何评估结果 . 例如, 输入: userid,itemid,score 1, 123, 5 2, 222, 1 .... svd.similar(123) 输出可能是:(222,0...
  • 3 votes
     answers
     views

    如何处理推荐系统的新数据?

    这里's a theoretical question. Let'假设我已经实现了两种类型的协同过滤:基于用户的CF和基于项目的CF(以Slope One的形式) . 我有一个很好的数据集可以运行这些算法 . 但后来我想做两件事: 我想为数据集添加新的评级 . 我想编辑一个现有的评级 . 我的算法应如何处理这些变化(不做大量不必要的工作)?任何人都可以帮助我吗?
  • 0 votes
     answers
     views

    推荐系统 - 将交易计数转换为星级

    我正在对推荐系统进行一些探索性工作,并且一直在阅读涉及基于用户,基于项目和SVD算法的协同过滤技术 . 我也在尝试R的推荐器包 . 文献中的一个明显假设是用户数据基于评定量表标记了项目,例如,介于1至5星之间 . 我正在研究用户数据没有评级但只是交易的问题 . 例如,如果我想向用户推荐餐馆,我所拥有的唯一数据就是他访问其他餐馆的频率 . 如何将这些“交易”计数转换为可以由期望固定规模评级的推荐算法...
  • 1 votes
     answers
     views

    矩阵分解新用户

    有人可以为我的用例指导我使用Python库(或其他语言的纸质或源代码)吗?这就是我有大量关于用户的数据以及大约100个对象的“分数” . 我将对这些数据运行矩阵分解,并将其分解为两个潜在因子矩阵 . 我想有一个推荐网站,用户(我可以得到他们的数据)被推荐给我的系统认为他们想要的对象 . 例如 . X的分数为10,Y的分数为20,但根据我们当前的矩阵和新用户的数据,我的系统期望他得到20分为x和2...
  • 2 votes
     answers
     views

    基于用户和基于项目的过滤器之间的决策

    我正在研究一种算法,以便为您可以查看餐馆的平台生成建议 . 因此,数据库存在3个表,“用户”,“餐馆”和“评论” . 评论的评分为1-5 . 每个餐厅都可以有多个评论,用户可以有多个评论 . 评论只能有1个用户和1个餐厅 . First I'll explain my current research/conclusions 我已经实现了大部分基于用户的系统,但我遇到了一些产生推荐的问题 . 首先...
  • 1 votes
     answers
     views

    基于项目的协作过滤器的最小数据量

    我正在研究推荐引擎,它使用基于项目的协作过滤器为餐馆创建推荐 . 每间餐厅的评论都是1-5分 .每个推荐算法都会遇到数据稀疏性问题,所以我一直在寻找计算正确相关性的解决方案 . 我在餐馆之间使用调整后的余弦相似度 . 如果要计算餐馆之间的相似度,则需要对两家餐馆进行评级的用户 . 但是,对两家餐馆进行评分以获得正确相关性的最低用户是多少? 通过测试,我发现一组对两家餐馆进行评级的用户都会导致相似性...
  • 3 votes
     answers
     views

    生成推荐引擎的测试集

    我正在研究基于隐式反馈的推荐引擎 . 我正在使用此链接:http://insightdatascience.com/blog/explicit_matrix_factorization.html#movielens 这使用ALS(交替最小二乘)来计算用户和项目向量 . 因为,我的数据集不能按时间划分 . 我随机从用户那里获取'x'个评级并将它们放入测试集中 . 这是我的训练用户项矩阵的可重现示例 ...
  • 0 votes
     answers
     views

    如何推荐推荐系统的不 balancer 数据集

    PLS . 告诉我如何推荐推荐系统的不 balancer 数据集 . 根据我的知识,需要为每个用户创建培训和测试文件,并将其评级作为类标签 . 例如:假设用户分别给出了 Item1 , Item4 和 Item3 rating 5 ,5和1,我们希望预测他的评级 Item6 对于 user1 ,训练数据将是: User1_F1,User1_F2,......................It...

热门问题