首页 文章
  • 0 votes
     answers
     views

    在 GraphDB 的 Lucene 连接器中使用 wild-cards

    我正在使用 GraphDB 的Lucene 连接器。我在我的三元组商店中为实体代码构建索引my_index,我想使用这样的索引进行子字符串匹配。 例. 实体代码: FooBar FooBaz BazFoo Lucene 连接器: PREFIX :<http://www.ontotext.com/connectors/lucene#> PREFIX inst:<http://ww...
  • 0 votes
     answers
     views

    如何在 GraphDB 全文搜索中创建自定义 AnalyzerFactory?

    (使用 GraphDB 8.1 免费)。 http://graphdb.ontotext.com/documentation/free/full-text-search.html表示我可以通过实现接口com.ontotext.trree.plugin.lucene.AnalyzerFactory,使用luc:analyzer param 为 GraphDB full-text 搜索启用自定义 An...
  • 85 votes
     answers
     views

    lucene 如何索引文件?

    我读了一些关于 Lucene 的文件;我也在这个链接(http://lucene.sourceforge.net/talks/pisa)中阅读了该文件。 我真的不明白 Lucene 如何索引文档并且不了解 Lucene 用于索引的算法? 在上面的链接中,它表示 Lucene 使用此算法进行索引: 增量算法: 维护一堆段索引 为每个传入文档创建索引 将新索引推入堆栈 让 b=...
  • 0 votes
     answers
     views

    lucene 指数匹配

    我正在尝试使用 Lucene 进行 undup 或重复数据删除匹配。基本上我有一个记录文件,我希望根据某些字段(模糊搜索)进行分组,并使用匹配键获取结果,该匹配键告诉我该文件中的哪些记录彼此匹配。 这可能吗?
  • 3 votes
     answers
     views

    Lucene:为现有索引添加方面

    关于如何为已经存在的 Lucene 索引添加 facet,我有点难过。 我有一个使用 Lucene 3.1 创建的 Lucene 索引(没有任何方面创建)。 我已经查看了 Lucene 文档的 facet,并在那里向他们展示了如何从头开始创建一个带有 facet 的索引,i.e。你创建一个新的 Lucene Document对象,使用分类工具向它添加构面信息(类别),然后在 Lucene 索引中编...
  • 0 votes
     answers
     views

    如何在 Lucene 索引中映射不同的 URL 对并查询这些 URL?

    如何将 URL 映射添加到 Lucene 并读取它们? 存储如:url1 - url2。如果你发送查询url1 get url2。我使用PhraseQuery,TermQuery和FuzzyQuery但无法获得结果。 例如: http://www.w3.org/2004/02/skos/core#山 - http://www.w3.org/2004/02/skos/core#EVERST
  • 0 votes
     answers
     views

    使用 GraphDB 的 Lucene 连接器时,如何直接访问 Lucene 而不是通过 SPARQL?

    我一直在使用 GraphDB 的Lucene 连接器作为通过 SPARQL 查询对大量数据执行 full-text 搜索的方法。我得到了一个例子 working.1除了通过 SPARQL 之外,还有另一种方法可以获得 read/write Lucene 的数据吗?对于许多大型文档,我担心通过 SPARQL 加载它们可能效率低下,而不是直接在 Lucene 中进行某种批量加载。 有没有办法更直接地访...
  • 678 votes
     answers
     views

    Solr与ElasticSearch

    这些技术之间的核心架构差异是什么? 另外,哪些用例通常更适合每种用例?
  • 1 votes
     answers
     views

    pyLucene安装

    我在Ubuntu 10.04,Python 2.6.5上并且在安装pyLucene时遇到了一些麻烦 . 这是我到目前为止所做的,安装这些包 - sudo apt-get install ant sudo apt-get install sun-java6-jdk sudo update-java-alternatives -s java-1.5.0-sun sudo apt-get install...
  • 5 votes
     answers
     views

    在Ubuntu 10.04上安装PyLucene 3.0.3

    我正在尝试在Ubuntu 10.04上安装PyLucene 3.0.3 . 事实证明这具有相当大的挑战性,但到目前为止,我已经: 修补了setuptools以允许按照PyLucene文档中的指示构建JCC . 通过以下方式建造JCC:cd pylucene-3.0.3-1 / jcc; python setup.py构建 通过ant构建Lucene 3.0.3,并将jar安装到/usr...
  • 0 votes
     answers
     views

    在Linux上安装PyLucene 6.5.0的问题

    我最近搬到了python3,所以我正在尝试安装最新版本的Pylucene(版本6.5.0),它与python3兼容 . jcc3/sources/jcc.cpp: In function ‘PyObject* t_jccenv_strhash(PyObject*, PyObject*)’: jcc3/sources/jcc.cpp:214:27: error: expected ‘)’ befor...
  • 1 votes
     answers
     views

    Solr索引mysql和搜索

    我想索引我的数据库表 . 如果我在浏览器中运行: http://localhost:8983/solr/dataimport?command=full-import 它返回: <response> <lst name="responseHeader"> <int name="status">0&lt...
  • 0 votes
     answers
     views

    数据未在ajax solr中编入索引

    我使用solr从我的本地MYSQL DB索引我的数据 . data-config.xml包含我的实体信息,如下所示: <entity name="distinctWeeksVolumeEntity" dataSource="mysqlLocal" rootEntity="false" query="select wee...
  • 1 votes
     answers
     views

    使用Solr faceting和pivoting以及日志文件数据查询时间分析

    我正在使用Solr进行一些分析,特别是使用faceting和pivot功能来处理大量日志文件 . 我有一个大型日志文件,我已经在Solr中索引了 . Keyword Visits log_date_ISO 1 red 1,938 2013-01-01 2 blue 435 2013-02-01 3 green 318 2013-04-01 ...
  • 1 votes
     answers
     views

    Solr:当查询包含特定术语时应用分面

    我有一个按名称,类型,制造商等索引的产品信息数据库 . 用户经常提交搜索查询,其结果将整齐地包含在一个或多个方面 . 出现这种情况时,我希望Solr解析查询并应用相关方面 . 例如,搜索 shoes 应该返回 shoe 类别中的结果 . 更加雄心勃勃,搜索 plaid shirt 应查询 shirt 类别中的项目 plaid . 是否可以配置Solr来执行此操作? 提前致谢 .
  • 398 votes
     answers
     views

    ElasticSearch,Sphinx,Lucene,Solr,Xapian . 哪种适合哪种用途? [关闭]

    我目前正在寻找其他搜索方法,而不是有一个巨大的SQL查询 . 我最近看到elasticsearch并使用了whoosh(搜索引擎的Python实现) . 你能说出你选择的理由吗?
  • 0 votes
     answers
     views

    Solr中的易失性数据

    我有一个文档索引,分布在几个分片和副本上 . 大小是ca. 40密耳,我希望它会增长 Problem :用户向这些文档添加信息,这些文档经常更改 . 他们需要将其集成到搜索语法中,例如 funny and cool and cat:interesting . cat将是易失性数据集 据我所知,Solr和Lucene都不支持“真正的更新”,这意味着我必须重新索引整套更改的文档 . 因此,我需要将...
  • 0 votes
     answers
     views

    SolrCloud模式下的Apache Solr 6.6.2,不适用于新副本

    我已经在2个不同的系统上安装了Apache Solr 6.6.2,我必须以 Cloud 模式运行Solr,这是我成功完成的 . 现在我想用2个副本创建一个分片 . 为此我运行了以下命令 bin/solr create -c myCollection -d use_configs -n conf1 -replicationFactor 2 在上面的命令执行时,只有一个节点是实时的,因此它创建一个r...
  • 6 votes
     answers
     views

    Elasticsearch基于事件的衰减分数

    我正试图找到一种方法来防止多个帖子出现在来自同一作者的搜索结果中 . 到目前为止,我已经尝试过随机评分,这让我可以保持分页 . 但是,在10个结果的给定页面中,我仍然可以拥有多达4个相同的作者 . 有没有办法根据结果集中某个字段出现的次数对文档进行评分?据我所知,你不能在评分脚本中保留变量或对象 . 我已经研究了几种实现这一目标的方法,但其中很多都有不少缺点 . 例如删除重复项,然后再次调用以检索...
  • 0 votes
     answers
     views

    在solr中逐行索引表

    我是 Solr 的新手,我试图在solr中索引大约1M的推文,以便能够在之后搜索它们 我在 MYSQL 数据库中有这些推文我知道如何索引Solr中的单独文件,但实际上我不能将推文分成1M文件 所以我问是否有办法在solr中逐行索引sql表 我试过的东西: 在Solr中索引单独的xml文件 我知道它可以从DataImportHandler处理,但很少与教程混淆
  • 192 votes
     answers
     views

    选择一个独立的全文搜索服务器:Sphinx还是SOLR? [关闭]

    我正在寻找具有以下属性的独立全文搜索服务器: 必须作为独立服务器运行,可以为多个客户端提供搜索请求 必须能够通过索引SQL查询的结果来执行"bulk indexing":比如"SELECT id, text_to_index FROM documents;" 必须是免费软件,必须在使用MySQL作为数据库的Linux上运行 必须快(排除MyS...
  • 18 votes
     answers
     views

    更新SOLR索引的特定字段

    我想使用solr搜索文章 我有3个表: 组(id,组名) ArticleBase(id,groupId,其他一些字段) 文章(id,articleBaseId,title,date,...) 在solr schema.xml文件中我只定义与ArticleBase表混合的所有文章字段(在solr上使用一个索引),如下所示:(id,articleBaseId,groupId,...) ...
  • 262 votes
     answers
     views

    NoSQL(MongoDB)与Lucene(或Solr)作为您的数据库

    随着基于文档的数据库的NoSQL运动的增长,我最近看了MongoDB . 我注意到与如何将项目视为“文档”有惊人的相似之处,就像Lucene(和Solr的用户)一样 . 所以,问题是: Why would you want to use NoSQL (MongoDB, Cassandra, CouchDB, etc) over Lucene (or Solr) as your "data...
  • 0 votes
     answers
     views

    如何定期删除弹性搜索索引?

    我每天都创建索引来存储搜索历史记录,我在我的applciation中使用这些索引来建议,这也有助于我根据历史记录进行建议 . 现在我必须保持最近10天的历史 . 那么Elastic搜索中是否有任何功能允许我定期创建和删除索引?
  • 1 votes
     answers
     views

    ELK / Lucene - 在没有其他活动的情况下选择活动

    我在AWS中有一个Lambda函数,它将日志报告给ELK实例 . 每次调用lambda函数都会生成一个与每个日志事件一起发送的唯一 invocation_id ,因此可以在ELK中识别来自单个调用的事件 . 在操作结束时,我发送一个"Done"事件 . Lambda函数可能会失败或超时,然后不会发送“完成”事件 . 我想创建一个查询来显示所有没有“完成”事件的调用 . SQL...
  • 1 votes
     answers
     views

    查询lucene搜索结果

    我有一个包含以下字段的新闻存储( Headers ,正文,新闻日期)我需要一个符合以下条件的最佳查询 1) Headers 更重要但不到日期2)日期应与当前日期进行比较,如果文件的日期接近当前日期则更有 Value (注意:这并不意味着在新闻日期排序下降导致可能导致其 Headers 及其正文的结果更相关,但它更旧)这只是搜索的另一个因素,我认为它需要自定义排序3)身体已排在第三位 有解决方案吗
  • 2 votes
     answers
     views

    2013年最佳Lucene搜索平台:Solr还是ElasticSearch? [关闭]

    我运行了一个工作板(PostJobFree.com),里面有大约1M个简历 . 平均恢复大小约为4000字节 . PostJobFree使用ASP.NET / C#/ SQL Server 2008 R2和MS SQL全文搜索 . 通过阅读各种文章,我相信切换到Apache Lucene搜索会使搜索更快,更具可扩展性 . 但我还没试过 . Question 1 :在大约1M的文档标记处从MS S...
  • 1 votes
     answers
     views

    是否有可能在lucene中搜索缺少字段的文档?

    我的数据如下所示 . X1, X2, X3 1, 1, 0 0, 0, 1 如果你注意到,有3列:X1,X2和X3 . 这些列中每一列的值仅为1或0.此数据中的每一行都希望被索引为lucene Document,并且每行的每列希望被索引为lucene字段 . 实际上,我拥有的列数超过100,000 . 此外,这些数据非常稀少;意思是,绝大多数的值都是零 . 当我尝试将每一行索引为Docu...
  • 0 votes
     answers
     views

    Maven依赖版本冲突:Elasticsearch和Lucene

    我的应用程序使用Elasticsearch的传输客户端连接到 ES 1.7.2 集群 . 根据documentation,它使用Lucene 4.10.4,所以下面是我的应用程序中的依赖版本: Elasticsearch : 1.7.2 Lucene : 4.10.4 现在,我想使用基于lucene的库(here)来执行内存渗透 . 查看 pom.xml ,它似乎使用Lucene 6.3.0库 ...
  • 0 votes
     answers
     views

    弹性搜索索引映射更新

    我使用的是ES-2.4.0索引json:{ "_id": 1, "name": "Longsword", "description": "The Longsword can be wielded in one or two hands", "category": "Sh...

热门问题