推广 热搜:   公司  快速  企业  中国  设备    上海  行业  未来 

SOLR查询匹配关键词的方式

   日期:2024-10-31     移动:http://keant.xrbh.cn/quote/10379.html

如果在字段后直接写关键词,solr对条件关键词分词后,各分词之间按照OR的关系进行匹配

SOLR查询匹配关键词的方式

如果查询条件关键词用半角双引号括叫起来,则分词间用AND关系进行匹配

尽管使用双引号括起来,分词间可以按照与的关系进行查询,但是有一种情况是,分词后,有些词会被停用词过滤掉,从而只剩下有效词,这样也会造成匹配过多的情况,解决办法是:将整个条件词,配置到自定义词库中,这样就不会被分词,可以按照整改词进行匹配。或者配置SOLR不过滤停用词,配置如下

编辑文件

${SOLR_HOME}serversolr ew_coreconfmanaged-schema

找到需要查询的fieldType,去掉solr.StopFilterFactory的配置,如下:

<fieldType name="text_hanlp" class="solr.TextField" >
    <analyzer type="index">
         <tokenizer class="com.hankcs.lucene.HanLPTokenizerFactory"  enableIndexMode="true"/>
         <!--<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true"/>-->
    </analyzer>
    <analyzer type="query">
        <tokenizer class="com.hankcs.lucene.HanLPTokenizerFactory" enableIndexMode="false"/>
        <!--<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true"/>-->
    </analyzer>
</fieldType>

将solr.StopFilterFactory注释掉,重启solr,并且,文档必须重新索引的才能生效,之前索引的不能生效了。

 

另外,solr的分词词典配置在:{SOLR_HOME}server esources下,以hanlp为例:此目录下放置hanlp.properties,在hanlp.properties中,指定自定义词典,停用词词典等,如:

本文地址:http://lianchengexpo.xrbh.cn/quote/10379.html    迅博思语资讯 http://lianchengexpo.xrbh.cn/ , 查看更多

特别提示:本信息由相关企业自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


相关行业动态
推荐行业动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  粤ICP备2023022329号