博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
solr4.10.2 + tomcat6.0.44搭建
阅读量:6892 次
发布时间:2019-06-27

本文共 2707 字,大约阅读时间需要 9 分钟。

hot3.png

源码:链接: 密码:isa8

搭建完成后目录结构

 solr
     home
           solr
                bin
                collection1
                data
                ...
      server
           apache-tomcat-6.0.44
      webapp
           solr
                WEB-INF
                ...

1、将solr-4.10.2\example\webapps\solr.war拷贝到solr\webapp后解压

2、将solr-4.10.2\example\solr拷贝到solr\home目录下
3、将apache-tomcat-6.0.44拷贝到solr\server目录下
4、新建solr/home/solr/data文件夹,修改文件solr\home\solr\collection1\conf\solrconfig.xml
<dataDir>${solr.data.dir:D:\...\solrSpace\solr\home\solr\data}</dataDir>
 
5、新建apache-tomcat-6.0.44\conf\Catalina\localhost\solr.xml文件5
<?xml version="1.0" encoding="UTF-8"?>
<Context path="/solr" docBase="D:/boke/technology/lucene/solrSpace/solr/webapp/solr" reloadable="false">
 <Environment name="solr/home" type="java.lang.String" value="D:/boke/technology/lucene/solrSpace/solr/home/solr" override="true" /> 
</Context>

6、启动报错,修改tomcat配置,利用log4j输出详细日志信息,见博文:

7、将solr-4.10.4\example\lib\ext下的jar包,全部拷贝到solrSpace\solr\webapp\solr\WEB-INF\lib下。

加入IK分词器:

下载IKAnalyzer2012FF_u1.jar,将IKAnalyzer2012FF_u1.jar拷贝到solrSpace\solr\webapp\solr\WEB-INF\lib,

在schema.xml加入以下配置:

<!-- IKAnalyzer2012FF_u1 add by huangchm -->

    <fieldType name="text_ik" class="solr.TextField">
       <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
       <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>

加入停用词和搜狗词库:

拷贝IKAnalyzer.cfg.xml、stopword.dic、sougou.dic到solrSpace\solr\webapp\solr\WEB-INF\classes目录下,修改IKAnalyzer.cfg.xml,修改如下:

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE properties SYSTEM ""> 
<properties> 
 <comment>IK Analyzer 扩展配置</comment>
 <!--用户可以在这里配置自己的扩展字典  --> <entry key="ext_dict">sougou.dic;</entry> 
 <!--用户可以在这里配置自己的扩展停止词字典-->
 <entry key="ext_stopwords">stopword.dic;</entry>
 
</properties>

加入mmseg中文分词器  注意,solr4.8版本以上需要mmseg1.9以上才行,solr4.8之后需要1.7的jdk

 添加jar包到lib中,solr\webapp\solr\WEB-INF\lib
  technology\lucene\maven\mmseg4j-1.9.1\dist\mmseg4j-analysis-1.9.1.jar、mmseg4j-core-1.9.1.jar、mmseg4j-solr-1.9.1.jar
 修改solr\home\solr\collection1\conf\schema.xml文件,加入fieldType
  <!-- add by huangchm 添加mmseg4j分词器-->
  <!-- dicPath 指定词库位置(每个MMSegTokenizerFactory可以指定不同的目录,当是相对目录时,是相对 solr.home 的目录) -->
   <fieldType name="textComplex" class="solr.TextField" >
   <analyzer>
            <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
        </analyzer>
     </fieldType>
   <fieldType name="textMaxWord" class="solr.TextField" >
         <analyzer>
            <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic"/>
         </analyzer>
     </fieldType>
   <fieldType name="textSimple" class="solr.TextField" >
         <analyzer>
            <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic"/>
         </analyzer>
     </fieldType>

转载于:https://my.oschina.net/sniperLi/blog/465571

你可能感兴趣的文章
video 全屏时 隐藏controls
查看>>
python input() 与raw_input()
查看>>
mysql数据库 --表查询
查看>>
Python中xlrd常用用法整理
查看>>
如何上传本地音乐获取MP3外链(欢迎分享和转载)
查看>>
@vue/cl构建得项目下,postcss.config.js配置,将px转化成rem
查看>>
搭建gitlab本地服务
查看>>
day02
查看>>
SpringBoot慕课学习-SpringBoot开发常用技术整合-资源文件属性配置
查看>>
命令导入证书
查看>>
Django-CBV
查看>>
NativeWindow_01
查看>>
【Flutter学习】基本组件之图片组件Image
查看>>
(转)工作之路---记录LZ如何在两年半的时间内升为PM
查看>>
CoreAnimation
查看>>
JS基础属性跟运算
查看>>
通过类创建子线程&同步锁
查看>>
编程珠玑:单词频率最高选取
查看>>
几乎所有编程语言的hello, world程序(3)
查看>>
CentOs 设置静态IP 方法
查看>>