免费注册
帮助文档(华北一、二)
  • ● 自定义分词词库操作

    通过在 IK 配置文件中提到的如下配置:

     <?xml version="1.0" encoding="UTF-8"?> 
    <!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"> 
    <properties>     
      <comment>IK Analyzer 扩展配置</comment>     
      <!--用户可以在这里配置自己的扩展字典 -->     
      <entry 
    key="ext_dict">custom/mydict.dic;custom/single_word_low_freq.dic</entry>     
      <!--用户可以在这里配置自己的扩展停止词字典-->     
      <entry key="ext_stopwords">custom/ext_stopword.dic</entry>     
      <!--用户可以在这里配置远程扩展字典 -->     
      <entry key="remote_ext_dict">location</entry>     
      <!--用户可以在这里配置远程扩展停止词字典-->     
      <entry key="remote_ext_stopwords">http://xxx.com/xxx.dic</entry>  
    </properties>

    IK分词支持本地自定义词库,并且支持远程热更新词库,ES服务通过 词库信息保存在特定索引中 来完成自定义词库的更新。下面给出在 Kibana 中的具体操作流程,其中 API 要保持完全一致

    ● 本地扩展字典

     
    PUT /custom_ik/analyzer/1 
    {   
      "ext_dict": [
      
    }

    示例:

     

    PUT /custom_ik/analyzer/1

    {

      "ext_dict": [

        "中华人民共和国",

        "美利坚合众国",

        "大不列颠和北爱尔兰联合王国"

      ]

    }

    ● 本地扩展停止词字典

     
    PUT /custom_ik/analyzer/2 
    {   
      "ext_stopwords": [   
      ] 
    }

    示例:

     
    PUT /custom_ik/analyzer/2 
    {   
      "ext_stopwords": [     
        "中华人民共和国",     
        "美利坚合众国",     
        "大不列颠和北爱尔兰联合王国"   
      ] 
    }

    ● 远程扩展字典

     
    PUT /custom_ik/analyzer/3  
    {   
     "remote_ext_dict": "" 
    }

    示例:

     
    PUT /custom_ik/analyzer/3  
    {   
      "remote_ext_dict": "http://localhost:8080/my_dict.dic" 
    }

    ● 远程扩展停止词字典

     
    PUT /custom_ik/analyzer/4  
    {   
      "remote_ext_stopwords": "" 
    }

    示例:

     
    PUT /custom_ik/analyzer/4 
    {   
      "remote_ext_stopwords": "http://localhost:8080/my_stopwords.dic" 
    }

    检测索引数据是否成功:

     
    GET /custom_ik/analyzer/1 
    GET /custom_ik/analyzer/2 
    GET /custom_ik/analyzer/3 
    GET /custom_ik/analyzer/4

    最后还需一步 ,到控制台点击需要更新的分词词库项完成配置文件的更新。


文档是否已解决您的问题?

  已解决   未解决

如您有其它疑问,您也可以与我们技术专家联系探讨。

联系技术专家