使用语言分析器 | Elasticsearch: 权威指南 | Elastic
2025-10-24
Elasticsearch 的内置分析器都是全局可用的,不需要提前配置, 它们也可以在字段映射中直接指定在某字段上:
PUT /my_index
{
  "mappings": {
    "blog": {
      "properties": {
        "title": {
          "type":     "string",
          "analyzer": "english"  }
      }
    }
  }
}
        }
      }
    }
  }
}当然,文本经过
 english 分析处理,我们会丢失源数据:
我们无法分辨源文档中是包含单数 fox 还是复数 foxes ;单词 not 因为是停用词所以被移除了,
所以我们无法分辨源文档中是happy about foxes还是not happy about foxes,虽然通过使用 english
(英语)分析器,使得匹配规则更加宽松,我们也因此提高了召回率,但却降低了精准匹配文档的能力。
为了获得两方面的优势,我们可以使用multifields(多字段)对 title 字段建立两次索引:
一次使用
 `english`(英语)分析器,另一次使用 `standard`(标准)分析器:
PUT /my_index
{
  "mappings": {
    "blog": {
      "properties": {
        "title": {  "type": "string",
          "fields": {
            "english": {
          "type": "string",
          "fields": {
            "english": {  "type":     "string",
              "analyzer": "english"
            }
          }
        }
      }
    }
  }
}
              "type":     "string",
              "analyzer": "english"
            }
          }
        }
      }
    }
  }
}替换为该字段映射后,我们可以索引一些测试文档来展示怎么在搜索时使用两个字段:
PUT /my_index/blog/1
{ "title": "I'm happy for this fox" }
PUT /my_index/blog/2
{ "title": "I'm not happy about my fox problem" }
GET /_search
{
  "query": {
    "multi_match": {
      "type":     "most_fields",  "query":    "not happy foxes",
      "fields": [ "title", "title.english" ]
    }
  }
}
      "query":    "not happy foxes",
      "fields": [ "title", "title.english" ]
    }
  }
}| 
使用 | 
感谢 title.english 字段的切词,无论我们的文档中是否含有单词 foxes 都会被搜索到,第二份文档的相关性排行要比第一份高,
因为在 title 字段中匹配到了单词 not 。
官方地址:https://www.elastic.co/guide/cn/elasticsearch/guide/current/using-language-analyzers.html