laravel开发简书搭建 elasticsearch 进行中文搜索的时候,你会发现,按照视频和 这篇文章: http://www.imooc.com/article/22449 的es:init 搭建完成并且使用 scout:import 导入数据之后,一篇文章包含“爱情”这个中文单词,但是我们搜索的时候,按照“爱” 进行搜索可以搜索出来,但是按照“爱情”搜索却搜索出来条数为0。
这里的原因并不是由于我们的分词错误。按照 http://www.imooc.com/article/22449 这篇文章的表示,我们的分词选择器使用的是 ik_max_word ,可以参考https://github.com/medcl/elasticsearch-analysis-ik 的说明,ik-max-word 会把文本按照字典切割出最多的单词。
问题是出在我们的查询上,我们跟踪
`$posts = \App\Post::search($query)->paginate(2);`
的源码,最终在vendor/tamayo/laravel-scout-elastic/src/ElasticsearchEngine.php 的里面可以看到
这里的query使用的是*{$builder->query}* 换句话说,如果我们搜索“爱情”的时候,它实际是搜索“*爱情*”。这个在中文分词插件ik中就会把带星号的词汇当作单词来进行搜索了(这个scout包这么写的原因也是因为没有考虑到文本分词)。
所以解决办法,把这里的星号给去掉。
就可以进行单词搜索了。
Laravel最新特性结合Mysql异步消息队列、ElasticSearch搜索引擎、Debugbar调试利器开发简书
了解课程