谢谢老师,解释的非常详细,我们现在是第二种情况,看了segments确实发现很多segments上面的docs.deleted比其他node上面的要大很多,加起来确实会多比其他节点很多。
另外在这里还想在多问一个问题,我们集群现在机器有两种类型,master节点和data节点(每台机器还额外有一个ingest的role),对于我们这样的集群来说,哪些节点充当协调节点的角色?是每个数据节点都是协调节点吗。另外我们现在搜索的性能瓶颈在于query and fetch阶段的fetch阶段,因为索引每个document比较大,获取数据的时候需要反序列化(指es内部),性能比较差(尽管我们对一些用了store_field的方式),这种情况是否可以通过使某些机器只作为协调节点来优化呢?