谈到搜索引擎,可能大家最先想到的是Elasicsearch。Elasticsearch是一个分布式、高扩展、高实时的搜索与数据分析引擎,能够在大量的数据中搜索、分析和探索需要的数据。在后端架构中,Elasticsearch通常需要与Logstash的数据收集和日志解析引擎Kibana一起配合来搭建可视化平台,而这三个产品也被设计成一个集成解决方案,称为ELK。
虽然Elasticsearch足够灵活强大、扩展性和实时性也较好。但是对于中小型项目来说,Elasticsearch还是显得有些庞大,对硬件设备的要求也较高。那么,在要求不是很高的情况下,我们可以考虑另一种搜索引擎方案:MeiliSearch。
MeiliSearch是一个功能强大、快速、开源、易于使用和部署的搜索引擎,并且MeiliSearch的搜索和索引都是高度可定制的,提供开箱即用的功能属性,如错字容忍、过滤器和同义词。而最重要的一点是,它【支持中文搜索】,而不需要添加额外的配置。
MeiliSearch使用RUST语言进行编写 ,RUST语音最重要的特点就是并发安全,同时它还是支持函数式和命令式以及泛型等编程范式的多范式语言。并且在性能方面,MeiliSearch也是媲美C++语音的存在,所以使用RUST语音编写的MeiliSearch搜索引擎,可以说在性能上也是非常的优秀。
MeiliSearch的安装方式有很多,支持Homebrew、Docker 容器、二进制、以及RUST 环境下克隆项目源码方式进行安装。
由于我使用的是MacOS,所以直接使用的是Homebrew方式,安装的命令如下:
启动成功后,系统会允许一个 MeiLiSearch 服务 (opens new window)。
同时,MeiLiSearch服务自身提供可视化的 Web 搜索页面,我们可以访问一下这个页面来验证服务是否运行成功。
由于还没有创建索引和文档,所以上面的页面是没有数据的。MeiliSearch的数据部署和ES十分相似,但又要简单许多。一般需要经历【添加索引】和【添加文档】两步。
2.2.1 添加索引
首先,我们使用简单的 CURL 创建索引。
执行成功后,如下图所示。
2.2.2 添加文档
索引是存储文档的地方,文档代表的是真正的数据,我们同样使用CURL批量创建文档。
涉及的movies.json为测试数据,下载链接:movies.json。为了方便上传数据,我们使用PostMan等工具来添加数据,上传成功系统会返回一个Json的结果,如下图。
需要说明的是,Body部分由于使用的是二进制方式,所以需要选择binary按钮。当我们再次刷新浏览器,就会发现数据已经搜索出来。
可以看到,由于数据并不是很多,所以搜索出来也是很快的。
使用Python方式部署需要先安装Elasicsearch插件,安装的命令如下。
然后,再调用add_documents方法新增文档。
接着,我们可以使用search方法搜索数据,比如:
当然,除了上面介绍的两种部署方式,MeiliSearch 还提供PHP、JAVA、Python 等语言的 SDK,直接直接集成到项目,开箱即用。
总的来说,对于数据量不是很大的中小型企业来说(几百万到几千万的数据),都可以使用 MeiliSearch 搜索引擎。同时,它的使用场景基本可以覆盖当前主流的平台和技术,如管理后台搜索、小程序搜索等场景中。是一款真正轻量级安装部署、搜索速度快到极致,名副其实的轻量级且美丽搜索引擎。
官网文档链接:https://docs.meilisearch.com/