Solr 是Apache下的一个顶级开源项目,采取Java开拓,它是基于Lucene的全文搜索做事器。

Solr供应了比Lucene更为丰富的查询措辞,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。

phpsolr扩展无法生效Solr82入门 Python

Solr可以独立运行,运行在Jetty、Tomcat等这些Servlet容器中,Solr 索引的实现方法很大略,用 POST 方法向 Solr 做事器发送一个描述 Field 及其内容的 XML 文档,Solr根据xml文档添加、删除、更新索引 。

Solr 搜索只须要发送 HTTP GET 要求,然后对 Solr 返回Xml、json等格式的查询结果进行解析,组织页面布局。
Solr不供应构建UI的功能,Solr供应了一个管理界面,通过管理界面可以查询Solr的配置和运行情形。

2.Solr与Lucene的差异:

Lucene是一个开放源代码的全文检索引擎工具包,它不是一个完全的全文检索引擎,Lucene供应了完全的查询引擎和索引引擎,目的是为软件开拓职员供应一个大略易用的工具包,以方便的在目标系统中实现全文检索的功能,或者以Lucene为根本构建全文检索引擎。

Solr的目标是打造一款企业级的搜索引擎系统,它是一个搜索引擎做事,可以独立运行,通过Solr可以非常快速的构建企业的搜索引擎,通过Solr也可以高效的完成站内搜索功能。

3. Solr的安装与配置

3.1 Solr的下载

从Solr官方网站(http://lucene.apache.org/solr/ )下载Solr8.2.0,根据Solr的运行环境,Linux下须要下载Solr-8.2.0.tgz,windows下须要下载Solr-8.2.0.zip。

3.2.Solr的文件构造

bin:solr的运行脚本

contrib:solr的一些软件/插件,用于增强solr的功能。

dist:该目录包含jar文件,以及干系的依赖文件。

docs:solr的API文档

example:solr工程的例子目录:

licenses:solr干系的一些容许信息

Server:solr的核心,可以算作是一个数据库里面有多个实例

3.3.Solr运行

Solr8.2.0哀求jdk利用1.8以上,Solr默认供应Jetty

进入solr-8.2.0\bin目录下利用cmd打开命令行。

启动命令:solr start

启动完成,默认端口8983

关闭命令:solr stop -all

3.4.后台页面

3.4.1访问后台页面

访问路径:localhost:8983/solr

3.4.2管理界面

3.4.3 Dashboard

仪表盘,显示了该Solr实例开始启动运行的韶光、版本、系统资源、jvm等信息。

3.4.4 Logging

Solr运行日志信息

3.4.5 Cloud

Cloud即SolrCloud,即Solr云(集群),当利用Solr Cloud模式运行时会显示此菜单,如下图是Solr Cloud的管理界面:

3.4.6 Core Admin

Solr Core的管理界面。
Solr Core 是Solr的一个独立运行实例单位,它可以对外供应索引和搜索做事,一个Solr工程可以运行多个SolrCore(Solr实例),一个Core对应一个索引目录。

3.4.7 java properties

Solr在JVM 运行环境中的属性信息,包括类路径、文件编码、jvm内存设置等信息。

3.4.8 Tread Dump

显示Solr Server中当前生动线程信息,同时也可以跟踪线程运行栈信息。

3.4.9 Core selector

选择一个SolrCore进行详细操作,如下:

个中my_db,my_news 为可以选择的库。

3.4.10 Analysis

通过此界面可以测试索引剖析器和搜索剖析器的实行情形。

3.4.11 Dataimport

可以定义数据导入处理器,从关系数据库将数据导入 到Solr索引库中。

3.4.12 Document

通过此菜单可以创建索引、更新索引、删除索引等操作,界面如下:

/update表示更新索引,solr默认根据id(唯一约束)域来更新Document的内容,如果根据id值搜索不到id域则会实行添加操作,如果找到则更新。

3.4.13 Query

通过/select实行搜索索引,必须指定“q”查询条件方可搜索。

4.库的创建与域的认识

4.1创建核心

第一步:在solr-8.2.0\server\solr文件夹下面创建核心名称作为文件夹,测试名称为my_db,可以理解为新建一个库

第二步:将solr-8.2.0\server\solr\configsets\_default下面的conf文件夹拷贝到solr-8.2.0\server\solr\my_db目录下,这是关于库所需的核心配置文件如下图

第三步:访问管理界面,选择Core Admin创建核心,右侧name和instanceDir输入名称和核心文件夹保持同等

4.2 创建表与字段

点击Add Field 添加my_title,类型为string

5.集成IK分词器

第一步:先下载solr对应版本的ik分词器,下载地址:

https://search.maven.org/search?q=com.github.magese

第二步:将下载好的jar包放入solr-8.2.0/server/solr-webapp/webapp/WEB-INF/lib目录中

第三步:将jar包目录下的5个配置文件(IKAnalyzer.cfg.xml、 ext.dic、 stopword.dic、 ik.conf、 dynamicdic.txt

)放入solr做事的Jetty或Tomcat的 solr-8.2.0\server\solr-webapp\webapp\WEB-INF\classes目录下;(如果无classes新建一个)

第四步:solr-8.2.0\server\solr\my_db\conf目录中打开managed-schema文件,增加如下代码

<!-- ik分词器 -->

<fieldType name=\"大众text_ik\"大众 class=\"大众solr.TextField\"大众>

<analyzer type=\"大众index\"大众>

<tokenizer class=\"大众org.wltea.analyzer.lucene.IKTokenizerFactory\"大众 useSmart=\"大众false\"大众 conf=\"大众ik.conf\"大众/>

<filter class=\公众solr.LowerCaseFilterFactory\公众/>

</analyzer>

<analyzer type=\"大众query\"大众>

<tokenizer class=\"大众org.wltea.analyzer.lucene.IKTokenizerFactory\"大众 useSmart=\"大众true\公众 conf=\公众ik.conf\"大众/>

<filter class=\"大众solr.LowerCaseFilterFactory\"大众/>

</analyzer>

</fieldType>

第五步(选择性配置):IKAnalyzer.cfg.xml是配置扩展词库的配置文件,可以指定分词构造

如果有多个词典用;隔开。

6.导入数据库中的数据

第一步:将\solr-8.2.0\example\example-DIH\solr\db下的文件拷贝到solr-8.2.0\server\solr\my_db中

第二步:拷贝jar包,包括数据库的驱动包和solr的依赖包

拷贝到solr-8.2.0\server\solr-webapp\webapp\WEB-INF\lib中

以及数据的驱动包须要和当前安装的数据库版本匹配须要自行去网高下载。

第三步:配置solr-8.2.0\server\solr\my_news\conf\db-data-config.xml文件

<dataConfig>

<dataSource type=\"大众JdbcDataSource\公众

driver=\公众com.mysql.jdbc.Driver\"大众

url=\"大众jdbc:mysql://localhost:3306/test\"大众

user=\"大众root\公众

password=\"大众admin\公众/>

<document>

<entity name=\"大众tnews\"大众 query=\"大众SELECT id,product_name,sale_price FROM product\公众>

<field column=\"大众id\"大众 name=\"大众id\公众/>

<field column=\"大众product_name\公众 name=\公众my_title\"大众/>

<field column=\"大众sale_price\"大众 name=\"大众my_content\"大众/>

</entity>

</document>

</dataConfig>

既数据库的链接信息和sql语句,以及把对应的数据导入到哪一个域里面。

第四步:管理界面更新索引库

7.浏览器界面实现数据的增编削查

7.1添加/更新文档

7.2删除文档

删除索引格式如下:

1) 删除制订ID的索引 <delete>

<id>8</id>

</delete>

2) 删除查询到的索引数据

<delete>

<query>my_title:诙谐杂货</query>

</delete>

3) 删除所有索引数据

<delete>

<query>:</query>

</delete>

7.3查询索引

通过/select搜索索引,Solr制订一些参数完身分歧需求的搜索:

1、q - 查询字符串,必须的,如果查询所有利用:。

2、fq - (filter query)过虑查询,浸染:在q查询符合结果中同时是fq查询符合的,

例如::

过滤查询价格从1到20的记录。

也可以在“q”查询条件中利用product_price:[1 TO 20],如下:

也可以利用“”表示无限,例如:

20以上:product_price:[20 TO ]

20以下:product_price:[ TO 20]

3、sort - 排序,格式:sort=<field name>+<desc|asc>[,<field name>+<desc|asc>]… 。

示例:

按价格降序

4、start - 分页显示利用,开始记录下标,从0开始

5、rows - 指定返回结果最多有多少条记录,合营start来实现分页。

显示前10条。

6、fl - 指定返回那些字段内容,用逗号或空格分隔多个。

显示商品图片、商品名称、商品价格

7、df-指定一个搜索Field

8、wt - (writer type)指定输出格式,可以有 xml, json, php, phps, 后面 solr 1.3增加的,要用关照我们,由于默认没有打开。

9、hl 是否高亮 ,设置高亮Field,设置格式前缀和后缀。

8.利用Java代码实现数据的增编削查(solrJ)

8.1 什么是solrJ

solrj是访问Solr做事的java客户端,供应索引和搜索的要求方法,SolrJ常日在嵌入在业务系统中,通过SolrJ的API接口操作Solr做事,如下图:

8.2依赖jar包

8.3 添加文档

实现步骤

第一步:创建一个java工程

第二步:导入jar包。
包括solrJ的jar包。

第三步:和Solr做事器建立连接。
HttpSolrServer工具建立连接。

第四步:创建一个SolrInputDocument工具,然后添加域。

第五步:将SolrInputDocument添加到索引库。

第六步:提交。

代码实现

//向索引库中添加索引

@Test

public void addDocument() throws Exception {

//和solr做事器创建连接

//参数:solr做事器的地址

SolrClient solrServer = new HttpSolrClient.Builder(\公众http://localhost:8983/solr/my_db\"大众).build();

//创建一个文档工具

SolrInputDocument document = new SolrInputDocument();

//向文档中添加域

//第一个参数:域的名称,域的名称必须是在schema.xml中定义的

//第二个参数:域的值

document.addField(\公众id\"大众, \公众c0001\"大众);

document.addField(\"大众title_ik\"大众, \"大众利用solrJ添加的文档\"大众);

document.addField(\"大众content_ik\公众, \"大众文档的内容\公众);

document.addField(\"大众product_name\"大众, \"大众商品名称\"大众);

//把document工具添加到索引库中

solrServer.add(document);

//提交修正

solrServer.commit();

}

8.4 删除文档

8.4.1 根据id删除

//删除文档,根据id删除

@Test

public void deleteDocumentByid() throws Exception {

//创建连接

SolrClient solrServer = new HttpSolrClient.Builder(\公众http://localhost:8983/solr/my_db\"大众).build();

//根据id删除文档

solrServer.deleteById(\公众c0001\"大众);

//提交修正

solrServer.commit();

}

8.4.2根据查询删除

查询语法完备支持Lucene的查询语法。

//根据查询条件删除文档

@Test

public void deleteDocumentByQuery() throws Exception {

//创建连接

SolrClient solrServer = new HttpSolrClient.Builder(\"大众http://localhost:8983/solr/my_db\"大众).build();

//根据查询条件删除文档

solrServer.deleteByQuery(\"大众:\"大众);

//提交修正

solrServer.commit();

}

8.5 修正文档

在solrJ中修正没有对应的update方法,只有add方法,只须要添加一条新的文档,和被修正的文档id同等就,可以修正了。
实质上便是先删除后添加。

8.6 查询文档

8.6.1大略查询

//查询索引

@Test

public void queryIndex() throws Exception {

//创建连接

SolrClient solrServer = new HttpSolrClient.Builder(\"大众http://localhost:8983/solr/my_db\"大众).build();

//创建一个query工具

SolrQuery query = new SolrQuery();

//设置查询条件

query.setQuery(\"大众:\"大众);

//实行查询

QueryResponse queryResponse = solrServer.query(query);

//取查询结果

SolrDocumentList solrDocumentList = queryResponse.getResults();

//共查询到商品数量

System.out.println(\"大众共查询到商品数量:\"大众 + solrDocumentList.getNumFound());

//遍历查询的结果

for (SolrDocument solrDocument : solrDocumentList) {

System.out.println(solrDocument.get(\"大众id\公众));

System.out.println(solrDocument.get(\公众product_name\"大众));

System.out.println(solrDocument.get(\公众product_price\"大众));

System.out.println(solrDocument.get(\"大众product_catalog_name\"大众));

System.out.println(solrDocument.get(\"大众product_picture\"大众));

}

}

8.6.2 繁芜查询

个中包含查询、过滤、分页、排序、高亮显示等处理。

//繁芜查询索引

@Test

public void queryIndex2() throws Exception {

//创建连接

SolrClient solrServer = new HttpSolrClient.Builder(\公众http://localhost:8983/solr/my_db\公众).build();

//创建一个query工具

SolrQuery query = new SolrQuery();

//设置查询条件

query.setQuery(\"大众钻石\"大众);

//过滤条件

query.setFilterQueries(\公众product_catalog_name:诙谐杂货\公众);

//排序条件

query.setSort(\"大众product_price\"大众, ORDER.asc);

//分页处理

query.setStart(0);

query.setRows(10);

//结果中域的列表

query.setFields(\公众id\"大众,\"大众product_name\公众,\"大众product_price\公众,\"大众product_catalog_name\公众,\"大众product_picture\公众);

//设置默认搜索域

query.set(\公众df\"大众, \公众product_keywords\公众);

//高亮显示

query.setHighlight(true);

//高亮显示的域

query.addHighlightField(\公众product_name\公众);

//高亮显示的前缀

query.setHighlightSimplePre(\"大众<em>\公众);

//高亮显示的后缀

query.setHighlightSimplePost(\"大众</em>\"大众);

//实行查询

QueryResponse queryResponse = solrServer.query(query);

//取查询结果

SolrDocumentList solrDocumentList = queryResponse.getResults();

//共查询到商品数量

System.out.println(\"大众共查询到商品数量:\"大众 + solrDocumentList.getNumFound());

//遍历查询的结果

for (SolrDocument solrDocument : solrDocumentList) {

System.out.println(solrDocument.get(\"大众id\"大众));

//取高亮显示

String productName = \"大众\公众;

Map<String, Map<String, List<String>>> highlighting = queryResponse.getHighlighting();

List<String> list = highlighting.get(solrDocument.get(\公众id\"大众)).get(\公众product_name\公众);

//判断是否有高亮内容

if (null != list) {

productName = list.get(0);

} else {

productName = (String) solrDocument.get(\"大众product_name\"大众);

}

System.out.println(productName);

System.out.println(solrDocument.get(\"大众product_price\"大众));

System.out.println(solrDocument.get(\"大众product_catalog_name\"大众));

System.out.println(solrDocument.get(\"大众product_picture\"大众));

}

}