Elasticsearch:Analyzer 在 Python 中的运用


本站和网页 https://www.dgrt.cn/news/show-5175383.html?action=onClick 的作者无关,不对其内容负责。快照谨为网络故障时之索引,不代表被搜索网站的即时页面。

Elasticsearch:Analyzer 在 Python 中的运用
学习资讯
当前位置:首页>news>正文Elasticsearch:Analyzer 在 Python 中的运用news来源:原创2023/3/21 17:19:02在今天的文章中,我来介绍如何在 Python 中使用 Analyzer。有关 Analyzer 的文章,请参考 “Elastic:菜鸟上手指南” 中的 “中文分词器介绍” 部分介绍。
安装
我们首先来安装 Elasticsearch 及 Kibana。你可以参考 “Elastic:菜鸟上手指南” 中的文章来安装 Elasticsearch 及 Kibana。你可以参考文章 “Elasticsearch:IK 中文分词器” 来安装 IK 中文分词器。千万要记得安装分词器后,要重新启动 Elasticsearch。
我们可以参考文章 “Elasticsearch:使用 Jupyter Notebook 创建 Python 应用导入 CSV 文件” 来设置自己的 Python 及 Jupyter 环境。
展示
我们首先创建一个叫做 analyzer 的 notebook。我们输入如下的代码:
try:from elasticsearch import Elasticsearch print("All Modules Loaded ! ")
except Exception as e:print("Some Modules are Missing {}".format(e))
关于 Elasticsearch 自带的 analyzer 的描述可以在官方文档 Built-in analyzer reference | Elasticsearch Guide [master] | Elastic
我们接下来创建和 Elasticsearch 的连接:
def connect_elasticsearch():es = Nonees = Elasticsearch([{'host': 'localhost', 'port': 9200}])if es.ping():print('Yupiee Connected ')else:print('Awww it could not connect!')return es
es = connect_elasticsearch()
es.ping()
我们尝试各种 built-in 的 analyzer:
analyzers = {"standard", "simple", "whitespace", "stop", "keyword", "pattern", "fingerprint"}
for analyzer in analyzers:res = es.indices.analyze(body={"analyzer": analyzer,"text": "This is exactly what I want"})print("======", analyzer, "=======")for i in res['tokens']:print(i['token'])print("\n")
我们来试一下中文的分词器:
es.indices.analyze(body= {"analyzer": "ik_smart","text": "我爱北京天安门"
})
试一下 standard 分词器:
es.indices.analyze(body= {"analyzer": "standard","text": "This is most wonderful career in my life"
})
body = {"settings": {"number_of_shards": 1,"number_of_replicas": 0},"mappings": {"properties": {"text": {"type": "text","fields": {"english": { "type": "text","analyzer": "whitespace"}}}} }
# create index
es.indices.create(index="my_index", ignore=400, body=body)
 在上面,我们创建一个索引。我们接下来使用索引中的 analyzer:
res = es.indices.analyze(index="my_index", body = {"field": "text.whitespace","text": "The quick Brown Foxes ."
})
for i in res['tokens']:print(i['token'])
查看全文本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.dgrt.cn/news/show-5175383.html
如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!
相关文章:安卓版kawaks街机模拟器,C8,V3,V8手柄冲突解决方案,物理改键kawaks_5.2.7.apk 做得很好
美中不足,相同类型的手柄,键值会冲突,导致4个人没法玩
本人通过更改手柄模式,成功试出了4种不冲突的组合模式 (鸿蒙3) 准备工作:C8手柄*2V3手柄*2,我们要调出以下组合 Xbox Wireless Controller V3: R1 Home
Wireless Controller V3: B Home …...编程日记2023/4/4 16:42:38通达信批量接口如何做到量化股票精选?通达信批量接口如何做到量化股票精选呢?基于这个问题,其实就是利用量化软件的通达信批量接口进行量化分析,然后通过AkShare获取股票基数据,进行基本面数据分析,慢慢将量化股票精选出来。比如说一些财务数据&#xff0c…...编程日记2023/4/4 16:41:56设计模式PDF下载了4.0万本!那,再肝一本《Java面经手册》吧!作者:小傅哥 博客:https://bugstack.cn 沉淀、分享、成长,让自己和他人都能有所收获!😄 一、前言
1. 先祝贺下自己拿下4.0万本下载量! 《重学Java设计模式》PDF,我的第二本电子书,截…...编程日记2023/4/4 16:40:422023年Java面经在家呆了半年多了,终于终于找到合适的开发工作了,这里记录一下,并分享我的经历。 我是22年7月毕业,二本物流管理专业。因为兴趣从大四开始学习Java。幸运的是当时计算机学院一位老师的工作室在招前端,我就主动去问了问…...编程日记2023/4/4 16:40:37南京小米java面经(一面)目录1.java支持多继承吗2.线程的生命周期3.线程和进程的区别4.单例模式有几种5.写一下双重锁的单例6.jvm有哪些区域7.jvm哪些区域是线程共享的,哪些是线程私有的8.gc中判断对象可回收的方式有哪些9.gc垃圾回收算法有哪些10.哪些对象可以作为gc root11.gc中的引用计数…...编程日记2023/4/4 16:40:35面经 | Java 基础 整理文章目录Java 基础一、整体观/理论/概念JDK和JRE的区别Java 为什么可以一次编写、到处运行?java运行快吗 是编译还是解释型语言什么是APIimport java 和javax的区别重写和重载的区别面向对象和面向过程的区别面向对象的三大特性: 封装 继承 多态向上/向下转型都有常…...编程日记2023/4/4 16:40:3123届秋/春招最新面经答案总结(Java基础、数据库、JVM、计网、计操、集合、多线程、Spring)持续更新答案有任何不懂欢迎进群询问群主,再次加深知识,热烈欢迎这些提问的小伙伴!!群里有22届秋招招聘汇总信息!
一、引言(秉持开源的想法) 经过残酷的春招实习面试,自己从中也从牛客和各个大神那些收集了很多面经…...编程日记2023/4/4 16:40:29双面打印技巧1、首先在打印对话框里输入的页面起始范围,要求一个是奇数一个是偶数,这样才能保证总页数是偶数
2、选择双面打印
3、根据首页的奇偶性决定相反的打印顺序,如果第一张的页码是奇数,就先打印偶数页,第一张的页码是偶数…...编程日记2023/4/4 16:39:53【有限元分析】ANSYS 接触设置介绍接触面与目标面选择原则 如凸面可能与一个平面或者凹面接触,则平面或者 凹面为目标单元,凸面为接触单元(弹性小球落地) 如两个面的网格疏密程度不同,则较密的网格应为接触面,较粗的网格为目标面&#xff0…...编程日记2023/4/4 16:39:37JSP 语法入门目录
JSP注释
语法格式:
运行效果:
脚本程序
语法格式:
示例:
运行效果:
JSP声明
语法格式:
示例:
JSP表达式
语法格式:
示例:
运行效果: JSP注…...编程日记2023/4/4 16:39:14安卓版kawaks街机模拟器,C8,V3,V8手柄冲突解决方案,物理改键kawaks_5.2.7.apk 做得很好
美中不足,相同类型的手柄,键值会冲突,导致4个人没法玩
本人通过更改手柄模式,成功试出了4种不冲突的组合模式 (鸿蒙3) 准备工作:C8手柄*2V3手柄*2,我们要调出以下组合 Xbox Wireless Controller V3: R1 Home
Wireless Controller V3: B Home …...编程日记2023/4/4 16:42:38通达信批量接口如何做到量化股票精选?通达信批量接口如何做到量化股票精选呢?基于这个问题,其实就是利用量化软件的通达信批量接口进行量化分析,然后通过AkShare获取股票基数据,进行基本面数据分析,慢慢将量化股票精选出来。比如说一些财务数据&#xff0c…...编程日记2023/4/4 16:41:56设计模式PDF下载了4.0万本!那,再肝一本《Java面经手册》吧!作者:小傅哥 博客:https://bugstack.cn 沉淀、分享、成长,让自己和他人都能有所收获!😄 一、前言
1. 先祝贺下自己拿下4.0万本下载量! 《重学Java设计模式》PDF,我的第二本电子书,截…...编程日记2023/4/4 16:40:422023年Java面经在家呆了半年多了,终于终于找到合适的开发工作了,这里记录一下,并分享我的经历。 我是22年7月毕业,二本物流管理专业。因为兴趣从大四开始学习Java。幸运的是当时计算机学院一位老师的工作室在招前端,我就主动去问了问…...编程日记2023/4/4 16:40:37南京小米java面经(一面)目录1.java支持多继承吗2.线程的生命周期3.线程和进程的区别4.单例模式有几种5.写一下双重锁的单例6.jvm有哪些区域7.jvm哪些区域是线程共享的,哪些是线程私有的8.gc中判断对象可回收的方式有哪些9.gc垃圾回收算法有哪些10.哪些对象可以作为gc root11.gc中的引用计数…...编程日记2023/4/4 16:40:35面经 | Java 基础 整理文章目录Java 基础一、整体观/理论/概念JDK和JRE的区别Java 为什么可以一次编写、到处运行?java运行快吗 是编译还是解释型语言什么是APIimport java 和javax的区别重写和重载的区别面向对象和面向过程的区别面向对象的三大特性: 封装 继承 多态向上/向下转型都有常…...编程日记2023/4/4 16:40:3123届秋/春招最新面经答案总结(Java基础、数据库、JVM、计网、计操、集合、多线程、Spring)持续更新答案有任何不懂欢迎进群询问群主,再次加深知识,热烈欢迎这些提问的小伙伴!!群里有22届秋招招聘汇总信息!
一、引言(秉持开源的想法) 经过残酷的春招实习面试,自己从中也从牛客和各个大神那些收集了很多面经…...编程日记2023/4/4 16:40:29双面打印技巧1、首先在打印对话框里输入的页面起始范围,要求一个是奇数一个是偶数,这样才能保证总页数是偶数
2、选择双面打印
3、根据首页的奇偶性决定相反的打印顺序,如果第一张的页码是奇数,就先打印偶数页,第一张的页码是偶数…...编程日记2023/4/4 16:39:53【有限元分析】ANSYS 接触设置介绍接触面与目标面选择原则 如凸面可能与一个平面或者凹面接触,则平面或者 凹面为目标单元,凸面为接触单元(弹性小球落地) 如两个面的网格疏密程度不同,则较密的网格应为接触面,较粗的网格为目标面&#xff0…...编程日记2023/4/4 16:39:37JSP 语法入门目录
JSP注释
语法格式:
运行效果:
脚本程序
语法格式:
示例:
运行效果:
JSP声明
语法格式:
示例:
JSP表达式
语法格式:
示例:
运行效果: JSP注…...编程日记2023/4/4 16:39:14一条大河网介绍商务合作免责声明CopyRight 一条大河网版权所有