博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
ELK学习总结(1-3)倒排索引
阅读量:4348 次
发布时间:2019-06-07

本文共 338 字,大约阅读时间需要 1 分钟。

1、倒排索引(反向索引)

     一种索引方法,用来存储在全文检索下某个单词在一个/组文档中的存储位置。

     常规索引,文档->关键词,费时,得把一个文档全部遍历一遍

     倒排索引,关键词->文档,全文搜索过程如下:

     1、构建单词集合:

                先对文档进行分词,

                然后筛选过滤,

                得到单词集合,并编号id

                

           2、构建文档集合:文档id

 

           3、建立单词、文档矩阵, 得出倒排索引,如:

                乔布斯:{(文档1,<位置3,位置11>),2次}, {(文档2,<位置7>),1},{(文档3,<位置9>),1}

                苹果:{(文档1,<位置16>),1次},  {(文档5,<1>),1次}  

 

 

 

      

转载于:https://www.cnblogs.com/lexiaofei/p/6575977.html

你可能感兴趣的文章
IOS内存管理
查看>>
[Bzoj1009][HNOI2008]GT考试(动态规划)
查看>>
Blob(二进制)、byte[]、long、date之间的类型转换
查看>>
OO第一次总结博客
查看>>
day7
查看>>
iphone移动端踩坑
查看>>
vs无法加载项目
查看>>
Beanutils基本用法
查看>>
玉伯的一道课后题题解(关于 IEEE 754 双精度浮点型精度损失)
查看>>
《BI那点儿事》数据流转换——百分比抽样、行抽样
查看>>
哈希(1) hash的基本知识回顾
查看>>
dockerfile_nginx+PHP+mongo数据库_完美搭建
查看>>
Http协议的学习
查看>>
WebSocket & websockets
查看>>
openssl 升级
查看>>
ASP.NET MVC:通过 FileResult 向 浏览器 发送文件
查看>>
CVE-2010-2883Adobe Reader和Acrobat CoolType.dll栈缓冲区溢出漏洞分析
查看>>
使用正确的姿势跨域
查看>>
AccountManager教程
查看>>
Android学习笔记(十一)——从意图返回结果
查看>>