Lucene 3

2022/10/20 TIL

루씬 인 액션 필수 확장 기능, 루씬을 포팅한 엔진, 라이브러리에 대한 소개, 성능 튜닝과 관련된 부분에 대해서 읽었다. 필수 확장 기능에서 기억에 남는 내용은 스팬 쿼리의 경우 성능이 좋지 않기 때문에(아마 토큰의 위치정보들을 훑어봐야하기 때문에, 도큐먼트 내부를 까보는 비용이 적지 않을 것 같다는 생각이다.) 쿼리 필터를 통해서 미리 검색 대상을 줄여두고 사용하는 것을 잊지 말아야한다는 내용이 기억에 남았다. 그리고 GeoCode 관련된 내용도 나왔다. 예전에 Firebase에서 제공해주는 FireStore에서 GeoHash를 사용했는데, 그때는 구글이 이런 알고리즘을 구상했구나 했는데, 그전에 이미 있었다는 것을 알게 되었다. 그리고 루씬을 포팅한 라이브러리 Clucene, dotLucene등에 대..

TIL 2022.10.21

2022/10/11 TIL

요새 취준이 삶에 끼어들면서 라이프사이클이 조금씩 어긋나고 있다. 다시 다잡아보고자 책읽기를 다시 라이프사이클에 넣어서 생활하려고 한다. 수영도 빠지지 말아야지. 이 글을 보고있는 미래의 내가 지금보다는 나은 고민을 하면 좋을 것 같다. k8s korea group online 오늘 밋업을 처음 들어가봤는데, 도커 컴포즈에서 RKE2로 마이그레이션한 이야기를 들을 수 있었다. 왜 RKE2로 옮기게 되었는지, 어떤 방식으로 운영하는지 같은 부분에 대해서 공유를 해주셔서 유의미한 시간을 보낼 수 있었다. 어서 쿠버네티스를 더 공부해서 위드유에서도 최종 발표전에 적용을 해볼 수 있으면 좋을 것 같다. Lucene Index Reader and Index Writer 루씬 인 액션을 이어서 읽고 있다. 오늘은 ..

TIL 2022.10.12

루씬이란?

이 글은 루씬에 대한 소개글입니다. 안녕하세요 정우현입니다. 오늘은 엘라스틱 서치의 본체라고 할 수 있는 루씬에 대해서 소개하려고 합니다. 그 과정에서 아래와 같이 세 가지 내용을 다룰 생각입니다. 왜 루씬이 엘라스틱의 본체라고 이야기하는지 루씬에서 인덱싱은 어떻게 이뤄지는지 검색을 하는 방식은 어떻게 되는지 루씬이 사실 본체다 저는 엘라스틱 서치가 루씬을 베이스로 만든 검색엔진이라고 했을때 루씬이 어떤 역할인지 몰랐습니다. "엘라스틱 서치 내부에서 루씬이 가벼운 역할을 하나보다" 이정도로만 생각했습니다. 하지만 괜히 엘라스틱 서치 위키피디아에 "based on lucene library"라고 바로 나와있는게 아니었습니다. 사실 엘라스틱 서치는 루씬이 본체입니다. 엘라스틱 서치는 루씬을 분산형으로 만들어..

Lucene 2022.09.20