제목+내용 검색을 하려고 하는데
like %단어%를 쓰면 내용같은경우는 워낙 내용들이 많아
서칭시간이 오래 걸리는데 이런부분은 어떻게 해결할수 있는지 궁금합니다.
풀텍스트 서치를 쓰면 그건 원하는 결과가 나오지를 않아 사용할수가 없더라고요
제목+내용 검색을 하려고 하는데
like %단어%를 쓰면 내용같은경우는 워낙 내용들이 많아
서칭시간이 오래 걸리는데 이런부분은 어떻게 해결할수 있는지 궁금합니다.
풀텍스트 서치를 쓰면 그건 원하는 결과가 나오지를 않아 사용할수가 없더라고요
1. fulltext 관련 설정을 language에 맞게...
-- advance option on
EXEC sp_configure 'show advanced options', 1;
reconfigure;
-- fulltext default language
exec sp_configure 'default full-text language';
-- fulltext default language : korean -> 변경
exec sp_configure 'default full-text language', 1042;
reconfigure;
그럼에도 좀더 정확한 문장으로 구분을 원한다면 사용자 어휘사전을 만들어야 합니다.
(이 부분은 상당히 고급적인 내용인데 굳이 이걸로 가야 할지 아니면 보조 엔진을 사용해볼지 의문이 드네요.)
어휘사전은 크게 세가지로 나뉩니다. stopword(불용어->버릴단어), synonym(동의어), lexicon(어휘사전)
참고
https://learn.microsoft.com/ko-kr/previous-versions/office/sharepoint-server-2010/dd361733(v=office.14)
------------------------------------------------------------------------------
2. 검색엔진을 구현해보기
1) ElasticSearch, logstash를 이용한 검색엔진 구현
2) 검색엔진을 직접 구현해보기
- n-gram, split_space로 직접 검색엔진 만들어보기