Lucene.net 과의 삽질.
6 10
접하다 검색엔진, 루씬, 장벽, 풀 텍스트 검색, 프로그래밍, 한글 6 Comments
어제 갑자기 예전부터 한번 자세히 살펴보고 싶었던 Lucene을 실제로 이것저것 만져보기 시작했습니다. 원래 늘 그렇듯이 할일은 많은데 하기 귀찮을땐 이것저것 다 해보게 되는건데, 역시 그런가봅니다. 꽤나 흥미 진진했고, 재미있게 살펴보았습니다.
하지만 역시나, 한글 지원은 너무나 턱없이 부족하고, 공개용 형태소 분석기로는 왠만해서는 사용하기 어려운게 현실이고, 조금 노력해서 도전해보려고 했는데, 이 분야는 그냥 취미삼아 몇시간 투자해서 넘볼 수 있을만한 영역은 역시 아닌 것 같습니다.
한글로 만든 서비스의 문제도 있지만, 이런 어쩌면 간단한 기술 하나도, 한글이라는 것 하나로 이렇게나 많은 장벽들이 놓여있다는 것에 조금은 아쉽고, 아주 어린 시절부터 0과 1밖에 모르는 이 컴퓨터라는 녀석들에 이 편한 한글 입력부터 시작한 이 모든 것들을 만들어내시고 발전시켜오신 분들께 무한한 존경심을 표합니다. (__)
Twitter
Facebook
RSS
6 11, 2006 @ 14:54:31
beagle의 최신 소스를 뒤져 보시면 한글 검색에 관한 것이 나올텐데요.
beagle도 어차피 루신 엔진을 쓰는 놈인지라.
6 12, 2006 @ 18:38:39
Beagle 0.2.1에 패치된 Lucene.Net이 포함되었습니다.
다음 버그질라 엔트리에 패치 파일이 첨부되어 있으니 참고하세요~
http://bugzilla.gnome.org/show_bug.cgi?id=328302
6 13, 2006 @ 12:41:37
백일몽님,
헤헷, 잘 찾아서 적용해 보았답니다. 감사합니다.
디토님,
신기하네요. 제가 구글에서 비글 패치 찾아보다가, 아마도 디토님이 올리신 패치 파일을 적용해서 이용한 것 같은데요. ㅎㅎ
감사합니다~
6 17, 2006 @ 04:11:56
그래도 한국어는 Lookout으로 인덱싱이나 가능하죠.
(Lookout에는 Lucene.net이 사용되었습니다)
일본어는 띄어쓰기가 없다보니… 절망적입니다 -_-;;;
어쩐지 인덱싱이 빨리 끝난다 했더니, 제대로 잡히는 문서가 거의 없습니다 OTL
그 이후 포기하고 느리디~느린 아웃룩 검색을 이용하고 있습니다.. ㅠ_ㅠ