Lucene.net 과의 삽질.

6 comments

어제 갑자기 예전부터 한번 자세히 살펴보고 싶었던 Lucene을 실제로 이것저것 만져보기 시작했습니다. 원래 늘 그렇듯이 할일은 많은데 하기 귀찮을땐 이것저것 다 해보게 되는건데, 역시 그런가봅니다. 꽤나 흥미 진진했고, 재미있게 살펴보았습니다.

하지만 역시나, 한글 지원은 너무나 턱없이 부족하고, 공개용 형태소 분석기로는 왠만해서는 사용하기 어려운게 현실이고, 조금 노력해서 도전해보려고 했는데, 이 분야는 그냥 취미삼아 몇시간 투자해서 넘볼 수 있을만한 영역은 역시 아닌 것 같습니다.

한글로 만든 서비스의 문제도 있지만, 이런 어쩌면 간단한 기술 하나도, 한글이라는 것 하나로 이렇게나 많은 장벽들이 놓여있다는 것에 조금은 아쉽고, 아주 어린 시절부터 0과 1밖에 모르는 이 컴퓨터라는 녀석들에 이 편한 한글 입력부터 시작한 이 모든 것들을 만들어내시고 발전시켜오신 분들께 무한한 존경심을 표합니다. (__)

6 comments

  1. 백일몽 6월 11th, 2006 at 14:54

    beagle의 최신 소스를 뒤져 보시면 한글 검색에 관한 것이 나올텐데요.
    beagle도 어차피 루신 엔진을 쓰는 놈인지라.

  2. 디토 6월 12th, 2006 at 18:38

    Beagle 0.2.1에 패치된 Lucene.Net이 포함되었습니다.
    다음 버그질라 엔트리에 패치 파일이 첨부되어 있으니 참고하세요~
    http://bugzilla.gnome.org/show_bug.cgi?id=328302

  3. 하늘씨 6월 13th, 2006 at 12:41

    백일몽님,
    헤헷, 잘 찾아서 적용해 보았답니다. 감사합니다.

    디토님,
    신기하네요. 제가 구글에서 비글 패치 찾아보다가, 아마도 디토님이 올리신 패치 파일을 적용해서 이용한 것 같은데요. ㅎㅎ
    감사합니다~

  4. ㅂㄹ 6월 17th, 2006 at 4:11

    그래도 한국어는 Lookout으로 인덱싱이나 가능하죠.
    (Lookout에는 Lucene.net이 사용되었습니다)

    일본어는 띄어쓰기가 없다보니… 절망적입니다 -_-;;;
    어쩐지 인덱싱이 빨리 끝난다 했더니, 제대로 잡히는 문서가 거의 없습니다 OTL

    그 이후 포기하고 느리디~느린 아웃룩 검색을 이용하고 있습니다.. ㅠ_ㅠ

  5. [...] 결국 이전의 첫눈 엔진을 언제쯤 제공받을 수 있을지조차 모른다는 결과를 받아본 이후로 꾸준히 자체적으로 검색 엔진을 개발하려고 고난의 삽질에 돌입하게 되었고, 구글신과 근처 광운대학교 도서관의 책들로 부터 도움(?)을 얻어, 슬슬 어느 정도 윤곽이 잡혀나가고, 드디어 이제는 성능 테스트 과정을 거치고 있습니다. 검색 엔진만 조금 더 완성되면 그 이후에는 서비스에 대한 기획과 디자인 작업 등을 걸쳐서 정식 서비스를 오픈 할 수 있을 것 같습니다. (이것도 일정이 늦어지게 되면 올블로그에서 비공식 예고편이라도 살짝 공개할게요.) [...]

  6. xanax addiction 5월 4th, 2007 at 19:54

    xanax addiction…

    news…