Lucene.net 과의 삽질.

6 Comments

어제 갑자기 예전부터 한번 자세히 살펴보고 싶었던 Lucene을 실제로 이것저것 만져보기 시작했습니다. 원래 늘 그렇듯이 할일은 많은데 하기 귀찮을땐 이것저것 다 해보게 되는건데, 역시 그런가봅니다. 꽤나 흥미 진진했고, 재미있게 살펴보았습니다.

하지만 역시나, 한글 지원은 너무나 턱없이 부족하고, 공개용 형태소 분석기로는 왠만해서는 사용하기 어려운게 현실이고, 조금 노력해서 도전해보려고 했는데, 이 분야는 그냥 취미삼아 몇시간 투자해서 넘볼 수 있을만한 영역은 역시 아닌 것 같습니다.

한글로 만든 서비스의 문제도 있지만, 이런 어쩌면 간단한 기술 하나도, 한글이라는 것 하나로 이렇게나 많은 장벽들이 놓여있다는 것에 조금은 아쉽고, 아주 어린 시절부터 0과 1밖에 모르는 이 컴퓨터라는 녀석들에 이 편한 한글 입력부터 시작한 이 모든 것들을 만들어내시고 발전시켜오신 분들께 무한한 존경심을 표합니다. (__)

밤새 전쟁이라도 난 줄 알았습니다. ㅠㅡ 그건 애플의 열정이야!

6 Comments (+add yours?)

  1. 백일몽
    6 11, 2006 @ 14:54:31

    beagle의 최신 소스를 뒤져 보시면 한글 검색에 관한 것이 나올텐데요.
    beagle도 어차피 루신 엔진을 쓰는 놈인지라.

  2. 디토
    6 12, 2006 @ 18:38:39

    Beagle 0.2.1에 패치된 Lucene.Net이 포함되었습니다.
    다음 버그질라 엔트리에 패치 파일이 첨부되어 있으니 참고하세요~
    http://bugzilla.gnome.org/show_bug.cgi?id=328302

  3. 하늘씨
    6 13, 2006 @ 12:41:37

    백일몽님,
    헤헷, 잘 찾아서 적용해 보았답니다. 감사합니다.

    디토님,
    신기하네요. 제가 구글에서 비글 패치 찾아보다가, 아마도 디토님이 올리신 패치 파일을 적용해서 이용한 것 같은데요. ㅎㅎ
    감사합니다~

  4. ㅂㄹ
    6 17, 2006 @ 04:11:56

    그래도 한국어는 Lookout으로 인덱싱이나 가능하죠.
    (Lookout에는 Lucene.net이 사용되었습니다)

    일본어는 띄어쓰기가 없다보니… 절망적입니다 -_-;;;
    어쩐지 인덱싱이 빨리 끝난다 했더니, 제대로 잡히는 문서가 거의 없습니다 OTL

    그 이후 포기하고 느리디~느린 아웃룩 검색을 이용하고 있습니다.. ㅠ_ㅠ

Leave a Reply