첫눈을 대신할 자체 올블로그 검색

23 comments

어제 하루는 첫눈의 인수 소식으로 여러 사람들과 이야기만 나누다 보니 시간이 훌쩍 지나가버렸네요. 아직도 제가 생각할 때 풀리지 않는 의문 몇 가지가 있어서, 조금 답답합니다만, 조만간 약간의 해답을 전해들을 수 있겠죠. 흑흑.

어찌되었든 첫눈의 인수 소식이야, 저희와 제휴해서 검색 서비스를 제공하기로 했던 건이 갑자기 홀딩 되어버린 것과, 그 전부터 나돌던 신빙성 있는 소문들 때문에 어제 사무실에 출근해서 들었던 첫 마디는 ‘첫눈이 인수되었대!’ 가 아니라, ‘첫눈 인수 발표했대!’가 되어버렸습니다. (비슷하면서도 약간 다른 의미)

결국 이전의 첫눈 엔진을 언제쯤 제공받을 수 있을지조차 모른다는 결과를 받아본 이후로 꾸준히 자체적으로 검색 엔진을 개발하려고 고난의 삽질에 돌입하게 되었고, 구글신과 근처 광운대학교 도서관의 책들로 부터 도움(?)을 얻어, 슬슬 어느 정도 윤곽이 잡혀나가고, 드디어 이제는 성능 테스트 과정을 거치고 있습니다. 검색 엔진만 조금 더 완성되면 그 이후에는 서비스에 대한 기획과 디자인 작업 등을 걸쳐서 정식 서비스를 오픈 할 수 있을 것 같습니다. (이것도 일정이 늦어지게 되면 올블로그에서 비공식 예고편이라도 살짝 공개할게요.)

지금 만들고 있는 저희 올블로그의 검색의 장점이라면, 오픈 소스 루씬을 이용한 덕분에 구글에서 지원하는 것 정도의 다양한 검색 연산자들(site:주소 등)이 기본적으로 구현되어 있다는 점, 빠른 검색 속도 등 많은 게 있을 수 있겠습니다만

가장 큰 장점은 올블로그의 별점과 같은 사용자의 평판 정보에 기반한 검색 결과를 제공한다는 점 입니다. (물론 지금과 심플한 같은 날짜순 정렬도 지원합니다. - 저는 아직까지도 이게 가장 편하던데요. ;) ) 즉 추천 글이나, 인기 글에 오르는 글인 경우에는 다른 정보보다 더 검증된 정보라고 판단하는 특징을 가진 검색 엔진이라고 하면 될까나요? :)

더불어서 사용자가 새로 찾은 정보에도 언제든지 별점을 붙여두거나, 검색 결과가 제대로 된 결과가 아니라면, 페널티도 붙여둘 수 있으니, 결국 이런 것들도 계속적으로 적용되는, 사용자가 직접 검색 결과에 참여하는 블로그 검색인지라, 올블로그에서 사용자들이 참여하는 평판이 더 늘어날수록 검색 결과도 더 좋아질 거라 믿습니다.

* 올블로그에 실시간으로 올라오는 글은 거의 대부분 블로거들에 의해서 실시간으로 평가되고, 인기글, 추천글까지 통해서 최대 24시간이라는 시간을 통해서 평판되어집니다. 구글은 비둘기를 이용해 검색합니다만, 올블로그는 뛰어난 두뇌와 지식을 가지고 있는 블로거들에 의해서 검색 결과가 만들어집니다.

어찌되었든, 더 열심히 달려서, 검색 서비스의 검색 기능이 완성되면, 보다 확실한 검색 서비스에 대한 기획을 통해서 예쁜 서비스 오픈하도록 하겠습니다. ;)

까지 쓰고, 우선 오늘은 자러 가야겠습니다. 오늘 점심 시간 이후에 서울지방중소기업청장이 사무실 방문한다고 센터에서 준비해두라고 했는데, 또 폐인모드로 가는 건 아닐지? 라고 걱정했는데, 우선은 늦잠부터 안 자도록 바라는 게 우선이겠군요. OTL

23 comments

  1. 일모리 June 30th, 2006 at 5:29

    캬,, 바로 이겁니다 이거. 우후후후
    블로거가 원하는 검색결과를 오랫동안 기다렸습니다.

  2. lunamoth June 30th, 2006 at 5:30

    site:, authority 지원이라 기대되는 걸요. :)

  3. 방문자 June 30th, 2006 at 5:30

    올블로그에 필요한것은 강력한 검색엔진이 아닌것같습니다.
    블로그검색이라는 주제도 그렇고…
    뭔가 블로그글 자체에 변화가 있어야된다고봅니다
    검색잘된다고발전하는건없는것같아요

  4. Feel~☆ June 30th, 2006 at 5:31

    현재시간 새복 5:30분,,,잠이 깼는데 배고파서 라면 끓여먹고 들어와봤는데 하늘님의 포스트가 올라왔네요,,,늦은 시간까지;; 정말 열심히 하는 모습에 찬사를 보냅니다.

  5. 한님 June 30th, 2006 at 5:44

    평가가 기준이 된다면 검색할때 해당 글의 평균 별점이나 별점을 매긴 사람 수 등도 조회할 수 있으면 좋을 것 같아요. 그런데 별점 수가 반영되는 방식은 아직 안 정해진 건가요?

  6. June 30th, 2006 at 5:52

    사실 글 내용과는 관련이 없는 질문이긴 한데, 정말 궁금한게 있거든요.
    하늘이님의 글을 자세히 보면, 마치 워드에서 작성한 글처럼, 글의 오른쪽 부분이 매우 가지런하게 정렬이 되어 있는데, 이거 어떻게 하는 건가요?

    궁금합니다! +_+

  7. 일모리 June 30th, 2006 at 6:33

    龍님 본문이 나열되는 css 를 찾으셔서 text-align: justify; 를 주시면 됩니다

  8. HFK June 30th, 2006 at 8:14

    조심스럽게 염려되는 것이 있는데, 사용자들의 추천 등에 의해 검색순위 상위에 오른다는 점을 악용하는 사람들이 생기지 않을까 염려됩니다. 잘 신경쓰셔야 할 것 같습니다. 아울러 효과적인 검색엔진이 개발되면, 코드 입력을 통해 블로그 내에서도 검색 form을 사용할 수 있었으면 좋겠습니다.

  9. 마음으로 찍는 사진 June 30th, 2006 at 8:55

    역시 오늘도 열심히 달리고 계시는 군요.
    홧팅 입니다.~~

  10. Rantro June 30th, 2006 at 9:12

    HFK님에 이어서…
    악의적으로 평판을 낮게 하는 경우도 있습니다. 이런 경우의 대책도 필요할텐데요. 아무래도 평판(별점) 시스템의 악용이 가장 우려되는 부분입니다. 지금까지는 단지 별점이 인기글의 노출빈도에 영향을 주는 정도였지만, 검색까지 영향을 준다면 악의적으로 특정 글이나 블로그를 거의 사장시킬 수도 있죠.

  11. Photoni`s Blog June 30th, 2006 at 9:13

    첫눈 NHN의 우산속으로 들어가다….

    2006년 하반기 첫눈 정식 오픈을 기다려왔는데… 오늘 아침날아든 뉴스를 보면서 많은 아쉬움도 생기고 실망스런 마음이 들기도 하지만, 장병규 대표는 확실히 벤처 전략가이자 노련한사업가…

  12. 까막 June 30th, 2006 at 10:44

    결국은 lucene쓰는구나. Original쓰는거야? Fork쓰는거야?

  13. 끄루또이 June 30th, 2006 at 11:52

    뻔한이야기지만 … 힘내세요!

  14. 저공비행사 샤린 June 30th, 2006 at 12:08

    음, 아마도 곧 RSS리더기 시장은 레드오션화될게 분명합니다.
    그러면 RSS리더기마다 차이가 있어야 하겠는데요.
    추천 글이나, 인기 글에 오르는 글인 경우에는 다른 정보보다 더 검증된 정보라고 판단하는 특징을 가진 검색 엔진이라.. 이 부분에 대해서는 글쎄요.
    어떠한 방식으로 추천글과 인기글이 선정될지는 모르겠지만.
    우리가 이야기하는 검색한 키워드에 제일 많은 클릭수를 냈거나, 방문자나 조회수가 많거나, 트랙백이 많다고해서 절대 검증된 정보라고 보기에는 힘들다고 생각합니다. 물론 지금의 읽고 별점주고 검토해서 올리는건 그나마 신뢰롭긴하지만요.

  15. 가짜집시 June 30th, 2006 at 13:03

    “추천글”/”인기글” 이 페이지 랭크를 너무 많이 좌우해버리면 상당히 곤란하지요. 태반이 낚시들이거든요. (본인들이 의도하지 않았더라도 결과적으로는 낚시가 되버리는 경우가 많습니다) 올블에 적합한 랭킹 알고리즘이 진화해나갈 수 있길 바랍니다. 이글루스의 욕나오는 검색 시스템은 언제쯤 고쳐지려나…

  16. ASRAAM June 30th, 2006 at 14:20

    뭔가 엄청난걸 준비하고 계시군요. 기대됩니다 :D

  17. 로보이 June 30th, 2006 at 15:29

    이런 질문 올려도 될지 모르겠는데..

    루씬을 사용하셔서 검색엔진 개발을 하셨다고 했는데
    한글 처리를 어떻게 하셨는지 궁금하네요..^^

  18. 골빈해커 June 30th, 2006 at 16:33

    로보이 / 직접 개발합니다. ㅎㅎㅎ

  19. 민주통신 블로그 July 1st, 2006 at 5:01

    첫눈, 그게 아니잖어.. -_-…

    “첫눈 사태는.. 그게 아니잖어..” “그게 아니라면..?” “장 머시기라는 친구가 첫눈 만들면서 그랬잖어. 한 100억쯤 가지고 그냥 재밌게 놀겠다고..” “그때 인터뷰에서 그랬지.” “근데.. 그게 …

  20. 하늘씨 July 1st, 2006 at 14:18

    우오, 오랜만의 덧글 폭격에 감사합니다. 역시 제목 낚시(?)가 효과있나보군요! ㅠㅡ)/
    몇몇 질문이나 이야기에 답변을 드리자면,

    방문자님,
    강력하지 않습니다만, 지금 수준보다는 분명 향상된 자체 검색 엔진의 필요성을 느끼고 있기에 이렇게 개발하고 있습니다. :)
    검색과 발전과의 관계에 대해서는 이야기가 길어지겠지만, 분명한건 올블로그 사용자들이 올블 검색의 향상에 대해 많은 필요성을 가지고 있었다는 점 이랄까요?
    어쨋든 사용자들의 요구에 대해 수용하면서 발전시켜 나가야 하니깐요.

    한님님,
    별점을 매긴 사람들을 조회하는 걸 예전부터 공개하고 싶었는데, 아직도 프라이버시 문제로 고민중입니다.
    별점수에 대한 적정선에 대한 테스트는 아직 진행하지 못했습니다. ^^;

    龍님,
    일모리님께서 직접 이렇게 덧글을 남겨주셨네요. 본문 테이블이나 div에 style로 지정하시면 됩니다.

    HFK님, Rantro님,
    네, 사용자 참여의 모든 것들은 전부 ‘악의적인 접근’을 고려할 수 밖에 없더라고요. 현재 올블로그도 그렇고요.
    하지만 이게 저희가 만들고자 하는 검색의 특징이니, 악의적인 접근을 최대한 막아낼 여러 방법들을 찾아서 보완해야죠. :)
    form은 저희 검색 성능만 괜찮다면, 꼭 지원하도록 하겠습니다!

    까막씨,
    오리지날이요|+_+)/ 둘의 차이점이 머에요?

    저공비행사 샤린님,
    아, 지금 올블로그에서 생산되는 별점, 클릭수 등의 평판 점수를 그대로 이용합니다. 지금의 정보가 신뢰하실만 하시다니, 검색도 당연히 신뢰하실 수 있을 것 같습니다. :)

    가짜집시님,
    너무 좌우해버리지 않도록 잘 맞추는게 숙제 같습니다. ;)
    그래도 아무리 낚시글이 많다지만 실시간 인기글에 널린 글이나, 다른 블로그 검색 결과보다는 나을 것 같아요.

    로보이님,
    http://ceo.blogcocktail.com/wp/archives/261/
    이 글의 댓글에 있는 버그질라의 패치 정도만 적용하셔도 한글 지원에는 무리 없습니다. :)

  21. JuneYin July 1st, 2006 at 15:26

    자료가 방대하니까 하기는 힘들겠지만, 가나다 순으로 정렬하고, 블로그 검색시 첫글자가 어떤 글자인가 해서 찾아가면 힘들겠나요?

    국어사전 찾는 식으로;;;
    그냥 주저리….

  22. 하민혁 July 3rd, 2006 at 2:05

    그러고 보니.. 하늘이님도 검색 서비스 제휴 건으로 첫눈과 접촉을 했던가 보네요. 저도 한번 찾아간 적이 있는데.. 지금 생각하면 좀 우습게 되어버렸지만(-_-), 당시 네이버의 제국화에 대한 비판(?)과 함께 열린 검색 서비스를 주문하는 기획 내지는 제안을 가지고 갔댔습니다.

    “네이버처럼 네티즌을 가두고 컨텐츠를 가두는 방식이 아니어도, 기술적으로 검색과 뉴스를 아우르면서 커뮤니티를 가능하게 할 수 있는 길이 있다”는 게 제안의 요지였지요. “한국에서 구글 방식의 검색 서비스는 성공할 수 없다”는 얘기도 덧붙여서 말이지요. 그런데.. 결과는 네이버에 인수되는 방식이었으니.. 사람 바보 되는 건 한순간이라는 생각이.. 커커~ -_-

  23. 하울 July 3rd, 2006 at 18:08

    자체 검색 엔진이라.. 기대되는데요.
    오픈유어북은 그냥 mysql의 풀텍스트 검색을 쓰고 있는데 한글은 별로라는 –;
    이제 검색만 제대로 되면 올블이 더욱 발전할것 같네요. 홧팅!!!