RSS구독하기:SUBSCRIBE TO RSS FEED
즐겨찾기추가:ADD FAVORITE
글쓰기:POST
관리자:ADMINISTRATOR
출처 블로그 > xinfra님의 블로그
원본 http://blog.naver.com/xinfra/80008688603
/
인터넷 검색 사이트에서 특정 단어를 입력했을 때 검색 순위를 인위적으로 올려주는 업체들이 성행하고 있다.

이러한 기법은 불법이 아니고 워낙 교묘한 방법을 동원하기 때문에 포털 사이트들도 속수무책이다. 하지만 돈을 주고 인기 순위를 올리는 사이트가 늘어나면서 반대로 정상적인 사이트가 순위가 떨어져 피해를 입는 사례가 많아지고 있다.

아이뉴스24 * 2003/4/5 기사 중에서

검색결과 첫 페이지가 중요한 홍보 방법으로 알려지면서 소위 '상위등록'에 대한 관심이 높아지고 있다. 그에 따른 오해와 부작용도 함께.

검색결과 상위에 올라가려는 이런 노력을 한 쪽에서는 검색순위 조작이라고 비난을 하고, 다른 쪽에서는 정당한 마케팅 방법이라고 단호하다. 어느 쪽 말이 맞는 걸까?

결론부터 말하자. 검색결과 상위에 올라가려는 노력은 비난 받을 일이 아니다. 다만 적절한 선을 무시하는게 문제일 뿐이다. 스팸메일은 문제지만 이메일을 이용한 홍보 자체는 비난받을 일이 아닌 것 처럼.

포탈에 돈내고 광고 한 것은 괜찮고, 검색결과에 올라가려고 HTML 문서를 잘 꾸미고 키워드를 배치한 것은 비난 받아야 한다면 어딘가 굉장히 어색하다.

  • 홈페이지를 만드는 이유는 다른 사람에게 보여주기 위해서다.
  • 사람들은 검색엔진으로 필요한 정보(홈페이지)를 찾는다.
  • 그래서 홈페이지를 만들 때 검색엔진을 염두에 두고 만든다.
  • 이런 노력 자체에는 아무런 문제가 없다. 다만 일부 업체들이 마술사처럼 거짓말을 하거나 적절한 선을 넘는 것이 문제다.

    인기 키워드에 대한 집착만 버린다면 상위등록이 그리 어렵지 않다고 말하고 싶지만, 어떤 경우에는 부득이 전문업체에 상위등록 대행을 맡겨야 하는 경우가 있다.

    그동안 "믿을 만한 상위등록 업체"를 알려달라는 질문을 많이 받았다. 특정 업체를 지목할 수는 없다. 대신 좋은 업체를 고를 몇 가지 기준을 함께 생각해보자.

    첫째, '상위등록'이 아닌 '마케팅'을 말하는 업체

    엄밀히 말해서 상위등록과 검색엔진 마케팅은 다르다. 상위등록은 어떤 키워드에서든 높이 올라가면 그만이지만 마케팅은 고객을 부르고 상품을 파는 활동이다.

    검색결과에 먼저 나오는 것은 마케팅 전략의 한 부분일 뿐이다. 적절한 키워드 선정, 홈페이지 구성, 효과분석, 고객 흐름의 설계와 관리 등 종합적인 노력이 필요하다.

    검색엔진 마케팅을 하겠다면 조회수만 보고 엉뚱한 키워드를 공략하는 일은 무의미하다. 1000 트래픽(Traffic) 보다는 10명의 고객이 나은 법이다.

    검색순위 조작 능력을 자랑하는 업체보다는 마케팅 전략을 말하는 업체를 고르자.

    둘째, 고객 방문 그 이후를 말하는 업체

    고객은 움직인다. 키워드 검색을 하고, 사이트를 방문하고, 활동을 하고, 다시 찾아온다. 검색엔진 마케팅은 이 모든 고객 흐름을 염두에 두어야 한다.

    공략 키워드 선택에서 메뉴 이름까지 하나하나 연결 시켜야 한다.

    셋째, 합리적인 가격을 말하는 업체

    누구나 싼 가격에 흔들리기 마련이다. 그러나 마케팅을 할인 판매할 수는 없는 것이다. 검색엔진 마케팅은 저렴하지만 그래도 돈이 들어간다. 어떤 경우에는 스폰서링크 같은 광고를 해야하는 경우도 있다.

    타겟별로, 예산과 전략에 따라 가격은 다를 수밖에 없다. 때로는 유료 광고를 해야하는 경우도 있다. 공장에서 기계를 찍듯이 가격을 말하는 업체 보다는 합리적인 가격을 제시하는 업체를 찾자. 마술쇼를 하듯이 터무늬없는 가격을 부르는 곳도 마찬가지로 다시 살펴보자.

    넷째, 효과분석을 철저히 하는 업체

    검색결과 상위에 올라갔다고? 그게 그렇게 대단할까?

    • 트래픽은 얼마나 늘었는가?
    • 고객은 얼마나 늘었는가?
    • 매출은 얼마나 늘었는가?
    • 늘지 않는다면 그 이유는 무엇이고 어떻게 개선할 것인가?

    ROI(투자수익률)를 말할 수 없다면 투자는 의미가 없다. 로그분석에 효과분석까지 철저히 짚어주는 업체를 찾아보자.

    다섯째, 검색엔진 구석구석을 이용하는 업체

    통합 검색결과에 먼저 나오려면 디렉토리 상위등록이 중요하다. 그러나 디렉토리는 한계가 뻔한 곳이다. 먼저 나온다는 것 빼고는 차별화도 불가능하다. 자유로운 마케팅이 불가능하다. 웹페이지 검색, 스폰서링크 등 검색엔진 각 검색결과를 총체적으로 이용하는 전략이 필요하다.

    여섯째, 미디어 믹스(또는 마케팅 믹스) 전략을 말하는 업체

    당연한 말이지만 인터넷 마케팅에는 검색엔진만 있는 것이 아니다. 이메일, 입소문 등 다른 매체 전략과의 연계가 있어야 더 큰 효과를 발휘한다. 때로는 오프라인과의 연계도 필요하다.

    종합적인 마케팅 대행사를 찾으라는 의미는 아니다. 이런 총체적인 시각으로 전략을 구사할 줄 아는 곳을 찾으라는 의미다.

    일곱째, 장기 전략을 말하는 업체

    디렉토리 빠른 등록은 길어야 일주일이면 끝난다. 상위등록이 바로 될 수도 있다. 그러나 마케팅은 속전속결일 수 없다. 단기간에 이룰 수 있는 건 어떤 키워드에서 높이 올라간다는 사실 뿐이다.

    제대로 검색엔진 마케팅을 하려면 6개월 내외의 장기전 준비를 해야한다. 이런 정도 기간의 단계별 전략과 경험을 제시하는 업체를 찾아야 한다.

    ◆◇◆◇◆◇

    이런 업체를 찾기가 힘든가? 그렇다면 만나는 상위등록 업체에게 요구하라. 이제까지는 검색결과 첫 페이지 올리기로 충분했는지 모른다. 그러나 이제는 더 큰 효과로 더 큰 시장을 만들어야 한다.

    일부 업체들은 말한다. "제대로 하고 싶지만 고객들이 상위등록 요구만해서 마케팅 이야기는 엄두도 못내요."

    시장을 제대로 키우는 책임은 소비자에게도 있다. 업체를 비교하자. 없다면 요구하자.

    세상엔 많은 검색엔진이 있다. 사람들다마 각자의 성향에 따라 즐겨 사용하는 검색엔진도 다 다르다. 그 가운데서 유독 전세계적으로 많은 매니아층을 끌어 들이는 구글 검색엔진은 여러 가지 신선한 아이디어로 항상 매니아층을 흥분시키곤 했다. 비록 일반 사용자들이 야후, 네이버, 엠파스, 한미르 등을 더 많이 사용한다고는 하지만(구글의 사이트 순위), 어느 정도 검색 엔진에 조예가 있는 사람들에겐 언제나 구글은 동경심의 대상이었다.

    이러다보니 구글과 관련한 사이트들도 전세계적으로 상당히 많이 생겨났다. 이들 중에는 단순히 구글을 사랑하는 사람들이 만든 팬사이트 형식의 사이트부터, 구글 기술과 관련한 사이트, 구글 검색 결과의 상위에 노출되는 방법을 알려주는 사이트 등 여러 사이트들이 있다. 그만큼 애정을 가진 사람들이 많다는 것이다.

    오늘은 이런 사이트들 중 흥미있는 사이트를 하나 소개하도록 하겠다.

    사이트를 운영하는 사람치고 검색엔진 결과 리스트의 상위에 노출되고 싶지 않은 사람은 없을 것이다. 오늘 살펴 볼 사이트는 구글의 검색 스파이더가 사이트를 어떻게 해석하는지 잘 보여주는 사이트이다.

    푸들 프리딕터(Poodle Predictor)란 사이트인데, 이 사이트는 구글 검색엔진이 각각의 사이트를 어떻게 해석하는지 시뮬레이션 해주는 사이트이다.

    이 사이트에 가서 korea.internet.com으로 검색한 결과는 다음과 같다.

    이 검색 결과의 첫 번째 항목은 구글 검색 결과에 어떻게 나타날지를 시뮬레이션 해준 것이고, 그 아래 쪽 결과는 검색엔진이 수집한 해당 페이지의 모든 링크를 보여준 것이다.

    이번엔 구글 검색엔진에서 korea.internet.com으로 검색한 결과를 한 번 보자.

    푸들 프리딕터에서 검색을 한 경우와 구글에서 검색을 한 경우 검색 결과에 나타날 요약문이 거의 동일함을 알 수 있을 것이다.

    푸들 프리딕터 이럴 때 유용하다

    하지만 이 요약문이 서로 다른 경우도 많이 있다. 이것은 푸들 프리딕터는 해당 페이지의 실시간 결과를 보여주는 것이고, 구글은 과거에 수집한 내용을 기반으로 결과를 보여주기 때문이다.

    이것은 무엇을 의미하나? 그렇다. 만일 검색엔진에 나타날 결과를 예측하여 페이지를 수정하였는데 막상 구글 검색엔진에 반영되는데 걸리는 시간은 1달 이상 걸릴 수 있다. 그런데 1달이 지나고 나서 결과를 보니 예상했던 것과 다르다면 얼마나 난처한 일일까? 다시 결과를 바로 잡기 위해 1달을 더 기다린다? 이럴 때 푸들 프리딕터의 도움을 받을 수 있다. 푸들 프리딕터는 현재 페이지에 대한 실시간 결과를 시뮬레이션 해서 보여주기 때문에 향후 구글 검색엔진 결과에 어떻게 나타날지를 쉽게 예측할 수 있게 해준다.

    푸들 프리딕터의 사이트 바라보기

    앞서 푸들 프리딕터는 구글 검색엔진이 각각의 사이트를 어떻게 해석하는지 시뮬레이션 해준다고 하였는데, 과연 어떤식으로 시뮬레이션 해주는 것일까?

    아래 그림처럼 푸들 프리딕터의 결과 요약문 아래 있는 "Diagnostics View" 메뉴를 클릭해 보기 바란다.

    이 메뉴의 결과를 보면 검색엔진 스파이더가 어떻게 페이지를 해석하는지 잘 알려준다. 즉, 스파이더 입장에서 페이지 내용중 관심 없는 항목들은 과감히 생략하여 보여주기 때문에, 즉, 스파이더가 관심있는 항목들만 정리하여 결과를 보여주기 때문에, 검색엔진 마케팅을 위해 페이지를 어떤 식으로 수정하면 좋을지 시뮬레이션 하는데 많은 도움을 얻을 수 있을 것이다. 이 결과들을 보면서 자신의 홈페이지를 검색엔진 스파이더가 관심을 갖도록 바꿔보는 것은 꽤 흥미있는 일이 될 것이다.


    /

    "검색엔진들이 지식 검색에 열을 올리고 있다. 검색엔진의 미래와 어떤 관련이 있을까?"

    최근에 받았던 질문이다. 아주 오랜만에 포탈 검색 서비스에 변화가 생겼다. 반가운 일이다. 변화가 생기고 경쟁이 생겨야 사용자가 행복하고 소비자가 즐겁다. 그리고 산업과 기술도 발전한다.

    최근 검색엔진 변화에 불을 당긴 것은 네이버의 지식인(지식iN) 서비스(이하 지식인)이다. 네티즌끼리 질문과 답을 주고 받는 서비스로 네이버 검색결과에서 먼저 나타난다.

    네이버의 중고차 검색 결과

    ▲ 네이버의 '중고차' 검색 결과 처음

    2002년 10월에 시작해서 5개월만에 인기있는 서비스로 자리잡았다.

    • 하루 이용자 수 650만명에 40만 건 이상의 자료가 구축되었다.
      (네이버 발표)
    • 네이버 사용자 100명중 24명이 지식인을 이용한다.
      (인터넷메트릭스 2월말 조사)
    • 일반 검색에 비해서 두배 이상의 체류 시간을 보인다.
      (인터넷메트릭스 2월말 조사)

    이제 네이버 검색의 슬로건은 '지식까지 찾아주는 검색'이다.

    다른 포탈들의 움직임도 심상치 않다. 엠파스는 지식인의 원조격인 디비딕(DBDIC)을 인수해서 '지식거래소'라는 이름으로 통합을 추진하고 있다. 세이클럽은 세이테마(SayTheme)라는 서비스를 이미 시작한 상태이다. 다른 포탈도 비슷한 서비스를 한창 준비하고 있다.

    지식인 서비스 자체는 성공적이라고 할 수 있다. 화제로 떠오르고 사람들이 모이니 말이다. 그럼 아까 받았던 질문으로 넘어가 보자.

    "지식 검색을 검색의 미래로 볼 수 있을까?"

    이 바람을 일으킨 네이버 지식인을 검색의 관점에서 살펴보는 것이 답변의 출발이 될 것 같다.

    ■ 지식인이 성공한 이유

    잘 알다시피 지식인은 이 분야 최초의 서비스가 아니다. 2000년 디비딕이란 서비스가 이미 화제가 되었다. 그런데 요즘 새삼스럽게 네이버의 지식인이 인기를 얻는 이유는 무얼까? 서비스 자체의 장점 말고 바깥쪽의 관점, 즉 검색의 관점에서 살펴보자.

    1. 검색엔진과 연결되었기 때문이다.

    기존의 디비딕은 독립 서비스였다. 그러나 네이버의 지식인은 검색과 연결되어 있다. 검색과 연결되어 있지 않았다면 오늘의 성공은 없었을 것이다. 'SM5'로 검색한 사용자가 'SM5 랑 옵티마랑 둘 중에 어느거 살까여?'라는 질문을 발견했기 때문에 지식인이 성공하는 것이다.

    포탈은 수십, 수백개의 서비스로 이루어져 있다. 그동안 브랜드는 하나였으나 제각각 움직이고 있었다.

    네이버는 지식인을 별도의 서비스로 놔두지 않고, 검색이라는 끈으로 연결했다. 사실 포털이 그렇게도 되고 싶은 미디어(Media)의 열쇠 하나가 검색엔진이다. 미디어는 메시지이고, 메시지는 기본적으로 연결 고리가 필요하다.

    포털의 검색은 여러 서비스 중의 하나가 아니다. 검색은 서 말의 구슬을 꿰어 보배로 만드는 힘이다. 때로는 포탈 그 자체이다.

    2. 웹페이지 검색 정보가 부족하기 때문이다.

    웹페이지 검색의 정보가 부족한 것도 지식인 활성화에 도움이 되었다. 우리나라는 영어권에 비해 웹 정보가 부족한 편이다. 수량에서도 차이가 나지만 내용에 있어서도 분야별 편차가 다소 심하다. 작년 모 언론사와 함께 우리나라 개인 홈페이지를 조사할 기회가 있었다. 엔터테인먼트(영화, 게임 등)와 컴퓨터 분야는 다양했으나 정치, 경제 분야 같은 경우는 홈페이지를 찾기가 쉽지 않았다.

    안타깝게도 우리나라는 정보 소비자는 많지만 아직 상대적으로 정보 생산자는 적은 편이다. 이런 정보 소비자 중심의 구조는 웹페이지 정보 부족으로 곧바로 연결된다.

    또 하나 국내 검색엔진의 웹페이지(웹문서) 검색에 대한 게으름도 한 몫한다. 국내 검색엔진들은 웹페이지에 신경을 덜 쓰는 경향이 있다. 업데이트 주기, 스파이더의 개선 등 여러 곳에 아쉬움이 있다.

    웹페이지가 늘어나고 복잡해질수록 검색엔진도 함께 발전해야 한다. 국내 웹페이지 검색엔진 시장이 워낙 작기 때문에 개선을 위해 큰 비용을 계속 들이는 것이 쉽지는 않을 것이다. 그러나 운영과 관리도 소홀하다면 이야기는 다르다.

    통합검색과 테마검색(혹은 컨텐츠 검색)이라는 이름으로 서퍼들의 편집 부분에 노력을 기울이는 것도 중요하다. 그러나 웹페이지 검색을 사용하는 사람 역시 적지 않다. 이 둘은 서로 상호보완적인 영역이지 어느 한쪽을 완전히 대신할 수가 없다.

    3. 정리된 지식을 찾을 수 있는 행운이 있다.

    얼마전 진심반 시험반으로 해외 리조트(resort) 여행에 관한 질문을 올린 적이 있다. 질문을 올린지 하루만에 2건의 답변이 올라왔고 그 중 하나는 제법 만족스러운 것이었다. 그리고 "때가 어느 때인데 해외여행에 외화를 낭비하느냐"는 따끔한 충고도 덤으로 얻을 수 있었다.

    로봇에게 묻든 사람에게 묻든 우리가 원하는 것은 답을 얻는 것이다. 자동 로봇이 찾아온 결과는 대개 생자료(raw data)인 경우가 많기 때문에 그것을 비교분석하는 것은 사용자의 몫이다. 그러나 지식인의 검색결과는 완결된 답변의 형태로 돌아올 가능성이 상대적으로 높다.

    필자가 이것을 행운이라고 표현했다. 답변이 돌아올 것이라는 보장도, 그 답변이 정확할 것이라는 보장이 없기 때문이다.(이에 대해서는 뒤에서 더 다루기로 하자.)

    ■ 지식인은 검색이 아니다?

    그러나 지식인은 정확히 말해서 검색이 아니다. 지식인은 하나의 데이터베이스(DB)일 뿐이다. 지식인이 성공했냐고 물으면 '네'라고 말하지만, 지식인이 검색의 나아갈 방향이냐고 물으면 '아니오' 혹은 '글쎄요'라고 말하는 것이 맞다.

    기존에 디렉토리-웹페이지-뉴스 등으로 붕어빵 같던 데이터베이스에 Q&A 자료라는 신선한 내용이 더해진 것은 분명하다. 그러나 그것이 곧 검색 자체의 발전을 의미하는 것은 아니다.

    Q&A 라면 지식인보다, 디비딕보다도 더 다양하고 오래된 서비스들이 있다. 다음(Daum) 카페는 아주 훌륭한 데이터베이스이다. 분야별 커뮤니티가 좋은 자료들을 계속 생산해내고 있다.(그러나 안타깝게도 다음의 검색은 이 훌륭한 보물 창고를 크게 활용하지 못하고 있다) 그보다 훨씬 전에도 있다. 웹이 등장하기 이전부터 존재한 뉴스그룹이 있다. 아주 오랫동안 토론과 정보 교환의 장으로 애용되어 왔다. 다만 미국이 뉴스그룹 ▶ 웹 의 발전 단계를 거쳤던 것에 반해서 우리나라는 웹이 먼저 들어와 버려서 뉴스그룹이 크게 발전하지 못했다. (물론 지금은 미국도 뉴스그룹이 웹 인터페이스 속으로 많이 흡수되었다.)

    다음 카페 - 중고차 관련

    ▲ 다음(Daum)의 '중고차'관련 카페

    지식인은 데이터베이스이지 검색 자체가 아니기 때문에 검색의 미래로 볼 수 없다고 말했다. 그럼 검색 자체가 된다는 것은 어떤 의미일까? 여러 방법이 있겠지만 인터페이스와 검색 결과 관점에서 한가지씩 살펴보기로 하자.

    ■ 검색과의 통합 1 - 인터페이스

    앞서 필자는 '리조트'에 관한 질문을 예로 들었다. 좋은 답변도 얻었다고 했다. 그러나 여기서 아쉬운 점은 지식인에 '리조트'에 대해 물어보려면 별도의 서비스로 찾아들어가야한다는 점이다.

    필자는 이미 '리조트'로 검색을 한 상태다. 거기에서 검색결과를 살펴보았다. 그 검색결과는 이미 고정되어 있는 데이터베이스 자료(디렉토리, 웹페이지, 뉴스 그리고 지식인까지)에 있는 내용이다. 이미 만들어진 정보에서 없으니까 필자는 곧바로 '사람들'에게 묻고 싶다. 지식인에게 묻고 싶다.

    그러나 네이버 검색에는 지식인에게 현재 검색한 키워드(리조트)를 그대로 가지고 질문을 하게 해주는 연결이 없다.

      '리조트'에 대해서 '지식인' 사람들에게 직접 물어보시겠습니까?

    이렇게 되어 있다면 로봇과 사람이 결합된 검색 시스템으로 볼 수 있다. 로봇에게 묻든, 사람에게 묻든 사용자에겐 모두 검색 행위이기 때문이다. 그러나 현재의 지식인은 별도 서비스에서 만들어진 데이터베이스에 대한 검색결과 정도의 통합이다.

    (현재 하단에 비슷한 문장이 있기는 하지만 '검색결과 더 보기' 정도의 역할을 할 뿐이다.)

    ■ 검색과의 통합 II - 결과 순서

    지식인의 검색 통합에 관련된 또 하나의 문제는 검색결과의 순서다. 현재 지식인 검색결과는 거의 최상단에 나타난다. 그러나 과연 지식인 검색결과가 '언제나' 먼저 나올만큼 '언제나' 좋은 내용인지는 다시 생각해볼 필요가 있다.

    어떤 분이 '세계 최초의 검색엔진과 한국 최초의 검색엔진이 무엇이냐'는 질문을 했고 두 분이 답변을 했다. 그러나 두 분의 답변이 모두 틀렸다.

    세계 최초의 검색엔진은 야후(Yahoo)가 아니다. 웹검색의 경우라면 갤럭시(Galaxy)라는 검색엔진이 더 빨리 나왔고, 만약 웹 이전의 인터넷 검색을 생각하면 Archie나 Veronica가 더 앞선 검색엔진이다.

    사실 인터넷이 본질적으로 정보 신뢰성의 문제를 안고 있기는 하다. 별도 홈페이지는 진실이고 지식인만 틀리다고 이야기할 수는 없다. 그러나 검색엔진에서 검색 결과 순서는 정보의 정확성에 대한 묵시적인 약속이다. 더구나 지식인은 네이버 내부 서비스이다.

    때로는 일부 왜곡의 소지도 안고 있다. 상품명이나 쇼핑 관련 키워드에서 의도적인 '작업'이 가능할 것이다. 실제 어떤 키워드에서는 그런 현상이 보이기도 한다. 어떤 쇼핑몰에 대해 질문을 하고, 어떤 쇼핑몰이 좋다는 답변을 함으로서 자연스런 홍보를 하는 구조를 만들 수 있다는 의미가 된다.

    네티즌이 자체적으로 꾸며가는 사이트는 장점과 동시에 단점을 가진다. 활성화만 되면 많은 양의 정보가 생산되고, 전문성도 어설픈 전문 사이트보다 좋을 경우가 많지만, 동시에 악의적이고 편파적인 정보가 늘어날 가능성도 함께 높아진다.

    자원봉사자들에 의해 운영되는 세계에서 가장 큰 디렉토리 서비스인 오픈 디렉토리(Open Directory)도 같은 문제를 겪는다. 정보량은 오래전부터 세계 최고이고 너무나 멋진 서비스가 분명하다. 그러나 카테고리별로 편차가 있고 일관성도 가끔 부족한 단점이 있다. 자기가 아는 사이트를 높이 평가하고, 경쟁 관계에 있는 사이트에 대한 평가를 나쁘게 하는 경우도 없지 않다.

    사람과 시스템이 결합한 자체적인 정화 구조가 있기 때문에 계속해서 흐름을 유지하고 있다. 지식인의 경우도 정보의 신뢰성을 높이기 위한 여러 장치를 가지고 있다. 그러나 어쩔 수 없는 한계도 있다고 본다.

    그럴 경우 지식인의 노출 정도와 방법에 대한 고민이 더 필요하지 않을까?

    그런가하면 지나치게 가볍게 흐르는 게 아닌가하는 일부 우려도 있다. 재미있는 지식도 좋지만 검색은 목적이 분명한 행위이다. 그 자체를 즐기는 구조는 별도의 서비스이지 검색이 아니라는 시각이다. 또 일부에서는 '지식검색결과' 박스안에 광고(AD표시)가 섞여있는 것에 대해서 문제를 제기하기도 한다.

    ■ 진정한 지식 검색을 기다리며

    검색에서 늘 한발 앞선 모습을 보여주던 네이버가 이번에는 지식인으로 검색 서비스 경쟁에 새로운 불을 붙였다. 검색의 영역에 신선한 데이터베이스를 소개해 주었다. 후발 주자들이 어떤 모습으로 나타날지도 기대 된다.

    지식 검색이 데이터베이스 차원을 넘어서, 사람-사람의 검색 커뮤니케이션 채널로 발전해가길 바란다. 지금까지 웹이 보여준 단절적인 인터페이스를 벗어나서 검색이라는 행위 아래 단순하고 쉬운 인터페이스 아래 묶여지기를 바란다. 이제 메신저와 모바일도 유기적으로 연결되기를 바란다.

    검색엔진의 미래는 인터페이스, 미디어, 디바이스(Device), 메신저, 에이전트 등 몇 가지 키워드를 통해 한조각 한조각 퍼즐이 되어 우리 곁에 올 것이다.

    1994년 야후가 등장한지 올해로 꼭 10년이다. 변화의 퍼즐 한 조각이, 아니 훨씬 더 많은 조각이 우리나라에서 시작되기를 기대해 본다.

    스파이더는 웹사이트에 찾아가도 홈페이지 문서를 다 가져오지 않는다. 한 웹사이트에서 가져오는 문서수에 제한이 있다. 웹사이트의 중요도에 따라 수집 정도도 다르다. 전체를 수집하지 않는 것은 검색엔진의 성능도 관련이 있지만 쓸모없는 페이지들이 많이 섞여 있는 것도 한 이유가 된다.

    만약 여러분의 웹사이트에서 모든 파일이 다 수집되는 것이 아니라면 거기에도 신경을 써야 한다.

    ■ 스파이더는 움직이지 않는다 - 동적인 페이지(Dynamic Pages)

    옥션

    옥션(Auction.co.kr)의 경우를 보자. 어떤 검색엔진은 "?"가 들어가 옥션의 동적인 페이지를 하나도 수집하지 못했다. 수집한 곳들도 문서 수에서 큰 차이를 보이고 있다.

    HTML 파일을 미리 만들지 않고 ASP, PHP 같은 기술을 사용해서 필요할 때 즉시 만드는 방식이다. 게시판, 회원관리, 쇼핑몰 등에서 널리 쓰인다. 10만개의 상품이 있다고 10만개의 HTML 페이지를 만들어 놓을 수는 없는 일이다. 데이터베이스와 연결해서 필요할 때마다 페이지를 만들면 관리가 편리하다. 디자인을 바꾸기도 쉽다.

    그러나 어떤 검색엔진은 이런 동적인 페이지를 잘 읽지 못한다. 정확히 말하면 페이지를 읽지 못하는 것이 아니라 주소(URL)를 읽지 못하는 것이다. 일반적으로 동적인 페이지의 주소 형식은 아래와 같다.

    http://www.web.com/bbs.cgi?db=file

    검색엔진은 ‘?’ 표시에서 문제를 일으킨다. http://www.website.com/bbs.cgi 까지만 보게 되는 것이다. 보통 데이터베이스 프로그래밍을 할 때 ?, #, +, % 같은 기호는 충돌을 일으키기 때문에 피하는데 검색엔진 역시 관련된 문제가 있다.

    http://www.web.com/cgi-bin/my1.htm

    또 한 주소 안에 CGI 관련 폴더(cgi-bin,cgi 등) 있는 경우도 문제가 생긴다. 데이터베이스와 연결된 곳에 들어갔다가 무한대의 자료를 읽는 문제가 생길 수 있기 때문에 미리 멈추는 것이다.

    검색엔진들이 이 문제를 해결하고 있어서 상황은 많이 좋아졌다. 그러나 어느 검색엔진 운영자의 말을 들어보자.

      “동적인 페이지는 게시판과 같이 중요하지 않은 내용들이 많다. 그리고 주소 방식이나 내용이 금방 바뀌어서 사용자가 찾아가면 전혀 다른 내용이 있는 경우가 많다. 물론 뉴스 사이트처럼 다른 경우도 있다. 사이트 상황에 따라 판단할 수 밖에 없다. 무한정 수집하기가 힘들다.”

    한 사이트에서의 동적인 페이지 수집 비율을 제한하는 경우가 있다는 것이다.

    여러분의 동적인 페이지가 등록될지 미리 정확히 알 수 있는 방법은 없다. 비슷한 방식의 페이지를 사용하는 다른 웹사이트가 어떻게 등록되어 있는지를 살펴보는 것이 가장 좋은 방법이다.

    ○ 스파이더를 생각한 대책

    답은 의외로 단순하다. 주소 방식에서 문제가 생기니까 주소 방식을 바꾸는 것이다. 서버 관리자의 도움을 받아서 해결할 수 있다.

    [ASP]

    웹사이트가 ASP(Active Server Pages)를 사용하고 있다면 아래의 사이트를 참고해서 주소 방식의 변화를 준다.

    [아파치 웹서버]

    아파치 웹서버를 사용한다면 ‘rewrite’ 모듈(mod_rewrite)로 주소방식을 바꿀 수 있다. 이 모듈을 사용해서 아파치 컴파일을 다시 하면 검색엔진에 좋은 주소 방식이 된다.

    ○ 최고의 해결책

    검색엔진 홍보에 중요한 페이지는 반드시 독립적인 HTML 페이지(Static Pages)로 만든다. 서버 설정에 손을 대지 않더라도 반드시 일반 형식의 주소(?,&표시 없는 URL)를 따라 따만들어 놓자. 최소한 각 메뉴의 메인 페이지 정도는 만들어 놓는 것이 좋다. 그래야 동적인 페이지를 읽지 못하거나 동적인 페이지 수집 비율 제한에 걸리지 않을 수 있다.

    스파이더는 웹사이트에 찾아가도 홈페이지 문서를 다 가져오지 않는다. 한 웹사이트에서 가져오는 문서수에 제한이 있다. 웹사이트의 중요도에 따라 수집 정도도 다르다. 전체를 수집하지 않는 것은 검색엔진의 성능도 관련이 있지만 쓸모없는 페이지들이 많이 섞여 있는 것도 한 이유가 된다.

    만약 여러분의 웹사이트에서 모든 파일이 다 수집되는 것이 아니라면 거기에도 신경을 써야 한다.

    2006/09/11 13:37 2006/09/11 13:37
    이 글에는 트랙백을 보낼 수 없습니다
    웅쓰:웅자의 상상플러스
    웅자의 상상플러스
    전체 (379)
    게임 (5)
    영화 (2)
    기타 (23)
    맛집 (5)
    영어 (2)
    대수학 (3)
    형태소 (5)
    Hacking (9)
    Linux (112)
    HTML (48)
    Application_developing (48)
    Web_developing (102)
    Window (11)
    «   2024/11   »
              1 2
    3 4 5 6 7 8 9
    10 11 12 13 14 15 16
    17 18 19 20 21 22 23
    24 25 26 27 28 29 30
    1. 2016/01 (1)
    2. 2015/12 (3)
    3. 2015/10 (3)
    4. 2015/03 (2)
    5. 2015/01 (4)