본문 바로가기
모르면 손해보는 블로그 정보

구글Google 검색의 작동 원리 크롤링과 페이지랭크

by 시크화니 2022. 12. 31.

목차

    반응형

    구글(Google)에서 검색어를 입력하면

     

    30조가 넘는 웹페이지 중 적절한 페이지를

     

    선택하게 되는데요.

     

    어떤 원리로 작동하는 걸까요?

     

    바로 데이터베이스에 정보를 저장 후

     

    알고리즘을 통해 그러한 페이지들이

     

    정리가 되어지는데요.

     

    엑셀을 해보신 분들이라면 대략 어떤 식으로

     

    작동되는 건지 알 수 있을 거예요.

     

    이러한 작동원리는

     

    블로그를 운영하는 사람들이라면 특히

     

    티스토리 블로그를 운영한다면

     

    한 번쯤 알아두고 가면 도움이 되는데요.

     

    이를 이해하기 위해 먼저 크롤링에 대해서

     

    한번 알아보도록 하죠.

     

    티스토리를 하시는 분이라면 색인등록을 위해

     

    종종 구글웹마스터에 들어가실 텐데요.

     

    그러다 보면 한 번씩 저렇게 크롤링이라는 단어를

     

    심심찮게 볼 수가 있습니다.

     

    도대체 크롤링의 뜻이 뭘까요?

     

    구글의 알고리즘은 인터넷상의 웹페이지를

     

    데이터베이스에 저장하는 것으로 시작되는데

     

    그것을 바로 스파이더라는 프로그램을 통해서

     

    크롤링하는데요.

     

    여기서 크롤이랑 뜻은 바로 기어 다닌다는 뜻이에요.

     

    거기에 'ing'가 붙었으니안 쉬고 끊임없이

     

    기어 다닌다는 말이 될 수 있겠네요.

     

    즉, 스파이더라는 프로그램이 24시간 내내

     

    돌아가고 있다고 생각을 하면 되는데요.

     

    여기서 스파이더 프로그램은 인터넷에 모든

     

    웹페이지를 찾을 때까지 크롤링해서

     

    '색인'이라는 웹페이지 목록에 추가하는 

     

    역할을 하고 있어요.

     

    하지만 그 양이 엄청나기 때문에 수집하는데

     

    시간이 걸릴 수 있거나 누락되는 경우도

     

    발생을 하는데요.

     

    그래서 티스토리 블로그를 하시는 분들은

     

    일일이 색인요청을 하는 분들이 많습니다.

     

    저도 글을 쓸 때마다 색인 등록요청을 하는 편이고요.

     

    일단 색인에 등록이 돼야지 제 글이

     

    구글 검색 사이트에 노출이 되던가 하겠죠?

     

    그래서 조금은 귀찮더라도 일일이 색인 등록 요청을

     

    통해 누락되는 것을 방지할 수 있습니다.

     

     

    그렇다면 구글 사용자들이 검색어를

     

    입력하면 어떤 원리를 통해 연관성이 높은

     

    웹페이지를 찾아낼까요?

     

    90년도까지만 해도 키워드의 출현 빈도

     

    통해서 많이 나온 웹페이지들을 보여줬지만

     

    이는 쉽게 악용이 되었고 그래서 나온 것이 바로

     

    페이지랭크입니다.

     

    페이지랭크는 키워도 밀도라는 다르게

     

    조금 더 혁신적인 알고리즘으로 모든 웹페이지에

     

    나름의 페이지랭크로 점수를 매겨서

     

    점수로 올라갈수록 쉽게 노출이 되는 방식으로

     

    쉽게 생각하면 블로그지수와 비슷한

     

    같은 단어라고 말할 수 있어요.

     

    (페이지랭크 = 블로그지수)

     

    그걸 구글 식으로 표현하는 말이지만

     

    즉, 점수가 낮은 블로그가 아무리 많은 글을

     

    올린다 한들 양보단 질이 우선이기에

     

    페이지랭크 점수가 높은 블로그의 글을 우선으로

     

    올린다는 개념이죠.

     

    그래서 다들 무작정 글을 말이 올리긴 보단

     

    양질의 글을 조금이라도 더 적는 것을

     

    강조하곤 합니다.

     

    그래서 블로그마케팅을 주 사업으로 하는

     

    사람들은 빈틈을 찾기 위해서 끊임없이

     

    찾아내고 있지만 사실 구글도 알고리즘도

     

    끊임없이 진화를 하고 있는데요.

     

    그러한 예로 링크팜이 있는데요.

     

    그것은 서로 연관 없는 링크를 잔뜩 넣은

     

    웹페이지를 생성하여 인위적으로 페이지링크를

     

    올리는 방법인데요.

     

    이 역시도 결국엔 링크팜을 색출하는 기술을

     

    구글에서 도입하여 잡아내고 있어요.

     

    이처럼 구글 검색 방식도 수시로 바뀌고 있고

     

    연간 약 500건 정도의 소소하게 알고리즘이

     

    업데이트된다고 하니까

     

    편법으로 상위 노출 시킬 시도는 아예 하지 말고

     

    최상의 글을 쓰는데 집중을 한다면

     

    진화하는 알고리즘 속 당신의 글은 반드시

     

    최상위에 올라갈 수 있을 거예요.

     

     

    반응형

    댓글