Jak działa wyszukiwarka Google
Niezależnie czy jest to mała strona internetowa przeznaczona dla lokalnej społeczności, czy też witryna ma charakter ogólnokrajowy ważne aby zrozumieć mechanizmy związane z działaniem wyszukiwarek internetowych.
Etapy działania wyszukiwarki Google
Programy Google nazywane robotami indeksującymi, regularnie przeglądają różne zakątki sieci w poszukiwaniu nowych stron i dodają je do indeksu. Proces ten można podzielić na trzy etapy:
- Skanowanie – polega na pobraniu przez robota treści (tekst, obrazy, filmy ) ze stron znalezionych w internecie.
- Indeksowanie – polega na analizuje pobranych informacji i umieszczeniu ich w bazie danych
- Wyświetlanie wyników wyszukiwania – użytkownik przesyła zapytanie do wyszukiwarki, a wyszukiwarka zwraca informacje pasujące do jego zapytania.
Skanowanie stron internetowych
Aplikacja skanująca nieustanie przeszukują sieć w celu znalezienia nowych lub zaktualizowanych stron. Nowe strony internetowe są odnajdywane poprzez analizę linków z innych już znanych stron. Zgodnie z algorytmem działania aplikacji następuje wybór stron do zeskanowania oraz częstotliwość pobierania treści. Podczas skanowania uruchamiany jest kod JavaScript co oznacza, że treści pobierane za pomocą JavaScriptu są widoczne dla aplikacji skanującej, a tym samym mogą zostać uwzględnione w indeksie.
Właściciel witryny może nie zezwolić na skanowanie niektórych zasobów. Również treści, do który wymagane jest logowanie nie zostaną zindeksowane. Ograniczenie dostępu może również wynikać z:
- problemów z serwerem obsługującym witrynę,
- problemów z siecią,
- reguł w pliku „robots.txt”, które ograniczają dostęp do określonych zasobów lub całej witryny.
Indeksowanie
Na tym etapie następuje przetwarzanie oraz analiza treści strony internetowej. Po za tekstem, obrazami i filmami analizowane są takie elementy jak język strony, kraj, na który skierowana jest treść, zawartość tagu title, metatagi czy też treść atrybutów alt obrazów ale również łatwość nawigacji w witrynie.
Na podstawie zebranych informacji tworzony jest indeks, czyli baza danych z informacjami o treściach i ich adresach URL.
Problemy z indeksowanie mogą wynikać z:
- Niskiej jakości treści.
- Ograniczenia indeksowania z wykorzystaniem metatagów.
- Błędnie zaprojektowanej strony internetowej.
Wyświetlanie wyników wyszukiwania
W wyniku przesłania przez użytkownika zapytania następuje przeszukanie indeksu w celu odnalezienia pasujących wyników. To, czy i na jakiej pozycji, w wynikach wyszukiwania zostanie uwzględniona dana strona zależy od wielu czynników, np: lokalizacji, języka, typu urządzenia użytkownika. Określenie pozycji w rankingu odbywa się automatycznie, a Google nie pobiera opłat za umieszczeni strony wyżej w rankingu.