Statistici na KMA - Google a náhodné procesy
Statistici na KMA stat.kma.zcu.cz  English
Home  Lidé  Oč jde  Výuka  Víte že?  Statistický seminář  Písemky...  Podrobný obsah


Víte že?
 •  Vynález pravděpodobnosti
 •  Náhoda je jistota
 •  Google a náhodné procesy

Google a náhodné procesy


Víte že?
Na první pohled nejspíš není vidět, že vyhledávání slov ve webových stránkách v internetu by mohlo mít nějakou spojitost s pravděpodobností či statistikou. Ale má, a překvapivě proto, že pořadí, v němž "lepší" vyhledávače prezentují nalezené stránky, není náhodné.

Konkrétně pořadí, v němž zobrazuje stránky oblíbený vyhledávač Google(ext) je (do značné míry) dáno pořadím hodnot nazývaných PageRank™. Tyto hodnoty jsou spočteny pro každou stránku a mají jí dávat váhu podle počtu odkazů, které na ni směřují. Přitom odkazy samy jsou navíc váženy pomocí hodnot PageRank™ stránek, z nichž vedou.

Ve skutečnosti se ale za obchodní značkou PageRank™ skrývá v podstatě jen stacionární rozdělení markovského řetězce na množině WWW stránek, který popisuje putování internetového surfaře klikajícího náhodně na odkazy na stránkách. Tedy věc, která patří k základům náhodných procesů.

Lze se dokonce domnívat, že i samotný výpočet hodnot PageRank, tj. vlastního vektoru obrovské matice řádu 4 miliardy, či kolik stránek Google aktuálně eviduje, probíhá simulací tohoto řetězce. Využívá tak dalšího faktu, že stacionární rozdělení lze (v tomto případě) stejně tak s jistotou aproximovat náhodnou frekvencí výskytu jednotlivých stránek v dlouhé pouti onoho surfaře.

2004-09-09 MF - Prohlášení