|
Víte že?
| | |
 |
Google a náhodné procesy |
 |
Na první pohled nejspíš není vidět, že vyhledávání slov ve webových
stránkách v internetu by mohlo mít nějakou spojitost s
pravděpodobností či statistikou. Ale má,
a překvapivě proto, že pořadí, v němž "lepší" vyhledávače prezentují
nalezené stránky, není náhodné.
Konkrétně pořadí, v němž zobrazuje stránky oblíbený vyhledávač
Google je (do značné míry) dáno
pořadím hodnot nazývaných PageRank™. Tyto hodnoty jsou
spočteny pro každou stránku a mají jí dávat váhu podle počtu odkazů, které
na ni směřují. Přitom odkazy samy jsou navíc váženy pomocí hodnot
PageRank™ stránek, z nichž vedou.
Ve skutečnosti se ale za obchodní značkou PageRank™ skrývá v podstatě
jen stacionární rozdělení markovského řetězce na množině WWW
stránek, který popisuje putování internetového surfaře klikajícího náhodně
na odkazy na stránkách. Tedy věc, která patří k základům
náhodných procesů.
Lze se dokonce domnívat, že i samotný výpočet hodnot PageRank, tj.
vlastního vektoru obrovské matice řádu 4 miliardy, či kolik stránek Google
aktuálně eviduje, probíhá simulací tohoto řetězce. Využívá tak dalšího
faktu, že stacionární rozdělení lze (v tomto případě) stejně tak
s jistotou aproximovat náhodnou frekvencí výskytu
jednotlivých stránek v dlouhé pouti onoho surfaře.
| | |