Przyspieszanie Google

Naukowcy z Uniwersytetu Stanforda przedstawili metody przyspieszenia najpopularniejszej i bez wątpienia jednej z najszybszych wyszukiwarek internetowych

Redakcja Wirtualne Media
Redakcja Wirtualne Media
Udostępnij artykuł:

Naukowcy z Uniwersytetu Stanforda przedstawili metody przyspieszenia najpopularniejszej i bez wątpienia jednej z najszybszych wyszukiwarek internetowych.

Google cieszy się ogromną popularnością m.in. właśnie ze względu na swoją szybkość. Badacze z Uniwersytetu Stanforda są jednak przekonani, że Google może działać o wiele szybciej, co pozwoliłoby na pogłębienie stopnia personalizacji procesu wyszukiwania przez indywidualnych użytkowników. Obecnie Google pozycjonuje strony systemem PageRank, kalkulującym popularność stron i ilość prowadzących do nich linków. Taka metoda stawia wysokie wymagania serwerom firmy – wyliczenie rankingów miliarda stron trwa kilka dni. A Google kataloguje ich obecnie ponad 3 miliardy. Wprowadzenie dodatkowych kryteriów katalogowania wydłużyłoby ten proces o kolejne dni.

Podczas 12. Dorocznej Konferencji Światowej Sieci Komputerowej w Budapeszcie, naukowcy z Uniwersytetu Stanforda omówili trzy techniki, które zastosowane na serwerach Google mogłyby znacznie usprawnić ich pracę. Wszystkie metody wykorzystują wiedze z działu matematyki nazywanego numeryczną algebrą liniową. Najbardziej efektywna jest pierwsza, nazwana BlockRank – pozwala na trzykrotne przyspieszenie technologii PageRank. Wykorzystuje odkrycie, że nawet 80% linków umieszczonych na stronie prowadzi do podstron tej samej witryny. PageRank przetwarza każdy link osobno, co pochłania znaczne zasoby. BlockRank łączy linki w bloki, składające się z adresów podstron do jednej strony. Przeliczanie całych bloków jest rzecz jasna zdecydowanie mniej czasochłonne, niż oddzielne zajmowanie się każdym linkiem. Druga metoda wykorzystuje ekstrapolację, czyli zasadę prognozowania przebiegu zjawiska na podstawie mniejszej próbki. Przed rozpoczęciem skanowania Sieci, program przyjmuje pewne założenia wobec stopnia ważności poszczególnych stron. Założenia te są weryfikowane podczas procesu przetwarzania linków i wraz z postępem przetwarzania danych są coraz bardziej trafne. W efekcie system działa o 50% szybciej, niż w sytuacji gdy nie dokonuje żadnych prognoz. Trzeci mechanizm – Adaptive PageRank – wykorzystuje fakt, że linki do niżej sklasyfikowanych stron są przetwarzane szybciej. Mnożna na tym zyskać kolejne 50% wydajności.

Eksperymenty pokazały, że połączenie trzech metod może przyspieszyć Google aż pięciokrotnie. Przedstawiciele firmy Google wyrazili zainteresowanie odkryciami naukowców z Kalifornii, jednak na ewentualną decyzję o ich praktycznym zastosowaniu jest jeszcze zbyt wcześnie.

PRACA.WIRTUALNEMEDIA.PL

NAJNOWSZE WIADOMOŚCI

"Chciałem to zrobić na antenie". Tak Kempa żegna się ze "Szkłem kontaktowym"

"Chciałem to zrobić na antenie". Tak Kempa żegna się ze "Szkłem kontaktowym"

Dziennikarz "Rzeczpospolitej" napisał o chorobie Szymona Hołowni. "Jacku, postąpiłeś podle"

Dziennikarz "Rzeczpospolitej" napisał o chorobie Szymona Hołowni. "Jacku, postąpiłeś podle"

Strona z filmami dla dorosłych z rekordową karą. Brytyjski regulator reaguje na nieprawidłowości

Strona z filmami dla dorosłych z rekordową karą. Brytyjski regulator reaguje na nieprawidłowości

Znamy redaktorkę naczelną polskiej edycji "Harper’s Bazaar"

Znamy redaktorkę naczelną polskiej edycji "Harper’s Bazaar"

Drożeją reklamy w Esce, Esce Rock i VOX FM

Drożeją reklamy w Esce, Esce Rock i VOX FM

DPD Polska z ogromną karą. Za naruszenie przepisów ws. danych osobowych

DPD Polska z ogromną karą. Za naruszenie przepisów ws. danych osobowych