Google przechowuje ok. 1 miliarda plików w jednym, wspólnym miejscu – repozytorium. Znajduje się tam łącznie 86TB danych, w tym 2 miliony linii kodu w 9 milionach unikalnych plików źródłowych.
Aby wszystko wydrukować, potrzebowalibyśmy papieru z ponad 4 milionów drzew!
Odczytanie całości, przy średnim tempie 200 słów na minutę i 5 słowach w wersie, zajęłoby nieprzerwanie 95 lat[1].
Repozytorium zawiera historię 35 milionów aktualizacji, wprowadzanych przez Google na przestrzeni 18 lat.
Na kodzie źródłowym pracuje ponad 25 tysięcy programistów z biur na całym świecie. To dwa razy więcej niż wszyscy pracownicy Facebooka i ponad 6 razy więcej niż wszyscy pracownicy Twittera!
Programiści codziennie dokonują 16 tysięcy zmian w kodzie, a kolejne 24 tysiące zachodzą automatycznie. Daje to razem 40 tysięcy modyfikacji kodu dziennie, czyli prawie 1700 zmian w ciągu godziny i blisko 28 zmian na minutę.
Kod źródłowy silnika wyszukiwania jest na tyle złożony, że każda ręczna zmiana jednego elementu, wymaga kolejnych. System automatycznie modyfikuje niezbędne składowe kodu, dopasowując je do aktualizacji wprowadzanych przez programistów.
Sprawne działanie tak wielkiego zbioru danych możliwe jest dzięki stworzonemu przez Google systemowi Piper. Liczne funkcjonalności wprowadzane w jego obrębie pozwalają m.in. na współpracę programistów z całego świata, bez względu na strefę czasową, w której się znajdują.
[1] Dane na podstawie: simplyted.blogspot.com
Infografika prezentująca budowę wyszukiwarki Google dostępna jest pod adresem:
https://www.semtec.pl/wp-content/uploads/2016/09/wyszukiwarka-Google-od-srodka-SEMTEC.jpg