• Wszystkie książki świata
  • ~Agnieszka Moskwa | 18-08-2010 11:16:00
    Wiemy już, ile książek jest na świecie - dokładnie 129 milionów 864 tysiące 880 sztuk (przynajmniej do końca zeszłego tygodnia). Taki wynik ogłosił Leonid Taycher, inżynier zatrudniony w Google'u przy projekcie "Google Books".

    Jest to - jak wiadomo - ambitna próba zeskanowania i udostępnienia w sieci wszystkich książek świata. Ale co to jest książka? Czy "wydanie drugie poprawione" to już nowa książka?

    Nie ma prostej odpowiedzi, bo wszystko przecież zależy od tego, jak dużo poprawiono. Google musiał użyć własnych metod sprawdzania. Jakich dokładnie, tego Taycher nie opisuje, bo takie sekrety stanowią najważniejszy majątek spółki.

    W swoim oficjalnym blogu (http://booksearch.blogspot.com) opisał za to przykłady problemów, z jakimi musiał się zmierzyć. Przede wszystkim okazało się, że nie ma żadnego uniwersalnego katalogu, któremu Google mógłby zaufać.

    Jest system ISBN (International Standard Book Number), ale jego numery są przyznawane niedokładnie. Częste są duplikaty, a pewien wyjątkowo pechowy numer przypisano aż 1,5 tys. różnych książek!

    W dodatku ISBN wprowadzono w połowie lat 60., a powszechnie zaczęto go używać dopiero w połowie lat 70. - i tylko w komercyjnych wydawnictwach. Google natomiast chce archiwizować także niszowe publikacje, takie jak Notatki do wykładów z informatyki czy Prace 4. Międzynarodowego Sympozjum Podstaw Logicznych Informatyki (przy okazji inżynierowie odkryli, że pod tymi dwoma tytułami występuje ten sam uczelniany skrypt).

    Po podliczeniu wszystkiego, co się da, wychodzi około 210 mln książek widniejących jako wpis do katalogu choć jednej biblioteki. To nie koniec liczenia.

    Trzeba jeszcze wyłączyć "jednostki nieksiążkowe", jak mikroformy (8 mln), nagrania audio (4,5 mln), mapy (2 mln), koszulki z nadrukiem, któremu przyznano ISBN (około tysiąca), i szpikulec do sprawdzania, czy indyk jest dobrze upieczony (pozycja dodana do katalogu pewnej biblioteki jako dowcip primaaprilisowy).

    Żmudne odejmowanie duplikatów, koszulek i indyków zakończyło się w zeszłym tygodniu. Zostało dokładnie 129 864 880 pozycji w katalogu. Miłej lektury!

    Materiał pochodzi z serwisu Internetowe Imperium Książki <http://www.iik.pl>