zaterdag 7 augustus 2010

Volgens Google zijn er 130 miljoen boeken

Google heeft haar zinnen gezet op het digitaliseren van alle boeken van de wereld, maar bedacht zich dat het wel handig zou zijn om eens uit te rekenen hoeveel boeken dat eigenlijk zijn. Ze bedachten een speciaal algoritme en kwamen uit op 129.864.880.

Dat zijn een hoop boeken! Natuurlijk leggen ze ook uit hoe ze het hele proces hebben doorlopen. Eerst zul je moeten definiëren wat een boek is, wat ongeveer overeen komt met de set van teksten die de International Standard Book Numbers (ISBN) hanteert.

Maar er is een probleem...ISBN is pas rond 1960 geïntroduceerd en is westers georiënteerd en er zijn dus een hele hoop oudere boeken en uiteraard Oosterse boeken die meestal geen ISBN nummer hebben.

Google sloeg ISBN over en haalde alle metadata uit 150 bronnen, zoals bibliotheken, WorldCat en wereldwijde aanbieders van boeken en haalde de dubbele er uit. Daarmee kwamen ze op 600 miljoen. Na nog een shifting van ontdubbelen, elimineren van microfilms, audiotapes en andere niet boeken kwamen ze uiteindelijk uit op die 129.864.880.

Dan te bedenken dat ik daarvan ongeveer 0,0000002% heb gelezen, blijven er een heleboel over om uit te kiezen...

- Geschreven met BlogPress op mijn iPad

Location:Av de Moscú,Adeje,Spanje

Geen opmerkingen:

Een reactie plaatsen