Sok újságíró igyekszik kerülni a kérdőjeles címeket, aminek több oka is van. Gyakran szenzációhatást keltenek, sokszor teljesen egyértelmű, hogy mi a válasz (az eldöntendő kérdéseknél általában az, hogy nem), és különben is, a mi dolgunk az, hogy hatékonyan adjunk át információt a drága olvasóinknak.
Viszont sok Észkombájn-cikk úgy születik, hogy felmerül bennünk egy kérdés, utánanézünk, és ha érdekes, amit találunk, megírjuk. Ilyen volt például nemrég az a cikk, amiben megpróbáltunk utánajárni, mi is történik a gyomrunkban, mikor éhesek vagyunk.
Ez a cikk is ezért kapott kérdőjeles címet, pedig nyilván mindenki számára teljesen egyértelmű, hogy bárhogy is értjük a kérdést, lehetetlen megválaszolni. Ha a fizikai könyvek darabszámára vagyunk kíváncsiak, akkor tényleg megválaszolhatatlan kérdést tettünk fel. Azonban ha azt szeretnénk kideríteni, hogy hány könyvet írtak (azaz hány művet szereztek, hogy egyértelműbb és kicsit magyartalanabb legyen), akkor legalább meg tudjuk kísérelni a válaszadást.
Először érdemes tisztázni, mi számít egy könyvnek. A szépirodalmi művek egyértelműen, de ide tartoznak még a tankönyvek, szakácskönyvek, disszertációk, és még egy csomó minden más. A választ az is nehezíti, hogy ha egy művet már többször is kiadtak, akkor azokat egy vagy több könyvnek számoljuk? Például A Gyűrűk Ura első, 1954-es kiadásának olvasóinak még nem volt lehetősége elmerülni Christopher Tolkien rendkívül olvasmányos előszavaiban. Vagy gondoljunk csak a Bibliára, és annak különböző változataira.
A Google könyvdigitalizáló csapata azt a megoldást választotta, hogy megpróbálnak a hivatalos adatbázisokból dolgozni. Sokak számára ismerős lehet az ISBN, egy számsor, ami könyvek azonosítására van. Ezzel az az egyik probléma, hogy csak az 1960-as évek közepén kezdték el osztogatni, és a '70-es évek közepéig nem is nagyon terjedt el használata, és azóta is inkább a Nyugaton jellemző. Arról nem is beszélve, hogy ha valaki saját maga adja ki és el a könyvét, akkor nem is kell ISBN-t szereznie, és ha a szerző adja ki a saját e-könyvét, akkor sincs rá szükség.
A másik probléma az, hogy ha egy művet keménykötésben és papír borítóval is kiadnak, és neadjisten még egy hangoskönyv is megjelenik, akkor mindnek ugyanaz az ISBN jut. Sőt, a Google több olyan esettel is találkozott, hogy egy ISBN alá több száz különböző mű került. Hivatalosan hiába könyv jellegű dolgok azonosítására szolgál, vannak cd-k, könyvjelzők és pólók is, amik kaptak ISBN-t. Van egy csomó más azonosító is, de minddel az a probléma, hogy adminisztrációs furcsaságok miatt gyakori az ismétlés vagy a hiba.
Épp ezért a Google a 2010-es felméréséhez (frissebbre nem bukkantunk) több mint 150 metaadat-szolgáltatótól gyűjtött be információt, és a 2010-ig több mint egymilliárd egyedi feljegyzést szedtek össze. Ebben azonban rengeteg az ismétlődés, így 600 millió feljegyzésre tudták lecsökkenteni. Még ez is rengeteg ismétlődést tartalmazott: a Programming Perl harmadik kiadásából például 46 helyről 96 feljegyzést kaptak.
Egy másik, hasonló példa: H.P. Lovecraft Az Őrület hegyei című művének egy 1971-es kiadásáról (At the Mountains of Madness and Other Tales of Terror) két különböző katalógus-kártyát kaptak. Az egyik szerint a Ballantine Books adta ki, a másik szerint pedig a Beagle Books. Az utóbbi nem egy ismert kiadó, mégpedig azért, mert nem is létezik. A borítón viszont látható, hogy a Beagle Horror Collection része, így elképzelhető, hogy egy kapkodó könyvtáros véletlenül a Beagle-t adta meg kiadónak.
A Google végül 129 864 880 címet számolt össze, és ez a szám azóta nyilván egyre nagyobb. Egyes mérések szerint évente nagyjából 2-2,5 millió könyvet adnak ki világszerte, tehát 12 év elteltével (ha 2,2 millióval számolunk) akkor
156 264 880 címnél járhatunk.
Ebből persze kimaradnak azok a kész könyvek, amik sose kerülnek ki egy önbizalomhiányos író fiókjából, és persze azok is, amik eltűntek/elégtek/eláztak/szétporladtak/vécépapírként végezték az elmúlt, nem elég lelkesen adminisztráló évszázadokban.