Het debat over welke taal de meeste woorden heeft, kan nog geruime tijd aan de gang zijn. En het punt hier is helemaal niet het gebrek aan nauwkeurige gegevens, maar de taalkundige kenmerken van elke taal. Allereerst verwart het de vraag wat er precies als een woord en een taal kan worden beschouwd.
Volgens de heersende mening kan een woord worden beschreven als een verzameling letters tussen twee spaties. Maar als u bijvoorbeeld de taal van de Groenlandse eskimo's neemt, wordt daarin in één woord de hele zin beschouwd. Er zijn problemen in minder exotische talen. De Tsjechische taal impliceert bijvoorbeeld de versmelting van het deeltje "niet" met werkwoorden; in het Turks staat deze ontkenning in het midden van het woord. Dus volgens onze regels blijkt dat elk woord met de ontkenning erin afzonderlijk moet worden beschouwd.
De vraag rijst: hoe zit het met woorden met verschillende eindes (bijvoorbeeld "mooi", "mooi", "mooi"), evenals homoniemen - bijvoorbeeld een kasteel als gebouw en een kasteel als apparaat? Is het mogelijk om de afkortingen - KVN, KGB, ATS, etc. als afzonderlijke woorden te tellen? In elke taal zijn er tienduizenden vergelijkbare trucs.
Nog lastiger zijn vragen over wat precies als een taal wordt beschouwd. Kunnen verschillende dialecten en dialecten betrekking hebben op individuele talen of zijn het varianten van de hoofdtaal? Zo komt het in Afrika en Europa vaak voor dat het onmogelijk is om direct te bepalen welke taal voor een bepaald dialect de hoofdtaal is. En is het mogelijk om ondubbelzinnig aan te geven tot welke van de talen sommige woorden behoren? 'Ataman' of 'hut' zijn bijvoorbeeld Oekraïense of Russische woorden? Naar welke taal kunnen de woorden "site", "server", "provider" verwijzen - Russisch, Engels, Duits of allemaal tegelijk?
Daarom is het de moeite waard om ons alleen te beperken tot algemene berekeningen die niet beweren wetenschappelijk te zijn. De Russische taal bevat volgens taalkundigen ongeveer 500.000 woorden. Dit aantal is bij benadering en bevat geen specifieke wetenschappelijke termen. Maar hier zijn er verouderd, ontleend aan andere talen, samengestelde woorden, aanhankelijke, verkleinende vormen en andere. Als we kijken naar het gezaghebbende Big Academic Dictionary, dat uit zeventien delen bestaat, zal het 131.257 woorden bevatten. Er moet echter rekening mee worden gehouden dat het jaar van publicatie 1970 is en dat de Russische taal de afgelopen 40 jaar veel veranderingen heeft ondergaan en aanzienlijk is verrijkt met concepten zoals bijvoorbeeld "perestroika", "internet", enz.
Wat betreft de Engelse taal, volgens monitoring door Global Language Monitor, in 2009 bedroeg het aantal woorden meer dan een miljoen en daarin blijft het toenemen. Bovendien was het miljoenste woord "Web 2.0". Volgens gezaghebbende woordenboeken loopt Engels ook voor op Russisch. Zo bevat de 3e editie van het Webster-woordenboek 450.000 woorden, terwijl het Oxford-woordenboek ongeveer 500.000 woorden bevat.
Van bijzonder belang zijn hiëroglifische talen waarin een enkel symbool niet een letter maar een heel woord aangeeft. In dit geval zijn directe vergelijkingen volkomen onmogelijk. Als we echter de woordenboeken vergelijken, verliezen dergelijke talen, tot ieders verbazing, veel. Het meest complete Japanse woordenboek bevat bijvoorbeeld 50.000 tekens. Maar het Ministerie van Onderwijs van Japan keurde slechts 1850 tekens goed voor dagelijks gebruik. De Chinese taal bevat ongeveer 80 duizend karakters. Maar echt, veel minder wordt hier ook gebruikt. De staatsstandaard "Basisset hiërogliefen" werd in 1981 goedgekeurd en omvat 6763 hiërogliefen.
De kwantitatieve leiders krijgen onverwacht de Italiaanse taal. Daarin worden alle samengestelde cijfers in woorden samen geschreven, in één woord. De getallenreeks is, zoals u weet, oneindig, daarom is het aantal woorden in de Italiaanse taal oneindig.