Google N- gram viewer: Man vs Women

Posted on Posted in Geen categorie

Hoe weet een computer wat de betekenis van een woord is? Voor een computer is een woord immers niet meer dan een aatal tekentjes in een bepaalde volgorde. Een computer heeft geen idee wat de emotie achter een tekst is. Toch kun je een computer dat leren, bijvoorbeeld door aan te geven welke woorden positief of negatief zijn. Qing gebruikt software bij het helpen van bedrijven met het analyseren van (grote hoeveelheden) tekst. Bijvoorbeeld door antwoord te geven op vragen als: Wat zijn de belangrijkste onderwerpen in de tekst(en)? Is men daar positief of negatief over?
Googe is sinds 2004 bezig met het digitaliseren van boeken. Boeken vanaf het jaar 1500, in het Engels, Chinees, Duits, Spaans, Frans en Russisch worden gedigitaliseerd en in een enorme database geplaatst. Dit heeft ertoe geleidt dat er nu meer dan 500 miljard woorden in die database staan.
Die woorden zijn geschreven tussen 1500 en 2008. Zonder de “echte” betekenis van het woord te weten, kan de computer door alleen de woorden te tellen inzicht geven in de ontwikkeling van de menselijke geschiedenis.
Zoals fossielen een verhaal vertellen over de evolutie en hoe de wereld zich ontwikkeld heeft, zo zeggen woorden iets over de ontwikkeling van de mensheid.
Want Google heeft een eenvoudige “tool” ontwikkeld waarmee je razendsnel informatie uit die database kan halen, namelijk de N-gram Viewer.

Ngramviewer

Een N-gram is een vaste woord volgorde zoals: “Coca Cola” (2-gram) of “Robert De Niro” (3-gram).
De N-gram zet je in het tekstvakje. Bij meerdere N-grams zet je er een komma tussen. Wanneer je de N-grams in het tekstvakje hebt geplaatst, klik je op “Search lot of books”. De Google Ngram viewer laat dan in een lijn grafiek zien hoe de populariteit van de de N-gram zich in de tijd ontwikkelt.
Wanneer je bijvoorbeeld “man, woman” invult krijg je de lijngrafieken zien.

Line-graph-Ngram-viewer_BlogIV

De grafiek laat zien dat “women” in vergelijking met “Men” niet vaak in teksten werden genoemd. Tot aan de begin jaren “70, bij de opkomst van het feminisme.
Hier nog een paar leuke voorbeelden:
• Rolling Stones, Beatles
• pizza, spaghetti, hotdog
• acid rain (zure regen)
• McDonalds, Burger King
• Catholic, Protestant
• Robert De Niro, jack Nicholson
• Hospitality
Zo zijn er vele combinaties mogelijk. Leuk om eens te proberen en om tijdens de kerstdagen aan tafel te bespreken.

Wanneer je meer leuke voorbeelden hebt, plaats ze dan in de reactie

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *