Door middel van Application Programming Interfaces (API’s) bieden social media websites zoals Twitter programmeurs en andere geïntereseerden de mogelijkheid om gestructureerd informatie van hun websites te downloaden. Daarnaast heeft diverse programmeersoftware tegenwoordig eigen applicaties (e.g., RCurl) om systematisch informatie van het web te halen. Geïnteresseerd in de mogelijkheden die de overvloed aan (gratis) informatie op het Internet biedt, heb ik een aantal experimentele proejcten gestart afgelopen jaren. Deze projecten komen voort uit persoonlijke interesse en zijn geenszins verbonden aan mijn academische en profesionnele activiteiten.


#Trump

Eind 2016 lekte de Washinton Post een videofragment uit waarin Donald Trump, presidentskandidaat op dat moment, vrij oneerbiedige sprak over verschillende bevolkingsgroepen. Rond die tijd was ik aan het experimenteren met de Twitter API en heb ik 10000 tweets met #Trump gedownload, waarvan de helft voor het incident en de andere helft erna. Deze tweets heb ik vervolgens geanalyseerd met behulp van een sentiment lexicon (Hu & Liu, 2004) om te achterhalen in hoeverre het sentiment van het twitterende publiek was aangedaan door de lek. Inderdaad was er in toenemende mate sprake van negatief sentiment, maar minder dan ik persoonlijk had verwacht. Limitaties zijn dat ik slechts unigrams heb gebruikt en de sample van tweets wellicht niet representatief was.

 

results
Drie visualisaties van het sentiment omtrent #Trump

 


#WIDM?

Begin januari 2017 begon het 17e seizoen van de Nederlandse televisie spelshow Wie is de Mol?. Over de loop van het seizoen heb ik met de Twitter API alle tweets gedownload die #WIDM bevatten. Vervolgens heb ik met deze tienduizenden berichtjes gekeken in hoeverre de populariteit van de 10 deelnemers veranderde over de loop van de tijd. Hierin waren duidelijke trends zichtbaar, zeker wanneer je inzoomde op de frequentie waarmee specifieke woorden werden gebruikt om deelnemer te omschrijven (e.g., mol of verdacht). De analyses zijn gepubliceerd in een serie blogs op LinkedIn, waarvan je hier de eerste kunt vindt.

e2_correlation_words_mentions
Een visualisatie uit de tweede blog over het #WIDM project