Thursday, February 28, 2013

Wat er mis is met de Porno-grafiek van De Morgen

Op Donderdag 28/0213 verscheen er in De Morgen een artikel, 'Pleidooi voor porno. Maar niet helemaal', geschreven door Sjoukje Smedts. Het is een genuanceerd artikel waarin allerlei experten hun zegje kunnen doen over het fenomeen porno. Een prima stuk dus ... Maar niet helemaal. De grafiek die erbij staat, een spindiagram, kon beter.

Ten eerste valt onmiddellijk op dat de verhoudingen niet kloppen. Het percentage Dagelijkse porno kijkers is ongeveer 10 maal kleiner dan het percentage mensen die zeggen ongeveer één keer per week naar porno te kijken. In de spindiagram lijkt de verhouding eerder de helft. Het lijkt erop dat de binnenste 7-hoek niet wordt meegeteld. Maar zelfs dan lijkt de 13.3% van 'ongeveer één keer per maand' niet te kloppen.
Maar los daarvan kan je je afvragen of zo'n spindiagram (spider of radar graph) wel de beste voorstelling is. In principe is bij een spin diagram de volgorde van de verschillende variabelen niet van belang, en dus is het ook niet fout om de diagram zo voor te stellen zoals hier het geval was. Maar, met een beetje goede wil, zou je kunnen zeggen dat de variabele "Mate van porno kijken" een ordinaal meetniveau heeft. Je zou dus de verschillende categorieën kunnen ordenen van zelden naar heel vaak. Een andere mogelijkheid is om de categorieën te ordenen van de meest voorkomende naar de minst voorkomende. In dit geval geven de twee benaderingen toevallig hetzelfde resultaat. Reden te meer om dat te doen. Persoonlijk denk ik dat een gewone staafdiagram hier uiteindelijk het duidelijkste is.

Je zou ook de zaak cumulatief kunnen voorstellen. Je kan moet dan wel eerst de percentages van hierboven herrekenen naar een totaal van 75,3%.

Persoonlijk doe ik dat liever alleen bij echte metrische variabele, al is het maar omdat nu ontbreken van een zinvol label voor de laatste categorie vreemd overkomt.

Monday, February 18, 2013

A data scientist looks at the Belgian Municipal Elections.

Remark: This is the english version of my previous Dutch blog post.

After the provincial and municipal elections of the 14th of October in Belgium, media reported several cases of candidates who had received more preference votes than what normally could have been expected. The additional votes were attributed to a problem with the touch screens of the voting machines. When voters pressed too long when selecting a party, the system would sometimes register a preference vote for the candidate whose name appeared in the same area as where the party was. The figures below illustrates well what the issue is.
The figure on the left is the Parties Screen, i.e. the first screen the voter sees. On that screen the voter selects a party (sometimes called a list). In this case, the voter has selected the PVDA+ party, as indicated by the blue rectangle. The figure on the right hand side is the candidates screen, i.e. the subsequent screen the voter sees. This screen shows all the candidates for the party that was selected in the previous sceen. It was reported that in some cases, especially when the voter pushed too hard or too long, the second screen would register a preference vote for the candidate at the same location on the screen as where the party name was (also indicated with a blue rectangle). For simplicity's sake we will call the position that corresponds with the exact location where the party name was a hotspot.
While some individual cases of remarkbable results were widely reported in the newspapers, a more thorough investigation of the problem was, as far as I know lacking. This effectively means that the magnitude of the effect was unknown.
As a Data Scientist that's the kind of question that you would find interesting and you would wonder how big the 'Touch Screen Effect' was. That's exactly what I did in a paper you can download here. In this blog post I'll try to summarize what I did, focussing on the Data Science aspects.
The first problem is to get the data. While a lot of (news-)websites offered web applications to retrieve the results of the elections in a meaningful way, none of them allowed me to download the complete set of results, i.e. for earch candidate, on each list (or party), in every municipality of the Flemish part of Belgium, the number of preference votes was needed. So I wrote a Python script to scrape the data from one of those websites. I used the BeautifulSoup and Selenium packages for that. If the hypothesis of a "Touch Screen Effect" is true we would expect a higher number of votes on hotspots than on the other positions. So the second problem becomes: "What is the expected number of votes for a given candidate on a given position, on a given list (or party) in a given municipality". For reasons that are detailed in the paper we chose to model the natural logarithm of the share of vote of a candidate (relative to his or her party in his or her municipality) with a multilevel regression model based on a polynomial of the third degree of the position of the candidate on the list. The polynomial is needed to capture the curvilinear nature of the data. Typically the candidates on top of a list, and the candidates at the bottom of the list receive more votes than those in between. The computations where done in R, using the LME4 package. Those who are interested can find the formulas in the original paper. The figure below illustrates this curvilinear nature for a random selection of 9 party-municipality combinations. The red line comes from a local regression model, the green line is the multilevel model that was used in the final analysis.
Remark: for a figure of better quality see the original paper

So far so good. The third problem is to decide on what constitutes an exceptional share of vote. Here we use the standardized residuals, as calculated by the LMERConvenienceFunctions in R (this is because in mixed models the calculation of standardized residuals is not that straightforward). Values above 2 are considered as being outliers.
With these three problems solved we can show the results for the main parties in the city of Antwerp (see below). The black points are the share of votes of the candidates (expressed as percentages) in function of the position of the candidate. The red points are those that are considered to be outliers, using the criterion descussed above. The green line is is the multilevel regression line. Hotspots are indicated by two blue vertical lines. Notice that in this figure the first 4 positions were omitted (for a justification, see the original paper).
Remark: for a figure of better quality see the original paper

In the figure above we see that all parties, except Open Vld, have an outlier that happens to be on a hotspot. There are a few parties that have more than one hotspot, while only one of them is actually an outlier. And finally, there are some outliers that are not on a hotspot. The latter observation should not come as a surprise. Exceptional election results can be attributed to lots of things, such as running a good campaign, being famous, and so on. In other words, the fourth problem is that we need to take into account that outliers could also just accidentally be on a hotspot. The approach I'm using is based on the calculation of some simple conditional probabilities. The probability for a hotspot in Antwerp to be an outlier (i.e. have substantially more votes than expected based on the position on the list) is about 55%. The probability for a normal (non-hotspot) position to have an outlier is 7%. The ratio between the two is 7.5. This means that the probability to have an exceptionally high share of votes (i.e. being an outlier) is 7.5 times higher for a hotspot than it is for a normal position.
It must be said that not all municipalities have the same spectacular effects as in Antwerp. On the other hand we should also stress that estimates are probably conservative. One of the reasons why this is the case is that the regression model is generally good, except for the first and last position. This effectively means that there are quite a lot of outliers on those two positions, while those positions are not relevant from the perspective of the Touch Screen issue. We can calculate less conservative estimates by disregarding the first two positions and the last two positions. Also, my approach doesn't work well for smaller municipalities because the lower number of observations. And hence we limit ourselves to the 12 most important Flemish cities where electronic voting was used. In those cities the overall, conservative, estimate is almost 2, while the less conservative estimate is 4.5. I repeat the interpretation here: In the most important Flemish cities that used electronic voting, the probability to have a (much) higher votershare than expected on a hotspot is almost twice as high as it is for a normal position. If we use the less conservative estimate it becomes 4.5.
Some parties are more affected than others. The right wing Vlaams Belang party seems to be more affected than others. If we again limit the analysis to the 12 most important Flemish cities that used electronic voting we see that the probability that a hotspot is an outlier is 40%. This is 10 times higher than it is for other positions for this party. If we use the less conservative estimate the ratio becomes more than 80.
The heatmap below illustrates the situation for Vlaams Belang in the main Flemish cities well. The columns are the twelve major cities in Flanders that used electronic voting. The rows are the positions on the candidates-list. The blocks with a blue border are the hotspots. Notice that the total number of candidates on the list can vary over the cities. The colouring of the heatmap is a function of the squared residuals of the multilevel-model. We thus take a less binary approach as we did above when we classified all cases as either being outliers or not. The dark areas (red and orange) are the positions where the voter share was close to the expectation. Lighter colours (yellow and white) indicate positions that deviated from the expectation (higher or lower). The first thing we notice in the heatmap below is that the top position and the last position are generally not well estimated by the regression model. That's not ideal, but it is less relevant from a "Touch Screen Effect" point of view (none of the top or bottom positions are on a hotspot). The important thing here is to notice that the remaining area between the top and the last position generally is dark (red or orange). There are some brighter spots, though. The brightest spots happen to be in the blue rectangles, i.e. hotspots, illustrating the effect of the position of the partyname (on the previous screen) on the preference votes themselves. It appears that besides Turnhout, the only cities that were not affected are those where the party name was split over two candidate columns (and hence two hotspots for Genk, Aalst en Roeselare).

Remark: for a figure of better quality see the original paper

Based on these findings I'm confident that the 'Touch Screen Effect' as reported by the newspapers right after the muncipal election in Flanders, Belgium in 2012, were not only anecdotal, but had a clear effect in Flanders's largest cities. The study remain inconclusive with regard to smaller municpalities. On aggregate there remains a noticeable effect over all municipalities were electronic voting was used. Some cities, such as Antwerp, and some parties, such as Vlaams Belang, seem to be stronger affected than others.
From a Data Science perspective it is interesting to notice that in this reseach I had to combine 3 skills:
  • Hacking skills to assemble all required data (Scraping of the election results from a news website with Python).
  • Statistical skills to model the data and detect outliers (multilevel regression models in R with the lme4 and LMERConvenienceFunctions packages).
  • Substantive expertise in the political situation in Belgium to understand how the election process works.
It is not by accident that these are also the three elements in The Data Science Venn Diagram of Drew Conway:

Sunday, February 17, 2013

Het 'touch screen effect' bij de gemeenteraadsverkiezingen in Vlaanderen

(My apologies for this Dutch post. Soon I'll write an English one on the same subject, but then from a Data Science point of View.)

De gemeenteraadsverkiezingen van oktober jongstleden blijven de gemoederen beroeren. Deze week waren er minstens drie berichten in de actualiteit die te maken hadden met de nasleep van de jongste gemeenteraadsverkiezingen. Er is de kwestie Ninove (zie De Morgen: Geen nieuwe verkiezing in Ninove na "inside joke"), de onwettelijke samenstelling van een aantal Vlaamse OCMW raadsleden (zie De Morgen: "Partijen op lokaal vlak te weinig ondersteund door hoofdkwartieren") en, tenslotte, is er de (vermeende) dubbele voordracht van schepenen in Zaventem (zie De Morgen: Gemeentebestuur Zaventem verzekert continuïteit werking). Het lijkt er dus een beetje op dat Vlaanderen het niet zo gemakkelijk heeft om de verkiezingen te verteren. Maar de problemen dateren niet van nu. Sommigen zullen zich nog herinneren dat de dag van de verkiezingen ook niet vlekkeloos waren verlopen. Er waren wachtrijen en technische mankementen (zie Gazet Van Antwerpen: Heel wat problemen met stemcomputers in de regio) en de problemen met de Touch Screens van de stem computers (Zie Het Laatste Nieuws: Slecht afgestelde stemcomputers leveren extra stemmen op).
Toch is het fair om te zeggen dat Vlaanderen z'n best heeft gedaan om de zaak in goede banen te leiden. De website, bijvoorbeeld, opgezet door het Agentschap voor Binnenlands Bestuur, probeert in ieder geval om zoveel mogelijk duidelijkheid te scheppen rond de voorbereiding en de afhandeling van de verkiezingen. Verder waren er infobrochures, en er waren filmpjes over hoe je elektronisch moet stemmen te bekijken op YouTube en op de Vlaamse televisiezenders. Bovendien had het Vlaamse Ministerie van Binnenlandse Zaken het gereputeerde Price Waterhouse Coopers (PwC) ingehuurd om de nieuwe stemcomputers te testen. Er werden zelfs een aantal hackers losgelaten op het systeem om de veiligheid ervan uit te proberen (Zie De Redactie:Bourgeois laat hackers los op stemcomputers).
Eén van de zaken die me persoonlijk sterk heeft verbaasd is de mildheid waarmee men gereageerd heeft op het zogenaamde 'touch screen effect'. Er waren nochtans enkele opvallende uitslagen. Zo meldde De Redactie (Verkozen dankzij de nieuwe stemcomputers?) dat:
In Antwerpen-stad kreeg de vrij onbekende Nick De Wilde, 14e op de Vlaams Belanglijst, maar liefst 2.077 voorkeurstemmen, meer dan voorzitter Bruno Valkeniers (19e plaats, 1.221 voorkeurstemmen) of lijstduwer Gerolf Annemans (1.563 voorkeurstemmen). Meteen goed voor een plaatsje in de gemeenteraad.
Bij Vlaams Belang en PVDA+ waren de nummers 14 de gelukkigen (zo kreeg bij PVDA+ Lieve Peeters 740 voorkeurstemmen, de kandidaten boven en onder haar 355 en 319), bij de N-VA en Groen waren dat de nummers 10. N-VA'er Rob Van de Velde kreeg met 4.081 gekleurde bolletjes achter zijn naam, de op drie na meeste voorkeurstemmen van de N-VA-lijst.
De oorzaak van dit alles waren, volgens enkele kranten, de Touch Screens van de stemcomputers. Het Nieuwsblad (zie Stemcomputer verkiest kandidaten per ongeluk) schreef dat:
Zelfs de Belangtop kende niet meteen Nick De Wilde die in Antwerpen met 2.077 stemmen voorzitter Valkeniers het nakijken gaf en verkozen raakte in de gemeenteraad. De Wilde voerde niet eens campagne. ‘Boosdoeners’ zijn de nieuwe stemcomputers waarover bevoegd minister Geert Bourgeois (N-VA) gisteren in het Vlaams parlement lovend sprak. De touchscreens blijken te gevoelig te zijn. Kiezers die te hard (of per ongeluk twee keer) drukten op het stemveld voor een partij gaven automatisch een kandidaat een voorkeurstem. Wie die gelukkige was, hing af van de plaats van dat veld op het computerscherm. Bij Vlaams Belang en bij PvdA+ ging het voordeel naar de nummer 14. Bij de N-VA en Groen ontving de nummer 10 een onverwachte bonus. Rob Van de Velde (N-VA) haalde met 4.081 voorkeurstemmen haast de top tien. Met 1.043 stemmen werd Dirk Avonts (Groen) tweede opvolger.
Toch werd vrij snel het probleem geminimaliseerd. In hetzelfde artikel werd geschreven dat:
Jacques Mahieu, die als voorzitter van de Antwerpse rechtbank de Antwerpse kiesverrichtingen superviseerde, bevestigt het verhaal. ‘Inderdaad, twee getuigen hebben me dat verteld. Juridisch is er geen probleem, het gaat eigenlijk om een fout gebruik van de computer. Tussen de lijsten maakt het geen verschil, binnen de lijsten natuurlijk wel. Kiezers moeten wat aandachtiger zijn. Ze krijgen bovendien de kans om een eventuele foute stem te corrigeren.’
Ook Geert Bourgeois, de bevoegde Minister, zag, in eerste instantie, geen grote problemen. Het Laatste Nieuws (Zie Slecht afgestelde stemcomputers leveren extra stemmen op) schreef dat:
Geert Bourgeois gelooft niet dat mensen door te lang drukken op de stemcomputer ongewild op bepaalde kandidaten gestemd hebben. Zijn agentschap en het bedrijf dat de computers leverde "hebben dat vandaag nog eens uitgeprobeerd", benadrukte hij op Radio 1. "Wat wel kan is dat de kiezer de vinger op het scherm houdt en gemakshalve de eerste de beste persoon aanvinkt. Er zijn telkens twee aparte handelingen nodig", onderstreept Bourgeois. "Mijn agentschap en het bedrijf dat de computers leverde spreekt tegen dat dit kon gebeuren door te lang te drukken." Ook bij de 85.000 tests door PriceWaterhouseCoopers is het probleem "nooit gesignaleerd". Bovendien voorziet het systeem in verschillende controles, argumenteert de N-VA-minister voorts. "Zo kan je niet alleen je print nalezen, maar je ziet het ook op het scherm, waar je je stem nog eens moet bevestigen. Ik ga ervan uit dat mensen die stemmen, dat ook bewust doen."
Later, toen bekend werd dat PwC het probleem met de Touch Screens wel had ontdekt, maar niet gemeld had bij de overheid (Zie Het Nieuwsblad: Geert Bourgeois en de stemcomputers : ‘Ik sta voor schut’), veranderde Geert Bourgeois van toon en kondigde aan te onderzoeken welke maatregelen hij kon nemen tegen PwC.

Een statistisch onderzoek naar het "Touch Screen Effect".

Vanuit statistisch standpunt kun je je natuurlijk de vraag stellen of er nu werkelijk sprake is van een "Touch Screen effect" of niet. Om dit na te gaan trachtte ik uitzonderlijke verkiezingsresultaten (outliers of uitbijters) te identificeren door de residuelen van een multilevel model gefit op de verkiezingsuitslagen te bestuderen, en deze te relateren aan de posities van de kandidaten en hun lijst op de computerschermen. Hieronder probeer ik het onderzoek zo eenvoudig mogelijk uit te leggen. Wie interesse heeft voor de statistische details verwijs ik naar de paper zelf: The 'Touch Screen Effect' in the Belgian municipal elections of 2012.
Ten eerste een recapitulatie van het probleem. Bij het elektronisch stemmen moet men op een eerste scherm een partij (of lijst) kiezen, om vervolgens, op een tweede scherm, een kandidaat te kiezen.

In het voorbeeld hierboven heeft iemand voor PVDA+ gekozen (zie het blauwe vierkantje op de linkse figuur). In de figuur rechts is de overeenkomstige plaats bij het kandidaten scherm eveneens met een blauw vierkantje aangeduid. Bij deze studie concentreerde ik me op de plaats exact in het midden van het vierkantje, i.e. de plaats waar ook de naam van de partij of lijst staat. Gemakshalve noem ik de positie van de kandidaat die net onder zijn of haar lijstnaam staat, een hotspot. Als er sprake is van een "Touch Screen Effect" is de verwachting dat er er meer stemmen op de hotspots te vinden zijn dan men normaal zou verwachten.
Wat men normaal zou verwachten is niet zo evident te bepalen, immers, het aantal stemmen dat een kandidaat krijgt is een functie van heel wat variabelen. Als men alleen al naar de positie kijkt dan weten we uit ervaring en uit ander onderzoek dat de eerste plaatsen (de zogenaamde lijsttrekkers) en de laatste plaatsen (de zogenaamde lijstduwers) over het algemeen meer stemmen genereren. Met een beetje goede wil kan men het verband tussen de positie op de lijst en het aandeel in de stemmen zien als een U-curve (eerst hoog, dan lager, en vervolgens terug hoger). In de paper wordt een regressie-model gebruikt om zo goed mogelijk het verband tussen de positie op de lijst en (het natuurlijk logaritme van) het aandeel van de stemmen van een kandidaat (relatief ten opzichte van het aantal stemmen voor de lijst) te benaderen. Om het curvilineair verband goed te vatten wordt in het regressiemodel een derdegraadsvergelijking gebruikt. In de paper wordt dieper ingegaan waarom een multilevel model hier de voorkeur geniet. De figuur hieronder kan je voor een selectie van 9 partijen-en-gemeenten combinaties, voor jezelf uitmaken in welke mate het model de gegevens goed samenvat of juist niet. De rode lijnen zijn de normale regressies en de groene lijnen komen van de multilevel modellen die uiteindelijk werden gebruikt voor de verdere analyse.

Noot: Voor een beter leesbare versie van deze grafiek, zie de oorspronkelijke paper
Nu kunnen we de mate waarin het stemmenaandeel van een kandidaat meer of minder afwijkt van wat we verachten op basis van de regressie zien als een maat van het hebben van meer of minder stemmen dan men zou verwachten op basis van de positie op de lijst. Vervolgens werd naar de gestandaardiseerde residuelen gekeken om, voor elke kandidaat, na te gaan of er sprake is van een outlier (uitbijter) of niet. Tenslotte werd, voor elke kandidaat, nagegaan of ze op een hotspot zaten of niet.
De figuur hieronder geeft de resultaten weer voor de belangrijkste lijsten van de stad Antwerpen. Ik kies hier voor Antwerpen omdat daar het "Touch Screen" effect (waarschijnlijk) het grootst is. Straks wordt er verder ingegaan op de andere steden en gemeenten. Omwille van de leesbaarheid zijn de eerste vier posities niet weergegeven (zie de oorspronkelijke paper voor een argumentatie waarom. In de paper vind je ook dezelfde figuur waarin de posities 1 tot en met 4 wel zijn opgenomen). De zwarte punten geven de werkelijke stemaandelen weer per positie. De groene lijn is de regressie lijn van het multilevel model. Outliers (uitbijters) zijn in her rood gekleurd. De hotspots worden weergegeven door een paar van blauwe verticale lijnen.

Noot: Voor een beter leesbare versie van deze grafiek, zie de oorspronkelijke paper
In de bovenstaande grafiek zien we dat in Antwerpen bij PVDA+, Groen, Stadslijst, Rood! en Vlaams Belang er een outlier is die ook een hotspot is. Alleen bij Open Vld is dat niet het geval. Er zijn wel een aantal partijen waar meer dan één hotspot is, waarvan er slechts één ook effectief een outlier is. Tenslotte zien we ook outliers die niet op een hotspot zitten. Dat laatste mag alvast niet verbazen want er zijn, buiten de positie op de lijst, nog heel wat andere elementen die het relatieve stemaandeel bepalen. Het goede resultaat kan te wijten zijn aan een uitzonderlijke campagne, het kan gaan om BV's, of mensen die een zichtbaar mandaat bekleden enzovoort. Kortom, we moeten nog nagaan of hetgeen we observeren niet aan het toeval te wijten kan zijn. Een eenvoudige manier omdat te doen is om conditionele kansen te beschouwen. In Antwerpen is de kans dat een hotspot een uitzonderlijk hoog stemaandeel heeft ongeveer 55%. De kans op een outlier bij een normale (niet-hotspot) positie is ongeveer 7%. De verhouding van beide kansen is 7,5. Dit wil zeggen dat de kans op een opvallend hoog stemaandeel op een hotspot 7,5 keer groter is op een hotspot dan op een gewone plaats. In andere steden is dat heel wat minder spectaculair, maar daar moet wel bij worden vermeld dat de methode die ik gebruikt heb een conservatieve inschatting oplevert omdat:
  • het gebruik van residuelen om outliers te bepalen niet goed werkt bij kleinere gemeenten wegens het kleiner wordend aantal observaties
  • er op een vrij zwart-wit manier gekeken worden naar uitzonderlijke stemmenaandelen (met name, outlier of niet), terwijl er ook sprake zou kunnen zijn van een (stijgend) effect zonder dat dit noodzakelijk tot een effectieve outlier aanleiding geeft (een voorbeeld hiervan is positie 14 voor PVDA+).
  • ik hier de hotspot heb beperkt tot die positie die in het midden staat, terwijl aangrenzende posities ook een extra stemmenwinst zou kunnen opleveren (mogelijke voorbeelden hiervan in Antwerpen zijn: PVDA+, Rood!, N-VA en Vlaams Belang.)
  • ik de coordinaten van de hotspots heb moeten inschatten en mogelijk fouten heb gemaakt
  • er veel outliers zijn bij de eerste twee en de laatste twee posities, terwijl die posities net minder relevant zijn voor de "Touch Screen" problematiek
Aan dat laatste kan verholpen worden door bij de conditionele kansenbenadering de eerste twee en laatste twee posities uit te sluiten.

Een conservatieve inschatting van de kansverhouding voor alle Vlaamse gemeenten waar elektronisch werd gestemd samen (Brussel uitgesloten) is 1,10. Nog steeds een effect, maar een eerder klein effect. Wanneer we de eerste twee en laatste twee, outlier-rijke posities, niet mee opnemen in de analyse, dan wordt die verhouding 1,44. Dat wil dus zeggen dat de kans op een uitzonderlijk stemaandeel op een hotspot een tiende tot tot een goede 40% hoger is op een hotspot dan bij een gewone positie. Als we alleen de centrumsteden waar electronisch gestemd werd bekijken dan is de conservatieve inschatting van die kansverhouding bijna 2, en de minder conservatieve inschatting meer dan 4,5. Ik herhaal hier nogmaals de interpretatie: De kans om, in een Vlaamse centrumstad (Gent uitgesloten), een uitzonderlijk stemaandeel te realiseren is op een hotspot bijna tweemaal zo groot als op een normale positie. De minder conservatieve inschatting geeft aanleiding tot een kansverhouding van meer dan 4,5.
Als we naar individuele partijen kijken dan zien we dat sommige partijen meer te lijden hebben gehad van het "Touch Screen Effect" dan anderen. Het valt bijvoorbeeld op dat Vlaams Belang, vooral in de centrumsteden, te maken heeft gehad met een sterk "Touch Screen Effect". Zo is de kans dat een hotspot op een Vlaams Belang lijst in een centrumstad (Gent uitgesloten) een uitzonderlijk stemaandeel oplevert niet minder dan 40%. Dat is 10 keer zoveel als op een normale positie voor die partij. Als men de minder conservatieve inschatting gebruikt stijgt die kansvehouding zelfs tot meer dan 80. De hele problematiek wordt aanschouwelijk in de Heatmap hieronder. De kolommen zijn de 12 centrumsteden waar elektronisch werd gestemd (Gent stemde met papier en potlood). De rijen zijn de posities van de kandidaten. Aangezien het aantal kandidaten op de Vlaams Belang lijst verschillend is van stad tot stad is de grafiek gekarteld. De donkere kleuren (rood en oranje) geven die posities aan die weinig of niet afwijken van wat we verwachten voor die positie (voor de statistici: de kleuring van de heatmap hangt af van de gekwadrateerde residuelen van het eerder besproken multilevel model). De lichte kleuren (tinten van geel en wit) geven sterk afwijkende stemaandelen weer. We zien meteen (op de eerste rij en de laatste kolommen) dat het model niet zo goed in staat is om de stemaandelen van de lijsttrekker en de lijstduwer te modelleren. Voor de studie van het "Touch Screen Effect" kan dat gelukkig niet zo veel kwaad. Hier zijn we vooral geïnteresseerd in het relevante gedeelte, zeg maar tussen de tweede en de voorlaatste positie. Zoals je kan zien is dat gedeelte over het algemeen netjes rood of donker oranje. Er zijn af en toe outliers die een uitzonderlijk hoog (of laag) aandeel in het totaal aantal stemmen van hun lijst hebben gehaald. In de kolom van Antwerpen, bijvoorbeeld, zie je dat de posities 4, 14, 19 en 20 eerder naar het licht oranje en zelfs geel neigen. Het gaat hier dus om een minder binaire (zwart-wit) manier om naar uitzonderlijke stemaandelen te kijken. De hotspots voor Vlaams Belang zijn aangeduid met een blauw rechthoekje. Onmiddellijk zie je dat in de meerderheid van de Vlaamse centrumsteden de hotspots ook een fellere (gele) kleur krijgen, wat een aanduiding is van een (sterk) afwijkend stemaandeel. Het lijken vooral steden te zijn waar de positie van de lijstnaam op het lijstenscherm gedeeld werd over twee kolommen van kandidaten (vandaar ook twee hotspots per stad in Genk, Aalst en Roeselare) dat de partij gespaard is gebleven van het "Touch Screen Effect".

Noot: Voor een beter leesbare versie van deze grafiek, zie de oorspronkelijke paper

Ik durf op basis van deze vaststellingen te concluderen dat de problemen met de Touch Screens een duidelijk effect hebben gehad op de resultaten van de voorkeurstemmen bij de voorbije gemeenteraadsverkiezingen. Wel is het zo dat je, mijns inziens, op statistische gronden, niet kan nagaan of een bepaalde kandidaat eigenlijk teveel stemmen heeft ontvangen en eventueel ten onrechte verkozen is geweest. Ik vind het daarom niet verkeerd dat de Raad voor Verkiezingsbetwistingen, geen rekening heeft gehouden met het Touch Screen probleem toen het de verkiezingsuitslagen moest goedkeuren. Als je echter alle kandidaten samen beschouwt, dan kan je wel besluiten dat het heel onwaarschijnlijk is dat de goede resultaten van de kandidaten op de hotspots, louter aan het toeval te wijten is.