Hem databaser Använda algoritmer för att förutsäga val: en chatt med drog linzer

Använda algoritmer för att förutsäga val: en chatt med drog linzer

Anonim

Drew kommer att presentera vid Big Data Innovation Summit, 30 & 31 januari i Las Vegas: http://analytics.theiegroup.com/bigdata-lasvegas, tillsammans med talare från Obama för America, Best Buy, LinkedIn, The New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs och många fler.


Registreringslänk: http://bit.ly/Zs3wms


Denna intervju genomfördes av George Hill och publicerades i Big Data Innovation Magazine.


Vilken typ av reaktion har det varit på dina förutsägelser?


De flesta av reaktionerna har fokuserat på skillnaden i noggrannhet mellan de av oss som studerade opinionsundersökningarna, och "tarmkänslan" förutsägelser om populära skickliga och kommentatorer. På valdagen har dataanalytiker som jag, Nate Silver (New York Times FiveThirtyEight-bloggen), Simon Jackman (Stanford University och Huffington Post) och Sam Wang (Princeton Election Consortium) alla placerat Obamas chanser för återval på över 90% och förutsåg korrekt 332 valröster för Obama som det mest troliga resultatet. Under tiden sa vitsord som Karl Rove, George Will och Steve Forbes att Romney skulle vinna - och i vissa fall lätt. Detta har lett till att man talar om en "seger för quanten" som jag hoppas kommer att genomföra till framtida val.


Hur utvärderar du algoritmen som används i dina förutsägelser?


Min prognosmodell uppskattade utfallet av statens röst och den slutliga valröstningen, varje dag av kampanjen, som börjar i juni. Jag ville att bedömningen av dessa prognoser skulle vara så rättvis och objektiv som möjligt - och inte lämna mig något vridrum om de var fel. Så ungefär en månad före valet publicerade jag på min webbplats en uppsättning av åtta utvärderingskriterier som jag skulle använda när resultaten var kända. Som det visade sig fungerade modellen perfekt. Det förutspådde under sommaren att Obama skulle vinna alla sina 2008-stater minus Indiana och North Carolina, och knoppade sig knappt från den förutsägelsen även efter att stödet för Obama sänkte sig uppåt i september, sedan doppade efter den första presidentdebatten.


Mängden data som använts under denna kampanj både av oberoende analytiker och kampanjteam har varit enorm, vilken typ av konsekvenser har detta för dataanvändningen 2016?


Kampanjen 2012 visade att flera, olika källor till kvantitativ information kunde hanteras, lita på och tillämpa framgångsrikt för olika ändamål. Vi utomstående kunde förutsäga valutfallet långt i förväg. Inom kampanjerna gjordes enorma framsteg när det gäller väljriktning, opinionsspårning, fundraising och valdeltagande. Nu när vi vet att dessa metoder kan fungera, tror jag att det inte går tillbaka. Jag förväntar mig att reportrar och kampanjkommentatorer kommer att ta undersökningssamling mycket mer allvarligt under 2016. Och även om Obama och demokraterna för närvarande verkar ha en fördel i kampanjtekniken, skulle jag bli förvånad om republikanerna inte snabbt hamnar.


Tror du att framgången med denna datadrivna kampanj har inneburit att kampanjchefer nu måste vara både analytiker och strateg?


Kampanjcheferna behöver kanske inte vara analytiker själva, men de borde ha en större uppskattning för hur data och teknik kan utnyttjas till deras fördel. Kampanjer har alltid använt undersökningsforskning för att formulera strategi och mäta väljarens känsla. Men nu finns det en rad andra kraftfulla verktyg: sociala nätverkswebbplatser, väljardatabaser, mobila smartphones och e-postmarknadsföring, för att bara nämna några. Och det är utöver de senaste framstegen inom omröstningsmetoder och statistisk åsikter modellering. Det sker mycket innovation i amerikansk kampanjpolitik just nu.


Du lyckades förutsäga valresultatet 6 månader i förväg, vad tycker du är den realistiska maximala tidsramen för att exakt förutsäga ett resultat med dina analystekniker?


Cirka fyra eller fem månader är ungefär så långt tillbaka som vetenskapen låter oss gå just nu; och det är till och med att driva det lite. Innan dess är enkäterna bara inte tillräckligt informativa om det slutliga resultatet: för många människor är antingen osäkra eller har inte börjat uppmärksamma kampanjen. De historiska ekonomiska och politiska faktorer som har visat sig korrelera med valresultaten börjar också förlora sin förutsägelseskraft när vi har gått utöver det ungefär 4-5 månaders intervallet. Lyckligtvis ger det fortfarande kampanjerna god tid att planera strategi och fatta beslut om hur man fördelar sina resurser.

Använda algoritmer för att förutsäga val: en chatt med drog linzer