Hem Audio Varför kan vissa maskininlärningsprojekt kräva enormt många aktörer?

Varför kan vissa maskininlärningsprojekt kräva enormt många aktörer?

Anonim

F:

Varför kan vissa maskininlärningsprojekt kräva enormt många aktörer?

A:

När du tänker på maskininlärning tenderar du att tänka på skickliga datavetare som arbetar på tangentbord i datorrum. Det är extremt viktigt med kvantitativ analys och algoritmer. Det finns inte en hel del omedelbar verklighetskontext för många av dessa program - åtminstone, det är vad många skulle tro.

Men några av dagens mest banbrytande maskininlärningsprogram använder veritära arméer av mänskliga aktörer ute på gatan, i butiker och var som helst som de kan modellera grundläggande mänskliga aktiviteter som promenader, arbetar eller shoppar.

Gratis nedladdning: Machine Learning and Why It Matters

En trådbunden artikel av Tom Simonite illustrerar detta mycket bra med den passande titeln "Att göra AI smartare, människor utför Oddball lågbetalda uppgifter."

Med hjälp av exemplet på korta videor som tagits i en livsmedelsbutik Whole Foods, belyser Simonite de typer av arbete som hjälper till att bygga ut några av nästa fas av maskininlärning.

Detta leder till frågan varför alla dessa människor är engagerade i att filma sig i korta och enkla videor som dokumenterar handlingar lika rudimentära som att flytta en arm eller ett ben.

Svaret belyser var maskininlärning är och vart den går.

"Forskare och entreprenörer vill se AI förstå och agera i den fysiska världen, " skriver Simonite och förklarar varför han och andra kämpar med kameror. ”Därför behovet av arbetare att utforska scener i stormarknader och hem. De genererar instruktionsmaterialet för att lära algoritmer om världen och människorna i den. ”

Som många experter påpekar innebär några av de största gränserna för maskininlärning bildbehandling och naturligt språkbearbetning. Dessa är extremt kvantitativa förfaranden - med andra ord finns det inte ett brett spektrum av insatser som det finns i "performanta" verkliga miljöer. Istället använder maskininlärningsprogrammen visuella och ljuddata på mycket specifika sätt för att bygga modeller. Med bildbehandling väljer det funktioner från ett (ändligt) synfält. För NLP är det montering av fonem.

Att gå utöver dessa specifika ingångskategorier innebär något du kan kalla "bild- och talgapet" - när du går utöver saker som bildbehandling och taligenkänning flyttar du till områden där datorer måste vara analytiska på olika sätt. Träningsuppsättningarna kommer att vara grundläggande olika.

Gå in i videografernas armé. I några av dessa nya maskininlärningsprojekt är de minsta idéerna om mänskliga aktiviteter träningsuppsättningarna. Istället för att utbildas för att leta efter funktioner och kanter och pixlar som komponeras i klassificeringsuppgifter använder datorer istället träningsvideor för att bedöma hur olika typer av handlingar ser ut.

Det viktigaste är vad ingenjörer kan göra med den här informationen när de är samlade och laddade och när datorn tränas på dem. Du kommer snart att se resultaten inom olika fält - till exempel kommer detta att göra övervakningen extremt effektiv. Datorer kommer att kunna "se" i det visuella fältet vad folk gör och tillämpa det på områden som marknadsföring och försäljning, eller kanske, i vissa fall, myndighetsarbete eller straffrätt.

Förgreningarna belyser också debatten mellan frågor om maximal nytta och integritet. Mycket av användningen av dessa videor kommer att bygga modeller för maskininlärning som fungerar för övervakning - men hur är det med människor som inte vill bli övervakade? När dessa nya maskininlärningsprogram distribueras i det offentliga rummet, vilka är rättigheterna för individen och var dras den linjen?

I vilket fall som helst använder företag dessa typer av mänskliga och videoressurser för att verkligen gräva in några nästa nivåer av maskininlärningsframsteg som faktiskt kommer att göra det möjligt för datorer att känna igen vad som händer runt dem, snarare än att bara klassificera bilder eller arbeta med fonema av Tal. Detta är en oerhört intressant och kontroversiell utveckling inom konstgjord intelligens, och en som förtjänar sin andel av uppmärksamhet i tekniska medier och därefter.

Varför kan vissa maskininlärningsprojekt kräva enormt många aktörer?