Hem Utveckling Varför är maskinstyrning ett problem i maskininlärning?

Varför är maskinstyrning ett problem i maskininlärning?

Anonim

F:

Varför är maskinstyrning ett problem i maskininlärning?

A:

Denna fråga kan besvaras på två olika sätt. Först, varför är maskinstyrning problem, som i varför finns det i maskininlärningsprocesser?

Maskininlärning, även om sofistikerad och komplex, är i viss utsträckning begränsad baserad på de datamängder som den använder. Konstruktionen av datamängderna innebär inneboende förspänning. Precis som i media, där utelämnanden och medvetna val av inkludering kan visa en viss förspänning, i maskininlärning, måste datamängderna som används undersökas för att avgöra vilken typ av förspänning som finns.

Gratis nedladdning: Machine Learning and Why It Matters

Det är till exempel ett vanligt problem för teknologitestning och designprocesser att visa en preferens för en typ av användare framför en annan. Ett stort exempel är könsskillnaden i den tekniska världen.

Varför gör detta en skillnad, och varför gäller det för maskininlärning?

Eftersom bristen på befintliga kvinnor i en testmiljö kan leda till en producerad teknologi som är mindre användarvänlig för en kvinnlig publik. Så som vissa experter beskriver detta är att utan befintlig kvinnlig testning kanske slutprodukten inte känner igen inmatningen från kvinnliga användare - den kanske inte har verktygen för att känna igen kvinnliga identiteter eller för att hantera input från kvinnor på ett adekvat sätt.

Detsamma gäller för olika etniska grupper, människor i olika religioner eller andra typer av demografiska. Utan rätt data kommer maskininlärningsalgoritmerna inte att fungera korrekt för en viss användaruppsättning, så att inkluderingsdata medvetet måste läggas till i tekniken. Istället för att bara ta primära datamängder och förstärka inneboende partiskhet, måste mänskliga hanterare verkligen titta på problemet.

Ett annat exempel är en maskininlärningsmotor som tar information om jobb och lön och spottar resultat. Om den inneboende datamängden inte analyseras kommer maskinen att förstärka förspänningen. Om det uppfattas att män innehar en stor majoritet av verkställande jobb, och maskininlärningsprocessen innebär att filtrera genom den rådata datauppsättningen och returnera motsvarande resultat kommer det att returnera resultat som visar en manlig partiskhet.

Den andra delen av frågan handlar om varför denna förspänning är så skadlig. Utan adekvat övervakning och testning kan ny teknik skada, inte hjälpa, vår känsla av inkludering och jämlikhet. Om en ny teknisk produkt rullas ut som känner igen ansikten med ljusare hud, men inte mörkare, kan det leda till eskalerade etniska spänningar och känslan av att företaget i fråga inte är känsligt för mångfald. Om en maskininlärningsalgoritm återger och ökar förspänningen i datamängden kommer den artificiella intelligensen att lägga till sin röst till de mänskliga rösterna och de mänskliga tendenser som redan finns i det sociala systemet som gynnar en grupp människor framför en annan.

Det bästa sättet att hantera detta är att titta noggrant på de underliggande datauppsättningarna, använda val av funktioner, lägga till variabel inmatning och manipulera själva rådata och förbättra den verkliga kraften i maskininlärning med avsiktlig skapande av data för att få en resultat som ger stor analytisk kraft, men också några av de mänskliga insikter som datorer ännu inte kan replikera.

Varför är maskinstyrning ett problem i maskininlärning?