Hem På nyheterna Varför är val av funktioner så viktigt i maskininlärning?

Varför är val av funktioner så viktigt i maskininlärning?

Anonim

F:

Varför är val av funktioner så viktigt i maskininlärning?

A:

Funktionsval är oerhört viktigt i maskininlärning främst eftersom det fungerar som en grundläggande teknik för att rikta användningen av variabler till det som är mest effektivt och effektivt för ett givet system för maskininlärning.

Experter talar om hur funktionsval och funktionsutvinning fungerar för att minimera förbannelsen av dimensionalitet eller hjälpa till att hantera övermontering - det är olika sätt att ta itu med idén om alltför komplex modellering.

Gratis nedladdning: Machine Learning and Why It Matters

Ett annat sätt att säga detta är att val av funktioner hjälper till att ge utvecklarna verktygen för att bara använda de mest relevanta och användbara data i maskininlärningsträningsuppsättningar, vilket dramatiskt minskar kostnader och datavolym.

Ett exempel är idén att mäta en komplex form i skala. När programmet skalar, identifierar det ett större antal datapunkter och systemet blir mycket mer komplicerat. Men en komplex form är inte den typiska datauppsättning som ett maskininlärningssystem använder. Dessa system kan använda datauppsättningar som har mycket olika nivåer av varians mellan olika variabler. I klassificering av arter kan till exempel ingenjörer använda funktionsval för att bara studera variablerna som ger dem de mest riktade resultaten. Om varje djur i diagrammet har samma antal ögon eller ben kan data tas bort eller andra mer relevanta datapunkter kan extraheras.

Funktionsval är den diskriminerande processen som ingenjörer leder maskininlärningssystem mot ett mål. Förutom idén att ta bort komplexitet från system i skala, kan val av funktioner också vara användbart för att optimera aspekter av vad experter kallar "biasvarians trade-off" i maskininlärning.

Orsakerna till att val av funktioner hjälper till med bias och variansanalys är mer komplicerade. En studie från Cornell University om funktionsval, biasvarians och påsar tjänar till att illustrera hur funktionsval hjälper projekt.

Enligt författarna undersöker uppsatsen "mekanismen med vilken val av funktioner förbättrar noggrannheten för övervakat lärande."

I studien framgår vidare:

En empirisk analys av bias / varians när funktionsval fortskrider indikerar att den mest exakta funktionsuppsättningen motsvarar den bästa avvikelsepunkten för biasvarians för inlärningsalgoritmen.

När man diskuterar användningen av stark eller svag relevans, talar författarna om val av funktioner som ”en variansreduceringsmetod” - det är meningsfullt när man tänker på varians som väsentligen mängden variation i en given variabel. Om det inte finns någon avvikelse kan datapunkten eller matrisen vara väsentligen värdelös. Om det är extremt hög varians kan det utvecklas till vad ingenjörer kan tänka sig som "buller" eller irrelevanta, godtyckliga resultat som är svåra för maskininlärningssystemet att hantera.

Mot bakgrund av detta är val av funktioner en grundläggande del av designen i maskininlärning.

Varför är val av funktioner så viktigt i maskininlärning?