F:
Varför är dataanteckning viktig i vissa maskininlärningsprojekt?
A:Datamärkning är viktigt i maskininlärning eftersom det i många fall gör arbetet med maskininlärningsprogrammet mycket enklare.
Detta har att göra med skillnaden mellan övervakad och oövervakad maskininlärning. Med övervakad maskininlärning är träningsdata redan märkta så att maskinen kan förstå mer om önskat resultat. Till exempel, om syftet med programmet är att identifiera katter i bilder, har systemet redan ett stort antal foton taggade som katt eller inte. Sedan använder de dessa exempel för att kontrastera nya data för att göra sina resultat.
Gratis nedladdning: Machine Learning and Why It Matters |
Med maskinövervakning utan övervakning finns det inga etiketter, och därför måste systemet använda attribut och andra tekniker för att identifiera katterna. Ingenjörer kan utbilda programmet på att känna igen visuella funktioner hos katter som viskor eller svansar, men processen är knappast någonsin lika enkel som det skulle vara i övervakad maskininlärning där dessa etiketter spelar en mycket viktig roll.
Datamärkning är processen för att anbringa etiketter på träningsdatasätten. Dessa kan tillämpas på många olika sätt - ovan talade vi om binär datainmotation - katter eller inte katter - men andra typer av dataanteckningar är också viktiga. I det medicinska området kan till exempel dataanmärkningar involvera märkning av specifika biologiska bilder med taggar som identifierar patologi eller sjukdomsmarkörer för andra medicinska egenskaper.
Dataanmälan tar arbete - och görs ofta av team av människor - men det är en grundläggande del av det som får många maskininlärningsprojekt att fungera korrekt. Den tillhandahåller den första inställningen för att lära ut ett program vad det behöver lära sig och hur man kan diskriminera olika insatsvaror för att få exakta resultat.