Innehållsförteckning:
Definition - Vad betyder testuppsättning?
En testuppsättning i maskininlärning är en sekundär (eller tertiär) datauppsättning som används för att testa ett maskininlärningsprogram efter det att det har tränats i en första utbildningsdatauppsättning. Tanken är att prediktiva modeller alltid har någon form av okänd kapacitet som måste testas ut, i motsats till att analyseras ur ett programmeringsperspektiv.
En testuppsättning är också känd som en testdatauppsättning eller testdata.
Techopedia förklarar testuppsättningen
Många experter skulle säga att en bästa praxis är att ha en testdatauppsättning som är "sequestered" eller hålls till slutet av processen. Ingenjörer letar efter övermontering av modellen och andra frågor i utbildningsprocessen. Helst finns det en tredje uppsättning, en valideringsdatauppsättning, som testar klassificeringsparametrarna. Sedan, och först då, kan testuppsättningen tas fram för att se hur väl programmet tränades och om dess prediktiva modell är korrekt för nya data. Även om vissa modeller kan undvika att skapa en partitionerad testuppsättning helt, ses detta ofta som kortsiktigt, eftersom bristen på praktisk testning kan lämna ett program som är benägna att felaktighet.
