Bland teknikstarter är datavetare en allt vanligare term som används för att hänvisa till datavetare som kan överbrygga traditionellt separata funktionella områden för datainformation. En datavetare är någon som är bekväm att utföra flera (om inte alla) aspekter av datainformationprojekt:
- Datainsamling: Detta kan innebära att du skriver anpassade parsers och webcrawler eller skript som riktar sig till specifika webbtjänster eller API: er för icke-traditionella datakällor.
- Datahantering: ETL, manipulera, fråga och underhålla data i databaser, nyckelvärdesbutiker eller Hadoop.
- Informationsvisualisering: Avtäcka mönster genom användning av statiska visualiseringsverktygssatser och / eller interaktiva plattformar baserade på Flash, JavaScript eller Processing.
- Analytics: Detta kan sträcka sig från enkla till komplexa tekniker i multivariat statistik, maskininlärning och NLP.
- Insikt: Extrahera, sammanfatta och presentera nyckelfynd för en bred publik.
Det finns många verktyg, färdigheter och tekniska detaljer, och man kan spendera år på att behärska var och en av artiklarna ovan. Även om en datavetare kanske inte har verklig expertkunskap inom något av områdena, är han eller hon bekväm att hoppa fram och tillbaka och utföra grundläggande uppgifter i dem alla. Resultatet är ett informellt geek som är snabbt för att snabbt kunna undersöka ett dataprojekt och ge svar på (hög nivå) frågor från ledningen. (om datavetare i Data Scientists: The New Rock Stars of the Tech World.)
För att vårda datavetare måste företag fokusera mer på kultur och organisationsstruktur. Många dataarbetare har tillräckligt med kompetens och utbildning för att snabbt bli produktiva inom flera områden av datainformation. Problemet är att de flesta inte arbetar i miljöer som uppmuntrar dem att bli datavetare. De sitter fast i silon och begränsas till ett eller två områden av datainformation. Ofta är de begränsade till att använda verktyg som "godkänns" av deras chefer.