Diena datu zinātnieka dzīvē
BrainStation Data Scientist karjeras ceļvedis var palīdzēt jums spert pirmos soļus ienesīgas karjeras virzienā datu zinātnē. Lasiet tālāk, lai iegūtu pārskatu par to, kā datu zinātnieki pavada savas dienas darbā.
Kļūsti par datu zinātnieku
Sazinieties ar mācību padomdevēju, lai uzzinātu vairāk par to, kā mūsu bootcamps un kursi var palīdzēt jums kļūt par datu zinātnieku.
Noklikšķinot uz Iesniegt, jūs piekrītat mūsu Noteikumi .
Iesniegt
Nevarēja iesniegt! Vai atsvaidzināt lapu un mēģināt vēlreiz?
Uzziniet vairāk par mūsu Data Science BootcampPaldies!
Mēs drīzumā sazināsimies.
Skatiet Data Science Bootcamp lapu
Diena datu zinātnieka dzīvē
No visām Brainstation digitālo prasmju aptaujā apskatītajām disciplīnām datu zinātne var ietvert visplašāko lietojumu klāstu. Bet, lai gan datu zinātne pastāv jau gadu desmitiem, tā tikai nesen ir sākusi pilnībā ziedēt. Tā kā datu pieejamība ir paplašinājusies, uzņēmumi ir sapratuši, cik svarīga var būt datu zinātne, saka Briana Brownell, Pure Strategy dibinātāja un izpilddirektore un datu zinātniece 13 gadus. Katram uzņēmumam tagad ir daļēji jākoncentrējas uz tehnoloģijām. Piemēram, tikai šonedēļ McDonald’s samaksāja aptuveni 300 miljonus USD, lai iegādātos savu lielo datu uzņēmumu.
Tāpēc nav brīnums, ka konkurence par datu zinātniekiem ir neticami augsta. Paredzams, ka tikai divu gadu laikā pieprasījums pieaugs par 28 procentiem, kas atbilst aptuveni 2,7 miljoniem jaunu darba vietu. Tas ir vairāk darba vietu, nekā to varēs aizpildīt jaunie absolventi — tas nozīmē, ka tehnoloģiju darbiniekiem citās jomās būs jāuzlabo savas prasmes un jāpāriet uz datiem, lai apmierinātu šo pieprasījumu.
Patiesībā mūsu aptauja liecina, ka tas jau notiek. Aptuveni četri no pieciem datu profesionāļiem sāka savu karjeru, nodarbojoties ar kaut ko citu, un 65 procenti no visiem datu zinātniekiem ir strādājuši šajā jomā piecus gadus vai mazāk. Šim milzīgajam jaunu prātu pieplūdumam ir divpusēja ietekme, saka Braunels; no vienas puses, nāk daudz jaunu ideju, viņa saka. Kad skatos uz kādu saturu, kas nāk no datu zinātnes kopienas, esmu pārsteigts, cik daudz jauninājumu tajā ir. Tomēr otrā puse ir tendence no jauna izgudrot riteni.
Liels pieprasījums pēc Data Scientists ir liels, ja esat tāds (vai domājat par tādu kļūt), taču darba devējiem darbā pieņemšana var būt grūts izaicinājums. Šeit pārkvalificēšana ir acīmredzams risinājums; var būt izdevīgāk pārkvalificēt pašreizējo darbinieku datu zinātnē, nevis meklēt jaunu.
Bet pat tad, ja plānojat nolīgt jaunu datu zinātnes komandu, jūsu organizācijai kopumā var būt nepieciešams uzlabot datu pratību, brīdina Braunels. Ikviens vēlas strādāt pie tā, kas ietekmē viņu darba vietu, kas padara cilvēku dzīvi labāku, viņa saka. Ja jūsu uzņēmuma kultūra nav tāda, lai [jūsu datu zinātnieki] varētu ietekmēt, ir gandrīz neiespējami pieņemt darbā. Līderībai ir jāspēj ne tikai informēt potenciālos darbiniekus par to, kā viņi varēs sniegt savu ieguldījumu, bet arī izprast priekšlikumus, ko viņu datu zinātnes komanda galu galā izvirza.
Diemžēl Braunels saka, ka neērti lielākā daļa ir uzņēmumi, kas nav sapratuši lietas. Mūsu aptauja to apstiprina: lielākā daļa respondentu (52 procenti) raksturoja datu pratības līmeni savās organizācijās kā pamata, un vidējā ir nākamā visbiežāk sastopamā atbilde (31 procents). Tas liek domāt, ka dažas pamata datu zinātnes apmācības varētu būt noderīgas lielākajai daļai uzņēmumu, jo īpaši vadībā.
Šo vajadzību pēc uzlabotas datu pratības un komunikācijas pastiprina veids, kā lielākā daļa datu zinātnes komandu ir strukturētas: kā atsevišķa komanda, kurā parasti ir 10 vai mazāk cilvēku (saskaņā ar 71 procentu respondentu), un bieži vien pieci vai mazāk (38 %). ). Šīs cieši saliedētās komandas nevar atļauties būt izolētām. Personas, kas strādā lielākos uzņēmumos, parasti ietilpst nelielā datu zinātnei specifiskā grupā, un viņu klienti ir iekšēji — citas organizācijas daļas, skaidro Braunels, tāpēc tā ir komanda, kurai jādarbojas daudzās dažādās organizācijas jomās.
Kas īsti ir datu zinātne?
Braunels saka, ka izplatītā uztvere (ka datu zinātnieki pārspēj skaitļus) nav pārāk tālu no atzīmes. Ir daudzas datu kopas, kurās ir jāatklāj ieskats, un tas ietver daudzas darbības, piemēram, modeļa izveidi un datu tīrīšanu, un pat tikai nepieciešamo datu izlemšanu. Tomēr galu galā šie centieni ir vērsti uz mērķi: būtībā jums kaut kas jādara ar datiem.
Šajā sakarā dati ne vienmēr ir skaitļi. Lai gan lielākā daļa respondentu (73 procenti) norādīja, ka strādā ar skaitliskiem datiem, 61 procents teica, ka strādā arī ar tekstu, 44 procenti ar strukturētiem datiem, 13 procenti ar attēliem un 12 procenti ar grafiku (un nelielas minoritātes pat strādā ar video un audio — attiecīgi 6 procenti un 4 procenti). Šie aptaujas rezultāti liecina par veidiem, kā datu zinātne izvēršas daudz tālāk par finanšu tabulām, piesaistot cilvēkus tādos projektos kā klientu apmierinātības palielināšana vai vērtīgu atziņu iegūšana no sociālo mediju ugunsdzēsības šļūtenes.
Tā rezultātā datu zinātnes jomā ir milzīga dažādība, saka Braunels. Katrai nozarei ir savs viedoklis par to, ar kādiem datu veidiem strādā datu zinātnieki, kādus rezultātus viņi sagaida un kā tas iekļaujas viņu uzņēmuma vadības struktūrā. Tomēr katrā gadījumā mērķis ir izmantot datus, lai palīdzētu uzņēmumam pieņemt labākus lēmumus. Tas varētu būt produktu uzlabošana, izpratne par tirgu, kurā viņi vēlas ienākt, noturēt vairāk klientu, izprast viņu darbaspēka izmantošanu, saprast, kā labi nomāt — dažādas lietas.
Datu zinātnes darbi
Dažās tehnoloģiju jomās kļūšana par ģenerālistu var būt jūsu labākā kāja — datu zinātnē tas nav gluži tā. Darba devēji parasti meklē prasmes, kas specializējas viņu nozarē. Tā kā datu zinātnei ir tik daudz dažādu garšu, mūsu aptauja tika veikta dziļāk, pārbaudot piecas galvenās darba kategorijas: datu analītiķis, pētnieks, biznesa analītiķis, datu un analīzes vadītājs un datu zinātnieks.
Visos šajos amatu nosaukumos datu ķildošana un tīrīšana aizņem lielāko daļu laika, bet kādam nolūkam? Visbiežāk mērķis ir optimizēt esošu platformu, produktu vai sistēmu (45 procenti), vai izstrādāt jaunas (42 procenti). Iedziļinoties, mēs atklājām, ka esošo risinājumu optimizēšana parasti ir biznesa analītiķu un datu analītiķu kompetencē, savukārt jaunu risinājumu izstrāde biežāk ir datu zinātnieku un pētnieku rokās.
Arī datu zinātnieku izmantotās metodes dažādās specialitātēs atšķiras. Lineārā regresija bija izplatīts rīks visās kategorijās, ko minēja 54 procenti respondentu, taču, aplūkojot programmatūru, ko izmanto cilvēki, radās daži pārsteigumi.
Excel — datu kopu manipulāciju zirgs — ir gandrīz visuresošs, to min 81 procents no visiem respondentiem, un tas ir vispopulārākais rīks visās kategorijās, izņemot pašu Data Scientists (kuri visbiežāk paļaujas uz Python), kā arī minēja lielāku rīku komplektu nekā citas kategorijas. ). Kas padara programmu Excel tik neizbēgamu pat 2019. gadā?
Man patīk programmā Excel, kā tas ļauj jums redzēt datus un iegūt to intuitīvu sajūtu, skaidroja Braunels. Mēs arī izmantojam daudz Python, un tādā gadījumā, kad veicat datu faila analīzi, tas tiek paslēpts; Ja vien jūs īpaši neieprogrammējat daļu sava koda, lai veiktu kādu analizējamo neapstrādāto datu vizualizāciju, jūs to neredzat. Turpretī programmā Excel tas ir tieši jūsu priekšā. Tam ir daudz priekšrocību. Dažreiz jūs varat pamanīt problēmas ar datu failu. Es neredzu, ka Excel kādreiz pazūd no analīzes.
Tas nozīmē, ka joprojām ir garš saraksts ar citām šajā jomā izmantotajām programmām, kas nav pārsteidzoši, ņemot vērā tās daudzveidību. SQL (43 procenti) un Python (26 procenti) ir vadošās popularitātes ziņā, un Tableau (23 procenti), R (16 procenti), Jupyter Notebooks (14 procenti) un vēl nedaudzi citi sasniedz ievērojamus skaitļus, nemaz nerunājot par milzīgo. 32 procenti respondentu, kuri minēja citus rīkus, pat ņemot vērā šo jau tā garo sarakstu.
Kāda ir datu zinātnes nākotne?
Visbeidzot, mēs jautājām, kādas tendences veidos digitālo ainavu nākamo piecu līdz 10 gadu laikā. Mašīnmācība un mākslīgais intelekts, kurām abām ir lietojumprogrammas datu zinātnē, lielākoties bija tās attīstības tendences, kurām respondenti cer, ka tām būs vislielākā ietekme, attiecīgi 80 un 79 procenti. Tas neskatoties uz to, ka mazāk nekā ceturtā daļa (23 procenti) no viņiem pašlaik strādā ar AI.
Mākslīgais intelekts var pilnībā pārveidot datu zinātni, apstiprina Braunels, kura uzņēmums izstrādā AI produktus. Tā patiešām ir nepārraudzītu mācību metožu godība. Mums ir tikai tik daudz laika, lai aplūkotu šīs datu kopas, un it īpaši ar lielām datu kopām ir ļoti grūti visu izdarīt. AI rīki var palīdzēt atklāt kaut ko tādu, ko varbūt nebūtu iedomājies meklēt. Mums tā noteikti ir gadījies.
Citas tendences, kuras Datu zinātnieki paredz, ka tuvākajā nākotnē dominēs: lietu internets (51 procents), blokķēde (50 procenti) un e-komercija (36 procenti), paplašinātā realitāte un virtuālā realitāte (38 procenti un 27 procenti) un pat balss. balstīta pieredze (25 procenti) — visas nozīmīgas izrādes un visas jomas, kurās datu zinātni var izmantot lietderīgi.