Datu zinātnieks

BrainStation Data Scientist karjeras ceļvedis var palīdzēt jums spert pirmos soļus ienesīgas karjeras virzienā datu zinātnē. Lasiet tālāk, lai iegūtu pārskatu par datu zinātnes jomu, kā arī datu zinātnieka darba lomu.

Kļūsti par datu zinātnieku

Sazinieties ar mācību padomdevēju, lai uzzinātu vairāk par to, kā mūsu bootcamps un kursi var palīdzēt jums kļūt par datu zinātnieku.



Noklikšķinot uz Iesniegt, jūs piekrītat mūsu Noteikumi .



Iesniegt

Nevarēja iesniegt! Vai atsvaidzināt lapu un mēģināt vēlreiz?

Uzziniet vairāk par mūsu Data Science Bootcamp

Paldies!

Mēs drīzumā sazināsimies.



Skatiet Data Science Bootcamp lapu

Kas ir datu zinātnieks?

Datu zinātnieki apkopo, organizē un analizē lielas lielo datu kopas — strukturētus un nestrukturētus datus —, lai izveidotu praktiskus, uz datiem balstītus biznesa risinājumus un plānus uzņēmumiem un citām organizācijām. Apvienojot izpratni par matemātiku, datorzinātnēm un uzņēmējdarbību, datu zinātniekiem ir jābūt gan tehniskajām iemaņām, lai apstrādātu un analizētu lielus datus, gan biznesa asprātībai, lai atklātu šajos datos slēptos praktiskus ieskatus.

Datu zinātne pret datu ieguvi

Pastāv dažas atšķirības starp datu zinātni un datu ieguvi. Apskatīsim tuvāk:

Datu zinātne

  • Tā ir plaša joma, kas parasti ietver mašīnmācīšanos, mākslīgo intelektu, paredzamo cēloņsakarību analīzi un preskriptīvo analīzi.
  • Nodarbojas ar visa veida datiem, tostarp gan strukturētiem, gan nestrukturētiem datiem
  • Tā mērķis ir izveidot uz datiem orientētus produktus un pieņemt uz datiem balstītus lēmumus
  • Koncentrējas uz datu un modeļu zinātnisku izpēti

Datu ieguve

  • Ir datu zinātnes apakškopa, kas ietver datu tīrīšanu, statistisko analīzi un modeļu atpazīšanu un dažreiz ietver datu vizualizāciju, mašīnmācīšanos un datu transformāciju.
  • Nodarbojas galvenokārt ar strukturētiem datiem, nevis ar nestrukturētiem datiem
  • Mērķis ir iegūt datus no dažādiem avotiem un padarīt tos izmantojamus
  • Koncentrējas uz biznesa praksi

Ko dara datu zinātnieks?

Datu zinātnieks analizē lielas datu kopas, lai atklātu modeļus un tendences, kas rada praktiskus biznesa ieskatus un palīdz organizācijām atrisināt sarežģītas problēmas vai noteikt ieņēmumu un izaugsmes iespējas. Datu zinātnieks var strādāt praktiski visās jomās, un viņam ir jābūt prasmīgam strukturētu un nestrukturētu datu kopu apstrādē. Tas ir daudznozaru darbs, un, lai kļūtu par datu zinātnieku, jums ir jābūt izpratnei par matemātiku, datorzinātnēm, uzņēmējdarbību un komunikāciju, lai efektīvi veiktu savu darbu.



Lai gan datu zinātnieka konkrētie darba pienākumi un pienākumi ievērojami atšķirsies atkarībā no nozares, amata un organizācijas, lielākā daļa datu zinātnieka pienākumu ietvers šādas atbildības jomas:

Pētījumi

Datu zinātniekam ir jāsaprot iespējas un sāpju punkti, kas raksturīgi gan nozarei, gan individuālam uzņēmumam.

Datu sagatavošana

Pirms var atrast vērtīgu ieskatu, datu zinātniekam ir jādefinē, kuras datu kopas ir noderīgas un atbilstošas, pirms tiek vākti, iegūti, notīrīti un lietoti strukturēti un nestrukturēti dati no dažādiem avotiem.



Modeļu un algoritmu veidošana

Izmantojot mašīnmācības un mākslīgā intelekta principus, datu zinātniekam jāspēj izveidot un pielietot automatizācijas rīku ieviešanai nepieciešamos algoritmus.

Datu analīze

Ir svarīgi, lai datu zinātnieks varētu ātri analizēt savus datus, lai noteiktu modeļus, tendences un iespējas.

Vizualizācija un komunikācija

Datu zinātniekam jāspēj stāstīt stāstus, kas atklāti, izmantojot datus, izveidojot un organizējot estētiski pievilcīgus informācijas paneļus un vizualizācijas, kā arī viņam ir jābūt komunikācijas prasmēm, lai pārliecinātu ieinteresētās personas un citus komandas locekļus, ka ir vērts rīkoties saskaņā ar datos atrodamajiem atklājumiem.

Jaunākajā BrainStation digitālo prasmju aptaujā atklājās, ka datu speciālisti lielāko daļu laika veltīja datu strīdiem un tīrīšanai. Respondenti arī secināja, ka viņu darba mērķis visbiežāk ir esošas platformas, produkta vai sistēmas optimizācija (45 procenti) vai jaunu izstrāde (42 procenti).

Datu zinātnes veidi

Plašākā datu zinātnes joma ietver daudzas dažādas disciplīnas, tostarp:

Datu inženierija

Tādas infrastruktūras projektēšana, veidošana, optimizēšana, uzturēšana un pārvaldība, kas atbalsta datus, kā arī datu plūsmu visā organizācijā.

Datu sagatavošana

Datu tīrīšana un pārveidošana.

Datu ieguve

Izmantojamo datu iegūšana (un dažreiz tīrīšana un pārveidošana) no lielākas datu kopas.

Prognozējošā analītika

Datu, algoritmu un mašīnmācīšanās metožu izmantošana, lai analizētu dažādu iespējamo turpmāko rezultātu iespējamību, pamatojoties uz datu analīzi.

Mašīnmācība

Analītiskā modeļa izveides automatizācija datu analīzes procesā, lai mācītos no datiem, atklātu modeļus un dotu sistēmām iespēju pieņemt lēmumus bez lielas cilvēka iejaukšanās.

Datu vizualizācija

Vizuālo elementu (tostarp diagrammu, karšu un diagrammu) izmantošana, lai pieejamā veidā ilustrētu datos atrastos ieskatus, lai auditorija varētu saprast datos atrastās tendences, novirzes un modeļus.

Datu zinātnes priekšrocības

Uzņēmumi visās nozarēs visās pasaules daļās arvien vairāk naudas, laika un uzmanības velta datu zinātnei un vēlas pievienot savai komandai datu zinātnieku. Pētījumi liecina, ka uzņēmumi, kas patiesi pieņem uz datiem balstītu lēmumu pieņemšanu, ir produktīvāki, ienesīgāki un efektīvāki nekā konkurenti.

Datu zinātne ir ļoti svarīga, lai palīdzētu organizācijām noteikt pareizās problēmas un iespējas, vienlaikus palīdzot veidot skaidru priekšstatu par klientu un klientu uzvedību un vajadzībām, darbinieku un produktu veiktspēju un iespējamām nākotnes problēmām.

Datu zinātne var palīdzēt uzņēmumiem:

  • Pieņemiet labākus lēmumus
  • Uzziniet vairāk par klientiem un klientiem
  • Izmantojiet tendences
  • Paredzēt nākotni

Kā datu zinātne var uzlabot uzņēmuma vērtību?

Datu zinātne ir arvien populārāks ieguldījums uzņēmumiem, jo ​​potenciālā IA lielo datu vērtības atrašanai ir milzīga. Datu zinātne ir vērtīgs ieguldījums, jo:

    Tas novērš minējumus un sniedz praktisku ieskatu.Uzņēmumi pieņem labākus lēmumus, pamatojoties uz datiem un kvantitatīviem pierādījumiem.Uzņēmumi labāk izprot savu vietu tirgū.Datu zinātne palīdzēs uzņēmumiem analizēt konkurenci, izpētīt vēsturiskos piemērus un sniegt uz skaitļiem balstītus ieteikumus.To var izmantot, lai identificētu labākos talantus.Lielajos datos slēpjas daudz ieskatu par produktivitāti, darbinieku efektivitāti un vispārējo sniegumu. Datus var izmantot arī talantu pieņemšanai darbā un apmācīšanai.Jūs uzzināsit visu par savu mērķauditoriju, klientu vai patērētāju.Šobrīd visi ģenerē un vāc datus, un uzņēmumi, kas pienācīgi neiegulda datu zinātnē, vienkārši savāc vairāk datu, nekā zina, ko ar tiem darīt. Ieskats par iepriekšējo vai potenciālo klientu vai klientu uzvedību, prioritātēm un vēlmēm ir nenovērtējams, un viņi vienkārši gaida, kad to atklās kvalificēts datu zinātnieks.

Datu zinātnieku algas

Lai gan datu zinātnieku algas ievērojami atšķiras atkarībā no reģiona un nozares, tiek ziņots, ka vidējā datu zinātnieka alga ASV ir no 96 000 līdz 113 000 USD atkarībā no avota. Vecākais datu zinātnieks vidēji var ienest aptuveni 130 000 USD.

Pieprasījums pēc datu zinātniekiem

Datu zinātnieki ir ļoti pieprasīti un trūkst gandrīz visās nozarēs. Deloitte Access Economics ziņojumā konstatēts, ka 76 procenti uzņēmumu plānoja nākamo gadu laikā palielināt izdevumus par datu analīzes iespējām, savukārt IBM prognozēja datu zinātnes pieprasījuma pieaugumu desmitgades sākumā par 28 procentiem.

ASV Darba statistikas birojs ir prognozējis datu zinātnes pieaugumu par 31% nākamajos 10 gados. Tikmēr Markets and Markets Report atklāja, ka tiek prognozēts, ka globālais lielo datu tirgus līdz 2025. gadam pieaugs līdz 229,4 miljardiem ASV dolāru, un datu zinātnes platforma līdz 2024. gadam pieaugs par 30 procentiem.

Šķiet, ka visā pasaulē pieaugs investīcijas datu zinātnē un līdz ar to arī pieprasījums pēc datu zinātniekiem.

Kādus rīkus izmanto datu zinātnieki?

Datu zinātnieki izmanto dažādus rīkus un programmas darbībām, tostarp datu analīzei, datu tīrīšanai un vizualizāciju izveidei.

Python ir BrainStation digitālo prasmju aptaujā aptaujāto datu zinātnieku populārākā programmēšanas valoda. Universāla programmēšanas valoda Python ir noderīga valsts valodas apstrādes lietojumprogrammām un datu analīzei. R bieži tiek izmantots arī datu analīzei un datu ieguvei. Smagākai skaitļu noteikšanai populāri ir uz Hadoop balstīti rīki, piemēram, Hive. Mašīnmācībai datu zinātnieki var izvēlēties no plaša rīku klāsta, tostarp h2o.ai, TensorFlow, Apache Mahout un Accord.Net. Vizualizācijas rīki ir arī svarīga datu zinātnieka arsenāla sastāvdaļa. Tādas programmas kā Tableau, PowerBI, Bokeh, Plotly un Infogram palīdz datu zinātniekiem izveidot vizuāli pievilcīgas diagrammas, siltuma kartes, grafiku, izkliedes diagrammas un daudz ko citu.

Datu zinātniekiem vajadzētu arī ļoti ērti strādāt gan ar SQL (izmanto dažādās platformās, tostarp MySQL, Microsoft SQL un Oracle), gan ar izklājlapu programmām (parasti Excel).

Kādas prasmes ir vajadzīgas datu zinātniekiem?

Ir vairākas prasmes, kuras visiem topošajiem datu zinātniekiem vajadzētu attīstīt, tostarp:

    Excel.Programma Excel, kas ir visvairāk izmantotais rīks 66 procentiem BrainStation digitālo prasmju aptaujā aptaujāto datu speciālistu, datu zinātniekiem joprojām ir ļoti svarīgs.SQL.Šī vaicājumu valoda ir neaizstājama datu bāzes pārvaldībā, un to izmanto aptuveni puse datu respondentu.Statistiskā programmēšana.Datu zinātnieki parasti izmanto Python un R, lai veiktu testus, izveidotu modeļus un veiktu lielu datu kopu analīzi.Datu vizualizācija.Tādi rīki kā Tableau, Plotly, Bokeh, PowerBl un Matplotlib palīdz datu zinātniekiem izveidot pārliecinošus un pieejamus atklājumu vizuālos attēlojumus.

Datu zinātnieka karjeras ceļi

Datu zinātnieka karjeras ceļi nav akmenī rakstīti kā salīdzinoši jauna profesija, un daudzi cilvēki ceļu uz datu zinātni atrod no datorzinātņu, IT, matemātikas un uzņēmējdarbības pieredzes. Taču datu zinātnieka karjeras četras galvenās asis parasti ir dati, inženierija, bizness un produkts. Daudzām daudznozaru lomām datu zinātnē ir jāpārvalda vairākas vai visas šīs jomas.

Cilvēki, kas strādā datu zinātnē, ir tehnoloģisko izmaiņu priekšgalā, kas visvairāk ietekmēs nākotni. Tā kā datu zinātne var veicināt progresu praktiski visās citās jomās, datu zinātnieki var turpināt pētniecību visās jomās, sākot no finansēm un komercijas līdz aktuāra statistikai, zaļajai enerģijai, epidemioloģijai, medicīnai un farmācijai, telekomunikācijām — saraksts ir praktiski bezgalīgs. Katra nozare izmanto savus dažāda veida datus, izmantojot tos dažādos veidos dažādu mērķu sasniegšanai. Lai kur tas notiktu, datu zinātnieki var palīdzēt pieņemt labākus lēmumus neatkarīgi no tā, vai tas attiecas uz produktu izstrādi, tirgus analīzi, klientu attiecību pārvaldību, cilvēkresursiem vai kaut ko citu.

Datu zinātnes lietojumprogrammas ir ne tikai plašas, skarot daudzas dažādas nozares, bet ir arī dažādi datu zinātnes veidi. Visām šīm darbībām kopīgs ir tas, ka tās visas mēģina datus pārvērst zināšanās. Precīzāk, datu zinātnieki izmanto metodisku pieeju, lai organizētu un analizētu neapstrādātus datus, lai noteiktu modeļus, no kuriem var identificēt vai secināt noderīgu informāciju.

Ņemot vērā to ietekmes apjomu, nav brīnums, ka datu zinātnieki ieņem ļoti ietekmīgus un ļoti pieprasītus amatus. Lai gan ceļš uz datu zinātnieku var būt prasīgs, tagad topošajiem datu zinātniekiem ir vairāk resursu nekā jebkad agrāk un viņiem ir vairāk iespēju veidot tādu karjeru, kādu viņi vēlas.

Taču, ņemot vērā visus veidus, kā datu zinātnieki var sniegt ieguldījumu dažādās nozarēs, un visiem dažādajiem karjeras ceļiem, ko datu zinātnieks var sekot, viņu veiktā darba veidus var iedalīt dažās galvenajās kategorijās. Ne visa datu zinātne precīzi iekļaujas šajās grupās, jo īpaši datorzinātņu priekšgalā, kur nepārtraukti tiek lauzts jauns pamats, taču tie sniegs jums priekšstatu par to, kā datu zinātnieki pārvērš datus ieskatā.

Statistika

Datu zinātnes pamatā statistika ir matemātikas joma, kas apraksta dažādas datu kopas īpašības neatkarīgi no tā, vai tie ir skaitļi, vārdi, attēli vai cita veida izmērāma informācija. Liela daļa statistikas ir vērsta uz to, lai vienkārši identificētu un aprakstītu, kas tur atrodas, jo īpaši ar ļoti lielām datu kopām, tikai zināt, ko informācija dara un ko neietver, ir uzdevums pats par sevi. Datu zinātnes jomā to bieži sauc par aprakstošo analīzi. Taču statistika var iet vēl tālāk, pārbaudot, vai jūsu pieņēmumi par datu saturu ir pareizi vai, ja tie ir pareizi, vai tie ir nozīmīgi vai noderīgi. Tas var ietvert ne tikai datu pārbaudi, bet arī manipulācijas ar tiem, lai izceltu to svarīgākās iezīmes. Ir daudz dažādu veidu, kā to izdarīt — lineārā regresija, loģistiskā regresija un diskriminantu analīze, dažādas paraugu ņemšanas metodes un tā tālāk, taču galu galā katra no šīm metodēm ir saistīta ar datu kopas iezīmju izpratni un šo pazīmju precizitāti. atspoguļo kādu jēgpilnu patiesību par pasauli, kurai tie atbilst.

Datu analīze

Lai gan tā ir balstīta uz statistikas pamatiem, datu analīze sniedzas nedaudz tālāk, lai izprastu cēloņsakarības, vizualizāciju un atklājumu paziņošanu citiem. Ja statistikas mērķis ir definēt datu kopas ko un kad, datu analīze mēģina noteikt, kāpēc un kā. Datu analītiķi to dara, iztīrot datus, apkopojot tos, pārveidojot, modelējot un pārbaudot. Kā minēts iepriekš, šī analīze neaprobežojas tikai ar skaitļiem. Lai gan daudzās datu analīzēs tiek izmantoti skaitliski dati, ir iespējams veikt arī cita veida datu analīzi – piemēram, rakstiskas klientu atsauksmes vai ierakstus sociālajos tīklos vai pat attēlus, audio un video.

Viens no datu analītiķu galvenajiem mērķiem ir izprast cēloņsakarību, ko pēc tam var izmantot, lai izprastu un prognozētu tendences plašā lietojumu klāstā. Diagnostikas analīzē datu analītiķi meklē korelācijas, kas liecina par cēloni un sekām, ko savukārt var izmantot, lai palīdzētu mainīt rezultātus. Prognozējošā analīze līdzīgi meklē modeļus, bet pēc tam paplašina tos tālāk, ekstrapolējot to trajektorijas ārpus zināmajiem datiem, lai palīdzētu paredzēt, kā varētu izpausties neizmērīti vai hipotētiski notikumi, tostarp nākotnes notikumi. Vismodernākās datu analīzes formas ir paredzētas, lai sniegtu norādījumus par konkrētiem lēmumiem, modelējot un prognozējot dažādu izvēļu rezultātus, lai noteiktu vispiemērotāko rīcības veidu.

Mākslīgais intelekts un mašīnmācīšanās

Viens no lielākajiem sasniegumiem, kas pašlaik notiek datu zinātnē, un tas, kam nākotnē būs milzīga ietekme, ir mākslīgais intelekts un konkrētāk, mašīnmācība. Īsumā, mašīnmācība ietver datora apmācību, lai veiktu uzdevumus, par kuriem parasti ir nepieciešama kāda veida inteliģence vai spriedums, piemēram, spēja identificēt fotoattēlā redzamos objektus. Parasti to panāk, sniedzot tai daudzus piemērus tam, kāda veida noteikšanai jūs apmācāt tīklu. Kā jūs varētu iedomāties, tas prasa gan daudz (parasti strukturētu) datu, gan spēju panākt, lai dators saprastu šos datus. Spēcīgas statistikas prasmes un programmēšanas prasmes ir obligātas.

Mašīnmācīšanās labvēlīgā ietekme ir praktiski neierobežota, taču pirmām kārtām tā ir spēja veikt sarežģītus vai ilgstošus uzdevumus ātrāk nekā jebkurš cilvēks jebkad varētu, piemēram, identificēt konkrētu pirkstu nospiedumu no miljoniem attēlu krātuve vai veikt savstarpējas atsauces. desmitiem mainīgo tūkstošos medicīnisko failu, lai identificētu asociācijas, kas varētu piedāvāt norādes uz slimības cēloni. Ja ir pietiekami daudz datu, mašīnmācības eksperti var pat apmācīt neironu tīklus, lai radītu oriģinālus attēlus, gūtu jēgpilnu ieskatu no masveida rakstīta teksta, veiktu prognozes par nākotnes tēriņu tendencēm vai citiem tirgus notikumiem un piešķirtu resursus, kas ir atkarīgi no ļoti sarežģītas sadales, piemēram, enerģijas. , ar maksimālu efektivitāti. Mašīnmācības izmantošana šo uzdevumu veikšanai, atšķirībā no citiem automatizācijas veidiem, ir tāda, ka bez uzraudzības A.I. sistēma var automātiski mācīties un laika gaitā uzlaboties – pat bez jaunas programmēšanas.

Biznesa inteliģence

Kā jau varēja nojaust no iepriekšējās atsauces uz tirgus notikumiem, biznesa un finanšu pasaule ir viena no vietām, kur mašīnmācīšanās ir radījusi vienu no agrākajām un visdziļākajām ietekmēm. Pateicoties milzīgajam pieejamo skaitlisko datu apjomam – mārketinga datubāzēm, aptaujām, banku informācijai, pārdošanas rādītājiem utt., no kuriem lielākā daļa ir ļoti sakārtoti un ar tiem ir salīdzinoši viegli strādāt –, datu zinātnieki var izmantot statistiku, datu analīzi un mašīnmācība, lai gūtu ieskatu par neskaitāmiem biznesa pasaules aspektiem, vadot lēmumu pieņemšanu un optimizējot rezultātus līdz tādam līmenim, ka biznesa inteliģence ir kļuvusi par datu zinātnes jomu.

Diezgan bieži biznesa inteliģences izstrādātāji ne tikai aplūko visus pieejamos datus, lai redzētu, ko viņi var atklāt. viņi aktīvi vāc datus un izstrādā metodes un produktus, lai atbildētu uz konkrētiem jautājumiem un sasniegtu konkrētus mērķus. Šajā ziņā biznesa inteliģences izstrādātājiem un analītiķiem ir izšķiroša nozīme stratēģiskajā attīstībā biznesa un finanšu pasaulē, palīdzot vadībai pieņemt labākus lēmumus un pieņemt tos ātrāk, izprast tirgu, lai identificētu uzņēmuma iespējas un izaicinājumus, kā arī uzlabotu uzņēmuma vispārējo efektivitāti. uzņēmuma sistēmas un darbība, un to visu galvenais mērķis ir sasniegt konkurences priekšrocības un palielināt peļņu.

Datu inženierija

Pēdējā galvenā studiju joma, kurā datu zinātnieki bieži strādā, ietver veselu virkni dažādu amatu nosaukumu — datu inženieris, sistēmu arhitekts, lietojumprogrammu arhitekts, datu arhitekts, uzņēmuma arhitekts vai infrastruktūras arhitekts, lai nosauktu tikai dažus. Katrai no šīm lomām ir savs pienākumu kopums, un daži no tiem izstrādā programmatūru, citi izstrādā IT sistēmas un vēl citi saskaņo uzņēmuma iekšējo struktūru un procesus ar tehnoloģiju, ko tas izmanto, lai īstenotu savas biznesa stratēģijas. Tos visus saista tas, ka datu zinātnieki, kas strādā šajā jomā, izmanto datus un informācijas tehnoloģijas, lai izveidotu vai uzlabotu sistēmas ar noteiktu funkciju.

Lietojumprogrammu arhitekts, piemēram, novēro, kā uzņēmums vai cits uzņēmums izmanto konkrētus tehnoloģiskos risinājumus, pēc tam izstrādā un izstrādā lietojumprogrammas (tostarp programmatūru vai IT infrastruktūru), lai uzlabotu veiktspēju. Datu arhitekts līdzīgi izstrādā lietojumprogrammas – šajā gadījumā risinājumus datu glabāšanai, administrēšanai un analīzei. Infrastruktūras arhitekts var izstrādāt visaptverošus risinājumus, ko uzņēmums izmanto ikdienas biznesa veikšanai, lai nodrošinātu, ka šie risinājumi atbilst uzņēmuma sistēmas prasībām neatkarīgi no tā, vai tas ir bezsaistē vai mākonī. Datu inženieri savukārt koncentrējas uz datu apstrādi, tādu datu cauruļvadu izstrādi un ieviešanu, kas vāc, organizē, glabā, izgūst un apstrādā organizācijas datus. Citiem vārdiem sakot, šīs plašās datu zinātnes kategorijas noteicošā iezīme ir tā, ka tā ietver lietu projektēšanu un veidošanu: sistēmas, struktūras un procesus, ar kuriem tiek veikta datu zinātne.

Kādi ir vispieprasītākie datu zinātnes darbi?

Datu zinātne kopumā ir ļoti pieprasīta prasme, tāpēc katrā jomā un specialitātē ir atrodamas ļoti daudzas iespējas. Faktiski 2019. gadā LinkedIn uzskaitīja Data Scientist kā gada daudzsološāko darbu, un QuantHub prognozēja, ka nākamajā gadā akūts kvalificētu datu zinātnieku trūkums.

Atslēgas vārds šeit ir kvalificēts. Bieži vien tehniskās prasības, kurām jāatbilst datu zinātniekam, ir tik specifiskas, ka var būt nepieciešami daži gadi, strādājot nozarē, lai izveidotu nepieciešamo kompetenču loku, sākot ar vispārīgu speciālistu, pēc tam pakāpeniski pievienojot arvien jaunas spējas un spējas viņu prasmju kopums.

Šie ir tikai daži no visizplatītākajiem veidiem, kā to var paveikt datu zinātnieki — potenciālo karjeras ceļu ir tikpat daudz, cik datu zinātnieku, taču katrā gadījumā karjeras izaugsme ir atkarīga no jaunu prasmju un pieredzes iegūšanas laika gaitā.

Datu analītiķis

Kā norāda nosaukums, datu analītiķi analizē datus, taču šis īsais nosaukums atspoguļo tikai nelielu daļu no tā, ko datu analītiķi faktiski var sasniegt. Pirmkārt, dati reti tiek iegūti viegli lietojamā formā, un parasti datu analītiķi ir atbildīgi par nepieciešamo datu identificēšanu, apkopošanu un apkopošanu un pēc tam to tīrīšanu un kārtošanu – pārveidošanu izmantojamā formā, nosakot, ko datu kopa patiesībā satur, noņemot bojātos datus un novērtējot to precizitāti. Pēc tam ir pati analīze — izmantojot dažādas metodes, lai pārbaudītu un modelētu datus, meklētu modeļus, iegūtu nozīmi no šiem modeļiem un tos ekstrapolētu vai modelētu. Visbeidzot, datu analītiķi dara savus ieskatus pieejamus citiem, prezentējot datus informācijas panelī vai datubāzē, kam var piekļūt citi cilvēki, un paziņojot savus atklājumus citiem, izmantojot prezentācijas, rakstiskus dokumentus un diagrammas, diagrammas un citas vizualizācijas.

Datu analītiķa karjeras ceļš

Data Analyst ir lielisks ieejas punkts datu zinātnes pasaulē; tas var būt sākuma līmeņa amats atkarībā no nepieciešamās zināšanas. Jaunie datu analītiķi parasti ienāk šajā jomā uzreiz pēc skolas – ar statistikas, matemātikas, datorzinātņu vai tamlīdzīgu grādu vai pāriet uz datu analīzi no saistītas jomas, piemēram, uzņēmējdarbības, ekonomikas vai pat sociālajām zinātnēm, parasti uzlabojot savas zināšanas. prasmes karjeras vidusposmā, izmantojot datu analīzes bootcamp vai līdzīgu sertifikācijas programmu.

Taču neatkarīgi no tā, vai viņi ir nesen absolventi vai pieredzējuši profesionāļi, kas maina karjeru, jaunie datu zinātnieki parasti sāk, veicot ikdienas uzdevumus, piemēram, iegūstot un manipulējot ar datiem, izmantojot tādu valodu kā R vai SQL, veidojot datu bāzes, veicot pamata analīzi un ģenerējot. vizualizācijas, izmantojot tādas programmas kā Tableau. Ne katram datu analītiķim būs jāzina, kā veikt visas šīs lietas — var būt specializācija, pat jaunākā amatā —, taču jums vajadzētu būt iespējai veikt visus šos uzdevumus, ja cerat progresēt savā karjerā. Elastība šajā agrīnajā posmā ir liela priekšrocība.

Tas, kā jūs progresējat kā datu analītiķis, zināmā mērā ir atkarīgs no nozares, kurā strādājat – piemēram, mārketinga vai finanšu. Atkarībā no nozares un darāmā darba veida varat izvēlēties specializēties programmēšanā Python vai R, kļūt par profesionālu datu tīrīšanas jomā vai koncentrēties tikai uz sarežģītu statistikas modeļu veidošanu vai skaistu vizuālo attēlu ģenerēšanu; no otras puses, jūs varat arī izvēlēties apgūt mazliet visu, lai jūs ieņemtu vadošu amatu, ieņemot vecākā datu analītiķa titulu. Ar plašu un pietiekami dziļu pieredzi vecākais datu analītiķis ir gatavs uzņemties vadošo lomu, pārraugot citu datu analītiķu komandu, galu galā kļūstot par nodaļas vadītāju vai direktoru. Pateicoties papildu prasmju apmācībai, datu analītiķiem ir arī lieliska iespēja pāriet uz progresīvāku datu zinātnieka pozīciju.

Datu zinātnieks

Datu zinātnieki parasti var darīt visu, ko var darīt datu analītiķi, kā arī vēl dažas lietas — ar atbilstošu apmācību un pieredzi datu analītiķis galu galā var iegūt datu zinātnieka amatu. Jā, datu zinātniekiem ir jāspēj iegūt, tīrīt, manipulēt, uzglabāt un analizēt datus, kā arī izprast un strādāt ar dažādām mašīnmācīšanās metodēm, kā arī jāspēj programmēt Python, R vai līdzīgā statistikas programmēšanas valodā, lai izveidot un novērtēt progresīvākus modeļus.

Datu zinātnieka karjeras ceļš

Daudzi cilvēki sāk strādāt kā datu analītiķi, pirms viņi iegūst pieredzi un papildu prasmes, kas nepieciešamas, lai sevi dēvētu par datu zinātniekiem. Pēc tam no Junior Data Scientist nākamais solis parasti ir vecākais datu zinātnieks — lai gan šīs vienkāršās nosaukuma maiņas liek šķēršļus darbam, kas nepieciešams šīs pārejas veikšanai; vecākais datu zinātnieks pārzina praktiski visus datu zinātnes aspektus — AI, datu noliktavu, datu ieguvi, mākoņdatošanu un tā tālāk — papildus pārzināšanai nozarē specifiskā jomā, piemēram, biznesa stratēģija vai veselības aprūpes analītika. , vai arī viņi specializēsies kādā no šīm jomām ar guru līmeņa zināšanām.

Ir vērts pieminēt, ka, lai gan daži datu zinātnieki sāk savu karjeru analītikā un strādā uz augstākiem amatiem specializētās jomās, piemēram, psiholoģijā, mārketingā, ekonomikā un tā tālāk, citi sāk kā profesionāļi kādā no šīm dažādajām jomām, pirms pāriet uz datiem. zinātnes loma.

Daudziem vecākais datu zinātnieks ir galvenais karjeras mērķis; šī jau ir tik progresīva loma, ka vismaz datu zinātnes jomā tas bieži vien ir visaugstākais amats, ko var sasniegt – jūs vienkārši kļūstat par labāku, spējīgāku vecāko datu zinātnieku ar plašākām specializācijas jomām. Tomēr dažiem, jo ​​īpaši tiem, kuri izmanto vispārīgāku pieeju, ir iespējams iegūt turpmākus panākumus vadošā amatā, piemēram, vadošā datu zinātnieka amatā, vadīt komandu vai nodaļu vai pat galveno datu inspektoru, kurš vada iestādes datu stratēģiju visaugstākajā līmenī. un atbildot tikai izpilddirektoram.

Datu inženieris

Datu inženierus no citiem profesionāļiem, kas strādā datu jomā, atšķir fakts, ka viņi izstrādā un veido veselas sistēmas, tostarp infrastruktūru un procesus, ko uzņēmums izmanto, lai maksimāli izmantotu šos datus. Tas nozīmē, ka datu inženieri ir cilvēki, kas nosaka veidus, kā citi datu zinātnieki var veikt savu darbu. Kādas datu formas var uzņemt uzņēmuma sistēmā? Kādas metodes tiek izmantotas, lai vāktu datus no pārdošanas un mārketinga vai veselības aprūpes aptaujas rezultātiem un padarītu tos pieejamus analīzei? Lai to izdarītu, datu inženieriem ir ļoti labi jāpārzina citi datu zinātnes profesionāļi — datu bāzu administratori, datu analītiķi, datu arhitekti un tā tālāk — līdz tādam līmenim, ka datu inženieri bieži var veikt katru no šīm lomām kā labi. Taču, tā kā datu inženieri ir veidotāji, datu inženieri parasti pavada vairāk laika, strādājot pie izstrādes nekā citi datu zinātnes profesionāļi — rakstot programmatūras programmas, veidojot relāciju datu bāzes vai izstrādājot rīkus, kas ļauj uzņēmumiem koplietot datus starp departamentiem.

Datu inženiera karjeras ceļš

Tāpat kā citi darbi, kas strādā datu jomā, pirmais solis, lai kļūtu par datu inženieri, bieži vien ir universitātes grāds (parasti bakalaura vai maģistra grāds inženierzinātnēs, datorzinātnēs vai matemātikā), taču ne vienmēr. Personai, kurai ir liela pieredze IT vai programmatūras izstrādē, var šķist, ka viņam jau ir visas nepieciešamās prasmes, lai kļūtu par datu inženieri, izņemot pašas datu prasmes, un tādā gadījumā prasmju pārkvalificēšana, piemēram, datu sāknēšanas nometne, var palīdzēt viņiem iegūt zināšanas. līdz ātrumam. Daudzas no datu inženierim nepieciešamajām prasmēm (piemēram, SQL, UNIX un Linux, ETL izstrāde vai IT sistēmu konfigurēšana) var attīstīt, strādājot blakus jomā; citiem (piemēram, mašīnmācībai vai datu cauruļvadu veidošanai) būs nepieciešama mērķtiecīgāka mācīšanās.

Tomēr lielākā daļa datu inženieru sāk savu karjeru, strādājot kādā datorzinātņu apakšnozarē, pirms iegūst visas prasmes, kas nepieciešamas, lai kļūtu par jaunāko datu inženieri — vairumam jaunāko datu inženieru darba sludinājumu ir nepieciešama viena līdz piecu gadu darba pieredze. No turienes nākamais loģiskais solis ir vecākajam datu inženierim un vadošajam datu inženierim. Taču, tā kā viņi pārvalda tik daudzus IT, programmatūras inženierijas un datu zinātnes aspektus, datu inženieriem ir pieejamas arī daudzas citas amata vietas, tostarp datu arhitekts, risinājumu arhitekts vai lietojumprogrammu arhitekts. Ja kāds vēlas veikt mazāk praktisku darbu un vairāk pārvaldīt darbiniekus, citas iespējas ir produktu izstrādes vadītājs vai, visbeidzot, ņemot vērā vajadzīgās cilvēku prasmes, pat galvenais datu speciālists vai galvenais informācijas speciālists.

Vai datu zinātnieki var strādāt no mājām?

Tāpat kā daudzus darbus tehnoloģiju jomā, datu zinātnieka pienākumus bieži var veikt attālināti, taču tas galu galā ir atkarīgs no uzņēmuma, kurā strādājat, un no jūsu veiktā darba veida.

Kad datu zinātnieki var strādāt attālināti?

Datu zinātnes pozīcijas, kas strādā ar ļoti sensitīviem vai konfidenciāliem datiem un informāciju (kas ietver lielu skaitu no tiem, pat ārpus tādām jomām, kurās ir liela privātuma aizsardzība, piemēram, banku un veselības aprūpes jomas, jo patentēti dati var būt viens no liela uzņēmuma vērtīgākajiem aktīviem), atradīs saskaras ar daudz vairāk ierobežojumu attiecībā uz attālo darbu. Šādos gadījumos, visticamāk, jums būs jāstrādā birojā darba laikā.

Daži citi faktori, kas jāņem vērā:

  • Cik tradicionāls ir jūsu uzņēmums. Lielāki, vecāki uzņēmumi parasti nav tik draudzīgi attālināti, lai gan COVID, iespējams, ir radījis lielas izmaiņas šajā jomā.
  • Cik viegli varat strādāt ar citiem komandas biedriem un nodaļām attālināti. Ja jūsu darbs ir ļoti saistīts ar sadarbību, visticamāk, jums būs jāierodas personīgi.
  • Datu zinātniekiem, kas strādā uz līguma pamata vai pat uz konsultāciju pamata, var būt arī lielāka elastība, izvēloties savu atrašanās vietu.

Kategori: Jaunumi