Datu zinātnes intervijas jautājumi

BrainStation Data Scientist karjeras ceļvedis var palīdzēt jums spert pirmos soļus ienesīgas karjeras virzienā datu zinātnē. Lasiet tālāk, lai iegūtu pārskatu par izplatītākajiem intervijas jautājumiem datu zinātnes darbiem un to, kā uz tiem vislabāk atbildēt.

Kļūsti par datu zinātnieku

Sazinieties ar mācību padomdevēju, lai uzzinātu vairāk par to, kā mūsu bootcamps un kursi var palīdzēt jums kļūt par datu zinātnieku.



Noklikšķinot uz Iesniegt, jūs piekrītat mūsu Noteikumi .



Iesniegt

Nevarēja iesniegt! Vai atsvaidzināt lapu un mēģināt vēlreiz?

Uzziniet vairāk par mūsu Data Science Bootcamp

Paldies!

Mēs drīzumā sazināsimies.



Skatiet Data Science Bootcamp lapu

Datu zinātnes interviju procesi var atšķirties atkarībā no uzņēmuma un nozares. Parasti tie ietver sākotnējo tālruņa pārbaudi ar darbā pieņemšanas vadītāju, kam seko viena vai vairākas intervijas uz vietas.

Jums būs jāatbild uz tehnisko un uzvedības datu zinātnes intervijas jautājumiem un, iespējams, pabeigsiet ar prasmēm saistītu projektu. Pirms katras intervijas jums vajadzētu pārskatīt savu CV un portfolio, kā arī sagatavoties potenciālajiem intervijas jautājumiem.

Datu zinātnes intervijas jautājumi pārbaudīs jūsu statistikas, programmēšanas, matemātikas un datu modelēšanas zināšanas un prasmes. Darba devēji novērtēs jūsu tehniskās un mīkstās prasmes un to, cik labi jūs iederētos viņu uzņēmumā.



Sagatavojot dažus izplatītus datu zinātnes interviju jautājumus un atbildes, varat droši piedalīties intervijā. Ir daži dažādi datu zinātnieka jautājumu veidi, ar kuriem varat saskarties datu zinātnes intervijas laikā.

Datu zinātnes intervijas jautājumu saraksts: ar datiem saistīti jautājumi

Darba devēji meklē kandidātus, kuriem ir spēcīgas zināšanas par datu zinātnes metodēm un koncepcijām. Ar datiem saistītie intervijas jautājumi mainīsies atkarībā no amata un nepieciešamajām prasmēm.

Šeit ir daži ar datiem saistītu intervijas jautājumu un atbilžu paraugu piemēri.



Kāda ir atšķirība starp uzraudzītu mācīšanos un bez uzraudzības?

Lielākā atšķirība starp uzraudzītu un neuzraudzītu mācīšanos ietver marķētu un nemarķētu datu kopu izmantošanu. Uzraudzītās mācīšanās izmanto izvades un ievades datus, kas ir marķēti, un neuzraudzītas mācīšanās algoritmi to neizmanto. Vēl viena atšķirība ir tā, ka uzraudzītai mācībai ir atgriezeniskās saites mehānisms, savukārt bez uzraudzības mācībām nav. Visbeidzot, parasti izmantotie uzraudzītie mācību algoritmi ietver loģistikas regresiju, atbalsta vektoru mašīnu un lēmumu kokus, savukārt neuzraudzītie mācību algoritmi ir k-means klasterizācija, hierarhiskā klasterizācija un apriori algoritms.

Kāda ir atšķirība starp dziļo mācīšanos un mašīnmācīšanos?

Uz šo jautājumu var būt grūti skaidri atbildēt, jo šeit acīmredzami ir zināma pārklāšanās. Sāciet, paskaidrojot, ka dziļā mācīšanās būtībā ir mašīnmācības apakšjoma un ka abas ietilpst mākslīgā intelekta paspārnē. Ja mašīnmācība izmanto algoritmus, lai analizētu datus un galu galā iemācītos pieņemt lēmumus, pamatojoties uz to, ko tas rada no datiem, dziļās mācīšanās slāņos šos algoritmus, lai izveidotu mākslīgus neironu tīklus, kas spēj mācīties un pieņemt apzinātus lēmumus.

  • Vai varat sniegt detalizētu Lēmumu koka algoritma skaidrojumu?
  • Kas ir paraugu ņemšana? Cik izlases metodes jūs zināt?
  • Kā jūs atšķirat I tipa kļūdu no II veida?
  • Lūdzu, definējiet lineāro regresiju.
  • Ko nozīmē termini p-vērtība, koeficients un r-kvadrātvērtība? Kāpēc katra sastāvdaļa ir nozīmīga?
  • Lūdzu, definējiet atlases novirzi.
  • Lūdzu, definējiet statistisko mijiedarbību.
  • Vai varat sniegt piemēru datu kopai ar sadalījumu, kas nav Gausa sadalījums?
  • Lūdzu, paskaidrojiet Binomiālās varbūtības formulu.
  • Vai varat izskaidrot atšķirību starp k-NN un k-means klasterizāciju?
  • Kāda ir jūsu pieeja loģistikas regresijas modeļa izveidei?
  • Kāds ir 80/20 noteikums? Cik svarīgi ir modelēt validāciju?
  • Definējiet precizitāti un atsaukšanu. Kā tie ir saistīti ar ROC līkni?
  • Lūdzu, paskaidrojiet, kā atšķirt L1 un L2 legalizācijas metodes?
  • Pirms mašīnmācīšanās algoritmu izmantošanas, kādi ir datu strīdēšanās un datu tīrīšanas soļi?
  • Vai varat izskaidrot atšķirību starp histogrammu un lodziņu?
  • Kā jūs definējat savstarpējo validāciju?
  • Vai varat paskaidrot, kas ir viltus pozitīvs un viltus negatīvs? Ko jūs teiktu labāk: pārāk daudz viltus pozitīvu vai pārāk daudz viltus negatīvu?
  • Izstrādājot mašīnmācīšanās modeli, kas ir svarīgāk: modeļa precizitāte vai modeļa veiktspēja?
  • Kas, jūsuprāt, ir labāks: 50 mazi lēmumu koki vai liels?
  • Vai varat iedomāties datu zinātnes projektu mūsu uzņēmumā, kas jūs varētu interesēt?
  • Vai varat, lūdzu, padomāt par dažiem datu zinātnes paraugprakses piemēriem?

Datu zinātnes interviju jautājumu saraksts: Tehnisko prasmju jautājumi

Tehnisko prasmju jautājumi datu zinātnes intervijā tiek izmantoti, lai novērtētu jūsu datu zinātnes zināšanas, prasmes un iemaņas. Šie jautājumi būs saistīti ar datu zinātnieka amata konkrētajiem darba pienākumiem.

Tehnisko datu zinātnes intervijas jautājumiem var būt viena pareizā atbilde vai vairāki iespējamie risinājumi. Risinot problēmas, vēlēsities parādīt savu domāšanas gaitu un skaidri izskaidrot, kā nonācāt pie atbildes.

Tehnisko datu zinātnes prasmju intervijas jautājumu piemēri:

Kādi ir datu zinātnieka labākie rīki un tehniskās prasmes?

Datu zinātne ir ļoti tehniska joma, un jūs vēlaties parādīt personāla atlases menedžerim, ka esat lietpratīgs ar visiem jaunākajiem nozares standarta rīkiem, programmatūru un programmēšanas valodām. No dažādām datu zinātnē izmantotajām statistikas programmēšanas valodām datu zinātnieki visbiežāk izmanto R un Python. Abas var izmantot statistikas funkcijām, piemēram, nelineāra vai lineāra modeļa izveidei, regresijas analīzei, statistikas testiem, datu ieguvei un citiem. Vēl viens svarīgs datu zinātnes rīks ir RStudio Server, savukārt Jupyter Notebook bieži tiek izmantots statistiskai modelēšanai, datu vizualizācijām, mašīnmācīšanās funkcijām utt. Protams, ir vairāki īpaši datu vizualizācijas rīki, ko plaši izmanto Data Scientists, tostarp Tableau, PowerBI. , Bokeh, Plotly un Infogram. Datu zinātniekiem ir nepieciešama arī liela pieredze, izmantojot SQL un Excel.

Jūsu atbildē ir jānorāda arī visi konkrētie rīki vai tehniskās kompetences, kas nepieciešamas darbam, par kuru intervējat. Pārskatiet darba aprakstu un, ja ir kādi rīki vai programmas, kuras neesat izmantojis, iespējams, ir vērts iepazīties ar to pirms intervijas.

Kā jūs izturaties pret ārējām vērtībām?

Dažus novirzes veidus var noņemt. Atkritumu vērtības vai vērtības, par kurām jūs zināt, ka tās nevar būt patiesas, var tikt atmestas. Var noņemt arī novirzes ar ekstremālām vērtībām, kas atrodas tālu ārpus pārējiem datu punktiem, kas grupēti kopā. Ja nevarat atteikties no nobīdēm, varat vēlreiz apsvērt, vai izvēlējāties pareizo modeli, varat izmantot algoritmus (piemēram, nejaušus mežus), kurus pārāk lielā mērā neietekmēs izņēmuma vērtības, vai arī mēģināt normalizēt savus datus.

  • Lūdzu, pastāstiet mums par oriģinālo izveidoto algoritmu.
  • Kāda ir jūsu iecienītākā statistikas programmatūra un kāpēc?
  • Vai esat strādājis pie datu zinātnes projekta, kuram bija nepieciešama būtiska programmēšanas sastāvdaļa? Ko jūs paņēmāt no pieredzes?
  • Aprakstiet, kā efektīvi attēlot datus ar piecām dimensijām.
  • Jums ir jāģenerē paredzamais modelis, izmantojot vairāku regresiju. Kāds ir šī modeļa apstiprināšanas process?
  • Kā nodrošināt, ka algoritmā veiktās izmaiņas ir uzlabojumi?
  • Lūdzu, norādiet savu metodi nelīdzsvarotas datu kopas apstrādei, kas tiek izmantota prognozēšanai (t.i., ievērojami vairāk negatīvo klašu nekā pozitīvo klašu).
  • Kāda ir jūsu pieeja, lai apstiprinātu modeli, kuru izveidojāt, lai ģenerētu kvantitatīvā iznākuma mainīgā paredzamo modeli, izmantojot vairāku regresiju?
  • Jums ir divi dažādi modeļi ar salīdzināmu skaitļošanas veiktspēju un precizitāti. Lūdzu, paskaidrojiet, kā izlemjat, kuru izvēlēties ražošanai un kāpēc.
  • Jums tiek dota datu kopa, kas sastāv no mainīgajiem lielumiem, kuriem liela daļa trūkst vērtību. Kāda ir jūsu pieeja?

Datu zinātnes intervijas jautājumu saraksts: personīgie jautājumi

Līdztekus datu zinātnes zināšanu un prasmju pārbaudei darba devēji, iespējams, uzdos arī vispārīgus jautājumus, lai jūs labāk iepazītu. Šie jautājumi palīdzēs viņiem saprast jūsu darba stilu, personību un to, kā jūs varētu iekļauties viņu uzņēmuma kultūrā.

Personas datu zinātnieka intervijas jautājumi var ietvert:

Kāds ir labs datu zinātnieks?

Jūsu atbilde uz šo jautājumu daudz pastāstīs personāla atlases vadītājam par to, kā jūs redzat savu lomu un vērtību, ko sniedzat organizācijai. Savā atbildē jūs varētu runāt par to, kā datu zinātnei ir nepieciešama reta kompetenču un prasmju kombinācija. Labam datu zinātniekam ir jāapvieno tehniskās prasmes, kas vajadzīgas datu parsēšanai un modeļu izveidei ar biznesa izpratni, kas nepieciešama, lai izprastu problēmas, ar kurām viņi risina, kā arī atpazītu savos datos izmantojamus ieskatus. Savā atbildē jūs varētu arī apspriest datu zinātnieku, uz kuru uzlūkojat, neatkarīgi no tā, vai tas ir kolēģis, kuru pazīstat personīgi, vai saprātīgs nozares pārstāvis.

  • Lūdzu, pastāstiet par sevi.
  • Kādas ir tavas profesionālās labākās īpašības? Kuras ir jūsu vājās vietas?
  • Vai ir kāds datu zinātnieks, kuru jūs visvairāk apbrīnojat?
  • Kas iedvesmoja jūsu interesi par datu zinātni?
  • Kādas unikālas prasmes vai īpašības jūs sniedzat, kas palīdzētu komandai?
  • Kas lika jums izlemt pamest savu pēdējo darbu?
  • Kāda līmeņa atlīdzību jūs gaidāt no šī darba?
  • Vai vēlaties strādāt vienatnē vai datu zinātnieku komandas sastāvā?
  • Kur tu redzi savu karjeru pēc pieciem gadiem?
  • Kāda ir jūsu pieeja stresa pārvarēšanai darbā?
  • Kā jūs atrodat motivāciju?
  • Kāda ir jūsu metode panākumu mērīšanai?
  • Kā jūs raksturotu savu ideālo darba vidi?
  • Kādas ir jūsu aizraušanās vai hobiji ārpus datu zinātnes?

Datu zinātnes intervijas jautājumu saraksts: vadība un komunikācija

Vadība un komunikācija ir divas vērtīgas datu zinātnieku prasmes. Darba devēji augstu vērtē darba kandidātus, kuri var izrādīt iniciatīvu, dalīties pieredzē ar komandas locekļiem un paziņot datu zinātnes mērķus un stratēģijas.

Šeit ir daži vadības un komunikācijas datu zinātnes intervijas jautājumu piemēri:

Kas jums patīk darbā daudznozaru komandā?

Datu zinātnieks sadarbojas ar dažādiem cilvēkiem tehniskās un netehniskās lomās. Nav nekas neparasts, ka datu zinātnieks strādā ar izstrādātājiem, dizaineriem, produktu speciālistiem, datu analītiķiem, pārdošanas un mārketinga komandām un augstākā līmeņa vadītājiem, nemaz nerunājot par klientiem. Tāpēc, atbildot uz šo jautājumu, jums ir jāparāda, ka esat komandas spēlētājs, kurš izbauda iespēju satikties un sadarboties ar cilvēkiem visā organizācijā. Izvēlieties piemēru situācijai, kurā ziņojāt uzņēmuma augstākā līmeņa cilvēkiem, lai ne tikai parādītu, ka jūtaties ērti sazināties ar jebkuru personu, bet arī parādītu, cik vērtīgi ir bijuši jūsu uz datiem balstītie ieskati pagātnē.

  • Vai varat iedomāties kādu profesionālu situāciju, kurā jums bija iespēja demonstrēt līderību?
  • Kāda ir jūsu pieeja konfliktu risināšanai?
  • Kāda ir jūsu pieeja profesionālu attiecību veidošanai ar kolēģiem?
  • Kāds ir jūsu sniegtās veiksmīgas prezentācijas piemērs? Kāpēc tas bija tik pārliecinoši?
  • Ja jūs runājat ar kolēģi vai klientu no netehniskas vides, kā jūs izskaidrojat sarežģītas tehniskas problēmas vai izaicinājumus?
  • Lūdzu, atcerieties situāciju, kad jums bija jārīkojas ar sensitīvu informāciju. Kā tu pievērsies situācijai?
  • Kā jūs vērtējat savas komunikācijas prasmes no savas perspektīvas?

Datu zinātnes intervijas jautājumu saraksts: uzvedība

Ar uzvedības intervijas jautājumiem darba devēji meklē konkrētas situācijas, kas parāda noteiktas prasmes. Intervētājs vēlas saprast, kā jūs tikāt galā ar pagātnes situācijām, ko esat iemācījušies un ko varat sniegt viņa uzņēmumam.

Uzvedības jautājumu piemēri datu zinātnes intervijā ir šādi:

Vai atceraties situāciju, kad jums bija jātīra un jāsakārto liela datu kopa?

Pētījumi liecina, ka datu zinātnieki lielāko daļu sava laika velta datu sagatavošanai, nevis datu ieguvei vai modelēšanai. Tātad, ja jums ir pieredze datu zinātnieka amatā, ir gandrīz droši, ka jums ir pieredze lielas datu kopas tīrīšanā un organizēšanā. Tā ir arī taisnība, ka šis ir uzdevums, kas patiešām patīk tikai dažiem cilvēkiem. Taču datu tīrīšana ir arī viens no svarīgākajiem soļiem jebkuram uzņēmumam. Tāpēc darbā pieņemšanas menedžerim vajadzētu veikt datu sagatavošanas procesu: dublēto novērojumu noņemšanu, strukturālo kļūdu labošanu, novirzes filtrēšanu, trūkstošo datu novēršanu un datu validāciju.

  • Padomājiet par datu projektu, pie kura esat strādājis, kur saskārāties ar problēmu vai izaicinājumu. Kāda bija situācija, kāds bija šķērslis un kā jūs to pārvarējāt?
  • Lūdzu, sniedziet konkrētu piemēru datu izmantošanai, lai uzlabotu klienta vai ieinteresētās personas pieredzi?
  • Lūdzu, norādiet konkrētu situāciju, kad esat sasniedzis mērķi. Kā tu to panāci?
  • Lūdzu, norādiet konkrētu situāciju, kurā jums neizdevās sasniegt mērķi. Kas notika?
  • Kāda ir jūsu pieeja, lai pārvaldītu un ievērotu stingrus termiņus?
  • Vai atceries, kad darbā saskārāties ar konfliktiem? Kā jūs ar to tikāt galā?

Datu zinātnes interviju jautājumu saraksts no populārākajiem uzņēmumiem (Amazon, Google, Facebook, Microsoft)

Lai sniegtu jums priekšstatu par dažiem citiem jautājumiem, kas varētu rasties intervijā, mēs izveidojām datu zinātnes interviju jautājumu sarakstu no dažiem labākajiem tehnoloģiju uzņēmumiem.

  • Kāda ir atšķirība starp atbalsta vektora mašīnu un loģistikas regresiju? Lūdzu, sniedziet piemērus situācijām, kurās jūs izvēlētos izmantot vienu, nevis otru.
  • Ja trūkstošo vērtību noņemšana no datu kopas izraisa novirzi, ko jūs darītu?
  • Kādus rādītājus jūs novērtētu, aplūkojot produkta veselību, iesaistīšanos vai izaugsmi?
  • Mēģinot risināt vai atrisināt biznesa problēmas, kas saistītas ar mūsu produktu, kādus rādītājus jūs novērtētu?
  • Kā jūs vērtējat produkta veiktspēju?
  • Kā zināt, vai jauns novērojums ir novirze?
  • Kā jūs definētu neobjektivitātes un novirzes kompromisu?
  • Kāda ir jūsu metode, lai nejauši atlasītu paraugu no produkta lietotāju kopas?
  • Kāds ir jūsu process datu izjaukšanai un tīrīšanai pirms mašīnmācīšanās algoritmu izmantošanas?
  • Kā jūs vērstos pret nelīdzsvarotu bināro klasifikāciju?
  • Kā jūs atšķirat labu un sliktu datu vizualizāciju?
  • Lūdzu, izveidojiet funkciju, kas pārbauda, ​​vai vārds ir palindroms.

Kategori: Jaunumi