Kā iegūt pirmo darbu datu zinātnē?

Kā var iegūt savu pirmo ierakstu līmeņa darbu kā datu zinātniece vai datu analītiķe? Pārlūkojot datu zinātnes forumus, jūs atradīsit daudz jautājumu par šo tēmu. Mana datu zinātnes emuāra (data36.com) lasītāji man ik pa laikam jautā to pašu. Un es jums varu pateikt, ka tā ir pilnīgi pamatota problēma!

Esmu nolēmis apkopot savas atbildes uz visiem galvenajiem jautājumiem!

JAUNUMS! Esmu izveidojis visaptverošu (bezmaksas) tiešsaistes video kursu, lai palīdzētu jums sākt darbu ar Data Science. Noklikšķiniet šeit, lai iegūtu vairāk informācijas: Kā kļūt par datu zinātnieku.

REĢISTRĒTIES ŠEIT (BEZMAKSAS): https://data36.com/how-to-become-a-data-scientist/

# 1: Kādas ir vissvarīgākās datu zinātnieka prasmes un rīki? Un kā jūs tos varat iegūt?

Labas ziņas - sliktas ziņas.

Sākšu ar slikto. 90% gadījumu prasmes, kuras viņi māca jums universitātēs, nav īsti noderīgas reālās dzīves datu zinātnes projektos. Kā esmu rakstījis apmēram vairākas reizes, reālos projektos ir vajadzīgas šīs 4 datu kodēšanas prasmes:

  • bash / komandrinda
  • Python
  • SQL
  • R
  • (un dažreiz Java)
avots: KDnuggets

Tas, kuri 2 vai 3 jūs atradīsit visnoderīgākos, patiešām ir atkarīgs no uzņēmuma… Bet, ja jūs vienu esat iemācījies, citu būs daudz vieglāk iemācīties.

Tātad pirmais lielais jautājums ir: kā jūs varat iegūt šos rīkus? Šeit nāk labās ziņas! Visi šie rīki ir bez maksas! Tas nozīmē, ka varat tos lejupielādēt, instalēt un lietot, par tiem nemaksājot santīmu. Jūs varat praktizēt, veidot datu hobiju projektu vai jebko citu!

Nesen es uzrakstīju soli pa solim rakstu par to, kā instalēt šos rīkus datorā. Pārbaudiet to šeit.

# 2: Kā iemācīties?

Ir divi galvenie veidi, kā viegli un rentabli apgūt datu zinātni.

1. grāmata.

Kinda old-school, bet tomēr labs mācīšanās veids. No grāmatām jūs varat iegūt ļoti koncentrētas, ļoti detalizētas zināšanas par tiešsaistes datu analīzi, statistiku, datu kodēšanu utt.... Es uzsvēru 7 grāmatas, kuras es ieteiktu iepriekšējā rakstā, šeit.

7 populārākās datu grāmatas, kuras es iesaku

2. daļa: Tiešsaistes tiešsaistes semināri un video kursi.

Datu zinātnes tiešsaistes kursi nāk ar taisnīgām cenām (no 10 līdz 500 USD), un tie aptver dažādas tēmas, sākot no datu kodēšanas līdz biznesa inteliģencei. Ja jūs nevēlaties tērēt naudu par to sākumā, šajā amatā esmu uzskaitījis bezmaksas kursus un mācību materiālus.

(3. daļa: Junior Data Scientist pirmā mēneša kurss. Es esmu izveidojis 6 nedēļu tiešsaistes datu zinātnes kursu, kas vēlas iegūt datu zinātniekiem praktiskas iespējas un risināt patiesos uzdevumus, izmantojot patiesas dzīves datu kopu: Junior Data Scientist pirmais mēnesis. .)

# 3: Kā praktizēt un kā iegūt reālu dzīves pieredzi

Tas ir sarežģīti, vai ne? Katrs uzņēmums vēlas, lai būtu cilvēki ar vismaz nelielu reālās dzīves pieredzi… Bet kā iegūt reālu dzīves pieredzi, ja jums nepieciešama reāla dzīves pieredze, lai iegūtu pirmo darbu? Klasiskais catch-22. Un atbilde ir: mājdzīvnieku projekti.

“Mājdzīvnieku projekts” nozīmē, ka jūs nākt klajā ar datu projekta ideju, kas jūs satrauc. Tad jūs vienkārši sākat to veidot. Varat domāt par to kā mazu starta vietu, taču pārliecinieties, ka jums jākoncentrējas uz projekta datu zinātnes daļu un varat vienkārši ignorēt biznesa daļu. Lai sniegtu jums dažas idejas, šeit ir daži no maniem mājdzīvnieku projektiem no pēdējiem gadiem:

  • Es izveidoju skriptu, kas uzraudzīja nekustamā īpašuma vietni, un man pa e-pastu nosūtīja labākos piedāvājumus reāllaikā - lai es varētu saņemt šos darījumus pirms visiem pārējiem.
  • Es uzcēlu skriptu, kas piesaistīja visus rakstus no ABC, BBC un CNN, un, balstoties uz izmantotajiem vārdiem, 3 dažādos ziņu portālos savienoja rakstus, kas bija par tieši to pašu tēmu.
  • Pythonā uzbūvēju pašmācības tērzētavu. (Tomēr tas nav pārāk gudrs - tā kā es to vēl neesmu apmācījis.)

Esi radošs! Atrodiet sev ar datu zinātni saistītu pet projektu un sāciet kodēt! Ja jūs saskaraties ar kodēšanas problēmu - tas var viegli notikt, kad sākat mācīties jaunu datu valodu - vienkārši izmantojiet google un / vai stackoverflow. Viens īss raktuvju piemērs par to, cik efektīva ir kaudzes pārplūde:

kreisā puse: mans jautājums - labā puse: atbilde (7 minūtēs)

Ievērojiet laika zīmogu! Esmu nosūtījis sava veida sarežģītu jautājumu, un 7 minūšu laikā saņēmu atbildi. Vienīgais, kas man bija jādara, bija kopēt-ielīmēt kodu manā ražošanas kodā un uzplaukumā, tas vienkārši darbojās!

(Piezīme. Cross Validated ir vēl viens lielisks forums ar jautājumiem, kas saistīti ar datu zinātni.)

+1 ieteikums:

Pat ja tas ir mazliet grūti, mēģiniet iegūt mentoru. Ja jums paveicas, jūs atradīsit kādu, kurš strādā datu zinātnieka lomā jaukā uzņēmumā un kurš var pavadīt 1 stundu nedēļā vai divreiz nedēļā ar jums un diskutēt vai mācīt lietas.

# 4: Kur un kā jūs sūtāt savu pirmo darba pieteikumu?

Ja jums vēl nav izdevies atrast mentoru, jūs joprojām varat atrast savu pirmo savā pirmajā uzņēmumā. Šis būs jūsu pirmais darbs, kas saistīts ar datu zinātni, tāpēc es iesaku nekoncentrēties uz lielu naudu vai super izdomātu sākuma atmosfēru. Koncentrējieties uz tādas vides atrašanu, kurā jūs varat mācīties un pilnveidot sevi.

Jūsu pirmā datu zinātnes darba veikšana daudznacionālā uzņēmumā varētu neatbilst šai idejai, jo cilvēki tur parasti ir pārāk aizņemti ar savām lietām, tāpēc viņiem nebūs laika vai / un motivācijas, lai palīdzētu jums pilnveidoties (protams, vienmēr ir izņēmumi).

Sākot no neliela uzņēmuma dibināšanas kā pirmās personas datu komandā, arī jūsu gadījumā nav laba ideja, jo šiem uzņēmumiem nav vecāko datu puišu, no kuriem mācīties.

Iesaku koncentrēties uz 50–500 lieliem uzņēmumiem. Tas ir zelta vidusceļš. Uz kuģa ir vecākie datu zinātnieki, taču viņi nav pārāk aizņemti, lai jums palīdzētu un mācītu.

Labi, ka esat atradis dažas labas firmas ... Kā pieteikties? Daži principi jūsu CV: izceliet savas prasmes un projektus, nevis pieredzi (jo jums vēl nav pārāk daudz gadu, lai ievietotu uz papīra). Uzskaitiet atbilstošās kodēšanas valodas (SQL un Python), kuras izmantojat, un saistiet dažus saistītos github repos, lai jūs varētu parādīt, ka tiešām esat lietojis šo valodu.

Arī vairumā gadījumu uzņēmumi lūdz pavadvēstuli. Protams, tā ir laba iespēja izteikt savu entuziasmu, taču varat arī pievienot dažas praktiskas detaļas, piemēram, ko jūs darītu savās pirmajās nedēļās, ja jūs pieņemtu darbā. (Piemēram, “Raugoties uz jūsu reģistrācijas plūsmu, es domāju, ka ____ vietnei ir liela nozīme. Pirmajās pāris nedēļās es veiktu ___, ___ un ___ (īpašas analīzes), lai pierādītu šo hipotēzi un saprastu to dziļāk. Tas varētu palīdzēt uzņēmumam uzlabot _____ un galu galā palielināt _____ KPI. ”)

Cerams, ka tas jums parādīs darba interviju, kurā jūs varat mazliet tērzēt par saviem mājdzīvnieku projektiem, motivācijas vēstules ieteikumiem, taču tas galvenokārt attieksies uz personības piemērotības pārbaudi un, iespējams, kādu pamata prasmju pārbaudi. Ja jūs būtu pietiekami praktizējis, jūs to nokārtotu ... bet, ja jūs esat nervu tips un vēlaties trenēties vairāk, to varat izdarīt vietnē hackerrank.com.

Secinājums

Nu, tas arī viss. Es zinu, ka tas izklausās vieglāk, kad tas ir uzrakstīts, bet, ja jūs patiešām esat apņēmies būt datu zinātnieks, tas neradīs nekādas problēmas to izdarīt! Veiksmi ar to!

Ja vēlaties izmēģināt, kas tas ir, piemēram, būt jaunākajam datu zinātniekam pie patiesas dzīves uzsākšanas, apskatiet manu 6 nedēļu tiešsaistes datu zinātnes kursu: Junioru datu zinātnieka pirmais mēnesis!

Un, ja vēlaties uzzināt vairāk par datu zinātni, pārbaudiet manu emuāru (data36.com) un / vai abonējiet manu biļetenu! Nepalaidiet garām manu jauno kodēšanas apmācības sēriju: SQL datu analīzei!

Paldies par lasīšanu

Patika raksts? Lūdzu, vienkārši paziņojiet man, noklikšķinot uz zemāk. Tas arī palīdz citiem cilvēkiem redzēt stāstu!

Tomi Mestere data36.com Twitter autore: @ data36_com