Kurss "Datu analītiķis" - kurss 96 000 rubļu. no Yandex darbnīcas, apmācība 7 mēneši, datums 2023. gada 7. decembris.
Literārs Mistrojums / / December 02, 2023
Datu analītiķis iegūst nozīmi no skaitļiem un vērtībām: viņš redz tendences, prognozē notikumus un palīdz uzņēmumam izprast klientus, optimizēt procesus un augt.
Tirgū ir vajadzīgi speciālisti, kas prot lietderīgi izmantot datus. Personāla uzņēmuma Ancor 2022. gada septembra pētījums parādīja, ka 45% Krievijas uzņēmumu meklē analītiķus, lai pievienotos savai komandai.
Prasmes, kuras apgūsiet kursā
Amata nosaukums
Analītiķis, datu analītiķis, datu analītiķis
Attīstības iespējas: Produktu analītiķis, mārketinga analītiķis, BI analītiķis, datu zinātnes speciālists
Šeit ir izmantotās tehnoloģijas un rīki:
Python
Jupyter piezīmju grāmatiņa
SQL
PostgreSQL
Tabula
A/B testi
Sāciet pelnīt naudu, analizējot
Jūs sāksit no juniora pozīcijas un tad virzīsities tikai uz priekšu. Jūs kāpsiet pa karjeras kāpnēm un pieaugsiet vērtībā. Un kādu dienu par jums nebūs cenas.
Pabeigt datu analīzes kursu programmu
Mēs to regulāri atjauninām, lai nodrošinātu, ka tas atbilst nozares un darba devēju vajadzībām.
Citiem vārdiem sakot, jūs mācāties tikai to, kas noteikti noderēs jūsu darbā.
Bezmaksas daļa - 1 nedēļa
Bezmaksas ievads: Python pamati un datu analīze
Uzziniet datu analīzes pamatjēdzienus un izprotiet, ko dara datu analītiķi un datu zinātnieki.
• Maskavas Catnamycs. Datu parādīšana ekrānā. CSV faili. Darbs ar galdiem. Siltuma kartes. Kolonnas reizināšana ar veselu skaitli.
• Kļūdas kodā. Sintakses kļūdas. Nosaukšanas kļūdas. Kļūdas dalot ar nulli. Kļūdas, importējot moduli.
• Mainīgie un datu tipi. Mainīgie lielumi. Datu veidi. Aritmētiskās darbības ar cipariem un virknēm.
• Kā izvirzīt hipotēzes. Hipotēzes. HADI cikli. Analītiskā domāšana. Grafiku lasīšana.
• Ko dara datu zinātnieki. Analītiķa uzdevumi. Uzdevumu precizēšana. Sadalīšanās. Projekta posmi.
• Reklāmguvumu pārbaude. Pārvēršana. Datu izpēte. Secinājumu veidošana.
• Reklāmas kampaņu atmaksāšanās. Kolonnu diagramma. Elementu atšķirība. Indeksēšana kolonnās.
• Mašīnmācība un datu zinātne. Apmācība mašīnmācībā. Unikālo vērtību atrašana kolonnās. Loģiskā indeksācija. Vērtību grupēšana tabulā. Prognožu kļūdas.
• Nobeiguma projekts. Lietotāju segmentācija.
PythonPandas kļūdasSeabornHipotēzesReklāmguvumuMainīgieDatu veidi Siltuma kartes
1 sprints 3 nedēļas
Pamata Python
Iedziļinieties Python programmēšanas valodā un Pandas bibliotēkā.
• Mainīgie un datu tipi. Python valoda. Mainīgie lielumi. Datu parādīšana ekrānā. Objektu parādīšana ekrānā. Apstrādājot kļūdas, mēģiniet... izņemot operatoru. Datu veidi. Datu veidu reklāmguvumi.
• Līnijas. Indeksi rindās. Līniju griezumi. Operācijas ar stīgām. Stīgu metodes. Formatēšanas virknes, format() metode, f-strings.
• Saraksti. Indeksi sarakstos. Saraksta šķēles. Vienumu pievienošana sarakstam. Notiek saraksta vienumu noņemšana. Sarakstu saskaitīšana un reizināšana. • Sarakstu kārtošana. Meklēt vienumus sarakstā. Virknes sadalīšana virkņu sarakstā, virkņu saraksta savienošana virknē.
• Cilpai. Cikli. Elementu uzskaitījums. Iterācija pār elementu indeksiem. Sarakstu elementu apstrāde, izmantojot cilpas: elementu summas un reizinājuma atrašana.
• Ligzdotie saraksti. Pārlūkojiet ligzdotos sarakstus ar skaitīšanas vērtībām. Elementu pievienošana ligzdotiem sarakstiem. Ligzdoto sarakstu kārtošana.
• Nosacīts operators. Kamēr cilpa. Būla datu tips. Būla vērtības. Loģiskās izteiksmes. Saliktas loģiskās izteiksmes. Nosacīts paziņojums, ja...elif...cits. Sazarošanās. Sarakstu filtrēšana, izmantojot nosacījumu operatoru. Kamēr cilpa.
• Funkcijas. Funkciju piešķiršana. Parametri un argumenti. Parametri ar noklusējuma vērtībām. Pozicionālie un nosauktie argumenti. Funkcijas rezultāta atgriešana.
• Vārdnīcas. Atslēgas un vērtības. Vērtības meklēšana pēc atslēgas. Vienumu pievienošana vārdnīcai. Vārdnīcu saraksts. Skaista vārdnīcu izlaide.
• Pandas bibliotēka. Csv failu lasīšana. Datu rāmis. Datu rāmja konstruktors. Datu rāmja pirmās un pēdējās rindas drukāšana. Indeksēšana datu rāmjos. Indeksēšana sērijas kolonnās.
• Datu priekšapstrāde. GIGO princips. Datu rāmja kolonnu pārdēvēšana. Trūkstošo vērtību apstrāde. Tiešu un netiešu dublikātu apstrāde.
• Datu analīze un rezultātu prezentācija. Datu grupēšana. Datu kārtošana. Aprakstošās statistikas pamati.
• Jupyter Notebook — piezīmju grāmatiņa šūnā. Jupyter piezīmjdatora saskarne. Jupyter Notebook saīsnes.
CilpasPitonsPandasVirknesSarakstiFunkcijasVārdnīcasDatuRāmisMainīgieDatu tipiNosacījuma paziņojums
Projekts
Salīdziniet Yandex Music lietotāju datus pēc pilsētas un nedēļas dienas.
2 sprints 2 nedēļas
Datu priekšapstrāde
Uzziniet, kā attīrīt datus no novirzēm, izlaidumiem un dublikātiem, kā arī konvertēt dažādus datu formātus.
• Darbs ar caurlaidēm. Pārvēršana. Sīkdatnes. Kategoriskie un kvantitatīvie mainīgie. Kategorisko mainīgo lielumu nepilnību apstrāde. Kvantitatīvo mainīgo trūkumu novēršana. Kvantitatīvo mainīgo trūkumu novēršana pēc kategorijas.
• Datu tipu maiņa. Excel failu lasīšana. Konvertējiet sēriju uz ciparu tipu. Skaitļu modulis, abs() metode. Darbs ar datumu un laiku. Apstrādājot kļūdas, mēģiniet... izņemot operatoru. Datu rāmju sapludināšana, sapludināšanas() metode. Rakurstabulas.
• Meklēt dublikātus. Meklējiet dublikātus, reģistrjutīgi.
• Datu kategorizēšana. Tabulu sadalīšana. Kategorizācija pēc skaitliskiem diapazoniem. Kategorizēt, pamatojoties uz vairākām vērtībām vienā rindā.
• Sistemātiska un kritiska domāšana analītiķa darbā. Sistēmiskā domāšana. Datu kļūdu cēloņi. Kritiskā domāšana.
PythonPandasGap apstrādeDatu apstrādeDublikāta apstrādeDatu kategorizēšana
Projekts
Analizēt datus par bankas klientiem un noteikt kredītspējīgo klientu īpatsvaru.
3 sprints 2 nedēļas
Izpētes datu analīze
Apgūstiet varbūtības un statistikas pamatus. Izmantojiet tos, lai izpētītu datu pamatīpašības, meklējot modeļus, sadalījumus un anomālijas. Iepazīstieties ar Matplotlib bibliotēku. Zīmējiet diagrammas un praktizējiet grafiku analīzi.
• Pirmie grafiki un secinājumi. Rakurstabulu izmantošana. Joslu diagramma. Izplatījumi. Diapazona diagramma.
• Datu slāņu izpēte. Vaicājuma() metode. Darbs ar datumu un laiku. Grafiku uzzīmēšana, izmantojot plot() metodi. Occam skuveklis.
• Darbs ar vairākiem datu avotiem. Datu daļa, pamatojoties uz ārējiem objektiem. Jaunu kolonnu pievienošana datu rāmim. Datu pievienošana no citiem datu rāmjiem. Kolonnu pārdēvēšana. Tabulu apvienošana, izmantojot merge() un join() metodes.
• Datu attiecības. Izkliedes diagramma. Mainīgo lielumu korelācija. Izkliedes matrica.
• Rezultātu apstiprināšana. Grupu konsolidācija. Datu sadalīšana grupās.
PythonPandasMatplotlib HistogramsDatu SlicesDatu analīzeScatterplotScatterplotDatu vizualizācija Aprakstošā statistika
Projekts
Izpētiet sludinājumu arhīvu par nekustamā īpašuma pārdošanu Sanktpēterburgā un Ļeņingradas apgabalā.
4 sprints 3 nedēļas
Statistisko datu analīze
Iemācīties analizēt attiecības datos, izmantojot statistikas metodes. Uzziniet, kas ir statistiskā nozīme un hipotēzes.
• Kombinatorika. Kombinācijas. Reizināšanas noteikums. Pārkārtojumi. Permutāciju skaits. Izvietojumi. Izvietojumu skaits. Kombinācijas. Kombināciju skaits.
• Varbūtību teorija. Eksperimentējiet. Varbūtības telpa. Pasākumi. Varbūtība. Krustojoši un savstarpēji izslēdzoši notikumi. Eilera-Vena diagramma. Lielo skaitļu likums.
• Aprakstošā statistika. Kategoriskie un kvantitatīvie mainīgie. Režīms un mediāna. Vidējā vērtība. Izkliede. Standarta novirze. Kvartiles un procentiles. Diapazona diagramma. Kolonnu diagramma. Frekvences blīvums. Joslu diagramma.
• Nejaušie mainīgie. Diskrēts nejaušības lielums. Diskrēta gadījuma lieluma varbūtības sadalījums. Diskrēta gadījuma lieluma kumulatīvā funkcija (sadales funkcija). Diskrēta gadījuma mainīgā matemātiskā cerība. Diskrēta gadījuma lieluma izkliede.
• Izplatījumi. Bernulli eksperiments. Binomiāls eksperiments. Binomiālais sadalījums. Nepārtraukta vienmērīga sadale. Normāls sadalījums. Standarta normālais sadalījums. CDF un PPF normālam sadalījumam. Poisson sadalījums. Viena sadalījuma tuvināšana ar citu.
• Hipotēžu pārbaude. Vispārējā populācija. Paraugs. Izlases sadalījums. Centrālās robežas teorēma. Vienpusējās un divpusējās hipotēzes. P-vērtība. Vienpusēju un divpusēju hipotēžu pārbaude vienam paraugam. Pārbaudot hipotēzi par divu vispārējo populāciju vidējo vienādību. Atkarīgo paraugu vidējo vienādības hipotēzes pārbaude.
ScipyNumpyPithonPandasMatplotlibCombinatoricsSadalījumiHipotēžu pārbaude Varbūtību teorija
Projekts
Pārbaudiet skrejriteņu nomas pakalpojumu hipotēzes, lai palīdzētu attīstīt savu biznesu.
Papildu sprints
Varbūtību teorija
Atcerieties vai atpazīstiet varbūtības teorijas pamatjēdzienus: neatkarīgi, pretēji, nesaderīgi notikumi utt. Izmantojot vienkāršus piemērus un jautras problēmas, jūs praktizēsiet darbu ar skaitļiem un risinājumu loģikas veidošanu.
Šis ir izvēles sprints. Tas nozīmē, ka katrs students pats izvēlas vienu no iespējām:
• Apgūstiet papildu 10 īsu nodarbību sprintu, atsvaidziniet teoriju un risiniet problēmas.
• Atveriet tikai bloku ar intervijas uzdevumiem, atcerieties praksi bez teorijas.
• Pilnībā izlaidiet kursu vai atgriezieties pie tā, kad ir laiks un nepieciešamība.
Python notikumiVarbūtībasBayes teorēmaNejauši mainīgieVarbūtību teorija Datu statistikas analīze
5 sprints 1 nedēļa
Pirmā moduļa noslēguma projekts
Uzziniet, kā veikt sākotnējo datu izpēti un formulēt un pārbaudīt hipotēzes.
ScipyNumpyPythonPandasMatplotlibDatu analīze Hipotēzes pārbaude Datu apstrāde
Projekts
Atrodiet modeļus spēļu pārdošanas datos.
6 sprints 2 nedēļas
Pamata SQL
Apgūstiet strukturētās vaicājumu valodas SQL pamatus un relāciju algebru darbam ar datu bāzēm. Iepazīstieties ar iespējām strādāt populārajā datu bāzes pārvaldības sistēmā (DBVS) PostgreSQL. Iemācieties rakstīt dažādas sarežģītības pakāpes vaicājumus un pārvērst biznesa problēmas SQL. Jūs strādāsit ar tiešsaistes veikala datu bāzi, kas specializējas filmās un mūzikā.
• Ievads datu bāzēs. Datu bāzes pārvaldības sistēmas (DBVS). SQL valoda. SQL vaicājumi. SQL vaicājumu formatēšana.
• Datu šķēles SQL. Datu tipi programmā PostgreSQL. Datu tipu konvertēšana. KUR klauzula. Loģiskie operatori. Datu šķēles. Operatori IN, LIKE, STARP. Darbs ar datumu un laiku. Trūkstošo vērtību apstrāde. Nosacītā CASE konstrukcija.
• Apkopošanas funkcijas. Datu grupēšana un kārtošana. Matemātiskās operācijas. Apkopošanas funkcijas. Datu grupēšana. Datu kārtošana. Filtrēšana pēc apkopotajiem datiem, operators HAVING.
• Attiecības starp tabulām. Tabulu savienojumu veidi. ER diagrammas. Lauku un tabulu pārdēvēšana. Pseidonīmi. Tabulu sapludināšana. Savienojumu veidi: IEKŠĒJAIS PIEVIENOJUMS, KREISAIS PIEVIENOJUMS, LABAIS PIEVIENOJUMS, PILNĪGS ĀRĒJS JOIN. Alternatīvi arodbiedrību veidi UNION un UNION ALL.
• Apakšvaicājumi un parastās tabulu izteiksmes. Apakšvaicājumi. Apakšvaicājumi šeit: FROM. Apakšvaicājumi šeit: WHERE. Savienojumu un apakšvaicājumu kombinācija. Kopējās tabulas izteiksmes (CTE). Pieprasījumu mainīgums.
SQLDBMSPostgreSQLApakšvaicājumiDatu bāzesSQL vaicājumi Datu filtrēšana Datu kārtošana Datu grupēšanaSavienojošās tabulasBiežākās tabulu izteiksmes
Projekts
Jūs rakstīsit dažādas sarežģītības vaicājumu sēriju datu bāzē, kurā tiek glabāti dati par riska investoriem, jaunizveidotiem uzņēmumiem un ieguldījumiem tajos.
7 sprints 3 nedēļas
Biznesa rādītāju analīze
Uzziniet, kādi rādītāji ir biznesā. Iemācieties izmantot rīkus datu analīzei uzņēmējdarbībā: kohortas analīzi, pārdošanas piltuvi un vienības ekonomiku.
• Metrika un piltuves. Pārvēršana. Piltuves. Mārketinga piltuve. Iespaidi. Klikšķi. VKS. Produkta piltuve.
• Kohortas analīze. Lietotāja profils. saglabāšanas līmenis. Atteikšanās ātrums. Analīzes horizonts. Kohortas analīzes vizualizācija. Nejaušo kohortu saglabāšanas analīze. Reklāmguvums kohortas analīzē. Metrikas aprēķināšana Python.
• Vienību ekonomika. Metrikas LTV, CAC, ROI. ARPU, ARPPU. Metrikas aprēķināšana Python. Uzlabota metrikas vizualizācija. Sharey parametrs. Slīdošais vidējais.
• Pielāgota metrika. Lietotāju aktivitātes novērtējums. Lietotāja sesija. Anomālijas izmeklēšana.
MetrikaPiltuvesReklāmguvumuvienības ekonomikaKohortas analīzeProduktu metrika Mārketinga metrika
Projekts
Pamatojoties uz datiem, izprotiet lietotāju uzvedību, kā arī analizējiet klientu rentabilitāti un reklāmas IA, lai sniegtu ieteikumus mārketinga nodaļai.
8 sprints 2 nedēļas
Uzlabotā SQL
Apgūsi papildus kursu darbam ar datu bāzēm un kļūsi vēl tuvāks biznesam. Izmantojot SQL valodu, jūs analizēsit galveno biznesa rādītāju aprēķinus, ar kuriem iepazināties "Biznesa rādītāju analīzes" sprintā. Apsveriet iespēju strādāt ar sarežģītu rīku, piemēram, loga funkcijām. Iemācieties mainīt datu bāzu saturu lokāli, bez simulatora, izmantojot īpašas Python klientu programmas un bibliotēkas.
• Biznesa rādītāju aprēķins. Datu shēma. Pārvēršana. LTV. ARPU. ARPPU. IA. Aprēķins, izmantojot SQL.
• Logu funkciju apkopošana. OVER izteiksme. PARTITION BY loga parametrs.
• Logu ranžēšanas funkcijas. Ranking funkcijas. Logu ORDER BY operators. ROW_NUMBER(). RANK(). DENSE_RANK(). NTILE(). Logu operatori kopā ar ranžēšanas funkcijām.
• Logu nobīdes funkcijas. Kumulatīvās vērtības. Nobīdes funkcijas. LEAD(). VVG(). Logu funkcijas un aizstājvārdi.
• Kohortas analīze. Saglabāšanas līmenis, atteikšanās līmenis. LTV.
• Datu bāzes un datu bāzes klienta uzstādīšana un konfigurēšana. Datu bāzes klients. PostgreSQL instalēšana. DBeaver instalēšana. DBeaver interfeiss. Datu bāzes izveide. Datu bāzes izgāztuves izvietošana. Notiek vaicājuma rezultātu augšupielāde. Vaicājuma rezultātu prezentācija.
SQLDBMSMetricsPostgreSQLDatubāzesSQL vaicājumiLogu funkcijasKohortas analīze
Projekts
Izmantojot Python un SQL, izveidojiet savienojumu ar datu bāzi, aprēķiniet un vizualizējiet galvenos rādītājus programmēšanas jautājumu un atbilžu pakalpojumu sistēmā.
9 sprints 2 nedēļas
Lēmumu pieņemšana biznesā
Jūs uzzināsiet, kas ir A/B testēšana, un sapratīsiet, kādos gadījumos tā tiek izmantota. Iemācieties izstrādāt A/B testēšanu un novērtēt tās rezultātus.
• Hipotēžu pārbaudes pamati uzņēmējdarbībā. Vadošie rādītāji. Eksperimentu pamati. Hipotēžu ģenerēšana. Metrikas prioritāšu noteikšana. Eksperimenta veikšanas metodes izvēle. Kvalitatīvas metodes hipotēžu pārbaudei. Kvantitatīvās metodes hipotēžu pārbaudei. A/B testu priekšrocības un trūkumi.
• Hipotēžu prioritāšu noteikšana. RICE ietvars. Sasniedzamības parametrs. Ietekmes parametrs. Pārliecības parametrs. Piepūles parametrs.
• Sagatavošanās veikt A/B testu. A/A tests. I un II tipa kļūdas. Statistikas testa spēks. Statistiskā testa nozīme. Vairāki salīdzinājumi, metodes kļūdas iespējamības samazināšanai. A/B testa izlases lieluma un ilguma aprēķins. Metrikas grafiskā analīze.
• A/B testu rezultātu analīze. Akciju vienlīdzības hipotēzes pārbaude. Shapiro-Wilk tests, lai pārbaudītu datu normālu. Neparametriskie statistikas testi. Manna-Vitnija tests. Kumulatīvo rādītāju stabilitāte. Ārējo rādītāju un pārrāvumu analīze.
• Uzvedības algoritmi. Fakti, emocijas, vērtējumi. Izskaidrojiet savu viedokli.
A/B testēšana Hipotēžu prioritāšu noteikšanaGatavošanās A/B testēšanai A/B testēšanas rezultātu analīze A/B testēšanas rezultātu analīze
Projekts
Analizējiet A/B testēšanas rezultātus lielā tiešsaistes veikalā.
10 sprints 1 nedēļa
Otrā moduļa noslēguma projekts
Iemācieties pārbaudīt statistiskās hipotēzes, izmantojot A/B testēšanu, un sagatavojiet secinājumus un ieteikumus analītiskā ziņojuma formātā.
Pārdošanas piltuveA/B testēšanaDatu apstrādePētniecības datu analīze
Projekts
Izpētiet pārdošanas piltuvi un analizējiet A/B testēšanas rezultātus mobilajā lietojumprogrammā.
11 sprints 2 nedēļas
Kā izstāstīt stāstu ar datiem
Uzzināsiet, kā pareizi prezentēt sava pētījuma rezultātus, izmantojot grafikus, svarīgākos skaitļus un to pareizu interpretāciju. Iepazīstieties ar Seaborn un Plotly bibliotēkām.
• Kam, kā, ko un kāpēc stāstīt. Pētījuma rezultāta prezentācija. Stāstītāja mērķauditorija. Ko un kāpēc stāstīt datu analītiķim.
• Seaborn bibliotēka. Seaborn bibliotēka kā Matplotlib bibliotēkas paplašinājums. jointplot() metode. Krāsu diapazoni. Diagrammu stili. Izplatījumu vizualizācija.
• Plotly bibliotēka. Interaktīvie grafiki. Līniju grafiks. Kolonnu diagramma. Sektoru diagramma. Piltuves diagramma.
• Datu vizualizācija ģeoanalītikā. Ģeoanalītika. Bibliotēka Folijs. Kartes displejs. Marķieru iestatīšana ar noteiktām koordinātām. Punktu kopu veidošana. Pielāgotas ikonas marķieriem. Horoplets.
• Prezentācijas sagatavošana. Secinājumi, pamatojoties uz pētījumu. Sezonalitāte un ārējie faktori. Absolūtās un relatīvās vērtības. Simpsona paradokss. Prezentāciju veidošanas principi. Pārskati Jupyter piezīmju grāmatiņā.
PlotlyFoliumSeabornMatplotlibPresentationGeoanalyticsDatu vizualizācija
Projekts
Sagatavot tirgus pētījumu, pamatojoties uz atklātajiem datiem par sabiedriskās ēdināšanas iestādēm Maskavā, vizualizēt iegūtos datus.
12 sprints 2 nedēļas
Informācijas paneļu izveide Tableau
Šajā sprintā strādāsi ar Tableau BI sistēmu. Iemācieties izveidot savienojumu ar datiem un modificēt tos, veidot dažāda veida diagrammas, apkopot informācijas paneļus un prezentācijas.
• Pamati darbam ar Tableau. BI sistēmas. Tabula. Dokumenta izveide. Dokumenta saglabāšana. Dokumenta publicēšana.
• Darbs ar datu avotiem. Datu avoti. Datu apvienošana. Attiecību metode. Pievienošanās metode. Blend metode. Savienības metode. Tabulas formāta maiņa.
• Datu tipi. Pamatdatu veidi. Mērījumi. Pasākumi. Darbs ar datumu un laiku. Komplekti. Grupas. Iespējas. Mainīgo lielumu formāta maiņa. Mainīgie Pasākumu nosaukumi, Pasākumu vērtības, Skaits.
• Tabulas un aprēķini. Lapu rediģēšanas interfeiss. Rakurstabulas. Aprēķinātie lauki. LOD izteiksmes.
• Filtri un šķirošana. Šķirošanas pasākumi. Šķirošanas izmēri. Ligzdotie veidi. Kārtošana, izmantojot parametru. Filtri.
• Vizualizācijas. Vizualizācijas vadīklas. Siltuma kartes. Sektoru diagrammas. Kolonnu diagrammas. Histogrammas. Diapazona diagrammas. Izkliedes diagramma. Līniju diagrammas. Kombinētie grafiki. Apgabalu diagrammas.
• Īpašas vizualizācijas un rīku padomi. Kartes. Rakstzīmju karte. Burbuļu diagramma. Koku karte. Apļa skatu diagrammas. Ložu diagrammas. Ganta diagrammas. Mērījumu nosaukumus un mērījumu vērtības vizualizācijās. Reversā inženierija. Rīku padomi. Rīka padomi ar vizualizācijām. Sliekšņa vērtības grafikos. Analītiskie rīki programmā Custom.
• Prezentācijas. Papildu iespējas. Tipisku parametru izpēte. Prezentācijas izveide.
• Informācijas paneļi. Datu ielāde un sagatavošana. Vizualizāciju sagatavošana. Informācijas paneļa montāža. Darbības. Informācijas paneļa demonstrācija. Informācijas paneļa publicēšana.
TableauDashboardsBI-toolsBI-toolsDatu vizualizācija
Projekts
Izpētiet TED konferenču vēsturi un izveidojiet informācijas paneli Tableau, pamatojoties uz iegūtajiem datiem.
Papildu sprints
Mašīnmācīšanās pamati
Iepazīsties ar mašīnmācības pamatiem un uzzini par mašīnmācības galvenajiem uzdevumiem biznesā.
PythonPandasSklearnMašīnmācībaMašīnmācības uzdevumiMašīnmācības algoritmi
Papildu sprints
Praktizējiet Python
Jūs apmeklēsiet vairākas laboratorijas nodarbības ar papildu uzdevumiem Python programmēšanas valodā. Jūs arī uzzināsit, kā iegūt datus no tīmekļa resursiem.
Jūs:
• HTML lapu struktūrā un GET pieprasījumu darbībā,
• iemācīties rakstīt vienkāršas regulāras izteiksmes,
• iepazīt API un JSON,
• veikt vairākus pieprasījumus vietnēm un apkopot datus.
JSONPythonREST API Web nokasīšana
13 sprints 3 nedēļas
Izlaiduma projekts
Pēdējā projektā apstipriniet, ka esat apguvis jaunu profesiju. Noskaidrojiet klienta uzdevumu un izejiet visus datu analīzes posmus. Tagad nav ne nodarbību, ne mājasdarbu – viss kā īstā darbā.
Noslēguma sprints ietver projekta darbu, A/B testēšanu un SQL uzdevumus un papildu uzdevumu. Projekts satur problēmas izklāstu, paredzamo rezultātu, datu kopu un to aprakstu.
Uzdevums attiecas uz vienu no piecām uzņēmējdarbības jomām:
• bankas,
• mazumtirdzniecība,
• spēles,
• mobilās aplikācijas,
• e-komercija.
Parasta soļu apraksta projektā nebūs. Jūs pats strādāsit caur tiem.
SQ LPython PandasTableau informācijas paneļi Postgre SQL dekompozīcijas A/B testēšana