Mašīnmācība praksē - kurss 41 500 rub. no IBS Mācību centra, apmācības 24 stundas, Datums 26.11.2023.
Literārs Mistrojums / / December 02, 2023
Kurss ir balstīts uz vairākiem praktiskiem gadījumiem, kuros ir tabulas ar sākotnējiem datiem.
Katrā gadījumā mēs izejam pilnu mašīnmācīšanās projekta dzīves ciklu.
datu izpēte, tīrīšana un sagatavošana,
uzdevumam atbilstošas apmācības metodes izvēle (lineārā regresija regresijai, izlases mežs klasifikācijai, K-vidēji un DBSCAN klasterēšanai),
apmācību, izmantojot izvēlēto metodi,
rezultātu novērtējums,
modeļa optimizācija,
rezultāta prezentēšana klientam.
Kursa diskusiju daļā mēs pārrunājam praktiskas problēmas, ar kurām saskaras studenti, kuras var atrisināt, izmantojot apspriestās metodes.
Apskatītās tēmas:
1. Uzdevuma apskats (teorija – 1 stunda)
Kādas problēmas labi atrisina mašīnmācība, un kādas problēmas tās cenšas atrisināt?
Kas notiek, ja datu zinātnieka vietā jūs pieņemat darbā nespeciālistu šajā jomā (tikai izstrādātāju/analītiķi/pārvaldnieku), cerot, ka viņi šajā procesā iemācīsies.
2. Sagatavošana, tīrīšana, datu izpēte (teorija – 1 stunda, prakse – 1 stunda)
Kā izprast biznesa avota datus (un vispār noteikt jebkādu kārtību tajos).
Apstrādes secība.
Ko var un vajadzētu deleģēt domēnu analītiķiem un ko vislabāk var izdarīt pats datu zinātnieks.
Prioritātes konkrētas problēmas risināšanai.
3. Klasifikatori un regresori (teorija – 2 stundas, prakse – 2 stundas)
Praktiskā sadaļa - labi formalizēti uzdevumi ar sagatavotiem datiem.
Atšķirība starp uzdevumiem (binārā/nebinārā/varbūtiskā klasifikācija, regresija), uzdevumu pārdale starp klasēm.
Praktisko problēmu klasifikācijas piemēri.
4. Klasterizācija (teorija – 1 stunda, prakse – 2 stundas)
Kur un kā veikt klasterizāciju: datu izpēte, problēmas izklāsta pārbaude, rezultātu pārbaude.
Kādus gadījumus var reducēt uz klasterizāciju.
5. Modeļa vērtēšana (teorija – 1 stunda, prakse – 1 stunda)
Biznesa metrika un tehniskā metrika.
Klasifikācijas un regresijas problēmu metrika, kļūdu matrica.
Klasterizācijas kvalitātes iekšējie un ārējie rādītāji.
Savstarpēja validācija.
Pārkvalifikācijas novērtēšana.
6. Optimizācija (teorija – 5 stundas, prakse – 3 stundas)
Ar ko viens modelis ir labāks par otru: parametri, funkcijas, ansambļi.
Iestatījumu pārvaldība.
Iezīmju atlases prakse.
Rīku apskats labāko parametru, funkciju un metožu atrašanai.
7. Diagrammas, atskaites, darbs ar tiešraides uzdevumiem (teorija – 2 stundas, prakse – 2 stundas)
Kā skaidri izskaidrot notiekošo: sev, komandai, klientam.
Skaistākas atbildes uz bezjēdzīgiem jautājumiem.
Kā vienā slaidā uzrādīt trīs terabaitus rezultātus.
Pusautomātiskie testi, kuru procesa kontroles punkti tiešām ir nepieciešami.
No reāllaika uzdevumiem līdz pilnam pētniecības un attīstības procesam ("P&A praksē") - auditorijas uzdevumu analīze un analīze.