Mašīnmācība par lielajiem datiem — bezmaksas kurss no Open Education, apmācības 5 nedēļas, no 5 līdz 14 stundām nedēļā, datums: 2023. gada 3. decembris.
Literārs Mistrojums / / December 08, 2023
Amats: Crowd Solution arhitekts, Neatsy, Inc.
Darbu Ekonomikas augstskolā uzsācis 2017. gadā. Viņa pasniedz kursus par digitālo pratību, teksta analīzi un rīkiem un paņēmieniem darbam ar lielu teksta informācijas apjomu. Profesionālās intereses: lielo datu analīze Izglītība 2018 Bakalaura grāds: Nacionālās pētniecības universitātes Ekonomikas augstskola, specialitāte "Lietišķā matemātika un datorzinātne"
1. Datu sagatavošana apmācībai
Mūsdienās mašīnmācīšanās darbojas efektīvi, ja mums ir liels marķētu datu apjoms. Šonedēļ apskatīsim, kādi datu formāti un marķējumi pastāv un kā šo marķējumu var savākt
2. Klasisko modeļu apmācība par lielajiem datiem
Šonedēļ mēs iemācīsimies apmācīt klasiskos algoritmus (lineāros modeļus un lēmumu kokus) lielos datos.
3. Ieteikumu sistēmu izveide
Apskatīsim, kā varam paralēli veikt ieteikumu sistēmās izmantotos klasiskos algoritmus.
4. Liela apjoma teksta informācijas analīze
Apskatīsim mašīnmācīšanās problēmas tekstos. Parunāsim par teksta priekšapstrādi un to, kā iegūt strukturētu teksta datu attēlojumu, izmantojot tādus modeļus kā word2vec un BERT.
5. Dziļo neironu tīklu apmācība
Mēs uzzināsim, kā paralēli apmācīt mūsdienu neironu tīklus, kā iekšā darbojas Horovod un Parameter Server, un runāsim par Transfer Learning.