Datu zinātne - bezmaksas kurss no Datu analīzes skolas, apmācība 4 semestri, datums 2023. gada 2. decembris.
Literārs Mistrojums / / December 05, 2023
Tiem, kas vēlas izvirzīt problēmas, izmantojot datu analīzi, piedāvāt risinājumus un novērtēt to efektivitāti ne tikai sintētiskā eksperimentā, bet arī reālos apstākļos.
Statistika, mašīnmācīšanās un darbs ar dažāda veida datiem.
Dati ir pamatā lielākajai daļai mūsdienu pakalpojumu un produktu, sākot no laikapstākļu prognožu lietotnēm un beidzot ar pašbraucošām automašīnām. Datu zinātnieks veic eksperimentus, veido metriku, zina, kā optimizēt pakalpojumu darbību un saprot, kur atrodas to izaugsmes punkti.
Katram studentam semestra laikā sekmīgi jāapgūst vismaz trīs kursi. Piemēram, ja pamatprogrammā ir divi no tiem, tad jāizvēlas viens no īpašajiem kursiem.
Zināšanas galvenokārt tiek pārbaudītas mājasdarbos – eksāmeni un ieskaites tiek kārtoti tikai atsevišķos priekšmetos.
Pirmais semestris
Obligāts
Algoritmi un datu struktūras, 1. daļa
01. Sarežģītība un skaitļošanas modeļi. Grāmatvedības vērtību analīze (sākums)
02. Grāmatvedības vērtību analīze (beigas)
03.Merge-Sort un Quick-Sort algoritmi
04. Kārtējā statistika. Kaudzes (sākums)
05. Kaudzes (beigas)
06.Jaukšana
07. Meklēt kokus (sākums)
08. Meklēt kokus (turpinājums)
09.Meklēšanas koki (beigas). Disjunktu kopu sistēma
10. RMQ un LCA uzdevumi
11.Datu struktūras ģeometriskajai meklēšanai
12. Dinamiskās savienojamības problēma nevirzītā grafā
Python valoda
01. Valodas pamati (1. daļa)
02. Valodas pamati (2. daļa)
03.Objektorientētā programmēšana
04. Kļūdu apstrāde
05. Koda projektēšana un testēšana
06.Darbs ar stīgām
07.Atmiņas modelis
08Funkcionālā programmēšana
09. Bibliotēkas apskats (1. daļa)
10. Bibliotēkas apskats (2. daļa)
11. Paralēlā skaitļošana Python
12.Padziļināts darbs ar objektiem
Mašīnmācība, 1. daļa
01.Pamatjēdzieni un lietišķo problēmu piemēri
02.Metriskās klasifikācijas metodes
03.Loģiskās klasifikācijas metodes un lēmumu koki
04.Gradientu lineārās klasifikācijas metodes
05.Support Vector Machine
06.Daudzfaktoru lineārā regresija
07. Nelineārā un neparametriskā regresija, nestandarta zudumu funkcijas
08.Laika rindu prognozēšana
09.Bayesian klasifikācijas metodes
10.Loģistiskā regresija
11. Meklēt asociācijas noteikumus
Otrais termiņš
Obligāts
Mašīnmācības statistikas pamati
01.Ievads
02.Statistisko secinājumu teorijas galvenie uzdevumi un metodes
03. Sadalījuma novērtējums un statistiskās funkcijas
04.Montekarlo simulācija, bootstrap
05. Parametriskā aplēse
06. Hipotēžu pārbaude
07. Daudzdimensiju datu dimensijas samazināšana
08.Modeļa jutīguma novērtēšana
09.Lineārā un loģistiskā regresija
10.Eksperimentu projektēšanas metodes
11.Dažādi regularizācijas veidi lineārajā regresijā
12. Nelineāras metodes regresijas atkarību konstruēšanai
13. Neparametrisks novērtējums
14. Beijeza pieeja novērtējumam
15.Bayesian pieeja regresijai
16. Bajesa pieeja regresijai un optimizācijai
17. Nejaušā Gausa lauka modeļa izmantošana datu analīzes uzdevumos
18.Statistisko modeļu un metožu izmantošana surogātmodelēšanas un optimizācijas uzdevumos
Mašīnmācība, 2. daļa
01.Neironu tīklu klasifikācijas un regresijas metodes
02.Klasifikācijas un regresijas kompozīcijas metodes
03. Modeļu atlases kritēriji un pazīmju atlases metodes
04.Rangs
05.Pastiprināšanas mācības
06.Mācīšanās bez skolotāja
07.Problēmas ar daļēju apmācību
08.Sadarbības filtrēšana
09. Tēmu modelēšana
Trešais semestris
Lai izvēlētos
Automātiska teksta apstrāde
01Kursa materiāls
vai
Datorredze
Kurss ir veltīts datorredzes metodēm un algoritmiem, t.i. iegūt informāciju no attēliem un video. Apskatīsim attēlu apstrādes pamatus, attēlu klasifikāciju, attēlu meklēšanu pēc satura, seju atpazīšanu, attēlu segmentēšanu. Pēc tam mēs runāsim par video apstrādes un analīzes algoritmiem. Kursa pēdējā daļa ir veltīta 3D rekonstrukcijai. Lielākajai daļai problēmu mēs apspriedīsim esošos neironu tīklu modeļus. Kursā cenšamies pievērst uzmanību tikai modernākajām metodēm, kuras šobrīd tiek izmantotas praktisko un pētniecisko problēmu risināšanā. Kurss lielākoties ir praktisks, nevis teorētisks. Tāpēc visas lekcijas ir aprīkotas ar laboratorijas un mājas darbiem, kas ļauj praktiski izmēģināt lielāko daļu apspriesto metožu. Darbs tiek veikts Python, izmantojot dažādas bibliotēkas.
01.Digitālā attēla un toņu korekcija.
02.Attēlu apstrādes pamati.
03.Attēlu apvienošana.
04. Attēlu klasifikācija un līdzīgu meklēšana.
05. Konvolūcijas neironu tīkli līdzīgu attēlu klasifikācijai un meklēšanai.
06.Objektu noteikšana.
07. Semantiskā segmentācija.
08.Stila pārnešana un attēlu sintēze.
09.Video atpazīšana.
10.Skratā 3D rekonstrukcija.
11.Blīvu trīsdimensiju rekonstrukcija.
12.Rekonstrukcija no viena kadra un punktu mākoņiem, parametriskie modeļi.
Ceturtais semestris
Ieteicamie speciālie kursi
Dziļa mācīšanās
01.Kursa materiāls
Pastiprināšanas mācības
01.Kursa materiāls
Pašbraucošas automašīnas
Kurss aptver pašbraukšanas tehnoloģiju galvenās sastāvdaļas: lokalizāciju, uztveri, prognozēšanu, uzvedības līmeni un kustību plānošanu. Katram komponentam tiks aprakstītas galvenās pieejas. Turklāt studenti iepazīs pašreizējos tirgus apstākļus un tehnoloģiskās problēmas.
01.Pārskats par bezpilota transportlīdzekļa galvenajām sastāvdaļām un sensoriem. Autonomijas līmeņi. Drive by Wire. Pašbraucošās automašīnas kā biznesa produkts. Veidi, kā novērtēt progresu dronu radīšanā. Lokalizācijas pamati: gnss, riteņu odometrija, Bajesa filtri.
02.Lidara lokalizācijas metodes: ICP, NDT, LOAM. Ievads vizuālajā SLAM, izmantojot ORB-SLAM kā piemēru. GraphSLAM problēmas izklāsts. GraphSLAM problēmas samazināšana uz nelineāru mazāko kvadrātu metodi. Pareiza parametru izvēle. Sistēmas ar īpašu GraphSLAM struktūru. Arhitektūras pieeja: frontend un backend.
03. Atpazīšanas uzdevums pašbraucošā automašīnā. Statiski un dinamiski šķēršļi. Sensori atpazīšanas sistēmai. Statisku šķēršļu attēlojums. Statisko šķēršļu noteikšana, izmantojot lidar (VSCAN, neironu tīklu metodes). Lidar izmantošana kopā ar attēliem, lai noteiktu statiku (semantiskā attēla segmentācija, dziļuma pabeigšana). Stereo kamera un dziļuma iegūšana no attēla. Stixel pasaule.
04.Iztēloties dinamiskus šķēršļus pašbraucošā automašīnā. Neironu tīklu metodes objektu noteikšanai 2D formātā. Noteikšana, pamatojoties uz Lidara mākoņa attēlojumu no putna lidojuma. Lidara izmantošana ar attēliem, lai noteiktu dinamiskus šķēršļus. Automašīnu noteikšana 3D formātā, pamatojoties uz attēliem (3D kastu montāža, CAD modeļi). Uz radaru balstīta dinamiska šķēršļu noteikšana. Objektu izsekošana.
05.Automašīnas braukšanas modeļi: aizmugurējais ritenis, priekšējais ritenis. Ceļu plānošana. Konfigurācijas telpas jēdziens. Grafu metodes trajektoriju konstruēšanai. Trajektorijas, kas samazina grūdienus. Optimizācijas metodes trajektoriju konstruēšanai.
06. Ātruma plānošana dinamiskā vidē. ST plānošana. Citu satiksmes dalībnieku uzvedības prognozēšana.