Lineārā regresija - kurss 4900 rub. no Atvērtā izglītība, apmācības 5 nedēļas, apmēram 2 stundas nedēļā, Datums 2023. gada 29. novembris.
Literārs Mistrojums / / November 29, 2023
Ja korelācijas analīze ļauj kvantitatīvi noteikt divu lielumu attiecības stiprumu un virzienu, tad regresijas modeļu konstruēšana sniedz lielākas iespējas. Izmantojot regresijas analīzi, iespējams kvantitatīvi aprakstīt pētāmo lielumu uzvedību atkarībā no prognozēšanas mainīgajiem un iegūt prognozes par jauniem datiem. Jūs uzzināsit, kā izveidot vienkāršus un vairākus lineārus modeļus, izmantojot R valodu. Katrai metodei ir savi ierobežojumi, tāpēc mēs palīdzēsim jums saprast, kādās situācijās Lineāro regresiju var un nevar izmantot, un mēs jums iemācīsim atlasītās diagnostikas metodes modeļiem. Īpaša vieta kursā atvēlēta regresijas analīzes padziļinātajai anatomijai: apgūsiet darbības ar matricām, kuras ir lineārās regresijas pamatā, lai varētu izprast sarežģītākas lineārās šķirnes modeļiem.
Ja jūs saskaraties ar nepieciešamību meklēt un aprakstīt attiecības starp noteiktām parādībām, kuras var izmērīt kvantitatīvi, tad šis kurss ir laba iespēja saprast, kā darbojas vienkārša un daudzkārtēja lineārā regresija, uzzināt par to iespējām un ierobežojumiem metodes.
Kurss paredzēts tiem, kuri jau pārzina R valodas datu analīzes pamatmetodes un ar vienkāršu .html dokumentu izveidi, izmantojot rmarkdown un knitr.
Zinātniskās intereses: jūras bentosa kopienu struktūra un dinamika, telpiskie mērogi, sukcesija, starpsugu un iekšsugas biotiskā mijiedarbība, jūras bezmugurkaulnieku augšana un vairošanās, populāciju demogrāfiskā struktūra, mikroevolūcija, biostatistika.
Kurss sastāv no 5 moduļiem:
1. Korelācijas analīze. Vienkārša lineārā regresija
Mēs sāksim savu sarunu par metodēm, kā skaitliski aprakstīt attiecības starp kvantitatīviem lielumiem ar kovariācijas un korelācijas koeficientiem, kas ļauj novērtēt attiecības stiprumu un virzienu. Pēc tam uzzināsiet, kādu papildu informāciju par attiecībām var iegūt, konstruējot lielumu attiecības lineāro modeli. Jūs iemācīsities interpretēt regresijas koeficientus un uzzināsit, kad un kā lineāros modeļus var izmantot, lai prognozētu jaunus datus. Līdz šī moduļa beigām jūs uzzināsit, kā pielāgot lineāro modeļa vienādojumu un attēlot to ar ticamības reģionu.
2. Lineāro modeļu nozīmes un derīguma pārbaude
Lineāra modeļa izveidošana un tā vienādojuma pierakstīšana ir tikai pats analīzes sākums. Šajā modulī jūs uzzināsiet, kā aprakstīt regresijas analīzes rezultātus: kā pārbaudīt kopējā modeļa vai tā koeficientu statistisko nozīmīgumu un novērtēt atbilstības kvalitāti. Lineārajiem modeļiem (vai drīzāk tiem izmantotajiem statistikas testiem), tāpat kā jebkurai metodei, ir savi ierobežojumi. Jūs uzzināsit, kas ir šie ierobežojumi un no kurienes tie nāk. Grafiskās diagnostikas metodes, kuras izmantosim, ir universālas dažādiem lineāriem modeļiem – lielāka prakse palīdzēs pieņemt lēmumus pārliecinošāk. Kad esat to visu sapratis, varat uzrakstīt pilnu skriptu R, lai tas atbilstu, diagnosticētu un parādītu vienkāršas lineārās regresijas rezultātus.
3. Īss ievads lineārās algebras pasaulē
Šajā modulī mēs iedziļināsimies lineāro modeļu būtībā. Lai to izdarītu, jums būs jāapgūst vai jāatceras lineārās algebras pamati. Mēs apspriedīsim dažādus matricu veidus, to izveidošanu R un pamatdarbības ar tām. Tas viss mums būs nepieciešams, lai saprastu, kā lineārā regresija darbojas no iekšpuses. Jūs uzzināsiet, kas ir modeļa matrica, uzzināsiet, kā uzrakstīt lineārās regresijas vienādojumu matricu veidā un atrast tā koeficientus. Jūs savām acīm redzēsiet cepuru matricu, kas ļauj iegūt prognozētās vērtības, un jūs pat varēsiet to aprēķināt manuāli. Visbeidzot, jūs iemācīsities aprēķināt atlikušo dispersiju, dispersijas-kovariācijas matricu un izmantot to visu, lai izveidotu regresijas ticamības zonu. Tad šīs zināšanas palīdzēs izprast sarežģītāku modeļu struktūru: ar diskrētiem prognozētājiem, ar atšķirīgu atlikumu sadalījumu, ar atšķirīgu variācijas-kovariācijas matricas struktūru.
4. Daudzkārtēja lineārā regresija
Visbiežāk attiecības starp daudzumiem ir sarežģītākas, nekā to var aprakstīt, izmantojot vienkāršu lineāro regresiju. Vairāku lineāro regresiju izmanto, lai aprakstītu, kā atbildes mainīgais ir atkarīgs no vairākiem prognozētājiem. Līdz ar vairāku prognozētāju parādīšanos modelī lineārajai regresijai ir jauns pielietojamības nosacījums - prasība par multikolinearitātes neesamību. Šajā modulī jūs uzzināsit, kā identificēt multikolinearitāti un izvairīties no tās. Visbeidzot, vairākos modeļos bieži ir vairāk mainīgo, nekā var attēlot plaknē, Tāpēc mēs iemācīsim jums vienkāršas metodes, kas palīdzēs jums izveidot informatīvu grafiku pat šajā lietu.
5. Lineāro modeļu salīdzinājums
Vairāki lineāri modeļi ir kā konstrukcijas komplekts: sarežģītākus modeļus var izjaukt un vienkāršot. Jūs uzzināsit, kā ligzdoto modeļu salīdzinājumi, izmantojot daļēju F testu, tiek izmantoti, lai pārbaudītu atsevišķu prognozētāju vai prognozētāju grupu nozīmīgumu. Sarežģītāki modeļi labāk apraksta sākotnējos datus, taču pārmērīga sarežģītība ir bīstama, jo šādi modeļi sāk slikti prognozēt jaunus datus. Izmantojot daļējus F testus, varat vienkāršot modeļus, pakāpeniski likvidējot nenozīmīgos prognozētājus. Vienkāršotus modeļus ir vieglāk izmantot, lai interpretētu un parādītu rezultātus. Visu, ko līdz šim esat iemācījies par lineāro regresiju, var izmantot, pabeidzot datu analīzes projektu, kur jums ir nepieciešams pareizi izveidot optimālu vairāku lineāru modeli un parādīt tā rezultātus ziņojumā, kas rakstīts, izmantojot rmarkdown un knitr.