Datu analīze Python un datu bāzēs (SQL) - bezmaksas kurss no RANEPA, apmācība, Datums: 2023. gada 6. marts.
Literārs Mistrojums / / December 04, 2023
Python datu analīzes un datu bāzes (SQL) programma sniegs studentiem izpratni par ML (mašīnmācīšanās) algoritmu programmēšanas pamatiem, izmantojot Python valodu. Tas arī palīdzēs jums apgūt vairākas kompetences mūsdienu relāciju datu bāzu pārvaldības jomā un apgūt praktiskās iemaņas DBVS valodas rīku lietošanā (datu bāzes pārvaldības sistēmas dati).
Uzņēmējdarbībā un valsts pārvaldē pastāvīgi ir jāanalizē milzīgs datu apjoms iegūt informāciju, lai kontrolētu darba kvalitāti, izvirzītu jaunas idejas un pamatotu pieņemtās lēmumus. Eksperti, kuri saprot milzīgu datu apjomu, var sagaidīt ātru karjeru ar iespaidīgām algām.
Darba sludinājumos, kas saistīti ar datu analīzi, parasti tiek minēti SQL un Python.
Kursam var pieteikties tikai studenti, kuri nemācās šādās jomās:
Programmas apguves gaitā studentiem būs iespēja nākt klajā ar jauniem digitāliem produktiem (patstāvīgi vai komandā). Labāko risinājumu autori saņems Akadēmijas atbalstu un iespēju sadarboties ar Mākslīgā intelekta laboratoriju un RANEPA Platformu izstrādes laboratoriju.
Python
Kā tas viss darbojas? Python funkcijas.
Kāpēc visi izmanto Python? Salīdzinājums ar citām programmēšanas valodām. Kā rakstīt programmas? Python plusi. Kā izmantot Python uzdevumos: tekstapstrāde, darbs ar attēliem, akciju robotu rakstīšana, tērzēšanas robotu palaišana. Ievade un izvade Python. Vārdi Python valodā. Pamatoperācijas. Programmas izpildes progresa kontrole (nosacījuma konstrukcijas). Vienkāršu programmu piemēri.
Cikli. Līnijas. Stīgu metodes.
Cilpa ar priekšnosacījumu. Pārtraukt un turpināt paziņojumus. Cilpai Līnijas struktūra un līnijas garums. Līnijas elements un līniju griešana. Apakšvirknes iegūšana no virknes. Līnijas šķērsošana. Sadaļas.
Korpusi. Saraksti. funkciju karte. Izlases vērtību saraksta ģenerators.
Kāpēc ir nepieciešami korteži? Darbs ar sarakstu. Saraksta elementi. Izdrukājiet sarakstu. Pareiza sarakstu kopēšana. Kartes funkcijas izmantošanas iespējas. Kas ir nejaušo vērtību ģeneratori? ķekars. Darbības ar komplektiem. Frozenset. Vārdnīcas. iegūt metodi Vārdnīcas šķērsošana.
Funkcijas. Matemātisko funkciju pielietojums. Darbības joma un izslēgšana.
Kā pareizi rakstīt funkcijas. Vienkārši algoritmi. Pirmo funkciju rakstīšana. Kā pievienot matemātiku. Ieteikumi savu funkciju rakstīšanai. Kā darbojas tvērumi. Globālie mainīgie. Vairāku vērtību atgriešana no funkcijas. Izņēmumi.
Darbs ar failiem. Matricas. Šķirošanas veidi
Ko jūs varat darīt ar failiem? Failu atvēršana un aizvēršana. Teksta failu lasīšana un rakstīšana. Matricas. Matricu aizpildīšana. Matricu ievadīšana rindu pēc rindas. Lasīšanas un rakstīšanas matricas. Burbuļu šķirošana. Algoritma analīze. Vairākas risinājuma versijas.
Pārskats par NumPy bibliotēku. Darbs ar NumPy funkcijām. SciPY bibliotēka.
Python bibliotēkas un to uzstādīšana. Pamata NumPy datu tipi. Skaitliskās funkcijas. Darbs ar masīviem. Darbības ar masīviem. Divdimensiju masīvi. Matricas. SciPy bibliotēkas pamatfunkcijas.
Pandas bibliotēkas pārskats. Pamata analītika.
Bibliotēkas instalēšana. Sērijas objekta izveide. DataFrame indeksēšana. Tabulas. Failu lasīšana un rakstīšana. Indeksēšana. Datu izlase. Darbības ar rindām un kolonnām. Darbs ar NaN. Šķirošana.
Datu vizualizācijas. Praktiski piemēri
Jaunu datu izpēte, pirmapstrāde, datu vizualizācija, sakarību meklēšana starp pazīmēm, apmācības datu sagatavošana un kredītriska prognozēšanas modeļu veidošana. Tāda modeļa iegūšana, kas atbild uz jautājumu: izsniegt vai neizsniegt kredītu.
Rutīnas uzdevumu automatizācija. Praktiski piemēri
Praktisku uzdevumu automatizācijas piemēru analīze, kas saistīti ar apkopotas informācijas iegūšanu no vairākiem avotiem (Excel failiem) vai interneta.
Datu analīzei izmantoto mašīnmācīšanās metožu apskats. Praktiski piemēri
Praktisks piemērs pamatpazīmju noteikšanai un to interpretācijai uzraugāmā mācību problēmā.
Starpposma moduļa novērtējums
Pagaidu sertifikācija notiek testa veidā (datortestēšana). Tipiskas testa ēkas paraugs:
Kādu Python funkciju var izmantot, lai uzzinātu mainīgā veidu?
- hwoami
- veids
- veids
- ir
Kāds skaitļu diapazons tiks izveidots šādā kodā: diapazons (9, 3, -2)
- 9 8 7 6 5 4 4
- 9 7 5 3
- 9 7 5
- 11 9 8 7 6 5 4
Ko sarakstā iekļautais koda fragments ļauj izpildīt?
- Koda fragments: print(math.sqrt(2))
- parāda skaitli 2 no matemātikas bibliotēkas
- savienojot matemātikas bibliotēku
- matemātiskā skaitļa kvadrātā
- parāda kvadrātsakni no diviem
SQL
Datu glabāšana un integritāte.
Datu glabāšana: datu faili, žurnāli, RAID līmeņi, Tempdb. Attiecības datu bāzēs, viens pret vienu, viens pret daudziem, daudzi pret daudziem. Datu integritāte: PRIMĀRĀ ATSLĒGA, PĀRBAUDE, UNIKĀLA un ĀRĒJĀ ATSLĒGA. Tabulu normalizācija.
Datu bāzes un tabulu izveide.
DBVS arhitektūra: loģiskais (tabulas un datu tips, atslēgas, indeksi, skati, komplekti, ierobežojumi, noteikumi, noklusējuma vērtības) un fiziskais līmenis (faili un failu grupas, lapas). Datu bāzes izveide. Tabulas lauku datu tipi: precīzi skaitļi, unikoda rakstzīmju virknes, aptuvenie skaitļi, binārie dati, datums un laiks, citi datu tipi, rakstzīmju virknes. Tabulu veidošana. Kur rakstīt pieprasījumus?
Indeksi. Diagrammas.
Indeksi: klasterizēts, nesagrupēts, unikāla identifikācija, filtrēts, kolonnu krātuve, jaucējkods, negrupēts, atmiņai optimizēts indekss. ER diagrammas: datu bāzes diagrammas, datu bāzes mezgls. DML un visizplatītākie SQL operatori: SELECT, INSERT, UPDATE, DELETE. Unikālo faktoru nozīme.
Pieprasījumi. Ārējie savienojumi.
Vaicājumi uz viena galda. Izlase bez atkārtojumiem. Vaicājumi vairākās tabulās. Ārējie savienojumi: LEFT, RIGHT vai FULL.
Apkopotās funkcijas. Apakšvaicājumi.
Apakšvaicājumi: WHERE COUNT, SUM, AVG, MAX, MIN, IN, ALL, ANY. Pievienošanās dati: SELECT JOIN. Apkopotās funkcijas: AVG, CHECKSUM_AGG, COUNT, COUNT_BIG, GROUPING, GROUPING_ID, MAX, MIN, STDEV, STDEVP, STRING_AGG, SUM, VAR, VARP. Agregātu funkciju nosacījumi.
Noderīgas funkcijas.
Nedaudz vairāk par operatoriem. Rūpnieciskais pieprasījums. Noderīgas funkcijas: SQRT, RAND, CONCAT, ciparu un virkņu funkcijas. Darbības prioritāte un veida pārveidošana: CAST, CONVERT.
Darījumi. Pārstāvība.
Viens pieprasījums četros veidos. Darījumi: darījumu jēdziens - atomitāte, konsekvence, izolētība, izturība, darījumu vadība - COMMIT, ROLLBACK, SAVEPOINT, SET TRANSACTION. Paralēlā piekļuve datiem: netīras, neatkārtojamas lasīšanas problēmas, fantomi. Skatījumi: indeksēti, sadalīti, sistēma.
Mainīgie un cilpas.
Programmēšanas sākums. Mainīgie: DECLARE, SET, SELECT. Koda struktūra. Datu apraksta operatori: CREATE, DROP, ALTER utt. Datu manipulācijas operatori: INSERT, DELETE, SELECT, UPDATE utt. Operatori piekļuves tiesību iestatīšanai datu bāzē: GRANT / REVOKE, LOCK / UNLOCK, SET LOCK MODE Operatori aizsardzībai, datu atgūšanai un citi operatori. Cikli: WHILE.
Saglabātās procedūras un funkcijas.
Pagaidu galdi. Transact-SQL kursori, serveris, klients. Kursoru veidi: vienvirziena, statisks, Keyset, dinamisks. Saglabātās procedūras un funkcijas: CREATE PROCEDURE, CREATE PROC.
Trigeri. Izņēmumi.
Konveijers HF. Trigeri: PĒC, VIETĀ. Izņēmumi: IZŅEMOT. Dinamiskā SQL, izmantojot atslēgvārdu un saglabāto procedūru: IZPILDĪT TŪLĪT.
DBVS. NoSQL datu bāzes.
Darījumi programmēšanā/DBVS/SQL. Kā tiek izpildīti pieprasījumi. Kā uzlabot vaicājuma veiktspēju. NoSQL datubāze un tās priekšrocības.
Starpposma moduļa novērtējums
Pagaidu sertifikācija notiek testa veidā (datortestēšana). Tipiskas testa ēkas paraugs:
Kāda veida lauka dati ir NUMBER tipa?
- stīga
- ciparu
- binārs
Kura SQL komanda vaicā datus?
- ALTER
- ATLASĪT
- NO
Kas ir darījums?
- šī ir DBVS veikto darbību grupa
- ir darbību grupa, kurai ir ACID īpašības
- šī ir SQL komandas izpildes darbība