-
Datu apstrādes un datizraces pamati
Nr. | Название главы | Стр. |
1. | UZDEVUMS | 3 |
2. | TEORĒTISKĀ DAĻA | 5 |
2.1. | Punkts 1 | 5 |
2.2. | Punkts 2 | 8 |
2.3. | Punkts 3 | 12 |
2.4. | Punkts 4 | 13 |
3. | PRAKTISKĀ DAĻA | 14 |
3.1. | Punkts 1 – klasifikācijas koki | 14 |
3.1.1. | Punkts 1.1 – klasifikācijas koka novērtēšana ar 10-kārtējo šķērsvalidāciju | 18 |
3.1.2. | Punkts 1.2 – rādītāju aprēķināšana no pārpratumu matricas ar pozitīvo klasi “P” | 19 |
3.1.3. | Punkts 1.3 – klasifikācijas koka attēlošana | 21 |
3.1.4. | Punkts 1.4 – logrīka Tree parametra izmainīšana un soļu atkārtošana | 23 |
3.2. | Punkts 2 - K-tuvāko kaimiņu algoritms | 26 |
3.2.1. | Punkts 2.1 – kNN tuvāko kaimiņu skaitu mainīšana ar šķērsvalidāciju | 27 |
3.2.2. | Punkts 2.2 – rādītāju aprēķināšana, izmantojot pārpratumu matricu | 30 |
3.2.3. | Punkts 2.3 – rādītāju grafiskā attēlošana un rezultātu salīdzināšana | 33 |
3.3. | Punkts 3 – naivais Baijesa klasifikācijas algoritms | 34 |
3.3.1. | Punkts 3.1 – skaitlisko atribūtu diskretizācija | 35 |
3.3.2. | Punkts 3.2 – ierakstu klasifikācija, pielietojot 10-kārtējo šķērsvalidāciju | 36 |
3.3.3. | Punkts 3.3 – rādītāju aprēķināšana, izmantojot pārpratumu matricu | 37 |
3.4. | Punkts 4 | 39 |
4. | REZULTĀTU APKOPOJUMS UN SECINĀJUMI | 41 |
5. | IZMANTOTĀ LITERATŪRA | 42 |
4. REZULTĀTU APKOPOJUMS UN SECINĀJUMI
Otrajā praktiskajā tika izskatīti un apgūti sekojoši algoritmi : ID3, kNN un Naive Bayes.
Darba gaitā izmantojot lietojumprogrammatūru Orange, iepazinos ar klasifikācijas algoritmiem un izveidoju trīs dažādi modeļus, ar kuriem vajadzēja krietni pastrādāt. Gadījās problēmas ar pārpratuma matricu rezultātu interpretēšanu, jo Orange izvada tos reversīvi. Katrs algoritms tika novērtēts ar 10-kārtējo šķērsvalidāciju un katram tika aprēķināti sekojoši rādītāji ar pozitīvo klasi “P” : klasifikācijas precizitāte, klasifikācijas kļūda, jūtīgums, specifiskums, KPN, KNN un pozitīva klases precizitāte. Pamatojoties uz visiem iegūtiem rezultātiem, tika novērtēta katra algoritma efektivitāte un precizitāte.
Pildot šo praktisko darbu, sastādos ar noformēšanas grūtībām, jo tiešām darbs bija diezgan apjomīgs. Tik un tā, iegūtās zināšanas no praktiskajām nodarbībām par algoritmiem nopietni noderēs nākotnē, tā kā uzskatu to par ļoti vērtīgo.
…
DATU APSTRĀDES UN DATIZRACES PAMATI PRAKTISKAIS DARBS NR. 2 1. UZDEVUMS 3-4 2. TEORĒTISKĀ DAĻA 5-13 2.1. Punkts 1 5-7 2.2. Punkts 2 8-11 2.3. Punkts 3 12-13 2.4. Punkts 4 13 3. PRAKTISKĀ DAĻA 14-40 3.1. Punkts 1 – klasifikācijas koki 14-26 3.1.1. Punkts 1.1 – klasifikācijas koka novērtēšana ar 10-kārtējo šķērsvalidāciju 18-19 3.1.2. Punkts 1.2 – rādītāju aprēķināšana no pārpratumu matricas ar pozitīvo klasi “P” 19-21 3.1.3. Punkts 1.3 – klasifikācijas koka attēlošana 21-22 3.1.4. Punkts 1.4 – logrīka Tree parametra izmainīšana un soļu atkārtošana 23-26 3.2. Punkts 2 - K-tuvāko kaimiņu algoritms 26-33 3.2.1. Punkts 2.1 – kNN tuvāko kaimiņu skaitu mainīšana ar šķērsvalidāciju 27-29 3.2.2. Punkts 2.2 – rādītāju aprēķināšana, izmantojot pārpratumu matricu 30-32 3.2.3. Punkts 2.3 – rādītāju grafiskā attēlošana un rezultātu salīdzināšana 33 3.3. Punkts 3 – naivais Baijesa klasifikācijas algoritms 34-39 3.3.1. Punkts 3.1 – skaitlisko atribūtu diskretizācija 35 3.3.2. Punkts 3.2 – ierakstu klasifikācija, pielietojot 10-kārtējo šķērsvalidāciju 36 3.3.3. Punkts 3.3 – rādītāju aprēķināšana, izmantojot pārpratumu matricu 37-39 3.4. Punkts 4 39-40 4. REZULTĀTU APKOPOJUMS UN SECINĀJUMI 41 5. IZMANTOTĀ LITERATŪRA 42
