-
WWW datizrace
Nr. | Название главы | Стр. |
Ievads | 3 | |
Web usage mining | 4 | |
Datu sagatavošana | 5 | |
Statiskā analīze | 7 | |
Iegūto datu analīze | 8 | |
Web content mining | 9 | |
9 |
WEB usage mining
Informācijas iegūšana servera līmenī, tas ir informācijas atlase no Web-servera žurnāliem. Šo metodi izmanto visbiežāk, jo bez liekiem tēriņiem var iegūt pietiekoši daudz informācijas par lietotāja mijiedarbību ar serveri. Šī ir viena tām metodēm, kurai jau iepriekš ir sakrāti dati, jo visi vai gandrīz visi serveri veic automātisku žurnālfailu veidošanu, kuri glabājas diezgan ilgi.
Lielākā daļa Web serveru mūsdienās (ieskaitot Apache) piedāvā administratoram iespēju izvēlēties, kādi lauki tiks iekļauti žurnālos, un kuri nē. Servera žurnāliem ir arī savi trūkumi, par pamat trūkumu uzskata informācijas nepilnību. Tas neatspoguļo lapas, kuras lietotājs iepriekš ir saglabājis uz sava datora un apmeklējis, kā arī datus, kuri tiek padoti serverim ar POST metodi. Alternatīva metode datu iegūšanai servera līmenī – analīze pakešu līmenī. Tādā veidā var analizēt datus atsevišķu TCP/IP vaicājumu līmenī, bet tādu datu uzkrāšanai ir nepieciešama papildus programmatūra.
Informācijas iegūšana par lietotāja darbībām lietotāja līmenī. Viens no veidiem – Java programmu izmantošana, kas ielādējas kopā ar lapām uz servera, bet šo programmu funkcionalitāte ir ierobežota un lietotājs ar pārlūkprogrammas palīdzību var atslēgt informācijas iegūšanu. Otra iespēja varētu būt izmaiņu ieviešana pārlūkprogrammās. Bet tad vajadzēs žurnālos ierakstīt visus iespējamos datus, jo ja nākotnē būs nepieciešamība iegūt datus par citu parametru, tad ieviest izmaiņas visās pārlūkprogrammās būs neiespējams. Kā arī pie tādas iespējas ir divas problēmas – pirmkārt, pārsvarā neviens negribēs, lai viņa soļi Internetā ir pierakstīti un tad kaut kur nosūtīti, otrkārt, pārsvarā neviens negribēs atjaunot programmu, trešās personas vajadzībām, kas vāc datus. Tādā veidā informācijas iegūšana lietotāja līmenī vistiešāk skar privātās dzīves nepieskaramības problēmu.
Kā alternatīvu informācijas iegūšanai servera pusē vai lietotāja līmenī var izmantot informācijas iegūšanu tīkla mezglos. Ne vienmēr iespējams piekļūt servera žurnāliem, kā arī pievienojot serverim jaunas programmas informācijas iegūšanai var būtiski samazināt tā ātrdarbību, kas nebūtu vēlams. Kā risinājumu var izvietot sensorus tīkla mezglos pirms servera, tādā veidā serveris nebūs pārslogots no programmatūras. Tādā gadījumā informācijas iegūšana ir protokolu līmenī, izmantojot TCP/IP paketes. Kā labs piemērs sistēmai kalpo Web Traffic Warehouse. Sistēmas izstrādātāji ir atklājuši, ka atkarībā no informācijas vācēja atrašanās vietas mainās datu kvalitāte. Ja dati tiek nodoti asinhroni, izejošais un ienākošais trafiks var tikt sūtīt pa dažādiem fiziskiem kanāliem. …
WEBs ir vienīgais lielākais datu avots pasaulē. Par pamat iemeslu elektroniskās komercijas pieaugumam var minēt ātrumu, ērtumu un vienkāršību iepērkoties interneta veikalos vai arī veikt citas operācijas Internetā. Lielas izmaiņas ir attiecībās ar galalietotāju, paveras iespējas personalizēt piedāvājumus pārdevējam katram klientam. Par datizraci var arī uzskatīt nepieciešamās informācijas atrašanu un analīzi. Šo darbības nozari dala divās daļās: automātiska informācijas meklēšana dokumentos Internetā – Web content mining un informācijas meklēšana un apstrāde, kas atspoguļo lietotāja mijiedarbību ar serveri, - Web usage mining.
-
Ergonomikas prasības biroja darbam ar displejiem
Конспект3 Компьютеры, программирование, электроника, Охрана труда
- Vaicājumi
- WWW datizrace
-
Ты можешь добавить любую работу в список пожеланий. Круто!Vaicājumi
Конспект для университета5
-
Ergonomikas prasības biroja darbam ar displejiem
Конспект для университета3
-
Šablonu izmantošana informācijas sistēmu projektēšanā
Конспект для университета2
-
MS Access formas
Конспект для университета29
-
Datormācība ekonomistiem
Конспект для университета1