WWW datizrace / Конспект / ID: 223349

Особые предложения 2 Открыть

4,99 € В корзину

Добавить в список желаний

В списке желаний

Хочешь дешевле?

Идентификатор:223349

Автор: Anry (23)

Оценка:

Опубликованно: 16.06.2011.

Язык: Латышский

Уровень: Университет

Литературный список: Нет

Ссылки: Использованы

Увеличить просмотр

Содержание

Nr.	Название главы	Стр.
	Ievads	3
	Web usage mining	4
	Datu sagatavošana	5
	Statiskā analīze	7
	Iegūto datu analīze	8
	Web content mining	9
	Google	9

Фрагмент работы

WEB usage mining
Informācijas iegūšana servera līmenī, tas ir informācijas atlase no Web-servera žurnāliem. Šo metodi izmanto visbiežāk, jo bez liekiem tēriņiem var iegūt pietiekoši daudz informācijas par lietotāja mijiedarbību ar serveri. Šī ir viena tām metodēm, kurai jau iepriekš ir sakrāti dati, jo visi vai gandrīz visi serveri veic automātisku žurnālfailu veidošanu, kuri glabājas diezgan ilgi.
Lielākā daļa Web serveru mūsdienās (ieskaitot Apache) piedāvā administratoram iespēju izvēlēties, kādi lauki tiks iekļauti žurnālos, un kuri nē. Servera žurnāliem ir arī savi trūkumi, par pamat trūkumu uzskata informācijas nepilnību. Tas neatspoguļo lapas, kuras lietotājs iepriekš ir saglabājis uz sava datora un apmeklējis, kā arī datus, kuri tiek padoti serverim ar POST metodi. Alternatīva metode datu iegūšanai servera līmenī – analīze pakešu līmenī. Tādā veidā var analizēt datus atsevišķu TCP/IP vaicājumu līmenī, bet tādu datu uzkrāšanai ir nepieciešama papildus programmatūra.

Informācijas iegūšana par lietotāja darbībām lietotāja līmenī. Viens no veidiem – Java programmu izmantošana, kas ielādējas kopā ar lapām uz servera, bet šo programmu funkcionalitāte ir ierobežota un lietotājs ar pārlūkprogrammas palīdzību var atslēgt informācijas iegūšanu. Otra iespēja varētu būt izmaiņu ieviešana pārlūkprogrammās. Bet tad vajadzēs žurnālos ierakstīt visus iespējamos datus, jo ja nākotnē būs nepieciešamība iegūt datus par citu parametru, tad ieviest izmaiņas visās pārlūkprogrammās būs neiespējams. Kā arī pie tādas iespējas ir divas problēmas – pirmkārt, pārsvarā neviens negribēs, lai viņa soļi Internetā ir pierakstīti un tad kaut kur nosūtīti, otrkārt, pārsvarā neviens negribēs atjaunot programmu, trešās personas vajadzībām, kas vāc datus. Tādā veidā informācijas iegūšana lietotāja līmenī vistiešāk skar privātās dzīves nepieskaramības problēmu.

Kā alternatīvu informācijas iegūšanai servera pusē vai lietotāja līmenī var izmantot informācijas iegūšanu tīkla mezglos. Ne vienmēr iespējams piekļūt servera žurnāliem, kā arī pievienojot serverim jaunas programmas informācijas iegūšanai var būtiski samazināt tā ātrdarbību, kas nebūtu vēlams. Kā risinājumu var izvietot sensorus tīkla mezglos pirms servera, tādā veidā serveris nebūs pārslogots no programmatūras. Tādā gadījumā informācijas iegūšana ir protokolu līmenī, izmantojot TCP/IP paketes. Kā labs piemērs sistēmai kalpo Web Traffic Warehouse. Sistēmas izstrādātāji ir atklājuši, ka atkarībā no informācijas vācēja atrašanās vietas mainās datu kvalitāte. Ja dati tiek nodoti asinhroni, izejošais un ienākošais trafiks var tikt sūtīt pa dažādiem fiziskiem kanāliem. …

Коментарий автора

Комплект работ:

ВЫГОДНО купить комплект ➞ экономия −4,98 €

Комплект работ Nr. 1243694

Купить 3 работы в комплекте

Просмотреть комплект

Загрузить больше похожих работ

Конспект

Технологии

Компьютеры, программирование, электроника