Добавить работы Отмеченные0
Работа успешно отмечена.

Отмеченные работы

Просмотренные0

Просмотренные работы

Корзина0
Работа успешно добавлена в корзину.

Корзина

Регистрация

интернет библиотека
Atlants.lv библиотека
4,99 € В корзину
Добавить в список желаний
Хочешь дешевле?
Идентификатор:223349
 
Автор:
Оценка:
Опубликованно: 16.06.2011.
Язык: Латышский
Уровень: Университет
Литературный список: Нет
Ссылки: Использованы
Содержание
Nr. Название главы  Стр.
  Ievads    3
  Web usage mining    4
  Datu sagatavošana    5
  Statiskā analīze    7
  Iegūto datu analīze    8
  Web content mining    9
  Google    9
Фрагмент работы

WEB usage mining
Informācijas iegūšana servera līmenī, tas ir informācijas atlase no Web-servera žurnāliem. Šo metodi izmanto visbiežāk, jo bez liekiem tēriņiem var iegūt pietiekoši daudz informācijas par lietotāja mijiedarbību ar serveri. Šī ir viena tām metodēm, kurai jau iepriekš ir sakrāti dati, jo visi vai gandrīz visi serveri veic automātisku žurnālfailu veidošanu, kuri glabājas diezgan ilgi.
Lielākā daļa Web serveru mūsdienās (ieskaitot Apache) piedāvā administratoram iespēju izvēlēties, kādi lauki tiks iekļauti žurnālos, un kuri nē. Servera žurnāliem ir arī savi trūkumi, par pamat trūkumu uzskata informācijas nepilnību. Tas neatspoguļo lapas, kuras lietotājs iepriekš ir saglabājis uz sava datora un apmeklējis, kā arī datus, kuri tiek padoti serverim ar POST metodi. Alternatīva metode datu iegūšanai servera līmenī – analīze pakešu līmenī. Tādā veidā var analizēt datus atsevišķu TCP/IP vaicājumu līmenī, bet tādu datu uzkrāšanai ir nepieciešama papildus programmatūra.

Informācijas iegūšana par lietotāja darbībām lietotāja līmenī. Viens no veidiem – Java programmu izmantošana, kas ielādējas kopā ar lapām uz servera, bet šo programmu funkcionalitāte ir ierobežota un lietotājs ar pārlūkprogrammas palīdzību var atslēgt informācijas iegūšanu. Otra iespēja varētu būt izmaiņu ieviešana pārlūkprogrammās. Bet tad vajadzēs žurnālos ierakstīt visus iespējamos datus, jo ja nākotnē būs nepieciešamība iegūt datus par citu parametru, tad ieviest izmaiņas visās pārlūkprogrammās būs neiespējams. Kā arī pie tādas iespējas ir divas problēmas – pirmkārt, pārsvarā neviens negribēs, lai viņa soļi Internetā ir pierakstīti un tad kaut kur nosūtīti, otrkārt, pārsvarā neviens negribēs atjaunot programmu, trešās personas vajadzībām, kas vāc datus. Tādā veidā informācijas iegūšana lietotāja līmenī vistiešāk skar privātās dzīves nepieskaramības problēmu.

Kā alternatīvu informācijas iegūšanai servera pusē vai lietotāja līmenī var izmantot informācijas iegūšanu tīkla mezglos. Ne vienmēr iespējams piekļūt servera žurnāliem, kā arī pievienojot serverim jaunas programmas informācijas iegūšanai var būtiski samazināt tā ātrdarbību, kas nebūtu vēlams. Kā risinājumu var izvietot sensorus tīkla mezglos pirms servera, tādā veidā serveris nebūs pārslogots no programmatūras. Tādā gadījumā informācijas iegūšana ir protokolu līmenī, izmantojot TCP/IP paketes. Kā labs piemērs sistēmai kalpo Web Traffic Warehouse. Sistēmas izstrādātāji ir atklājuši, ka atkarībā no informācijas vācēja atrašanās vietas mainās datu kvalitāte. Ja dati tiek nodoti asinhroni, izejošais un ienākošais trafiks var tikt sūtīt pa dažādiem fiziskiem kanāliem. …

Коментарий автора
Загрузить больше похожих работ

Atlants

Выбери способ авторизации

Э-почта + пароль

Э-почта + пароль

Неправильный адрес э-почты или пароль!
Войти

Забыл пароль?

Draugiem.pase
Facebook

Не зарегистрировался?

Зарегистрируйся и получи бесплатно!

Для того, чтобы получить бесплатные материалы с сайта Atlants.lv, необходимо зарегистрироваться. Это просто и займет всего несколько секунд.

Если ты уже зарегистрировался, то просто и сможешь скачивать бесплатные материалы.

Отменить Регистрация