Uniwersytet Łódzki - Centralny System UwierzytelnianiaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Data mining (Eksploracja danych)

Informacje ogólne

Kod przedmiotu: 1100-DMZPAD Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Data mining (Eksploracja danych)
Jednostka: Wydział Matematyki i Informatyki
Grupy:
Punkty ECTS i inne: 0 LUB 10.00 (w zależności od programu)
zobacz reguły punktacji
Język prowadzenia: (brak danych)
Efekty kształcenia:

Student:

E1. Przytacza i ilustruje podstawowe pojęcia dotyczące eksploracji danych.

E2. Zna podstawy języka R i pakietu Rattle.

E3. Potrafi odkrywać asocjacje w zbiorach danych.

E4. Stosuje podstawowe techniki grupowania.

E5. Potrafi budować drzewa decyzyjne z użyciem Rattle.

Forma studiów:

podyplomowe

Wymagania wstępne:

podstawy programowania

Skrócony opis:

Nasza cywilizacja, a w szczególności duże firmy muszą sobie radzić z ogromną ilością danych. Są to dane pochodzące z baz danych, hurtowni danych oraz systemu WWW i zawierają informacje m.in. o klientach i wytwarzanych produktach. Eksploracja danych jest dziedziną informatyki, której zadaniem jest odkrywanie użytecznej wiedzy z danych i obejmuje metody i algorytmy automatycznej ich analizy. Ułatwia tworzenie promocji na podstawie koszyków zakupów, tworzenie systemu rekomendacji oraz skutecznych reklam w systemie WWW. Celem przedmiotu jest wprowadzenie do metodyki CRISP-DM i podstawowych technik eksploracji danych.

Zajęcia w cyklu "Rok akademicki 2017/2018" (w trakcie)

Okres: 2017-10-01 - 2018-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 20 godzin więcej informacji
Wykład, 15 godzin więcej informacji
Koordynatorzy: Monika Bartkiewicz, Arkadiusz Popa
Prowadzący grup: Monika Bartkiewicz, Arkadiusz Popa
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena zgodna z regulaminem studiów

Zajęcia w cyklu "Rok akademicki 2016/2017" (zakończony)

Okres: 2016-10-01 - 2017-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 40 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Monika Bartkiewicz, Arkadiusz Popa
Prowadzący grup: Monika Bartkiewicz, Arkadiusz Popa
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena zgodna z regulaminem studiów

Zajęcia w cyklu "Rok akademicki 2015/2016" (zakończony)

Okres: 2015-10-01 - 2016-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 20 godzin więcej informacji
Wykład, 15 godzin więcej informacji
Koordynatorzy: Monika Bartkiewicz, Arkadiusz Popa
Prowadzący grup: Monika Bartkiewicz, Arkadiusz Popa
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena zgodna z regulaminem studiów
Metody dydaktyczne:

klasyczna metoda problemowa, metoda projektu

Sposoby i kryteria oceniania:

Ocena z ćwiczeń zależy od liczby wykonanych projektów w ramach zajęć (EK1-EK5), na ocenę bardzo dobrą wymagane jest wykonanie dodatkowego projektu lub zaliczenie kolokwium, sprawdzającego efekty EK1-EK5. Oceną końcową jest ocena z ćwiczeń.

Treści kształcenia:

1. Co to jest eksploracja danych?

2. Omówienie metodyki CRISP-DM.

3. Podstawy języka R i pakietu Rattle.

4. Praca z danymi w Rattle i R:

(a) nazewnictowo,

(b) jakość danych,

(c) import danych z różnych źródeł (CSV, ARFF, ODBC, SQLite, R Data),

(d) eksploracja danych (podsumowywanie, wykresy, analiza korelacji),

(e) przekształcanie danych (normalizacja, imputacja, czyszczenie).

5. Tworzenie modeli:

(a) Grupowanie,

(b) Analiza asocjacji,

(c) Drzewa decyzyjne,

(d) przykłady innych modeli.

6. Ocena wydajności modeli.

7. Wdrożenie.

Literatura:

[1]Graham Williams Data Mining With Rattle and R_ The Art of Excavating Data for Knowledge Discovery, Springer 2011

[2]Biecek, Przemysław. Przewodnik po pakiecie R. Wrocław: Oficyna Wydawnicza „GIS”, 2011.

[3]Daniel T Larose, i Anna Wilbik. Odkrywanie wiedzy z danych: wprowadzenie do eksploracji danych. Warszawa: Wydawnictwo Naukowe PWN, 2013.

[4]Walesiak, Marek, Gatnar, Eugeniusz, i Andrzej Bąk. Statystyczna analiza danych z wykorzystaniem programu R. Warszawa: Wydawnictwo Naukowe PWN, 2009.

Zajęcia w cyklu "Rok akademicki 2014/2015" (zakończony)

Okres: 2014-10-01 - 2015-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 20 godzin więcej informacji
Wykład, 15 godzin więcej informacji
Koordynatorzy: Andrzej Skowron
Prowadzący grup: Andrzej Skowron
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena zgodna z regulaminem studiów
Metody dydaktyczne:

• klasyczna metoda problemowa


• metoda projektu

Sposoby i kryteria oceniania:

Warunkiem koniecznym zaliczenia ćwiczeń jest wykonanie projektów w ramach zajęć (EK 1-5). Na ocenę dobrą wymagane jest wykonanie dodatkowego projektu, a na bardzo dobrą, dwóch.

Treści kształcenia:

1. Co to jest eksploracja danych?


2. Omówienie metodyki CRISP-DM.


3. Podstawy języka R i pakietu Rattle.


4. Praca z danymi w Rattle i R:


(a) nazewnictowo,


(b) jakość danych,


(c) import danych z różnych źródeł (CSV, ARFF, ODBC, SQLite, R Data),


(d) eksploracja danych (podsumowywanie, wykresy, analiza korelacji),


(e) przekształcanie danych (normalizacja, imputacja, czyszczenie).


5. Tworzenie modeli:


(a) Grupowanie,


(b) Analiza asocjacji,


(c) Drzewa decyzyjne,


(d) przykłady innych modeli.


6. Ocena wydajności modeli.


7. Wdrożenie.

Literatura:

Biecek, Przemysław. Przewodnik po pakiecie R. Wrocław: Oficyna Wydawnicza „GIS”, 2011.

Daniel T Larose, i Anna Wilbik. Odkrywanie wiedzy z danych: wprowadzenie do eksploracji danych. Warszawa: Wydawnictwo Naukowe PWN, 2013.

Walesiak, Marek, Gatnar, Eugeniusz, i Andrzej Bąk. Statystyczna analiza danych z wykorzystaniem programu R. Warszawa: Wydawnictwo Naukowe PWN, 2009.

Zajęcia w cyklu "Rok akademicki 2013/2014" (zakończony)

Okres: 2013-10-01 - 2014-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 20 godzin więcej informacji
Wykład, 15 godzin więcej informacji
Koordynatorzy: Andrzej Skowron
Prowadzący grup: Andrzej Skowron
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena zgodna z regulaminem studiów
Metody dydaktyczne:

• klasyczna metoda problemowa


• metoda projektu

Sposoby i kryteria oceniania:

Warunkiem koniecznym zaliczenia ćwiczeń jest wykonanie jednego projektu (EK 1-5). Egzamin w formie testu (EK 1-5). Ocena końcowa jest średnią ocen z zaliczenia i egzaminu.

Treści kształcenia:

1. Co to jest eksploracja danych?


2. Omówienie metodyki CRISP-DM.


3. Podstawy języka R i pakietu Rattle.


4. Praca z danymi w Rattle i R:


(a) nazewnictowo,


(b) jakość danych,


(c) import danych z różnych źródeł (CSV, ARFF, ODBC, SQLite, R Data),


(d) eksploracja danych (podsumowywanie, wykresy, analiza korelacji),


(e) przekształcanie danych (normalizacja, imputacja, czyszczenie).


5. Tworzenie modeli:


(a) Grupowanie,


(b) Analiza asocjacji,


(c) Drzewa decyzyjne,


(d) przykłady innych modeli.


6. Ocena wydajności modeli.


7. Wdrożenie.

Literatura:

Williams, Graham J. Data Mining with Rattle and R: The Art of Excavating Data for Knowledge Discovery. New York: Springer, 2011.

Biecek, Przemysław. Przewodnik po pakiecie R. Wrocław: Oficyna Wydawnicza „GIS”, 2011.

Daniel T Larose, i Anna Wilbik. Odkrywanie wiedzy z danych: wprowadzenie do eksploracji danych. Warszawa: Wydawnictwo Naukowe PWN, 2013.

Walesiak, Marek, Gatnar, Eugeniusz, i Andrzej Bąk. Statystyczna analiza danych z wykorzystaniem programu R. Warszawa: Wydawnictwo Naukowe PWN, 2009.

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Łódzki.