LoginRegistration
Zajęcia z Podstawy analizy danych w e-biznesie dla studiów magisterskich niestacjonarnych sobotnio-niedzielnych (223300).

Zasady zaliczenia:

  • Kolokwium pisane w sesji egzaminacyjnej za maksymalnie 50 punktów.
  • Wysłanie w terminie projektu zespołowego za maksymalnie 20 punktów.
  • Indywidualne wykonanie poleceń związanych z R oraz projektem zespołowym za maksymalnie 10 punktów (w sesji egzaminacyjnej).
  • Referat na wskazany temat za maksymalnie 20 punktów.
  • Do zaliczenia niezbędne jest uzyskanie co najmniej po jednym punkcie z referatu, projektu zespołowego, poleceń związanych z R oraz kolokwium.
  • Ocena wystawiona na podstawie sumy punktów według tabeli przeliczeniowej:
    PUNKTYOCENA
    < 502 (niedostateczny)
    od 503 (dostateczny)
    od 603,5 (dostateczny plus)
    od 704 (dobry)
    od 804,5 (dobry plus)
    od 905 (bardzo dobry)

Projekt zespołowy (2-3 osoby)

Dla rzeczywistego zbioru danych napisać program w R, w którym dokonana jest analiza w oparciu o jedną z wybranych metod eksploracji danych: regresja liniowa lub regresja logistyczna. Na rozwiązanie zadania składa się:

Referat

Referat powinnien obejmować:

Plan przedmiotu:

  1. Źródła i specyfika danych występujących w e-biznesie, metody ich pozyskiwania i metod analizy.
  2. Wprowadzenie do środowiska obliczeń statystycznych i wizualizacji wyników R. Prezentacja graficznego interfejsu RStudio.
  3. Podstawy składni języka R.
  4. Język R: instrukcje warunkowe, pętle, funkcje.
  5. Relacyjny model danych. Bazy danych w R.
  6. Podstawy języka zapytań SQL.
  7. Funkcje wierszowe i funkcje agregujące w języku zapytań SQL.
  8. Połączenia i podzapytania w języku zapytań SQL.
  9. Kolokwium.
  10. Wybrane techniki wizualizacji danych. Wykorzystanie technik wizualizacji danych do przewidywania i porównywania zachowań klientów.
  11. Wykorzystanie drzew decyzyjnych do analizy danych o klientach.
  12. Drzewa klasyfikacyjne i regresyjne. Metoda CART. Implementacja przykładowych rozwiązań w R.
  13. Charakterystyka systemów e-businessowych. Systemy CRM (Customer Relationship Management), ich architektura i funkcjonalność.
  14. Wybrane metody eksploracji danych: regresja logistyczna. Szacowanie prawdopodobieństwa konwersji.
  15. Wybrane metody eksploracji danych: modele szeregów czasowych. Przewidywanie wielkości sprzedaży.
Contact: [email protected]