LoginRegistration
Zajęcia z Podstawy analizy danych w e-biznesie dla studiów magisterskich niestacjonarnych sobotnio-niedzielnych (223300).

Literatura:

  • Larry Rockoff: Język SQL Przyjazny podręcznik, Helion 2017
  • J.D. Ullman, J. Widom: Podstawowy wykład z systemów baz danych, WNT, W-wa, 2000
  • Marcin Szeliga, Danuta Mendrala: Praktyczny kurs SQL, Helion 2015
  • P. Biecek: Przewodnik po pakiecie R. 2017. GIS.
  • Krider R.E.: Customer and business analytics: applied data mining for business decision making using R, 2012, CRC Press;
  • Doligalski T., 2013, Internet w zarządzaniu wartością klienta, Warszawa, Oficyna Wydawnicza - Szkoła Główna Handlowa w Warszawie;
  • M. Lasek, Data Mining zastosowania w analizach i ocenach klientów bankowych, Oficyna Wydawnicza "Zarządzanie i Finanse", Warszawa 2002;
  • E. Gatnar, Symboliczne metody klasyfikacji danych, PWN, Warszawa 1998.
  • Dawid Wydra: Reklama Google AdWords w praktyce, Edgard, Warszawa 2014.

  • Zasady zaliczenia:

    • Kolokwium za maksymalnie 50 punktów. Nie ma możliwości poprawiania raz napisanego kolokwium.
    • Wysłanie w terminie projektu zespołowego i wprowadzona (osobiście) poprawnie modyfikacja w kodzie programu za maksymalnie 30 punktów.
    • Referat za maksymalnie 20 punktów.
    • Dla osób z usprawiedliwioną nieobecnością na kolokwium istnieje możliwość napisania egzaminu za maksymalnie 50 punktów.
    • Ocena wystawiona na podstawie sumy punktów według tabeli przeliczeniowej:
      PUNKTYOCENA
      < 502 (niedostateczny)
      od 503 (dostateczny)
      od 603,5 (dostateczny plus)
      od 704 (dobry)
      od 804,5 (dobry plus)
      od 905 (bardzo dobry)

    Projekt zespołowy (2-3 osoby)

    Dla rzeczywistego zbioru danych napisać program w R, w którym dokonana jest analiza w oparciu o co najmniej jedną z wybranych metod eksploracji danych: regresja liniowa, regresja logistyczna, prognozowanie szeregów czasowych, drzewa klasyfikacyjne, sieci neuronowe. Na rozwiązanie zadania składa się:

    Referat

    Przygotowanie jednego zadania z rozwiązaniem z zakresu: Referat powinnien obejmować:

    Plan przedmiotu:

    1. Źródła i specyfika danych występujących w e-biznesie, metody ich pozyskiwania i metod analizy.
    2. Wprowadzenie do środowiska obliczeń statystycznych i wizualizacji wyników R. Prezentacja graficznego interfejsu RStudio.
    3. Podstawy składni języka R.
    4. Język R: instrukcje warunkowe, pętle, funkcje.
    5. Relacyjny model danych. Bazy danych w R.
    6. Podstawy języka zapytań SQL.
    7. Funkcje wierszowe i funkcje agregujące w języku zapytań SQL.
    8. Połączenia i podzapytania w języku zapytań SQL.
    9. Kolokwium.
    10. Wybrane techniki wizualizacji danych. Wykorzystanie technik wizualizacji danych do przewidywania i porównywania zachowań klientów.
    11. Wykorzystanie drzew decyzyjnych do analizy danych o klientach.
    12. Drzewa klasyfikacyjne i regresyjne. Metoda CART. Implementacja przykładowych rozwiązań w R.
    13. Charakterystyka systemów e-businessowych. Systemy CRM (Customer Relationship Management), ich architektura i funkcjonalność.
    14. Wybrane metody eksploracji danych: regresja logistyczna. Szacowanie prawdopodobieństwa konwersji.
    15. Wybrane metody eksploracji danych: modele szeregów czasowych. Przewidywanie wielkości sprzedaży.
    Contact: [email protected]