LoginRegistration
Zajęcia z Podstawy analizy danych w e-biznesie dla studiów magisterskich (223300).

Literatura:

 • Larry Rockoff: Język SQL Przyjazny podręcznik, Helion 2017
 • J.D. Ullman, J. Widom: Podstawowy wykład z systemów baz danych, WNT, W-wa, 2000
 • Marcin Szeliga, Danuta Mendrala: Praktyczny kurs SQL, Helion 2015
 • P. Biecek: Przewodnik po pakiecie R. 2017. GIS.
 • Krider R.E.: Customer and business analytics: applied data mining for business decision making using R, 2012, CRC Press;
 • Doligalski T., 2013, Internet w zarządzaniu wartością klienta, Warszawa, Oficyna Wydawnicza - Szkoła Główna Handlowa w Warszawie;
 • M. Lasek, Data Mining zastosowania w analizach i ocenach klientów bankowych, Oficyna Wydawnicza "Zarządzanie i Finanse", Warszawa 2002;
 • E. Gatnar, Symboliczne metody klasyfikacji danych, PWN, Warszawa 1998.
 • Dawid Wydra: Reklama Google AdWords w praktyce, Edgard, Warszawa 2014.

 • Zasady zaliczenia:

  • Kolokwium za maksymalnie 50 punktów. Nie ma możliwości poprawiania raz napisanego kolokwium.
  • Referat z prezentacją za maksymalnie 20 punktów.
  • Wysłanie w terminie projektu zespołowego i poprawnie (osobiście) wykonane polecenie związane z projektem (i prezentacjami) za maksymalnie 20 punktów.
  • Wykonane polecenie związane z modelowaniem danych za maksymalnie 10 punktów.
  • Dla osób z usprawiedliwioną nieobecnością na kolokwium istnieje możliwość napisania kolokwium w terminie sesji egzaminacyjnej za maksymalnie 50 punktów.
  • Ocena wystawiona na podstawie sumy punktów według tabeli przeliczeniowej:
   PUNKTYOCENA
   < 502 (niedostateczny)
   od 503 (dostateczny)
   od 603,5 (dostateczny plus)
   od 704 (dobry)
   od 804,5 (dobry plus)
   od 905 (bardzo dobry)

  Projekt zespołowy (2-3 osoby)

  Dla rzeczywistego zbioru danych napisać program w R, w którym dokonana jest analiza w oparciu o co najmniej jedną z wybranych metod eksploracji danych: regresja liniowa, regresja logistyczna, prognozowanie szeregów czasowych, drzewa klasyfikacyjne, sieci neuronowe. Na rozwiązanie zadania składa się:

  Referat z prezentacją

  Prezentacja powinna obejmować:

  Plan przedmiotu:

  1. Źródła i specyfika danych występujących w e-biznesie, metody ich pozyskiwania i metod analizy.
  2. Wprowadzenie do środowiska obliczeń statystycznych i wizualizacji wyników R. Prezentacja graficznego interfejsu RStudio.
  3. Podstawy składni języka R.
  4. Język R: instrukcje warunkowe, pętle, funkcje.
  5. Relacyjny model danych. Bazy danych w R.
  6. Podstawy języka zapytań SQL.
  7. Funkcje wierszowe i funkcje agregujące w języku zapytań SQL.
  8. Połączenia i podzapytania w języku zapytań SQL.
  9. Kolokwium.
  10. Wybrane techniki wizualizacji danych. Wykorzystanie technik wizualizacji danych do przewidywania i porównywania zachowań klientów.
  11. Wykorzystanie drzew decyzyjnych do analizy danych o klientach.
  12. Drzewa klasyfikacyjne i regresyjne. Metoda CART. Implementacja przykładowych rozwiązań w R.
  13. Charakterystyka systemów e-businessowych. Systemy CRM (Customer Relationship Management), ich architektura i funkcjonalność.
  14. Wybrane metody eksploracji danych: regresja logistyczna. Szacowanie prawdopodobieństwa konwersji.
  15. Wybrane metody eksploracji danych: modele szeregów czasowych. Przewidywanie wielkości sprzedaży.
  Contact: [email protected]