TPD-grupowanie2009.pdf
(
2261 KB
)
Pobierz
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
Analiza Skupień - Grupowanie
Zaawansowana Eksploracja Danych
JERZY STEFANOWSKI
Inst. Informatyki PP
Wersja dla TPD 2009,
Aktualizacja 2010
Email: Jerzy.Stefanowski@cs.put.poznan.pl
Elementy terminologiczne
Troche uwag:
•
Cluster Analysis
→
Analiza skupień, Grupowanie.
•
Numerical taxonomy
→
Metody taksonomiczne (ekonomia)
•
Uwaga: znaczenie taksonomii w biologii możemieć inny
kontest (podział systematyczny oparty o taksony).
•Cluste
→
Skupienie, skupisko, grupa/klasa/pojęcie
•
Nigdy nie mów: klaster, klastering, klastrowanie!
…
© Stefanowski 2009
Polski elementy w rozwoju analizy skupień
•
Jan Czekanowski
(1882-1965) - wybitny polski
antropolog, etnograf, demograf i statystyk, profesor
Uniwersytetu Lwowskiego (1913 – 1941) oraz
Uniwersytetu Poznańskiego (1946 – 1960).
•
Nowe odległości i metody przetwarzania macierzy odległości w
algorytmach, …, tzw. metoda Czekanowskiego.
• Kontynuacja Jerzy Fierich (1900-1965) Kraków
•
Hugo Steinhaus
, (matematycy Lwów i Wrocław)
•Wrocławska szkoła taksonomiczna (metoda dendrytowa)
•
Zdzisław Hellwig
(Wrocław)
•
wielowymiarowa analizą porównawcza, i inne …
•
Współcześnie …
•
„ Sekcja Klasyfikacji i Analizy Danych” (SKAD) Polskiego Towarzystwa
Statystycznego
© Stefanowski 2009
Referencje do literatury (przykładowe)
•
Koronacki J. Statystyczne systemy uczące się, WNT
2005.
•
Pociecha J., Podolec B., Sokołowski A., Zając K. „Metody
taksonomiczne w badaniach społeczno-ekonomicznych”.
PWN, Warszawa 1988,
•S ąpor K. „Automatyczna klasyfikacja obiektów”
Akademicka Oficyna Wydawnicza EXIT, Warszawa 2005.
•
Hand, Mannila, Smyth, „Eksploracja danych”, WNT 2005.
•
Larose D: „Odkrywania wiedzy z danych”, PWN 2006.
•
Kucharczyk J. „Algorytmy analizy skupień w języku
ALGOL 60” PWN Warszawa, 1982,
•
Materiały szkoleniowe firmy Statsoft.
© Stefanowski 2009
Przykłady zastosowań analizy skupień
•
Zastosowania ekonomiczne:
•
Identyfikacja grup klientów bankowych (np. właścicieli kart
kredytowych wg. sposobu wykorzystania kart oraz stylu życia,
danych osobowych, demograficznych)
→
cele marketingowe.
•
Systemy rekomendacji produktów i usług.
•
Rynek usług ubezpieczeniowych (podobne grupy klientów).
•
Analiza sieci sprzedaży (np. czy punkty sprzedaży podobne
pod względem społecznego sąsiedztwa liczby personelu, itp.,
przynoszą podobne obroty).
•
Poszukiwanie wspólnych rynków dla produktów.
•
Planowanie, np. nieruchomości.
•
Badania naukowe (biologia, medycyna, nauki społeczne).
•
Analiza zachowań użytkowników serwisów WWW.
•
Rozpoznawanie obrazów, dźwięku
•
Wiele innych
© Stefanowski 2009
Plik z chomika:
Lexor2
Inne pliki z tego folderu:
cwicz-inddrzew.pdf
(128 KB)
DMpreprocessingdodatkowe.pdf
(2240 KB)
DMwstep.pdf
(699 KB)
DMmultipleclassifiers.pdf
(1715 KB)
CASESTUDY12.pdf
(183 KB)
Inne foldery tego chomika:
Bazy danych 1 (BD1)
HDA - Hurtownie Danych
Zgłoś jeśli
naruszono regulamin