piątek, 23 czerwiec 2017 12:16

Eksploracja danych (ang. data mining). Co to jest?

W kontekście pozyskiwania, analizy oraz wykorzystania danych stosuje się często termin „eksploracja danych”, który określany jest w języku angielskim jako data mining. Na czym dokładnie polega eksploracja danych i jakie ma zastosowanie?

 

Eksploracja danych, inaczej także zgłębianie danych, czyli data mining jest złożonym procesem analitycznym, który służy do badania dużych zasobów danych, na przykład tych dotyczących kwestii rynkowych czy gospodarczych. Służy on poszukiwaniu regularnych wzorców oraz współzależności pomiędzy różnymi zmiennymi, a następnie jest podstawą do oceny wyników poprzez wykorzystanie tych właśnie wykrytych wzorców. Efektem jest możliwość przewidywania różnych zdarzeń, na przykład zachowań klientów czy sprzedaży. Mowa wtedy o tak zwanym predykcyjnym data mining.

Za pośrednictwem predykcyjnego data miningu przedsiębiorstwa mogą uzyskać więc atrakcyjne dla nich korzyści biznesowe. Rozwiązania tego rodzaju wykorzystywane są między innymi w technice, ekonomii, medycynie, astronomii, a także w szeroko pojętym biznesie, na przykład przy prognozowaniu sprzedaży, tworzeniu reklam skierowanych, segmentacji klientów, ocenie ryzyka kredytowego, aby wspomnieć jedynie o kilku przykładach zastosowania.

Jak odbywa się eksploracja danych?

Proces ten dzielimy zasadniczo na trzy różne etapy, a mianowicie na wstępną eksplorację, budowanie modelu wraz z wyznaczeniem wzorców, a także ich ocenę i weryfikację, a także na wdrożenie i wykorzystanie modeli dla nowych danych, aby na tej podstawie można było uzyskać przewidywane wartości.

W tym celu wykorzystuje się specjalne oprogramowanie komputerowe, na przykład SAS, Statistical Analysis System (sas.com), które zawiera rozbudowane narzędzia pozwalające na analizowanie dużych zbiorów informacji w sposób najbardziej efektywny. Środowisko SAS służy między innymi do importu i przetwarzania danych, generowania raportów, analizy statystycznej. Więcej informacji dotyczących oprogramowania działającego w tym środowisku możemy znaleźć na stronie internetowej sas.com.