Wizualna analiza danych, czyli BI nowej generacji

tibco_03

Pojęcie Business Intelligence zostało sformułowane po raz pierwszy w latach 50. ubiegłego wieku, a prawdziwą popularność zdobyło zaledwie trzy dekady później. Rozwój informatyki i coraz częstsze  stosowanie systemów wspierających zarządzanie spowodowały, że określenie Business Intelligence wciąż ewoluowało, aby w rezultacie objąć swoim zakresem procesy, metody, narzędzia i technologie związane z analizą danych. Obecnie BI kojarzone jest głównie z systemami raportowymi, hurtowniami danych i data miningiem.

Dziś stoimy u progu zupełnie nowej ery w dziedzinie Business Intelligence. Systemy informatyczne w firmach, internet, sieć telefonii komórkowej, nawigacja GPS, a nawet tkanka miejska rejestrują informacje. Całe mnóstwo różnorodnych informacji, które stanowią potencjał do uczenia się zachowań użytkowników, przewidywania ich kolejnych kroków i podejmowania decyzji w taki sposób, aby osiągnąć pożądany efekt. Obecnie bardziej niż kiedykolwiek potrzebne są sprawne narzędzia, które wspierają przekształcanie danych z różnych źródeł w informacje i wiedzę niezbędne do skutecznego zarządzania.

W tym miejscu z pomocą przychodzi firma Tibco. Opierając się na wieloletnim doświadczeniu i czerpiąc z koncepcji wielkich zbiorów danych, stworzyła ona Spotfire, czyli narzędzie, które proponuje inne niż do tej pory podejście do analizy danych. Najważniejsze zalety Spotfire to:

  • analiza wizualna, dzięki której pracujemy na wykresach, a nie bezpośrednio na liczbach;
  • działanie in-memory, które sprawia, że Spotfire działa bardzo szybko, przetwarzając obszerne zbiory danych;
  • aktywna rozbudowa danych, co oznacza, że silnik Spotfire działa w tle, rozbudowując strukturę danych o informacje/metadane wykonywanych czynności;
  • Data Mashup, czyli możliwość łączenie wielu różnych źródeł danych w jednym miejscu (między innymi z bazy danych, plików i skryptów);
  • wbudowane funkcje statystyczne i wsparcie dla skryptów R, S+, SAS i MATLAB;
  • oddanie analizy danych w ręce użytkowników biznesowych czy analityków, bez konieczności udziału IT w tym procesie.

Ekosystem Spotfire składa się z zespołu elementów, z których kilka warto wymienić. Podstawową jednostką jest klient Spotfire Professional. Z jego pomocą przygotowuje się aplikacje analityczne. W tle pracuje serwer Spotfire, który stanowi repozytorium przygotowanych Data Linków czy opublikowanych aplikacji. Jest też Web Player, który pozwala na udostępnianie aplikacji analitycznych szerszemu gronu odbiorców. Tibco udostępnia również obszerne API, co z kolei umożliwia daleko idącą personalizację rozwiązań w firmie.

Architektura TIBCO Spotfire

Bardzo trudno jest pokazać, jak działa Spotfire, w formie statyczno-blogowej. Mimo wszystko podejmę próbę. Postaram się na przykładach zaprezentować podstawowe możliwości tego systemu. Do stworzenia przykładów wykorzystam ogólnodostępny zbiór danych o polskich miastach.

Główne okno Spotfire Professional składa się ze standardowego dla tego typu narzędzi zestawu elementów. Są nimi:

  • belka górna z paskiem menu i przyciskami ułatwiającymi korzystanie z popularnych funkcji;
  • pasek zakładek umożliwiający sprawne poruszanie się po kolejnych stronach analizy;
  • obszar filtrów umożliwiający manipulowanie na żywo zakresem analizowanych danych;
  • obszar roboczy, w którym umieszczane są poszczególne wykresy czy tabele z danymi.

wizualna_analiza_1Okno Tibco Spotfire. Na górze klasyczny pasek menu, niżej zakładki, obszar roboczy z wykresem i zależną od zaznaczenia tabelą danych, a po prawej panel z filtrami.

Wszystkie elementy, jakie umieścimy na stronie, można konfigurować, czyli dowolnie je przemieszczać, rozciągać i formatować. Firma Tibco oddaje w nasze ręce bardzo szeroki wachlarz ustawień, zaczynając od konfiguracji, filtrowania i zaznaczania danych źródłowych, a na wyglądzie wykresów kończąc. Wspomniane zaznaczanie jest tu kluczowe do zbudowania interaktywnej aplikacji. Możemy zdefiniować wiele poziomów zaznaczeń, przypisać je do poszczególnych elementów i stworzyć obiekty zależne od zaznaczenia. Warto zwrócić uwagę na to, że zaznaczenie odbywa się na poziomie danych, dzięki czemu zaznaczone na jednym wykresie dane zostaną wyróżnione również w ramach innych elementów aplikacji.

wizualna_analiza_2Wykres słupkowy i kołowy pokazują dane zagregowane na województwo i są od siebie niezależne. Zaznaczony obszar na jednym z nich podkreślony jest na obu. Wykres punktowy pokazuje miasta z zaznaczonych województw.

Kolejnym ważnym komponentem jest Text Area. Nazwa może wprowadzać w błąd, ponieważ nie mamy tu do czynienia ze zwykłym polem tekstowym. Faktycznie w treści da się wprowadzić dowolny tekst, ale można tam umieścić również inne elementy, takie jak przyciski, linki, filtry, pola wprowadzania wartości czy listy rozwijalne. Zastosowane obiekty mogą wpływać na wygląd wykresu, ingerować w dane czy filtry lub uruchamiać skrypty. Dzięki nim aplikacja zyskuje kolejny poziom interakcji z użytkownikiem.

wizualna_analiza_3Główny element to wykres TreeMap, poniżej w tabeli dane miast z zaznaczonych powiatów. Po lewej znajduje się Text Area, a w nim od góry: tekst, List Box skonfigurowany tak, aby ograniczać dane pokazane na wykresie, nie filtrując ich dla całej aplikacji, przycisk resetujący filtry i zaznaczenie, tekst i filtr (zakresowy) służący do ograniczania danych analizowanych w aplikacji po parametrze liczby ludności w mieście.

Praca ze Spotfire dzięki wspomnianej interaktywności i łatwości obsługi jest przyjemnością. Zaryzykuję stwierdzenie, że wystarczy tylko krótka chwila na zapoznanie się z tym narzędziem, a potem można się nim wręcz świetnie bawić. Tworzenie kolejnego wykresu, modyfikacja jego ustawień i fakt, że wyniki zmieniają się natychmiast po zatwierdzeniu zmian, dają dużą satysfakcję. Swoją rolę bardzo sprawnie odgrywa zastosowane podejście Drag & Drop. Efekty są natychmiastowe i przedstawione w bardzo przejrzystej formie.

wizualna_analiza_4W tym wypadku na wykres słupkowy z trzema prostymi miarami przeciągnięty został dodatkowy wymiar, miasto.

Zalet wymieniłem już niemało, a nie padło jeszcze ani jedno słowo o zakładkach (bookmarks) czy choćby o wbudowanych w Spotfire funkcjach statystycznych. Jednak nie sposób wspomnieć o wszystkich cechach tego narzędzia w jednym wpisie. Zainteresowanych odsyłam do strony internetowej Tibco Spotfire, z której można pobrać darmową wersję narzędzia do testowania przez 30 dni.

Podsumujmy: Tibco wykonało dobrą pracę, przygotowując Spotfire. Umożliwia on zebranie danych z wielu źródeł w jednym miejscu praktycznie bez udziału zasobów IT firmy. Pozwala specjalistom zagłębić się w dane za pomocą wbudowanych funkcji i języków skryptowych, a następnie opublikować i podzielić się wnioskami. Moim zdaniem Spotfire, zgodnie z tytułem tego wpisu, jest przedstawicielem nowej generacji narzędzi Business Intelligence. Generacji, która nie stanowi bezpośredniej konkurencji dla klasycznego BI, ale proponuje inne podejście do tematu. Z przyjemnością będę obserwować rozwój tego tematu w najbliższym czasie. Jednocześnie chciałbym, aby ten wpis stanowił początek serii dotyczącej najnowszych trendów w dziedzinie BI i analizy danych.

Na koniec chciałbym jeszcze zachęcić do obejrzenia oficjalnej reklamy Tibco Spotfire.

http://www.youtube.com/watch?v=KoUswm18ZfQ

Całkiem przyjemna, prawda?


Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *