Jak skutecznie opowiadać historię za pomocą danych? Data storytelling w Microsoft Power BI

Norbert Kulski | Smart Data | 24.03.2021

Z Norbertem Kulskim, Business Intelligence Technical Solution Managerem w JCommerce, rozmawiamy o tym, czym jest data storytelling, czy narzędzie self-service naprawdę zrobi wszystko za nas, a także o tym, jakich błędów w wizualizacjach trzeba się wystrzegać i w jaki sposób wyeliminować „shadow reporting” w organizacji.

Data storytelling i wdrożenie Business intelligence

Storytelling to chwytliwe hasło, a opowiadanie historii jest wykorzystywane w różnych dziedzinach życia, także w analizie danych. Czym jest data storytelling w Business Intelligence?

Norbert Kulski: Jak w przypadku każdego nośnego hasła, definicji jest dużo. Najprościej ujmując, data storytelling to sztuka przekazywania informacji w taki sposób, aby odbiorca nie był przytłoczony mnogością danych. Data storytelling to tworzenie raportów w taki sposób, by użytkownik, korzystając z nich, doskonale wiedział, na jakie pytania odpowiadają. Naszym, twórców raportów celem, jest zaangażować, przykuć uwagę i sprawić, by użytkownik był zainteresowany zarówno samym przekazem, jak i płynącymi z niego wnioskami. Opowiadanie historii poprzez dane to zatem przedstawianie informacji w taki sposób, by odbiorca czuł się związany z danymi, a nie tylko miał poczucie, że patrzy na szereg nic niemówiących mu surowych tabelek.

Czy firmy wiedzą, jaką historię chcą opowiadać za pomocą narzędzi Business Intelligence? 

Na jednym biegunie są firmy, które wiedzą, jakimi danymi dysponują i z jakich systemów one pochodzą. Na drugim – firmy, które tą wiedzą nie dysponują i które nie korzystały do tej pory z systemów Business Intelligence lub nie znają możliwości posiadanych już przez siebie narzędzi. Dlatego właśnie przy wdrożeniach Business Intelligence z każdym rozmawiamy w sposób indywidualny.

Od czego powinna zacząć się rozmowa o wdrożeniu Microsoft Power BI czy innego narzędzia Business Intelligence?

Ja zaczynam od pytania, jaki obszar firma chce badać i co orientacyjnie chce przedstawić w ramach raportu. Dzięki doświadczeniu zebranemu w wielu obszarach jako specjaliści Business Intelligence możemy również pokazać, jaki efekt udało się osiągnąć w innych firmach. W tym celu prezentujemy możliwości narzędzia lub szablony raportów. W firmach, które nie do końca wiedzą, co mogłyby osiągnąć, i są na etapie analizy danych, już sama sposobność zapoznania się z możliwościami narzędzia jest bardzo wartościowa, bo ukierunkowuje rozmowę. Wówczas klient mówi: „Tak, to nam się podoba, chcemy mieć właśnie taki raport!”

Co dalej?

Zaczynamy się zastanawiać, jak pobrać potrzebne dane i z jakich systemów. W przedsiębiorstwach, które wiedzą, jakie mają dane i co chcą zobaczyć na raportach, sprawa może być prostsza i w szczególności sprowadza się do wykonania raportu w taki sposób, by był atrakcyjny i po prostu przyjemny w obsłudze dla użytkowników.

Dobre praktyki i grzechy główne w wizualizacjach

Jakie cechy powinien posiadać taki atrakcyjny raport?

Dziś narzędzia raportowe rozwijają szereg funkcjonalności, które pozwalają tak zaprojektować raport, by nie tylko utrzymać, ale nawet zwiększyć zainteresowanie czytelnika. Są to na przykład mechanizmy poruszania się od ogółu do szczegółu, formatowania warunkowego, czyli wyróżniania kolorystycznego tych elementów, które spełniają określone reguły. W ten sposób już za pomocą samego tylko koloru informujemy odbiorcę: „Tu jest dobrze” lub przeciwnie – „Tu jest źle”. Narzędzia Business Intelligence dają możliwość nakładania linii trendów czy forecastu. Są dostępne opcje podpowiedzi, a nawet automatyczna analiza danych w oparciu o algorytmy Machine Learning.  

W jaki sposób sztuczna inteligencja i uczenie maszynowe ułatwiają pracę z raportami?

AI i ML to mechanizmy, które bardzo ułatwiają pracę z raportami! Narzędzie Microsoft Power BI stara się samo, na podstawie algorytmów, zrozumieć, które liczby czy spostrzeżenia mogą być interesujące dla odbiorcy. Umożliwia to dla przykładu funkcjonalność Quick Insights, czyli zautomatyzowana analiza zbioru danych. Power BI w tle analizuje nasz zbiór danych, żeby zaprezentować ciekawe wnioski, np. wartości odstające. Po opublikowaniu danych, zgromadzonych w raporcie, na stronie powerbi.com pojawia się pytanie: „Czy chcesz zobaczyć Quick Insights?”. Przykładowo, w przypadku sprzedaży QI może pokazać nam najlepiej i najgorzej sprzedający się produkt. Czasem dzięki Quick Insights można trafić na bardzo ciekawe „znajdźki”!

Pomimo coraz większych ułatwień wielu użytkowników unika raportów. Jakie są „grzechy główne” w wizualizacjach?

Przede wszystkim przeładowanie informacyjne i niespójność w przekazie. Jeśli nie mamy spójnego pomysłu na przekazanie informacji, tylko zapełniamy stronę wieloma niepowiązanymi ze sobą wizualizacjami, użytkownik straci zaangażowanie, bo najzwyczajniej nie będzie wiedział, na które dane patrzeć. Nie będzie potrafił wyciągnąć wniosków, co jest dobrze, a co źle. Inny częsty błąd: twórca raportu chce pokazać użytkownikowi cały zbiór bez agregowania danych. Ekspertom dziedzinowym to wiele daje, gdy mają dostęp do całego zbioru. Jednak dla wszystkich innych na początek nie powinno prezentować się wszystkiego naraz, tylko zacząć od podsumowań z możliwością przejścia do szczegółów.

W czasie pandemii pojawiło się wiele raportów covidowych wykorzystujących agresywną kolorystykę.

Wykorzystanie kolorów pozwala zbudować emocje względem prezentowanych danych. Niepożądane stany liczb oznaczamy kolorem czerwonym i dla użytkowników to jasna informacja, że to nie jest oczekiwana wartość. Nasz mózg intuicyjnie postrzega kolory właśnie w taki sposób. Jeśli ktoś buduje raport covidowy, wykorzystując agresywną kolorystykę, liczy na to, że zbuduje emocje: strach albo przekonanie, że jest źle. Wykorzystanie kolorów to również szereg praktyk, ale trzeba być w tym spójnym. Na przykład, jeśli w raporcie handlowym wartość sprzedaży zaznaczona jest na niebiesko, dobrze jest trzymać się tego koloru na wszystkich stronach.

Specjalista Business Intelligence powinien być więc także UX Designerem, a nawet trochę psychologiem?

W Business intelligence łączy się wiedzę z różnych dziedzin, także o tym, jak pracuje ludzki mózg. Business Intelligence jest więc szerokim zbiorem technik, algorytmów, dziedzin, w tym i znajomości dobrych praktyk z zakresu UX Design. Wszystko po to, żeby jak najsprawniej przekazać informację i wycisnąć z niej jak najwięcej. Czy wiesz, dlaczego do przedstawiania wartości nie powinniśmy wykorzystywać wykresów kołowych?

Dlaczego?

Jeśli wykres kołowy jest posortowany od największej do najmniejszej wartości, to jeszcze pół biedy, bo idąc zgodnie ze wskazówkami zegara, poruszamy się od największej do najmniejszej wartości. Bez tego jednak byłoby bardzo trudno od razu powiedzieć, która część koła jest największa. Drugą sprawą jest sytuacja, gdy jedna wartość dominuje nad pozostałymi, które stają się wtedy niemal niewidoczne – a to czasami tam kryją się ciekawe wnioski. Na koniec, jeśli mamy wartości dodatnie i ujemne, będzie nam bardzo trudno pokazać je naraz na jednym wykresie kołowym. Istnieją standardy doboru wizualizacji, a jednym z nich jest standard IBCS wykorzystywany najczęściej w księgowości i mocno ostatnio promowany. Warto poczytać na ten temat, żeby wiedzieć, jakich wizualizacji nie powinniśmy używać w tym standardzie, by uniknąć wprowadzania odbiorców w błąd.

Dla przykładu – link do standardu IBCS wskazujący inne wizualizacje jako alternatywy dla wykresu kołowego

Narzędzia self-service i szkolenia Business Intelligence

A co z narzędziami typu self-service? Ich użycie nie wymaga tej wiedzy?

Hasło „self-service” jest bardzo nośne. Kryje się pod nim narzędzie o ogromnych możliwościach schowanych za prostym, a więc dostępnym dla każdego, interfejsem. To prawda… a raczej część prawdy. Z prostych danych można stworzyć szybko i w łatwy sposób funkcjonalny raport. Jednak im większy model danych, im więcej zależności, tym trudniej pracuje się z wykorzystaniem narzędzia typu self-service. Pod spodem, niemal niewidoczne dla normalnego użytkownika, są ukryte wszystkie warstwy, które mają duży wpływ na to, czy raport będzie przyjazny w obsłudze. To, jak zorganizujemy pobieranie danych i model analityczny, ma ogromne znaczenie dla wydajności, jak i dla wizualnej (czyli widocznej dla każdego) formy raportu. O modelowaniu nie zawsze mówi się w przypadku haseł promujących narzędzia self-service i może dlatego właśnie wśród niektórych użytkowników pokutuje przeświadczenie, że Microsoft Power BI zrobi wszystko za nich. A prawda jest taka, że im większa ilość danych i zakres informacji, tym większej wiedzy potrzeba, by dobrze zorganizować model danych.

Specjaliści Business Intelligence będą więc nadal potrzebni?

Prowadziłem kiedyś szkolenie z Microsoft Power BI, gdzie problemem dla użytkownika był przesunięty rok finansowy. Gdy użytkownik wczytywał zbiór danych (była nim tabela płaska: numer transakcji, wartość, data zwykła i dołożona data fiskalna), ignorując część modelowania – raportował tylko z jednej tabeli. Było mu trudno tworzyć raporty, które przełączałyby się między zwykłym kalendarzem i kalendarzem fiskalnym. Zastosowaliśmy prostą modyfikację – utworzenie dedykowanego przygotowanego już w samym narzędziu kalendarza rozwiązało wszystkie problemy, a kod miar czy kalkulacji skurczył się ze strony A4 do dwóch linijek. Wystarczyło mieć wiedzę, że poza warstwą wizualną istnieje jeszcze warstwa modelowania i że to w niej można wiele usprawnić.

Warto inwestować w szkolenia Business Intelligence?

Jestem zwolennikiem wdrażania Microsoft Power BI, bo to narzędzie bardzo przyjazne użytkownikom. Jednak każde wdrożenie powinno mieć w standardzie szkolenie, bo już 1-2 dni szkolenia bardzo otwierają oczy użytkownikom na możliwości narzędzia. Dopiero od momentu szkolenia (niezależnie od tego, czy chodzi o Qlik, Tableau, czy Power BI) można mówić, że wdrażamy narzędzie Business Intelligence z sukcesem. Sama praca z trenerem podczas szkolenia stwarza możliwość zadania pytania, dopytania o funkcjonalność i dobre praktyki w zakresie rozwiązywania typowych w danej firmie problemów z danymi.

Z czego wynika tak duża potrzeba szkoleń Business Intelligence?

Zdarza się, że użytkownicy, którzy trafiają na szkolenie, pewnego dnia po prostu dowiedzieli się, że będą korzystali z Microsoft Power BI. Jednak mimo korzystania z nowoczesnego narzędzia ich problemy z danymi się nie skończyły, bo tak naprawdę zamienili Excele, raporty z całą ich ułomnością, na raporty Power BI, gdzie niewiele albo wręcz nic nie zyskali ze względu na brak należytej wiedzy, jak pracować w nowym narzędziu. Takie pozostawianie użytkowników z narzędziem jest nie fair względem nich, bo jeśli nie dajemy im oprócz narzędzia zestawu wiedzy, powielają oni dokładnie te same błędy, które chcieliśmy wyeliminować za pomocą wdrożenia nowoczesnego rozwiązania BI. Jeśli nie zapewnimy im wiedzy, będą postępowali tak, jak potrafią…  często w najlepszej wierze, ale jednak częściowo trwoniąc potencjał narzędzia. Tam, gdzie zaczynają się komplikacje i gdzie potrzeba bardziej wyrafinowanych raportów, użytkownikom pozostawionym samym sobie jest bardzo trudno się odnaleźć. Materiałów szkoleniowych w Internecie jest mnóstwo, ale to nie jest odpowiedź na potrzeby użytkowników biznesowych w firmach. Dodatkowo po kwartale używania narzędzia polecany jest następny etap szkolenia. Dopiero wtedy widać, jakie są możliwości narzędzi Business Intelligence i jak wiele problemów pomagają rozwiązać.

Pandemia COVID-19 a boom na rozwiązania raportowe

Które branże są najbardziej zainteresowane analizą danych i wdrożeniami BI?

W czasie pandemii COVID-19 widzimy prawdziwą eksplozję zainteresowania systemami raportowymi,  i to już niezależnie od branży. W marcu 2020, gdy wprowadzone zostały obostrzenia, wiele firm nieposiadających systemów raportowych pozostało bezradnych. Nie wiedziały, z jakich narzędzi skorzystać, by zostać konkurencyjnym lub po prostu… przetrwać. Z kolei firmy, które już posiadały dojrzały system raportowy i ufały danym, miały większe pole manewru i nie musiały reagować impulsywnie. Mając pełną kontrolę nad marżowością, nad okresami zatrudnienia, mogły podejmować świadome decyzje i szybko identyfikować obszary czy elementy nierentowne. Z narzędziami Business Intelligence można dużo lepiej reagować na przewidywany spadek dochodów. Pomijając ten wyjątkowy i trudny okres, w którym się znajdujemy, zapytania o systemy BI dostajemy zarówno od małych firm, takich jak wyspecjalizowane sklepy internetowe, jak i od największych firm w Polsce i za granicą.

Pandemia i potrzeba kontroli kosztów okazały się wyzwalaczem dla wprowadzania podejścia data-driven w organizacjach?

Widzimy bardzo duże zainteresowanie systemami raportowymi! Mówi się, że dane są nową ropą naftową świata. Ale trzeba również pamiętać o tym, że dane, których nie wykorzystujemy, to tylko koszt – płaci się za przestrzeń dyskową, za coraz większe kopie bezpieczeństwa czy spadającą wydajność systemów. Jeśli wykorzystujemy dane do analizy tego, „jak było”, a jeszcze lepiej do przewidywania tego „jak może być”, to jesteśmy w uprzywilejowanej pozycji, bo dołączamy do organizacji data-driven.

2020 przyniósł też 30% wzrostu branży e-commerce. W jaki sposób sektor
e-commerce wykorzystuje narzędzia Business Intelligence, takie jak Power BI?

Tak naprawdę to sektor e-commerce jest pionierem wykorzystania systemów Business Intelligence i algorytmów Machine Learning na masową skalę. Organizacje e-commerce oprócz oczywistych już przykładów, takich jak proponowanie produktu, który jest najczęściej kupowany, z tymi które mamy już w koszyku, mogą dodatkowo śledzić trendy zakupowe poza swoją platformą, np. w mediach społecznościowych. Podam przykład, którego prawdopodobnie każdy z nas doświadczył: wzrost zainteresowania drożdżami na początku marca 2020 roku. Ludzie nie wiedzieli, jak wiele czasu pozostaną w zamknięciu i jak niebezpieczny jest wirus. Sądzili, że będą musieli samodzielnie wypiekać pieczywo, czego efektem był wzrost zapotrzebowania m.in. na mąkę i drożdże (sięgający 300%!).  Ja też nauczyłem się piec, wykonywać zakwasy. Ale śledząc chociażby social media, trendy w wyszukiwarkach (ludzie szukali przepisów na pieczywo) czy po prostu analizując, trochę post factum, w swoim systemie wzrost skokowy zapotrzebowania, można było uprzedzić konkurencję i postarać się zwiększyć stany magazynowe najbardziej pożądanych produktów. Ten, kto wtedy miał w zapasie drożdże, mógł decydować o tym, jaka jest ich cena i komu je sprzedaje.

W jaki sposób to działa?

Wykorzystuje się tu narzędzia Advanced Analytics. To dziedzina, która korzysta z zaawansowanych technik wykraczających poza Business Intelligence,  takich jak m.in uczenie maszynowe, Data Mining, czy analiza tekstu łącznie ze zrozumieniem sensu i emocji w tekście w sposób zautomatyzowany. W działaniach marketingowych, wybierając grupy docelowe w social mediach, można sprawdzić na małym zbiorze odbiorców, jak dana kampania zostanie przyjęta przed realizacją działań na szerszą skalę. To zwiększa docieralność i skuteczność działań. Monitorujemy odbiór, mamy potwierdzenie w niemoderowanych konwersacjach, a algorytmy rozpoznawania emocji w tekście wskazują: tak, to pozytywna recenzja, lub: nie, to się spotkało z negatywnym odbiorem, powinniśmy się z tego wycofać. Wykorzystanie Advanced Analytics pozwala być w awangardzie firm czerpiących korzyści z analizy danych. Analizując działania np. na Twitterze, możemy poinformować decydentów, o jakim zagadnieniu coraz więcej się mówi, i podpowiedzieć, w jaki obszar warto zainwestować.

Jakie są typowe korzyści z wykorzystania narzędzi analitycznych w e-commerce?

Usprawnione planowanie popytu, przyspieszenie procesu decyzyjnego, zwiększona świadomość sytuacyjna czy odkrywanie trendów oraz skuteczności działań marketingowych. Oczywiście zabezpieczenie się czy przewidzenie takiego zdarzenia jak pandemia COVID-19 jest bardzo trudne, bo są to zdarzenia rzadko występujące, a jednak o ogromnej sile rażenia. W codziennym życiu narzędzia analityczne bardzo pomagają w rozwinięciu sprzedaży, skoncentrowaniu się na tych produktach, które przynoszą nam największy dochód oraz szybkiej eliminacji produktów nierentownych. Dają również możliwość sprawdzania, jak produkty się zachowają, gdy będziemy udostępniali je w powiązanych ofertach – np. produkt A z produktem B – czyli przeprowadzenia analizy koszykowej. Razem są to działania, które mogą w bardzo wydatny sposób zwiększyć dochody.

Shadow reporting

Jaki najciekawszy projekt udało Ci się realizować i jaki problem udało się rozwiązać dzięki wdrożeniu Power BI?

Kocham to, co robię i w każdym projekcie, niemal każdego dnia, robię coś ciekawego. Trudno mi zatem wskazać jeden najciekawszy projekt. Samo odkrywanie Power BI, praca z narzędziem, które tak szybko się rozwija, jest superciekawe. Coś, z czego jestem najbardziej dumny, to moment, gdy użytkownicy rezygnują z własnych rozwiązań, które zbudowali z powodu braku systemu raportowego, który odpowiadałby ich potrzebom.

O jakie sytuacje chodzi?

Mam na myśli tzw. shadow reporting, czyli „raportowanie nieoficjalne”. To zjawisko obecne chyba w każdej firmie, zarówno w Polsce jak i za granicą. Gdzieś w tle, oprócz oficjalnego, czasem skostniałego i niewydajnego systemu raportowego, pracownicy rozwijają alternatywne raportowanie, bardzo często przy wykorzystaniu narzędzia na którym się znają, czyli Excela. Wymaga to wielkiego nakładu ich pracy. W moim przekonaniu jest to strata potencjału ludzi, którzy są dobrymi analitykami czy ekspertami w swoich obszarach i mogliby zająć się analizą danych oraz stawianiem hipotez czy wyciąganiem wniosków, które przynoszą prawdziwe korzyści firmie, a tymczasem dzień w dzień walczą, aby pozyskać informację, jaki był wynik za wczoraj czy za poprzedni miesiąc.

Jak zatem wyeliminować shadow reporting?

W rozwiązaniach, które wdrażamy, chcemy porozmawiać ze wszystkimi użytkownikami, tak aby shadow reporting nie był już potrzebny. Budujemy systemy przekrojowe, które integrują dane z wielu źródeł, często nawet takich, których jeszcze parę lat temu nie dałoby się w prosty sposób zintegrować. Dziś narzędzia mają niesamowite możliwości przekształcania nieustrukturyzowanych danych, dbania o ich jakość i jej poprawę. Dzięki temu mamy możliwość dostarczenia systemu, który odpowiada naprawdę na wszelkie potrzeby i wtedy użytkownicy mówią: „To jest to, czego naprawdę potrzebujemy” i przyznają: „Nie musimy już tego robić manualnie”. W każdym projekcie spotykam się z sytuacjami, gdy ludzie dziękują i mówią: „Fantastycznie, że udało się to zrealizować!”.