Bohater telewizyjnego serialu, doktor House, zwykł mawiać, że wszyscy kłamią. Chcę wierzyć, że ludzie nie są aż tak źli i cyniczni, dlatego pozwolę sobie zmienić tę frazę. Wszyscy mogą kłamać. Niektórzy celowo, inni nieświadomie – efekt jest ten sam. Odbiorca kłamstwa jest wprowadzony w błąd, może wyciągnąć niewłaściwe wnioski – a na ich podstawie podjąć złe decyzje.

Kłamstwo ma krótką oś Y, czyli jak wykreślić nieprawdę

Świadomość tego, że możemy paść ofiarą nieprawdy jest szczególnie ważna dziś, w dobie postprawdy i fake newsów. Zwłaszcza że nadmiar informacji, jakimi jesteśmy bombardowani w każdej minucie, nie pozwala nam na ich szczegółową weryfikację. Często jedynie prześlizgujemy się wzrokiem po nagłówkach czy zdjęciach, a nasze doświadczenie do spółki z poglądami dopowiadają nam resztę. Pół biedy, jeśli dotyczy to jakiejś błahej informacji. Gorzej, gdy damy się w ten sposób zwieść, odczytując informacje kluczowe dla działalności gospodarczej. Rzeczywistość biznesowa sprawia, że cenimy wszelkiej maści syntezy. Zamiast opasłych analiz, wystarczy podsumowanie, najlepiej w formie prezentacji. Zamiast sprawozdania pełnego liczb – raport pełen wykresów. Najważniejsze informacje przedstawione w formie graficznej wystarczą, aby wyrobić sobie zdanie na dany temat. Przecież jeden obraz zastępuje tysiąc słów. Tylko że wykresy są szczególnie podatne na przeinaczenia. Celowe czy nie – efekt będzie ten sam. Kłamliwy obraz zastąpi tysiąc kłamstw. Jak się przed tym ustrzec? A jednocześnie – jak nie popełnić błędów, mogących wprowadzić w błąd innych?

Pułapki wykresów

Zacznijmy od tego, co wydaje się najczęstszym błędem popełnianym przy tworzeniu wykresu. Wybór jego typu. Wydaje się, że to nie jest skomplikowane, ale jakże często przy tworzeniu wizualizacji danych jej autor decyduje się na jakiś typ wykresu bez większej refleksji nad tym, do czego właściwie powinno się go zastosować. Spójrzmy na załączony przykład (Rysunek 1). W obu przypadkach na wykresach przedstawiam te same dane liczbowe. Intuicyjnie jednak z tych dwóch wykresów wyciągniemy dwa różne wnioski. W przypadku wykresu liniowego mogę założyć, że dane pomiędzy poszczególnymi wartościami są połączone, zmieniają się stopniowo – maleją i rosną. Z kolei wartości przedstawione na wykresie kolumnowym mogą, ale nie muszą, być ze sobą powiązane. Dlatego wykresów liniowych należy używać jedynie dla danych powiązanych ze sobą chronologicznie. W pozostałych przypadkach – pozostańmy przy wykresie kolumnowym. Albo słupkowym (czyli z poziomymi paskami), gdy mamy do przedstawienia sporo kategorii, a chcemy, aby nasz wykres był czytelny.

Jest jeszcze jeden typ wykresu, który dość często jest stosowany, tak jakby komuś zależało na zaciemnieniu, a nie na jak najjaśniejszym przekazaniu informacji. To popularny w ostatnich latach wykres radarowy, widoczny na Rysunku 2. Pokazuje on kilka cech w formie linii lub płaszczyzny łączącej punkty na osiach biegnących promieniście od środka wykresu. Bardzo często pojawia się w podsumowaniach testów psychologicznych, prezentując siłę różnych cech osobowości u badanej osoby. Podstawowy problem z tego typu wykresem jest identyczny jak z wykresem liniowym z poprzedniego akapitu. Łączenie punktów na wykresie radarowym może sugerować, że pomiędzy tymi cechami i zmianami ich wielkości jest jakieś powiązanie, tymczasem zazwyczaj go nie ma. Drugim problemem, który często pojawia się przy wykresach radarowych, jest prezentowanie danych zbyt wielu serii. Umieszczenie dwóch przypadków na jednym wykresie może dawać jakieś porównanie. Ale kiedy jest ich dużo więcej, zamiast czytelnego wykresu otrzymujemy kolorową plamę, bardziej pasującą do muzeum sztuki nowoczesnej niż do biznesowego raportu. W plątaninie linii i osi trudno się połapać, więc można ukryć tam informację, która niekoniecznie powinna wybijać się na pierwszy plan. Gdyby zamiast wykresu radarowego użyć tradycyjnego kolumnowego, tego typu sztuczki byłyby nieco trudniejsze, choć oczywiście nie niemożliwe, co jeszcze zaprezentuję w dalszej części artykułu.

Jednym z najczęściej stosowanych wykresów jest wykres kołowy. Po angielsku nazywa się on pie chart i wydaje się to zrozumiałe, w końcu wiele osób lubi ciasta. Ale nawet najlepsze ciasto w nadmiarze jest niestrawne. Wykresowi kołowemu, na przykład takiemu jak na Rysunku 3, można wiele zarzucić. Po pierwsze: jako ludzie nie potrafimy poprawnie oszacowywać różnic między kątami, zwłaszcza jeśli różnice te nie są znaczące. W przypadku wielu wykresów kołowych mamy do czynienia z więcej niż dwiema kategoriami, co byłoby najczytelniejsze. Im ich więcej, tym trudniej znaleźć różnice między nimi, a to już stwarza pole do nadużyć. Wystarczy ułożyć kategorie na kole nie według wartości. Innym problemem związanym z wykresem kołowym, na którym zaprezentowano sporo danych, jest jego czytelność. Mnogość kolorów, konieczność dodawania legendy, to wszystko sprawia, że odbiorca rozprasza się i nie jest w stanie szybko i poprawnie zinterpretować przedstawionych danych. Zamiast wykresów kołowych lepiej stosować wykresy słupkowe lub gałęziowe, a kołowe zostawić sondażom wyborczym – i to dla drugiej tury wyborów prezydenckich, gdy kandydatów jest tylko dwóch.

Czasem jednak przy tworzeniu wizualizacji danych posłuchamy diabełka siedzącego nam na ramieniu i użyjemy wykresu kołowego. Gorzej, gdy okazuje się, że na drugim ramieniu zamiast aniołka też siedzi diabełek i doradza nam, aby ten wykres przenieść w trzeci wymiar. Spójrzmy na przykład z Rysunku 4. Mamy tu wszystkie problemy wykresu kołowego, ale dodatkowo okraszone tym niefortunnym imitowaniem przestrzenności. Nadal trudno oszacować kąty na wykresie, ale pochylenie koła dodatkowo zaburza proporcje pomiędzy poszczególnymi jego fragmentami. To trick stosowany przez największych – swego czasu duży i znany producent sprzętu elektronicznego na swojej corocznej konferencji tak ustawił trójwymiarowy wykres, aby sprawić wrażenie, że to do niego należy największy udział na rynku telefonów. Oczywiście wykres był opisany procentami, więc oficjalnie nic nie było przekłamaniem. Ale odpowiedni wycinek koła rzucał się w oczy jako pierwszy, a tym samym można było odnieść wrażenie, że ów producent jest niekwestionowanym liderem, choć konkurencja zauważalnie go wyprzedzała.

Ostatnim typem wykresu, który bywa używany bez związku z charakterem danych, a do tego może zaciemniać informacje, jest wykres powierzchniowy. Powstaje on przez pokolorowanie przestrzeni pod linią łączącą wartości na wykresie liniowym (Rysunek 5). Pomijając problem omówiony na początku, czyli to, że nie dla każdych danych wykres liniowy i pochodne są najlepsze, pojawia się tu jeszcze jedno pole do ukrywania danych. I to dosłownie. Gdy na jednym wykresie umieszczamy kilka wykresów liniowych, jesteśmy w stanie dość swobodnie prześledzić przebieg każdego z nich, bez względu na to, jak kształtują się dane w poszczególnych punktach. Gdy jednak zamienimy to na wykres powierzchniowy, punkty przecięć obu wykresów są miejscami, w których dane chowają się za zasłoną innej serii danych. Widzimy, że jakaś wartość jest niższa od drugiej, ale o ile dokładnie? Czy mamy do czynienia z niewielką korektą danych w dół, czy też z wielkim dołkiem? Nie dowiemy się, o ile nie znajdziemy sposobu na zajrzenie za kolorowe pole. Czasem jako rozwiązanie tego problemu podaje się stworzenie wykresu powierzchniowego w wersji trójwymiarowej, ale to tylko przysparza nowych kłopotów. Perspektywa staje się zaburzona, porównywanie poszczególnych wartości między sobą jest utrudnione, a sens danych znika pomiędzy kolorowymi paskami.

Dane trudne do zrozumienia

Innym sposobem na zaciemnianie informacji, zamiast jej rzetelnego przekazywania, jest prezentowanie danych w sposób utrudniający ich szybkie zrozumienie. Tutaj króluje umieszczanie zbyt wielu danych na jednym wykresie. Tak jak w opisanym powyżej wykresie radarowym albo kołowym – to najprostsza droga do tego, aby skończyć z nieczytelnym wykresem. Odbiorca, widząc plątaninę kolumn lub linii, może się łatwo pogubić w ich przebiegu lub porównaniu z legendą. Można jeszcze sprawić, o czym wspomnę w ostatniej części tego tekstu, aby dane zlewały się ze sobą. W ten sposób łatwo o podświadomy przekaz dla czytelnika: tu się dużo dzieje, jest profesjonalnie, nie zrozumiesz tego, zaufaj nam. I wiele osób, zamiast nabawić się bólu głowy przy odczytaniu zagmatwanego wykresu, machnie ręką i dopowie sobie to, co mu pasuje. Lub to, co podprogowo zasugeruje mu źle przygotowany wykres.

Za dużo danych

Osobnym problemem ze zbyt dużą ilością danych jest to, że nie tylko mogą wprowadzać w błąd, ale przede wszystkim nużyć. Nasze wykresy czy raporty, poza przekazywaniem suchych informacji, powinny snuć jakąś opowieść. Pokazywać dane przedsięwzięcie jak bohatera historii. Dlatego warto prowadzić uwagę odbiorcy od jednego faktu do drugiego, starannie dobierając informacje i sposób ich przedstawienia. Kierujemy jego skupienie na to, co jest ważne dla zrozumienia naszych danych nie po to, aby go oszukać, ale by faktycznie zrozumiał nasz przekaz. Umieszczanie wszystkiego, a przynajmniej wielu faktów, na jednym wykresie czy nawet stronie, to jak wzięcie wszystkich opisów dań i uczt z „Pana Tadeusza”, po czym zapisanie ich drobnym maczkiem na jednej stronie. Nie opowiada to żadnej historii, nie pobudza wyobraźni i nie daje wytchnienia odbiorcy. Tak to można opisywać przyrodę w „Nad Niemnem”, a nie prezentować dane.

Przeładowane infografiki

A skoro już temat dużej ilości danych wypłynął, muszę poruszyć zmorę współczesności, jaką są przeładowane infografiki. To narzędzie pozwalające szybko i efektywnie przekazać nawet duże ilości informacji, a przynajmniej ich przesłanie. Niemniej zdarzają się przypadki infografik, w których autor uparł się na umieszczenie na jednej stronie wszystkich wykresów. Dodatkowo postanowił je kreatywnie połączyć i podkreślić ich kontekst, dodając masę ozdobników. W ten sposób zamiast infografiki otrzymujemy coś pomiędzy kolażem, wykonanym na plastykę w podstawówce, a ścianą ze zdjęciami celebryty w pokoju psychofana. W teorii tworzenia wykresów stosowany jest nawet współczynnik danych do atramentu (data-ink ratio). Powstał on w latach osiemdziesiątych i mówi, jaka część atramentu stosowanego do wydruku wykresu (współcześnie można to przełożyć na piksele niezbędne do ich wyświetlenia) przypada na faktyczne dane, a jaka na zbędne ozdobniki. Tło, trzeci wymiar, niepotrzebnie użyty kolor (na przykład na wykresie kolumnowym z jedną serią danych), powtórzenie etykiet lub wartości – wszystko to wpływa na zmniejszenie wartości współczynnika, a tym samym obniża jakość naszej prezentacji danych. Wykresy, na których dane giną pod masą ozdobników, określa się mianem wykresów śmieciowych (chartjunk), bowiem faktycznie rzadko można je uratować i nadają się tylko na śmietnik. Ten sam termin zarezerwowany jest dla wykresów nieniosących ze sobą żadnej istotnej informacji, będących sztuką dla sztuki, na przykład wykresów kolumnowych, składających się z jednej kolumny (Rysunek 6).

Gra w kolory

Jeśli jednak autorowi uda się umieścić wiele serii danych na jednym wykresie w sposób umożliwiający ich zrozumienie, nadal może zaciemnić obraz. Wystarczy uświadomić sobie, jakim sojusznikiem lub wrogiem może być użycie koloru, ewentualnie desenia, którym wypełnione będą poszczególne pola wykresu. Najlepiej jest używać kolorów kontrastujących, a deseni – wyraźnie odcinających się od innych. Gdy jednak mamy kilkanaście serii danych do przedstawienia, pojawia się pokusa, by użyć różnych odcieni jednego koloru. Podświadomie, i słusznie, uciekamy od pstrokatości, tym samym skazując odbiorcę na istne katusze. Czy ten odcień różowego różni się od tamtego łososiowego? Czy to są dwie różne wartości, czy jedna, tylko niewłaściwie wydrukowana? W taki sposób można nawet zawyżyć wizualnie dany wynik, na przykład na wykresie kołowym.

Inną sztuczką z kolorem, stosowaną wyraźnie w celu skonfundowania odbiorcy, jest używanie barw niezgodnie z ich intuicyjnym czy kulturowym znaczeniem. Wyobraźmy sobie mapę pogody, na której ochłodzenie oznaczane jest kolorem czerwonym, a ocieplenie – niebieskim. Negatywnym wartościom przypisujemy kolor zielony, a pozytywnym – czerwień. Umysł odbiorcy podświadomie przypisze kolorom na wykresie znaczenie i jeżeli będzie widział rozbieżność między tą interpretacją a przebiegiem wykresu, może ją zignorować i pójść na skróty. Dlatego w przypadku operowania kolorem, zwłaszcza gdy ma on służyć nie tylko estetyce wykresu, należy zachować daleko posuniętą ostrożność.

Manipulowanie osiami

Trzecim i ostatnim sposobem manipulowania wykresami, po niewłaściwym dobraniu typów i mętnym przedstawianiu danych, jest manipulowanie osiami na wykresach liniowych bądź kolumnowych. I tu na pierwszym miejscu pojawia się klasyk nad klasykami, czyli zaczynanie osi rzędnych nie od zera, ale od arbitralnie wybranej wartości. Spójrzmy na przykład na Rysunku 7. Te dwa wykresy prezentują dokładnie te same dane, różnica jest tylko w tym, gdzie zaczyna się oś Y. W ten sposób można stworzyć wrażenie, że zmiany z okresu na okres były zdecydowanie większe niż w rzeczywistości. Choć faktycznie było to kilka procent, możemy odnieść wrażenie, że dana pozycja podwoiła się. Do oceny skali nieprawdy na tych wykresach stosuje się tak zwany współczynnik kłamstwa (lie-factor), będący współczynnikiem efektu widocznego na wykresie do efektu faktycznego. Tu wynosi on 160, więc jest bardzo wysoki. Lie-factor można też zaobserwować na wspomnianych wykresach trójwymiarowych, z zaburzoną perspektywą.

Ta sztuczka jest już dość znana, dlatego obecnie coraz częściej można spotkać wykresy, które... w ogóle nie mają osi Y, albo zaznaczonej na niej skali. Ewentualnie skala jest, ale jakaś dziwnie rozciągnięta lub ściśnięta. Lub, co dziwniejsze, zupełnie bezzasadnie zastosowano skalę logarytmiczną. Przykład z Rysunku 8 pokazuje to wyraźnie. To ponownie te same dane, ale przedstawione na odpowiednio zmienionych osiach. Pierwsze wrażenie w przypadku każdego z nich jest diametralnie różne. Zresztą nie tylko oś rzędnych jest narażona na tego typu tortury, także osi odciętych zdarzają się dziwne przypadki, jak zupełnie abstrakcyjne grupowanie. Albo stosowanie niewłaściwych okresów porównawczych. Rysunek 9 pokazuje dane w sposób, od którego włos się jeży na głowie. Dwa okresy połączone w jedno, jeden okres pominięty, a kolejny zaprezentowany w sposób niepełny. Jedyny wniosek, jaki można wyciągnąć z tego wykresu, to niedbałość lub zła wola jego twórcy.

Oczywiście może być tak, że wykresy w raporcie będą sprawiać wrażenie dobrze przygotowanych. Kolory zostaną użyte poprawnie, dane będą rozdzielone na osobne wykresy, osie będą poprawnie opisane, współczynnik kłamstwa będzie niski, a współczynnik danych do atramentu – wysoki. Szybki rzut oka wystarczy, aby zaufać takim wykresom, jak na Rysunku 10 i wyciągnąć odpowiednie wnioski. Tylko że pomiędzy jednym a drugim wykresem zmianie uległa skala. Jak widać, zmiana nie musi być znaczna, aby zmanipulować odbiór tego typu wykresu.

Podsumowanie

Opisane powyżej przykłady to najczęstsze sposoby na pudrowanie danych na wykresach. Czy oznaczają, że nie można ufać graficznemu przedstawieniu liczb? Absolutnie. Wszyscy kochają wykresy, a bez nich biznesowe raporty i prezentacje byłyby jak tort składający się z samego biszkopta, bez kremu, lukru i ozdób. A skoro kochamy wykresy, pozostaje podeprzeć się starą maksymą – kochaj i sprawdzaj. Nie ulegajmy pierwszemu wrażeniu. Przyjrzyjmy się uważnie wykresowi, mając w pamięci to, że jego twórca mógł mieć cele odmienne od naszych. Porównajmy z danymi przedstawionymi w tekście lub tabelach. Zrozummy liczby stojące za słupkami, kolumnami i liniami. I pamiętajmy, że nawet najlepiej przygotowany wykres nie zwalnia nas z krytycznego myślenia.

Ulubione Drukuj

Zobacz również

Data decency

Applying an ethical approach to personal data processing is a matter of good governance never mind regulatory compliance, says John Bowman

Czytaj więcej

Wykresy wodospadowe w praktyce

Wykresy są często nieodłącznym narzędziem wykorzystywanym przy różnego rodzaju raportach. Ich zadaniem jest zarówno przekazać pewne merytoryczne dane, jak również przyciągnąć uwagę odbiorcy. Jako że większość z nas jest wzrokowcami, to dobrze stworzony wykres pozwoli zapamiętać najważniejsze dane czy różne zależności.

Czytaj więcej

Polecamy

Przejdź do

Partnerzy

Reklama