Przeczytaj fragment książki pt. „Big data – efektywna analiza danych”

Dodane:

MamStartup logo Mam Startup

Udostępnij:

Skutki big data są najbardziej odczuwalne w praktyce, ponieważ wykorzystywane przez to zjawisko techniki są stosowane do znajdowania rozwiązań irytujących, codziennych problemów. Ale to zaledwie początek. Big data jest gotowe do przekształcenia naszego życia i myślenia oraz przemiany naszej pracy.

Zmiana, z którą się zmierzymy, jest w niektórych aspektach nawet większa od wywołanych przez poprzednie epokowe odkrycia, które dramatycznie zwiększyły ilość informacji w społeczeństwie i poszerzyły jej zakres. Ziemia usuwa się spod naszych stóp. Podważane są stare prawdy. Big data prowokuje do dyskusji na temat natury podejmowania decyzji, przeznaczenia czy sprawiedliwości. Naszemu sposobowi widzenia świata zbudowanemu na zasadzie przyczynowości wyzwanie rzuciła korelacja. Wiedza oznaczająca kiedyś zrozumienie przeszłości, stanie się wkrótce umiejętnością przewidywania przyszłości.

Kwestie te mają dużo większe znaczenie niż problemy, które powstawały, gdy przygotowywaliśmy się do korzystania z e-handlu, życia z internetem, wejścia w erę komputerową czy używania abakusa. Idea, że nasze próby zrozumienia przyczyn mogą być przereklamowane – że w wielu przypadkach korzystniejsze jest zrezygnowanie z pytania  dlaczego  na rzecz pytania  co  sugeruje, że są to zagadnienia fundamentalne dla naszego społeczeństwa i istnienia. Wyzwania, jakie stawia przed nami big data, mogą nie mieć ustalonych rozwiązań. Są one raczej częścią niekończącej się debaty nad miejscem człowieka we wszechświecie i poszukiwaniem sensu w chaotycznej, niezrozumiałej rzeczywistości.

Big data wyznacza chwilę, kiedy społeczeństwo informacyjne w końcu wypełni obietnicę zawartą w swojej nazwie. Kluczowe będą w tym dane. Wszystkie te cyfrowe drobiny, które dotychczas zebraliśmy, mogą być obecnie wykorzystane w nowatorski sposób, żeby służyć realizacji nowych celów i stworzyć nowe formy wartości. Wymaga to jednak zmiany naszego sposobu myślenia i stanowi wyzwanie dla naszej intuicji, a nawet poczucia własnej tożsamości. Jedno jest pewne – ilość danych będzie nieustannie się zwiększać, tak jak wzrastać będzie moc urządzeń zdolnych do ich przetwarzania. Choć większość osób, skupiając się na sprzęcie i oprogramowaniu, uważa big data za zagadnienie z zakresu technologii, jesteśmy przekonani, że w analizowaniu tego zjawiska nacisk powinien zostać położony na to, co się stanie, gdy dane przemówią.

Zapisujemy i przetwarzamy więcej informacji niż kiedykolwiek wcześniej. Niedobór danych przestaje być charakterystyką, która definiuje nasze próby zrozumienia świata. Możemy korzystać z dużo większej ilości danych, a w niektórych przypadkach zbliżamy się do użycia wszystkich informacji dotyczących jakiegoś zagadnienia. Zmusza nas to jednak do skorzystania z niekonwencjonalnych metod, a w szczególności do zmiany naszych przekonań, czym są użyteczne informacje.

Zamiast obsesyjnego dążenia do dokładności, precyzji i nieskazitelności danych możemy pozwolić sobie na pewną niedbałość. Nie powinniśmy akceptować danych, które są zasadniczo złe lub fałszywe, w zamian za możliwość stworzenia dużo większego ich zbioru, jednak pewien bezład może być dopuszczalny. W niektórych przypadkach duże i nieuporządkowane zbiory mogą być przydatne, ponieważ kiedy staramy się korzystać z niewielkich, dokładnych porcji danych, rezygnujemy z wielu szczegółów, w których mogą być ukryte cenne informacje.

Ponieważ znalezienie korelacji jest szybsze i tańsze niż odkrycie przyczyn, często do niego właśnie będziemy się ograniczać. Co prawda w niektórych przypadkach, na przykład przy projektowaniu ważnych części do samolotów, ciągle będziemy szukali związków przyczynowych i będziemy przeprowadzali kontrolowane eksperymenty z wykorzystaniem ostrożnie dobranych danych, ale w codziennych sprawach wystarczy nam wiedza co, a nie  dlaczego. Niemniej jednak big data może nam wskazać obiecujące obszary, w których możemy poszukiwać związków przyczynowo-skutkowych. 

Odkryte korelacje pozwolą nam w świecie ograniczonych zasobów zaoszczędzić pieniądze przy zakupie biletów lotniczych, przewidzieć pojawienie się epidemii grypy, dowiedzieć się, które studzienki lub przeludnione budynki powinniśmy sprawdzić. Być może dzięki nim firmy ubezpieczeniowe sprzedadzą nam polisy bez konieczności przeprowadzenia badań lekarskich i obniżą koszty leczenia dzięki wysyłaniu przypomnień o zażywaniu leków. Tłumaczymy maszynowo języki i tworzymy automatyczne samochody na podstawie przewidywań bazujących na korelacjach. Walmart może dowiedzieć się, jaki smak Pop-Tartsów umieścić przy wejściu do sklepów przed nadejściem huraganu. (Odpowiedź: truskawkowy) 2 . Oczywiście miło jest znać przyczyny. Problem polega na tym, że z reguły trudno je poznać i często oszukujemy się, twierdząc, że je znaleźliśmy nowe narzędzia począwszy od szybszych procesorów i pojemniejszych pamięci po mądrzejsze programy i algorytmy, to tylko niektóre powody, dla których robimy to wszystko. Chociaż narzędzia są ważne, bardziej fundamentalnym powodem jest to, że mamy więcej danych, ponieważ więcej aspektów naszego życia jest danetyzowanych. Ustalmy jedno, ambicje człowieka, żeby policzyć świat, ujawniły się wieki przed początkiem rewolucji komputerowej. Jednak cyfrowe narzędzia znacząco ułatwiły danetyzację. Telefony komórkowe mogą nie tylko zapamiętać, do kogo dzwonimy i dokąd idziemy, ale dane, które zbierają, mogą być wykorzystane do stwierdzenia, czy jesteśmy chorzy. 

Już niedługo dzięki big data będziemy wiedzieć, czy się zakochaliśmy. Nasza zdolność do robienia czegoś lepiej, szybciej, więcej i w nowy sposób ma potencjał do uwolnienia ogromnej wartości, stworzenia nowych zwycięzców i przegranych. Większa część korzyści pochodzi głównie z ponownego wykorzystania danych, a nie – jak uważaliśmy do tej pory – z ich pierwotnego użycia. W rezultacie w przypadku większości typów danych sensownym wydaje się gromadzenie ich jak największej ilości i przechowywanie przez jak najdłuższy czas. Korzystne jest również zezwolenie innym na ich analizę, jeśli tylko są lepiej do niej przygotowani (pod warunkiem, że będą chcieli podzielić się tym, co zarobili na wykorzystaniu naszych danych).

Rozkwitać będą firmy, które potrafią usytuować się w środku strumienia informacji i umieją gromadzić dane. Efektywne wykorzystywanie big data wymaga umiejętności technicznych i dużej wyobraźni – oraz odpowiedniego nastawienia. Jednak najwięcej zarobić mogą ci, którzy posiadają dane. Czasami wartościowym kapitałem nie będą jawne informacje, ale tworzone w trakcie interakcji osób z informacjami dane resztkowe, które sprytne firmy mogą wykorzystać do poprawy funkcjonowania istniejących usług lub wprowadzenia zupełnie nowych.

Big data niesie ze sobą również duże ryzyko. Sprawia, że podstawowe techniczne i prawne mechanizmy, za pomocą których obecnie staramy się chronić prywatność, stają się nieskuteczne. W przeszłości to, co składało się na identyfikujące nas dane – nazwiska, numery PESEL, deklaracje podatkowe itp. – było dobrze znane i łatwo dawało się zabezpieczać. Obecnie nawet najbardziej niewinnie wyglądające dane, jeśli tylko zbierze się ich wystarczającą ilość, mogą ujawnić czyjąś tożsamość. Anonimizacja lub usunięcie się z widoku nie są już skuteczne. Co więcej, bycie celem inwigilacji wiąże się teraz z dużo większym naruszaniem prywatności niż kiedykolwiek wcześniej, ponieważ władze nie tylko chcą zdobyć jak najwięcej informacji o jednej osobie, ale pragną również dowiedzieć się możliwie dużo o jej związkach, relacjach i interakcjach z innymi. 

Oprócz zagrożeń dla prywatności wykorzystanie big data rodzi również inne obawy – istnieje niebezpieczeństwo, że będziemy sądzić ludzi nie za ich rzeczywiste działania, ale za posiadane przez nich predyspozycje, które wywnioskujemy z danych. Gdy prognozy big data staną się dokładniejsze, społeczeństwo może użyć ich do karania osób za ich przewidywane zachowania – za czyny, których jeszcze nie popełniły. Takie prognozy z założenia będą nie do obalenia, dlatego oskarżone osoby nigdy nie będą mogły uwolnić się od postawionych im zarzutów. Karanie na takiej podstawie neguje ideę wolnej woli i zaprzecza możliwości (małej, ale jednak), że osoba taka wybierze inną drogę postępowania. Ponieważ ponosimy osobistą odpowiedzialność wobec społeczeństwa (i to ono nam wymierza kary), wolność wyboru musi pozostać nienaruszalną zasadą. Musimy zachować prawo do kształtowania naszej przyszłości. Jeśli tak się nie stanie, big data zniszczy samą istotę człowieczeństwa – racjonalność i wolność wyboru.

Big data pomaga nam usprawnić to, czym już się zajmujemy i równocześnie pozwala nam zająć się nowymi zagadnieniami. Nie jest jednak magiczną różdżką. Nie przyniesie światu pokoju, nie zlikwiduje biedy, ani nie sprawi, że pojawi się nowy Picasso. Nie wyleczy bezpłodności, ale pomoże przeżyć wcześniakom. Po jakimś czasie nabierzemy przekonania, że big data rozwiąże każdy nasz problem i być może będziemy lekko zaniepokojeni, gdy okaże się, że jest to niemożliwe. Będzie dla nas jak prześwietlenie, którego używamy, gdy choroba nie może być zdiagnozowana w inny sposób.

Tytuł: Big data – efektywna analiza danych. Rewolucja, która zmieni nasze myślenie, pracę i życie

Autorzy: Viktor Mayer-Schönberger, Kenneth Cukier

Wydawnictwo: MT Biznes