Dane przestały być ciągiem znaków zrozumiałym tylko dla informatyka. Dziś to nasze twarze i głos

Czy uda się nam stworzyć standardy korzystania z danych i ich udostępniania, tak by chronić nasze prawo do prywatności? Czy będziemy potrafili docierać do informacji rzetelnych i odróżniać je od fałszywych?

dane Norbert Biedrzycki SpidersWeb blog

Aby pokonać tysiące kilometrów, wystarczy mi zaledwie kilka godzin lotu samolotem. Przemieszczanie się z jednego zakątka globu do drugiego nigdy nie było tak proste, łatwo dostępne i względnie tanie. Ale czy zdajemy sobie sprawę z tego, ile informacji zostaje nadanych, odebranych i przetworzonych, by do takiej podróży doszło?

Mój artykuł w SpidersWeb – link.

Wyszukiwarka w internecie, reklamy linii lotniczych, porównywarki cen, rezerwacja lotu, zakup biletu, logowanie się do konta bankowego, użycie karty kredytowej, korzystanie ze specjalnie dobranej oferty promocyjnej, podróż samochodem na lotnisko (w samochodzie strumienie informacji przetwarza na bieżąco GPS i inne urządzenia elektroniczne) czy nadanie bagażu – dla tych wszystkich operacji paliwem są ogromne zbiory danych (big data).

Ta świadomość w codziennym życiu nam umyka, nie jest potrzebna, do takiego świata się przyzwyczailiśmy. Nikogo pewnie z nas nie zaskoczy teza, że z roku na rok od tych strumieni informacji będziemy się coraz bardziej uzależniać. IDC przewiduje, że cyfrowy wszechświat, czyli ilość przetwarzanych, dostarczanych, tworzonych, wysyłanych i odbieranych danych osiągnie w roku 2025 poziom 180 zettabajtów (proszę dodać 21 zer do liczby 180). Już dzisiaj ilość informacji, która nas atakuje w ciągu zaledwie jednej doby, równa się wszystkim informacjom, które docierały do mieszkańca ziemi w ciągu … 100 lat XX wieku.

Co z tego wynika dla nas już teraz, i jak wpływać to będzie na nasze życie w przyszłości? Czy uda się nam stworzyć standardy korzystania z danych i ich udostępniania, tak by chronić nasze prawo do prywatności? Czy będziemy potrafili docierać do informacji rzetelnych i odróżniać je od fałszywych? Czy jako klienci i osoby prywatne będziemy mogli dysponować danymi na nasz temat w taki sposób, by czerpać z tego zyski? Czy zarządy współczesnych firm zdają sobie sprawę z tego, jaką konkretnie wartość biznesową mają dane będące w ich posiadaniu?

Sprzedam portalowi, to co chcę

Nasze cyfrowe „ja” to nie tylko informacje takie jak: data urodzenia, adres, numer telefonu czy adres mailowy, ale także informacje o pracy, zainteresowaniach, zdrowiu, finansach. Innowacyjną usługą mogą w przyszłości stać się rozwiązania, dzięki którym my – konsumenci, zaczniemy monetyzować informacje, na których dzisiaj zarabiają firmy, wykorzystując je do usług reklamowych. Odwrócenie relacji, w taki sposób, by klient mógł otrzymywać wynagrodzenie za udostępnianie informacji na swój temat, mogłoby przynieść ciekawe efekty, a relacja siły w układzie klient indywidualny – korporacja wzrosłaby niepomiernie po stronie tego pierwszego.

Przykładem takiego właśnie spojrzenia na role sprzedawcy i nabywcy danych jest działalność firmy Datacoup. Jej misją jest – jak sama ją określa na swojej witrynie – zmiana niesymetrycznego modelu, w którym firmy masowo wykorzystują dane użytkowników, a ci ostatni nic z tego nie mają. W tym przypadku klient tworzy w serwisie Datacoup profil własnej osoby, a jego składowe określają jego wartość rynkową. Informacje zebrane w profilu zostają następnie udostępnione przez Datacoup zainteresowanym nabywcom, głównie bankom i firmom ubezpieczeniowym, które za to płacą.

Trudno dzisiaj orzekać, czy tak zorganizowany system wymiany informacji na nowych zasadach, przyjmie się. Popularyzacja takiego odwróconego modelu wymagałaby od nas zmiany naszych przyzwyczajeń, potrzebne by były poważne rozwiązania prawne i w dużej mierze dobra wola kręgów biznesowych.

Innym przykładem mogą być cyfrowe portfele. Przybierają różną postać – od kart cyfrowych do wyspecjalizowanych aplikacji zainstalowanych na naszych smartfonach. Przechowują dane o nas, o naszych transakcjach, kartach, kontach czy często również naszych przyzwyczajeniach i upodobaniach zakupowych. Są skarbnicą wiedzy o nas samych.

Komu te dane są teraz udostępniane? Najczęściej producentom tychże portfeli, którzy następnie te dane w formie zagregowanej, zanonimizowanej sprzedają dalej. Czy my, jako twórcy i właściciele tych danych, mamy z tego jakąś korzyść? Oprócz dedykowanych dla nas ofert w postaci wszechobecnych reklam, raczej niewielką.

Internet Rzeczy, czyli rewolucja w świecie danych

Zalewa nas masa danych wartościowych i bezwartościowych, fałszywych i prawdziwych, potrzebnych i zbędnych. Ten proces wydaje się nie mieć końca, a kolejne terabajty informacji będą rodzić się w przyszłości bez naszego udziału, za sprawą – Internetu Rzeczy. Połączenie w jeden organizm komputerów, czujników, pojazdów, robotów, urządzeń przemysłowych i domowych, smartfonów, czy środków transportu spowoduje lawinowy przyrost informacji – zmiennych, a wręcz efemerycznych.

Globalna sieć współpracujących ze sobą urządzeń może okazać się dla nas poważnym wyzwaniem. Do tej pory żadna społeczność, miasto czy państwo nie doświadczyło sytuacji, w której inteligentna elektronika usamodzielnia się, „karmiąc się” informacjami, które sama generuje. Jak kontrolować ten proces?

Internet Rzeczy może rodzić problemy dla przyszłych systemów prawnych, które będą musiały zmagać się z faktem masowego powstawania informacji, których nadawców/właścicieli trudno będzie zidentyfikować. Informacje te rodzą się niejako samodzielnie w inteligentnych urządzeniach – będą to w dużym stopniu dane „anonimowe”.

Nowe cele organizacji

Jak powinna zachowywać się firma, by przetrwać na rynku zdominowanym przez olbrzymie zbiory danych? Jej misją jest uświadomienie pracownikom wszystkich szczebli i działów, że to właśnie DANE stają się podstawowym produktem. Umiejętność przetwarzania, gromadzenia, wymiany, zabezpieczania i monetyzowania informacji będzie w coraz poważniejszym stopniu wpływała na pozycję rynkową i wycenę każdej organizacji.

Wdrożenie nowoczesnych procesów zarządzania danymi jest więc kluczowym wyzwaniem dla działów IT. Równie ważne są szkolenia, które zapewnią pracownikom świadome użytkowanie danych. Na razie bowiem terminy takie jak: „machine learning” czy „deep learning” dla wielu zarządów są abstrakcyjnymi terminami, zrozumiałymi jedynie przez działy IT czy Advanced Analytics. A przecież to właśnie te technologie będą w przyszłości wpływać na zdolność organizacji do funkcjonowania na rynku.

Informacje muszą współpracować

Aby firmy mogły sprostać wymaganiom dynamicznie zmieniającego się rynku, zarządy muszą zrezygnować z przyzwyczajeń i tradycyjnego spojrzenia na biznes. Nowoczesna technologia w firmie nie ma być jedynie zabawką dla działu IT, który cieszy się, bo udało mu się przekonać osoby decyzyjne do zakupu tej, czy innej aplikacji, algorytmu czy sieci neuronowej. Implementacja nowej technologii to najpoważniejszy warunek utrzymania firmy przy życiu. Przecież to technologia pozwala szybko ocenić, czy przyjęta strategia marketingowa, produktowa, sprzedażowa przynosi wymierne rezultaty.

Szybko dostępne i szybko przetwarzalne zbiory informacji stają się wartością bezdyskusyjną. By przekonać osoby odpowiedzialne do inwestowania w najnowszą technologię, w tym mechanizmy oparte na Sztucznej Inteligencji, warto czasem posłużyć się argumentami futurystów. Mogą oni przecież tworzyć scenariusze użycia lub scenariusze biznesowe (use cases) czy modele wykorzystania danych oparte na nowoczesnych technologiach – takich, które są dopiero w powijakach, a które mają szanse się rozwinąć i odgrywać ogromną rolę w przyszłości.

Jakich technologiach? Pomyślmy tutaj o możliwościach, które daje bezpośrednie sprzężenie mózgu ludzkiego z maszyną w celu wyeliminowania najbardziej nieefektywnego interfejsu człowiek-maszyna, a mianowicie klawiatury komputerowej. Przy tym wirtualna czy rozszerzona rzeczywistość (tak obecnie popularna i szturmem wchodząca do branży rozrywkowej czy produkcyjnej) wygląda jak zabawka.

Prostota jest w cenie

Jednym z kryteriów oceny efektywności systemu zarządzania danymi w firmie staje się łatwość jego obsługi. Pozytywne user experience jest priorytetem, a nie kaprysem rozpieszczonego użytkownika. Przetwarzając dane w firmie, mamy czuć się jak w samochodzie, który dowozi nas do celu nie tylko szybko i bezpiecznie, ale i komfortowo.

Komfort używania narzędzi technologicznych – jako wartość – jest owocem przemian, które dokonały się w naszym świecie w ciągu ostatnich kilkunastu lat. Błyskawicznie i komfortowo – oto dewiza współczesnego konsumenta. Teraz staje się dewizą menedżera. Między elektroniką użytkową – smartfonem, nawigacją samochodową, tabletem, a profesjonalnymi aplikacjami w miejscu pracy nie może być przepaści. W walce o dobrego pracownika zwyciężą te firmy, które zrozumieją, jak ważny jest dla niego komfort użytkowania systemów i urządzeń.

Świat wymusił na nas to, by zdemokratyzować proces obchodzenia się z narzędziami powstałymi w oparciu o wyrafinowaną myśl techniczną. Podsumowując: im prościej, tym lepiej. Kariera chmury, jako uniwersalnego modelu wymiany danych doprowadziła do popularności takich aplikacji, jak chociażby: Dropbox, Google Drive, czy WeTransfer. Skomplikowane procesy zarządzania projektami nabrały prostoty dzięki Asanie, czy Trello, a planowanie zadań i zarządzanie notatkami staje się dużo przyjemniejsze przy użyciu takich aplikacji jak Evernote. Wszystkie te narzędzia działają w zgodzie z podstawową zasadą: im prościej, tym lepiej i skuteczniej.

Każdy stworzy aplikację

Prostota rozwiązań może doprowadzić do interesujących scenariuszy. Niemal każdy z nas natyka się w sieci na reklamy stron czy aplikacji, które pomagają tworzyć nam – zwykłym użytkownikom – proste witryny internetowe. Nie trzeba wysiłku, by wyobrazić sytuację, w której – jako prywatni użytkownicy – będziemy mieli z czasem dostęp do dowolnych narzędzi, które umożliwią nam samodzielne, łatwe tworzenie aplikacji.

Współczesne startupy pracują nad rozwiązaniami, które pozwolą użytkownikom sieci oddzielać informacje prawdziwe od fałszywych. W przyszłości to my – samodzielnie i zaledwie z paru elementów – powinniśmy budować aplikacje, które pomogą nam w tym procesie. Urządzenia, które ułatwiać będą nam życie w biznesie lub pracy biurowej, w niedalekiej przyszłości nie będą owocem pracy informatyków.

Będziemy je tworzyć my, samodzielnie. Tworzenie biznesowych aplikacji może wkrótce przypominać zabawę klockami Lego, podczas której my określimy cel i sposób działania urządzenia. Może właśnie takie inteligentne zabawki dla profesjonalistów będą niezbędne do panowania nad rzeczywistością, która przytłacza nas coraz to nowymi treściami?

Targ informacji

Monetyzacja danych będzie postępować w coraz szybszym tempie. Komercjalizacja tego rynku zaczęła się w okolicach 2000 roku, czyli w chwili pojawienia się tzw. bańki internetowej. Wiele firm internetowych, po przeżyciu na własnej skórze kryzysu, zaczęło rozglądać się za nowymi źródłami dochodu. I tak powstał pomysł, by stworzyć zapotrzebowanie na nowych produkt: DANE.

Cały pomysł spodobał się w świecie marketingu, który tych danych mocno potrzebuje, by identyfikować zachowania i profil klienta. Dzisiaj potrzebują ich już wszyscy, dlatego firmy oferujące narzędzia, pozwalające na błyskawiczne porządkowanie i wyszukiwanie informacji, mają przed sobą ciekawą przyszłość. Kupowanie gotowych algorytmów przez wielki biznes stanie się być może modą. Jej konsekwencją mogą być narodziny nowych branż z obszaru technologii.

W tym kontekście trudno się nie zgodzić z opinią (cytowaną przez Economist) Hala Variana, ekonomisty pracującego dla Google, który twierdzi, że poprzez kosmiczne rozmnożenie danych, ich wartość – samych w sobie –nie będzie rosnąć, co zresztą z punktu widzenia klasycznej ekonomii jest logiczne. To, co będzie jednak zwiększać swoją wartość, to inteligencja dobrze zaprojektowanych algorytmów, które te dane będą filtrować, szeregować i porządkować.

Przyszłość rynku danych to przyszłość informacji pozyskiwanych z czujników umieszczanych w komunikacji miejskiej, miejscach publicznych – gdzie wszyscy będziemy zostawiali „ślady” naszej obecności, plus lawina informacji, którą zostawiamy w social media i w sklepach internetowych.

To na tych obszarach będzie dalej toczyć się gra pod tytułem BIG DATA. I to właśnie tym obszarom powinni się przyglądać producenci algorytmów, bo stamtąd będzie pochodzić najcenniejszy „surowiec” w postaci wiedzy o współczesnym kliencie. Czy algorytmy przyszłości będą w stanie „przerobić” strumienie danych z tych wszystkich, różnorodnych źródeł, tak by w rezultacie efekt tych operacji był interesujący dla korporacyjnych nabywców – czas pokaże.

Gdzie jest prywatność

Zapraszając do naszego świata Sztuczną Inteligencję, stwarzamy wiele miejsc pracy dla branży prawniczej. Szereg analiz wskazuje na to, że po 2022 roku inteligentne algorytmy będą odpowiadać aż za połowę sytuacji, w których doszło do naruszenia czy przekroczenia prawa. Możemy bez wątpienia spodziewać się batalii, w których stronami będą: właściciele platform społecznościowych, prawnicy, firmy ubezpieczeniowe i przeciętni obywatele. Dla każdej z tych grup prawo do ochrony danych i informacji jest i będzie zupełnie czymś innym. Inne jest postrzeganie prawa do prywatności.

Dane stały się towarem niezwykle wrażliwym i kontrowersyjnym. Jak wrażliwym – uświadamiają sobie to coraz bardziej regulatorzy, którzy zaczynają się coraz poważniej angażować w prace legislacyjne związane z kwestią obrotu danymi. W dobie rozpowszechniającej się Sztucznej Inteligencji jedną z głównych technik, na której bazują urządzenia jest „machine learning”, które stanowi rodzaj automatycznego systemu, który doskonali się pod wpływem nabywanego doświadczenia (np. im więcej zapytań w wyszukiwarce, tym lepsze kolejne odpowiedzi).

Zasadnym pytaniem staje się pytanie o to, czy algorytmy wykorzystujące tę technikę będą zdolne tak pracować, by nasze dane chronić przed niepożądanym wykorzystaniem. Z punktu widzenia technologii – wydaje się być to możliwe, natomiast czym innym staje się już punkt widzenia każdego biznesu, który ma interes w tym, by jak najwięcej danych przejmować i używać.

Demokratyzacja danych

Przez większą część ostatnich lat dane były „własnością” działów IT. Były co prawda wykorzystywane przez analityków biznesowych i menedżerów do podejmowania decyzji biznesowych, ale to IT było odpowiedzialne za zbieranie, przechowywanie i udostępnianie danych. Obecnie, gdy organizacje zostały wprost zalane danymi i gdy dane praktycznie stają się niezbędne do podejmowania jakichkolwiek decyzji, stało się oczywiste, że więcej użytkowników biznesowych musi mieć samodzielny dostęp do danych, bez IT jako strażnika.

Tu pojawiają się koncepcje demokratyzacji danych, czyli otwartych danych, dostępnych dla każdego. Każdy staje się twórcą jak i użytkownikiem danych. Taka formuła może wyrównać szanse w rywalizacji rynkowej oraz umożliwić tworzenie nowych modeli biznesowych. W mojej ocenie demokratyzacja danych może być istotną zmianą w organizacji, która wdroży je we właściwy sposób. Taki model danych i sposób ich traktowania może pozwolić użytkownikom szybko i łatwo generować modele biznesowe, czy tworzyć nowe zindywidualizowane produkty i usługi. Oczywiście ta formuła niesie też zagrożenia, jak chociażby te związane z bezpieczeństwem danych.

Blockchain na straży bezpieczeństwa

Potrzeba bezpieczeństwa danych jest dzisiaj kwestią oczywistą i wręcz banalną, zrozumiałą dla każdego z nas. Dane osobowe, jak i biznesowe stają się cennym łupem dla hakerów, czy nieuczciwej konkurencji. Tworzenie systemów o maksymalnym poziomie zabezpieczeń staje się poważnym wyzwaniem dla współczesnej branży technologicznej.

W poprzednich tekstach wykazywałem korzyści, jakie niesie technologia blockchain. Jej wartość, a właściwie jej bezpieczny charakter, wynika z tego, że jest ona zbudowana na zasadach kryptografii. Dlatego ma szanse sprostać naszym oczekiwaniom dotyczącym niezawodności narzędzi i systemów. Więcej o blockchain tutaj.

W wielkim skrócie, szacuje się, że do złamania blockchain potrzebna jest moc obliczeniowa równa połowie internetu. Niemniej wprowadzenie komputerów kwantowych będzie wymagało wdrożenia nowych zabezpieczeń kryptograficznych. Zasadą, która dzisiaj gwarantuje ciągle duże bezpieczeństwo tej technologii jest to, że każdy nowy blok tworzony w łańcuchu bazuje na danych z poprzedniego bloku (liczba kontrolna), a więc nie można podrobić danych w aktualnym bloku bez zmiany danych w poprzednim bloku, którego kopie są przechowywane w łańcuchu bloków w praktycznie każdym węźle sieci blockchain. Jest to niewykonalne. Każdy uczestnik procesu transakcyjnego może więc stwierdzić, czy dane są prawdziwie i niemodyfikowanie.

Beneficjentem technologii blockchain będzie każda instytucja gwarantująca klientowi czy firmie poufność i zabezpieczenie danych przed kradzieżą czy podrobieniem – np. szpital, bank, firma ubezpieczeniowa, czy agenda rządowa. Szacunkowe analizy wskazują, że istnieją szanse na to, by blockchain był w powszechnym użyciu do 2025 roku. Potencjalnym zagrożeniem mogą być komputery kwantowe i ich możliwości w łamaniu zabezpieczeń krypotograficznych. Ale to ciągle daleka przyszłość.

Ten świat nie ma końca

Analitycy, opisując przemiany dokonujące się na rynku danych i informacji, stworzyli pojęcie „efektu sieci danych”. Oddaje ono dobrze sytuację, w jakiej dzisiaj tkwimy. Korporacje produkują coraz to nowe zbiory danych, by przyciągnąć do siebie klientów. Ci zaś, używając urządzeń i narzędzi dostarczanych przez te korporacje, produkują samodzielnie jeszcze większe ilości danych. A to – biorąc pod uwagę istotę technologii „machine learning” i „deep learning” – powoduje ciągłe doskonalenie się inteligentnych urządzeń, programów i aplikacji, które uczestniczą w tym procesie.

Doskonalenie w tym przypadku oznacza większe umiejętności operowania zbiorami informacji. Dotarliśmy więc do momentu, w którym technologia nie zna granic, nie może się już zatrzymać, a rynek danych i informacji będzie rósł w astronomicznym tempie. Czy wobec tego stwierdzenie, że „wszystko jest dzisiaj informacją” jest przesadą? Myślę, że właśnie w dzisiejszych czasach sformułowanie to ukazuje swoją wyjątkową trafność.

Dane mają nasze oczy

Przełom, jaki dokonuje się dzisiaj w świecie danych, oznacza ich mocną personalizację. Współczesne zbiory danych mają dużo bardziej ludzki charakter. Przestały być ciągiem znaków, kodem zrozumiałym jedynie dla informatyka. Dziś to nasze twarze na zdjęciach – rozpoznawane już przez komputery, nasz głos, którego używamy do uruchamiania aplikacji.

To także informacje zapisywane na pokładzie samochodowego komputera, odwiedzane przez nas strony w internecie. Wszystko to, w połączeniu z danymi o naszych zarobkach, miejscu zamieszkania czy płci tworzy informacyjny wszechświat, którego jesteśmy centralną częścią. O niego teraz toczy się walka. O korzyści, które można z niego wydobyć. Ten właśnie wszechświat stał się miejscem wielkiego spotkania ludzi z maszynami, a wiele wskazuje na to, że będzie ono miało charakter niekończącej się przygody, gdzie tylko niektóre scenariusze są dzisiaj wyobrażalne.

Powiązane artykuły

– Kto zyska a kto straci na rewolucji cyfrowej?

– Sztuczna inteligencja to nowa elektryczność

– Roboty czekają na sędziów

– Tylko Bóg potrafi policzyć równie szybko, czyli świat komputerów kwantowych

– Machine Learning. Komputery nie są już niemowlętami

Skomentuj

8 comments

  1. CzarekZ23

    Nie tylko ciagi zer i jedynek. Teraz danymi są nagrania video, dźwięki, obrazy – wszystko. Mamy juz technologie ktora pozwala je katalogowac i oceniac, a potem wyciagac z nich wnioski

  2. Oskar 111

    Uczenie maszynowe i praca z bazującymi na nim narzędziami wymaga nabycia doświadczenia i wiedzy: nie można ślepo wierzyć we wszystkie raporty czy rekomendacje. Często jest tak, że dostarczane wnioski są w pewnym stopniu błędne lub niepełne. Z tego powodu, jeśli firma nie może sobie pozwolić na błąd, ML okazuje się niewłaściwym narzędziem do wykonywania niektórych zadań.