Big Data - czym jest i w jaki sposób funkcjonuje?

Big Data to wyrażenie, które staje się coraz bardziej popularne na całym świecie. Wykorzystują je w swojej pracy głównie analitycy, ale budzi zainteresowanie również ze strony zwykłych ludzi. Dzieje się tak, ponieważ jako narzędzie pracy stanowi źródło szeregu przydatnych danych i informacji, zaś w społeczeństwie powoduje niechęć i obawy przed nadmierną inwigilacją ze strony korporacji z niej korzystających. 

Big Data - co to jest?

Mianem Big Data określa się tendencję do szukania, pobierania, gromadzenia i przetwarzania dostępnych danych. Jest to metoda legalnego gromadzenia informacji z przeróżnych źródeł, a następnie ich analizowania i wykorzystywania do własnych celów. W rezultacie tworzony jest profil konsumenta, który później wykorzystuje się w celu np. zwiększenia sprzedaży. Najważniejsze w Big Data jest zatem przetwarzanie informacji i wykorzystywanie w praktyce wniosków z nich płynących, a nie samo gromadzenie danych.

Warto jeszcze raz zaznaczyć, że dane, które gromadzą i przetwarzają analitycy są pozyskiwane w sposób zgodny z prawem. Najczęściej są powiązanie z usługami, z których już i tak się korzysta. Zatem przykładowo:

  • banki gromadzą dane, które wynikają z ruchów na kontach użytkowników, np. dokonanych płatności, ich wielkości i rodzaju kupowanych przedmiotów,
  • firmy wypuszczają własne aplikacje, które są pobierane przez użytkowników na smartfony lub tablety. Instalując produkt na urządzeniu najczęściej automatycznie wyraża się zgodę na dostęp aplikacji do własnych danych,
  • właściciele portali internetowych, poprzez świadczone usługi również mogą gromadzić takie dane. Najczęściej zgoda na taką czynność znajduje się w regulaminie.

Interesującym źródłem danych są ponadto media społecznościowe. Pozyskane z nich Informacje charakteryzują się znaczną trudnością w analizie, ponieważ nie zawierają wartości liczbowych, które łatwo ze sobą porównać. Jednak można je analizować pod względem obecności i zawartości słów kluczowych, pojawiania się i częstotliwości wpisów użytkowników oraz czasu ich reakcji na posty zamieszczane przez inne osoby. 

Ilość gromadzonych danych jest ogromna i powiększa się z każdą kolejną akcją wykonaną przez użytkowników. Część z nich może okazać się mniej wartościowa. Zatem kolejnym etapem prac analityków jest prawidłowe posegregowanie informacji, aby móc w pełni je wykorzystać. Najskuteczniejszym sposobem jest wybór najważniejszych z nich i wykorzystanie znanych i dostępnych narzędzi analitycznych. Ponieważ zapytania muszą być wykonywane szybko, wszystkie analizy wykonuje się równolegle. Najważniejszym algorytmem wykorzystywanym do tego celu jest MapReduce. Zastosowanie tego narzędzia umożliwia rozproszenie wprowadzonych zbiorów danych między wiele serwerów, które porządkują je i wybierają właściwe elementy i rekordy zgodnie z regułami zapytania. Uzyskane w ten sposób wyniki gromadzi się i przetwarza do postaci wynikowej. Efektem końcowym jest mniejsza ilość danych, ponieważ zostały one wcześniej odpowiednio pogrupowane oraz poddane procesowi niezbędnej redukcji. Istnieją również inne narzędzia, które z powodzeniem mogą być wykorzystywane przez analityków. Wybór najwłaściwszego zależy od preferencji użytkownika i oczekiwanych przez niego rezultatów.

Big Data - wykorzystanie

Biga Data ma ogromny potencjał do kreowania zachowań konsumentów. Na podstawie zgromadzonych danych można stworzyć i dokładnie sprecyzować profil ich potrzeb i skutecznie podsuwać im idealne (z punktu widzenia sprzedającego) rozwiązania. Takie długofalowe działania mają szansę przyczynić się do powstania na rynku przewagi konkurencyjnej na rzecz przedsiębiorstwa, które zdecydowało się na użycie narzędzi Big Data.

Big Data budzi pewne wątpliwości sygnalizowane przez społeczeństwo. Wiążą się one szczególnie z obawą przed nadmierną ingerencją analityków w ich życie prywatne oraz celowym wprowadzaniem w błąd dla osiągnięcia własnych celów sprzedażowych. Granica jest delikatna i tak naprawdę, tylko od przedsiębiorstw zależy, jak daleko się posuną, aby zrealizować własne plany. Nad prawidłowością ich działań czuwa Unia Europejska, która coraz intensywniej zajmuje się zagadnieniem ochrony danych osobowych oraz Generalny Inspektorat Ochrony Danych Osobowych.

Big Data może być wykorzystywana w sposób korzystny zarówno dla konsumenta, jak i przedsiębiorstwa. Przykładowo na podstawie zgromadzonych informacji bank jest w stanie zaproponować kobiecie w ciąży odnawialny kredyt na koncie, aby mogła pozwolić sobie na dodatkowe wydatki. Zaś firma ubezpieczeniowa, po skrupulatnej analizie wpisów na facebookowym profilu klienta zamiłowanego w sportach ekstremalnych, może zaproponować mu dodatkowy pakiet świadczeń.

Big Data jest narzędziem, które pomaga organizacjom lepiej poznać własne otoczenie i konsumentów, którzy korzystają z ich produktów czy usług. Zatem tylko od wykwalifikowanej i świadomej kadry zależy, czy przedsiębiorstwom uda się wykorzystać zgromadzone dane w sposób etyczny i niewyrządzający szkód aktualnym i przyszłym użytkownikom.