O autorze
Interesuje mnie tematyka z pogranicza biznesu, nauki, technologii i kultury.

Po ukończeniu studiów z zarządzania na Uniwersytecie Warszawskim przeniosłem się do Science and Technology Research Unit (SPRU), gdzie pracowałem m. in. nad analizą procesów dyfuzji innowacji oraz badaniem trendów technologiczno-ekonomicznych. Obecnie pracuję w londyńskim centrum nowych technologii zajmującym się przyszłością miast.

W wolnej chwili pomagam przy organizacji TEDxWarsaw, a także twittuje na @lukaszalwast. Jestem rownież na linkedin.

Big data – Duża wiedza, Duży problem, a może Wielka wiara?

Powszechnie przyjmuje się, że Big Data to zbiory danych tak duże, że trudno je analizować przy pomocy ogólnie dostępnych mocy obliczeniowych i narzędzi. Wokół tego terminu narasta coraz więcej nadziei, wyobrażeń i mitów, ale spora uwaga poświecana temu zjawisku nie jest przypadkowa.

Co roku w lutym w Santa Clara odbywa się popularna konferencja technologiczna Strata. Jej tegorocznym tematem przewodnim było hasło Making Data Work, a tytuły wystąpień: Big Data. in a Really Big World, Big Data vs. The Beltway, Big Data on small devices, Getting Big Benefits from Big Data, Video Games: The Biggest Big Data Challenge, czy Building Scalable Big Data Infrastructure jednoznacznie sugerują co wzbudzało najwięcej emocji.



W tym gronie moją szczególną uwagę zwróciło wystąpienie Kate Crawford z zespołu Microsoft Research i MIT Center for Civic Media. Rok temu Crawford wraz z danną boyd z Centrum Berkmana na Harvardzie podjeły się skonstruowania możliwie rzetelnej definicji terminu Big Data.



W opinii obu badaczek Big Data to zjawisko kulturowe, technologiczne i naukowe opierające się na fundamentach technologii, analizy i „mitologii”. Aspekt technologiczny Big Data zakłada systematyczne zwiększanie potencjału przetwarzania danych oraz rzetelności wykorzystywanych algorytmów do zbierania, analizowania, łączenia i porównywania olbrzymich zbiorów danych. Aspekt analityczny to sama umiejętność pracy z bardzo dużymi zbiorami po to, aby móc zidentyfikować wzorce i przełożyć je na odpowiedni kontekst ekonomiczny, społeczny bądź techniczny. Aspekt „mitologiczny” to z kolei szeroko rozpowszechniona wiara w to, że duże zbiory danych są „wyższą formą inteligencji” pozwalającą na generowanie spostrzeżeń i obserwacji wcześniej niedostępnych - w aurze większej prawdy, obiektywizmu i rzetelności.

Kilka tygodni temu trafiłem na blog opisujący potencjalne możliwości wykorzystania Big Data na potrzeby lepszego zrozumienia działań różnych polityk innowacyjnych (ang. innovation policy). Artykuł opisywał cztery - moim zdaniem - ciekawe projekty dotyczące możliwości połączenia Big Data z innovation policy.

Pierwszy projekt dotyczył mapowania innowacyjności i wzrostu gospodarczego w czasie rzeczywistym na bazie firm z brytyjskiego klastra grafenowego. Drugi, wykorzystania informacji z profesjonalnych serwisów społecznościowych takich jak np. GitHub czy StackOverflow do wczesnego rozpoznawania projektów wykazujących się „cechami innowacyjności”. Trzeci, zastosowaniem bardzo dużych zbiorów danych (o setkach tysięcy przedsiębiorstw) z branży kreatywnej do rozpoznania czynników stojących za ich „innowacyjnością i sukcesem rozwojowym”. A ostatni, czwarty projekt, miałby być lokalną wersją amerykańskiej metodologii rozpoznawania i mapowania popytu na zatrudnienie w obszarach aktywnych technologicznie.

Mając na uwadze przedstawioną powyżej definicję od Crawford i boyd oraz wspólne zainteresowanie tą tematyką, link do artykułu przesłałem jednemu z moich byłych wykładowców. Jego reakcja była jednoznaczna - “ktoś sobie chyba żarty stroi twierdząc, że Big Data to jest coś nowego, a w dodatku jeszcze lansuje jako przełomowe metody badawcze znane od lat m. in. w ekonomii, naukach o zarządzaniu czy socjologii”.

Rzeczywiście, jeśli popatrzeć na projekty przeprowadzane już w przeszłości, np. wielką analizę cytowań patentów USPTO, przekrojowe analizy dyskusji na portalach programistów, wykorzystywanie modeli sieci społecznych na potrzeby firm biotechnologicznych czy badanie naukowców pracujących nad zagadnieniami naukowymi, to trudno się z tymi zastrzeżeniami nie zgodzić. I to między innymi z tego powodu dla wielu osób termin Big Data zdaje się być idealnym kandydatem do czegoś, co od lat jest powszechnie nazywane w naukach o zarządzaniu management fashions (z ang.).

Co by jednak nie mówić – moda, nie moda – Big Data przyciąga uwagę i idą za tym często nie małe pieniądze.


W samej Wielkiej Brytanii badania nad Big Data zostały uznane jako jeden z ośmiu strategicznych kierunków rozwoju brytyjskiego sektora nowych technologii - obok m.in. przemysłu kosmicznego, systemów autonomicznych, biologii syntetycznej, medycyny regeneratywnej, agro-technologii, nowych materiałów i alternatywnych źródeł energii. Jednym z następstw tej decyzji było zresztą niedawne przeznaczenie 64 milionów funtów na projekty badawcze z pogranicza nauk społecznych i inżynierii dotyczące właśnie Big Data, w tym m. in. na lepsze zarządzanie wielkimi bazami i sieciami danych, wykorzystywaniem tych danych do lepszego zrozumienia charakterystyki zachowań bardzo dużych populacji ludzkich oraz zapewnienie bezpiecznego środowiska dla przechowywania tych danych.

Jaki będzie rezultat tych badań, a także co dokładnie te i podobne projekty będą mogły dla nas oznaczać w życiu codziennym będziemy prawdopodobnie mieli szansę dowiedzieć się na przestrzeni najbliższych kilkudziesięciu miesięcy.

Na polskim podwórku do rychłego, szerszego wykorzystania Big Data w nie-naukowym kontekście podchodziłbym raczej sceptycznie. Na poziomie ogólnym praca nad zagadnieniami odpowiednimi dla Big Data wymaga przede wszystkim wysokiej kultury pracy z oraz na danych - zarówno w instytucjach publicznych jak i w firmach. Mamy co prawda kilka dobrych ośrodków naukowych i firm posiadających wystarczające kompetencje (np. Interdyscplinarne Centrum Modelowania Matematycznego na UW) ale one zajmują się już podobnymi analizami - bez specjalnego nagłaśniania - od lat. Generalnie, aby powstało środowisko sprzyjające rozwojowi projektów typu Big Data potrzebny jest ekosystem umożliwiający dostęp do dobrej jakości materiałów źródłowych oraz przedewszystkim, dobra wola aby takie dane wspólnie opracowywać...

A Wy jakiego typu projekty Big Data chcielibyście widzieć w Polsce?

- Łukasz Alwast
Trwa ładowanie komentarzy...