Technologie Big data a przemysł i ośrodki Big Science

Ośrodki Big Science, np. CERN, ESA czy ITER generują, przetwarzają i przechowują ogromne ilości danych, które z jednej strony  są kluczowym elementem prowadzonych przez nie badań, a z drugiej strony głównym efektem takiego procesu.  Zgromadzona w ten sposób wiedza  jest lub powinna być źródłem korzyści dla gospodarki i społeczeństw UE.

 

Big Data z kosmosu na Ziemię

Europejska Agencja Kosmiczna, w ramach prowadzonych przez siebie działań gromadzi ogromną ilość danych, które można wykorzystać do poprawy jakości życia na naszej planecie. Zasobów tych można używać do celów naukowych i komercyjnych m.in. w ramach programu Copernicus, który gromadzi i udostępnia dane i informacje zebrane przez satelity, oraz ogólnoświatową sieć lądowych, powietrznych i morskich czujników.

 

Dane z CERN jako źródło innowacji

Eksperymenty prowadzone przy użyciu LHC, w CERN, rocznie powodują powstanie ponad 90 petabajtów, czyli 94 371 827 gigabajtów, danych.

Zarządzanie dużą ilością danych wymusiło opracowanie zaawansowanych programów używanych dziś m.in. w przemyśle, sektorze bankowym i medycznym. Bezpośrednim efektem pracy z dużą ilością informacji było stworzenie rozwiązań pozwalających na stabilne przechowywanie i przepływy danych, wiele tego typu rozwiązań jest dziś dostępnych dla firm za pośrednictwem CERN Knowledge Transfer Group. Wśród  najważniejszych baz danych, z których usług można korzystać w ramach  CERN KTG można  wymienić np.:

  • QF-Lib – bibliotekę Pythona, która zapewnia wysokiej jakości narzędzia do matematyki finansowej,
  • CERN VM-FS – internetowy, globalny system plików zoptymalizowany pod kątem dystrybucji oprogramowania,
  • C2MON – modułowa platforma Java do szybkiego budowania, wysoce dostępnych, wielkoskalowych przemysłowych rozwiązań monitorowania i kontroli.
  • ROOT – framework, który zapewnia narzędzia do obsługi i analizy dużych ilości danych w niezwykle wydajny sposób.