Abstract:
|
Дається короткий огляд труднощів, пов'язаних з Big Data, технологій та підходів для подолання труднощів отримання значимої інформації з Big Data. Дійсно, створення та підтримка сховищ об'ємом в терабайт, петабайт і більше стало можливим завдяки технологіям розподілених файлових систем. У розподілених системах, замість зберігання даних в одній файловій системі, дані зберігаються і індексуються на декількох (і навіть тисячах) жорстких дисках і серверах. Створюється також «карта» (map), де міститься інформація про те, де саме знаходяться ті чи інші дані. З точки зору реалізації, аналітична платформа для роботи з Big Data повинна вміти використовувати нові технології map-reduce. |