Description:
|
The article contains results of a study of social media data (SMD) which, being distinct from conventional data by their origin, require special methods for collection, processing and analysis. As shown by a literature review, in spite of great many research publications devoted to social media research and big data analysis, the SMD potential as a big data component still remains inadequately explored. Two approaches to research and analysis of SMD were highlighted in course of the study, in which SMD are addressed as an object of Internet statistics and an object of big data. When SMD are explored as an object of Internet statistics, collection of anonymized data is performed using the services that have network protocols for collection and analysis of data on social media customers using statistical methods. When SMD are explored as an object of big data, the collection is performed mostly by artifi cial intellect, whereas the storage and processing is operated by databases designed for large scopes of data and software with statistical data processing applications. The social media most popular with users in 2020 were identifi ed in the study. Statistical indicators for assessment of users’ feedback, available now for statistical assessments of social media communities, are given. The study revealed several problems which solutions would require, apart from a multifaceted and complex approach to collection and processing, highly competent teams of specialists in various subject fi elds, including experts in computations, experts in machine learning and statisticians. У статті розглядаються дані соціальних медіа (ДСМ), які за походженням відрізняються від традиційних даних і тому потребують особливих методів збирання, оброблення та аналізу. Визначено, що незважаючи на велику кількість наукових публікацій, які присвячені питанням вивчення соціальних медіа і аналітики великих даних, потенціал ДСМ як складової великих даних усе ще залишається недосконало дослідженим. У ході дослідження виокремлено два підходи до вивчення та аналізу ДСМ, згідно з якими ДСМ розглядаються як об’єкт Інтернет-статистики і як об’єкт великих даних. При дослідженні ДСМ як об’єкта Інтернет-статистики збирання знеособлених даних здійснюється за допомогою сервісів, які мають мережеві протоколи для збирання і аналізу даних про відвідувачів соціальних медіа з використанням статистичних методів. Якщо ДСМ досліджуються як об’єкт великих даних, збирання здійснюється переважно за допомогою штучного інтелекту, а для зберігання та оброблення використовуються бази даних, розраховані на великі обсяги даних, і програми статистичного оброблення даних. В рамках дослідження визначено найпопулярніші соціальні медіа серед користувачів у 2020 р. Наведено статистичні показники для оцінювання зворотного зв’язку з аудиторією, які наразі доступні для статистичного оцінювання спільнот у соціальних медіа. Виявлено низку проблем, які, як і у випадку з великими даними, вимагають окрім багатоаспектного та комплексного підходу до збирання та оброблення ще й висококваліфікованих команд фахівців з різних предметних галузей, зокрема експертів з обчислень, експертів з машинного навчання, статистиків. |