DSpace

Інституційний репозитарій Державного вищого навчального закладу "Національної Академії Статистики, Обліку та Аудиту"

 en uk 
 


Періодичні видання НАСОА >
Статистика України >
2020 >
№4 >

Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://194.44.12.92:8080/jspui/handle/123456789/5506

Назва: Програмна реалізація відновлення пропущених даних: порівняльний аналіз
Автори: Ковтун, Н. В.
Фаталієва, А.-Н. Я.
Ключові слова: пропущені дані
типи пропусків
засоби імпутації даних
SPSS Statistics
Statistica
програмне середовище R
SAS
Дата публікації: 2021
Видавець: Національна академія статистики, обліку та аудиту
Короткий огляд (реферат): Ковтун Н. В., Фаталієва А.-Н. Я. Програмна реалізація відновлення пропущених даних: порівняльний аналіз. Статистика України. 2020. № 4. С. 12–20. Doi: 10.31767/su.4(91)2020.04.02.
Опис: Проведено порівняльний аналіз можливостей застосування різних програмних продуктів для вирішення проблеми відновлення даних на прикладі вибірки, для якої симульовані різні варіанти пропусків даних. Дослідження дало змогу виявити слабкі та сильні сторони розглянутих програмних продуктів, а також визначити ефективність застосування того чи іншого методу за різних обсягів пропущеної інформації. Найпростішим інструментом відновлення пропусків визначено пакет прикладних програм Statistica, який пропонує користувачу лише прості методи обробки пропущених даних. Ця програма допоможе впоратися з пропущеними даними при незначному обсязі пропусків (до 10%). SPSS пропонує ширший спектр методів відновлення даних порівняно зі Statistica, водночас має зрозуміліший інтерфейс для користувача проти мов програмування R чи SAS. В останніх зазначених програмних середовищах можна використовувати різні методи відновлення даних від найпростіших до найскладніших, таких як, наприклад, множинна імпутація. Отже, R та SAS є найпотужнішими програмами з відновлення даних, проте і складнішими для користувачів, оскільки потребують знання мови програмування. Встановлено, що жодне з розглянутих програмно-аналітичних середовищ не має вбудованих процедур обробки категоріальних даних. У програмних середовищах R та SAS є певні підходи, які можна реалізувати за аналогією для упорядкованих категорій, проте це не покриває всі потреби аналізу досліджень, реалізованих у вигляді опитувань і результати яких здебільшого представлені як відповіді на запитання. Методи, які застосовуються для відновлення кількісних даних, не можуть бути поширені на категоріальні, навіть якщо для кодування відповідей використані цифри. Дослідження безперечно довело той факт, що до відновлення даних у різних програмних середовищах, так само, як і до вибору можливих способів застосування тих чи інших способів імпутації у різних середовищах, слід підходити дуже обережно. У кожному конкретному випадку проблема імпутації має вирішуватися на основі ретельного аналізу існуючої бази даних з урахуванням не тільки особливостей самих даних і обсягу пропусків, а й специфіки конкретного дослідження. Робота з пропущеними даними охоплює широкий спектр проблем, серед яких вивчення природи пропусків, вибір методології обробки й відновлення даних залежно від їхньої природи та від типу, а також використання різних програмних засобів відновлення даних. У подальшому планується оцінити ефективність відновлювальної здатності методів, реалізованих у різних пакетах прикладних програм, а також розробити методологічні засади відновлення пропусків для категоріальних даних та реалізувати їх на практиці.
URI (Уніфікований ідентифікатор ресурсу): http://194.44.12.92:8080/jspui/handle/123456789/5506
Розташовується у зібраннях:№4

Файли цього матеріалу:

Файл Опис РозмірФормат
SU_2021_4_17.03-12-20.pdf330,01 kBAdobe PDFПереглянути/Відкрити
Перегляд статистики

Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

 

Valid XHTML 1.0! Програмне забезпечення DSpace Авторські права © 2002-2005 Массачусетський технологічний інститут та Х’юлет Пакард - Зворотній зв’язок