Генеральна сукупність та вибіркове дослідження. Статистична достовірність. Як правильно розрахувати обсяг вибірки? Результати вибірки представлені

Один із головних компонентів ретельно продуманого дослідження – визначення вибірки та що таке репрезентативна вибірка. Це як у прикладі з тортом. Не обов'язково ж з'їдати весь десерт, щоб зрозуміти його смак? Досить невеликої частини.

Так ось, торт – це Генеральна сукупність (Тобто всі респонденти, які підходять для опитування). Вона може бути виражена територіально, наприклад, лише жителі Московської області. Гендерно – лише жінки. Або мати обмеження за віком – росіяни віком від 65 років.

Вирахувати генеральну сукупність складно: потрібно мати дані перепису населення чи попередніх оціночних опитувань. Тому зазвичай генеральну сукупність «прикидають», та якщо з отриманого числа вираховують вибіркову сукупністьабо вибірку.

Що таке репрезентативна вибірка?

Вибірка- Це чітко визначена кількість респондентів. Її структура має максимально збігатися зі структурою генеральної сукупності за основними характеристиками відбору.

Наприклад, якщо потенційні респонденти – все населення Росії, де 54% — це жінки, а 46% — чоловіки, то вибірка повинна містити таке саме відсоткове співвідношення. Якщо збіг параметрів відбувається, вибірку можна назвати репрезентативною. Це означає, що неточності та помилки у дослідженні зводяться до мінімуму.

Обсяг вибірки визначається з урахуванням вимог точності та економічності. Ці вимоги обернено пропорційні одна одній: що більше обсяг вибірки, то точніше результат. У цьому що вища точність, тим більше витрат необхідно проведення дослідження. І навпаки, що менше вибірка, то менше на неї витрат, тим менш точно і більш випадково відтворюються властивості генеральної сукупності.

Тому для обчислення обсягу вибору соціологами було винайдено формулу та створено спеціальний калькулятор:

Довірча ймовірністьі довірча похибка

Що означають терміни « довірча ймовірність» та « довірча похибка»? Довірча ймовірність – це показник точності вимірів. А довірча похибка – це можлива помилкарезультатів дослідження. Наприклад, при генеральній сукупності понад 500 00 осіб (припустимо, що проживають у Новокузнецьку) вибірка дорівнюватиме 384 особи за довірчої ймовірності 95% і похибки 5% АБО (при довірчому інтервалі 95±5%).

Що з цього випливає? При проведенні 100 досліджень з такою вибіркою (384 особи) у 95 відсотків випадків відповіді, що одержуються, за законами статистики будуть знаходитися в межах ±5% від вихідного. І ми отримаємо репрезентативну вибірку із мінімальною ймовірністю статистичної помилки.

Після того, як підрахунок обсягу вибірки виконано, можна подивитися чи є достатня кількість респондентів у демо-версії Панелі Анкетолога. А як провести панельний опитування можна докладніше дізнатися.

Часто буває так, що необхідно проаналізувати якесь конкретне соціальне явище та отримати інформацію про нього. Такі завдання часто виникають у ста...

Вибірка - це... Визначення, види, методи та результати вибірки

Від Masterweb

09.04.2018 16:00

Часто буває так, що необхідно проаналізувати якесь конкретне соціальне явище та отримати інформацію про нього. Такі завдання часто виникають у статистиці та при статистичних дослідженнях. Перевірити певне соціальне явище найчастіше буває неможливим. Наприклад, як дізнатися думку населення чи всіх мешканців певного міста з якогось питання? Запитувати всіх – справа практично неможлива і дуже трудомістка. У таких випадках нам і потрібна вибірка. Це саме те поняття, на якому ґрунтуються практично всі дослідження та аналізи.

Що таке вибірка

Під час аналізу конкретного соціального явища необхідно отримати інформацію про нього. Якщо взяти будь-яке дослідження, можна помітити, що дослідженню та аналізу підлягає не кожна одиниця сукупності об'єкта дослідження. До уваги береться лише певна частина всієї цієї сукупності. Ось цей процес і є вибіркою: коли досліджуються лише певні одиниці з множини.

Звичайно ж, багато залежить від виду вибірки. Але й основні правила. Головне з них свідчить, що відбір із сукупності має бути абсолютно випадковим. Одиниці сукупності, які будуть використані, не повинні бути обрані за будь-яким критерієм. Грубо кажучи, якщо необхідно набрати сукупність із населення певного міста та відібрати лише чоловіків, то у дослідженні буде помилка, тому що відбір було проведено не випадково, а відібрано за ґендерною ознакою. Практично всі методи вибірки ґрунтуються на цьому правилі.

Правила вибірки

Для того, щоб відібрана сукупність відображала основні якості всього явища, вона повинна бути побудована за конкретними законами, де основну увагу необхідно приділяти таким категоріям:

  • вибірка (вибіркова сукупність);
  • Генеральна сукупність;
  • репрезентативність;
  • помилка репрезентативності;
  • одиниця сукупності;
  • методи побудови вибірки.

Особливості вибіркового спостереження та складання вибірки полягають у наступному:

  1. Всі отримані результати засновані на математичних законах та правилах, тобто при правильному проведенні дослідження та при правильних розрахункахрезультати не будуть спотворені за суб'єктивною ознакою
  2. Дає можливість значно швидше і з меншими витратами часу та ресурсів отримати результат, вивчаючи не весь масив подій, а лише їхню частину.
  3. Може бути застосовано для вивчення різних об'єктів: від конкретних питань, наприклад, вік, стать цікавої для нас групи, до вивчення громадської думки або рівня матеріального забезпечення населення.

Вибіркове спостереження

Вибіркове - це таке статистичне спостереження, у якому дослідженню піддається не вся сукупність досліджуваного, лише деяка, відібрана певним чином її частина, а отримані результати вивчення цієї частини поширюються протягом усього сукупність. Ця частина називається вибірковою сукупністю. Це єдиний спосіб вивчення великого масиву об'єкта дослідження.

Але вибіркове спостереження можна використовувати лише у випадках, коли необхідно досліджувати лише малу групу одиниць. Наприклад, при дослідженні співвідношення чоловіків до жінок у світі використовуватиметься вибіркове спостереження. Зі зрозумілих причин – взяти до уваги кожного жителя нашої планети неможливо.

А ось при такому ж дослідженні, але не всіх мешканців землі, а певного 2 «А» класу в конкретній школі, певного міста, певної країни може обійтися без вибіркового спостереження. Адже проаналізувати весь масив об'єкта дослідження цілком можливо. Необхідно порахувати хлопчиків та дівчаток цього класу – от і буде співвідношення.


Вибіркова та генеральна сукупність

Насправді, все не так складно, як звучить. У будь-якому об'єкті вивчення є дві системи: генеральна та вибіркова сукупність. Що це таке? Усі одиниці відносяться до генеральної. А до вибіркової – ті одиниці загальної сукупності, взяті для вибірки. Якщо все правильно зроблено, то відібрана частина складатиме зменшений макет усієї (генеральної) сукупності.

Якщо говорити про генеральну сукупність, то можна виділити всього два її різновиди: певна та невизначена генеральна сукупність. Залежить від того, чи відома загальна кількість одиниць даної системи чи ні. Якщо це певна генеральна сукупність, то вибірку робитиме легше через те, що відомо, який відсоток від загальної кількості одиниць складатиме вибірка.

Цей момент дуже потрібний у дослідженнях. Наприклад, якщо необхідно досліджувати відсоток недоброякісної продукції кондитерських виробів конкретному заводі. Припустимо, що генеральну сукупність вже визначено. Достеменно відомо, що на рік це підприємство виробляє 1000 кондитерських виробів. Якщо зробити вибірку 100 випадкових кондитерських виробів із цієї тисячі та відправити їх на експертизу, то похибка буде мінімальною. Грубо кажучи, дослідженню підлягало 10% всієї продукції, і за результатами можемо, взявши до уваги помилку репрезентативності, говорити про недоброякісність усієї продукції.

А якщо провести вибірку 100 кондитерських виробів із невизначеної генеральної сукупності, де їх насправді було, припустимо, 1 млн одиниць, то результат вибірки та самого дослідження буде критично неправдоподібним та неточним. Відчуваєте різницю? Тому визначеність генеральної сукупності здебільшого є вкрай важливою і дуже сильно впливає на результат дослідження.


Репрезентативність сукупності

Отже, тепер одне з найголовніших питань – якою має бути вибірка? Це найголовніший момент дослідження. На цьому етапі необхідно розрахувати вибірку та відібрати одиниці із загального числа до неї. Сукупність була відібрана правильно, якщо певні особливості та характеристики генеральної сукупності залишається і у вибірковій. Це називається репрезентативністю.

Іншими словами, якщо після відбору частина зберігає ті ж самі тенденції та особливості, що і вся кількість досліджуваного, то така сукупність називається репрезентативною. Не кожна певна вибірка може бути відібрано з репрезентативної сукупності. Бувають і такі об'єкти дослідження, вибірка яких просто не може бути репрезентативною. Звідси і виникає поняття помилки репрезентативності. Але про це поговоримо трохи більше.

Як зробити вибірку

Отже, щоб репрезентативність була максимальною, виділяють три основні правила вибірки:

  1. Найунікальнішим показником числа вибірки вважається 20%. Статистична вибірка в 20% практично завжди даватиме результат максимально наближений до дійсності. У той самий час немає необхідності переносити у зібрану більшу частину генеральної сукупності. 20% вибірки – це показник, який вироблений багатьма дослідженнями. Наведемо ще трохи теорії. Чим більша вибірка, тим менша помилка репрезентативності та точніше результат дослідження. Чим ближче буде вибіркова сукупність до генеральної за кількістю одиниць, тим точнішими та правильнішими будуть результати. Адже якщо дослідити всю систему, то результат буде 100%. Але тут уже немає вибірки. Це ті дослідження, в яких досліджується весь масив, усі одиниці, тому нас це не цікавить.
  2. У разі недоцільності обробки 20 % генеральної сукупності допускається вивчення одиниць сукупності у кількості не менше 1001. Це також один із показників дослідження масиву об'єкта дослідження, що виробився з часом. Звичайно, він не дасть точних результатів при великих масивах дослідження, але максимально наблизить до можливої ​​точності вибірки.
  3. У статистиці існує безліч формул та зведених таблиць. Залежно від об'єкта дослідження та від критерію вибірки, існує доцільність вибору тієї чи іншої формули. Але цей пункт використовується у складних та багатоетапних дослідженнях.

Похибка (помилка) репрезентативності

Головною характеристикою якості обраної вибірки є поняття «похибки репрезентативності». Що це таке? Це певні розбіжності між показниками вибіркового та суцільного спостереження. За показниками похибки репрезентативність ділять на надійну, звичайну та наближену. Інакше висловлюючись, допустимими є відхилення у вигляді 3 %, від 3 до 10 % і від 10 до 20 % відповідно. Хоча у статистиці бажано, щоб похибка не перевищувала 5-6%. В іншому випадку є привід говорити про недостатню репрезентативність вибірки. Для обчислення похибки репрезентативності та того, як вона впливає на вибіркову чи генеральну сукупність, до уваги беруться багато факторів:

  1. Імовірність, з якою потрібно отримати точний результат.
  2. Кількості одиниць вибіркової сукупності. Як згадувалося раніше, що менше одиниць складе вибірка, то більше вписуватиметься помилка репрезентативності, і навпаки.
  3. Однорідність досліджуваної сукупності. Чим більш різнорідною є сукупність, тим більшою буде похибка репрезентативності. Можливість сукупності бути репрезентативною залежить від однорідності її складових одиниць.
  4. Спосіб відбору одиниць у вибіркову сукупність.

У конкретно заданих дослідженнях відсоток похибки середнього значення зазвичай задається самим дослідником виходячи з програми спостереження і за даними раніше проведених досліджень. Як правило, вважається припустимою гранична помилка вибірки (помилка репрезентативності) у межах 3-5%.


Більше – не завжди краще

Також варто пам'ятати, що головне при організації вибіркового спостереження – це доведення його обсягу до мінімуму. При цьому не слід прагнути надмірного зменшення меж похибки вибірки, оскільки це може призвести до невиправданого збільшення обсягу даних вибірки і, отже, підвищення витрат на проведення вибіркового спостереження.

У той самий час не можна надмірно збільшувати розмір похибки репрезентативності. Адже в цьому випадку, хоч і станеться зменшення обсягу вибіркової сукупності, це призведе до погіршення достовірності отриманих результатів.

Які питання зазвичай ставиться перед дослідником

Будь-яке дослідження якщо і проводиться, то для якоїсь мети та для отримання якихось результатів. Під час проведення вибіркового дослідження, зазвичай, ставляться початкові питання:

  1. Визначення необхідної кількостіодиниць вибіркової сукупності, тобто те, скільки одиниць досліджуватиметься. До того ж, для точного дослідження сукупність має бути репрезентативною.
  2. Розрахунок похибки репрезентативності із встановленим рівнем ймовірності. Відразу слід зазначити, що вибіркових досліджень немає з рівнем ймовірності 100 %. Якщо та інстанція, яка проводила вивчення певного сегмента, стверджує, що їх результати точні з ймовірністю 100%, це брехня. Багаторічна практика вже встановила процент ймовірності правильно проведеного вибіркового дослідження. Цей показник дорівнює 95,4%.

Способи відбору одиниць дослідження у вибірку

Не кожна вибірка є репрезентативною. Іноді та сама ознака по-різному виражений загалом й у її частини. Для досягнення вимог репрезентативності є доцільним використання різних прийомів створення вибірки. Причому використання тієї чи іншої способу залежить від конкретних обставин. Серед таких прийомів створення вибірки виділяють:

  • випадковий відбір;
  • механічний відбір;
  • типовий відбір;
  • серійний (гніздовий) відбір.

Випадковий відбір є систему заходів, вкладених у випадковий відбір одиниць сукупності, коли ймовірність потрапити у вибірку є рівної всім одиниць генеральної сукупності. Цей прийом доцільно застосовувати лише у разі однорідності та невеликої кількості властивих їй ознак. В іншому випадку деякі характерні рисиризикують бути не відображеним у вибірці. Ознаки випадкового відбору є основою всіх інших способів побудови вибірки.

При механічному відборі одиниць проводиться через певний інтервал. Якщо необхідно сформувати вибірку конкретних злочинів, можна вилучати зі всіх карток статистичного обліку зареєстрованих злочинів кожну 5-ту, 10-ту або 15-ту картку в залежності від їх загальної кількості та наявних розмірів вибірки. Недоліком цього є те, що перед відбором необхідно мати повний облік одиниць сукупності, потім потрібно провести ранжування і тільки після цього можна проводити вибірку з певним інтервалом. Цей метод займає багато часу, тому і не часто використовується.


Типовий (районований) добір – вид вибірки, у якому генеральну сукупність поділяють на однорідні групи за певною ознакою. Іноді дослідники вживають замість «груп» інші терміни: «райони» та «зони». Потім із кожної групи у випадковому порядку відбирається певна кількість одиниць пропорційно до питомої ваги групи в загальній сукупності. Типовий відбір часто здійснюється у кілька етапів.

Серійний відбір - це метод, у якому відбір одиниць проводиться групами (серіями) і обстеженню підлягають всі одиниці відібраної групи (серії). Перевагою цього є те, що іноді відібрати окремі одиниці складніше, ніж серії, наприклад, щодо особистості, яка відбуває покарання. У межах відібраних районів зон застосовується вивчення всіх одиниць без винятку, наприклад, вивчення всіх осіб, які відбувають покарання в певній установі.

Вулиця Київян, 16 0016 Вірменія, Єреван Сервіс +374 11 233 255

Вибірка в 1С 8.2 і 8.3 спеціалізований спосіб перебору записів таблиць інформаційної бази. Розглянемо докладно, що таке вибірка та як її використовувати.

Що таке вибірка у 1С?

Вибірка- спосіб перебору інформації в 1С, який полягає у послідовній установці курсору на наступному записі. Вибірку в 1С можна отримати з результату запиту та менеджера об'єктів, наприклад, документів або довідників.

Приклад отримання та перебору з менеджера об'єкта:

Вибірка = Довідники. Банки. Вибрати() ; Поки що Вибірка. Наступний() Цикл КінецьЦикл ;

Приклад отримання вибірки із запиту:

Отримайте 267 відеоуроків з 1С безкоштовно:

Запит = Новий Запит( "Вибрати Посилання, Код, Найменування З Довідник.Банки"); Вибірка = Запит. Виконати() . Вибрати() ; Поки що Вибірка. Наступний() Цикл //виробляємо дії, що цікавлять, з довідником "Банки"Кінець циклу;

Обидва наведені вище приклади отримують однакові набори даних для перебору.

Методи вибірки 1С 8.3

Вибірка має велику кількість методів, розглянемо їх докладніше:

  • Вибрати()- Метод, за допомогою якого отримують безпосередньо вибірку. З вибірки можна отримати ще одну, підлеглу, вибірку якщо вказано тип обходу «угруповання».
  • Власник()- Метод, обернений Вибрати (). Дозволяє отримати «батьківську» вибірку запиту.
  • Наступний()— метод, який проводить переведення курсору на наступний запис. Якщо запис існує, повертає Істина, якщо записи закінчилися - Брехня.
  • ЗнайтиНаступний()— дуже корисний метод, за допомогою якого можна виконувати перебір лише потрібних полів за значенням відбору (відбір — структура полів).
  • НаступнийПоЗначеннюПоля()— дозволяє отримати наступний запис, відмінний від поточного положення значення. Наприклад, необхідно перебрати всі записи з унікальним значенням поля «Контрагент»: Вибірка.
  • Скинути()— дозволяє скинути поточне розташування курсору та встановити його у початкове положення.
  • Кількість()- Повертає кількість записів у вибірці.
  • Отримати()— за допомогою методу можна встановити курсор на потрібний запис за значенням індексу.
  • Рівень()рівень у ієрархії поточного запису (число).
  • ТипЗаписи()— відображає тип запису — ДетальнийЗапис, ПідсумокУгрупування, ПідсумокПоІєрархії або ЗагальнийПідсумок
  • Угруповання()— повертає ім'я поточного угруповання, якщо запис не є групуванням — пустий рядок.

Якщо Ви починаєте вивчати програмування 1С, рекомендуємо наш безкоштовний курс (не забудьте

Елементи, що охоплюються експериментом (спостереженням, опитуванням).

Характеристики вибірки:

  • Якісна характеристика вибірки - що саме ми вибираємо та які способи побудови вибірки ми для цього використовуємо.
  • Кількісна характеристика вибірки - скільки випадків вибираємо, тобто обсяг вибірки.

Необхідність вибірки:

  • Об'єкт дослідження дуже великий. Наприклад, споживачі продукції глобальної компанії – величезна кількість територіально розкиданих ринків.
  • Існує потреба у зборі первинної інформації.

Енциклопедичний YouTube

    1 / 5

    ✪ Вибір: розрахунок обсягу. Достовірність та потужність дослідження. Біостатистика.

    ✪ 02 – Мат. Статистика. Вибірка. Вибірковий простір. Приклади

    ✪ Основи SQL для початківців | Вибір значень з бази даних

    ✪ SQL для початківців (DML): Вибір з таблиці (MySql), Урок 4!

    Виробництво SIPпанелей. Частина 2. Розкрий та фігурне різання. Вибір пазів. Все за розумом

    Субтитри

Обсяг вибірки

Обсяг вибірки - Число випадків, включених у вибіркову сукупність.

Вибірки можна умовно розділити великі і малі, оскільки у математичної статистиці використовуються різні підходи залежно від обсягу вибірки. Вважається, що вибірки обсягу більше 30 можна зарахувати до великих.

Залежні та незалежні вибірки

При порівнянні двох (і більше) вибірок важливим параметром є їхня залежність. Якщо можна встановити гомоморфну ​​пару (тобто коли одному випадку з вибірки X відповідає один і тільки один випадок з вибірки Y і навпаки) для кожного випадку у двох вибірках (і ця підстава взаємозв'язку є важливою для вимірюваної на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок:

  • пари близнюків,
  • два виміри будь-якої ознаки до і після експериментального впливу,
  • чоловіки та дружини
  • і т.п.

Якщо такий взаємозв'язок між вибірками відсутня, то ці вибірки вважаються незалежними, наприклад:

  • чоловіки та жінки ,
  • психологи та математики.

Відповідно, залежні вибірки мають однаковий обсяг, а обсяг незалежних може відрізнятися.

Порівняння вибірок проводиться за допомогою різних статистичних критеріїв:

  • Критерій Пірсона (χ 2 )
  • Критерій Стюдента ( t )
  • Критерій Вілкоксону ( T )
  • Критерій Манна - Уітні ( U )
  • Критерій знаків ( G )
  • та ін.

Репрезентативність

Вибірка може розглядатися як репрезентативна або нерепрезентативна. Вибірка буде репрезентативною під час обстеження великої групи людей, якщо всередині цієї групи є представники різних підгруп, тільки так можна зробити правильні висновки.

Приклад нерепрезентативної вибірки

  1. Дослідження з експериментальною та контрольною групами, які ставляться у різні умови.
    • Дослідження з експериментальною та контрольною групами із залученням стратегії попарного відбору
  2. Дослідження з використанням лише однієї групи – експериментальної.
  3. Дослідження з використанням змішаного (факторного) плану – всі групи ставляться у різні умови.

Типи вибірок

Вибірки поділяються на два типи:

  • імовірнісні
  • неймовірні

Імовірнісні вибірки

  1. Проста ймовірнісна вибірка:
    • Проста повторна вибірка. Використання такої вибірки ґрунтується на припущенні, що кожен респондент з часткою ймовірності може потрапити у вибірку. За підсумками списку генеральної сукупності складаються картки з номерами респондентів. Вони поміщаються в колоду, перемішуються і їх навмання виймається картка, записується номер, потім повертається назад. Далі процедура повторюється стільки разів, який обсяг вибірки нам необхідний. Мінус: повторення одиниць відбору.

Процедура побудови простої випадкової вибірки включає наступні кроки:

1) необхідно отримати повний списокчленів генеральної сукупності та пронумерувати цей список. Такий список, нагадаємо, називається основою вибірки;

2) визначити передбачуваний обсяг вибірки, тобто очікуване число опитаних;

3) витягти з таблиці випадкових чисел стільки чисел, скільки нам потрібно вибіркових одиниць. Якщо у вибірці має бути 100 людина, з таблиці беруть 100 випадкових чисел. Ці випадкові числа можуть генеруватись комп'ютерною програмою.

4) вибрати зі списку-основи ті спостереження, номери яких відповідають виписаним випадковим числам

  • Проста випадкова вибірка має очевидні переваги. Цей метод дуже простий для розуміння. Результати дослідження можна поширювати на сукупність, що вивчається. Більшість підходів до отримання статистичних висновків передбачають збирання інформації за допомогою простої випадкової вибірки. Однак метод простої випадкової вибірки має як мінімум чотири суттєві обмеження:

1) нерідко складно створити основу вибіркового спостереження, яка б провести просту випадкову вибірку.

2) результатом застосування простої випадкової вибірки може стати велика сукупність, або сукупність, розподілена на великій географічній території, що значно збільшує час і вартість збору даних.

3) результати застосування простої випадкової вибірки часто характеризуються низькою точністю та більшою стандартною помилкою, ніж результати застосування інших імовірнісних методів.

4) у результаті застосування SRS може сформуватися нерепрезентативна вибірка. Хоча вибірки, отримані простим випадковим відбором, в середньому адекватно представляють генеральну сукупність, деякі з них вкрай некоректно представляють сукупність, що вивчається. Імовірність цього особливо велика за невеликого обсягу вибірки.

  • Проста неповторна вибірка. Процедура побудови вибірки така сама, тільки картки з номерами респондентів не повертаються назад у колоду.
  1. Систематична імовірнісна вибірка. Є спрощеним варіантом простої імовірнісної вибірки. За підсумками списку генеральної сукупності через певний інтервал (К) відбираються респонденти. Розмір До визначається випадково. Найбільш достовірний результат досягається при однорідній генеральній сукупності, інакше можливі збіг величини кроку та якихось внутрішніх циклічних закономірностей вибірки (змішування вибірки). Мінуси: такі ж, як і в простій імовірнісній вибірці.
  2. Серійна (гніздова) вибірка. Одиниці відбору є статистичні серії (сім'я, школа, бригада тощо). Відібрані елементи зазнають суцільного обстеження. Відбір статистичних одиниць може бути організований на кшталт випадкової чи систематичної вибірки. Мінус: Можливість більшої однорідності, ніж у генеральній сукупності.
  3. Районована вибірка. У разі неоднорідної генеральної сукупності, перш ніж використовувати ймовірнісну вибірку з будь-якою технікою відбору, рекомендується розділити генеральну сукупність на однорідні частини, така вибірка називається районованою. Групами районування можуть бути як природні освіти (наприклад, райони міста), і будь-який ознака, закладений основою дослідження. Ознака, на основі якої здійснюється поділ, називається ознакою розшарування та районування.
  4. «Зручна» вибірка. Процедура «зручної» вибірки полягає у встановленні контактів із «зручними» одиницями вибірки – з групою студентів, спортивною командою, з друзями та сусідами. Якщо необхідно отримати інформацію про реакцію людей на нову концепцію, така вибірка цілком обґрунтована. «Зручну» вибірку часто використовують із попереднього тестування анкет.

Неймовірні вибірки

Відбір у такій вибірці здійснюється за принципами випадковості, а, по суб'єктивним критеріям - доступності, типовості, рівного представництва тощо.

  1. Квотна вибірка - вибірка будується як модель, яка відтворює структуру генеральної сукупності у вигляді квот (пропорцій) ознак, що вивчаються. Число елементів вибірки з різним поєднанням ознак, що вивчаються, визначається з таким розрахунком, щоб воно відповідало їх частці (пропорції) в генеральній сукупності. Так, наприклад, якщо генеральна сукупність у нас представлена ​​5000 чоловік, з них 2000 жінок та 3000 чоловіків, тоді у квотній вибірці у нас будуть 20 жінок та 30 чоловіків, або 200 жінок та 300 чоловіків. Квотовані вибірки найчастіше ґрунтуються на демографічних умовах: стать, вік, регіон, дохід, освіта та інші. Мінуси: зазвичай такі вибірки нерепрезентативні, тому що не можна врахувати відразу кілька соціальних параметрів. Плюси: доступний матеріал.
  2. Спосіб снігового кома. Вибірка будується в такий спосіб. У кожного респондента, починаючи з першого, просяться контакти його друзів, колег, знайомих, які б підходили під умови відбору і могли б взяти участь у дослідженні. Отже, крім першого кроку, вибірка формується з участю самих об'єктів дослідження. Метод часто застосовується, коли необхідно знайти та опитати важкодоступні групи респондентів (наприклад, респондентів, які мають високий дохід, респондентів, що належать до однієї професійної групи, респондентів, які мають схожі хобі/захоплення тощо).
  3. Стихійна вибірка – вибірка так званого «першого зустрічного». Часто використовується в теле- та радіоопитуваннях. Розмір та склад стихійних вибірок заздалегідь не відомий, і визначається лише одним параметром – активністю респондентів. Мінуси: неможливо встановити якусь генеральну сукупність представляють опитані, і як наслідок - неможливість визначити репрезентативність.
  4. Маршрутне опитування – часто використовується, якщо одиницею вивчення є сім'я. На карті населеного пункту, в якому опитуватиметься, нумеруються всі вулиці. З допомогою таблиці (генератора) випадкових чисел відбираються великі числа. Кожне велике число розглядається як 3-х компонентів: номер вулиці (2-3 перших числа), номер будинку, номер квартири. Наприклад, число 14832: 14 – це номер вулиці на карті, 8 – номер будинку, 32 – номер квартири.
  5. Районована вибірка із відбором типових об'єктів. Якщо після районування з кожної групи відбирається типовий об'єкт, тобто об'єкт, який переважно досліджуваних у дослідженні характеристик наближається до середніх показників, така вибірка називається районованої з відбором типових об'єктів.
  6. Модальна вибірка.
  7. Експертна вибірка.
  8. Гетерогенна вибірка.

Стратегії побудови груп

Відбір груп для їхньої участі в психологічному експерименті здійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої та зовнішньої валідності.

Рандомізація

Рандомізація, або випадковий відбірвикористовується для створення простих випадкових вибірок. Використання такої вибірки ґрунтується на припущенні, що кожен член популяції з рівною ймовірністю може потрапити у вибірку. Наприклад, щоб зробити випадкову вибірку зі 100 студентів вузу, можна скласти папірці з іменами всіх студентів вузу в капелюх, а потім дістати з нього 100 папірців - це буде випадковим відбором (Гудвін Дж., с. 147).

Попарний відбір

Попарний відбір- стратегія побудови груп вибірки, у якому групи піддослідних складаються з суб'єктів, еквівалентних за значними експерименту побічним параметрам. Ця стратегія ефективна для експериментів з використанням експериментальних та контрольних груп з найкращим варіантом- залученням близнюкових пар (моно- та дизиготних).

Стратометричний відбір

Стратометричний відбір- рандомізація із виділенням страт (чи кластерів). При даному способі формування вибірки генеральна сукупність ділиться на групи (страти), що мають певні характеристики (стаття, вік, політичні переваги, освіта, рівень доходів та ін), і відбираються піддослідні з відповідними характеристиками.

Наближене моделювання

Наближене моделювання- Складання обмежених вибірок та узагальнення висновків про цю вибірку на ширшу популяцію. Наприклад, за участю у дослідженні студентів 2-го курсу університету дані цього дослідження поширюються на «людей віком від 17 до 21 року». Допустимість подібних узагальнень вкрай обмежена.

Наближене моделювання - формування моделі, яка чітко обумовленого класу систем (процесів) визначає його поведінка (чи необхідні явища) з прийнятною точністю.

Поняття «репрезентативність» стосовно соціологічних опитувань - опитувань громадської думки - має майже магічну дію на людей. Сам термін «репрезентація» має, крім наукового, ще й явно політичне значення.

В чому причина? Вся справа в тому, що передбачається, що вибірка (група людей, відібрана для опитування) може представляти всю генеральну сукупність. Генеральною сукупністю у разі загальноросійських опитувань є населення країни. Тепер уявімо, що мова йдепро політичне рішення - підтримку законопроекту чи голосування під час виборів. За допомогою вибіркового опитування ми отримуємо відмінний механізм політичної репрезентації – механізм, у якому невелика група людей може представляти думку чи позицію населення країни. Тому репрезентативності дослідження приділяється таке важливе місце.

Поняття репрезентативності використовується, зрозуміло, у політичних дослідженнях. Термін застосовується практично завжди, коли йдеться про великі дослідження, чи то у сфері маркетингу, економічної поведінки чи освіти.

Методологія репрезентативних опитувань

Як, опитавши 1500 осіб, можна робити висновки про всіх росіян, яких понад 140 мільйонів (і навіть виборців понад 110 мільйонів)? Технологія, яка стоїть за репрезентативними опитуваннями, ґрунтується на статистичних законах. Найближчою підставою є закон великих чисел, або теорема Бернуллі.

Спрощено його зміст можна передати так. Припустимо, ми маємо деяку ознаку, наприклад кількість опадів за день в Єкатеринбурзі протягом ХХ століття. Якщо ми випишемо всі його значення разом із їх частотою (це називається розподілом), а потім випадково візьмемо досить велику кількість випадків (тобто не всі дні у ХХ столітті, але досить багато), то ми побачимо, що розподіл у нашій вибірці буде дуже схожим на розподіл за все ХХ століття. Таким чином, якщо ми відбираємо із сукупності деякі одиниці, вони справді можуть представляти всю сукупність, і насправді немає необхідності збирати дані з усіх випадків.

Однак є ключова умова: це правильно, тільки якщо проводити відбір суворо випадковим чином. Єдиною проблемою може бути відхилення від випадковості. Так, якщо ми візьмемо лише дані щодо опадів за Останніми роками(Наприклад, тому що ці дані простіше знайти) або опитаємо 1500 своїх знайомих (бо з ними простіше зв'язатися), а не випадкових людей, то вибірка, звичайно, не буде репрезентативною.

Уявіть, що з 143,5 мільйонів росіян ви випадково відбираєте необхідні вам 1500 чоловік. Тоді, наприклад, частка менеджерів середньої ланки серед них приблизно дорівнює частці менеджерів середньої ланки в генеральній сукупності, що і показує, що ваша вибірка може представляти всю сукупність. Чи може так вийти, що ці два показники сильно відрізнятимуться? Наприклад, серед росіян він становить 14%, а у вибірці він становитиме лише 1%? Теоретично це можливо, проте ймовірність цього настільки мала, що її можна знехтувати (приблизно як зустріти дракона на вулиці).

Більш того, найприємніше в цій ймовірності навіть не те, що вона мала, а те, що для випадкових процесів цю ймовірність можна обчислити. Ми можемо сказати, з якою ймовірністю наше вибіркове значення відхилиться від значення в генеральній сукупності на 13% (як у прикладі вище), а з якою, скажімо, на 2,5%. Зазвичай, втім, роблять навпаки: спочатку визначають ймовірність, з якої ми хочемо, щоб наше значення не відхилялося від значення в генеральній сукупності (найчастіше його фіксують на рівні 95%), а потім уже дивляться, яка величина відхилення при тому чи іншому розмірі вибірки. Це відхилення називається довірчим інтервалом, іноді його називають помилкою вибірки чи статистичної похибкою – його часто наводять поруч із результатами опитування.

Отже, ймовірність відхилення, величина відхилення (довірчий інтервал) та розмір вибірки пов'язані між собою. Виходячи з цього, формула для розрахунку розміру вибірки виглядає так:

де n – розмір вибірки, Δ – довірчий інтервал, z – значення функції нормального розподілу для даної ймовірності відхилення (для ймовірності 5% це значення становить 1,96).

Це спрощена формула, у реальних опитуваннях використовуються дещо складніші формули. Ця формула також може давати збій, якщо значення показника сильно відрізняється від 50% (тому, наприклад, ця формула не підійде для того, щоб оцінити частку хворих на рідкісне захворювання в країні).

Ось що буде, якщо підставити в цю формулу деякі значення:

Іншими словами, якщо ми взяли випадкову вибірку росіян розміром у 1600 осіб і оцінили якийсь показник, наприклад, готовність голосувати за певного політика, то з ймовірністю 95% наша оцінка не відрізнятиметься від готовності проголосувати за нього серед усіх росіян більш ніж на 2, 45%.

Розмір вибірки

Отже, чим більше розмірвибірки, тим більше ймовірність того, що ми будемо ближчими до частки в генеральній сукупності. Здавалося б, це означає, що нам потрібно намагатися наблизити вибірку до 143,5 млн. Насправді, як можна бачити з таблиці, природа випадкових процесів така, що з певного моменту можливість потрапити в інтервал починає підвищуватися дуже повільно (і цей момент настає доволі швидко). Після того як ми відбираємо 1500 одиниць, як би ми сильно не збільшували обсяг вибірки, ймовірність, що наше значення за вибіркою потрапить у значення за генеральною сукупністю, зростатиме дуже і дуже повільно.

Фактично різниці між 1500 та 10 000 опитаних майже немає. Десь до 1500 ми вже можемо говорити, що наші оцінки відрізнятимуться від частки в генеральній сукупності на 2–3%. Якщо ми збільшуємо вибірку далі, ця можлива помилка буде зменшуватися, але дуже незначно. Інакше кажучи, вибірка в 100 000 краще, ніж вибірка в 2500, але різниця настільки мала, що немає сенсу, а разі соціальних обстежень і економічно не обгрунтована. Зазвичай збільшення вибірки коштує дорого, і тому її немає сенсу роздмухувати заради того, щоб виграти один відсотковий пункт у розмірі довірчого інтервалу.

Важливо, що у формулі взагалі фігурує розмір генеральної сукупності. Справа в тому, що коли генеральна сукупність велика (понад 20 000), він практично не впливає на розмір вибірки. Таким чином, нам не потрібно знати, скільки людей живе в Росії, щоби побудувати репрезентативну вибірку. Зрозуміло, що вибирати 1500 із 2000, швидше за все, не має сенсу – простіше обстежити 2000 та отримати точну оцінку. Але, роблячи у разі потреби вибірку, ми маємо можливість узагальнювати її результати для генеральної сукупності. І з цієї ж причини розмір вибірки не відрізнятиметься для великих та маленьких країн.

Репрезентативність та точність

Щоб зрозуміти зміст поняття «репрезентативність», розглянемо вибірку в 15 осіб. Як не дивно, якщо ви зробили її випадково, вона також репрезентативна. Більше того, ви можете зробити вибірку на одну одиницю. Уявіть ящик з кулями, звідки ви випадково берете одну кулю. Якщо це випадково обрана куля, то вона теж буде репрезентувати всі кулі, що є в цій скриньці. Просто він буде репрезентувати їх неточно. Чому? Тому що є дуже велика можливість помилитися. Наступного разу ми можемо витягнути іншу кулю і отримати інше уявлення про кулі в ящику. Репрезентувати неточно означає мати велику кількість оцінок.

Так само і 15 осіб репрезентують будь-яку генеральну сукупність, але вони репрезентують її неточно, тому що похибка, довірчий інтервал дуже великі. Нам доведеться додавати +/- 33%, щоб отримати 95% ймовірності того, що ми потрапимо в інтервал. Якщо ми готові це допустити, то беремо 15 осіб, з'ясовуємо, що 7 з них – це менеджери середньої ланки, а далі отримуємо оцінку, що 7/15 від сукупності, тобто 47% +/- 33% – це і є оцінка частки менеджерів у генеральній сукупності, і це абсолютно коректний висновок. Просто він не має жодної цінності. Це ми могли сказати без обстеження. Тому, плануючи вибірку, має сенс досягати такого обсягу, який буде доцільним з погляду співвідношення витрат та ефективності.

Все сказане покликане донести одну просту думку, яку часто не усвідомлюють: обсяг вибірки не пов'язаний з її репрезентативністю.

Маленька вибірка неточна, але вона все одно може бути репрезентативною. Обсяги вибірок, які використовуються сьогодні в масових опитуваннях в Росії, майже завжди мають досить високу точність.

Погрожує репрезентативності вибірки не її обсяг, а зміщення, тобто відхилення від принципу випадковості.

Порушення принципу випадковості

Якщо ми починаємо вибирати одиниці невипадковим чином, вибірка стає нерепрезентативною. Наприклад, якщо щось заважає нам відбирати їх випадково. Уявімо, що ми хочемо відібрати кулі з нашого ящика випадковим чином, але тут виявляється, що частина куль кусається. Механізм, при якому ми братимемо лише ті кульки, які даються нам у руки, - це механізм, що порушує випадковість і тому порушує репрезентативність. В цьому випадку, скільки б ми кульок не взяли з ящика (навіть якщо ми візьмемо всі кульки, які не кусаються), у нас буде нерепрезентативна вибірка, тому що ми не врахуємо жодного з тих, що кусаються - вони просто пройдуть нашу вибірку .

Найбільша проблема з кулями, що кусаються, полягає в тому, що вони можуть відрізнятися від тих, які йдуть до нас в руки, і відрізнятися якраз за тією ознакою, яка нас цікавить. Така ситуація називається систематичною помилкою вибірки.

Потрібно відрізняти ситуацію неточної репрезентації, яку ми описали вище, від ситуації нерепрезентативності. Це різні проблеми, і у них різні способирішення. Не можна вирішити одну з них шляхом вирішення іншої. Якщо вибірці не вистачає репрезентативності, марно її збільшувати. Більше того, великі вибірки у соціальних обстеженнях мають властивість накопичувати помилки, тому за допомогою сильного збільшення вибірки проблему репрезентації можна лише посилити.

Чому репрезентативність неможлива

У примітках до таблиць з результатами опитувань часто можна побачити, що «обсяг вибірки становить 1600 осіб, вибірка репрезентативна за статтю та віком». Зі сказаного вище очевидно, що це два різні параметри: вказівка ​​на репрезентативність не пов'язана з обсягом вибірки. Насправді тут мають на увазі те, що виконувались певні процедури, щоб забезпечити відповідність між вибіркою та генеральною сукупністю. Наприклад, щоб забезпечити репрезентативність за статтю, у вибірку набирають чоловіків і жінок у таких самих співвідношеннях, які існують серед росіян за даними перепису. Але репрезентативність за статтю не означає репрезентативності, наприклад, з політичних поглядів.

Чому доводиться вирівнювати вибірку за статтю та іншими соціально-демографічними категоріями? Тому що справжню репрезентативність може забезпечити лише випадкова вибірка, а реалізувати її практично неможливо з маси причин. Як тільки ви спробуєте це зробити, ви зіткнетеся з безліччю проблем - байдуже, яким методом ви захочете скористатися. Частина респондентів взагалі виявиться недоступною для вашого методу (скажімо, для особистих інтерв'ю великою проблемою є будинки з домофонами та охороною), ще частина буде відсутня, не відповідатиме або волітиме займатися своїми справами. Є люди, які мають мовні проблеми, і вони не можуть з нами говорити. Є люди, які не розуміють, навіщо це потрібно, і вони не хочуть говорити з нами. Все це - серйозні порушення випадковості, які унеможливлюють її реалізацію.

Ті, хто зводить проблему репрезентації у масових опитуваннях до статистики, забувають про те, що люди – це дуже специфічні кульки. Є кульки, які тікають та ховаються. Є кульки, які кусаються. Вони не пасивні об'єкти, вони дають здачу. Вони кажуть: "Я не хочу брати участь у твоєму опитуванні", тим самим порушують випадковість. Тому в строгому значенні слова репрезентативність у масових опитуваннях, звісно, ​​неможлива у жодному вигляді.

Вироблено механізм, за допомогою якого зазвичай забезпечується видимість репрезентативності: ми вирівнюємо вибірку за деякими категоріями і робимо вигляд, що за рештою можливих категорій вона теж вирівняна. Насправді, у нас немає жодних підстав це стверджувати. Але проблема в тому, що немає і ніякої можливості це перевірити - знову ж таки через те, що деякі кульки кусаються. Щоб перевірити наявність систематичної помилки, перевіряльнику довелося б сходити до тих, кого ми не опитали, і опитати їх. Але вони, як ми пам'ятаємо, не хочуть, щоб їх опитували. Опитати тих, хто не відповідає категорично, неможливо. Тому всі працюють на припущенні, що якщо ми вирівняли вибірку за двома-трьома параметрами, вона репрезентує всю сукупність, хоча у цього припущення і немає жодних серйозних підстав.

Репрезентативна вибірка – технологія, запозичена соціологами зі статистики. Тому вона неминуче містить у собі елементи математико-статистичної картини світу. Мабуть, найсильніше припущення у тому, що саме собою вибіркове опитування політично і соціологічно нейтральний: що й неучасть у опитуванні несе у собі політичного сенсу і пов'язані з іншими соціологічно важливими параметрами. Але сьогодні опитування стали одним із головних політичних інститутів і перетворилися на ключового посередника між великими корпораціями та споживачами. У цих умовах вірити в їхню політичну стерильність уже неможливо. Однак ми, як і раніше, мало знаємо про те, як опитування розуміються на сучасних суспільствахі що вони насправді репрезентують.

Схожі статті

2023 р. videointercoms.ru. Майстер на усі руки - Побутова техніка. Висвітлення. Металобробка. Ножі Електрика.