Studiul populației generale și al eșantionului. Valabilitate statistică. Cum se calculează corect dimensiunea eșantionului? Sunt prezentate mostre de rezultate

Una dintre componentele principale ale unui studiu bine conceput este definirea eșantionului și ceea ce este un eșantion reprezentativ. Este ca exemplul tortului. La urma urmei, nu este necesar să mănânci întregul desert pentru a-i înțelege gustul? O mică parte este suficientă.

Deci, tortul este populatia (adică toți respondenții care se califică pentru sondaj). Poate fi exprimat teritorial, de exemplu, numai locuitorii regiunii Moscova. Gen - numai femei. Sau au restricții de vârstă - rușii au peste 65 de ani.

Este dificil să calculezi populația: trebuie să ai date din recensământul populației sau anchete de evaluare preliminară. Prin urmare, de obicei populația generală este „estimată”, iar din numărul rezultat se calculează cadru de prelevare sau prelevarea de probe.

Ce este un eșantion reprezentativ?

Probă este un număr bine definit de respondenți. Structura sa ar trebui să coincidă cât mai mult cu structura populației generale în ceea ce privește principalele caracteristici ale selecției.

De exemplu, dacă respondenții potențiali sunt întreaga populație a Rusiei, unde 54% sunt femei și 46% sunt bărbați, atunci eșantionul ar trebui să conțină exact același procent. Dacă parametrii se potrivesc, atunci eșantionul poate fi numit reprezentativ. Aceasta înseamnă că inexactitățile și erorile din studiu sunt minimizate.

Mărimea eșantionului este determinată ținând cont de cerințele de acuratețe și economie. Aceste cerințe sunt invers proporționale între ele: cu cât dimensiunea eșantionului este mai mare, cu atât rezultatul este mai precis. Mai mult, cu cât acuratețea este mai mare, cu atât sunt necesare mai multe costuri pentru studiu. Și invers, cu cât eșantionul este mai mic, cu atât costă mai puțin, cu atât sunt reproduse mai puțin precis și mai aleatoriu proprietățile populației generale.

Prin urmare, pentru a calcula cantitatea de alegere, sociologii au inventat o formulă și au creat calculator special:

Probabilitatea de încredereși eroare de încredere

Ce înseamnă termenii " nivel de încredere" și " eroare de încredere"? Nivelul de încredere este o măsură a acurateței măsurătorilor. Și eroarea de încredere este posibilă eroare rezultatele cercetării. De exemplu, cu o populație generală de peste 500,00 de persoane (de exemplu, care locuiește în Novokuznetsk), eșantionul va fi de 384 de persoane cu un nivel de încredere de 95% și o eroare de 5% SAU (cu un interval de încredere de 95 ± 5%).

Ce rezultă din asta? La efectuarea a 100 de studii cu un astfel de eșantion (384 de persoane), în 95 la sută din cazuri, răspunsurile primite, conform legilor statisticii, se vor situa în ± 5% față de original. Și vom obține un eșantion reprezentativ cu o probabilitate minimă de eroare statistică.

După ce se calculează dimensiunea eșantionului, puteți vedea dacă există destui respondenți în versiunea demonstrativă a panoului de chestionare. Puteți afla mai multe despre cum să efectuați un sondaj de grup.

Se întâmplă adesea să fie necesară analizarea unui anumit fenomen social și obținerea de informații despre acesta. Deseori apar astfel de locuri de muncă...

Eșantionarea este... Definiție, tipuri, metode și rezultate ale eșantionării

De către Masterweb

09.04.2018 16:00

Se întâmplă adesea să fie necesară analizarea unui anumit fenomen social și obținerea de informații despre acesta. Asemenea sarcini apar adesea în statistică și în cercetarea statistică. Verificarea unui fenomen social complet definit este adesea imposibilă. De exemplu, cum să aflați părerea populației sau a tuturor locuitorilor unui anumit oraș cu privire la orice problemă? A cere absolut toată lumea este aproape imposibil și foarte laborios. În astfel de cazuri, avem nevoie de o probă. Acesta este exact conceptul pe care se bazează aproape toate cercetările și analizele.

Ce este o mostră

Atunci când se analizează un anumit fenomen social, este necesar să se obțină informații despre acesta. Dacă luăm orice studiu, putem observa că nu fiecare unitate din totalitatea obiectului de studiu este supusă cercetării și analizei. Doar o anumită parte din această totalitate este luată în considerare. Acest proces este eșantionarea: atunci când sunt examinate doar anumite unități din set.

Desigur, mult depinde de tipul eșantionului. Dar există și reguli de bază. Principalul spune că selecția din populație trebuie să fie absolut aleatorie. Unitățile de populație care vor fi utilizate nu trebuie selectate din cauza niciunui criteriu. În linii mari, dacă este necesar să se colecteze o populație din populația unui anumit oraș și să se selecteze numai bărbați, atunci va exista o eroare în studiu, deoarece selecția nu a fost efectuată aleatoriu, ci a fost selectată în funcție de sex. Aproape toate metodele de eșantionare se bazează pe această regulă.

Reguli de eșantionare

Pentru ca setul selectat să reflecte principalele calități ale întregului fenomen, acesta trebuie să fie construit conform unor legi specifice, unde atenția principală trebuie acordată următoarelor categorii:

  • eșantion (populație eșantion);
  • populația generală;
  • reprezentativitate;
  • eroare de reprezentativitate;
  • unitate de populație;
  • metode de eșantionare.

Caracteristicile observației selective și ale prelevării de probe sunt următoarele:

  1. Toate rezultatele obținute se bazează pe legi și reguli matematice, adică cu desfășurarea corectă a studiului și cu calcule corecte rezultatele nu vor fi distorsionate subiectiv
  2. Face posibilă obținerea unui rezultat mult mai rapid și cu mai puțin timp și resurse, studiind nu întreaga gamă de evenimente, ci doar o parte a acestora.
  3. Poate fi folosit pentru a studia diverse obiecte: de la probleme specifice, de exemplu, vârsta, sexul grupului de interes pentru noi, până la studiul opiniei publice sau nivelul de sprijin material al populației.

Observație selectivă

Selectiv - aceasta este o astfel de observație statistică în care nu întreaga populație a studiului este supusă cercetării, ci doar o parte a acesteia, selectată într-un anumit mod, iar rezultatele studiului acestei părți se aplică întregii populații. Această parte se numește cadrul de eșantionare. Acesta este singurul mod de a studia o gamă largă de obiecte de studiu.

Dar observația selectivă poate fi folosită numai în cazurile în care este necesar să se studieze doar un grup mic de unități. De exemplu, atunci când se studiază raportul dintre bărbați și femei din lume, se va folosi observația selectivă. Din motive evidente, este imposibil să ținem cont de fiecare locuitor al planetei noastre.

Dar cu același studiu, dar nu al tuturor locuitorilor pământului, ci al unei anumite clase 2 „A” dintr-o anumită școală, un anumit oraș, o anumită țară, se poate renunța la observarea selectivă. La urma urmei, este foarte posibil să se analizeze întreaga gamă a obiectului de studiu. Este necesar să numărați băieții și fetele din această clasă - acesta va fi raportul.


Eșantion și populație

De fapt, nu este atât de dificil pe cât pare. În orice obiect de studiu există două sisteme: populație generală și populație eșantion. Ce este? Toate unitățile aparțin generalului. Și la eșantion - acele unități din populația totală care au fost luate pentru eșantion. Dacă totul este făcut corect, atunci partea selectată va fi un aspect redus al întregii populații (generale).

Dacă vorbim despre populația generală, atunci putem distinge doar două dintre soiurile sale: populația generală definită și nedefinită. Depinde dacă numărul total de unități ale unui sistem dat este cunoscut sau nu. Dacă este vorba de o anumită populație, atunci eșantionarea va fi mai ușoară datorită faptului că se știe ce procent din numărul total de unități va fi eșantionat.

Acest moment este foarte necesar în cercetare. De exemplu, dacă este necesar să se investigheze procentul de produse de cofetărie de calitate scăzută la o anumită fabrică. Să presupunem că populația a fost deja definită. Se știe cu siguranță că această întreprindere produce 1000 de produse de cofetărie pe an. Dacă facem o probă de 100 de produse de cofetărie aleatorii din această mie și le trimitem spre examinare, atunci eroarea va fi minimă. Aproximativ, 10% din toate produsele au fost supuse cercetării, iar pe baza rezultatelor, ținând cont de eroarea de reprezentativitate, se poate vorbi de calitate slabă a tuturor produselor.

Și dacă luați un eșantion de 100 de produse de cofetărie dintr-o populație generală nedeterminată, unde au existat de fapt, să zicem, 1 milion de unități, atunci rezultatul eșantionului și al studiului în sine vor fi critic de neplauzibil și inexact. Simte diferenta? Prin urmare, certitudinea populației generale în majoritatea cazurilor este extrem de importantă și afectează foarte mult rezultatul studiului.


Reprezentativitatea populației

Deci, acum una dintre cele mai importante întrebări - care ar trebui să fie eșantionul? Acesta este cel mai important punct al studiului. În această etapă, este necesar să se calculeze eșantionul și să se selecteze unitățile din numărul total în el. Populația a fost selectată corect dacă în eșantion rămân anumite trăsături și caracteristici ale populației generale. Aceasta se numește reprezentativitate.

Cu alte cuvinte, dacă, după selecție, o parte păstrează aceleași tendințe și caracteristici ca întreaga cantitate de examinat, atunci o astfel de populație se numește reprezentativă. Dar nu fiecare eșantion specific poate fi selectat dintr-o populație reprezentativă. Există și astfel de obiecte de cercetare, al căror eșantion pur și simplu nu poate fi reprezentativ. De aici vine conceptul de eroare de reprezentativitate. Dar să mai vorbim puțin despre asta.

Cum să faci o selecție

Deci, pentru a maximiza reprezentativitatea, există trei reguli de bază de eșantionare:

  1. Cel mai unic indicator al numărului de eșantion este considerat a fi 20%. Un eșantion statistic de 20% va oferi aproape întotdeauna un rezultat cât mai apropiat de realitate. În același timp, nu este necesară transferul către cea mai mare parte colectată a populației generale. 20% din eșantion este cifra care a fost dezvoltată de multe studii. Să aruncăm o privire la ceva mai multă teorie. Cu cât eșantionul este mai mare, cu atât eroarea de reprezentativitate este mai mică și rezultatul studiului este mai precis. Cu cât populația eșantionului este mai aproape de populația generală în ceea ce privește numărul de unități, cu atât rezultatele vor fi mai precise și mai corecte. La urma urmei, dacă examinați întregul sistem, atunci rezultatul va fi de 100%. Dar nu există nicio selecție aici. Acestea sunt acele studii în care se examinează întregul array, toate unitățile, așa că acest lucru nu ne interesează.
  2. În caz de inadecvare a procesării a 20% din populația generală, este permisă studierea unităților populației în valoare de cel puțin 1001. Acesta este, de asemenea, unul dintre indicatorii studiului matricei obiectului de studiu. , care s-a dezvoltat de-a lungul timpului. Bineînțeles, nu va oferi rezultate precise cu o gamă largă de cercetări, dar o va aduce cât mai aproape de posibila acuratețe a probei.
  3. Există multe formule și tabele în statistici. În funcție de obiectul de studiu și de criteriul de eșantionare, este oportun să se aleagă una sau alta formulă. Dar acest articol este folosit în studii complexe și în mai multe etape.

Eroare (eroare) de reprezentativitate

Principala caracteristică a calității eșantionului selectat este conceptul de „eroare de reprezentativitate”. Ce este? Acestea sunt anumite discrepanțe între indicatorii de observație selectivă și continuă. Conform indicatorilor de eroare, reprezentativitatea este împărțită în fiabil, obișnuit și aproximativ. Cu alte cuvinte, sunt acceptabile abateri de până la 3%, de la 3 la 10% și, respectiv, de la 10 la 20%. Deși în statistică este de dorit ca eroarea să nu depășească 5-6%. În caz contrar, există motive să vorbim despre reprezentativitatea insuficientă a eșantionului. Pentru a calcula eroarea de reprezentativitate și modul în care aceasta afectează un eșantion sau o populație, sunt luați în considerare mulți factori:

  1. Probabilitatea cu care se obține un rezultat precis.
  2. Numărul de unități de prelevare. După cum sa menționat mai devreme, cu cât numărul de unități din eșantion este mai mic, cu atât eroarea de reprezentativitate va fi mai mare și invers.
  3. Omogenitatea populației studiate. Cu cât populația este mai eterogenă, cu atât eroarea de reprezentativitate va fi mai mare. Capacitatea unei populații de a fi reprezentativă depinde de omogenitatea tuturor unităților sale constitutive.
  4. O metodă de selectare a unităților dintr-o populație eșantion.

În studiile specifice, eroarea procentuală a mediei este stabilită de obicei de către investigator însuși, pe baza programului de observație și în funcție de datele din studiile anterioare. De regulă, eroarea maximă de eșantionare (eroarea de reprezentativitate) în intervalul 3-5% este considerată acceptabilă.


Mai mult nu este întotdeauna mai bine

De asemenea, merită să ne amintim că principalul lucru în organizarea observației selective este să-și aducă volumul la un minim acceptabil. În același timp, nu ar trebui să ne străduim să reducem excesiv limitele de eroare de eșantionare, deoarece acest lucru poate duce la o creștere nejustificată a cantității de date eșantionate și, în consecință, la o creștere a costului eșantionării.

În același timp, dimensiunea erorii de reprezentativitate nu trebuie mărită excesiv. La urma urmei, în acest caz, deși va exista o scădere a dimensiunii eșantionului, aceasta va duce la o deteriorare a fiabilității rezultatelor obținute.

Ce întrebări sunt puse de obicei de către cercetător?

Orice cercetare, dacă este efectuată, are un anumit scop și pentru a obține unele rezultate. Când se efectuează un sondaj eșantion, de regulă, întrebările inițiale sunt:

  1. Definiție suma necesară unități de eșantionare, adică câte unități vor fi examinate. În plus, pentru un studiu precis, populația trebuie să fie reprezentativă.
  2. Calculul erorii de reprezentativitate cu nivelul de probabilitate stabilit. Trebuie remarcat imediat că studiile selective nu au loc cu un nivel de probabilitate de 100%. Dacă autoritatea care a efectuat studiul unui anumit segment susține că rezultatele lor sunt exacte cu o probabilitate de 100%, atunci aceasta este o minciună. Mulți ani de practică au stabilit deja procentul de probabilitate al unui studiu prin eșantion realizat corect. Această cifră este de 95,4%.

Metode de selectare a unităților de cercetare din eșantion

Nu fiecare eșantion este reprezentativ. Uneori, unul și același semn este exprimat diferit în întreg și în partea sa. Pentru a atinge cerințele de reprezentativitate, se recomandă utilizarea diferitelor metode de eșantionare. Mai mult, utilizarea unei metode sau alteia depinde de circumstanțele specifice. Unele dintre aceste metode de eșantionare includ:

  • selectie aleatorie;
  • selecție mecanică;
  • selecție tipică;
  • selecție în serie (imbricate).

Selecția aleatorie este un sistem de activități care vizează selecția aleatorie a unităților populației, atunci când probabilitatea de a fi incluse în eșantion este egală pentru toate unitățile populației generale. Această tehnică este recomandabilă să se aplice numai în cazul omogenității și a unui număr mic de caracteristicile sale inerente. Altfel, unii trăsături de caracter riscă să nu fie incluse în eșantion. Caracteristicile selecției aleatorii stau la baza tuturor celorlalte metode de eșantionare.

Cu selecția mecanică a unităților se efectuează la un anumit interval. În cazul în care este necesară formarea unui eșantion de infracțiuni specifice, se poate scoate fiecare a 5-a, a 10-a sau a 15-a fișă din toate evidențele statistice ale infracțiunilor înregistrate, în funcție de numărul lor total și de mărimea eșantionului disponibil. Dezavantajul acestei metode este că înainte de selecție este necesar să se aibă o evidență completă a unităților populației, atunci este necesar să se efectueze o clasare și numai după aceea este posibilă eșantionarea la un anumit interval. Această metodă necesită mult timp, deci nu este folosită des.


Selecția tipică (regională) este un tip de eșantion în care populația generală este împărțită în grupuri omogene în funcție de un anumit atribut. Uneori, cercetătorii folosesc alți termeni în loc de „grupuri”: „districte” și „zone”. Apoi, din fiecare grup, un anumit număr de unități este selectat aleatoriu proporțional cu ponderea grupului în populația totală. O selecție tipică este adesea efectuată în mai multe etape.

Eșantionarea în serie este o metodă în care selecția unităților se efectuează în grupuri (serie) și toate unitățile din grupul (seriele) selectate sunt supuse examinării. Avantajul acestei metode este că uneori este mai dificil să selectați unități individuale decât serii, de exemplu, atunci când studiați o persoană care ispășește o pedeapsă. În zonele, zonele selectate, se aplică studiul tuturor unităților fără excepție, de exemplu, studiul tuturor persoanelor care execută pedepse într-o anumită instituție.

Strada Kievyan, 16 0016 Armenia, Erevan +374 11 233 255

Eșantionarea în 1C 8.2 și 8.3 este o modalitate specializată de sortare a înregistrărilor tabelelor din baza de informații. Să aruncăm o privire mai atentă la ce este eșantionarea și cum se utilizează.

Ce este o probă în 1C?

Probă- o modalitate de sortare a informațiilor în 1C, care constă în plasarea secvenţială a cursorului pe următoarea înregistrare. O selecție în 1C poate fi obținută din rezultatul interogării și din managerul de obiecte, de exemplu, documente sau directoare.

Un exemplu de obținere și iterare de la un manager de obiecte:

Selectie = Directoare. Băncile. Alegeți() ; În timp ce selecția. Next() Cycle EndCycle ;

Un exemplu de obținere a unei selecții dintr-o interogare:

Obțineți 267 de lecții video 1C gratuit:

Solicitare = Solicitare nouă( „Selectați legătura, codul, numele din director. Bănci”); Sample = Solicitare. A executa() . Alegeți() ; În timp ce selecția. Buclă Next() //efectuați acțiuni interesante cu directorul „Bănci”. EndCycle ;

Ambele exemple de mai sus obțin aceleași seturi de date pentru a repeta.

Metode de eșantionare 1C 8.3

Selecția are un număr mare de metode, să le analizăm mai detaliat:

  • Alege()- o metodă prin care se obține direct o probă. Din selecție, puteți obține o altă selecție, subordonată, dacă este specificat tipul de ocolire „prin grupare”.
  • Proprietar() este metoda inversă a lui Select(). Vă permite să obțineți selecția de interogare „părinte”.
  • Următorul()- o metodă care mută cursorul la următoarea înregistrare. Returnează True dacă înregistrarea există, False dacă nu mai există înregistrări.
  • Găsește următorul()- o metoda foarte utila prin care se poate itera doar peste campurile necesare dupa valoarea selectiei (selectie - structura campului).
  • NextByFieldValue()- vă permite să obțineți următoarea înregistrare cu o valoare diferită de poziția curentă. De exemplu, este necesar să sortați toate înregistrările cu o valoare unică a câmpului „Cont”: Selection.NextBy FieldValue („Cont”).
  • Resetare()- vă permite să resetați locația curentă a cursorului și să o setați la poziția inițială.
  • Cantitate()- returnează numărul de înregistrări din selecție.
  • Obține()- folosind metoda, puteți seta cursorul pe înregistrarea dorită după valoarea indexului.
  • Nivel() - nivel în ierarhia intrării curente (număr).
  • Tipul de înregistrare()— afișează tipul de înregistrare — DetailRecord, GroupTotal, HierarchyTotal sau GrandTotal
  • grupare()- returnează numele grupării curente, dacă înregistrarea nu este o grupare - un șir gol.

Dacă începeți să învățați programarea 1C, vă recomandăm cursul nostru gratuit (nu uitați

Elemente, care este acoperită de experiment (observare, sondaj).

Caracteristicile eșantionului:

  • Caracteristicile calitative ale eșantionului - ce alegem exact și ce metode de eșantionare folosim pentru aceasta.
  • Caracteristica cantitativă a eșantionului este câte cazuri selectăm, cu alte cuvinte, dimensiunea eșantionului.

Nevoia de eșantionare:

  • Obiectul de studiu este foarte larg. De exemplu, consumatorii produselor unei companii globale sunt un număr mare de piețe dispersate geografic.
  • Este nevoie de a colecta informații primare.

YouTube enciclopedic

    1 / 5

    ✪ Eșantion: calculul volumului. Fiabilitatea și puterea cercetării. Biostatistica.

    ✪ 02 - Mat. statistici. Eșantion Spațiu eșantion. Exemple

    ✪ Noțiuni de bază SQL pentru începători | Preluarea valorilor din baza de date

    ✪ SQL pentru începători (DML): Selectarea dintr-un tabel (MySql), Lecția 4!

    Productie SIP panouri. Partea 2. Tăiere și tăiere ondulată. Selectarea canelurilor. Toate în minte

    Subtitrări

Marime de mostra

Marime de mostra - numărul de cazuri incluse în eșantion.

Eșantioanele pot fi împărțite condiționat în mari și mici, deoarece în statistica matematică sunt utilizate abordări diferite, în funcție de dimensiunea eșantionului. Se crede că eșantioanele mai mari de 30 pot fi clasificate ca fiind mari.

Eșantioane dependente și independente

Când se compară două (sau mai multe) mostre, dependența lor este un parametru important. Dacă este posibil să se stabilească o pereche homomorfă (adică atunci când un caz din proba X corespunde unui singur caz din proba Y și invers) pentru fiecare caz în două eșantioane (și această bază de relație este importantă pentru trăsătură măsurate în probe), astfel de eșantioane se numesc dependent. Exemple de selecții dependente:

  • pereche de gemeni
  • două măsurători ale oricărei caracteristici înainte și după expunerea experimentală,
  • soți și soții
  • etc.

Dacă nu există o astfel de relație între eșantioane, atunci aceste eșantioane sunt luate în considerare independent, de exemplu:

  • bărbați și femei ,
  • psihologi și matematicieni.

În consecință, eșantioanele dependente au întotdeauna aceeași dimensiune, în timp ce dimensiunea eșantioanelor independente poate diferi.

Eșantioanele sunt comparate folosind diverse criterii statistice:

  • Criteriul Pearson (χ 2 )
  • Criteriul Student ( t )
  • criteriul Wilcoxon ( T )
  • Criteriul Mann - Whitney ( U )
  • Semne de criteriu ( G )
  • si etc.

Reprezentativitatea

Eșantionul poate fi considerat reprezentativ sau nereprezentator. Eșantionul va fi reprezentativ atunci când se examinează un grup mare de persoane, dacă în cadrul acestui grup există reprezentanți ai diferitelor subgrupuri, doar astfel se pot trage concluzii corecte.

Un exemplu de eșantion nereprezentativ

  1. Studiu cu grupuri experimentale și de control, care sunt plasate în condiții diferite.
    • Studiați cu grupuri experimentale și de control folosind o strategie de selecție pereche
  2. Studiați folosind un singur grup - experimental.
  3. Un studiu care utilizează un plan mixt (factorial) - toate grupurile sunt plasate în condiții diferite.

Tipuri de mostre

Probele sunt împărțite în două tipuri:

  • probabilistică
  • improbabilitate

Probe probabilistice

  1. Eșantionare probabilă simplă:
    • Reeșantionare simplă. Utilizarea unui astfel de eșantion se bazează pe ipoteza că fiecare respondent are șanse egale de a fi inclus în eșantion. Pe baza listei populației generale se întocmesc fișe cu numărul de respondenți. Ele sunt puse într-un pachet, amestecate și o carte este scoasă din ele la întâmplare, se notează un număr, apoi se returnează înapoi. În plus, procedura se repetă de câte ori avem nevoie de dimensiunea eșantionului. Minus: repetarea unităților de selecție.

Procedura de construire a unui eșantion aleator simplu include următorii pași:

1) trebuie să obțineți lista plina membri ai populației generale și numerotați această listă. O astfel de listă, rechemare, se numește cadru de eșantionare;

2) determinați dimensiunea eșantionului așteptat, adică numărul așteptat de respondenți;

3) extrageți câte numere din tabelul de numere aleatoare avem nevoie de unități de probă. Dacă eșantionul ar trebui să includă 100 de persoane, 100 de numere aleatorii sunt luate din tabel. Aceste numere aleatorii pot fi generate de un program de calculator.

4) selectați din lista de bază acele observații ale căror numere corespund numerelor aleatoare scrise

  • O mostră simplă aleatorie are avantaje evidente. Această metodă este extrem de ușor de înțeles. Rezultatele studiului pot fi extinse la populația studiată. Cele mai multe abordări ale inferenței statistice implică colectarea de informații folosind un eșantion aleator simplu. Cu toate acestea, metoda simplă de eșantionare aleatorie are cel puțin patru limitări semnificative:

1) este adesea dificil să se creeze un cadru de eșantionare care să permită o probă simplă aleatorie.

2) rezultatul aplicării unui eșantion aleator simplu poate fi o populație mare, sau o populație distribuită pe o zonă geografică mare, ceea ce crește semnificativ timpul și costul culegerii datelor.

3) rezultatele aplicării unui eșantion aleator simplu sunt adesea caracterizate de o acuratețe scăzută și o eroare standard mai mare decât rezultatele aplicării altor metode probabilistice.

4) ca urmare a aplicării SRS, se poate forma o probă nereprezentativă. Deși eșantioanele obținute prin selecție aleatorie simplă, în medie, reprezintă adecvat populația generală, unele dintre ele reprezintă extrem de incorect populația studiată. Probabilitatea acestui lucru este deosebit de mare cu o dimensiune mică a eșantionului.

  • Eșantionare simplă nerepetitivă. Procedura de construire a eșantionului este aceeași, doar cărțile cu numerele respondenților nu sunt returnate înapoi în pachet.
  1. Eșantionarea probabilă sistematică. Este o versiune simplificată a unui eșantion de probabilitate simplu. Pe baza listei populației generale, respondenții sunt selectați la un anumit interval (K). Valoarea lui K este determinată aleatoriu. Rezultatul cel mai de încredere este obținut cu o populație generală omogenă, altfel dimensiunea treptei și unele modele ciclice interne ale eșantionului pot coincide (amestecarea probei). Contra: la fel ca într-un eșantion de probabilitate simplă.
  2. Eșantionare în serie (imbricată). Unitățile de eșantionare sunt serii statistice (familie, școală, echipă etc.). Elementele selectate sunt supuse unei examinări continue. Selecția unităților statistice poate fi organizată în funcție de tipul de eșantionare aleatorie sau sistematică. Contra: Posibilitatea unei omogenități mai mari decât în ​​populația generală.
  3. Probă zonată. În cazul unei populații eterogene, înainte de a utiliza eșantionarea probabilă cu orice tehnică de selecție, se recomandă împărțirea populației în părți omogene, un astfel de eșantion se numește eșantion zonat. Grupurile de zonare pot fi atât formațiuni naturale (de exemplu, districte de oraș) cât și orice caracteristică care stă la baza studiului. Semnul pe baza căruia se realizează împărțirea se numește semn de stratificare și zonare.
  4. Selecție „convenabilă”. Procedura de eșantionare „convenient” constă în stabilirea de contacte cu unități de prelevare „conveniente” – cu un grup de elevi, o echipă sportivă, cu prietenii și vecinii. Dacă este necesar să obțineți informații despre reacțiile oamenilor la un nou concept, un astfel de eșantion este destul de rezonabil. Eșantionarea „convenient” este adesea folosită pentru testarea preliminară a chestionarelor.

Mostre incredibile

Selecția într-un astfel de eșantion se efectuează nu după principiile hazardului, ci după criterii subiective - accesibilitate, tipicitate, reprezentare egală etc.

  1. Eșantion de cotă - eșantionul este construit ca un model care reproduce structura populației generale sub formă de cote (proporții) ale caracteristicilor studiate. Numărul elementelor eșantionului cu o combinație diferită a caracteristicilor studiate este determinat în așa fel încât să corespundă ponderii (proporției) acestora în populația generală. Deci, de exemplu, dacă avem o populație generală de 5.000 de oameni, dintre care 2.000 de femei și 3.000 de bărbați, atunci în eșantionul de cotă vom avea 20 de femei și 30 de bărbați, sau 200 de femei și 300 de bărbați. Eșantioanele de cote se bazează cel mai adesea pe criterii demografice: sex, vârstă, regiune, venit, educație și altele. Contra: de obicei, astfel de mostre nu sunt reprezentative, deoarece este imposibil să luați în considerare mai mulți parametri sociali simultan. Pro: material ușor accesibil.
  2. Metoda bulgărelui de zăpadă. Eșantionul este construit după cum urmează. Fiecare respondent, începând cu primul, este rugat să-și contacteze prietenii, colegii, cunoscuții care s-ar încadra în condițiile de selecție și ar putea lua parte la studiu. Astfel, cu excepția primului pas, eșantionul este format cu participarea obiectelor de studiu în sine. Metoda este adesea folosită atunci când este necesară găsirea și intervievarea unor grupuri de respondenți greu accesibile (de exemplu, respondenți cu venituri mari, respondenți care aparțin aceluiași grup profesional, respondenți care au unele hobby-uri/pasiuni similare etc. )
  3. Eșantionarea spontană - prelevarea așa-numitului „primul venit”. Folosit adesea în sondaje de televiziune și radio. Mărimea și compoziția eșantioanelor spontane nu este cunoscută dinainte și este determinată de un singur parametru - activitatea respondenților. Dezavantaje: este imposibil de stabilit ce tip de populație generală reprezintă respondenții și, ca urmare, este imposibil să se determine reprezentativitatea.
  4. Sondaj de traseu - folosit adesea dacă unitatea de studiu este familia. Pe harta localității în care se va efectua sondajul sunt numerotate toate străzile. Folosind un tabel (generator) de numere aleatorii, sunt selectate numere mari. Fiecare număr mare este considerat ca fiind format din 3 componente: numărul străzii (2-3 primele numere), numărul casei, numărul apartamentului. De exemplu, numărul 14832: 14 este numărul străzii de pe hartă, 8 este numărul casei, 32 este numărul apartamentului.
  5. Eșantionare zonată cu selecție de obiecte tipice. Dacă, după zonare, din fiecare grup este selectat un obiect tipic, adică un obiect care se apropie de media pentru majoritatea caracteristicilor studiate în studiu, un astfel de eșantion se numește zonat cu selecția obiectelor tipice.
  6. selecția modală.
  7. Eșantion de expert.
  8. eșantion eterogen.

Strategii de construire a grupului

Selecția grupurilor pentru participarea lor la un experiment psihologic se realizează folosind diverse strategii, care sunt necesare pentru a asigura cea mai mare conformitate cu valabilitatea internă și externă.

Randomizare

Randomizare, sau selectie aleatorie, este folosit pentru a crea mostre aleatoare simple. Utilizarea unui astfel de eșantion se bazează pe presupunerea că fiecare membru al populației este la fel de probabil să fie inclus în eșantion. De exemplu, pentru a face un eșantion aleatoriu de 100 de studenți universitari, puteți pune bucăți de hârtie cu numele tuturor studenților universitari într-o pălărie și apoi puteți scoate 100 de bucăți de hârtie din ea - aceasta va fi o selecție aleatorie (Goodwin J. , p. 147)......

Selecție în perechi

Selecție în perechi- o strategie de construire a grupelor de eșantion, în care grupurile de subiecți sunt alcătuite din subiecți echivalenti din punct de vedere al parametrilor laterali care sunt semnificativi pentru experiment. Această strategie este eficientă pentru experimentele care utilizează grupuri experimentale și de control cu cea mai bună opțiune- atragerea de perechi de gemeni (mono - și dizigoți).

Selecția stratometrică

Selecția stratometrică- randomizare cu alocarea straturilor (sau clusterelor). Prin această metodă de eșantionare, populația generală este împărțită în grupuri (straturi) cu anumite caracteristici (sex, vârstă, preferințe politice, educație, nivel de venit etc.), și sunt selectați subiecți cu caracteristicile corespunzătoare.

Modelare aproximativă

Modelare aproximativă- întocmirea de eșantioane limitate și generalizarea concluziilor despre acest eșantion la o populație mai largă. De exemplu, atunci când participă la un studiu al studenților din anul 2 de universitate, datele acestui studiu sunt extinse la „persoanele cu vârsta cuprinsă între 17 și 21 de ani”. Admisibilitatea unor astfel de generalizări este extrem de limitată.

Modelarea aproximativă este formarea unui model care, pentru o clasă clar definită de sisteme (procese), își descrie comportamentul (sau fenomenele dorite) cu o acuratețe acceptabilă.

Conceptul de „reprezentativitate” în raport cu sondajele sociologice – sondaje de opinie publică – are un efect aproape magic asupra oamenilor. Termenul „reprezentare” în sine are, pe lângă științific, și un sens clar politic.

Care este motivul? Chestia este că se presupune că eșantionul (un grup de persoane selectate pentru sondaj) poate reprezenta (reprezenta) întreaga populație. Populația generală în cazul sondajelor în întregime rusă este întreaga populație a țării. Acum să ne imaginăm asta vorbim despre despre o decizie politică - susținerea unui proiect de lege sau votul la alegeri. Cu ajutorul unui sondaj prin sondaj, obținem un excelent mecanism de reprezentare politică - un mecanism în care un grup mic de oameni poate reprezenta opinia sau poziția întregii populații a țării. Prin urmare, reprezentativității studiului i se acordă un loc atât de important.

Conceptul de reprezentativitate este folosit, desigur, nu numai în studiile politice. Termenul este folosit aproape întotdeauna când se vorbește despre studii ample, fie în domeniul marketingului, al comportamentului economic sau al educației.

Metodologia anchetelor reprezentative

Cum, după sondajul a 1.500 de persoane, se poate trage concluzii despre toți rușii, dintre care sunt peste 140 de milioane (și chiar și alegători peste 110 milioane)? Tehnologia din spatele sondajelor reprezentative se bazează pe legi statistice. Cel mai apropiat motiv este legea numerelor mari sau teorema lui Bernoulli.

Simplificat, sensul său poate fi transmis după cum urmează. Să presupunem că avem o caracteristică, de exemplu, cantitatea de precipitații pe zi în Ekaterinburg în timpul secolului al XX-lea. Dacă scriem toate valorile sale împreună cu frecvența lor (aceasta se numește distribuție), apoi luăm aleatoriu un număr suficient de mare de cazuri (adică nu toate zilele din secolul al XX-lea, ci destul de multe), atunci vom vedea că distribuția în eșantionul nostru va fi foarte asemănătoare cu distribuția pentru întregul secol XX. Astfel, dacă selectăm unele unități din populație, acestea pot reprezenta într-adevăr întreaga populație și nu este cu adevărat necesar să colectăm date pentru toate cazurile.

Cu toate acestea, există o condiție cheie: aceasta este adevărată numai dacă selecția este strict aleatorie. Singura problemă aici poate fi abaterea de la aleatoriu. Astfel, dacă luăm doar date despre precipitații pt anul trecut(de exemplu, pentru că aceste date sunt mai ușor de găsit) sau intervievăm 1500 dintre cunoscuții noștri (pentru că este mai ușor să-i contactăm), și nu persoane aleatorii, atunci eșantionul cu siguranță nu va fi reprezentativ.

Imaginați-vă că din 143,5 milioane de ruși, selectați aleatoriu cei 1.500 de oameni de care aveți nevoie. Apoi, de exemplu, proporția de manageri de mijloc dintre aceștia va fi aproximativ egală cu proporția de manageri de mijloc din populația generală, ceea ce arată că eșantionul dumneavoastră poate reprezenta întreaga populație. Se poate întâmpla ca acești doi indicatori să fie foarte diferiți? De exemplu, printre ruși este de 14%, dar în eșantion va fi doar 1%? Teoretic, acest lucru este posibil, dar probabilitatea este atât de mică încât poate fi neglijată (cum ar fi întâlnirea cu un dragon pe stradă).

Mai mult, cel mai plăcut lucru la această probabilitate nu este nici măcar că este mică, ci că pentru procese aleatorii această probabilitate poate fi calculată. Putem spune cu ce probabilitate valoarea eșantionului nostru se va abate de la valoarea populației generale cu 13% (ca în exemplul de mai sus) și cu care, să zicem, cu 2,5%. De obicei, totuși, aceștia procedează invers: în primul rând, determină probabilitatea cu care dorim ca valoarea noastră să nu devieze de la valoarea din populația generală (cel mai adesea este fixată la nivelul de 95%) și apoi se uită la magnitudinea abaterii pentru o anumită dimensiune a eșantioanelor. Această abatere se numește interval de încredere, uneori denumit eroare de eșantionare sau eroare statistică și este adesea enumerată alături de rezultatele sondajului.

Deci, probabilitatea abaterii, valoarea abaterii (intervalul de încredere) și dimensiunea eșantionului sunt legate. Pe baza acestui fapt, formula de calcul a mărimii eșantionului este următoarea:

unde n este dimensiunea eșantionului, Δ este intervalul de încredere, z este valoarea funcției de distribuție normală pentru o probabilitate dată de respingere (pentru o probabilitate de 5%, această valoare este 1,96).

Aceasta este o formulă simplificată, sondajele reale folosesc formule puțin mai complexe. Această formulă poate eșua și dacă valoarea indicatorului este foarte diferită de 50% (deci, de exemplu, această formulă nu este potrivită pentru estimarea proporției de pacienți cu o boală rară într-o țară).

Iată ce se întâmplă dacă înlocuiți unele valori în această formulă:

Cu alte cuvinte, dacă am luat un eșantion aleatoriu de ruși cu o dimensiune de 1600 de persoane și am estimat un indicator, de exemplu, dorința de a vota pentru un anumit politician, atunci cu o probabilitate de 95% estimarea noastră nu va diferi de disponibilitatea să-l voteze printre toți rușii cu mai mult de 2, 45%.

Marime de mostra

Şi ce dacă marime mai mare eșantion, cu atât este mai probabil să fim mai aproape de o pondere în populație. S-ar părea că aceasta înseamnă că trebuie să încercăm să aducem eșantionul mai aproape de 143,5 milioane.De fapt, după cum puteți vedea din tabel, natura proceselor aleatoare este de așa natură încât de la un anumit moment probabilitatea de a cădea în interval începe să crească foarte încet (și acest moment vine destul de repede). După ce eșantionăm 1500 de unități, indiferent cât de mult am crește dimensiunea eșantionului, probabilitatea ca valoarea eșantionului nostru să cadă în valoarea populației va crește foarte, foarte lent.

De fapt, nu există aproape nicio diferență între 1.500 și 10.000 de respondenți. Undeva până în 1500 putem spune deja că estimările noastre vor diferi de ponderea în populația generală cu 2-3%. Dacă creștem în continuare eșantionul, atunci această posibilă eroare va scădea, dar foarte ușor. Cu alte cuvinte, un eșantion de 100.000 este mai bun decât un eșantion de 2500, dar diferența este atât de mică încât nu are sens și, în cazul anchetelor sociale, nu este justificată economic. De obicei, creșterea eșantionului este costisitoare și, prin urmare, nu are sens să-l umflați pentru a câștiga un punct procentual în valoarea intervalului de încredere.

Este important ca dimensiunea populației generale să nu apară deloc în formulă. Faptul este că atunci când populația este mare (mai mult de 20.000), nu are niciun efect asupra dimensiunii eșantionului. Astfel, nu trebuie să știm câți oameni trăiesc în Rusia pentru a construi un eșantion reprezentativ. Este clar că alegerea a 1500 din 2000 cel mai probabil nu are sens - este mai ușor să examinezi 2000 și să obții o estimare precisă. Dar, dacă este necesar, făcând un eșantion, avem ocazia de a generaliza rezultatele acestuia pentru populația generală. Și din același motiv, dimensiunea eșantionului nu va diferi pentru țările mari și mici.

Reprezentativitate și acuratețe

Pentru a înțelege semnificația conceptului de „reprezentativitate”, să luăm în considerare un eșantion de 15 persoane. Destul de ciudat, dacă ai făcut-o din întâmplare, este și reprezentativ. Mai mult, puteți face o mostră dintr-o unitate. Imaginați-vă o cutie de bile din care trageți la întâmplare o minge. Dacă este o minge aleasă aleatoriu, atunci va reprezenta și toate bilele care se află în această casetă. El îi va reprezenta doar. nu chiar. De ce? Pentru că există o probabilitate foarte mare de a greși. Data viitoare putem trage o altă minge și ne putem face o altă idee despre bilele din cutie. A reprezenta incorect înseamnă a avea o gamă largă de estimări.

La fel, 15 persoane reprezintă orice populație generală, dar o reprezintă inexact, deoarece eroarea, intervalul de încredere, este foarte mare. Va trebui să adăugăm +/- 33% pentru a obține o șansă de 95% să cădem în interval. Dacă suntem gata să recunoaștem acest lucru, atunci luăm 15 oameni, aflăm că 7 dintre ei sunt manageri de mijloc și apoi obținem o estimare că 7/15 din total, adică 47% +/- 33%, este ponderea estimată a managerilor în populația generală, iar aceasta este o concluzie absolut corectă. Doar că nu are valoare. Am putea spune asta fără examinare. Prin urmare, atunci când planificați un eșantion, este logic să obțineți un volum care să fie adecvat din punct de vedere al rentabilității.

Toate cele de mai sus sunt menite să transmită o idee simplă, care de multe ori nu este realizată: dimensiunea eșantionului nu este legată de reprezentativitatea acestuia.

Un eșantion mic este imprecis, dar poate fi totuși reprezentativ. Dimensiunile eșantionului care sunt folosite astăzi în anchetele de masă din Rusia au aproape întotdeauna o precizie destul de ridicată.

Reprezentativitatea eșantionului este amenințată nu de dimensiunea sa, ci de părtinire, adică de abaterea de la principiul aleatoriei.

Încălcarea principiului aleatoriei

Dacă începem să alegem unități non-aleatorie, eșantionul devine nereprezentator. De exemplu, dacă ceva ne împiedică să le selectăm aleatoriu. Imaginează-ți că vrem să selectăm bile din cutia noastră la întâmplare, dar apoi se dovedește că unele dintre bile mușcă. Mecanismul prin care vom lua doar acele bile care ne sunt date este un mecanism care încalcă aleatorietatea și, prin urmare, încalcă reprezentativitatea. În acest caz, indiferent câte bile vom lua din cutie (chiar dacă luăm toate bilele care nu mușcă), vom avea o probă nereprezentativă, pentru că nu vom număra niciuna dintre cele care mușcă - pur și simplu ocolesc mostra noastră.

Cea mai mare problemă cu bile care mușcă este că pot fi diferite de cele care vin în mâinile noastre și diferă exact în modul în care ne interesează. Această situație se numește prejudecată de eșantionare.

Este necesar să distingem situația de reprezentare inexactă, pe care am descris-o mai sus, de situația de nereprezentare. Acestea sunt probleme diferite și ele căi diferite solutii. Nu poți rezolva una dintre ele rezolvându-l pe cealaltă. Dacă eșantionul este lipsit de reprezentativitate, este inutil să îl creștem. Mai mult, eșantioanele mari din anchetele sociale tind să acumuleze erori, astfel încât problema reprezentării nu poate fi agravată decât de o creștere mare a dimensiunii eșantionului.

De ce este imposibilă reprezentativitatea?

În notele la tabelele cu rezultatele sondajelor, se poate observa adesea că „mărimea eșantionului este de 1600 de persoane, eșantionul este reprezentativ pentru sex și vârstă”. Din cele spuse mai sus, este evident că aceștia sunt doi parametri diferiți: o indicație de reprezentativitate nu este legată de dimensiunea eșantionului. De fapt, ceea ce se înțelege aici este că au fost urmate anumite proceduri pentru a asigura corespondența dintre eșantion și populație. De exemplu, pentru a asigura reprezentativitatea pe sex, bărbații și femeile sunt recrutați în eșantion în aceleași proporții care există în rândul rușilor conform datelor recensământului. Dar reprezentativitatea după sex nu înseamnă reprezentativitate, de exemplu, după opiniile politice.

De ce este necesară alinierea eșantionului pe gen și alte categorii socio-demografice? Pentru că doar un eșantion aleatoriu poate oferi o adevărată reprezentativitate și este imposibil de implementat în practică din multe motive. De îndată ce încercați să faceți acest lucru, veți întâmpina o mulțime de probleme - indiferent de metoda pe care alegeți să utilizați. Unii respondenți nu vor fi deloc disponibili pentru metoda dvs. (de exemplu, pentru interviurile personale, casele cu interfoane și securitate sunt o mare problemă), o altă parte va fi absentă, nu va răspunde sau preferă să-și facă treaba. Sunt oameni care au probleme cu limba și nu pot vorbi cu noi. Sunt oameni care nu înțeleg de ce este necesar acest lucru și nu vor să vorbească cu noi. Toate acestea sunt încălcări grave ale aleatoriei, care fac imposibilă realizarea acesteia.

Cei care reduc problema reprezentării în anchetele de masă la statistici uită că oamenii sunt marmură foarte specifică. Sunt bile care aleargă și se ascund. Sunt bile care mușcă. Nu sunt obiecte pasive, ci lovesc înapoi. Ei spun: „Nu vreau să particip la sondajul tău”, încălcând astfel aleatoriu. Prin urmare, în sensul strict al cuvântului, reprezentativitatea în anchetele de masă, desigur, este imposibilă sub orice formă.

S-a dezvoltat un mecanism prin care se asigură de obicei aspectul reprezentativității: aliniem eșantionul în unele categorii și pretindem că este aliniat și în toate celelalte categorii posibile. De fapt, nu avem niciun motiv să afirmăm acest lucru. Dar problema este că nu există nicio modalitate de a verifica acest lucru - din nou, din cauza faptului că unele bile mușcă. Pentru a verifica părtinirea, examinatorul ar trebui să meargă la cei pe care nu i-am intervievat și să îi intervieveze. Dar ei, după cum ne amintim, nu doresc deloc să fie chestionați. Este imposibil să-i interoghezi pe cei care nu răspund categoric. Prin urmare, toată lumea lucrează pe ipoteza că, dacă aliniem eșantionul pe doi sau trei parametri, acesta reprezintă întreaga populație, deși nu există o bază serioasă pentru această ipoteză.

Eșantionarea reprezentativă este o tehnologie împrumutată de sociologi din statistică. Prin urmare, poartă inevitabil elemente ale tabloului matematic și statistic al lumii. Probabil cea mai puternică presupunere este că sondajul în sine este neutru din punct de vedere politic și sociologic: participarea și neparticiparea la sondaj nu au semnificație politică și nu sunt legate de alți parametri importanți din punct de vedere sociologic. Dar astăzi, sondajele au devenit una dintre principalele instituții politice și au devenit un intermediar cheie între marile corporații și consumatori. În aceste condiții, nu se mai poate crede în sterilitatea lor politică. Cu toate acestea, știm încă puține despre modul în care sunt înțelese sondajele societăţile moderneși ceea ce reprezintă de fapt.

Articole similare

2022 videointerfons.ru. Handyman - Aparate de uz casnic. Iluminat. Prelucrarea metalelor. Cutite. Electricitate.