Raksti

3.4.: Datu atrašanās vietas mērījumi


Kopējie atrašanās vietas mērījumi ir kvartiles un procentiles. Kvartiles ir īpašas procentiles. Pirmā kvartile, J1, ir tāds pats kā 25th procentile un trešā kvartile, J3, ir tāds pats kā 75th procentile. Mediāna, M, sauc gan par otro kvartili, gan par 50th procentile.

Lai aprēķinātu kvartiles un procentiles, datiem jābūt sakārtotiem no mazākā līdz lielākajam. Kvartiles sadala sakārtotos datus ceturtdaļās. Procentiles sadala sakārtotos datus simtdaļās. Lai gūtu vārtus 90th eksāmena procentile nenozīmē, ka jūs pārbaudē saņēmāt 90%. Tas nozīmē, ka 90% testa rezultātu ir vienādi vai mazāki par jūsu rezultātiem un 10% no testa rezultātiem ir vienādi vai lielāki par jūsu testa rezultātiem.

Procenti ir noderīgi, lai salīdzinātu vērtības. Šī iemesla dēļ universitātes un koledžas plaši izmanto procentiles. Viens gadījums, kad koledžas un universitātes izmanto procentiles, ir SAT rezultāti, lai noteiktu minimālo testēšanas rezultātu, kas tiks izmantots kā pieņemšanas koeficients. Piemēram, pieņemsim, ka hercogs pieņem SAT rādītājus 75 vai augstākth procentile. Tas nozīmē vismaz 1220 punktu skaitu.

Procenti tiek izmantoti galvenokārt ar ļoti lielām populācijām. Tāpēc, ja jūs teiktu, ka 90% testa rezultātu ir mazāki (un nav vienādi vai mazāk) nekā jūsu rezultāti, tas būtu pieņemami, jo vienas noteiktas datu vērtības noņemšana nav būtiska.

The mediāna ir skaitlis, kas mēra datu "centru". Jūs varat domāt par mediānu kā par "vidējo vērtību", taču tai faktiski nav jābūt vienai no novērotajām vērtībām. Tas ir skaitlis, kas sakārtotos datus atdala uz pusēm. Puse vērtībām ir vienāds vai mazāks par vidējo, bet puse vērtību ir vienāds vai lielāks. Piemēram, ņemiet vērā šādus datus.

1; 11.5; 6; 7.2; 4; 8; 9; 10; 6.8; 8.3; 2; 2; 10; 1

Pasūtīts no mazākā līdz lielākajam:

1; 1; 2; 2; 4; 6; 6.8; 7.2; 8; 8.3; 9; 10; 10; 11.5

Tā kā ir 14 novērojumi, mediāna ir starp septīto vērtību 6,8 un astoto vērtību 7,2. Lai atrastu mediānu, saskaitiet abas vērtības kopā un daliet ar divām.

[ dfrac {6.8 + 7.2} {2} = 7 ]

Mediāna ir septiņi. Puse no vērtībām ir mazāka par septiņām un puse no vērtībām ir lielāka par septiņām.

Kvartiles ir skaitļi, kas datus sadala ceturkšņos. Kvartiles var būt vai nebūt datu daļa. Lai atrastu kvartiles, vispirms atrodiet vidējo vai otro kvartili. Pirmā kvartile, J1, ir datu apakšējās puses vidējā vērtība un trešā kvartile, J3, ir datu augšējās puses vidējā vērtība jeb mediāna. Lai iegūtu ideju, apsveriet to pašu datu kopu:

1; 1; 2; 2; 4; 6; 6.8; 7.2; 8; 8.3; 9; 10; 10; 11.5

Mediāna vai otrā kvartile ir septiņi. Datu apakšējā puse ir 1, 1, 2, 2, 4, 6, 6.8. Apakšējās puses vidējā vērtība ir divas.

1; 1; 2; 2; 4; 6; 6.8

Numurs divi, kas ir daļa no datiem, ir pirmā kvartile. Ceturtā daļa no visām vērtību kopām ir vienāda vai mazāka par divām, un trīs ceturtdaļas no vērtībām ir vairāk nekā divas.

Datu augšējā puse ir 7,2, 8, 8,3, 9, 10, 10, 11,5. Augšējās puses vidējā vērtība ir deviņi.

The trešā kvartile, J3, ir deviņi. Trīs ceturtdaļas (75%) no pasūtītās datu kopas ir mazāk nekā deviņas. Ceturtā daļa (25%) no pasūtītās datu kopas ir lielāka par deviņām. Trešā kvartile ir daļa no šajā piemērā esošo datu kopas.

The starpkvartilu diapazons ir skaitlis, kas norāda vidējās puses vai vidējo 50% datu izplatību. Tā ir atšķirība starp trešo kvartili (J3) un pirmā kvartile (J1).

[IQR = Q_3 - Q_1 tags {2.4.1} ]

The IQR var palīdzēt noteikt potenciālu ārējie rādītāji. Tiek uzskatīts, ka vērtība ir potenciāls iznākums, ja tā ir mazāka par (1,5) (IQR) zem pirmās kvartiles vai lielāks par (1,5) (IQR) virs trešās kvartiles. Iespējamie zaudējumi vienmēr prasa papildu izmeklēšanu.

Definīcija: Ārējie rādītāji

Potenciālais iznākums ir datu punkts, kas ievērojami atšķiras no citiem datu punktiem. Šie īpašie datu punkti var būt kļūdas vai kāda veida novirze, vai arī tie var būt atslēga datu izpratnei.

2.4.1. Piemērs

Par šādām 13 nekustamā īpašuma cenām aprēķiniet IQR un nosakiet, vai kādas cenas ir potenciālie zaudējumi. Cenas ir norādītas dolāros.

389,950; 230,500; 158,000; 479,000; 639,000; 114,950; 5,500,000; 387,000; 659,000; 529,000; 575,000; 488,800; 1,095,000

Atbilde

Pasūtiet datus no mazākā līdz lielākajam.

114,950; 158,000; 230,500; 387,000; 389,950; 479,000; 488,800; 529,000; 575,000; 639,000; 659,000; 1,095,000; 5,500,000

[M = 488 800 bez numura]

[Q_ {1} = dfrac {230,500 + 387,000} {2} = 308,750 nonumber ]

[Q_ {3} = dfrac {639,000 + 659,000} {2} = 649,000 nonumber ]

[IQR = 649 000 - 308 750 = 340 250 bez skaita]

[(1.5) (IQR) = (1.5) (340.250) = 510.375 nonumber ]

[Q_ {1} - (1,5) (IQR) = 308,750 - 510,375 = –201,625 nonumber ]

[Q_ {3} + (1,5) (IQR) = 649 000 + 510 375 = 1 159 375 skaitlis ]

Neviena mājas cena nav mazāka par –201625. Tomēr 5 500 000 ir vairāk nekā 1 159 375. Tāpēc 5 500 000 ir potenciāls ārējs.

2.4.1

Aprēķiniet nākamajām 11 algām IQR un nosakiet, vai kādas algas ir lielākas. Algas ir dolāros.

$33,000; $64,500; $28,000; $54,000; $72,000; $68,500; $69,000; $42,000; $54,000; $120,000; $40,500

Atbilde

Pasūtiet datus no mazākā līdz lielākajam.

$28,000; $33,000; $40,500; $42,000; $54,000; $54,000; $64,500; $68,500; $69,000; $72,000; $120,000

Mediāna = 54 000 USD

[Q_ {1} = 40 500 USD bez numuriem]

[Q_ {3} = $ 69 000 nonumber ]

[IQR = 69 000 USD - 40 500 USD = 28 500 USD nonumber ]

[(1.5) (IQR) = (1.5) (28.500 USD) = 42.750 $ nonumber ]

[Q_ {1} - (1,5) (IQR) = 40 500 USD - 42 750 USD = - 2250 USD nonumber ]

[Q_ {3} + (1,5) (IQR) = 69 000 USD + 42 750 USD = 111 750 USD nonumber ]

Neviena alga nav mazāka par - 2250 USD. Tomēr 120 000 USD ir vairāk nekā 11 750 USD, tāpēc 120 000 USD ir potenciāls izņēmums.

2.4.2. Piemērs

Abām datu kopām testa rezultātu piemērā atrodiet:

  1. Starpkvartilu diapazons. Salīdziniet abus starpkvartilu diapazonus.
  2. Jebkurš iznākums jebkurā komplektā.

Atbilde

Piecu numuru kopsavilkums dienas un nakts nodarbībām ir

MinimālaisJ1MediānaJ3Maksimums
Diena325674.582.599
Nakts25.578818998
  1. The IQR dienas grupai ir (Q_ {3} - Q_ {1} = 82,5 - 56 = 26,5 )

    The IQR nakts grupai ir (Q_ {3} - Q_ {1} = 89 - 78 = 11 )

    Dienas klases starpkvartilu diapazons (izplatība vai mainīgums) ir lielāks nekā nakts klase IQR. Tas liek domāt, ka dienas klases klases pārbaudījumu rezultātos būs vairāk atšķirību.

  2. Dienas klases lielākie rezultāti tiek atrasti, izmantojot IQR reizes 1,5 likumu. Tātad,
    • (Q_ {1} - IQR (1,5) = 56 - 26,5 (1,5) = 16,25 )
    • (Q_ {3} + IQR (1,5) = 82,5 + 26,5 (1,5) = 122,25 )

    Tā kā dienas klases minimālās un maksimālās vērtības ir lielākas par 16,25 un mazākas par 122,25, nav atšķirību.

    Nakts klases izņēmumus aprēķina šādi:

    • (Q_ {1} - IQR (1,5) = 78 - 11 (1,5) = 61,5 )
    • (Q_ {3} + IQR (1,5) = 89 + 11 (1,5) = 105,5 )

    Šajā klasē jebkurš ieskaites rezultāts, kas mazāks par 61,5, ir labāks. Tāpēc rādītāji 45 un 25,5 ir ārpus rezultātiem. Tā kā neviena testa rezultāts nav lielāks par 105,5, augšējā gala robežas nav.

2.4.2. Uzdevums

Atrodiet sekojošo divu datu kopu starpkvartilu diapazonu un salīdziniet tos.

Pārbaudes rezultāti par klasi A

69; 96; 81; 79; 65; 76; 83; 99; 89; 67; 90; 77; 85; 98; 66; 91; 77; 69; 80; 94

Pārbaudes rezultāti par klasi B

90; 72; 80; 92; 90; 97; 92; 75; 79; 68; 70; 80; 99; 95; 78; 73; 71; 68; 95; 100

Atbilde

Klase A

Pasūtiet datus no mazākā līdz lielākajam.

65; 66; 67; 69; 69; 76; 77; 77; 79; 80; 81; 83; 85; 89; 90; 91; 94; 96; 98; 99

(Mediāna = dfrac {80 + 81} {2} ) = 80,5

(Q_ {1} = dfrac {69 + 76} {2} = 72,5 )

(Q_ {3} = dfrac {90 + 91} {2} = 90,5 )

(IQR = 90,5 - 72,5 = 18 )

Klase B

Pasūtiet datus no mazākā līdz lielākajam.

68; 68; 70; 71; 72; 73; 75; 78; 79; 80; 80; 90; 90; 92; 92; 95; 95; 97; 99; 100

(Mediāna = dfrac {80 + 80} {2} = 80 )

(Q_ {1} = dfrac {72 + 73} {2} = 72,5 )

(Q_ {3} = dfrac {92 + 95} {2} = 93,5 )

(IQR = 93,5 - 72,5 = 21 )

Klases dati B ir lielāks IQR, tāpēc rādītāji starp J3 un J1 (vidēji 50%) klases datiem B ir vairāk izkliedēti un nav grupēti par mediānu.

2.4.3. Piemērs

Piecdesmit statistikas studentiem tika jautāts, cik daudz viņi guļ vienā skolas naktī (noapaļojot līdz tuvākajai stundai). Rezultāti bija:

MIEGA SUMMA SKOLAS NAKTĪ (STUNDAS)BIEŽUMSSAISTĪTĀ BIEŽUMSKUMULATĪVĀ RELATĪVA BIEŽUMS
420.040.04
550.100.14
670.140.28
7120.240.52
8140.280.80
970.140.94
1030.061.00

Atrodiet 28th procentile. Ievērojiet 0,28 slejā "kumulatīvais relatīvais biežums". Divdesmit astoņi procenti no 50 datu vērtībām ir 14 vērtības. Ir par 14 vērtībām mazāk nekā 28th procentile. Tie ietver divus 4, piecus 5 un septiņus 6. 28th procentile ir starp pēdējiem sešiem un pirmajiem septiņiem. 28th procentile ir 6,5.

Atrodiet vidējo. Vēlreiz apskatiet kolonnu "kumulatīvā relatīvā frekvence" un atrodiet 0,52. Mediāna ir 50th procentile vai otrā kvartile. 50% no 50 ir 25. Ir 25 vērtības, kas ir mazākas par vidējo. Tajos ietilpst divi 4, pieci 5, septiņi 6 un vienpadsmit no 7. Mediāna vai 50th procentile ir starp 25th, vai septiņi, un 26thvai septiņas vērtības. Mediāna ir septiņi.

Atrodiet trešo kvartili. Trešā kvartile ir tāda pati kā 75th procentile. Jūs varat “atbildēt uz šo aci”. Apskatot kolonnu "kumulatīvā relatīvā frekvence", jūs atradīsit 0,52 un 0,80. Kad jums ir visi četri, pieci, seši un septiņi, jums ir 52% datu. Iekļaujot visus astoņus, jums ir 80% datu. 75th tad procentilei jābūt astoņniekam. Vēl viens veids, kā apskatīt problēmu, ir atrast 75% no 50, kas ir 37,5, un noapaļot līdz 38. Trešā kvartile, J3, ir 38th vērtība, kas ir astoņi. Šo atbildi var pārbaudīt, skaitot vērtības. (Ir 37 vērtības zem trešās kvartiles un 12 vērtības iepriekš.)

2.4.3. Uzdevums

Četrdesmit autobusu vadītājiem tika jautāts, cik stundas viņi katru dienu pavada, veicot maršrutus (noapaļojot līdz tuvākajai stundai). Atrodiet 65th procentile.

Maršrutā pavadītā laika daudzums (stundas)BiežumsRelatīvais biežumsKumulatīvais relatīvais biežums
2120.300.30
3140.350.65
4100.250.90
540.101.00

Atbilde

65th procentile ir starp pēdējiem trim un pirmajiem četriem.

65th procentile ir 3,5.

2.4.4. Piemērs

Izmantojot tabulu:

  1. Atrodiet 80th procentile.
  2. Atrodiet 90th procentile.
  3. Atrodiet pirmo kvartili. Kā vēl sauc pirmo kvartili?

Risinājums

Izmantojot datus no biežuma tabulas, mums ir:

  1. 80th procentile ir starp pēdējiem astoņiem un pirmajiem deviņiem tabulā (starp 40th un 41. lppsv vērtības). Tāpēc mums jāņem vidējais rādītājs no 40th an 41sv vērtības. 80th procentile (= dfrac {8 + 9} {2} = 8,5 )
  2. 90th procentile būs 45th datu vērtība (atrašanās vieta ir (0,90 (50) = 45 )) un 45th datu vērtība ir deviņi.
  3. J1 ir arī 25th procentile. 25th procentiles atrašanās vietas aprēķins: (P_ {25} = 0,25 (50) = 12,5 aptuveni 13 ) 13th datu vērtība. Tādējādi 25th procentile ir seši.

2.4.4. Uzdevums

Skatiet tabulu. Atrodiet trešo kvartili. Kā vēl sauc trešo kvartili?

Atbilde

Trešā kvartile ir 75th procentile, kas ir četras. 65th procentile ir no trim līdz četrām, un 90th procentile ir no četriem līdz 5,75. Trešā kvartile ir starp 65 un 90, tāpēc tai jābūt četrai.

SADARBĪBAS STATISTIKA

Jūsu instruktors vai klases dalībnieks visiem klases dalībniekiem jautās, cik daudz džemperu viņiem pieder. Atbildiet uz sekojošiem jautājumiem:

  1. Cik studentu tika aptaujāti?
  2. Kādu paraugu jūs veicāt?
  3. Konstruējiet divas dažādas histogrammas. Katram sākuma vērtība = _____ beigu vērtība = ____.
  4. Atrodiet vidējo, pirmo kvartili un trešo kvartili.
  5. Konstruējiet datu tabulu, lai atrastu:
    1. 10th procentile
    2. 70th procentile
    3. to studentu procentuālā daļa, kuriem pieder mazāk nekā četri džemperi

Formula, lai atrastu kth procentile

Ja jūs veicat nelielu pētījumu, jūs atradīsit vairākas formulas, lai aprēķinātu k-to procentili. Šeit ir viens no tiem.

  • (k = ) piektā procentile. Tas var būt vai nebūt daļa no datiem.
  • (i = ) indekss (datu vērtības rangs vai pozīcija)
  • (n = ) kopējais datu skaits

Pasūtiet datus no mazākā līdz lielākajam.

Aprēķināt (i = dfrac {k} {100} (n + 1) )i = k100 (n + 1)

Ja (i ) ir vesels skaitlis, tad (k ^ {th} ) procentile ir datu vērtība sakārtotās datu kopas pozīcijā (i ^ {th} ).

Ja (i ) nav vesels skaitlis, tad noapaļojiet (i ) uz augšu un noapaļojiet (i ) uz leju līdz tuvākajiem skaitļiem. Vidēji abas datu vērtības šajās divās pozīcijās sakārtotajā datu kopā. To ir vieglāk saprast piemērā.

2.4.5. Piemērs

Sarakstā ir iekļauti 29 gadi, lai sasniegtu Kinoakadēmijas balvu ieguvušos labākos aktierus secībā no mazākā līdz lielākajam.

18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77

  1. Atrodiet 70th procentile.
  2. Atrodiet 83rd procentile.

Risinājums

    • (k = 70 )
    • (i ) = indekss
    • (n = 29 )
    (i = dfrac {k} {100} ) (n + 1) = dfrac {70} {100} (29 + 1) = 21 ). Divdesmit viens ir vesels skaitlis, un datu vērtība ir 21sv pozīcija sakārtotajā datu kopā ir 64. 70th procentile ir 64 gadi.
    • (k ) = 83rd procentile
    • (i = indekss )
    • (n = 29 )
    (i = dfrac {k} {100} (n + 1) = ( dfrac {83} {100}) (29 + 1) = 24,9 ), kas NAV vesels skaitlis. Noapaļojiet to uz leju līdz 24 un līdz 25. Vecums 24 gadu vecumāth pozīcija ir 71 un vecums 25th pozīcija ir 72. Vidējā 71 un 72. 83rd procentile ir 71,5 gadi.

2.4.5. Uzdevums

Sarakstā ir iekļauti 29 gadi, lai sasniegtu Kinoakadēmijas balvu ieguvušos labākos aktierus secībā no mazākā līdz lielākajam.

18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77

Aprēķiniet 20th procentile un 55th procentile.

Atbilde

(k = 20 ). Indekss (= i = dfrac {k} {100} (n + 1) = dfrac {20} {100} (29 + 1) = 6 ). Vecums sestajā pozīcijā ir 27. The 20th procentile ir 27 gadi.

(k = 55 ). Indekss (= i = dfrac {k} {100} (n + 1) = dfrac {55} {100} (29 + 1) = 16,5 ). Noapaļojiet uz leju līdz 16 un līdz 17. Vecums 16 gadu vecumāth pozīcija ir 52 un vecums 17th pozīcija ir 55. Vidējais rādītājs 52 un 55 ir 53,5. 55th procentile ir 53,5 gadi.

2.4.2. Piezīme

Procentiles var aprēķināt, izmantojot kalkulatorus un datorus. Ir dažādi tiešsaistes kalkulatori.

Formula vērtības procentuālās daļas atrašanai datu kopā

  • Pasūtiet datus no mazākā līdz lielākajam.
  • (x = ) datu vērtību skaits, skaitot no datu saraksta apakšas līdz pat vērtībai, kurai vēlaties atrast procentili.
  • (y = ) datu vērtību skaits, kas vienāds ar datu vērtību, kurai vēlaties atrast procentili.
  • (n = ) kopējais datu skaits.
  • Aprēķiniet ( dfrac {x + 0,5y} {n} (100) ). Tad noapaļo līdz tuvākajam skaitlim.

2.4.6. Piemērs

Sarakstā ir iekļauti 29 gadi, lai sasniegtu Kinoakadēmijas balvu ieguvušos labākos aktierus secībā no mazākā līdz lielākajam.

18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77

  1. Atrodiet 58 procentili.
  2. Atrodiet 25 procentili.

Risinājums

  1. Skaitot no saraksta apakšas, ir 18 datu vērtības, kas ir mazākas par 58. Viena vērtība ir 58.

    (x = 18 ) un (y = 1 ). ( dfrac {x + 0,5y} {n} (100) = dfrac {18 + 0,5 (1)} {29} (100) = 63,80 ). 58 ir 64th procentile.

  2. Skaitot no saraksta apakšas, ir trīs datu vērtības, kas mazākas par 25. Ir viena vērtība 25.

    (x = 3 ) un (y = 1 ). ( dfrac {x + 0,5y} {n} (100) = dfrac {3 + 0,5 (1)} {29} (100) = 12,07 ). Divdesmit pieci ir 12thprocentile.

2.4.6. Uzdevums

Uzskaitīti 30 gadu vecumi, lai sasniegtu Kinoakadēmijas balvu ieguvušos labākos aktierus secībā no mazākā līdz lielākajam.

18; 21; 22; 25; 26; 27; 29; 30; 31, 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77

Atrodiet 47 un 31 procentiles.

Atbilde

Procentile 47: skaitot no saraksta apakšas, ir 15 datu vērtības, kas ir mazākas par 47. Ir viena vērtība 47.

(x = 15 ) un (y = 1 ). ( dfrac {x + 0,5y} {n} (100) = dfrac {15 + 0,5 (1)} {29} (100) = 53,45 ). 47 ir 53rd procentile.

Procentile 31: skaitot no saraksta apakšas, ir astoņas datu vērtības, kas mazākas par 31. Ir divi vērtības 31.

(x = 15 ) un (y = 2 ). ( dfrac {x + 0,5y} {n} (100) = dfrac {15 + 0,5 (2)} {29} (100) = 31,03 ). 31 ir 31sv procentile.

Interpretējot procentiles, kvartiles un mediānu

Procenti norāda datu vērtības relatīvo stāvokli, kad dati tiek sakārtoti skaitliskā secībā no mazākā līdz lielākajam. Datu vērtību procentuālais daudzums ir mazāks vai vienāds ar pth procentile. Piemēram, 15% datu vērtību ir mazākas vai vienādas ar 15th procentile.

  • Zemas procentiles vienmēr atbilst zemākām datu vērtībām.
  • Augstas procentiles vienmēr atbilst augstākām datu vērtībām.

Procentile var vai var neatbilst vērtējumam par to, vai tā ir "laba" vai "slikta". Interpretācija par to, vai noteikta procentile ir "laba" vai "slikta", ir atkarīga no situācijas konteksta, uz kuru dati attiecas. Dažās situācijās zema procentile tiktu uzskatīta par "labu"; citos apstākļos augstu procentili var uzskatīt par "labu". Daudzās situācijās nav piemērojams vērtējums.

Saprast, kā pareizi interpretēt procentiles, ir svarīgi ne tikai aprakstot datus, bet arī aprēķinot varbūtības šī teksta turpmākajās nodaļās.

PAMATNOSTĀDNE

Rakstot procentiles interpretāciju norādīto datu kontekstā, teikumā jāietver šāda informācija.

  • informācija par izskatāmās situācijas kontekstu
  • datu vērtība (mainīgā vērtība), kas apzīmē procentili
  • to personu vai priekšmetu procentuālais daudzums, kuru datu vērtības ir zemākas par procentili
  • to personu vai priekšmetu procentuālais daudzums, kuru datu vērtības pārsniedz procentili.

2.4.7. Piemērs

Laika ziņā paredzētajā matemātikas ieskaitē pirmā kvartile pēc laika, kas bija nepieciešama eksāmena pabeigšanai, bija 35 minūtes. Interpretējiet pirmo kvartili šīs situācijas kontekstā.

Atbilde

  • 25 procenti studentu eksāmenu pabeidza 35 minūtēs vai mazāk.
  • Septiņdesmit pieci procenti studentu eksāmenu pabeidza 35 minūtēs vai ilgāk.
  • Zema procentile varētu tikt uzskatīta par labu, jo ir vēlams ātrāk pabeigt eksāmenu ar laika ierobežojumu. (Ja aizņemsit pārāk ilgu laiku, iespējams, nevarēsiet pabeigt.)

2.4.7. Uzdevums

100 metru brasā trešā kvartile par laiku, lai pabeigtu sacīkstes, bija 11,5 sekundes. Interpretējiet trešo kvartili situācijas kontekstā.

Atbilde

Divdesmit pieci procenti skrējēju sacensības pabeidza pēc 11,5 sekundēm vai ilgāk. Septiņdesmit pieci procenti skrējēju sacensības pabeidza 11,5 sekundēs vai mazāk. Zemāka procentile ir laba, jo ir vēlama ātrāka sacensību pabeigšana.

2.4.8. Piemērs

Uz 20 jautājumu matemātikas pārbaudi 70th procentile pareizo atbilžu skaitam bija 16. Interpretējiet 70th procentile šīs situācijas kontekstā.

Atbilde

  • Septiņdesmit procenti studentu pareizi atbildēja uz 16 vai mazāk jautājumiem.
  • Trīsdesmit procenti studentu pareizi atbildēja uz 16 vai vairāk jautājumiem.
  • Augstāku procentili varētu uzskatīt par labu, jo ir vēlams pareizi atbildēt uz vairākiem jautājumiem.

2.4.8. Uzdevums

Veicot rakstisku 60 punktu uzdevumu, 80th procentile nopelnīto punktu skaitam bija 49. Interpretējiet 80th procentile šīs situācijas kontekstā.

Atbilde

Astoņdesmit procenti studentu nopelnīja 49 vai mazāk punktus. Divdesmit procenti studentu nopelnīja 49 vai vairāk punktus. Augstāka procentile ir laba, jo ir vēlams iegūt vairāk punktu par uzdevumu.

2.4.9. Piemērs

Kopienas koledžā tika konstatēts, ka 30th kredītvienību procentile, kurā studenti tiek uzņemti, ir septiņas vienības. Interpretējiet 30th procentile šīs situācijas kontekstā.

Atbilde

  • Trīsdesmit procenti studentu tiek uzņemti septiņās vai mazāk kredītvienībās.
  • Septiņdesmit procenti studentu tiek uzņemti septiņās vai vairāk kredītvienībās.
  • Šajā piemērā nav “labas” vai “sliktas” vērtības sprieduma, kas būtu saistīts ar augstāku vai zemāku procentili. Studenti apmeklē kopienas koledžu dažādu iemeslu un vajadzību dēļ, un viņu kursu slodze mainās atkarībā no viņu vajadzībām.

2.4.9. Uzdevums

Sezonas laikā 40th procentile par punktiem, kas gūti uz vienu spēlētāju spēlē, ir astoņi. Interpretējiet 40th procentile šīs situācijas kontekstā.

Atbilde

Četrdesmit procenti spēlētāju ieguva astoņus vai mazāk punktus. Sešdesmit procenti spēlētāju ieguva astoņus vai vairāk punktus. Augstāka procentile ir laba, jo ir vēlams iegūt vairāk punktu basketbola spēlē.

2.4.10. Piemērs

Šarpes vidusskola piesakās uz stipendiju, kas tiks izmantota fitnesa aprīkojuma pievienošanai sporta zālei. Direktore aptaujāja 15 anonīmus studentus, lai noteiktu, cik minūtes dienā skolēni pavada, vingrojot. Tiek parādīti 15 anonīmo studentu rezultāti.

0 minūtes; 40 minūtes; 60 minūtes; 30 minūtes; 60 minūtes

10 minūtes; 45 minūtes; 30 minūtes; 300 minūtes; 90 minūtes;

30 minūtes; 120 minūtes; 60 minūtes; 0 minūtes; 20 minūtes

Nosakiet šādas piecas vērtības.

  • Min = 0
  • J1 = 20
  • Med = 40
  • J3 = 60
  • Maks. = 300

Ja jūs būtu galvenais, vai jūs būtu pamatoti iegādāties jaunu fitnesa aprīkojumu? Tā kā 75% studentu katru dienu vingro 60 minūtes vai mazāk, un kopš IQR ir 40 minūtes (60 - 20 = 40), mēs zinām, ka puse aptaujāto studentu katru dienu vingrina no 20 minūtēm līdz 60 minūtēm. Tas, šķiet, ir saprātīgs laiks, kas pavadīts vingrinājumiem, tāpēc principāls būtu pamatots, iegādājoties jauno aprīkojumu.

Tomēr galvenajam jābūt uzmanīgam. Šķiet, ka vērtība 300 ir potenciāls iznākums.

[Q_ {3} + 1,5 (IQR) = 60 + (1,5) (40) = 120 ].

Vērtība 300 ir lielāka par 120, tāpēc tā ir potenciālā vērtība. Ja mēs to izdzēsīsim un aprēķināsim piecas vērtības, mēs saņemsim šādas vērtības:

  • Min = 0
  • J1 = 20
  • J3 = 60
  • Maks. = 120

Mums joprojām ir 75% studentu, kuri katru dienu vingro 60 minūtes vai mazāk, un puse studentu vingro no 20 līdz 60 minūtēm dienā. Tomēr 15 studenti ir maza izlase, un direktoram vajadzētu apsekot vairāk studentu, lai būtu pārliecināts par viņa aptaujas rezultātiem.

Atsauces

  1. Kašons, Deniss, Pols Overbergs. "Skaitīšanas dati rāda, ka minoritātes tagad ir lielākā daļa ASV dzimušo." USA Today, 2012. Pieejams tiešsaistē vietnē http://usatoday30.usatoday.com/news/...sus/55029100/1 (skatīts 2013. gada 3. aprīlī).
  2. Dati no Amerikas Savienoto Valstu Tirdzniecības departamenta: Amerikas Savienoto Valstu skaitīšanas birojs. Pieejams tiešsaistē vietnē http://www.census.gov/ (skatīts 2013. gada 3. aprīlī).
  3. "1990. gada tautas skaitīšana". Amerikas Savienoto Valstu Tirdzniecības departaments: Amerikas Savienoto Valstu Tautas skaitīšanas birojs. Pieejams tiešsaistē vietnē http://www.census.gov/main/www/cen1990.html (skatīts 2013. gada 3. aprīlī).
  4. Dati no Sanhosē dzīvsudraba ziņas.
  5. Dati no Laika žurnāls; Yankelovich Partners, Inc. aptauja

Nodaļas pārskats

Vērtības, kas sadala rangu sakārtotu datu kopu 100 vienādās daļās, sauc par procentilēm. Procentiles tiek izmantotas datu salīdzināšanai un interpretēšanai. Piemēram, novērojums pie 50th procentile būtu lielāka par 50 procentiem no visiem citiem komplektiem. Kvartiles sadala datus ceturtdaļās. Pirmā kvartile (J1) ir 25th procentile, otrā kvartile (J2 vai mediāna) ir 50th procentile un trešā kvartile (J3) ir 75th procentile. Starpkvartilu diapazons vai IQR, ir datu vidējo 50 procentu diapazons. The IQR tiek atrasta, atņemot J1 no J3, un var palīdzēt noteikt izņēmumus, izmantojot šādus divus izteicienus.

  • (Q_ {3} + IQR (1,5) )
  • (Q_ {1} - IQR (1,5) )

Formulu apskats

[i = dfrac {k} {100} (n + 1) ]

kur (i ) = datu vērtības rangs vai pozīcija,

(k ) = kth procentile,

(n ) = kopējais datu skaits.

Izteiksme datu vērtības procentiles atrašanai: ( left ( dfrac {x + 0,5y} {n} right ) (100) )

kur (x = ) vērtību skaits, kas tiek skaitīts no datu saraksta apakšas līdz datu vērtībai, kurai vēlaties atrast procentili, bet neiekļaujot,

(y = ) datu vērtību skaits, kas vienāds ar datu vērtību, kurai vēlaties atrast procentili,

(n = ) kopējais datu skaits

Starpkvartilu diapazons
vai IQR, ir datu vidējo 50 procentu diapazons; IQR tiek atrasta, atņemot pirmo kvartili no trešās kvartiles.
Ārējais
novērojums, kas neatbilst pārējiem datiem
Procentile
skaitlis, kas sadala sakārtotos datus simtdaļās; procentiles var būt vai nebūt datu daļa. Datu mediāna ir otrā kvartile un 50th procentile. Pirmā un trešā kvartile ir 25th un 75th attiecīgi procentiles.
Kvartiles
skaitļi, kas datus sadala ceturkšņos; kvartiles var būt vai nebūt datu daļa. Otrā kvartile ir datu mediāna.

3.4.: Datu atrašanās vietas mērījumi

Vidējais ir tā vērtība, kuru visbiežāk dēvē par vidējo. Mēs izmantosim terminu vidējais kā sinonīmu vidējam un terminam tipiskā vērtība, lai vispārīgi apzīmētu atrašanās vietas mērījumus.

Šis grafiks parāda histogrammas 10 000 nejaušiem skaitļiem, kas ģenerēti no normāla, eksponenta, Cauchy un lognormal sadalījuma.

Normāls sadalījums Pirmā histogramma ir paraugs no normāla sadalījuma. Vidējais rādītājs ir 0,005, mediāna ir -0,010 un režīms ir -0,144 (režīms tiek aprēķināts kā histogrammas intervāla viduspunkts ar augstāko virsotni).

Normālais sadalījums ir simetrisks sadalījums ar labi izturētām astēm un vienu virsotni sadalījuma centrā. Ar simetrisku mēs domājam, ka sadalījumu var salocīt ap asi tā, lai divas puses sakristu. Tas ir, tā rīkojas tāpat kā pa kreisi un pa labi no kāda centra punkta. Normālam sadalījumam vidējais, vidējais un režīms faktiski ir līdzvērtīgi. Iepriekš histogramma rada līdzīgus vidējā, vidējā un režīma aprēķinus. Tādēļ, ja histogramma vai normālas varbūtības diagramma norāda, ka jūsu dati ir labi tuvināti normālam sadalījumam, ir pamatoti izmantot vidējo kā atrašanās vietas novērtētāju. Eksponenciāla izplatīšana Otrā histogramma ir eksponenciālā sadalījuma paraugs. Vidējais rādītājs ir 1,001, mediāna ir 0,684 un režīms ir 0,254 (režīms tiek aprēķināts kā histogrammas intervāla viduspunkts ar augstāko virsotni).

Eksponenciālais sadalījums ir šķībs, t.i. e., nevis simetrisks, sadalījums. Novirzītajiem sadalījumiem vidējais un vidējais lielums nav vienādi. Vidējais rādītājs tiks novilkts šķībuma virzienā. Tas ir, ja labā aste ir smagāka par kreiso asti, vidējais rādītājs būs lielāks par vidējo. Tāpat, ja kreisā aste ir smagāka par labo asti, vidējais rādītājs būs mazāks par vidējo.

Attiecībā uz šķībajiem sadalījumiem vispār nav skaidrs, vai vidējais, vidējais vai veids ir tipiskākas vērtības jēgpilnāks mērītājs. Šajā gadījumā visi trīs pasākumi ir noderīgi. Cauchy izplatīšana Trešā histogramma ir Cauchy sadalījuma paraugs. Vidējais rādītājs ir 3,70, mediāna ir -0,016 un režīms ir -0,362 (režīms tiek aprēķināts kā histogrammas intervāla viduspunkts ar augstāko virsotni).

Labākam vizuālam salīdzinājumam ar citām datu kopām mēs ierobežojām Cauchy sadalījuma histogrammu līdz vērtībām starp -10 un 10. Pilnajam Cauchy datu kopumam faktiski ir vismaz aptuveni -29 000 un maksimāli aptuveni 89 000.

Košī sadalījums ir simetrisks sadalījums ar smagām astēm un vienu virsotni izplatības centrā. Cauchy sadalījumam ir interesanta īpašība, ka vairāk datu apkopošana nenodrošina precīzāku vidējā līmeņa novērtējumu. Tas ir, vidējā parauga sadalījums ir līdzvērtīgs sākotnējo datu izlases sadalījumam. Tas nozīmē, ka Cauchy sadalījumam vidējais rādītājs ir nederīgs kā tipiskās vērtības mērs. Šajā histogrammā vidējais rādītājs 3,7 ir krietni virs lielākās daļas datu. To izraisa dažas ļoti ekstrēmas vērtības astē. Tomēr mediāna sniedz noderīgu tipiskās vērtības mēru.

Kaut arī Cauchy sadalījums ir ārkārtējs gadījums, tas ilustrē smago astes nozīmi vidējā līmeņa noteikšanā. Galējās vērtības astēs izkropļo vidējo. Tomēr šīs galējās vērtības neizkropļo mediānu, jo mediānas pamatā ir pakāpes. Parasti datiem, kuru astēs ir ekstrēmas vērtības, mediāna sniedz labāku atrašanās vietas novērtējumu nekā vidējais rādītājs. Lognormāls sadalījums Ceturtā histogramma ir paraugs no lognormāla sadalījuma. Vidējais rādītājs ir 1,677, vidējais ir 0,989 un režīms ir 0,680 (režīms tiek aprēķināts kā histogrammas intervāla viduspunkts ar augstāko virsotni).

Lognormāls ir arī šķībs sadalījums. Tāpēc vidējais un vidējais lielums nesniedz līdzīgus aprēķinus par atrašanās vietu. Tāpat kā attiecībā uz eksponenciālo sadalījumu, nav skaidras atbildes uz jautājumu, kurš ir jēgpilnākais atrašanās vietas mērītājs. Izturība Atrašanās vietas noteikšanai ir dažādas alternatīvas vidējam un vidējam. Šīs alternatīvas tika izstrādātas, lai risinātu datus, kas nav normāli, jo vidējais ir optimāls novērtētājs, ja patiesībā jūsu dati ir normāli.

    Derīguma pamatotība nozīmē, ka ticamības intervāliem populācijas atrašanās vietai ir 95% iespēja aptvert populācijas atrašanās vietu neatkarīgi no tā, kāds ir pamatā esošais sadalījums.

Mediāna ir novērtētāja piemērs, kuram parasti ir derīgums, bet ne efektivitāte.


Kā noteikt pozīcijas mērījumus (procentiles un kvartiles)

Lai gan jūs bieži neizmantojat tādus mērījumus kā procentiles un kvartiles, šīs vērtības tiek izmantotas, lai aprakstītu datus dažās situācijās, un ir noderīgi zināt, kā tos interpretēt.

o Nosakiet datu kopas diapazonu

o Zināt, kā interpretēt un noteikt pozīcijas mērījumus (procentiles un kvartiles)

Lai gan statistikā bieži tiek izmantoti centrālās tendences, izkliedes un šķībuma mēri, ir arī citas metodes datu izplatīšanas vai daļu raksturošanai vai aprakstīšanai, kuras arī parasti izmanto. Mēs izskatīsim vairākus no šiem statistikas rādītājiem, dažus no kuriem jūs, iespējams, jau zināt vai esat redzējis citur.

The diapazons datu kopas vērtība ir vienkārši starpība starp kopas maksimālo un minimālo vērtību. (Šo mēru parasti uzskata par izkliedes mēru, jo tas ir vienkāršs apraksts par to, cik tālu dati sniedzas.) Tādējādi, ja datu kopa, piemēram, <x1, x2, x3. xN> tiek sniegts pieaugošā secībā, lai xi & lt xi+1, tad datu kopas diapazons ir vienkārši xNx1. Ja datu kopa nav sakārtota, pārbaudot, jums vienkārši jānosaka maksimālās un minimālās vērtības.

Prakses problēma:Atrodiet šīs datu kopas diapazonu.

Risinājums: Diapazonu mēs varam atrast, vienkārši meklējot maksimālās un minimālās vērtības vai sakārtojot kopu pieaugošā secībā un pēc tam atņemot pirmo elementu no pēdējā. Lai arī pēdējā pieeja ir nedaudz laikietilpīgāka, tā var būt izdevīga gadījumos, kad jāveic citi aprēķini. Tātad, pasūtīsim datu kopu pilnības labad.

Diapazons tad ir 15 & # 8211 1 = 14.

Kvartiles un procentiles

Praktiski ikviens, kurš vienā vai otrā laikā ir nokārtojis standartizētu testu, zina šo terminu procentile. Lai gan procentiles šķiet bīstami līdzīgas procentiem (tas ir, "procenti pareizi", atsaucoties uz pareizi atbildēto jautājumu skaitu, dalītu ar kopējo jautājumu skaitu, visi reizināti ar 100%), tie faktiski ir atšķirīgi. Līdzīgs mērījums ir kvartile, kuru mēs arī apspriedīsim. Gan procentiles, gan kvartiles ir statistiskas pozīcijas mērījumi tas ir, tie nemēra centrālo tendenci vai izplatīšanos (izkliedi), bet tā vietā mēra atrašanās vietu datu kopā. (Precīza procentiles un kvartiles definīcija atšķiras no šīm atšķirībām, tomēr tām parasti ir neliela nozīme un tās ir vērstas uz noteiktiem smalkiem punktiem. Šīs atšķirības mēdz pazust arī tad, ja datu vērtību skaits komplektā ir liels.)

Apsvērsim skaitli lpp, kur lpp ir vesels skaitlis no 0 līdz 100. Pieņemsim, ka skaitlis lpp apraksta procentuālo vērtību, kas mazāka vai vienāda ar kādu datu vērtību Nlpp. Līdz ar to 100 & # 8211 lpp ir procentuālā vērtība, kas lielāka par Nlpp. Šis skaitlis Nlpp ir lppth procentile. Tādējādi teikt, ka daži datu vērtība x ir 75. procentile nozīmē, ka 75% no visām datu kopas vērtībām ir mazākas vai vienādas ar x, un ka 25% datu vērtību ir lielākas par x. Ņemiet vērā, ka datu vērtības procentili var saprast arī kā simtkārtīgu šīs vērtības kumulatīvo relatīvo biežumu. (Atgādinām, ka vērtības kumulatīvais relatīvais biežums x ir visu vērtību relatīvais biežums, kas mazāks vai vienāds ar x.) Tātad, students, kurš, piemēram, iegūst testa rezultātu 90. procentilē, nav (obligāti) ieguvis pareizu rezultātu 90/100 - viņam vienkārši ir rezultāts, kas ir vismaz tikpat labs kā 90% no pārējiem studentiem. . Kaut arī šāds apraksts ne vienmēr ļoti apmierina studentu (kurš, iespējams, ir vairāk ieinteresēts uzzināt pareizo atbilžu procentuālo daļu), tas ir statistiski noderīgs noteiktās situācijās. Parasti 0 un 100 procentiles netiek apspriestas, jo šīs vērtības ir vienkārši minimālā un maksimālā (attiecīgi) datu kopa.

Prakses problēma: Kura vērtība ir 75. procentilē zemāk esošajai datu kopai?

Risinājums: Mēs vēlamies atrast datu vērtību Nlpp kur 75% datu kopas ir mazāka vai vienāda ar Nlpp. Ņemiet vērā, ka kopā ir 16 vērtības, tādējādi 75% datu kopas ir 12 vērtības. Tā kā datu kopa ir sakārtota, mums vienkārši jāatrod 12. datu vērtība, tad 75% (12 no 16 vērtībām) no datu kopas būs mazāka vai vienāda ar šo vērtību. Skaitlis 10 ir 75. procentile: 75% no kopas vērtībām ir mazākas vai vienādas ar 10.

Prakses problēma: Kuras no šīm datu vērtībām ir 50. procentile?

Risinājums: 50. procentile ir šī vērtība N kurai 50% no kopas vērtībām ir mazāka vai vienāda ar N. Lai palīdzētu mums atrast šo vērtību, vispirms pasūtīsim datu kopu.

Datu kopai ir 10 vērtības, tādējādi 50. procentile ir piektā datu vērtība 5.52. Tieši puse (50%) no datu vērtībām ir mazāka vai vienāda ar 5,52, bet atlikusī puse ir lielāka par 5,52.

Vēl viens pozīcijas rādītājs ir kvartilis, kas ir līdzīgs procentilei, izņemot to, ka datus sadala ceturkšņos (segmentos pa 25% katrā), nevis simtdaļās. Tādējādi nth kvartile ir vērtība x par kuru (25n)% no vērtībām ir mazāka vai vienāda ar x. Ir definētas trīs kvartiles: Q1, Q2 un Q3. Kvartile Q1 atbilst 25. procentilei, Q2 - 50. procentilei un Q3 - 75. procentilei.

Dažreiz tiek teikts, ka Q2 un 50. procentile atbilst datu kopas mediānai. Ņemot vērā mūsu mediānas definīciju, tā ir taisnība, ja ir nepāra skaitlis datu vērtību, kas tā nav stingri taisnība attiecībā uz pāra skaitli datu vērtību (skat. prakses problēmu iepriekš) - mediāna saskaņā ar mūsu definīciju faktiski būtu 5,52 un 5,97 vidējā vērtība. Mēs tomēr varētu teikt, ka šī vidējā vērtība (5,75) ir 50. procentile datu kopai: tehniski puse datu kopas vērtību ir zem šīs vērtības, bet puse ir virs. Tādējādi mēs joprojām varam saglabāt savu mediānas definīciju, ja pareizi definējam procentiles un kvartiles. Turklāt mēs varam arī atzīmēt, ka Q1 ir vērtību pirmās puses mediāna, un Q3 ir vērtību otrās puses mediāna. (Arī šeit ir piemēroti iepriekš minētie apsvērumi par mediānas definīciju.)

Prakses problēma: Kas ir Q3 šādai datu kopai?

Risinājums: Q3 ir vērtība x par kuru maksimums 75% (trīs no četriem) ir datu lielumi x. Tā kā datu kopā ir astoņi dalībnieki, sestā vērtība ir Q3-75. Šī vērtība ir arī 75. procentile.


Datu atrašanās vietas mērījumi

Kvartiles ir īpašas procentiles. Pirmā kvartile, J1, ir tāds pats kā 25. procentile un trešā kvartile, J3, ir tāds pats kā 75. procentile. Mediāna, M, sauc gan par otro kvartili, gan par 50. procentili.

Lai aprēķinātu kvartiles un procentiles, datiem jābūt sakārtotiem no mazākā līdz lielākajam. Kvartiles sadala sakārtotos datus ceturtdaļās. Procentiles sadala sakārtotos datus simtdaļās. Vērtējums eksāmena 90. procentilē nenozīmē, ka obligāti esat saņēmis 90% no testa. Tas nozīmē, ka 90% testa rezultātu ir vienādi vai mazāki par jūsu rezultātiem un 10% no testa rezultātiem ir vienādi vai lielāki par jūsu testa rezultātiem.

Procenti ir noderīgi, lai salīdzinātu vērtības. Šī iemesla dēļ universitātes un koledžas plaši izmanto procentiles. Viens gadījums, kad koledžas un universitātes izmanto procentiles, ir SAT rezultāti, lai noteiktu minimālo testēšanas rezultātu, kas tiks izmantots kā pieņemšanas koeficients. Piemēram, pieņemsim, ka hercogs pieņem SAT rādītājus 75. procentilē vai virs tās. Tas nozīmē vismaz 1220 punktu skaitu.

Procenti tiek izmantoti galvenokārt ar ļoti lielām populācijām. Tāpēc, ja jūs teiktu, ka 90% testa rezultātu ir mazāki (un nav vienādi vai mazāk) nekā jūsu rezultāti, tas būtu pieņemami, jo vienas konkrētas datu vērtības noņemšana nav būtiska.

Mediāna ir skaitlis, kas mēra datu & # 8220centru & # 8221. Jūs varat domāt par mediānu kā par & # 8220 vidējo vērtību & # 8221, taču tai faktiski nav jābūt vienai no novērotajām vērtībām. Tas ir skaitlis, kas sakārtotos datus atdala uz pusēm. Puse vērtībām ir vienāds vai mazāks par vidējo, bet puse vērtību ir vienāds vai lielāks. Piemēram, ņemiet vērā šādus datus.
1 11.5 6 7.2 4 8 9 10 6.8 8.3 2 2 10 1
Pasūtīts no mazākā līdz lielākajam:
1 1 2 2 4 6 6.8 7.2 8 8.3 9 10 10 11.5

Tā kā ir 14 novērojumi, mediāna ir starp septīto vērtību 6,8 un astoto vērtību 7,2. Lai atrastu mediānu, saskaitiet abas vērtības kopā un daliet ar divām.

Mediāna ir septiņi. Puse no vērtībām ir mazāka par septiņām un puse no vērtībām ir lielāka par septiņām.

Kvartiles ir skaitļi, kas datus atdala ceturkšņos. Kvartiles var būt vai nebūt datu daļa. Lai atrastu kvartiles, vispirms atrodiet vidējo vai otro kvartili. Pirmā kvartile, J1, ir datu apakšējās puses vidējā vērtība un trešā kvartile, J3, ir datu augšējās puses vidējā vērtība jeb mediāna. Lai iegūtu ideju, apsveriet to pašu datu kopu:
1 1 2 2 4 6 6.8 7.2 8 8.3 9 10 10 11.5

Mediāna vai otrā kvartile ir septiņi. Datu apakšējā puse ir 1, 1, 2, 2, 4, 6, 6.8. Apakšējās puses vidējā vērtība ir divas.
1 1 2 2 4 6 6.8

Skaitlis divi, kas ir daļa no datiem, ir pirmā kvartile. Ceturtā daļa no visām vērtību kopām ir vienāda vai mazāka par divām, un trīs ceturtdaļas no vērtībām ir vairāk nekā divas.

Datu augšējā puse ir 7,2, 8, 8,3, 9, 10, 10, 11,5. Augšējās puses vidējā vērtība ir deviņi.

Trešā kvartile, J3, ir deviņi. Trīs ceturtdaļas (75%) no pasūtītās datu kopas ir mazāk nekā deviņas. Ceturtā daļa (25%) no pasūtītās datu kopas ir lielāka par deviņām. Trešā kvartile ir daļa no šajā piemērā esošo datu kopas.

Starpkvartilu diapazons ir skaitlis, kas norāda vidējās puses vai vidējā 50% datu izplatību. Tā ir atšķirība starp trešo kvartili (J3) un pirmā kvartile (J1).

The IQR var palīdzēt noteikt potenciālu ārējie rādītāji. Tiek uzskatīts, ka vērtība ir potenciāls iznākums, ja tā ir mazāka par (1,5) (IQR) zem pirmās kvartiles vai lielāks par (1,5) (IQR) virs trešās kvartiles. Iespējamie zaudējumi vienmēr prasa papildu izmeklēšanu.

Potenciālais iznākums ir datu punkts, kas ievērojami atšķiras no citiem datu punktiem. Šie īpašie datu punkti var būt kļūdas vai kāda veida anomālija, vai arī tie var būt atslēga datu izpratnei.

Par šādām 13 nekustamā īpašuma cenām aprēķiniet IQR un nosakiet, vai kādas cenas ir potenciālie zaudējumi. Cenas ir norādītas dolāros.
389,950 230,500 158,000 479,000 639,000 114,950 5,500,000 387,000 659,000 529,000 575,000 488,800 1,095,000

Pasūtiet datus no mazākā līdz lielākajam.
114,950 158,000 230,500 387,000 389,950 479,000 488,800 529,000 575,000 639,000 659,000 1,095,000 5,500,000

J1 = = 308,750

J3 = = 649,000

IQR = 649,000 – 308,750 = 340,250

Neviena mājas cena nav mazāka par –201625. Tomēr 5 500 000 ir vairāk nekā 1 159 375. Tāpēc 5 500 000 ir potenciāls izņēmums.

Aprēķiniet nākamajām 11 algām IQR un nosakiet, vai kādas algas ir lielākas. Algas ir dolāros.

?33,000 ?64,500 ?28,000 ?54,000 ?72,000 ?68,500 ?69,000 ?42,000 ?54,000 ?120,000 ?40,500

Abām datu kopām testa rezultātu piemērā atrodiet:

  1. Starpkvartilu diapazons. Salīdziniet abus starpkvartilu diapazonus.
  2. Jebkurš iznākums jebkurā komplektā.

Piecu numuru kopsavilkums dienas un nakts nodarbībām ir

    Dienas grupas IQR ir J3J1 = 82.5 – 56 = 26.5

Nakts grupas IQR ir J3J1 = 89 – 78 = 11

Dienas klases starpkvartilu diapazons (izplatība vai mainīgums) ir lielāks nekā nakts klase IQR. Tas liek domāt, ka dienas klases klases pārbaudījumu rezultātos būs vairāk atšķirību.

Tā kā dienas klases minimālās un maksimālās vērtības ir lielākas par 16,25 un mazākas par 122,25, nav atšķirību.

Nakts klases izņēmumus aprēķina šādi:

Šajā klasē jebkurš ieskaites rezultāts, kas ir mazāks par 61,5, ir labāks. Tāpēc rādītāji 45 un 25,5 ir ārpus rezultātiem. Tā kā neviena testa rezultāts nav lielāks par 105,5, augšējā gala robežas nav.

Atrodiet sekojošo divu datu kopu starpkvartilu diapazonu un salīdziniet tos.

Pārbaudes rezultāti par klasi A
69 96 81 79 65 76 83 99 89 67 90 77 85 98 66 91 77 69 80 94
Pārbaudes rezultāti par klasi B
90 72 80 92 90 97 92 75 79 68 70 80 99 95 78 73 71 68 95 100

Piecdesmit statistikas studentiem tika jautāts, cik daudz viņi guļ vienā skolas naktī (noapaļojot līdz tuvākajai stundai). Rezultāti bija:

MIEGA SUMMA SKOLAS NAKTĪ (STUNDAS) BIEŽUMS SAISTĪTĀ BIEŽUMS KUMULATĪVĀ RELATĪVA BIEŽUMS
4 2 0.04 0.04
5 5 0.10 0.14
6 7 0.14 0.28
7 12 0.24 0.52
8 14 0.28 0.80
9 7 0.14 0.94
10 3 0.06 1.00

Atrodiet 28. procentili. Kolonnā & # 8220 kumulatīvais relatīvais biežums & # 8221. Divdesmit astoņi procenti no 50 datu vērtībām ir 14 vērtības. Ir 14 vērtības, kas mazākas par 28. procentili. Tajos ietilpst divi 4, pieci 5 un septiņi 6. 28. procentile ir starp pēdējiem sešiem un pirmajiem septiņiem. 28. procentile ir 6,5.

Atrodiet vidējo. Vēlreiz apskatiet sleju & ​​# 8220kumulatīvais relatīvais biežums & # 8221 un atrodiet 0,52. Mediāna ir 50. procentile jeb otrā kvartile. 50% no 50 ir 25. Ir 25 vērtības, kas ir mazākas par vidējo. Tajos ietilpst divi 4, pieci 5, septiņi 6 un vienpadsmit no 7. Mediāna jeb 50. procentile ir starp 25. vai septiņām un 26. vai 7. vērtībām. Mediāna ir septiņi.

Atrodiet trešo kvartili. Trešā kvartile ir tāda pati kā 75. procentile. Jūs varat atbildēt uz šo atbildi. Apskatot kolonnu & # 8220kumulatīvais relatīvais biežums & # 8221, tiek atrasti 0,52 un 0,80. Kad jums ir visi četri, pieci, seši un septiņi, jums ir 52% datu. Iekļaujot visus astoņus, jums ir 80% datu. Tad 75. procentilei jābūt astoņniekam. Vēl viens veids, kā apskatīt problēmu, ir atrast 75% no 50, kas ir 37,5, un noapaļot līdz 38. Trešā kvartile, J3, ir 38. vērtība, kas ir astoņi. Šo atbildi var pārbaudīt, skaitot vērtības. (Ir 37 vērtības zem trešās kvartiles un 12 vērtības iepriekš.)

Četrdesmit autobusu vadītājiem tika jautāts, cik stundas viņi katru dienu pavada, veicot maršrutus (noapaļojot līdz tuvākajai stundai). Atrodiet 65. procentili.

Maršrutā pavadītā laika daudzums (stundas) Biežums Relatīvais biežums Kumulatīvais relatīvais biežums
2 12 0.30 0.30
3 14 0.35 0.65
4 10 0.25 0.90
5 4 0.10 1.00

  1. Atrodiet 80. procentili.
  2. Atrodiet 90. procentili.
  3. Atrodiet pirmo kvartili. Kā vēl sauc pirmo kvartili?

Izmantojot datus no biežuma tabulas, mums ir:

  1. 80. procentile ir starp pēdējiem astoņiem un pirmajiem deviņiem tabulā (starp 40. un 41. vērtību). Tāpēc mums jāņem 40. un 41. st vidējā vērtība. 80. procentile
  2. 90. procentile būs 45. datu vērtība (atrašanās vieta ir 0,90 (50) = 45) un 45. datu vērtība ir deviņas.
  3. J1 ir arī 25. procentile. 25. procentiles atrašanās vietas aprēķins: P25 = 0,25 (50) = 12,5 ≈ 13 13. datu vērtība. Tādējādi 25. procentile ir seša.

Skatiet (Attēls). Atrodiet trešo kvartili. Kā vēl sauc trešo kvartili?

Jūsu instruktors vai klases dalībnieks visiem klases dalībniekiem jautās, cik daudz džemperu viņiem pieder. Atbildiet uz sekojošiem jautājumiem:

  1. Cik studentu tika aptaujāti?
  2. Kādu paraugu jūs veicāt?
  3. Konstruējiet divas dažādas histogrammas. Katram sākuma vērtība = _____ beigu vērtība = ____.
  4. Atrodiet vidējo, pirmo kvartili un trešo kvartili.
  5. Konstruējiet datu tabulu, lai atrastu:
    1. 10. procentile
    2. 70. procentile
    3. to studentu procentuālā daļa, kuriem pieder mazāk nekā četri džemperi

    Formula, lai atrastu kth procentile

    Ja jūs veiktu nelielu pētījumu, jūs atrastu vairākas formulas, lai aprēķinātu k th procentile. Šeit ir viens no tiem.

    k = k procentile. Tas var būt vai nebūt daļa no datiem.

    i = indekss (datu vērtības rangs vai pozīcija)

    n = kopējais datu skaits

    • Pasūtiet datus no mazākā līdz lielākajam.
    • Aprēķiniet
    • Ja i ir vesels skaitlis, tad k procentile ir datu vērtība i th pozīcija sakārtotajā datu kopā.
    • Ja i nav vesels skaitlis, tad apaļa i uz augšu un apaļu i līdz tuvākajiem skaitļiem. Vidēji abas datu vērtības šajās divās pozīcijās sakārtotajā datu kopā. To ir vieglāk saprast piemērā.

    Sarakstā ir iekļauti 29 gadi, lai sasniegtu labāko akadēmijas balvu ieguvējus secībā no mazākā līdz lielākajam.
    18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

    Sarakstā ir iekļauti 29 gadi, lai sasniegtu labākos ASV Kinoakadēmijas balvas ieguvējus secībā no mazākā līdz lielākajam.

    18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77
    Aprēķiniet 20. procentili un 55. procentili.

    Procentiles var aprēķināt, izmantojot kalkulatorus un datorus. Ir dažādi tiešsaistes kalkulatori.

    Formula vērtības procentuālās daļas atrašanai datu kopā

    • Pasūtiet datus no mazākā līdz lielākajam.
    • x = datu vērtību skaits, skaitot no datu saraksta apakšas līdz pat vērtībai, kurai vēlaties atrast procentili.
    • y = datu vērtību skaits, kas vienāds ar datu vērtību, kurai vēlaties atrast procentili.
    • n = kopējais datu skaits.
    • Aprēķiniet (100). Tad noapaļo līdz tuvākajam skaitlim.

    Sarakstā ir iekļauti 29 gadi, lai sasniegtu labāko akadēmijas balvu ieguvējus secībā no mazākā līdz lielākajam.
    18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

    1. Skaitot no saraksta apakšas, ir 18 datu vērtības, kas mazākas par 58. Ir viena vērtība 58.

    x = 18 un y = 1.(100) = (100) = 63,80. 58 ir 64. procentile.

    x = 3 un y = 1.(100) = (100) = 12,07. Divdesmit pieci ir 12. procentile.

    Uzskaitīti 30 gadu vecumi, lai sasniegtu Kinoakadēmijas balvu ieguvušos labākos aktierus secībā no mazākā līdz lielākajam.

    18 21 22 25 26 27 29 30 31, 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77
    Atrodiet 47 un 31 procentiles.

    Interpretējot procentiles, kvartiles un mediānu

    Procenti norāda datu vērtības relatīvo stāvokli, kad dati tiek sakārtoti skaitliskā secībā no mazākā līdz lielākajam. Datu vērtību procentuālais daudzums ir mazāks vai vienāds ar p procentili. Piemēram, 15% datu vērtību ir mazāka vai vienāda ar 15. procentili.

    • Zemas procentiles vienmēr atbilst zemākām datu vērtībām.
    • Augstas procentiles vienmēr atbilst augstākām datu vērtībām.

    Procentile var vai var neatbilst vērtējumam par to, vai tas ir & # 8220labs & # 8221 vai & # 8220slikts. & # 8221 Interpretācija par to, vai noteikta procentile ir & # 8220labi & # 8221 vai & # 8220bad & # 8221, ir atkarīga no situācijas, uz kuru attiecas dati, kontekstā. Dažās situācijās zems procentile tiek uzskatīts par & # 8220labs & # 8221 citos kontekstos, var uzskatīt par augstu procentili Daudzās situācijās nav piemērojams vērtējums.

    Saprast, kā pareizi interpretēt procentiles, ir svarīgi ne tikai aprakstot datus, bet arī aprēķinot varbūtības šī teksta turpmākajās nodaļās.

    Rakstot procentiles interpretāciju norādīto datu kontekstā, teikumā jāietver šāda informācija.

    • informācija par izskatāmās situācijas kontekstu
    • datu vērtība (mainīgā vērtība), kas apzīmē procentili
    • to personu vai priekšmetu procentuālais daudzums, kuru datu vērtības ir zemākas par procentili
    • to personu vai priekšmetu procentuālais daudzums, kuru datu vērtības pārsniedz procentili.

    Laika ziņā paredzētajā matemātikas testā pirmā kvartile pēc laika, kas vajadzīgs, lai pabeigtu eksāmenu, bija 35 minūtes. Interpretējiet pirmo kvartili šīs situācijas kontekstā.

    • 25 procenti studentu eksāmenu pabeidza 35 minūtēs vai mazāk.
    • Septiņdesmit pieci procenti studentu eksāmenu pabeidza 35 minūtēs vai ilgāk.
    • Zema procentile varētu tikt uzskatīta par labu, jo ir vēlams ātrāk pabeigt eksāmenu ar laika ierobežojumu. (Ja aizņemsit pārāk ilgu laiku, iespējams, nevarēsiet pabeigt.)

    100 metru brasā trešā kvartile par laiku, lai pabeigtu sacīkstes, bija 11,5 sekundes. Interpretējiet trešo kvartili situācijas kontekstā.

    20 jautājumu matemātikas testā pareizo atbilžu skaita 70. procentile bija 16. Šīs situācijas kontekstā interpretējiet 70. procentili.

    Veicot 60 punktu rakstisku uzdevumu, nopelnīto punktu 80. procentile bija 49. Šīs situācijas kontekstā interpretējiet 80. procentili.

    Sabiedrības koledžā tika konstatēts, ka kredītvienību 30. procentile, kurā studenti tiek uzņemti, ir septiņas vienības. Interpretējiet 30. procentili šīs situācijas kontekstā.

    Sezonas laikā 40. procentile par punktiem, kas gūti uz vienu spēlētāju spēlē, ir astoņi. Šīs situācijas izpratnē interpretējiet 40. procentili.

    Šarpes vidusskola piesakās uz stipendiju, kas tiks izmantota fitnesa aprīkojuma pievienošanai sporta zālei. Direktore aptaujāja 15 anonīmus studentus, lai noteiktu, cik minūtes dienā skolēni pavada, vingrojot. Tiek parādīti 15 anonīmo studentu rezultāti.

    0 minūtes 40 minūtes 60 minūtes 30 minūtes 60 minūtes

    10 minūtes 45 minūtes 30 minūtes 300 minūtes 90 minūtes

    30 minūtes 120 minūtes 60 minūtes 0 minūtes 20 minūtes

    Nosakiet šādas piecas vērtības.

    Ja jūs būtu galvenais, vai jūs būtu pamatoti iegādāties jaunu fitnesa aprīkojumu? Tā kā 75% studentu katru dienu vingro 60 minūtes vai mazāk, un kopš IQR ir 40 minūtes (60 - 20 = 40), mēs zinām, ka puse aptaujāto studentu katru dienu vingrina no 20 minūtēm līdz 60 minūtēm. Tas, šķiet, ir saprātīgs laiks, kas pavadīts vingrinājumiem, tāpēc principāls būtu pamatots, iegādājoties jauno aprīkojumu.

    Tomēr galvenajam jābūt uzmanīgam. Šķiet, ka vērtība 300 ir potenciāls iznākums.

    Vērtība 300 ir lielāka par 120, tāpēc tā ir potenciālā vērtība. Ja mēs to izdzēsīsim un aprēķināsim piecas vērtības, mēs saņemsim šādas vērtības:

    Mums joprojām ir 75% studentu, kuri katru dienu vingro 60 minūtes vai mazāk, un puse studentu vingro no 20 līdz 60 minūtēm dienā. Tomēr 15 studenti ir maza izlase, un direktoram vajadzētu apsekot vairāk studentu, lai būtu pārliecināts par viņa aptaujas rezultātiem.

    Atsauces

    Kašons, Deniss, Pols Overbergs. "Skaitīšanas dati rāda, ka minoritātes tagad ir lielākā daļa ASV dzimušo." USA Today, 2012. Pieejams tiešsaistē vietnē http://usatoday30.usatoday.com/news/nation/story/2012-05-17/minority-birthscensus/55029100/1 (skatīts 2013. gada 3. aprīlī).

    Dati no Amerikas Savienoto Valstu Tirdzniecības departamenta: Amerikas Savienoto Valstu skaitīšanas birojs. Pieejams tiešsaistē vietnē http://www.census.gov/ (skatīts 2013. gada 3. aprīlī).

    "1990. gada tautas skaitīšana". Amerikas Savienoto Valstu Tirdzniecības departaments: Amerikas Savienoto Valstu Tautas skaitīšanas birojs. Pieejams tiešsaistē vietnē http://www.census.gov/main/www/cen1990.html (skatīts 2013. gada 3. aprīlī).

    Dati no Sanhosē dzīvsudraba ziņas.

    Dati no Laika žurnāls Yankelovich Partners, Inc. aptauja

    Nodaļas pārskats

    Vērtības, kas sadala rangu sakārtotu datu kopu 100 vienādās daļās, sauc par procentilēm. Procentiles tiek izmantotas datu salīdzināšanai un interpretēšanai. Piemēram, novērojums 50. procentilē būtu lielāks par 50 procentiem no visiem citiem komplektiem. Kvartiles sadala datus ceturtdaļās. Pirmā kvartile (J1) ir 25. procentile, otrā kvartile (J2 vai mediāna) ir 50. procentile un trešā kvartile (J3) ir 75. procentile. Starpkvartilu diapazons vai IQR, ir datu vidējo 50 procentu diapazons. The IQR tiek atrasta, atņemot J1 no J3, un var palīdzēt noteikt izņēmumus, izmantojot šādus divus izteicienus.

    Formulu apskats

    kur i = datu vērtības rangs vai pozīcija,

    Izteiksme datu vērtības procentiles atrašanai: (100)

    kur x = vērtību skaits, kas skaitāms no datu saraksta apakšas līdz datu vērtībai, kurai vēlaties atrast procentili, bet neiekļaujot,

    y = datu vērtību skaits, kas vienāds ar datu vērtību, kurai vēlaties atrast procentili,

    Sarakstā ir iekļauti 29 gadi, lai sasniegtu labākos ASV Kinoakadēmijas balvas ieguvējus secībā no mazākā līdz lielākajam.

    18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

    Uzskaitīti 32 gadi, lai sasniegtu labākos akadēmijas balvas ieguvējus secībā no mazākā līdz lielākajam.

    18 18 21 22 25 26 27 29 30 31 31 33 36 37 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

    Džesijs savā absolventu klasē ar 180 studentiem ierindojās 37. vietā. Kādā procentilē ir Džesijas rangs?

    Džesijs pabeidza 37. vietu 180 studentu klasē. Zem Jesse ir 180 - 37 = 143 studenti. Ir viens rangs 37.

    x = 143 un y = 1. (100) = (100) = 79,72. Džesijas rangs 37 liek viņam 80. procentili.

    1. Skrējējiem sacensībās zems laiks nozīmē ātrāku skrējienu. Sacensību uzvarētājiem ir īsākais darbības laiks. Vai, startējot sacensībās, ir vēlams finiša laiks ar augstu vai zemu procentili?
    2. Skrējiena laika 20. procentile konkrētā braucienā ir 5,2 minūtes. Uzrakstiet teikumu, interpretējot 20. procentili situācijas kontekstā.
    3. Velosipēdistu 90. procentiles velosipēdists sacensības veica 1 stundā un 12 minūtēs. Vai viņš ir starp ātrākajiem vai lēnākajiem riteņbraucējiem sacensībās? Uzrakstiet teikumu, interpretējot 90. procentili situācijas kontekstā.
    1. Skrējējiem sacensībās lielāks ātrums nozīmē ātrāku skrējienu. Vai, braucot sacensībās, ir vēlams, lai ātrums būtu ar augstu vai zemu procentili?
    2. Ātruma 40. procentile noteiktā sacīkstē ir 7,5 jūdzes stundā. Uzrakstiet teikumu, interpretējot 40. procentili situācijas kontekstā.
    1. Skrējējiem sacensībās ir vēlams, lai ātrumam būtu liela procentile. Augsta procentile nozīmē lielāku ātrumu, kas ir ātrāks.
    2. 40% skrējēju skrēja ar ātrumu 7,5 jūdzes stundā vai mazāk (lēnāk). 60% skrējēju skrēja ar ātrumu 7,5 jūdzes stundā vai vairāk (ātrāk).

    Vai eksāmenā būtu vēlams nopelnīt atzīmi ar augstu vai zemu procentili? Paskaidrojiet.

    Mina gaida rindā Mehānisko transportlīdzekļu departamentā (DMV). Viņas gaidīšanas laiks 32 minūtes ir gaidīšanas laika 85. procentile. Vai tas ir labi vai slikti? Uzrakstiet teikumu, interpretējot 85. procentili šīs situācijas kontekstā.

    Gaidot rindā pie DMV, 85. procentile būtu ilgs gaidīšanas laiks, salīdzinot ar citiem gaidošajiem cilvēkiem. 85% cilvēku gaidīšanas laiks bija īsāks nekā Mina. Šajā kontekstā Mina dod priekšroku gaidīšanas laikam, kas atbilst zemākai procentilei. 85% cilvēku DMV gaidīja 32 minūtes vai mazāk. 15% cilvēku DMV gaidīja 32 minūtes vai ilgāk.

    Aptaujā, kurā apkopoti dati par nesenajiem koledžas absolventiem nopelnītajām algām, Li atklāja, ka viņas alga bija 78. procentilē. Vai Li būtu jāapmierina vai jāsatrauc par šo rezultātu? Paskaidrojiet.

    Pētījumā, kurā apkopoti dati par automašīnu bojājumu remonta izmaksām noteikta veida avārijas testos, noteiktam automašīnas modelim bija 1700 bojājumi un tā bija 90. procentilē. Vai šādam rezultātam vajadzētu būt apmierinātam vai sarūgtinātam ražotāju un patērētāju? Paskaidrojiet un uzrakstiet teikumu, kas šīs problēmas kontekstā interpretē 90. procentili.

    Ražotājs un patērētājs būtu satraukti. Šīs ir lielas bojājumu remonta izmaksas, salīdzinot ar citām izlasē iekļautajām automašīnām. TULKOJUMS: 90% no avārijas pārbaudītajām automašīnām bojājumu remonta izmaksas bija 1700 vai mazāk un tikai 10% bojājumu remonta izmaksas bija 1700 vai vairāk.

    Kalifornijas universitātei ir divi kritēriji, kurus izmanto, lai noteiktu pirmkursnieku uzņemšanas standartus koledžā UC sistēmā:

    1. Studentu & # 8217 GPA un standartizēto testu (SAT un ACTs) rādītāji tiek ievadīti formulā, kas aprēķina & # 8220pielietojumu indeksu & # 8221 rezultātu. Uzņemšanas indeksa rādītājs tiek izmantots, lai noteiktu atbilstības standartus, kas paredzēti, lai sasniegtu mērķi uzņemt 12% labāko vidusskolu studentu valstī. Šajā kontekstā kādu procentili pārstāv 12% labākie?
    2. Studenti, kuru GPA ir vismaz 96. procentile no visiem viņu vidusskolas studentiem, ir piemēroti (vietējā kontekstā tos sauc par atbilstošiem), pat ja viņi nav 12% no visiem štata studentiem. Cik procentu studentu no katras vidusskolas ir & # 8220piemēroti vietējā kontekstā & # 8221?

    Pieņemsim, ka jūs pērkat māju. Jūs un jūsu nekustamo īpašumu esat noteikuši, ka visdārgākā māja, ko varat atļauties, ir 34. procentile. Mājokļu cenu 34. procentile ir 240 000 pilsētā, uz kuru vēlaties pārcelties. Vai šajā pilsētā varat atļauties 34% māju vai 66% māju?

    Jūs varat atļauties 34% māju. 66% māju ir pārāk dārgas jūsu budžetam. TULKOJUMS: 34% māju maksā 240 000 vai mazāk. 66% māju maksā 240 000 vai vairāk.

    Izmantojiet šo informāciju, lai atbildētu uz nākamajiem sešiem vingrinājumiem. Sešdesmit pieciem nejauši izvēlētiem automašīnu pārdevējiem tika uzdots jautājums par to automašīnu skaitu, ko viņi parasti pārdod vienas nedēļas laikā. Četrpadsmit cilvēki atbildēja, ka viņi parasti pārdod trīs automašīnas deviņpadsmit parasti pārdod četras automašīnas, divpadsmit parasti pārdod piecas automašīnas, deviņas parasti pārdod sešas automašīnas, vienpadsmit parasti pārdod septiņas automašīnas.


    Datu atrašanās vietas mērījumi

    Kvartiles ir īpašas procentiles. Pirmā kvartile, J1, ir tāds pats kā 25. procentile un trešā kvartile, J3, ir tāds pats kā 75. procentile. Mediāna, M, sauc gan par otro kvartili, gan par 50. procentili.

    Lai aprēķinātu kvartiles un procentiles, datiem jābūt sakārtotiem no mazākā līdz lielākajam. Kvartiles sadala sakārtotos datus ceturtdaļās. Procentiles sadala sakārtotos datus simtdaļās. Vērtējums eksāmena 90. procentilē nenozīmē, ka obligāti esat saņēmis 90% no testa. Tas nozīmē, ka 90% testa rezultātu ir vienādi vai mazāki par jūsu rezultātiem un 10% no testa rezultātiem ir vienādi vai lielāki par jūsu testa rezultātiem.

    Procenti ir noderīgi, lai salīdzinātu vērtības. Šī iemesla dēļ universitātes un koledžas plaši izmanto procentiles. Viens gadījums, kad koledžas un universitātes izmanto procentiles, ir SAT rezultāti, lai noteiktu minimālo testēšanas rezultātu, kas tiks izmantots kā pieņemšanas koeficients. Piemēram, pieņemsim, ka hercogs pieņem SAT rādītājus 75. procentilē vai virs tās. Tas nozīmē vismaz 1220 punktu skaitu.

    Procenti tiek izmantoti galvenokārt ar ļoti lielām populācijām. Tāpēc, ja jūs teiktu, ka 90% testa rezultātu ir mazāki (un nav vienādi vai mazāk) nekā jūsu rezultāti, tas būtu pieņemami, jo vienas konkrētas datu vērtības noņemšana nav būtiska.

    The mediāna ir skaitlis, kas mēra datu "centru". Jūs varat domāt par mediānu kā par "vidējo vērtību", taču tai faktiski nav jābūt vienai no novērotajām vērtībām. Tas ir skaitlis, kas sakārtotos datus atdala uz pusēm. Puse vērtībām ir vienāds vai mazāks par vidējo, bet puse vērtību ir vienāds vai lielāks. Piemēram, ņemiet vērā šādus datus. * * *

    1 11.5 6 7.2 4 8 9 10 6.8 8.3 2 2 10 1 * * *

    Pasūtīts no mazākā līdz lielākajam: * * *

    1 1 2 2 4 6 6.8 7.2 8 8.3 9 10 10 11.5

    Tā kā ir 14 novērojumi, mediāna ir starp septīto vērtību 6,8 un astoto vērtību 7,2. Lai atrastu mediānu, saskaitiet abas vērtības kopā un daliet ar divām.

    Mediāna ir septiņi. Puse no vērtībām ir mazāka par septiņām un puse no vērtībām ir lielāka par septiņām.

    Kvartiles ir skaitļi, kas datus sadala ceturkšņos. Kvartiles var būt vai nebūt datu daļa. Lai atrastu kvartiles, vispirms atrodiet vidējo vai otro kvartili. Pirmā kvartile, J1, ir datu apakšējās puses vidējā vērtība un trešā kvartile, J3, ir datu augšējās puses vidējā vērtība jeb mediāna. Lai iegūtu ideju, apsveriet to pašu datu kopu: * * *

    1 1 2 2 4 6 6.8 7.2 8 8.3 9 10 10 11.5

    Mediāna vai otrā kvartile ir septiņi. Datu apakšējā puse ir 1, 1, 2, 2, 4, 6, 6.8. Apakšējās puses vidējā vērtība ir divas. * * *

    Numurs divi, kas ir daļa no datiem, ir pirmā kvartile. Ceturtā daļa no visām vērtību kopām ir vienāda vai mazāka par divām, un trīs ceturtdaļas no vērtībām ir vairāk nekā divas.

    Datu augšējā puse ir 7,2, 8, 8,3, 9, 10, 10, 11,5. Augšējās puses vidējā vērtība ir deviņi.

    The trešā kvartile, J3, ir deviņi. Trīs ceturtdaļas (75%) no pasūtītās datu kopas ir mazāk nekā deviņas. Ceturtā daļa (25%) no pasūtītās datu kopas ir lielāka par deviņām. Trešā kvartile ir daļa no šajā piemērā esošo datu kopas.

    The starpkvartilu diapazons ir skaitlis, kas norāda vidējās puses vai vidējo 50% datu izplatību. Tā ir atšķirība starp trešo kvartili (J3) un pirmā kvartile (J1).

    The IQR var palīdzēt noteikt potenciālu ārējie rādītāji. Tiek uzskatīts, ka vērtība ir potenciāls iznākums, ja tā ir mazāka par (1,5)IQR) zem pirmās kvartiles vai lielāks par (1,5) (IQR) virs trešās kvartiles. Iespējamie zaudējumi vienmēr prasa papildu izmeklēšanu.

    Potenciālais iznākums ir datu punkts, kas ievērojami atšķiras no citiem datu punktiem. Šie īpašie datu punkti var būt kļūdas vai kāda veida novirze, vai arī tie var būt atslēga datu izpratnei.

    Par šādām 13 nekustamā īpašuma cenām aprēķiniet IQR un nosakiet, vai kādas cenas ir potenciālie zaudējumi. Cenas ir norādītas dolāros. * * *

    389,950 230,500 158,000 479,000 639,000 114,950 5,500,000 387,000 659,000 529,000 575,000 488,800 1,095,000

    Pasūtiet datus no mazākā līdz lielākajam. * * *

    114,950 158,000 230,500 387,000 389,950 479,000 488,800 529,000 575,000 639,000 659,000 1,095,000 5,500,000

    IQR = 649,000 – 308,750 = 340,250

    Neviena mājas cena nav mazāka par –201625. Tomēr 5 500 000 ir vairāk nekā 1 159 375. Tāpēc 5 500 000 ir potenciāls ārējs.

    Aprēķiniet nākamajām 11 algām IQR un nosakiet, vai kādas algas ir lielākas. Algas ir dolāros.

    $33,000 $64,500 $28,000 $54,000 $72,000 $68,500 $69,000 $42,000 $54,000 $120,000 $40,500

    Abām datu kopām testa rezultātu piemērā atrodiet:

    1. Starpkvartilu diapazons. Salīdziniet abus starpkvartilu diapazonus.
    2. Jebkurš iznākums jebkurā komplektā.

    Piecu numuru kopsavilkums dienas un nakts nodarbībām ir

    Dienas grupas IQR ir J3J1 = 82,5 - 56 = 26,5 IQR nakts grupai ir J3J1 = 89 – 78 = 11

    Dienas klases starpkvartilu diapazons (izplatība vai mainīgums) ir lielāks nekā nakts klase IQR. Tas liek domāt, ka dienas klases klases pārbaudījumu rezultātos būs vairāk atšķirību.

    Dienas klases lielākie rezultāti tiek atrasti, izmantojot IQR reizes 1,5 likumu. Tātad,

    Tā kā dienas klases minimālās un maksimālās vērtības ir lielākas par 16,25 un mazākas par 122,25, nav atšķirību.

    Nakts klases izņēmumus aprēķina šādi:

    Šajā klasē jebkurš ieskaites rezultāts, kas ir mazāks par 61,5, ir labāks. Tāpēc rādītāji 45 un 25,5 ir ārpus rezultātiem. Tā kā neviena testa rezultāts nav lielāks par 105,5, augšējā gala robežas nav.

    Atrodiet sekojošo divu datu kopu starpkvartilu diapazonu un salīdziniet tos.

    69 96 81 79 65 76 83 99 89 67 90 77 85 98 66 91 77 69 80 94 * * *

    90 72 80 92 90 97 92 75 79 68 70 80 99 95 78 73 71 68 95 100

    Piecdesmit statistikas studentiem tika jautāts, cik daudz viņi guļ vienā skolas naktī (noapaļojot līdz tuvākajai stundai). Rezultāti bija:

    MIEGA SUMMA SKOLAS NAKTĪ (STUNDAS) BIEŽUMS SAISTĪTĀ BIEŽUMS KUMULATĪVĀ RELATĪVA BIEŽUMS
    4 2 0.04 0.04
    5 5 0.10 0.14
    6 7 0.14 0.28
    7 12 0.24 0.52
    8 14 0.28 0.80
    9 7 0.14 0.94
    10 3 0.06 1.00

    Atrodiet 28. procentili. Ievērojiet 0,28 slejā "kumulatīvais relatīvais biežums". Divdesmit astoņi procenti no 50 datu vērtībām ir 14 vērtības. Ir 14 vērtības, kas mazākas par 28. procentili. Tie ietver divus 4, piecus 5 un septiņus 6. 28. procentile ir starp pēdējiem sešiem un pirmajiem septiņiem. 28. procentile ir 6,5.

    Atrodiet vidējo. Vēlreiz apskatiet kolonnu "kumulatīvā relatīvā frekvence" un atrodiet 0,52. Mediāna ir 50. procentile jeb otrā kvartile. 50% no 50 ir 25. Ir 25 vērtības, kas ir mazākas par vidējo. Tajos ietilpst divi 4, pieci 5, septiņi 6 un vienpadsmit no 7. Mediāna jeb 50. procentile ir starp 25. vai septiņām un 26. vai 7. vērtībām. Mediāna ir septiņi.

    Atrodiet trešo kvartili. Trešā kvartile ir tāda pati kā 75. procentile. Jūs varat “atbildēt uz šo aci”. Apskatot kolonnu "kumulatīvā relatīvā frekvence", jūs atradīsit 0,52 un 0,80. Kad jums ir visi četri, pieci, seši un septiņi, jums ir 52% datu. Iekļaujot visus astoņus, jums ir 80% datu. Tad 75. procentilei jābūt astoņniekam. Vēl viens veids, kā apskatīt problēmu, ir atrast 75% no 50, kas ir 37,5, un noapaļot līdz 38. Trešā kvartile, J3, ir 38. vērtība, kas ir astoņi. Šo atbildi var pārbaudīt, skaitot vērtības. (Ir 37 vērtības zem trešās kvartiles un 12 vērtības iepriekš.)

    Četrdesmit autobusu vadītājiem tika jautāts, cik stundas viņi katru dienu pavada, veicot maršrutus (noapaļojot līdz tuvākajai stundai). Atrodiet 65. procentili.

    Maršrutā pavadītā laika daudzums (stundas) Biežums Relatīvais biežums Kumulatīvais relatīvais biežums
    2 12 0.30 0.30
    3 14 0.35 0.65
    4 10 0.25 0.90
    5 4 0.10 1.00

    1. Atrodiet 80. procentili.
    2. Atrodiet 90. procentili.
    3. Atrodiet pirmo kvartili. Kā vēl sauc pirmo kvartili?

    Izmantojot datus no biežuma tabulas, mums ir:

    1. 80. procentile ir starp pēdējiem astoņiem un pirmajiem deviņiem tabulā (starp 40. un 41. vērtību). Tāpēc mums jāņem 40. un 41. st vidējā vērtība. 80. procentile = 8 + 9 2 = 8,5
    2. 90. procentile būs 45. datu vērtība (atrašanās vieta ir 0,90 (50) = 45) un 45. datu vērtība ir deviņas.
    3. J1 ir arī 25. procentile. 25. procentiles atrašanās vietas aprēķins: P25 = 0,25 (50) = 12,5 ≈ 13 13. datu vērtība. Tādējādi 25. procentile ir seša.

    Skatiet [saiti]. Atrodiet trešo kvartili. Kā vēl sauc trešo kvartili?

    Jūsu instruktors vai klases dalībnieks visiem klases dalībniekiem jautās, cik daudz džemperu viņiem pieder. Atbildiet uz sekojošiem jautājumiem:

    1. Cik studentu tika aptaujāti?
    2. Kādu paraugu jūs veicāt?
    3. Konstruējiet divas dažādas histogrammas. Katram sākuma vērtība = _ _ _ _ _ beigu vērtība = _ _ _ _.
    4. Atrodiet vidējo, pirmo kvartili un trešo kvartili.
    5. Konstruējiet datu tabulu, lai atrastu:
      1. 10. procentile
      2. 70. procentile
      3. to studentu procentuālā daļa, kuriem pieder mazāk nekā četri džemperi

      Formula, lai atrastu kth procentile

      Ja jūs veiktu nelielu pētījumu, jūs atrastu vairākas formulas, lai aprēķinātu k th procentile. Šeit ir viens no tiem.

      k = k procentile. Tas var būt vai nebūt daļa no datiem.

      i = indekss (datu vērtības rangs vai pozīcija)

      n = kopējais datu skaits

      • Pasūtiet datus no mazākā līdz lielākajam.
      • Aprēķiniet i = k 100 (n + 1)
      • Ja i ir vesels skaitlis, tad k procentile ir datu vērtība i th pozīcija sakārtotajā datu kopā.
      • Ja i nav vesels skaitlis, tad apaļa i uz augšu un apaļu i līdz tuvākajiem skaitļiem. Vidēji abas datu vērtības šajās divās pozīcijās sakārtotajā datu kopā. To ir vieglāk saprast piemērā.

      Sarakstā ir iekļauti 29 gadi, lai sasniegtu Kinoakadēmijas balvu ieguvušos labākos aktierus secībā no mazākā līdz lielākajam. * * *

      18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

      ) (29 + 1) = 21. Divdesmit viens ir vesels skaitlis, un datu vērtība sakārtotās datu kopas 21. pozīcijā ir 64. 70. procentile ir 64 gadi.

      ) (29 + 1) = 24,9, kas NAV vesels skaitlis. Noapaļojiet to uz leju līdz 24 un līdz 25. Vecums 24. pozīcijā ir 71 un vecums 25. pozīcijā ir 72. Vidējais 71 un 72. 83. procentile ir 71,5 gadi.

      Sarakstā ir iekļauti 29 gadi, lai sasniegtu Kinoakadēmijas balvu ieguvušos labākos aktierus secībā no mazākā līdz lielākajam.

      18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77 * * *

      Aprēķiniet 20. procentili un 55. procentili.

      Procentiles var aprēķināt, izmantojot kalkulatorus un datorus. Ir dažādi tiešsaistes kalkulatori.

      Formula vērtības procentuālās daļas atrašanai datu kopā

      • Pasūtiet datus no mazākā līdz lielākajam.
      • x = datu vērtību skaits, skaitot no datu saraksta apakšas līdz pat vērtībai, kurai vēlaties atrast procentili.
      • y = datu vērtību skaits, kas vienāds ar datu vērtību, kurai vēlaties atrast procentili.
      • n = kopējais datu skaits.
      • Aprēķiniet x + 0,5 y n

      (100). Tad noapaļo līdz tuvākajam skaitlim.

      Sarakstā ir iekļauti 29 gadi, lai sasniegtu Kinoakadēmijas balvu ieguvušos labākos aktierus secībā no mazākā līdz lielākajam. * * *

      18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

      Skaitot no saraksta apakšas, ir 18 datu vērtības, kas ir mazākas par 58. Viena vērtība ir 58. x = 18 un y = 1. x + 0.5 y n

      (100) = 63,80. 58 ir 64. procentile.

      Skaitot no saraksta apakšas, ir trīs datu vērtības, kas mazākas par 25. Ir viena vērtība 25. x = 3 un y = 1. x + 0.5 y n

      (100) = 12,07. Divdesmit pieci ir 12. procentile.

      Uzskaitīti 30 gadu vecumi, lai sasniegtu Kinoakadēmijas balvu ieguvušos labākos aktierus secībā no mazākā līdz lielākajam.

      18 21 22 25 26 27 29 30 31, 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77 * * *

      Atrodiet 47 un 31 procentiles.

      Interpretējot procentiles, kvartiles un mediānu

      Procenti norāda datu vērtības relatīvo stāvokli, kad dati tiek sakārtoti skaitliskā secībā no mazākā līdz lielākajam. Datu vērtību procentuālais daudzums ir mazāks vai vienāds ar p procentili. Piemēram, 15% datu vērtību ir mazāka vai vienāda ar 15. procentili.

      • Zemas procentiles vienmēr atbilst zemākām datu vērtībām.
      • Augstas procentiles vienmēr atbilst augstākām datu vērtībām.

      Procentile var vai var neatbilst vērtējumam par to, vai tā ir "laba" vai "slikta". Interpretācija par to, vai noteikta procentile ir "laba" vai "slikta", ir atkarīga no situācijas konteksta, uz kuru dati attiecas. Dažās situācijās zemu procentili citos apstākļos uzskatīs par "labu", bet augstu procentili par "labu". Daudzās situācijās nav piemērojams vērtējums.

      Saprast, kā pareizi interpretēt procentiles, ir svarīgi ne tikai aprakstot datus, bet arī aprēķinot varbūtības šī teksta turpmākajās nodaļās.

      Rakstot procentiles interpretāciju norādīto datu kontekstā, teikumā jāietver šāda informācija.

      • informācija par izskatāmās situācijas kontekstu
      • datu vērtība (mainīgā vērtība), kas apzīmē procentili
      • to personu vai priekšmetu procentuālais daudzums, kuru datu vērtības ir zemākas par procentili
      • to personu vai priekšmetu procentuālais daudzums, kuru datu vērtības pārsniedz procentili.

      Laika ziņā paredzētajā matemātikas ieskaitē pirmā kvartile pēc laika, kas bija nepieciešama eksāmena pabeigšanai, bija 35 minūtes. Interpretējiet pirmo kvartili šīs situācijas kontekstā.

      • 25 procenti studentu eksāmenu pabeidza 35 minūtēs vai mazāk.
      • Septiņdesmit pieci procenti studentu eksāmenu pabeidza 35 minūtēs vai ilgāk.
      • Zema procentile varētu tikt uzskatīta par labu, jo ir vēlams ātrāk pabeigt eksāmenu ar laika ierobežojumu. (Ja aizņemsit pārāk ilgu laiku, iespējams, nevarēsiet pabeigt.)

      100 metru brasā trešā kvartile par laiku, lai pabeigtu sacīkstes, bija 11,5 sekundes. Interpretējiet trešo kvartili situācijas kontekstā.

      20 jautājumu matemātikas testā pareizo atbilžu skaita 70. procentile bija 16. Šīs situācijas kontekstā interpretējiet 70. procentili.

      Veicot 60 punktu rakstisku uzdevumu, nopelnīto punktu 80. procentile bija 49. Šīs situācijas kontekstā interpretējiet 80. procentili.

      Sabiedrības koledžā tika konstatēts, ka kredītvienību 30. procentile, kurā studenti tiek uzņemti, ir septiņas vienības. Interpretējiet 30. procentili šīs situācijas kontekstā.

      Sezonas laikā 40. procentile par punktiem, kas iegūti katram spēlētājam, spēlē ir astoņi. Šīs situācijas izpratnē interpretējiet 40. procentili.

      Šarpes vidusskola piesakās uz stipendiju, kas tiks izmantota fitnesa aprīkojuma pievienošanai sporta zālei. Direktore aptaujāja 15 anonīmus studentus, lai noteiktu, cik minūtes dienā skolēni pavada, vingrojot. Tiek parādīti 15 anonīmo studentu rezultāti.

      0 minūtes 40 minūtes 60 minūtes 30 minūtes 60 minūtes

      10 minūtes 45 minūtes 30 minūtes 300 minūtes 90 minūtes

      30 minūtes 120 minūtes 60 minūtes 0 minūtes 20 minūtes

      Nosakiet šādas piecas vērtības.

      Ja jūs būtu galvenais, vai jūs būtu pamatoti iegādāties jaunu fitnesa aprīkojumu? Tā kā 75% studentu katru dienu vingro 60 minūtes vai mazāk, un kopš IQR ir 40 minūtes (60 - 20 = 40), mēs zinām, ka puse aptaujāto studentu katru dienu vingrina no 20 minūtēm līdz 60 minūtēm. Tas, šķiet, ir saprātīgs laiks, kas pavadīts vingrinājumiem, tāpēc principāls būtu pamatots, iegādājoties jauno aprīkojumu.

      Tomēr galvenajam jābūt uzmanīgam. Šķiet, ka vērtība 300 ir potenciāls iznākums.

      Vērtība 300 ir lielāka par 120, tāpēc tā ir potenciālā vērtība. Ja mēs to izdzēsīsim un aprēķināsim piecas vērtības, mēs saņemsim šādas vērtības:

      Mums joprojām ir 75% studentu, kuri katru dienu vingro 60 minūtes vai mazāk, un puse studentu vingrina no 20 līdz 60 minūtēm dienā. Tomēr 15 studenti ir maza izlase, un direktoram vajadzētu apsekot vairāk studentu, lai būtu pārliecināts par viņa aptaujas rezultātiem.

      Atsauces

      Kašons, Deniss, Pols Overbergs."Skaitīšanas dati rāda, ka minoritātes tagad ir lielākā daļa ASV dzimušo." USA Today, 2012. Pieejams tiešsaistē vietnē http://usatoday30.usatoday.com/news/nation/story/2012-05-17/minority-birthscensus/55029100/1 (skatīts 2013. gada 3. aprīlī).

      Dati no Amerikas Savienoto Valstu Tirdzniecības departamenta: Amerikas Savienoto Valstu skaitīšanas birojs. Pieejams tiešsaistē vietnē http://www.census.gov/ (skatīts 2013. gada 3. aprīlī).

      "1990. gada tautas skaitīšana". Amerikas Savienoto Valstu Tirdzniecības departaments: Amerikas Savienoto Valstu Tautas skaitīšanas birojs. Pieejams tiešsaistē vietnē http://www.census.gov/main/www/cen1990.html (skatīts 2013. gada 3. aprīlī).

      Dati no Sanhosē dzīvsudraba ziņas.

      Dati no Laika žurnāls Yankelovich Partners, Inc. aptauja

      Nodaļas pārskats

      Vērtības, kas sadala rangu sakārtotu datu kopu 100 vienādās daļās, sauc par procentilēm. Procentiles tiek izmantotas datu salīdzināšanai un interpretēšanai. Piemēram, novērojums 50. procentilē būtu lielāks par 50 procentiem no visiem citiem komplektiem. Kvartiles sadala datus ceturtdaļās. Pirmā kvartile (J1) ir 25. procentile, otrā kvartile (J2 vai mediāna) ir 50. procentile un trešā kvartile (J3) ir 75. procentile. Starpkvartilu diapazons vai IQR, ir datu vidējo 50 procentu diapazons. The IQR tiek atrasta, atņemot J1 no J3, un var palīdzēt noteikt izņēmumus, izmantojot šādus divus izteicienus.

      Formulu apskats

      kur i = datu vērtības rangs vai pozīcija,

      Izteiksme datu vērtības procentiles atrašanai: (x + 0,5 y n)

      kur x = vērtību skaits, kas tiek skaitīts no datu saraksta apakšas līdz pat vērtībai, kurai vēlaties atrast procentili,

      y = datu vērtību skaits, kas vienāds ar datu vērtību, kurai vēlaties atrast procentili,

      Sarakstā ir iekļauti 29 gadi, lai sasniegtu labāko akadēmijas balvu ieguvējus secībā no mazākā līdz lielākajam.

      18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

      Uzskaitīti 32 gadi, lai sasniegtu labākos akadēmijas balvas ieguvējus secībā no mazākā līdz lielākajam.

      18 18 21 22 25 26 27 29 30 31 31 33 36 37 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

      Džesijs savā absolventu klasē, kurā bija 180 skolēnu, ierindojās 37. vietā. Kādā procentilē ir Džesijas rangs?

      Džesijs pabeidza 37. vietu 180 studentu klasē. Zem Jesse ir 180 - 37 = 143 studenti. Ir viens rangs 37.

      x = 143 un y = 1. x + 0.5 y n

      (100) = 79,72. Džesijas rangs 37 liek viņam 80. procentili.

      1. Skrējējiem sacensībās zems laiks nozīmē ātrāku skrējienu. Sacensību uzvarētājiem ir īsākais darbības laiks. Vai, startējot sacensībās, ir vēlams, lai finiša laiks būtu ar augstu vai zemu procentili?
      2. Skrējiena laika 20. procentile konkrētā braucienā ir 5,2 minūtes. Uzrakstiet teikumu, interpretējot 20. procentili situācijas kontekstā.
      3. Velosipēdistu 90. procentiles velosipēdists sacensības veica 1 stundā un 12 minūtēs. Vai viņš ir starp ātrākajiem vai lēnākajiem riteņbraucējiem sacensībās? Uzrakstiet teikumu, interpretējot 90. procentili situācijas kontekstā.
      1. Skrējējiem sacensībās lielāks ātrums nozīmē ātrāku skrējienu. Vai, braucot sacensībās, ir vēlams ātrums ar augstu vai zemu procentili?
      2. Ātruma 40. procentile noteiktā sacīkstē ir 7,5 jūdzes stundā. Uzrakstiet teikumu, interpretējot 40. procentili situācijas kontekstā.
      1. Skrējējiem sacensībās ir vēlams, lai ātrumam būtu liela procentile. Augsta procentile nozīmē lielāku ātrumu, kas ir ātrāks.
      2. 40% skrējēju skrēja ar ātrumu 7,5 jūdzes stundā vai mazāk (lēnāk). 60% skrējēju skrēja ar ātrumu 7,5 jūdzes stundā vai vairāk (ātrāk).

      Vai eksāmenā būtu vēlams nopelnīt atzīmi ar augstu vai zemu procentili? Paskaidrojiet.

      Mina gaida rindā Mehānisko transportlīdzekļu departamentā (DMV). Viņas gaidīšanas laiks 32 minūtes ir gaidīšanas laika 85. procentile. Vai tas ir labi vai slikti? Uzrakstiet teikumu, interpretējot 85. procentili šīs situācijas kontekstā.

      Gaidot rindā pie DMV, 85. procentile būtu ilgs gaidīšanas laiks, salīdzinot ar citiem gaidošajiem cilvēkiem. 85% cilvēku gaidīšanas laiks bija īsāks nekā Mina. Šajā kontekstā Mina dod priekšroku gaidīšanas laikam, kas atbilst zemākai procentilei. 85% cilvēku DMV gaidīja 32 minūtes vai mazāk. 15% cilvēku DMV gaidīja 32 minūtes vai ilgāk.

      Aptaujā, kurā apkopoti dati par nesenajiem koledžas absolventiem nopelnītajām algām, Li atklāja, ka viņas alga bija 78. procentilē. Vai Li būtu jāapmierina vai jāsatrauc par šo rezultātu? Paskaidrojiet.

      Pētījumā, kurā apkopoti dati par automašīnu bojājumu remonta izmaksām noteikta veida avārijas testos, noteiktam automašīnas modelim bija 1700 USD bojājumi un tā bija 90. procentilē. Vai šādam rezultātam vajadzētu būt apmierinātam vai sarūgtinātam ražotāju un patērētāju? Paskaidrojiet un uzrakstiet teikumu, kas šīs problēmas kontekstā interpretē 90. procentili.

      Ražotājs un patērētājs būtu satraukti. Šīs ir lielas bojājumu remonta izmaksas, salīdzinot ar citām izlasē iekļautajām automašīnām. TULKOJUMS: 90% no avārijas pārbaudītajām automašīnām bojājumu novēršanas izmaksas bija 1700 USD vai mazāk. Tikai 10% bojājumu novēršanas izmaksas bija 1700 USD vai vairāk.

      Kalifornijas universitātei ir divi kritēriji, kurus izmanto, lai noteiktu pirmkursnieku uzņemšanas standartus koledžā UC sistēmā:

      1. Studentu GPA un standartizēto testu (SAT un ACT) rezultāti tiek ievadīti formulā, kas aprēķina “uzņemšanas indeksa” punktu skaitu. Uzņemšanas indeksa rādītājs tiek izmantots, lai noteiktu atbilstības standartus, kas paredzēti, lai sasniegtu mērķi uzņemt 12% labāko vidusskolu studentu valstī. Šajā kontekstā kādu procentili pārstāv 12% labākie?
      2. Studenti, kuru GPA ir vismaz 96. procentile no visiem viņu vidusskolas studentiem, ir piemēroti (vietējā kontekstā tos sauc par atbilstošiem), pat ja viņi nav 12% no visiem štata studentiem. Cik procentu studentu no katras vidusskolas ir “piemēroti vietējā kontekstā”?

      Pieņemsim, ka jūs pērkat māju. Jūs un jūsu nekustamo īpašumu esat noteikuši, ka visdārgākā māja, ko varat atļauties, ir 34. procentile. Mājokļu cenu 34. procentile ir 240 000 USD pilsētā, uz kuru vēlaties pārcelties. Vai šajā pilsētā varat atļauties 34% māju vai 66% māju?

      Jūs varat atļauties 34% māju. 66% māju ir pārāk dārgas jūsu budžetam. TULKOJUMS: 34% māju maksā USD 240 000 vai mazāk. 66% māju maksā USD 240 000 vai vairāk.

      Izmantojiet šo informāciju, lai atbildētu uz nākamajiem sešiem vingrinājumiem. Sešdesmit pieciem nejauši izvēlētiem automašīnu pārdevējiem tika uzdots jautājums par to automašīnu skaitu, ko viņi parasti pārdod vienas nedēļas laikā. Četrpadsmit cilvēki atbildēja, ka viņi parasti pārdod trīs automašīnas deviņpadsmit parasti pārdod četras automašīnas, divpadsmit parasti pārdod piecas automašīnas, deviņas parasti pārdod sešas automašīnas, vienpadsmit parasti pārdod septiņas automašīnas.


      3.4.: Datu atrašanās vietas mērījumi


      Q-1 - datu atrašanās vietas mērījumi

      • i. Norādiet datu tipu (kvantitatīvi - diskrēti, kvantitatīvi - nepārtraukti vai kvalitatīvi), kas tiktu izmantoti atbildes raksturošanai.
      • ii. Sniedziet datu piemēru.
      • a. Uz koncertu pārdoto biļešu skaits
      • b. Ķermeņa tauku daudzums
      • c. Mīļākā beisbola komanda
      • d. Laiks rindā pirkt pārtikas preces
      • e. Evergreen Valley College uzņemto studentu skaits
      • f. Mos & # 8211 skatījās televīzijas šovu
      • g. Zobu pastas zīmols
      • h. Attālums līdz tuvākajam kinoteātrim
      • i. Fortune 500 uzņēmumu vadītāju vecums
      • j. Konkurējošo datoru izklājlapu programmatūras pakotņu skaits
      • a. kvantitatīvs - diskrēts
      • b. kvantitatīvs - nepārtraukts
      • c. kvalitatīvs
      • d. kvantitatīvs - nepārtraukts
      • e. kvantitatīvs - diskrēts
      • f. kvalitatīvs
      • g. kvalitatīvs
      • h. kvantitatīvs - nepārtraukts
      • i. kvantitatīvs - nepārtraukts
      • j. kvantitatīvs - diskrēts

      Piecdesmit nepilna laika studentiem tika jautāts, cik daudz kursu viņi apguva šajā termiņā. Rezultāti (nepilnīgi) ir parādīti zemāk:

      • a. Aizpildiet tukšās vietas tabulā iepriekš.
      • b. Cik procentu studentu iziet tieši divus kursus?
      • c. Cik procentu studentu iziet vienu vai divus kursus?

      Sešdesmit pieaugušajiem ar smaganu slimībām tika uzdots jautājums par to, cik reizes nedēļā viņi izmantoja zobu diegu pirms diagnozes noteikšanas. Rezultāti (nepilnīgi) ir parādīti zemāk:

      • a. Aizpildiet tukšās vietas tabulā iepriekš.
      • b. Cik procenti pieaugušo izmanto zobu diegu sešas reizes nedēļā?
      • c. Cik procenti šķiedru ne vairāk kā trīs reizes nedēļā?

      Fitnesa centru interesē vidējais laiks, ko klients katru nedēļu vingro centrā. Pētījuma ziņā definējiet sekojošo. Norādiet piemērus, kur tas ir piemērots.

      • a. Populācija
      • b. Paraugs
      • c. Parametrs
      • d. Statistika
      • e. Mainīgs
      • f. Dati

      Slēpošanas kūrortus interesē vidējais vecums, kādā bērni apmeklē pirmās slēpošanas un snovborda nodarbības. Viņiem šī informācija ir nepieciešama, lai optimāli plānotu slēpošanas klases. Pētījuma ziņā definējiet sekojošo. Norādiet piemērus, kur tas ir piemērots.

      • a. Populācija
      • b. Paraugs
      • c. Parametrs
      • d. Statistika
      • e. Mainīgs
      • f. Dati
      • a. Bērni, kuri apmeklē slēpošanas vai snovborda nodarbības
      • b. Šo bērnu grupa
      • c. Iedzīvotāju vidējais rādītājs
      • d. Izlases vidējā vērtība
      • e. X = viena bērna vecums, kurš apmeklē pirmo slēpošanas vai snovborda nodarbību
      • f. X vērtība, piemēram, 3, 7 utt.

      Kardiologu interesē vidējais atveseļošanās periods pacientiem, kuriem ir bijuši sirdslēkmes. Pētījuma ziņā definējiet sekojošo. Norādiet piemērus, kur tas ir piemērots.

      • a. Populācija
      • b. Paraugs
      • c. Parametrs
      • d. Statistika
      • e. Mainīgs
      • f. Dati

      Apdrošināšanas sabiedrības ir ieinteresētas vidējās klientu veselības izmaksās katru gadu, lai viņi varētu noteikt veselības apdrošināšanas izmaksas. Pētījuma ziņā definējiet sekojošo. Norādiet piemērus, kur tas ir piemērots.

      • a. Populācija
      • b. Paraugs
      • c. Parametrs
      • d. Statistika
      • e. Mainīgs
      • f. Dati
      • a. Apdrošināšanas sabiedrību klienti
      • b. Klientu grupa
      • c. Vidējās klientu veselības izmaksas
      • d. Parauga vidējās veselības izmaksas
      • e. X = viena klienta veselības izmaksas
      • f. X vērtība, piemēram, 34, 9, 82 utt.

      Politiķi interesē tas, cik īsti balsotāju savā rajonā domā, ka viņš dara labu darbu. Pētījuma ziņā definējiet sekojošo. Norādiet piemērus, kur tas ir piemērots.

      • a. Populācija
      • b. Paraugs
      • c. Parametrs
      • d. Statistika
      • e. Mainīgs
      • f. Dati

      Laulības konsultantu interesē, cik proporcionāli viņas konsultētie klienti paliek precējušies. Pētījuma ziņā definējiet sekojošo. Norādiet piemērus, kur tas ir piemērots.

      • a. Populācija
      • b. Paraugs
      • c. Parametrs
      • d. Statistika
      • e. Mainīgs
      • f. Dati
      • a. Visi konsultanta klienti
      • b. Klientu grupa
      • c. Visu viņas klientu īpatsvars, kas paliek precējušies
      • d. Izlases daļa, kas paliek precējusies
      • e. X = pāru skaits, kas paliek precējušies
      • f. Jā nē

      Politiskos aptaujas dalībniekus var interesēt to cilvēku īpatsvars, kuri balsos par konkrētu lietu. Pētījuma ziņā definējiet sekojošo. Norādiet piemērus, kur tas ir piemērots.

      • a. Populācija
      • b. Paraugs
      • c. Parametrs
      • d. Statistika
      • e. Mainīgs
      • f. Dati

      Mārketinga kompāniju interesē to cilvēku īpatsvars, kuri iegādāsies konkrētu produktu. Pētījuma ziņā definējiet sekojošo. Norādiet piemērus, kur tas ir piemērots.

      • a. Populācija
      • b. Paraugs
      • c. Parametrs
      • d. Statistika
      • e. Mainīgs
      • f. Dati
      • a. Visi cilvēki (varbūt noteiktā ģeogrāfiskā apgabalā, piemēram, Amerikas Savienotajās Valstīs)
      • b. Cilvēku grupa
      • c. To cilvēku īpatsvars, kuri iegādāsies produktu
      • d. Parauga daļa, kas iegādāsies produktu
      • e. X = cilvēku skaits, kas to iegādāsies
      • f. pirkt, nevis pirkt

      Aviokompānijas ir ieinteresētas zīdaiņu skaita konsekvencē katrā lidojumā, lai viņiem būtu piemērots drošības aprīkojums. Pieņemsim, ka aviokompānija veic aptauju. Pateicības dienas nedēļas nogalē tā apseko 6 lidojumus no Bostonas uz Soltleiksitiju, lai noteiktu zīdaiņu skaitu lidojumos. Tas nosaka drošības aprīkojuma daudzumu, kas vajadzīgs šī pētījuma rezultātam.

      • a. Izmantojot pilnus teikumus, uzskaitiet trīs lietas, kas nepareizas, veicot aptauju.
      • b. Izmantojot pilnus teikumus, uzskaitiet trīs veidus, kā uzlabot aptauju, ja to atkārtotu.

      Pieņemsim, ka vēlaties noteikt vidējo studentu skaitu vienā statistikas klasē jūsu valstī. Aprakstiet iespējamo izlases metodi 3 un # 8211 5 pilnos teikumos. Sniedziet detalizētu aprakstu.

      Pieņemsim, ka vēlaties noteikt vidējo sodas kārbu skaitu, ko katru mēnesi dzer divdesmitgadnieki. Aprakstiet iespējamo izlases metodi 3 - 5 pilnos teikumos. Sniedziet detalizētu aprakstu.

      2004.-2005. Mācību gadā Longbīčas pilsētas koledžā tika aptaujāti 726 tālmācības studenti, kuriem tika uzdoti iemesli, kāpēc viņi apmeklēja tālmācības klasi. (Avots: Amit Schitai, LBCC Mācību tehnoloģiju un tālmācības direktore). Šīs aptaujas rezultāti ir norādīti zemāk esošajā tabulā.

      Iemesli LBCC tālmācības kursu apgūšanai
      Ērtības 87.6%
      Nevar ierasties pilsētiņā 85.1%
      Papildus saviem DL kursiem apmeklēju universitātes pilsētiņas kursus 71.7%
      Instruktoram ir laba reputācija 69.1%
      Lai izpildītu prasības par pārsūtīšanu 60.8%
      Izpildīt asociētā grāda prasības 53.6%
      Domāja, ka DE būs daudzveidīgāka un interesantāka 53.2%
      Man patīk datortehnika 52.1%
      Bija panākumi ar iepriekšējo DL kursu 52.0%
      Campus sadaļas bija pilnas 42.1%
      Izpildīt prasības attiecībā uz profesionālo sertifikāciju 27.1%
      Invaliditātes dēļ 20.5%

      Pieņemsim, ka aptauja ļāva studentiem izvēlēties no atbildēm, kas uzskaitītas iepriekš tabulā.

      • a. Kāpēc procenti var sasniegt vairāk nekā 100%?
      • b. Vai tas noteikti nozīmē kļūdu ziņojumā?
      • c. Kā, jūsuprāt, jautājums tika formulēts, lai saņemtu atbildes, kuru kopskaits pārsniedz 100%?
      • d. Kā jautājums varētu tikt formulēts, lai iegūtu 100% atbildes?

      Deviņpadsmit imigrantiem uz ASV tika jautāts, cik gadus līdz tuvākajam gadam viņi ir dzīvojuši ASV. Dati ir šādi:

      2 5 7 2 2 10 20 15 0 7 0 20 5 12 15 12 4 5 10

      Tika izveidota šāda tabula:

      • a. Izlabojiet kļūdas uz galda. Paskaidrojiet arī to, kā kāds varēja nonākt pie nepareizā (-ajiem) numura (-iem).
      • b. Paskaidrojiet, kas ir nepareizs ar šo apgalvojumu: & # 822047 procenti aptaujāto cilvēku ir dzīvojuši ASV 5 gadus & # 8221
      • c. Labojiet iepriekš teikto, lai tas būtu pareizs.
      • d. Kāda daļa aptaujāto cilvēku ir dzīvojuši ASV 5 vai 7 gadus?
      • e. Cik liela daļa aptaujāto cilvēku ir dzīvojuši ASV ne vairāk kā 12 gadus?
      • f. Kāda daļa aptaujāto cilvēku ir dzīvojuši ASV mazāk nekā 12 gadus?
      • g. Kāda daļa aptaujāto cilvēku ir dzīvojuši ASV no 5 līdz 20 gadiem ieskaitot?

      Tika veikta 3274 & # 8220mikroprocesoru ģenerācijas & # 8221 cilvēku (cilvēki, kas dzimuši kopš 1971. gada, kad tika izgudrots mikroprocesors) 3274 cilvēki. Tika ziņots, ka 48% no aptaujātajām personām paziņoja, ka, ja viņiem būtu iztērēti 2000 USD, viņi to izmantotu datortehnikai. Tāpat 66% aptaujāto uzskatīja sevi par samērā gudriem datoru lietotājiem. (Avots: Sanhosē Mercury News)

      • a. Vai jūs uzskatāt, ka izlases lielums ir pietiekami liels šāda veida pētījumam? Kāpēc vai kāpēc ne?
      • b. Vai jūs uzskatāt, ka, balstoties uz jūsu & # 8220gut sajūtu & # 8221, procenti precīzi atspoguļo ASV iedzīvotāju skaitu kopš 1971. gada dzimušajiem indivīdiem? Ja nē, vai jūs domājat, ka iedzīvotāju īpatsvars faktiski ir lielāks vai zemāks par izlases statistiku? Kāpēc?

      Papildu informācija: Aptauju ziņoja Intel korporācija, kas apmeklēja Losandželosas konferenču centru, lai redzētu Smithsonian Institure ceļa izstādi ar nosaukumu # # 8220Americ & # 8217s Smithsonian & # 8221

      • c. Izmantojot šo papildu informāciju, vai jūs domājat, ka pasākumā visas demogrāfiskās un etniskās grupas bija vienādi pārstāvētas? Kāpēc vai kāpēc ne?
      • d. Pievienojot papildu informāciju, komentējiet to, cik precīzi, jūsuprāt, izlases statistika atspoguļo populācijas parametrus.
      • a. Uzskaitiet dažas praktiskas grūtības, kas saistītas ar precīzu telefonu aptaujas rezultātu iegūšanu.
      • b. Uzskaitiet dažas praktiskas grūtības, kas saistītas ar precīzu rezultātu iegūšanu no aptaujas pa pastu.
      • c. Kopā ar klasesbiedriem pārdomājiet dažus veidus, kā pārvarēt šīs problēmas, ja nepieciešams veikt aptauju pa tālruni vai pastu.

      Izmēģiniet šos vairāku atbilžu jautājumus

      Nākamie četri jautājumi attiecas uz sekojošo: Taho ezera kopienas koledžas pasniedzēju interesē vidējais dienu skaits, kad Taho ezera kopienas matemātikas studenti ceturtdaļas laikā nav nodarbināti.

      Kas ir viņu interesējošie iedzīvotāji?

      • A. Visi Lake Tahoe Kopienas koledžas studenti
      • B. Visi Lake Tahoe Kopienas koledžas angļu valodas studenti
      • C. Visi Lake Tahoe Kopienas koledžas studenti viņas klasēs
      • D. Visi Lake Tahoe Kopienas koledžas matemātikas studenti

      X = dienu skaits, kad Taho ezera kopienas matemātikas students nav klāt

      Šajā gadījumā X ir piemērs:

      Instruktore ņem paraugu, apkopojot datus par 5 nejauši izvēlētiem studentiem no katras Lake Tahoe Community College matemātikas klases. Viņa izmantoja paraugu ņemšanas veidu

      • A. Kopu paraugu ņemšana
      • B. Stratificēta paraugu ņemšana
      • C. Vienkārša izlases veida atlase
      • D. Ērtības paraugu ņemšana

      Instructo & # 8217s paraugs rada vidējo prombūtnes dienu skaitu 3,5 dienas. Šī vērtība ir a

      Nākamie divi jautājumi attiecas uz šo relatīvo frekvenču tabulu par viesuļvētrām, kuras laika posmā no 1851. līdz 2004. gadam ir tieši skārušas ASV. Viesuļvētrām tiek piešķirts stipruma kategorijas vērtējums, pamatojoties uz minimālo vētra radīto vēja ātrumu. (http://www.nhc.noaa.gov/gifs/table5.gif)

      Tiešo viesuļvētru trāpījumu biežums
      Kategorija Tiešo trāpījumu skaits Relatīvais biežums Kumulatīvais biežums
      Kopā = 273
      1 109 0.3993 0.3993
      2 72 0.2637 0.6630
      3 71 0.2601
      4 18 0.9890
      5 3 0.0110 1.0000

      Kāds ir tiešo trāpījumu, kas bija 4. kategorijas viesuļvētras, relatīvais biežums?

      Kāds ir to tiešo trāpījumu relatīvais biežums, kuri VISPĀR bija 3. kategorijas vētra?

      Nākamie trīs jautājumi attiecas uz sekojošo: Tika veikts pētījums, lai noteiktu vecumu, reižu skaitu nedēļā un ilgumu (laika daudzumu), kad iedzīvotāji izmanto vietējo parku Sanhosē. Pirmā māja ap parku tika izvēlēta nejauši un pēc tam tika intervētas katra 8. māja apkārtnē ap parku.

      & # 8216Kādu reižu skaits vienā reizē & # 8217 ir kāda veida dati?

      & # 8216Ilgums (laika daudzums & # 8217 ir kāda veida dati?

      [Jūsu viedoklis mums ir svarīgs. Ja jums ir komentārs, labojums vai jautājums, kas attiecas uz šo nodaļu, lūdzu, nosūtiet to attiecīgajai personai, kas norādīta kontaktinformācijā vai apmeklējiet šī kursa forumus.]


      Ievads

      Kopējie atrašanās vietas mērījumi ir kvartiles un procentiles.

      Kvartiles ir īpašas procentiles. Pirmā kvartile, J1, ir tāds pats kā 25. procentile un trešā kvartile, J3, ir tāds pats kā 75. procentile. Mediāna, M, sauc gan par otro kvartili, gan par 50. procentili.

      Lai aprēķinātu kvartiles un procentiles, dati jāpasūta no mazākā līdz lielākajam. Kvartiles sadala sakārtotos datus ceturtdaļās. Procentiles sadala sakārtotos datus simtdaļās. Atgādināsim, ka procents nozīmē simtdaļu. Tātad procentiles nozīmē, ka dati ir sadalīti 100 sadaļās. Vērtējums eksāmena 90. procentilē nebūt nenozīmē, ka testā esat saņēmis 90 procentus. Tas nozīmē, ka 90 procenti testa rezultātu ir vienādi vai mazāki par jūsu rādītājiem un ka 10 procenti testa rezultātu ir vienādi vai lielāki par jūsu testa rezultātiem.

      Procenti ir noderīgi, lai salīdzinātu vērtības. Šī iemesla dēļ universitātes un koledžas plaši izmanto procentiles. Viens gadījums, kad koledžas un universitātes izmanto procentiles, ir SAT rezultāti, lai noteiktu minimālo testēšanas rezultātu, kas tiks izmantots kā pieņemšanas koeficients. Piemēram, pieņemsim, ka hercogs pieņem SAT rādītājus 75. procentilē vai virs tās. Tas nozīmē vismaz 1220 punktu skaitu.

      Procenti tiek izmantoti galvenokārt ar ļoti lielām populācijām. Tādēļ, ja jūs teiktu, ka 90 procenti testa rezultātu ir mazāki - un nav vienādi vai mazāk - nekā jūsu rezultāti, tas būtu pieņemami, jo vienas noteiktas datu vērtības noņemšana nav būtiska.

      Mediāna ir skaitlis, kas mēra centrā datu. Jūs varat domāt par mediānu kā vidējā vērtība, bet patiesībā tam nav jābūt vienai no novērotajām vērtībām. Tas ir skaitlis, kas sakārtotos datus atdala uz pusēm. Puse vērtībām ir vienāds vai mazāks par vidējo, bet puse vērtību ir vienāds vai lielāks. Piemēram, ņemiet vērā šādus datus:

      Tā kā ir 14 novērojumi (pāra skaitlis datu vērtību), mediāna ir starp septīto vērtību 6.8 un astoto vērtību 7.2. Lai atrastu mediānu, saskaitiet abas vērtības kopā un daliet ar divām.

      Mediāna ir septiņi. Puse no vērtībām ir mazāka par septiņām un puse no vērtībām ir lielāka par septiņām.

      Kvartiles ir skaitļi, kas datus atdala ceturkšņos. Kvartiles var būt vai nebūt datu daļa. Lai atrastu kvartiles, vispirms atrodiet mediānu vai, otrkārt, kvartili. The pirmā kvartile, J1, ir datu apakšējās puses vidējā vērtība un trešā kvartile, J3, ir datu augšējās puses vidējā vērtība jeb mediāna. Lai iegūtu ideju, apsveriet to pašu datu kopu:

      1, 1, 2, 2, 4, 6, 6.8, 7.2, 8, 8.3, 9, 10, 10, 11.5

      Datu kopai ir pāra vērtību skaits (14 datu vērtības), tāpēc mediāna būs vidējā no divām vidējām vērtībām (vidējā vērtība 6,8 un 7,2), kas tiek aprēķināta kā 6,8 + 7,2 2 6,8 + 7,2 2 un ir vienāda 7.

      Tātad mediāna jeb otrā kvartile (Q 2 Q 2) ir 7.

      Pirmā kvartile ir datu apakšējās puses mediāna, tādēļ, ja datus dalām septiņās vērtībās apakšējā pusē un septiņās vērtībās augšējā pusē, mēs varam redzēt, ka apakšējā pusē mums ir nepāra skaitlis . Tādējādi apakšējās puses vidējā daļa jeb pirmā kvartile (Q 1 Q 1) būs vidējā vērtība vai 2. Izmantojot to pašu procedūru, mēs varam redzēt, ka augšējās puses vai trešās kvartiles (Q 3 Q 3) būs augšējās puses vidējā vērtība vai 9.

      Kvartiles ir ilustrētas zemāk:

      Starpkvartilu diapazons ir skaitlis, kas norāda vidējās puses izplatību jeb vidējos 50 procentus datu. Tā ir atšķirība starp trešo kvartili (J3) un pirmā kvartile (J1)

      IQR = J3J1. The IQR šai datu kopai tiek aprēķināts kā 9 mīnus 2 vai 7.

      The IQR var palīdzēt noteikt potenciālu ārējie rādītāji. Ir aizdomas, ka vērtība ir potenciāls iznākums, ja tā ir mazāka par 1,5 × IQR zem pirmās kvartiles vai lielāks par 1,5 × IQR virs trešās kvartiles. Iespējamie zaudējumi vienmēr prasa papildu izmeklēšanu.

      Potenciālais iznākums ir datu punkts, kas ievērojami atšķiras no citiem datu punktiem. Šie īpašie datu punkti var būt kļūdas vai kāda veida novirze, vai arī tie var būt atslēga datu izpratnei.

      2.15. Piemērs

      Par šādām 13 nekustamā īpašuma cenām aprēķiniet IQR un nosakiet, vai kādas cenas ir potenciālie zaudējumi. Cenas ir norādītas dolāros.

      389,950 230,500 158,000 479,000 639,000 114,950 5,500,000 387,000 659,000 529,000 575,000 488,800 1,095,000

      Pasūtiet šādus datus no mazākajiem līdz lielākajiem:

      114,950, 158,000, 230,500, 387,000, 389,950, 479,000, 488,800, 529,000, 575,000, 639,000, 659,000, 1,095,000, 5,500,000.

      IQR = 649,000 – 308,750 = 340,250

      Neviena mājas cena nav mazāka par –201625. Tomēr 5 500 000 ir vairāk nekā 1 159 375. Tāpēc 5 500 000 ir potenciāls izņēmums.

      Aprēķiniet 11 algām IQR un nosakiet, vai kādas algas ir lielākas. Šīs algas ir dolāros:

      $33,000 , $64,500 , $28,000 , $54,000 , $72,000 , $68,500 , $69,000 , $42,000 , $54,000 , $120,000 , $40,500

      Iepriekš redzamajā piemērā jūs tikko redzējāt vidējās, pirmās un trešās kvartiles aprēķinus. Šīs trīs vērtības ir daļa no piecu skaitļu kopsavilkuma. Pārējās divas vērtības ir minimālā vērtība (vai min) un maksimālā vērtība (vai max). Piecu numuru kopsavilkums tiek izmantots lodziņa diagrammas izveidošanai.

      Atrodiet starpkvartilu diapazonu šīm divām datu kopām un salīdziniet tās:

      69, 96, 81, 79, 65, 76, 83, 99, 89, 67, 90, 77, 85, 98, 66, 91, 77, 69, 80, 94

      2.16. Piemērs

      Piecdesmit statistikas studentiem tika jautāts, cik daudz viņi guļ vienā skolas naktī (noapaļojot līdz tuvākajai stundai). Rezultāti bija šādi:

      Miega daudzums skolas naktī (stundas) Biežums Relatīvais biežums Kumulatīvais relatīvais biežums
      4 2 0.04 0.04
      5 5 0.10 0.14
      6 7 0.14 0.28
      7 12 0.24 0.52
      8 14 0.28 0.80
      9 7 0.14 0.94
      10 3 0.06 1.00

      Atrodiet 28. procentili. Kolonnā Kumulatīvais relatīvais biežums ievērojiet 0,28. Divdesmit astoņi procenti no 50 datu vērtībām ir 14 vērtības. Ir 14 vērtības, kas mazākas par 28. procentili. Tie ietver divus 4, piecus 5 un septiņus 6. 28. procentile ir starp pēdējiem sešiem un pirmajiem septiņiem. 28. procentile ir 6,5.

      Atrodiet vidējo. Apskatiet vēlreiz kolonnu Relatīvais biežums un atrodiet 0,52. Mediāna ir 50. procentile jeb otrā kvartile. Piecdesmit procenti no 50 ir 25. Ir 25 vērtības, kas ir mazākas par vidējo. Tajos ietilpst divi 4, pieci 5, septiņi 6 un 11 no 7. Mediāna jeb 50. procentile ir starp 25. vai septiņām un 26. vai 7. vērtībām. Mediāna ir septiņi.

      Atrodiet trešo kvartili. Trešā kvartile ir tāda pati kā 75. procentile. Jūs varat acs ābols šo atbildi. Apskatot kolonnu Kumulatīvais relatīvais biežums, jūs atradīsit 0,52 un 0,80. Kad jums ir visi četri, pieci, seši un septiņi, jums ir 52 procenti datu. Iekļaujot visus astoņus, jums ir 80 procenti datu. Tad 75. procentilei jābūt astoņniekam. Vēl viens veids, kā apskatīt problēmu, ir atrast 75 procentus no 50, kas ir 37,5, un noapaļot līdz 38. Trešā kvartile, J3, ir 38. vērtība, kas ir astoņi. Šo atbildi var pārbaudīt, skaitot vērtības. Zem trešās kvartiles ir 37 vērtības, bet augstāk - 12 vērtības.

      Četrdesmit autobusu vadītājiem tika jautāts, cik stundas viņi katru dienu pavada, veicot maršrutus (noapaļojot līdz tuvākajai stundai). Atrodiet 65. procentili.


      Vidējā vidējā režīma aprēķināšana

      Centrālās tendences mērs ir viena vērtība, lai aprakstītu datu kopu, identificējot centrālo pozīciju šajā datu kopā. Dažreiz centrālās tendences mērījumus sauc par centrālās atrašanās vietas mērījumiem. To izmanto, lai atrastu vidējo, vidējo un režīmu, pamatojoties uz centrālās atrašanās vietas mērījumiem. Vidējais ir datu kopas summas vidējais lielums, kas dalīts ar datu skaitu. Mediāna ir norādīto divu vērtību vidējā vērtība, un režīms ir vērtība, kurai ir vairāk atkārtojumu.


      3. Izplatīšanās mērījumi

      Datu kopas & # 8220central & # 8221 vērtības noteikšanas mērķis bija aprakstīt a tipisks vērtība datu kopā. Kad tas ir zināms, mēs varam izmērīt datu vērtību izkliedes vai izplatības apjomu no tipiskās, centrālās, vērtības. Citiem vārdiem sakot, mēs aprēķināsim, kā mūsu dati ir izkliedēti. Trīs galvenie datu kopas izkliedes mērījumi ir diapazons, dispersijaun standarta novirze.

      Diapazons

      Mainīgā diapazons ir vienkārši & # 8220distence & # 8221 starp lielāko datu vērtību un mazāko datu vērtību. Matemātikas simbolos:

      Diapazons = lielākā datu vērtība - mazākā datu vērtība


      Parādītajā tabulā ir norādīti pirmie eksāmenu rezultāti klasē, kurā mācās 11 skolēni. Šīs datu kopas diapazons ir:

      Diapazona aprēķināšanai ir jāizmanto tikai divas vērtības: mazākā un lielākā datu vērtība. Ja mainās kāda no šīm divām vērtībām, mainās arī diapazons. Tāpēc diapazons nepārprotami ir nav izturīgs datu kopas galējām vērtībām. Citas datu vērtības neietekmē diapazonu.

      Dispersijas paraugs

      Datu kopas dispersija ir skaitlisks kopsavilkums, kas norāda katras datu vērtības vidējā novirze no vidējās datu kopas. Lai aprēķinātu datu kopas dispersiju, mums jāsalīdzina katra datu vērtība no mūsu neapstrādātā saraksta <x1, x2, x3,…, X(n-1), xn>, līdz vidējam . Novirzes ideja ir tikai atšķirība, ko aprēķina ar atņemšanu. Simbolos novirze par vidējo vērtību i th datu vērtība, xi, ir vērtība: (xi & # 8211 x̄).

      Datu kopas vidējā līmeņa definīcijas dēļ, summējot novirzi no vidējās vērtības katrai datu vērtībai, jūs vienmēr saņemsit nulli. Simbolos Σ (xi & # 8211 x̄) = 0. Tas ir mazliet tehniski, bet tas būtībā nozīmē to, ka mēs nevaram vienkārši novirzīt noviržu summu. Mēs vienmēr saņemam nulli !!

      Lai to apietu, mums ir nepieciešams veids, kā visas novirzes no vidējā rādītāja padarīt pozitīvas neatkarīgi no tā, vai datu vērtība ir zemāka vai augstāka par vidējo. Piemēram, ja jūs dzīvojat divas jūdzes uz ziemeļiem no pilsētas, un es dzīvoju divas jūdzes uz dienvidiem no tās pašas pilsētas, būtu smieklīgi teikt: & # 8220Es dzīvoju negatīvi 2 jūdzes no pilsētas. & # 8221 Mēs abi dzīvojam divu jūdžu attālumā .

      Matemātiski viens veids, kā padarīt visas novirzes pozitīvas, ir absolūtās vērtības izmantošana. Vēl viens veids, ko mēs izmantosim, lai aprēķinātu gan datu kopas variāciju, gan standarta novirzi, ir kvadrāts katra novirze. Pilsētas piemēram, jūsu novirzes vērtība būtu 2 2 = 4, un mana novirzes vērtība būtu (-2) 2 = 4. Tāpēc mūsu novirze neatkarīgi no tā, vai tā ir pozitīva vai negatīva, būtu vienāda! Tātad, lai pozitīvās atšķirības un negatīvās atšķirības uzskatītu par vienādām, mēs kvadrātiņojam novirzes: (xi & # 8211 x̄) 2 .

      Visbeidzot, tā kā dispersija mēra katras datu vērtības vidējā novirze no vidējās visas datu kopas summējam kvadrāta novirzes vērtību katram datu punktam un dalām ar vērtību (n & # 8211 1), par vienu mazāk nekā datu vērtību skaits. Šī ir vēl viena tehniska & # 8220grūtība & # 8221, ar kuru mēs vēlāk nodarbosimies. Vērtība (n & # 8211 1) piešķir īpašu apzīmējumu brīvības pakāpes datu kopas. Iemesls tam tiks paskaidrots visā klasē, taču iedomājieties šādu vienkāršu scenāriju: Jūs un četri draugi dodaties uz ķīniešu restorānu, un maltītes beigās jūsu serveris atnes jūsu grupai 5 laimes sīkfailus, tos ievietojot kaudze galda vidū. Cik daudz no jūsu 5 cilvēku partijas faktiski nonāk izvēlēties viņu laime? Tikai 4. Iemesls ir acīmredzams: pēc tam, kad 4 cilvēki ir izvēlējušies veiksmes sīkdatnes, paliek tikai viens. Piektajam cilvēkam ir nav laimes izvēles. Tādējādi šīs & # 8220problēmas & # 8221 brīvības pakāpes ir 5 & # 8211 1 = 4.

      Šeit ir vēl viens piemērs, šoreiz no matemātikas viedokļa: ja kāds jums saka, ka domā par 3 skaitļiem, kuru vidējais rādītājs ir 5, cik no trim skaitļiem jums jāzina, pirms zināt visus 3? Nedaudz padomājis, jūs sapratīsit, ka atbilde ir 2. Ja jums saka, ka divi no skaitļiem ir 2 un 10, nedaudz padomājot (un dažas algebras), jūs atradīsit, ka pēdējam skaitlim jābūt


      Atkal šīs problēmas brīvības pakāpe ir 3 & # 8211 1 = 2.

      Visā krāšņumā matemātiskā formula izlases dispersijas aprēķināšanai ir:

      kur n ir izlases lielums.

      Piemērs: Aprēķini dispersijas paraugam

      Atgriežoties pie klases, kurā mācās 11 skolēni, eksāmenu punktu skaita, iepriekš redzamā tabula ilustrē (dažreiz garlaicīgus!) Iedzīvotāju dispersijas aprēķinus. Šīs datu populācijas vidējais lielums ir = 82.

      Iedzīvotāju datu kopējā novirze kvadrātā ir 1272. Tāpēc datu kopas dispersija ir:


      Centrālās tendences pasākumi

      Centrālās tendences mērījumi sniedz kopsavilkuma mērījumu, kas mēģina aprakstīt visu datu kopu ar vienu vērtību, kas apzīmē tās izplatīšanas vidu vai centru. Ir trīs galvenie centrālās tendences rādītāji: vidējais, vidējais un veids.

      Datu kopas vidējais lielums ir pazīstams arī kā vidējā vērtība. To aprēķina, visu vērtību summu datu kopā dalot ar vērtību skaitu.

      Tātad datu kopā 1, 2, 3, 4, 5 mēs aprēķinātu vidējo, saskaitot vērtības (1 + 2 + 3 + 4 + 5) un dalot ar kopējo vērtību skaitu (5). Mūsu vidējais rādītājs tad ir 15/5, kas ir vienāds ar 3.

      Vidējā kā centrālās tendences mēra trūkumi ir tādi, ka tas ir ļoti uzņēmīgs pret nepieļaujamiem rādītājiem (novērojumiem, kas ir ievērojami attālināti no lielākās daļas datu kopas novērojumu), un ka tas nav piemērots, ja dati ir sagrozīti, drīzāk nekā normāla sadalījuma.

      Mediāna

      Datu kopas mediāna ir vērtība, kas atrodas datu kopas vidū, kas sakārtota no mazākās līdz lielākajai.

      1., 2., 3., 4., 5. datu kopā mediāna ir 3.

      Datu kopā ar pāra novērojumu skaitu mediānu aprēķina, divu vidējo vērtību summu dalot ar divām. Tātad: 1, 2, 3, 4, 5, 6 vidējā vērtība ir (3 + 4) / 2, kas ir vienāda ar 3,5.

      Mediānu ir lietderīgi izmantot ar kārtas mainīgajiem lielumiem un ar intervālu mainīgajiem lielumiem ar šķību sadalījumu.

      Režīms ir visizplatītākais datu kopas novērojums vai visbiežāk sastopamā vērtība datu kopā.

      Režīmam ir vairāki trūkumi. Vienā datu kopā var parādīties divi režīmi (piemēram, 1, 2, 2, 3, 4, 5, 5, režīmi ir gan 2, gan 5).

      Režīms ir piemērots pasākums, ko izmantot ar kategoriskiem datiem.

      Resursi

      Veselības sistēmu izpētes projektu izstrāde un vadīšana: Šīs PVO rokasgrāmatas 22. modulis (28. lpp.) Sniedz norādījumus par centrālās tendences pasākumu izmantošanu.

      Šī lapa ir sprauga (minimāla lapas versija). Jūs varat palīdzēt to paplašināt. Noklikšķiniet uz Contribute Content vai Contact Us, lai ieteiktu papildu resursus, dalītos pieredzē, izmantojot opciju, vai brīvprātīgi paplašiniet aprakstu.


      Skatīties video: Asmens duomenų apsauga (Decembris 2021).