Raksti

1.6.10.E. Pierādījumu pārbaude, izmantojot grafikus un statistiku (vingrinājumi) - matemātika


  1. Profesionālo sporta komandu fani sagaida, ka komandas īpašnieki iztērēs nepieciešamo naudu, lai iegūtu spēlētājus, kuri viņiem palīdzēs izcīnīt čempionātu. Dažādu ASV profesionālo sporta komandu algu saraksti tika sadalīti trešdaļās, un tika salīdzināts komandu uzvarēto čempionātu skaits katrā trešdaļā. Izveidojiet pilnīgu šo datu joslu diagrammu. (dati no nepublicēta studentu statistikas klases projekta)
    Algu sarindošanaČempionātu skaits
    Zemākā trešā2
    Vidējā trešdaļa7
    Augstākais trešais11
  2. Saskaņā ar National Geographic datiem 1903. gadā sēklu mājas pārdeva 307 kukurūzas sēklu šķirnes. 1983. gadā tika pārdotas 12 sēklu šķirņu šķirnes, bet pārējās vairs neizmantoja. Atrodiet kukurūzas sēklu šķirņu paraugu proporciju, kas vēl bija pieejama 1983. gadā, salīdzinot ar 1903. gadu. Izveidojiet pilnīgu sektoru diagrammu. (ngm.nationalgeographic.com/20...ariety-graphic skatīts 2013. gada 9. septembrī)

    Vai jūs domājat, ka ir labi vai slikti, ka šķirņu ir mazāk? Kāpēc?
  3. Laika posmā no 2010. līdz 2014. gadam Elfas upē, Olimpiskajā nacionālajā parkā netālu no Portelželosas štata, tika aizsprostoti divi aizsprosti, ļaujot lašiem nārstot pirmo reizi šajā upē 100 gadu laikā. Pieņemsim, ka tika reģistrēti 10 atgriezto Chinook lašu svari. Šie svari ir parādīti zemāk esošajā tabulā.
    4148404345
    3935474151

    Šīs problēmas mērķis ir atrast visu statistiku, izmantojot formulas ar rokām. Parādīt visu darbu.

    Atrodiet šo datu vidējo, dispersiju un standartnovirzi, kā arī 5 lodziņu diagrammas numurus.

  4. Paredzams, ka skolēni attīstības matemātikas nodarbībās, piemēram, starpposma algebrā, ātri uzzinās matemātikas faktus. Automātika jeb matemātisko faktu raitums ir spēja atcerēties matemātikas faktus, neveicot aprēķinus. Matemātisko faktu ātras uzzināšanas priekšrocība ir tā, ka smadzeņu darba atmiņa nav piepildīta ar centieniem veikt aprēķinus, lai tās varētu koncentrēties uz algebrai nepieciešamo augstākā līmeņa domāšanu. Starpalgebras studentiem tika veikts automātiskuma tests, kurā vienā minūtē viņiem bija jāatrisina pēc iespējas vairāk vienpakāpes lineāro vienādojumu. Visos saskaitīšanas, atņemšanas un reizināšanas vienādojumos tika izmantoti skaitļi no –10 līdz 10, savukārt dalījumu vienādojumiem bija atbildes šajā diapazonā. Visas atbildes bija veseli skaitļi. Zemāk esošajā tabulā norādīts veiksmīgi vienā minūtē pabeigto problēmu skaits.
    1130283123
    272993818
    1917261210
    1920171523
    2234233610

    Izveidojiet frekvences sadalījumu un histogrammu. Izmantojot sākuma vērtību 5 un klases platumu 5. Pilnīgi iezīmējiet diagrammu.

    Izveidojiet kastes gabalu.

  5. Automātiskuma eksperimentu mērķis ir noteikt, vai pastāv saistība starp studenta matemātisko faktu raitumu un viņu ceturkšņa pēdējo atzīmi. Zemāk esošajā tabulā ir divvērtīgo dati par 6 studentiem.
    Automātiskuma rādītājsGalīgā pakāpe
    1. students194
    2. students312.9
    3. students161.4
    4. students194
    5. students202.3
    6. students161.3

    Šiem datiem izveidojiet izkliedes diagrammu.

    Izmantojot formulas, atrodiet korelāciju. Kalkulatoru var izmantot pamatfunkcijām, bet ne tikai korelācijas atrašanai, izņemot atbildes pārbaudi. Parādiet visu savu darbu.

  6. Automātika ir viena no jomām, kas jāizpēta, kad koledža mēģina uzlabot panākumu līmeni attīstības matemātikas stundās. Ja tas ir veiksmes faktors, tad koledža izstrādās metodi, kā palīdzēt studentiem uzlabot viņu automātiskumu. Tika veikts eksperiments, kurā starpalgebras studentiem tika dots datorizēts automātiskuma tests, kas viņiem prasīja atrisināt vienpakāpes lineāro vienādojumu maisījumu, kas prasīja skaitļu saskaitīšanu, atņemšanu vai reizināšanu starp -10 un 10 un kuriem bija risinājumi starp šīm pašām vērtībām. sadalīšanas problēmas. Piemēri ietver -3x = 12 un x + 5 = -3. Studenta rezultāts bija maksimālais problēmu skaits, uz kuru viņi varēja pareizi atbildēt vienā minūtē. Pirms pāriet pie jaunas problēmas, studentiem bija jāsaņem pareiza atbilde. Viens mērķis bija noskaidrot, vai vidēji vienā minūtē pareizi atbildēto problēmu skaits bija lielāks skolēniem, kuri izturēja klasi, nekā tiem, kuri neizturēja.

    Tiks pārbaudītas hipotēzes:

    (H_0: mu_ text {pass} = mu_ {fall} )
    (H_0: mu_ text {pass}> mu_ {fall} )
    ( alfa = 0,05 )

    a. Aizpildiet noformējuma izkārtojuma tabulu.

    Pētījumu noformēšanas tabula
    Pētījuma jautājums:
    Pētījuma veidsNovērošanas pētījums
    Novērošanas eksperiments
    Manipulatīvs eksperiments
    Kāda ir atbildes reakcija?
    Kāds ir parametrs, kas tiks aprēķināts?Vidējā proporcijas korelācija
    Uzskaitiet potenciālos latentos mainīgos.
    Grupējošais / paskaidrojošais mainīgais 1 (ja tāds ir)Līmeņi:

    b. Ja no 12 piedāvātajām klasēm nejauši izvēlētos divas starpalgebras klases, klasēm piešķirot numuru no 1. līdz 12., kuras divas klases tiktu atlasītas, ja kalkulatoru izsētu ar 27. vai nejaušo ciparu tabulā izmantotu 10. rindu?

    c. Kāda veida paraugu ņemšanas metode tiek izmantota, ja tiek izvēlēta klase un visi klases dalībnieki piedalās pētījumā?

    d. Apkopotie dati ir to problēmu skaits, uz kurām vienā minūtē ir pareizi atbildēts. Vai šie dati ir kvantitatīvi diskrēti, kvantitatīvi nepārtraukti vai kategoriski?

    Automātiskuma rādītāji studentiem, kuri neveica nodarbību, ir parādīti zemāk esošajā tabulā.

    16151415
    13162230
    2081314
    16161616
    6279

    Skolēnu, kuri izturējuši klasi, automātiskuma rādītāji ir parādīti zemāk esošajā tabulā.

    2019331520
    149111217
    820313829
    922313130
    922313130
    1510102322
    711231719
    202018927
    251518927
    2515232811
    20133634

    e. Izveidojiet frekvences sadalījumu, dubultstieņu histogrammu un blakus lodziņus, lai parādītu grafisko šo divu rezultātu kopu salīdzinājumu.

    f. Kurš grafiks ir efektīvāks, lai redzētu atšķirību starp datu kopām?

    g. Atsevišķi atrodiet abu datu kopu vidējo lielumu, dispersiju un standartnovirzi. Jūs varat izmantot sava kalkulatora statistikas funkcijas.

    h. Statistiskā testa p vērtība, kas salīdzina abus vidējos rādītājus, ir 0,0395. Uzrakstiet noslēdzošo teikumu tādā stilā, kāds tiek izmantots zinātniskajos žurnālos (tāpat kā jūs mācījāt 1. nodaļā).

    i. Vai koledža, pamatojoties uz šīs analīzes rezultātiem un lēmuma noteikumu stāstu, izstrādās programmu, lai palīdzētu uzlabot automātiskumu?

  7. Kāpēc statistikas pamatojums ir svarīgs bioloģijas studentam un profesionālim, kas izstrādāts sadarbībā ar Elīziju Mbuju un Robertu Tīsenu, Bioloģijas katedra Šī tēma ir apskatīta BIOL 160, Vispārīgā bioloģija.

    Lai izpētītu zinātnisko metodi, studenti pētīs alkohola ietekmi uz dafnijām. Dafnijas, dzīvās ūdens blusas, tiek izmantotas, jo tās ir gandrīz caurspīdīgas un ir redzama sitoša sirds. Pārbaudāmā teorija ir, vai alkohols palēnina dafniju sirdsdarbības ātrumu. Lai veiktu šo pārbaudi, dafnijas mikroskopā ievieto ūdens pilienā. Tiks skaitīts sirdsdarbību skaits 15 sekundēs. Ūdens tiks noņemts no priekšmetstikliņa un 8% spirta piliens tiks novietots uz dafnijām. Pēc 1 minūtes sirdsdarbība tiks skaitīta vēlreiz. Ja sirdsdarbība ir mazāka, nevar secināt, ka iemesls ir alkohola dēļ. Tā var būt vienkārši reakcija uz šķidruma pilienu, kas tiek uzklāts uz Daphnia, vai ietekme uz slaida zem gaismas. Tāpēc pēc dafnijām ļauj atgūties, tās tiek atgrieztas priekšmetstiklā, ievērojot tieši to pašu procedūru, izņemot to, ka spirta vietā lieto ūdens pilienu.

    (H_0: mu _ { text {alcohol}} = mu _ { text {water}} )
    (H_1: mu _ { text {alcohol}} < mu _ { text {water}} )
    ( alfa = 0,05 )

    a. Aizpildiet eksperimenta noformējuma tabulu.

    Pētījumu noformēšanas tabula
    Pētījuma jautājums:
    Pētījuma veidsNovērošanas pētījums
    Novērošanas eksperiments
    Manipulatīvs eksperiments
    Kāda ir atbildes reakcija?
    Kāds ir parametrs, kas tiks aprēķināts?Vidējā proporcijas korelācija
    Uzskaitiet potenciālos latentos mainīgos.
    Grupējošais / paskaidrojošais mainīgais 1 (ja tāds ir)Līmeņi:

    b. Izveidojiet atbilstošu diagrammu, lai salīdzinātu abas datu kopas. Aizēnoto šūnu dati ir autentiski. Tas nāk no BIOL 160 klases.

    c. Parādiet attiecīgo divu datu kopu statistiku.
    Sirdsdarbības ātrums pēc alkohola lietošanasSirdsdarbības ātrums pēc ūdens
    Nozīmē
    Standarta novirze
    Mediāna

    d. P-vērtība no t-testa 2 neatkarīgām populācijām ir 1,28E-5. Uzrakstiet noslēdzošo teikumu.

    e. Kāda ir alkohola ietekme uz dafniju sirdsdarbības ātrumu? Vai jūs domājat, ka tam būs tāda pati ietekme uz cilvēku?


Standartizētās testēšanas plusi un mīnusi

Tāpat kā daudzi sabiedrības izglītības jautājumi, arī standartizētā testēšana var būt pretrunīgi vērtējama tēma starp vecākiem, skolotājiem un vēlētājiem. Daudzi cilvēki saka, ka standartizētā testēšana nodrošina precīzu skolēnu snieguma un skolotāju efektivitātes novērtēšanu. Citi saka, ka šāda vienota pieeja akadēmisko sasniegumu novērtēšanai var būt neelastīga vai pat neobjektīva. Neatkarīgi no viedokļu dažādības, ir daži kopīgi argumenti par un pret standartizētu testēšanu klasē.


3.1. Parastās dzīves tabula

Parastā dzīves tabula ir statistikas rīks, kas apkopo iedzīvotāju mirstības pieredzi un sniedz informāciju par ilgmūžību un dzīves ilgumu. Lai gan to parasti izmanto mirstības pētīšanai, dzīves tabulas formātu var izmantot, lai apkopotu jebkuru ilguma mainīgo, piemēram, laulības ilgumu, kontracepcijas līdzekļu ilgumu utt.

Dzīves tabulas piemērs

Tipiskajā dzīves tabulā ir vairākas kolonnas, katrai no tām ir unikāla interpretācija. Mēs uzzināsim par šīm slejām un to interpretācijām, pārbaudot ilustratīvu dzīves tabulu. Pirmkārt, ievads apzīmējumam:

Turpmākajā tabulā (3.1.2. Tabula) ir parastā ASV iedzīvotāju 1997. gada dzīves tabula (pielāgota no NCHS Valsts nozīmes statistikas ziņojumi Sēj. 47, Nr. 19, 1999. gada 30. jūnijs).

Kolonnu interpretācija un attiecības starp tām

The nqx kolonnai ir varbūtības interpretācija:

Varbūtība, ka cilvēks vecumā no x mirs
vecuma intervāls (x, x + n)

Vai ar atsauci uz kolonnām 2. kolonna =

Diagramma ar nqx visā dzīves laikā ir parādīts 3.1.1. attēlā. Vecumam raksturīgu mirstības rādītāju grafikam būtu līdzīga forma.

3.1.1. Attēls: nqx visā ASV 1997. gada dzīves ilgumā

Lx slejā ir arī varbūtības interpretācija:

Šīs proporcijas sauc par izdzīvošanas varbūtībām. Izdzīvošanas varbūtību diagramma visā dzīves laikā ir parādīta 3.1.2. Attēlā.

3.1.2. Attēls: lx visā ASV 1997. gada dzīves ilgumā

Pastāv vienkāršas attiecības starp ndx kolonnu un lx un nqx kolonnas dzīves tabulā:

a) (3.1.2. tabulā reiziniet 3. sleju ar 2. sleju.)

(b) Tā kā visi galu galā mirst, nāves gadījumu summa visos vecuma intervālos būs vienāda ar dzīves tabulas rādiusu, t.i .:

Riska summa ndx kolonna ir vienāda ar 100 000 = l0

c) Attiecības b) apakšpunktā var paplašināt šādi:

Tā kā visi, kas izdzīvo līdz x vecumam, galu galā nomirs, nāves gadījumu skaits no šī vecuma līdz tabulas beigām būs vienāds ar skaitu, kas izdzīvojis līdz šim vecumam, t.i .:

d) to cilvēku skaits, kuri mirst pirms noteiktā vecuma x, ir mirušo summa no tabulas sākuma līdz noteiktajam vecumam:

3.1.2. Tabulā
personas, kas mirst pirms 10 gadu vecuma:

e) No iepriekš d) apakšpunkta tiek aprēķināta proporcija (varbūtība), ka jaundzimušais mirst pirms x vecuma sasniegšanas:

3.1.2. Tabulā varbūtība
nomirt pirms 10 gadu vecuma sasniegšanas:

(f) Lai gan dzīves tabulā nav norādīts, viens noderīgs lielums, ko aprēķināt no tabulas, ir proporcija, kas izdzīvo katrā vecuma intervālā. Šī proporcija tiek apzīmēta kā nlppx. Pieraksti to:

Ņemiet vērā arī to, ka var rakstīt:

Vai arī lx kolonna ir saistīta ar nlppx kolonnu pēc relācijas:

Tādējādi var aprēķināt kumulatīvo izdzīvošanas funkciju kā katra intervāla izdzīvošanas varbūtību reizinājumu:

Dzīvības tabulas rādiuss parasti ir 100 000, bet tas var būt atšķirīgs skaitlis. Kur parastajā dzīves tabulā vienmēr var meklēt, lai uzzinātu, kas ir radix?

  1. 7. kolonnas pirmajā rindā
  2. 3. slejas pirmajā rindā
  3. 7. slejas pēdējā rindā
  4. 1. slejas pēdējā rindā

Saskaņā ar 3.1.2. Tabulas 7. sleju jaundzimušais ASV 1997. gadā var sagaidīt 76,5 gadu vecumu. Kad šis bērns sasniegs 50 gadu vecumu, kādu vecumu viņš / viņa gaidīs?

Saskaņā ar 3.1.2. Tabulu ir paredzams, cik procentuāli no tiem, kas dzimuši ASV 1997. gadā un kuri sasniedz 70 gadu vecumu, pirms 75 gadu vecuma sasniegšanas?

Kāda ir varbūtība, ka 1997. gadā ASV jaundzimušais izdzīvos līdz 20 gadu vecumam?


15.2.1. Datu jēdzieni

Šajā kursā mēs jau esam apsprieduši dažus datu jēdzienus, piemēram, taisnstūrveida un kārtīgu datu idejas. Tomēr šīs diskusijas ir apraktas pēdējās nodaļas tekstā, tāpēc uz tām ir grūti atsaukties - un es vēlos pārliecināties, ka visi šie jēdzieni ir iekļauti vienā vietā, lai iegūtu tīru atsauces sadaļu.

  • Viena veida datu elementu secība
  • Katru vektora elementu sauc arī par komponentiem, locekļiem vai vērtībām
  • Izveidots R, izmantojot c ()
  • Identisku garumu vektoru saraksts
  • Piemērs: varavīksnene
  • Pazīme vai stāvoklis, kas var pastāvēt dažādos daudzumos vai veidos
  • Mēs izmērām neatkarīgs prediktora mainīgie atkarīgs reakcijas mainīgie
  • Skaitliskie dati, kas nav ierobežoti ar noteiktām vērtībām - iespējamo vērtību ir bezgalīgi daudz
  • Skaitliskiem datiem, kas aprobežojas ar noteiktām vērtībām, piemēram, bērnu (vai koku, vai dzīvnieku) skaitam jābūt veselam skaitlim
  • Dati, kas var pastāvēt tikai kā viena no noteiktām vērtību kopām, piemēram, mājas krāsa vai pasta indekss
  • Piesaistītie skaitliskie dati (piemēram, “no 1 līdz 2 collām”) parasti ir kategoriski
  • Kategoriski dati, kur vienīgās vērtības ir 0 un 1
  • Bieži lieto situācijās, kad “trāpījums” - dzīvnieka ieslodzījums, klients, kurš noklikšķina uz saites utt., Ir 1 un neviens trāpījums nav 0
  • Kategorisku datu veids, kur katrai vērtībai tiek piešķirts līmenis vai rangs
  • Noderīgi ar piesaistītajiem datiem, bet arī grafikā, lai pārkārtotu pasūtījumu kategorijas
  • R apzīmē ar “faktoriem”
  • Dati bez stingra formāta, parasti sastāv no teksta
  • R izmantoja nestrukturētus datus, pārvēršot tos faktoros, lai gan tas vairs nav vajadzīgs, dažām funkcijām joprojām teksta datiem jābūt faktora formā
  • Cik bieži visas iespējamās vērtības rodas datu kopā
  • Parasti grafikā tiek parādīta kā izliekta līnija vai histogramma
  • Dati, kur vidējais = mediāna, 2/3 datu ir vienas vidējās standartnovirzes robežās, 95% datu ir divu SD robežās un 97% ir 3 robežās.
  • Daudzās statistikas analīzēs tiek pieņemts, ka jūsu dati tiek parasti izplatīti
  • Daudzas datu kopas - īpaši dabā - nav
  • Dati, kur mediāna nav vienāda ar vidējo
  • Kreisajā šķībajā sadalījumā diagrammas kreisajā pusē ir gara aste, savukārt labajā pusē šķērsotajam sadalījumam ir garā aste pa labi
  • Nosaukts pēc astes, nevis grafika virsotnes, jo vērtības šajā astē notiek biežāk, nekā varētu sagaidīt ar normālu sadalījumu

15.2.2. Statistikas termini

  • Statistika, kas aprēķināta pēc jūsu datiem
  • Sauca aprēķinu, jo mēs no parauga datiem tuvinām populācijas līmeņa vērtības
  • Sinonīms: metriskais
  • Salīdzinot nulles hipotēzi (parasti, ka divi lielumi ir līdzvērtīgi) ar alternatīvu hipotēzi
  • Alternatīva hipotēze divvirzienu testā ir tāda, ka lielumi ir atšķirīgi, savukārt alternatīvā hipotēze viena astes testā ir tāda, ka viens lielums ir lielāks vai mazāks par otru
  • Gandrīz nekad netiek izmantots uzņēmējdarbībā, jo svarīgais jautājums parasti nav vai x izraisa y bet vai x var prognozēt y
  • Varbūtība redzēt tāda paša izmēra efektu kā mūsu rezultāti, ņemot vērā nejaušības modeli
  • Augstas p vērtības bieži nozīmē, ka jūsu neatkarīgajiem mainīgajiem lielumiem nav nozīmes, bet zemas p vērtības nenozīmē, ka tie ir svarīgi - šādam spriedumam ir nepieciešams racionāls pamatojums, kā arī efekta lieluma un nozīmīguma izpēte. Pretējā gadījumā jūs vienkārši pielīdzināt korelāciju un cēloņsakarību.
  • 0,05 lieta ir no viena teikuma, kas izņemts no konteksta, no 1925. gadā izdotas grāmatas. Nav pamata smiltīs noteikt līniju “nozīmībai” - 0,05 nozīmē, ka pastāv 1 no 20 varbūtība, ka jūsu rezultāts varētu būt nejaušs iespēja, un 0,056 nozīmē, ka tas ir 1 pret 18. Tie ir gandrīz identiski koeficienti.
  • Daži žurnāli ir pilnībā aizlieguši to izmantošanu, bet citi joprojām pieņems tikai “nozīmīgus” rezultātus
  • Amerikas statistikas asociācijas paziņojums:

P vērtība vai statistiskā nozīmība nenovērtē efekta lielumu vai rezultāta nozīmīgumu. P vērtība pati par sevi nenodrošina labu pierādījumu par modeli vai hipotēzi.

  • Termins, kas nozīmē aplēsi, ir mazāk uzņēmīgs pret nepiedienīgajiem
  • Līdzekļi nav izturīgi, bet, piemēram, mediāni.
  • Metode neatkarīgu mainīgo ietekmes uz atkarīgo mainīgo analīzei
  • ANOVA un modeļi ir abi regresijas analīzes veidi
  • Formulas, kas attēlo atbildes mainīgā paredzamo vērtību viena vai vairāku prognozētāju norādītajām vērtībām
  • Modeļa tipiskais y = mx + b formāts
  • Dažreiz saīsināts GLM R to konstruēšanai izmanto lm ()
  • Atkarībā no tā, kam jūs jautājat, tie var būt lineāri modeļi vai nebūt - tie vienā vai otrā veidā pielabo parasto formulu, lai izmērītu rezultātus, kurus vispārējie lineārie modeļi nevar novērst
  • Šajā kursā mēs izmantosim tikai loģistikas modeļus
  • Dažreiz saīsinātā GLM R izmanto, lai tos konstruētu, izmantojot glm ()

15.2.2.1. Aplēses un statistika

  • Datu kopas vai kategoriskā līmeņa novērojumu skaits.
  • R, lai aprēķinātu, palaidiet nrow (datu ietvars) vai garumu (Vector).
  • Lai aprēķinātu pēc grupas, palaidiet skaitu (Data, GroupingVariable)
  • Piemēri: nrow (varavīksnene), length (varavīksnene $ Sepal.Length), count (varavīksnene, suga)
  • Datu kopas vidējais lielums, kas definēts kā visu novērojumu summa, dalīta ar novērojumu skaitu.
  • R aprēķina vidējo vērtību (vektoru).
  • Piemērs: mean (iris $ Sepal.Length)
  • Vidējais rādītājs datu kopai, kurā nav iekļauta noteikta datu daļa
  • Tiek apgrieztas visaugstākās un zemākās vērtības - piemēram, 10% apgrieztā vidējā vērtība izmantos vidējos 80% jūsu datu
  • vidējais (Vector, trim = 0. ##)
  • vidējais (varavīksnene $ Sepal. Garums, apdare = 0,10)
  • Jūsu datu izplatības mērs.
  • var (Vector)
  • var (varavīksnene $ Sepal.Length)
  • Paredzams, ka jebkura novērojuma summa atšķirsies no vidējā.
  • sd (vektors)
  • sd (varavīksnene $ Sepal.Length)
  • Kļūda, kas saistīta ar izlases punktu novērtējumu (piemēram, vidējo).
  • Ja ziņojat par mainīgā parauga vidējo vērtību, izmantojiet SD. Ja diagrammā ievietojat kļūdu joslas ap vidējo, izmantojiet SE.
  • Nav vietējās funkcijas R - palaist sd (Vector) / sqrt (length (Vector)), lai aprēķinātu.
  • sd (iris $ Sepal.Length) / sqrt (garums (iris $ Sepal.Length))
  • Vidējais attālums starp katru datapunktu un - R - vidējo
  • Jūsu datu izplatības rādītājs
  • Ņemiet vērā, ka MAD bieži nozīmē vidējo absolūto novirzi no vidējā, vidējo absolūto novirzi no mediānas un dažas citas mazāk izplatītas lietas - pirms lietojat, pārbaudiet savus saīsinājumus!
  • traks (vektors)
  • traks (varavīksnene $ Sepal.Length)
  • Droša datu centra aplēses.
  • mediāna (vektors)
  • mediāna (varavīksnene $ Sepal.Length)
  • Mazākā vērtība.
  • min (vektors)
  • min (varavīksnene $ sepals. Garums)
  • Lielākā vērtība.
  • maks. (vektors)
  • max (varavīksnene $ Sepal.Length)
  • Maksimālais mīnus minimums.
  • max (vektors) - min (vektors)
  • max (iris $ Sepal.Length) - min (iris $ Sepal.Length)
  • The n kvantile ir vērtība, pie kuras dotajam vektoram n procenti datu ir zem šīs vērtības.
  • Diapazons no 0-1. Kvantile * 100 = procentile.
  • Kvartiles ir 0,25, 0,5 un 0,75 kvantiles
  • kvantiļa (vektors, c (vēlamās kvantiles))
  • kvantile (varavīksnene $ Sepal. Garums, c (0,25, 0,5, 0,75))
  • Vidējie 50% datu saturēja starp 0,25 un 0,75 kvantilēm
  • IQR (vektors)
  • IQR (varavīksnene $ Sepal.Length)
  • Vidējā un vidējā relatīvā pozīcija. Pie 0, vidējais = vidējais, un dati parasti tiek sadalīti.
  • Nav iekļauta R bāzē.
  • Astes lielums sadalījumā. R, vērtības, kas daudz atšķiras no 0, nav normāli sadalītas.
  • Nav iekļauta R bāzē.

15.2.3. Modeļi un testi

Ņemiet vērā, ka lielākajai daļai šeit aplūkoto testu noklusējuma 95% ticamības līmenis un divējāda pārbaude. Ja vēlaties uzzināt, kā mainīt tos jebkurai funkcijai, ierakstiet? FunctionName (). Funkcijām, kas nav piemērojamas varavīksnenes () datu kopai, zem tām pašlaik nav piemēru.

  • Cik cieši saistīti ir divi mainīgie
  • Pīrsona tests pieņem, ka jūsu dati tiek izplatīti normāli, un mēra lineāro korelāciju
  • Spīrmana tests nepieņem normālumu un mēra nelineāru korelāciju
  • Kendala tests arī nepieņem normālumu un mēra nelineāru korelāciju, un tas ir stingrāks tests, taču to ir grūtāk aprēķināt ar roku, un kā tāds ir retāk redzams
  • Nevar salīdzināt viena testa veida rezultātus ar citiem - piemēram, Kendala rezultāti vienmēr ir par 20–40% zemāki nekā Spearman
  • cor (Vector1, Vector2) nodrošina korelācijas koeficientus, savukārt cor.test (Vector1, Vector2) veic statistikas testu, sniedzot testa statistiku, p vērtības un citus rezultātus. Abi pēc noklusējuma veic Pīrsona testu, taču tos var mainīt, norādot argumentu method = & quotspearman & quot vai method = & quotkendall & quot
  • cor (varavīksnene $ Sepal.Length, varavīksnene $ Sepal.Width, method = & quotpearson & quot)
  • cor.test (varavīksnene $ Sepal.Length, varavīksnene $ Sepal.Width, method = & quotpearson & quot)
  • Metode divu grupu vidējo rādītāju salīdzināšanai
  • Ja jūsu grupas mainīgajam ir vairāk nekā divi līmeņi, nelietojiet t testu - tā vietā izmantojiet ANOVA
  • t.test (Vector1, Vector2)
  • Pārbaude, vai divi kategoriskie mainīgie ir saistīti
  • Nulles hipotēze ir tāda, ka abi mainīgie ir neatkarīgi viens no otra
  • Lai iegūtu papildinformāciju, it īpaši par to, kādā formā jābūt jūsu datiem, lūdzu, apmeklējiet šo vietni.
  • chisq.test (Vector1, Vector2)
  • Regresijas veids, kas paredz atbildes mainīgā lielumu pie noteiktām neatkarīgu prediktoru mainīgo vērtībām
  • Ja jums nepieciešama palīdzība lineāro modeļu izpratnē, šeit ir Penn State lekcija.
  • Mūsu mērķiem vissvarīgākā ir izpratne, ka modeļus veido noteikumiem, kuri ir prognozējošie mainīgie, kurus jūs tam piešķirat, un koeficienti, kas tiek reizināti ar šiem noteikumiem, lai aprēķinātu mūsu atbildes vērtību.
  • Lielāki koeficienti vispārīgi nozīmē, ka mainīgais ir svarīgāks par citiem modelī, bet tikai tad, ja mainīgajiem ir kopīgas vienības - šeit tiek apspriests viens (daudz argumentēts) veids, kā salīdzināt mainīgo lielumu koeficientus ar dažādām vienībām
  • Lineārajos modeļos ir arī pārtveršanas termins, kas netiek reizināts ar nevienu mainīgo. Šis termins ir “nozīmīgs” pie p = neatkarīgi no tā, ko nozīmē burtiski neko, un, ja tas ir jūsu vienīgais nozīmīgais termins, jūsu modelis ir bezjēdzīgs.
  • Varat pievienot vairākus prediktora vektorus, izmantojot +, un iekļaut mijiedarbības terminus, izmantojot + Vector1: Vector2.
  • Vispārināta lineārā modeļa forma, kur prediktora mainīgais ir binārs vektors
  • Zinātnē un biznesā ārkārtīgi bieži tiek prognozēti notikumi - ja koks vai dzīvnieks iet bojā, ja tiks pārdots utt
  • Tests, lai noteiktu viena vai vairāku kategorisku mainīgo ietekmi uz vienu vai vairākiem skaitliskās atbildes mainīgajiem
  • Mainīta lineārā modeļa forma
    veic interesantu ārstēšanu par to, kā interpretēt ANOVA rezultātus ar nozīmīgu mijiedarbību

15.2.4. Kā mēs salīdzināsim modeļus

Ir daudz dažādu veidu, kā salīdzināt modeļus, katram no kuriem ir savi atbalstītāji un nelabvēlīgie. Tā vietā, lai iedziļinātos šajos argumentos, mēs izmantosim trīs visizplatītākās metrikas. Citas metrikas (RMSE, PRESS, BIC utt.) Var ģenerēt arī no R modelēšanas funkcijām, taču mēs tās neiedziļināsimies.

  • Datu dispersijas procents, kas izskaidrojams ar regresiju
  • Jo modelī ir vairāk neatkarīgu prediktoru mainīgo, jo augstāks ir R 2, visi pārējie ir vienādi
  • Pielāgotais R 2 ir labāks regresijas piemērotības novērtējums, jo tas tiek pielāgots mainīgo skaitam modelī
  • Vidējā kvadrāta kļūda
  • Atlikumu standarta novirze - tas norāda, cik precīzs ir jūsu modelis
  • Zemāks == labāks
  • R 2 nav piemērojams loģistikas modeļiem
  • Tā vietā mēs aprēķinām laukumu zem ROC līknes, laukumam zem līknes saīsinot AUC
  • AUC atspoguļo jūsu modeļa precizitāti, nejauši uzminot AUC 0,5 un perfektam modelim 1 AUC.
  • AUC dažreiz sauc par c-statistiku
  • Akaike informācijas kritērijs
  • Atsevišķai datu kopai labākais modelis ir modelis ar mazāko AIC
  • Bet modeļi, kuru A ( Delta ) AIC (starpība starp abiem AIC) ir & lt 2 (vai 4, atkarībā no tā, kuru jūs uzdodat), ir statistiski identiski
  • Ja jūsu modeļa ( Delta ) AIC ir & lt 2 ar nulles modeli, tas ir bezjēdzīgi
  • Metode, kurā dati tiek sadalīti atsevišķās apmācības un testēšanas datu kopās, lai novērtētu modeļa veiktspēju ar jauniem datiem
  • Zelta standarts modeļa veiktspējas pārbaudei ir tāds, ka modeli apmāca un noregulē, izmantojot apmācības datu kopas, un pēc tam to pārbauda vienreiz un vienreiz, ģenerējot prognozes un aprēķinot testa datu kopas precizitāti. Pēc tam jūs ziņojat par šī testa statistiku.
  • Variācija ir k-reizes savstarpēja validācija, kur datu kopa ir sadalīta k sadaļās. Pēc tam modeļi tiek apmācīti, izmantojot visas kombinācijas k-1 sadaļas (tātad, ja k = 3, trīs atsevišķi modeļi tiks apmācīti par apvienotajām 1. un 2., 2. un 3., kā arī 1. un 3. datu kopām) un pārbaudīti vienā sadaļā, kas nav iekļauta.
  • Plašāka informācija par savstarpēju validāciju un tās ieviešanu R šeit
  • Tabula, kurā parādīts, cik bieži jūsu modelis pareizi prognozēja rezultātu un cik bieži tas darbojās nepareizi
  • Tas nodrošina gan vispārējas precizitātes izjūtu, gan to, cik precīzi modelis ir neprecīzs - piemēram, kuru kategoriju tas, visticamāk, nepareizi klasificēs
  • Nodrošina veidu, kā kvantitatīvi un kvalitatīvi salīdzināt dažādas modeļu formulas

Izturība tiek definēta kā viena no visizplatītākajām un bīstamākajām jaunās informācijas pieņemšanas metodēm.

Intuīcija tiek definēta kā pārliecība, ka neatkarīgi no tā, ko viņi atbild, ir taisnība bez jebkādiem pierādījumiem.

Risinājuma skaidrojums

Zināšanu zināšanai vai iegūšanai ir dažādas metodes: stingrība, intuīcija, autoritāte, racionālā metode un empīriskā metode. Stingrība ir viena no visbiežāk izmantotajām metodēm, kas stāsta, ka patiesība ir patiesa pat tad, ja pierādījumi ir pretrunā, turpretī intuīcija ir metode, kurā personas ticība vai minējums tiek uzskatīts bez jebkādiem pierādījumiem. Ierobežojums ar izturības metodi ir tāds, ka tā ir spēcīga ticības ziņā pat pierādījumu / pierādījumu klātbūtnē. Tāpēc šī metode var nebūt precīza. Intuīcija ir laba

jo tas palīdz mums attīstīt pārliecību, bet dažreiz tas ir kaitīgi, jo intuīcija var nebūt pareiza vienmēr, jo ir pieejami pierādījumi pret intuīciju, bet cilvēks netic, jo viņš / viņa par to var būt pārāk pārliecināts.

Stingrība un intuīcija ir zināšanu iegūšanas metodes. Sīkstums ir metode, kurā patiesība tiek uzskatīta par patiesu, pat ja pierādījumi ir pretrunā šai patiesībai, turpretī intuīcija nozīmē ticēt vai minēt, ja nav pierādījumu.

Pamatojums:

Tā kā stingrība norāda, ka patiesība ir patiesa, pat ja trūkst atbalsta attiecībā uz pierādījumiem, piemēram, pētnieciskajā darbā, ja mūsu pētījums ir patiess un pierādījumi, tas ir, cits pētījuma dokuments ir pret mūsu pētījumu, mēs uzskatiet, ka mūsu pētījums ir pareizs. Dažos konkursa eksāmenos dažreiz konkrētajam jautājumam dotie varianti var nebūt pareizi, tādā gadījumā cilvēks izvēlas pareizo variantu, pamatojoties uz savu intuīciju.

Vai vēlaties redzēt vairāk šādu pilnīgu risinājumu?

Abonējiet tūlīt, lai soli pa solim piekļūtu miljoniem mācību grāmatu problēmu risinājumiem, ko uzrakstījuši priekšmetu eksperti!


Praktiska darbība Cik tālu? Berzes mērīšana, izmantojot dažādus materiālus

Vienības kalpo kā ceļveži uz noteiktu saturu vai tēmu. Ligzdotas zem vienībām ir nodarbības (violetā krāsā) un praktiskās aktivitātes (zilā krāsā).

Ņemiet vērā, ka ne visas stundas un aktivitātes pastāvēs vienībā, un tās var pastāvēt kā “atsevišķa” mācību programma.

TE biļetens

Kopsavilkums

Berze rodas, kad beisbola spēlētājs slīd, palēninot viņu.

Inženiertehniskais savienojums

Inženieri ņem vērā berzi, nosakot materiālus riepām, skrejceļiem, apavu zolēm, motoriem vai gurnu locītavām. Ķīmijas inženieri ņem vērā berzi, izstrādājot līmju, burbuļgumijas vai bremžu kluču savienojumus. Dažās velosipēdu riepās tiek izmantoti dažādi materiāli, jo berze uz riepas plaknes atšķiras no riepas līknes. Inženieri ņem vērā arī berzes spēku sekas. Piemēram, berze uz veiktspējas automobiļu plānajiem bremžu diskiem var paaugstināt diska temperatūru pietiekami augstu, lai to deformētu, tāpēc inženieri noformē bremžu disku ar caurumiem, lai tas ātrāk atdziest.

Mācību mērķi

Pēc šīs aktivitātes studentiem jāspēj:

  • Saprotiet, ka berze starp dažām virsmām ir spēcīgāka nekā citas.
  • Spēj ieteikt metodes, kā ietekmēt berzi starp virsmām.
  • Izprotiet, kāpēc berze ir svarīgs apsvērums daudzās inženiertehniskās projektēšanas jomās

Izglītības standarti

Katrs TeachEngineering nodarbība vai darbība ir saistīta ar vienu vai vairākiem K-12 zinātnes, tehnoloģiju, inženierzinātņu vai matemātikas (STEM) izglītības standartiem.

Visi 100 000+ K-12 STEM standarti, uz kuriem attiecas TeachEngineering tos savāc, uztur un iesaiņo Sasniegumu standartu tīkls (ASN), projekts D2L (www.achievementstandards.org).

ASN standarti ir hierarhiski strukturēti: vispirms pēc avota piem., pēc stāvokļa avotā pēc veida piem., dabaszinātnes vai matemātika pēc veida pēc apakštipa, pēc tam pēc pakāpes, utt.

NGSS: nākamās paaudzes zinātnes standarti - zinātne

MS-PS2-2. Plānojiet izmeklēšanu, lai sniegtu pierādījumus tam, ka objekta kustības izmaiņas ir atkarīgas no objekta spēku summas un objekta masas. (6. – 8. Klase)

Vai jūs piekrītat šim saskaņojumam? Paldies par jūsu atsauksmi!

Izlīdzināšanas līgums: paldies par jūsu atsauksmēm!

Zinātnes zināšanas balstās uz loģiskām un konceptuālām saiknēm starp pierādījumiem un paskaidrojumiem.

Izlīdzināšanas līgums: paldies par jūsu atsauksmēm!

Izlīdzināšanas līgums: paldies par jūsu atsauksmēm!

Visas objektu pozīcijas un spēku un kustību virzieni jāapraksta patvaļīgi izvēlētā atskaites rāmī un patvaļīgi izvēlētās lieluma vienībās. Lai dalītos informācijā ar citiem cilvēkiem, ir jāpiedalās arī šajās izvēlēs.

Izlīdzināšanas līgums: paldies par jūsu atsauksmēm!

Izlīdzināšanas līgums: paldies par jūsu atsauksmēm!

Kopējie valsts pamatstandarti - matemātika
  • Attēlojiet datus ar diagrammām reālā skaitļa līnijā (punktu diagrammas, histogrammas un lodziņu diagrammas). (9. - 12. klase) Sīkāka informācija

Vai jūs piekrītat šim saskaņojumam? Paldies par jūsu atsauksmi!

Starptautiskā tehnoloģiju un inženierzinātņu pedagogu asociācija - tehnoloģija

Vai jūs piekrītat šim saskaņojumam? Paldies par jūsu atsauksmi!

Valsts standarti
Kolorādo - matemātika

Vai jūs piekrītat šim saskaņojumam? Paldies par jūsu atsauksmi!

Vai jūs piekrītat šim saskaņojumam? Paldies par jūsu atsauksmi!

Kolorādo - zinātne

Vai jūs piekrītat šim saskaņojumam? Paldies par jūsu atsauksmi!

Vai jūs piekrītat šim saskaņojumam? Paldies par jūsu atsauksmi!

Materiālu saraksts

  • Piezīmju karte
  • Saspraude
  • Gumijas aproce
  • Līmes pudele (8 oz., Kalpo kā svars)
  • Stīga
  • Vaska papīrs
  • Smilšpapīrs
  • Lineāls
  • Šķēres
  • Pildspalva
  • Lente
  • Ieteikumi papildu materiāliem: Saran Wrap, alumīnija folija, audums vai jebkurš cits materiāls pie rokas ar interesantu tekstūru.

Darba lapas un pielikumi

Vairāk šādu mācību programmu

Vidusskolas skolēni uzzina, kā inženieri matemātiski izstrādā amerikāņu kalniņu celiņus, izmantojot pieeju, ka izliektu ceļu var tuvināt ar daudzu īsu slīpumu secību. Viņi izmanto pamata aprēķinu un darba enerģijas teorēmu nekonservatīviem spēkiem, lai kvantitatīvi noteiktu berzi gar līkni.

Uzziniet pamatus to spēku analīzei, ko inženieri veic kopņu savienojumos, lai aprēķinātu kopņu tilta stiprumu, kas pazīstams kā “savienojumu metode”. Atrodiet saspīlējumus un saspiešanu, lai atrisinātu lineāro vienādojumu sistēmas, kur izmērs ir atkarīgs no elementu un mezglu skaita trusā.

Šīs stundas mērķis ir iemācīt studentiem, kā kosmosa kuģis nokļūst no Zemes virsmas uz Marsu. Studenti vispirms pēta raķetes un to, kā viņi spēj mūs nogādāt kosmosā. Visbeidzot, tiek apspriests orbītas raksturs, kā arī tas, kā orbītas ļauj mums nokļūt no planētas uz planētu - spec.

Studenti uzzina par divu veidu berzi - statisko un kinētisko - un vienādojumu, kas tos pārvalda. Viņi eksperimentāli mēra arī statiskās berzes koeficientu.

Ievads / motivācija

Berze ir spēks, kas rodas, kad lietas berzējas viena pret otru. Piemēram, ja jūs ļoti ātri berzējat rokas, tās kļūst siltākas. Tas ir jūsu kustīgo roku berzes rezultāts. Dažādiem priekšmetiem berzes laikā ir atšķirīgs berzes līmenis. Faktiski katram objektam ir unikālas īpašības berzes ziņā. Inženierus ļoti interesē berze, jo berze ietekmē to, cik vienmērīgi lietas darbojas. Kad virsmas sasmalcina viena pret otru ar lielu berzi, tās mēdz nolietoties. Piemēram, ja slīpēšanas virsmas mašīnā ir zobrati, mašīna ātrāk nolietojas un ir jāmaina ātrāk nekā tad, ja mašīnā būtu minimāla berze.

Par laimi, mēs varam izmērīt berzes daudzumu starp virsmām. Šajā darbībā mēs izveidojam instrumentu, lai izpētītu lieluma berzi starp piezīmju kartīti un dažādām citām virsmām. Mērot berzi, ievērojiet virsmu īpašības. Kuras īpašības varētu ietekmēt berzes daudzumu?

Augšējā attēlā redzami četri spēki, kas iedarbojas uz piezīmju kartīti, kad tā tiek vilkta. Kad piezīmju karte tiek vilkta, bet nepārvietojas, vilkšanas spēks (Fvilkt) neitralizē vienāds un pretējs berzes spēks (Fspēks). Pēc tam piezīmju karte sāk kustēties, kad vilces spēks ir lielāks par berzes spēku. Var uzskatīt, ka šie horizontālie spēki darbojas kā x ass. Matemātiski runājot:

  • Kad piezīmju karte ir nekustīga: Fvilkt = Ff
  • Kad piezīmju karte pārvietojas pa labi: Fvilkt & gt Ff

Vertikālie spēki (vai spēki, kas darbojas gar y asi) vienmēr ir vienādi. Līmes pudeles (vai jebkura priekšmeta) svars ir vienāds ar tā masu, kas reizināta ar gravitāciju (W = mg). To neitralizē spēks no galda, kas pazīstams kā parastais spēks (N). Normālais spēks spiež uz augšu, kad līmes pudeles svars nospiež uz leju. Šiem diviem vertikālajiem spēkiem jābūt vienādiem, jo ​​līmes pudele nepārvietojas vertikālā virzienā (uz augšu vai uz leju), tā pārvietojas tikai pa labi (horizontāli gar x asi). Matemātiski runājot:

Līmes pudeles masa ir ievērojama, jo berzes spēks ir atkarīgs no normālā spēka (un tādējādi netieši atkarīgs no masas). Tāpēc smagāku priekšmetu ir grūtāk pārvietot nekā vieglāku priekšmetu (pieņemot, ka tiem ir vienāds izmērs un kontakts ar zemi) - berzes spēks palielinās, masai palielinoties.

Procedūra

Darbība, kas izveidota, lai veiktu eksperimentus ar berzi.

  1. Apspriediet ar studentiem berzes jēdzienus. Pajautājiet, kas notiek, kad slīdat pa zemi pa dubļiem vai betonu. Kas ir vieglāk? (Atbilde: dubļi.) Kāpēc? (Atbilde: starp kājām un dubļiem ir mazāka berze salīdzinājumā ar pēdām un betonu.)
  2. Izdodiet darblapas katrai divu studentu grupai un lieciet viņiem atbildēt uz jautājumiem, veicot eksperimentus.
  3. Palūdziet studentiem salocīt piezīmju kartīti un sagriezt 1 cm (apmēram ½ collas) garu 5 cm (apmēram 2 collas) spraugu no kartes gala.
  4. Ielieciet saspraudes spraugā un pabīdiet gumijas joslu uz saspraudes.
  5. Izgrieziet virknes gabalu 25 cm (10 collu) garumā un cilpojiet to caur gumijas joslu.
  6. Piezīmju kartes galā ievietojiet līmes pudeli.
  7. Viegli pavelciet auklu tieši tik daudz, lai iztaisnotu gumijas joslu. Atzīmējiet punktu taisnas gumijas joslas "Start" galā.
  8. Pavelciet auklu, līdz karte pārvietojas pa galdu. Izmēriet un darblapā ierakstiet gumijas joslas izstiepto attālumu.
  9. Līmējiet pie galda vaska papīra gabalu un smilšpapīra gabalu.
  10. Pārvietojiet karti pa šiem materiāliem, velkot auklu, vēlreiz ierakstot, cik tālu stiepjas gumijas josla (un turot līmes pudeli uz kartes).
  11. Paskaidrojiet, ka berzes ir tas, ko inženieri bieži mēģina izvairīties vai samazināt līdz minimumam. Pajautājiet viņiem, kāpēc? (Iespējamās atbildes: izšķērdē enerģiju, nodilst detaļas utt.) Kad inženieri nevēlētos izvairīties no berzes? (Iespējamās atbildes: lai palēninātu lietas, piemēram, ar bremžu klučiem, vai novērstu slīdēšanu, izvēloties materiālu ar lielu berzi.)
  12. Kamēr visi studenti finišē, palūdziet viņiem savienoties pārī ar citu grupu, kura ir pabeigusi, un salīdziniet atbildes.
  13. Lieciet studentiem iesaistīties programmā I Spy! darbība, kas aprakstīta sadaļā Novērtējums.

Novērtējums

Diskusijas jautājumi: Pieprasiet, integrējiet un apkopojiet studentu atbildes.

  • Kas notiek, kad jūs mēģināt slīdēt pa zemi pa dubļiem? Kas notiek, mēģinot slīdēt pāri betonam? Kas ir vieglāk? (Atbilde: dubļi.) Kāpēc? (Atbilde: mazāk berzes.)

Darbības iegultais novērtējums

Darblapa: Palūdziet studentiem aizpildīt aktivitātes darblapu un pārskatīt savas atbildes, lai novērtētu priekšmeta meistarību.

Pāru pārbaude: Pēc tam, kad studentu komandas ir beigušas strādāt pie viņu darblapām, lieciet viņiem salīdzināt atbildes ar citu grupu, dodot atlikušajām komandām laiku darblapas pabeigšanai.

ES spiegoju: Lieciet studentu komandām paskatīties telpā un atrast vienu priekšmetu, kas parāda berzi darbā. Pasaki, lai viņi ir radoši. Spēlē spēli I Spy! ar klasi, lūdzot vienu komandu sākt sakot: "Es izspiegoju ar savu mazo aci." un pārējiem klases dalībniekiem vajadzētu uzminēt objektu, kas demonstrē berzi. Kad objekts tiek uzminēts, personai, kas to uzminēja, ir jāpaskaidro, kā objekts demonstrē berzi. Komanda, kas atradusi objektu, var izlemt, vai paskaidrojums ir pareizs, vai arī dot savu.

Diskusija: Uzdodiet studentiem šādus jautājumus:

  • Kuri spēki iedarbojas uz piezīmju karti horizontālā virzienā (vai gar x asi)? (Atbilde: vilces spēks un berzes spēks.)
  • Kuri spēki iedarbojas uz piezīmju karti vertikālā virzienā (vai gar y asi)? (Atbilde: līmes pudeles / cita priekšmeta svars un parastais spēks.)
  • Kad līmes pudeles / priekšmeta masa samazinās, kas notiek ar berzes spēku? (Atbilde Tas arī samazinās.)
  • Kad piezīmju karte sāk kustēties? (Atbilde: kad vilces spēks kļūst lielāks par berzes spēku.)

Drošības jautājumi

Studentiem jābūt uzmanīgiem, izmantojot šķēres.

Padomi problēmu novēršanai

Viens no darbības taustiņiem ir pietiekams svars piezīmju kartē. Jo lielāks svars, jo lielāka atšķirība starp gumijas lentes stiepšanās daudzumu dažādām virsmām. Piemēram, līmes pudelei jābūt pietiekami pilnai, lai uz karti iedarbotos pietiekams spēks.

Darbību paplašinājumi

Palūdziet studentiem atkārtot vienu un to pašu eksperimentu ar citiem mainīgajiem lielumiem: Dažādas formas kārtis, dažāda izmēra kārtis, dažādu svaru, citas virsmas. Palūdziet viņiem aprakstīt savus rezultātus un to, kā rezultāti ir saistīti ar berzi. Daži rezultāti var būt ļoti pārsteidzoši, piemēram, kartei ar lielu virsmas laukumu var būt lielāka berze ar vienu virsmu, bet mazāk ar otru.

Aktivitātes mērogošana

  • Zemākām klasēm vāciet studentu izmērītās vērtības un strādājiet kopā, lai izveidotu vienu joslu diagrammu.
  • Augšākajām klasēm lieciet studentiem dalīties ar izmērītajām vērtībām un, izmantojot vidējos rādītājus, izveidojiet joslu diagrammas. Lieciet studentiem veikt aktivitātes paplašināšanu.

Atsauces

VanCleve, Janice. Fizika katram bērnam: 101 viegls eksperiments kustībā, siltumā, gaismā, mašīnās un skaņā. Ņujorka, NY: John Wiley and Sons Inc., 1991. (Darbība pielāgota no VanCleave.)


6.8 Vingrinājumi

6.8.1. Konceptuālie vingrinājumi

Uzskaitiet katra pētījuma jautājuma paskaidrojošos un atbildes mainīgos.

  1. Vai skolēni ar sliktām atzīmēm biežāk dzer dzērienus?
  2. Kāda ir iespēja, ka jūs pieņemat medicīnas skolā, ņemot vērā jūsu GPA un MCAT rādītājus?
  3. Vai vientuļā mamma, visticamāk, apprecēs mazuļa tēvu, ja viņai ir zēns?
  4. Vai studenti, kas piedalās sportā koledžā, vairāk vai mazāk izceļas?
  5. Vai iedarbība uz noteiktu ķīmisku vielu ir saistīta ar vēža diagnozi?

Interpretējiet koeficientu koeficientus šādā kopsavilkumā.

Dienas aprūpes centri un elpceļu veselība (Nafstad et al. 1999)

Mērķis. Novērtēt dienas aprūpes veida ietekmi uz elpceļu veselību pirmsskolas vecuma bērniem.

Metodes. Iedzīvotāju skaita šķērsgriezuma pētījums par Oslo bērniem, kas dzimuši 1992. gadā, tika veikts 1996. gada beigās. Pašpārvaldes anketa jautāja par dienas aprūpes kārtību, vides apstākļiem un ģimenes īpašībām (n = 3853 atbildes līmenis, 79%).

Rezultāti. Loģistiskā regresijā, kas kontrolē sajaukšanu, dienas aprūpes centros bērniem pēdējo 12 gadu laikā biežāk bija nakts klepus (koriģētā izredžu attiecība, 1,89 95% ticamības intervāls 1,34-2,67) un bloķēts vai iesnas bez saaukstēšanās (1,55 1,07-1,61). mēnešus, salīdzinot ar bērniem mājas aprūpē.

Konstruējiet tabulu un aprēķiniet atbilstošos koeficientus un koeficientus. Šajā komentējiet paziņotos un aprēķinātos rezultātus Ņujorkas Laiks raksts no Kolatas (2009).

Novembrī Slimību kontroles un profilakses centrs publicēja rakstu, kurā ziņots, ka zīdaiņiem, kas ieņemti ar IVF vai ar metodi, kurā spermu injicē tieši olās, ir nedaudz palielināts vairāku iedzimtu defektu risks, tostarp caurums starp abām kamerām sirds, lūpas vai aukslēju plaisa, nepareizi attīstīts barības vads un nepareizi veidota taisnās zarnas. Pētījumā piedalījās 9 584 zīdaiņi ar iedzimtiem defektiem un 4792 zīdaiņi bez. Starp zīdaiņu mātēm bez iedzimtiem defektiem 1,1% izmantoja IVF vai ar to saistītas metodes, salīdzinot ar 2,4% zīdaiņu ar iedzimtiem defektiem.

Secinājumi tiek uzskatīti par provizoriskiem, un pētnieki saka, ka viņi uzskata, ka IVF nerada pārmērīgu risku. Ir 3% iespēja, ka jebkuram bērnam būs iedzimts defekts.

Nelielā izmēģinājuma pētījumā pētnieki salīdzināja divas 3 turbīnas riteņu grupas zemā mitrumā un divas 3 turbīnu riteņu grupas augsta mitruma apstākļos, lai noteiktu, vai mitrums ir saistīts ar radušos plaisu skaitu. Ja (Y ) = plaisu radošo turbīnu riteņu skaits, tad pieņemsim, ka (Y sim textrm(n = 3, p = p_L) ) zemā mitrumā un (Y sim textrm(n = 3, p = p_H) ) zem augsta mitruma, kur (f (yp) = binom p ^ y (1-p) ^). Izrakstiet funkciju log-likelihood ( textrm(p_L, p_H) ), izmantojot 6.4. tabulas datus un pēc iespējas vienkāršojot.

6.8.2. Vadīti vingrinājumi

Futbola vārti mērķī. Dati iegūti no raksta Psiholoģiskā zinātne (Roskes et al. 2011). Autori ziņo par soda sitienu rezultativitātes līmeni, kas bija vērsti uz mērķi, tā ka vai nu vārtsargs atvairīja sitienu, vai arī metienu FIFA Pasaules kausa izcīņas laikā no 1982. līdz 2010. gadam. Viņi atklāja, ka 18 no 20 sitieniem tika izdarīti, kad vārtsarga komanda atpalika, 71 no 90 metieniem tika izdarīts, kad spēle bija neizšķirta, un 55 no 75 metieniem tika gūti ar vārtsarga komandu priekšā.

Aprēķiniet veiksmīga soda sitiena koeficientu par spēlēm, kurās vārtsarga komanda bija aiz muguras, neizšķirta vai priekšā. Pēc tam izveidojiet empīrisko koeficientu koeficientus veiksmīgiem soda sitieniem (a) aizmugurē pret neizšķirtu un (b) neizšķirti pret priekšā.

Uzstādiet modeli ar kategorisko pareģotāju c (“aiz”, “sasiets”, “uz priekšu”) un interpretējiet eksponētos koeficientus. Kā viņi salīdzina ar jūsu aprēķinātajiem empīriskajiem koeficientiem?

Medicīnas skolas uzņemšana. Medicīnisko skolu uzņemšanas dati ir MedGPA.csv, kas vairāku gadu laikā ņemti no mazās brīvās mākslas skolas studentiem. Mūs interesē studentu atribūti, kas saistīti ar augstāku pieņemšanas līmeni.

  • Pieņemt = pieņemts (A) medicīnas skolā vai noraidīts (D)
  • Pieņemšana = pieņemta (1) medicīnas skolā vai atteikta (0)
  • Dzimums = vīrietis (M) vai sieviete (F)
  • BCPM = GPA dabaszinātnēs un matemātikā
  • GPA = vispārējā GPA
  • VR = MCAT verbālā pamatojuma apakšskalas rādītājs
  • PS = fizisko zinātņu MCAT apakšskalas rādītājs
  • WS = MCAT apakšskalas rādītāju paraugu rakstīšana
  • BS = MCAT bioloģisko zinātņu apakšskalas rādītājs
  • MCAT = MCAT kopējais rezultāts
  • Lietotnes = pieteikto skolu skaits

Atbildot uz šādiem jautājumiem, noteikti interpretējiet modeļa koeficientus un saistītos nozīmīguma vai ticamības intervālu testus:

  1. Salīdziniet relatīvo ietekmi, kāda ir jūsu MCAT rādītāja uzlabošanai salīdzinājumā ar GPA uzlabošanu, ņemot vērā izredzes tikt uzņemtai medicīnas skolā.
  2. Vai pēc MCAT un GPA kontroles pieteikumu skaits ir saistīts ar izredzes iekļūt medicīnas skolā?
  3. Vai viena MCAT apakšskala ir svarīgāka par citām?
  4. Vai ir kādi pierādījumi tam, ka MCAT rādītāja vai GPA ietekme vīriešiem un sievietēm atšķiras?

Kode. Raksts Dzīvnieku ekoloģijas žurnāls Bishop (1972) pētīja, vai kodes ar savām maskēšanās pazīmēm pierāda “visizcilāko izdzīvošanu”. Pētnieki uz koku stumbriem 7 vietās no 0 līdz 51,2 km no Liverpūles pielīmēja vienādu skaitu gaišu un tumšu morfīšu kodes, kas bija līdzvērtīgas dabiskam stāvoklim. Pēc tam viņi reģistrēja pēc 24 stundām, iespējams, plēsēju, izņemto kodes gadījumu skaitu. Hipotēze bija tāda, ka, tā kā koku stumbrus netālu no Liverpūles piesārņoja piesārņojums, netālu no Liverpūles, visticamāk, tiks noņemtas vieglās morfes.

Dati (Ramsey un Schafer 2002) ir atrodami vietnē moth.csv un satur mainīgos zemāk. Turklāt R kodu problēmas beigās var izmantot, lai ievadītu datus un izveidotu papildu noderīgus mainīgos.

  • MORPH = gaišs vai tumšs
  • DISTANCE = kilometri no Liverpūles
  • PLACED = konkrēta morfa kožu skaits, kas šajā vietā pielīmēts kokiem
  • REMOVED = pēc 24 stundām noņemtā koda skaits
  1. Kādi ir šī pētījuma logiti?
  2. Izveidojiet empīrisko logitu grafiku diagrammai pret attālumu pēc morfa. Ko mēs varam secināt no šī sižeta?
  3. Izveidojiet modeli ar DISTANCE un tumšu. Interpretējiet visus koeficientus.
  4. Izveidojiet modeli ar DISTANCE, dark un mijiedarbību starp abiem mainīgajiem. Interpretējiet visus koeficientus.
  5. Interpretējiet novirzes krituma testu un Valda testu, lai pārbaudītu mijiedarbības termina nozīmīgumu (d).
  6. Pārbaudiet mijiedarbības modeļa piemērotību. Ko mēs varam secināt par šo modeli?
  7. Vai mijiedarbības modelī ir pierādījumi par pārmērīgu izkliedi? Kādi faktori šajā gadījumā varētu izraisīt pārmērīgu izkliedi? Neatkarīgi no atbildes, atkārtojiet (d) pielāgošanu pārmērīgai izkliedēšanai.
  8. Salīdziniet ticamības intervālus koeficientiem savos modeļos no (g) un (d).
  9. Kas notiek, ja paplašinām datu kopu, lai tajā būtu viena rinda vienā kodē (968 rindas)? Tagad mēs varam palaist loģistikas binārās regresijas modeli. Kā loģistikas binārās regresijas modelis salīdzina ar binomālās regresijas modeli? Kādas ir līdzības un atšķirības? Vai šādā gadījumā būtu kāds iemesls veikt loģistikas binomālo regresiju, nevis loģistikas bināro regresiju? Daži sākuma kods ir atrodams zem ievades koda.

Putnu turēšana un plaušu vēzis: retrospektīvs novērojumu pētījums. 1972. – 1981. Gada veselības apsekojums Hāgā, Nīderlandē, atklāja saistību starp lolojumdzīvnieku putnu turēšanu un paaugstinātu plaušu vēža risku. Lai izpētītu putnu turēšanu kā riska faktoru, pētnieki 1985. gadā četrās Hāgas slimnīcās veica pacientu kontroles pētījumu. Viņi identificēja 49 plaušu vēža gadījumus pacientiem, kuri bija reģistrēti vispārējā praksē un kuri bija 65 gadus veci vai jaunāki un kuri dzīvoja pilsētā kopš 1965. gada. Katram pacientam (gadījumam) ar vēzi tika pievienoti divi kontroles subjekti (bez vēža) ) pēc vecuma un dzimuma. Sīkāku informāciju var atrast Holstā, Kromhoutā un Brendā (1988).

Ir zināms, ka vecums, dzimums un smēķēšanas vēsture ir saistīta ar plaušu vēža sastopamību. Tādējādi pētnieki, kuri vēlējās noteikt pēc vecuma, dzimuma, sociālekonomiskā stāvokļa un smēķēšanas kontroles, vai ar putnu turēšanu ir saistīts papildu risks? Dati (Ramsey un Schafer 2002) ir atrodami vietnē birdkeeping.csv, un mainīgie ir uzskaitīti zemāk. Turklāt R kodu problēmas beigās var izmantot, lai ievadītu datus un izveidotu papildu noderīgus mainīgos.

  • sieviete = dzimums (1 = sieviete, 0 = vīrietis)
  • vecums = vecums, gados
  • highstatus = sociālekonomiskais statuss (1 = augsts, 0 = zems), ko nosaka mājsaimniecības primārā darba ņēmēja nodarbošanās
  • yrsmoke = smēķēšanas gadi pirms diagnostikas vai izmeklēšanas
  • cigsday = vidējais smēķēšanas līmenis cigaretēs dienā
  • putns = putnu turēšanas rādītājs (1 = jā, 0 = nē), ko nosaka pēc tā, vai mājā būros turēti putni ilgāk par 6 mēnešiem pēc kārtas no 5 līdz 14 gadiem pirms diagnozes noteikšanas (gadījumi) vai pārbaudes (pārbaudes).
  • vēzis = plaušu vēža diagnozes rādītājs (1 = vēzis, 0 = nav vēža)
  1. Veiciet izpētes datu analīzi, lai redzētu, kā katrs skaidrojošais mainīgais ir saistīts ar reakciju (vēzis). Apkopojiet visas attiecības vienā teikumā.

Kvantitatīvajiem skaidrojošajiem mainīgajiem lielumiem (vecums, yrsmoke, cigsday) izveidojiet cdplot, boxplot un kopsavilkuma statistiku pēc vēža diagnostikas.

Kategoriskiem skaidrojošiem mainīgajiem (sieviete vai dzimums, augstākā vai sociālā stāvokļa stāvoklis, putns vai turēšanas putns) izveidojiet segmentētu joslu diagrammu un atbilstošu proporciju tabulu, kas parāda saistību ar vēža diagnozi.

Punktā (a) jums nevajadzēja atrast nekādu saistību starp to, vai pacientam attīstās vai nē plaušu vēzis, vai ar viņu vecumu vai dzimumu. Kāpēc tas tā varētu būt? Kādas sekas tam būs jūsu modelēšanai?

Balstoties uz divvirzienu tabulu ar putnu turēšanu un plaušu vēža attīstību no (a), atrodiet nepielāgotu koeficientu attiecību, salīdzinot putnu turētājus ar putnu turētājiem, un interpretējiet šo koeficientu kontekstā. (Piezīme: an nepielāgots koeficientu attiecību nosaka kontrolējot citus mainīgos.) Atrodiet arī līdzīgu relatīvo risku un interpretējiet to arī kontekstā.

Vai elogīti ir samērā lineāri, salīdzinot smēķēto gadu skaitu ar aplēsto log izredzes saslimt ar plaušu vēzi? Demonstrējiet ar piemērotu sižetu.

Vai pastāv mijiedarbība starp kūpināto gadu skaitu un to, vai subjekts tur putnu? Demonstrējiet ar mijiedarbības diagrammu un kodētu izkliedes diagrammu ar empīriskiem logittiem uz y ass.

Pirms atbildat uz nākamajiem jautājumiem, atbildiet uz loģistiskās regresijas modeļiem R ar vēzi kā atbildi un šādus paskaidrojošo mainīgo lielumus:

  • model1 = vecums, yrsmoke, cigsday, sieviete, highstatus, putns
  • model2 = yrsmoke, cigsday, highstatus, putns
  • model4 = yrsmoke, putns
  • model5 = pilnīga 4. modeļa otrās kārtas versija (pievienojiet kvadrātiņus un mijiedarbību)
  • model6 = yrsmoke, putns, yrsmoke: putns

Vai ir pierādījumi, ka mēs varam noņemt vecumu un sievietes no sava modeļa? Veiciet atbilstošu testu, salīdzinot 1. modeli ar 2. modeli, sniedzot testa statistiku un p vērtību un norādot secinājumu kontekstā.

Vai ir pierādījumi, ka pilnīga modeļa4 otrās kārtas versija uzlabo tā veiktspēju? Veiciet atbilstošu testu, salīdzinot 4. modeli ar 5. modeli, sniedzot testa statistiku un p vērtību un norādot secinājumu kontekstā.

Rūpīgi interpretējiet katru no četriem modeļa 6 modeļa koeficientiem kontekstā.

Ja jūs aizstājāt yrsmoke visur, kur tas parādās modelī6, ar vidēji centrētu yrsmoke versiju, pastāstiet, kas mainītos starp šiem elementiem: 4 koeficienti, 4 koeficientu p vērtības un atlikusī novirze.

model4 ir potenciāls galīgais modelis, kura pamatā ir šis izskaidrojošo mainīgo lielumu kopums. Atrodiet un uzmanīgi interpretējiet 95% ticamības intervālus, pamatojoties uz yrsmoke un putna koeficientu profila varbūtību.

Kā putnu turēšanas koriģētā koeficienta attiecība no 4. modeļa tiek salīdzināta ar nepielāgoto koeficientu attiecību, kuru atradāt c) apakšpunktā? Vai putnu turēšana ir saistīta ar ievērojamu plaušu vēža attīstības izredžu pieaugumu pat pēc tam, kad ir pielāgota citiem faktoriem?

Izmantojiet kategorisko mainīgo years_factor, pamatojoties uz yrsmoke, un, lai izveidotu model4a, aizstājiet yrsmoke model4 ar jauno mainīgo. Vispirms kontekstā interpretējiet koeficientu years_factorOver 25 gadiem. Tad pasakiet, vai dodat priekšroku modelim 4 ar gadiem, kas smēķēti kā skaitliskais pareģotājs, vai modelim 4a, kad gadi ir smēķēti kā kategorisks pareģotājs, un paskaidrojiet savu argumentāciju.

Šajā pētījumā apspriediet secinājumu apjomu. Vai mēs varam vispārināt savus atklājumus ārpus šī pētījuma subjektiem? Vai mēs varam secināt, ka putnu turēšana palielina izredzes saslimt ar plaušu vēzi? Vai jums ir citas bažas par šo pētījumu plānu vai veikto analīzi?

Izlasiet rakstu, kas parādījās Britu medicīnas žurnāls. Kādas līdzības un atšķirības jūs redzat starp viņu un jūsu analīzi? Kādas ir pāris lietas, kuras uzzinājāt no raksta un kuras nebija redzamas īsā kopsavilkumā uzdevuma sākumā.

2016. gada vēlēšanas. Godalgotajā studentu projektā (Blakeman, Renier un Shandaq 2018) tika pārbaudīti Donalda Trampa pārsteidzošās uzvaras 2016. gada prezidenta vēlēšanās virzītājspēki, izmantojot gandrīz 40 000 vēlētāju datus, kas apkopoti 2016. gada kooperatīvā kongresa vēlēšanu aptaujas (CCES) ietvaros. Pētnieki studenti pētīja divas teorijas: (1) Tramps tika uzskatīts par pārmaiņu kandidātu vēlētājiem, kuriem ir ekonomiskas grūtības, un (2) Tramps izmantoja vēlētāju bailes par imigrantiem un minoritātēm.

Datu kopai választdata.csv ir individuāla līmeņa dati par vēlētājiem 2016. gada prezidenta vēlēšanās, kas apkopoti no CCES un pēc tam sakārtoti. Mēs pievērsīsimies šādiem mainīgajiem:

  • Balsojums = 1, ja Tramps 0, ja cits kandidāts
  • zfaminc = ģimenes ienākumi, kas izteikti kā z rādītājs (standartnoviržu skaits virs vai zem vidējā)
  • zmedinc = valsts vidējais ienākums, kas izteikts kā z-rādītājs
  • EconWorse = 1, ja vēlētājs uzskatīja, ka ekonomika pēdējos 4 gados ir pasliktinājusies 0 citādi
  • EducStatus = 1, ja vēlētājam citādi ir vismaz bakalaura grāds 0
  • republikāņu = 1, ja vēlētājs citādi apzīmē 0 republikāņu
  • Noimmigranti = 1, ja vēlētājs atbalstīja vismaz vienu no 2 pret imigrantiem vērstajiem politikas paziņojumiem 0, ja neviens no tiem nav
  • propforeign = ārvalstīs dzimušo proporcija valstī
  • evaņģēliski = 1, ja pew_bornagain ir 2, citādi 0

Turpmākie jautājumi attiecas uz 1. teoriju (ekonomikas modeli). Mēs vēlamies redzēt, vai ir nozīmīgi pierādījumi tam, ka balsošana par Trampu bija saistīta ar ģimenes ienākumu līmeni un / vai ar pārliecību, ka Obamas administrācijas laikā ekonomika pasliktinājās.

  1. Izveidojiet sižetu, parādot attiecības starp to, vai vēlētāji balsoja par Trampu, un viņu viedokli par ekonomikas stāvokli. Ko jūs atrodat?
  2. Atkārtojiet (a) atsevišķi republikāņiem un nerepublikāņiem. Atkal aprakstiet to, ko atrodat.
  3. Izveidojiet sižetu ar vienu novērojumu katrā valstī, parādot attiecības starp štata vidējiem ienākumiem un žurnāla koeficientiem, ja šīs valsts rezidents balso par Trampu. Ko jūs varat secināt no šī sižeta?

Atbilde (d) - (f), pamatojoties uz zemāk redzamo 1.a modeli:

  1. Interpretējiet zmedinka koeficientu kontekstā.
  2. Interpretējiet republikāņu koeficientu kontekstā.
  3. Interpretējiet EconWorse: republikāņu koeficientu kontekstā. Ko tas ļauj secināt par 1. teoriju?
  4. Atkārtojiet iepriekš minēto procesu 2. teorijai (imigrācijas modelis). Tas ir, sagatavo jēgpilnus izpētes parauglaukumus, piemēro datiem modeli, īpašu uzsvaru liekot uz imigrantiem, interpretē jēgpilnus koeficientus un paziņo, ko var secināt par 2. teoriju.
  5. Vai pastāv bažas par neatkarības pieņēmumu šajos modeļos? Pie šī jautājuma mēs atgriezīsimies nākamajās nodaļās.

6.8.3. Atklāti vingrinājumi

2008. gada prezidenta balsošana Minesotas apgabalos. Dati mn08.csv satur 2008. gada ASV prezidenta vēlēšanu rezultātus pēc apgabala Minesotā, koncentrējoties uz diviem galvenajiem kandidātiem (demokrātu Baraku Obamu un republikāni Džonu Makkeinu). Jūs varat uzskatīt, ka atbilde ir vai nu Obamas balsu procentuālais daudzums apgabalā (binomāls), vai arī tas, vai Obamam bija vairāk balsu nekā Makkeinam (binārā). Pēc tam izveidojiet reakcijas modeli, izmantojot zemāk uzskaitītos apgabala līmeņa prognozētājus. Interpretējiet sava modeļa rezultātus.

  • Apgabals = apgabala nosaukums
  • Obama = kopējais balsu skaits par Obamu
  • Makkeins = kopējais balsu skaits par Makkeinu
  • pct_Obama = procentu balsu skaits par Obamu
  • pct_rural = procenti no apgabala, kas dzīvo lauku vidē
  • medHHinc = vidējais mājsaimniecības ienākums
  • unemp_rate = bezdarba līmenis
  • pct_poverty = procenti, kas dzīvo zem nabadzības sliekšņa
  • medAge2007 = vidējais vecums 2007. gadā
  • medAge2000 = vidējais vecums 2000. gadā
  • Gini_Index = novadu ienākumu atšķirības rādītājs
  • pct_native = vietējo dzimušo iedzīvotāju procenti

Noziegums pilsētiņā. Datu kopa c_data2.csv satur statistiku par vardarbīgiem un īpašuma noziegumiem 81 ASV koledžas un universitātes izlasē. Raksturojiet vardarbīgu noziegumu īpatsvaru proporcionāli visiem paziņotajiem noziegumiem (t.i., num_viol / total_crime). Vai tās atšķiras atkarībā no iestādes veida, iestādes lieluma vai valsts reģiona?

  • Uzņemšana = uzņemto studentu skaits
  • tips = universitāte (U) vai koledža (C)
  • num_viol = ziņoto vardarbīgo noziegumu skaits
  • num_prop = ziņoto mantisko noziegumu skaits
  • viol_rate_10000 = vardarbīgas noziedzības līmenis uz 10 000 uzņemtajiem studentiem
  • prop_rate_10000 = noziedzības līmenis īpašumā uz 10 000 uzņemtajiem studentiem
  • total_crime = ziņoto noziegumu kopskaits (īpašumi un vardarbība)
  • reģions = valsts reģions

NBA dati. NBA1718team.csv (Kaggle 2018b) dati aplūko faktorus, kas saistīti ar profesionālās basketbola komandas uzvaru procentuālo daudzumu 2017.-18. Pēc rūpīgas izpētes datu analīzes izveidojiet labāko modeli, lai prognozētu komandas uzvaru procentu, esiet piesardzīgs pret kolariāru starp kovariātiem. Pamatojoties uz savu EDA un modelēšanu, aprakstiet faktorus, kas, šķiet, izskaidro komandas panākumus.

  • win_pct = uzvaru procentuālā daļa,
  • FT_pct = vidējais soda metienu procents spēlē,
  • TOV = vidējie apgrozījumi vienā spēlē,
  • FGA = vidējie lauka vārtu mēģinājumi spēlē,
  • FG = vidēji vienā spēlē gūtie lauka mērķi,
  • mēģinājumi_3P = vidēji 3 punktu mēģinājumi spēlē,
  • avg_3P_pct = vidējais 3 punktu procents spēlē,
  • PTS = vidējie punkti spēlē,
  • OREB = vidējais uzbrukuma atlecošo bumbu daudzums vienā spēlē,
  • DREB = vidējās aizsardzības atlēkušās bumbas spēlē,
  • REB = vidējais atlēkušo bumbu daudzums vienā spēlē,
  • AST = vidēji rezultatīvas piespēles spēlē,
  • STL = vidējās spēles pārtvertās bumbas,
  • BLK = Vidējie bloki spēlē,
  • PF = vidējie pārkāpumi spēlē,
  • mēģinājumi_2P = vidēji 2 punktu mēģinājumi spēlē

Miskaste. Lieliski lietainai dienai! Jautrs veids, kā ģenerēt pārdalītos binomālos datus. Katrs students drupina 8,5x11 collu lapu un katru reizi to izmet no trim paredzētajiem attālumiem. Atbilde ir izgatavoto grozu skaits no 10 iemetieniem, sekojot līdzi attālumam. Lieciet klasei ģenerēt un savākt potenciālos kovariātus un iekļaut tos savā datu kopā (piemēram, gadu pieredze basketbolā, izmantojot tenisa bumbu, nevis papīra lapu, augstums). Daži parauga analīzes soļi:

  1. Izveidojiet logitāru un nepārtrauktu prognozētāju (attālums, augstums, metienu skaits utt.) Izkliedes un logit vs kategoriskos mainīgos lielumus (dzimums, bumbas veids utt.). Apkopojiet svarīgas tendences vienā vai divos teikumos.
  2. Izveidojiet diagrammu ar empīriskiem logitātiem un attālumu, kas attēlots atsevišķi pēc bumbas veida. Ko jūs varētu secināt no šī sižeta?
  3. Izmantojot savāktos mainīgos, atrodiet binomālo modeli. Sniedziet īsu diskusiju par saviem atklājumiem.

Atsauces

Baiers, Bens un Maikls Ficdžeralds. 2011. “Alabamas rekonstrukcija: rekonstrukcijas laikmeta demogrāfiskie un statistiskie pētījumi.”

Bishop, J. A. 1972. “Eksperimentāls pētījums par rūpnieciskā melanisma līniju Biston Betularia (L.) (Lepidoptera) starp Liverpūles pilsētu un Ziemeļvelsas lauku.” Dzīvnieku ekoloģijas žurnāls 41 (1): 209–43. https://doi.org/10.2307/3513.

Bleķmens, Mārgareta, Tims Renjē un Rami Šandaks. 2018. “Donalda Trampa vēlētāju modelēšana 2016. gada vēlēšanās.”

Slimību kontroles un profilakses centri. 2009. “Jauniešu riska uzvedības apsekojuma dati.” http://www.cdc.gov/HealthyYouth/yrbs/index.htm.

Greibe, Šellija, Dženeta Šibija Haide un L. Monikija Vorda. 2008. “Mediju loma ķermeņa attēla problēmās starp sievietēm: eksperimentālo un korelācijas pētījumu metanalīze.” Psiholoģiskais biļetens 134 (3): 460–76. https://doi.org/10.1037/0033-2909.134.3.460.

Holsts, P. A., D. Kromhūts un R. Brends. 1988. “Debatēm: Mājdzīvnieku putni kā neatkarīgs plaušu vēža riska faktors.” Britu medicīnas žurnāls 297 (6659): 1319–21. https://doi.org/10.1136/bmj.297.6659.1319.

Kolata, Džīna. 2009. “Attēls, kas parādās par Ivf ģenētiskajiem riskiem”. The New York Times.

Martinsens, M, S Bratland-Sanda, A K Ēriksons un Dž Sundgot-Borgens. 2009. “Diēta, lai uzvarētu vai būtu tievs? Pētījums par diētu un traucētu uzturu pusaudžu elites sportistu un kontrolējošo sportistu vidū. ” Britu Sporta medicīnas žurnāls 44 (1): 70–76. http://bjsm.bmj.com/content/44/1/70.

Nafstads, Pērs, Jorgens A. Hāgens, Leifs Oī, Pērs Magnuss un Jouni J. K. Jaakkola. 1999. “Dienas aprūpes centri un elpceļu veselība”. Pediatrija 103 (4): 753–58. http://pediatrics.aappublications.org/content/103/4/753.

Ramsijs, Freds un Daniels Šafers. 2002. gads. Statistiskā slepus: datu analīzes metožu kurss. 2. izdev. Bostona, Masačūsetsa: Brūkss / Kols Čengāža.


Matemātikas skolotāju pedagoga pamanīšana: interpretējot studentu domāšanu un pierādījumus

Pamanīšana ir prasme, kas nav acīmredzami vērojama, tomēr tā ir efektīva matemātikas apmācība. Pētnieki ir atklājuši, ka topošie un praktizējošie skolotāji var iemācīties pamanīt, taču maz uzmanības tiek pievērsts tiem, kas māca skolotājus pamanīt. Pētījuma mērķis bija raksturot matemātikas skolotāju pedagogu pamanāmību un viņu spēju interpretēt studentu domāšanu un saistīt interpretācijas ar pierādījumiem. Pētījuma dalībnieku vidū bija 16 matemātikas skolotāju pedagogi, kuri piedalījās kursos, kas izstrādāti, lai atbalstītu pamanīšanu. Rezultāti norāda, ka matemātikas skolotāju pedagogi dažādās pakāpēs pamanīja un uzlaboja viņu pamanāmību un saiknes biežumu starp interpretācijām un pierādījumiem. Atzinumi liecināja, ka 19% dalībnieku nemanīja izmaiņas, jo sākumā viņi bija visaugstākajā pamanīšanas līmenī (Robust with Strong Evidence), kas tika uzskatīts par uzlabotu pamanīšanu. Divdesmit pieci procenti dalībnieku nemaz nepamainīja savu pamanīšanu un palika pie Limited, kas tiek uzskatīts par vidēju pamanīšanas līmeni. Atlikušie 56% dalībnieku pamanījās uzlabot. Pētījuma rezultāti atklāj, ka kursa beigās lielākā daļa dalībnieku spēja saistīt interpretācijas ar pierādījumiem. Šie atklājumi ir svarīgi, jo tie, pamanot matemātikas skolotāju pedagogu interpretācijas un pierādījumus, apraksta tos.

Šis ir abonementa satura priekšskatījums, piekļuve caur jūsu iestādi.


Apjukuma sekas

  • Var ņemt vērā visu šķietamo asociāciju vai tās daļu.
  • Var izraisīt patiesas asociācijas pārvērtēšanu (pozitīva jaucēšana) vai par zemu asociācijas novērtējumu (negatīva sajaukšana).

Apgrūtinošo lielumu var kvantitatīvi noteikt, aprēķinot procentuālo starpību starp neapstrādātiem un koriģētiem ietekmes rādītājiem. Lai to aprēķinātu, izmeklētāji izmanto divas nedaudz atšķirīgas metodes, kā parādīts zemāk.

Procentuālo starpību aprēķina, aprēķinot starpību starp sākuma vērtību un beigu vērtību un pēc tam dalot to ar sākuma vērtību. Daudzi izmeklētāji uzskata, ka neapstrādātais asociācijas mērs ir & quot; sākuma vērtība & quot;

Citi izmeklētāji koriģēto asociācijas rādītāju uzskata par sākuma vērtību, jo tas ir mazāk sajaukts nekā kopīgais asociācijas rādītājs.

Lai gan abas iepriekš minētās metodes nedaudz atšķiras, tās parasti dod līdzīgus rezultātus un nodrošina saprātīgu veidu, kā novērtēt sajaukšanas apjomu. Ņemiet vērā arī to, ka sajaukšana var būt negatīva vai pozitīva.


2.2. Varbūtība ar tabulām

2.2.1 Varbūtības noteikšana

A izlases process ir rezultāts, kurā rezultāts nav paredzams. Katru dienu mēs sastopamies ar nejaušiem procesiem: vai šodien līs? cik minūtes paies līdz nākamās īsziņas saņemšanai? vai Seahawks uzvarēs Super Bowl? Lai gan viena konkrēta nejauša procesa iznākums nav prognozējams, ja mēs procesu novērojam daudzas reizes, rezultātu modeli vai tā varbūtības sadalījumu bieži var modelēt matemātiski. Lai gan pastāv vairākas filozofiskas varbūtības definīcijas, mēs izmantosim varbūtības “biežistu” definīciju - ilgtermiņa relatīvo biežumu.

Varbūtība.

The varbūtība notikuma ilgtermiņa īpatsvars, cik reižu notikums notiktu, ja nejaušo procesu atkārtotu bezgalīgi (vienādos apstākļos).

Apsveriet vienkāršo piemēru, kā vienreiz pagriezt godīgu monētu. Kāda ir varbūtība, ka monēta nonāk uz galvas. No tā fizikālajām īpašībām mēs pieņemam, ka galvu varbūtība ir 0,5, bet varbūtības pārbaudei izmantosim simulāciju. 2.9. Attēlā parādīta ilgtermiņa proporcija reižu laikā, kad simulēta monētas apgāšanās nonāk uz galvām uz y ass, un metienu skaits uz x ass. Ievērojiet, kā ilgtermiņa proporcija sāk tuvināties 0,5, jo palielinās metienu skaits.

2.9. Attēls. Viena godīgas monētas pagriešanas simulācija, izsekojot ilgtermiņa proporciju, kad monēta nonāk galvā.

2.2.2 Varbūtību atrašana ar tabulām

Mēs varam atrisināt daudzas reālās dzīves varbūtības problēmas, neizmantojot vienādojumus, izveidojot a hipotētiska divvirzienu tabula scenārija. Šo rīku vislabāk var parādīt ar piemēru.

Pieņemsim, ka kā Montānas štata universitātes studente jūsu pirmā stunda pirmdienās ir Vilsona zālē plkst. 8:00 un jūs dodaties uz skolu. Jums ir Bobcat autostāvvietas atļauja. Pēc iepriekšējās pieredzes jūs zināt, ka Animal Bioscience piedāvā 20% iespēju atrast 6. stāvā atvērtu autostāvvietu. Pretējā gadījumā jums ir jānovieto 18. daļa ar absolventu mājokļiem. Ja 6. vietā atrodat vietu, jums ir tikai 5% iespēja nokavēt stundu. Tomēr, ja jums ir jāuzstājas 18. daļā, jums ir 15% iespēja nokavēt nodarbību. Cik liela ir varbūtība, ka jūs kavēsieties uz nodarbību šo pirmdien?

Šajā scenārijā ir divi nejauši mainīgie: vai jūs novietojat automašīnu 6. vai 18. daļā un vai esat nokavējis nodarbību. Tā kā mēs zinām, ka varbūtība ir ilgtermiņa relatīvā frekvence, iedomāsimies 1000 hipotētiskas pirmdienas un aizpildiet ārkārtas situāciju tabulu ar frekvencēm, kuras mēs sagaidām katrā šūnā.

Tagad mēs varam atrast varbūtību nokavēt stundu, nolasot to no galda: 130/1000 = 0,13.

Kā mēs izveidojām tabulu pēdējā piemērā? Izstrādāsim to soli pa solim.

  1. Identificējiet beznosacījuma problēmā norādītās varbūtības: 20% iespēja novietot automašīnu 6. daļā, kas nozīmē 80% iespēju novietot automašīnu 18. daļā. Ņemiet 20% un 80% no 1000, lai aizpildītu kopējo rindu:
Vēlu uz stundu Nav vēlu uz nodarbību Kopā
6. daļa 1000 ( reizes ) 0,20 = 200
18. daļa 1000 ( reizes ) 0,80 = 800
Kopā 1000
  1. Identificējiet nosacīts problēmā norādītās varbūtības: ja jūs novietojat automašīnu 6. daļā, varbūtība nokavēt nodarbību ir 5% ja jūs noparkojāties 18. žurnālā, varbūtība nokavēt nodarbību ir 15%. Aizpildiet atbilstošās šūnas tabulā, ņemot 5% reižu, kad esat novietojis automašīnu 6. daļā, un 15% reižu, kad esat novietojis vietu 18. daļā:
Vēlu uz stundu Nav vēlu uz nodarbību Kopā
6. daļa 200 ( reizes ) 0,05 = 10 200
18. daļa 800 ( reizes ) 0,15 = 120 800
Kopā 1000
  1. Izmantojiet atņemšanu, lai aizpildītu atlikušās šūnas kolonnā “Nav vēlu līdz stundai”. Izmantojiet papildinājumu, lai atrastu kolonnu kopsummas.

Izmantojot hipotētisko divvirzienu tabulu, kas sniegta pēdējā piemērā, atrodiet šādas varbūtības:

  1. Kāda ir varbūtība, ka jūs nenokavējat nodarbību?
  2. Kāda ir varbūtība, ka jūs novietojat automašīnu 6. daļā un jūs nenokavējat nodarbību?
  3. Ņemot vērā, ka jūs kavējāt stundu, kāda ir varbūtība, ka jūs novietojāt 18. partijā? 33

Uzmanīgi izlasiet, kā katra varbūtība ir aprakstīta vadītajā praksē - ņemiet vērā smalko atšķirību starp “varbūtību nokavēt stundu, dota ka jūs esat novietojis automašīnu 18. daļā ”( (120/800 = 0,15 )) un“ autostāvvietu iespējamība 18. daļā, ņemot vērā to, ka kavējāt klasi ”( (120/130 = 0,923 )). Kad mums tiek sniegta papildu informācija, to sauc par a nosacīta varbūtība, un varbūtības aprēķinā saucējs ir rindas kopsumma (piem., 800) vai kolonnas kopsumma (piemēram, 130), nevis kopējā summa hipotētiskajā divvirzienu tabulā.

Kuras no varbūtībām iepriekšējā nosacītajā praksē ir nosacītas varbūtības? kas ir beznosacījuma? 34

2.2.3 Varbūtības apzīmējums

Lai atvieglotu varbūtības problēmu pārvēršanu aprēķinos, definēsim dažus apzīmējumus. Mēs apzīmēsimnotikumiem”(Piem., Nokavēšana stundā) ar lielajiem burtiem netālu no alfabēta sākuma, piemēram, (A ), (B ), (C ). The notikuma varbūtība (A ) tiks apzīmēts ar (P (A) ), tāpēc (P (A) ) ir skaitlis starp 0 un 1. Notikums, kuru (A ) notikt, sauc par papildināt no (A ) un tiek apzīmēts ar (P (A ^ C) ). Dažreiz mums ir papildu informācija, par kuru mēs vēlētos izvirzīt nosacījumus, un mēs to apzīmējam nosacīta varbūtība (A ) dota (B ) by (P (A | B) ) - varbūtība, ka (A ) notiks, ņemot vērā, ka (B ) jau ir noticis.

Savā monētas pagrieziena piemērā mēs varētu ļaut, lai (A ) būtu notikums, kad monēta nonāk galvā. Tad varbūtību, ka monēta nonāk galvās, mēs varam apzīmēt ar (P (A) = 0,5 ). Mēs varētu divreiz pavērst monētu un uzskatīt, ka (H_1 ) ir notikums, kad pirmais pārsegs piezemējas uz galvām, un (H_2 ) ir notikums, kad otrais pārsegs nolaižas uz galvām. Tā kā monēta neatceras savu pēdējo atlēcienu, tad, ja pirmais klēpis nokrīt uz galvām, otrajam klēpim joprojām ir 50% iespēja piezemēties uz galvām. Tas ir, (P (H_2 | H_1) = 0,5 ).

2.2.4. Diagnostiskā pārbaude

Slimību medicīniskās diagnostikas testi gadiem ilgi pavada attīstību. Veicot klīniskos pētījumus, diagnostikas testa izstrādātāji spēj noteikt divas svarīgas testa īpašības:

  • The jutīgums diagnostikas testa rezultāts ir varbūtība, ka tests dod pozitīvu rezultātu, ņemot vērā to, ka indivīdam ir slimība. Citiem vārdiem sakot, kāda slimo iedzīvotāju daļa būtu pozitīva?
  • The specifika diagnostikas testa rezultāts ir varbūtība, ka tests dod negatīvu rezultātu, ņemot vērā to, ka indivīdam nav slimības. Tas ir, kāda neapdzīvoto iedzīvotāju daļa pārbaudītu negatīvi?

Labam diagnostikas testam ir ļoti augsta (gandrīz 100%) jutība un specifiskums. Tomēr pat gandrīz ideāla testa gadījumā varbūtība, ka esat saslimis ar slimību, kuras rezultāts ir pozitīvs, joprojām varētu būt diezgan zema. Lai izpētītu šo pretin intuitīvo rezultātu, mums nepieciešama cita definīcija:

  • Mēs sauksim to iedzīvotāju īpatsvaru, kuriem ir šī slimība, - varbūtību saslimt ar šo slimību izplatība (saslimstība) ar slimību.

Pieņemsim, ka (D ) ir gadījums, kad indivīdam ir slimība, un (T ) ir gadījums, kad indivīdam ir pozitīvs rezultāts. Kā jūs izteiktu katru no šiem lielumiem, izmantojot varbūtības apzīmējumus?

Ņemiet vērā, ka jutīgums un specifiskums ir nosacītas varbūtības, savukārt izplatība ir beznosacījumu varbūtība. Lai gan iepriekš minētās varbūtības ir noderīga informācija, ja diagnostikas testa rezultāts ir pozitīvs, neviens no šiem lielumiem nav varbūtība, kuru patiešām vēlaties zināt: nosacītā slimības iespējamība, ņemot vērā, ka jums ir pozitīvs rezultāts, (P (D | T ) ).

Baby Jeff gadījums

Šādu gadījumu izpēti iesniedza Slawson un Shaughnessy (2002). Plakāts slimnīcas jaundzimušo bērnudārzā paziņoja, ka visiem jaundzimušajiem vīriešiem tiks veikta muskuļu distrofijas pārbaude, izmantojot kreatinīna fosfokināzes (CPK) papēža nūjas asins analīzi. Skrīninga testu testa raksturlielumi bija gandrīz ideāli: jutīgums 100% un specifiskums 99,98%. Muskuļu distrofijas izplatība jaundzimušajiem vīriešiem svārstās no 1 no 3500 līdz 1 no 15 000. Mazulim Džefam bija nenormāls CPK tests. Zīdaiņa vecāki vēlējās uzzināt: "Kāda ir iespēja, ka mūsu dēlam ir muskuļu distrofija?" Ārsti informēja vecākus, ka, lai gan tas nav simtprocentīgi iespējams, tas ir ļoti iespējams. Vispirms veltiet minūti un paredziet šo varbūtību - ko jūs domājat? 80% iespēja? 99% iespēja? Izpētīsim, izmantojot divvirzienu tabulu ar hipotētisku 100 000 jaundzimušo vīriešu populāciju.

Lai veiktu aprēķinus, izmantosim izplatību 1 no 10 000. Tad no 100 000 hipotētiskiem jaundzimušajiem vīriešiem mēs sagaidām, ka vienam no 10 000 ir muskuļu distrofija vai 10: ((1/10000) reizes 100000 = 10 ). Testa jutība ir nevainojama, tāpēc visiem 10 vīriešu jaundzimušajiem ar muskuļu distrofiju būs pozitīvs rezultāts. No (100000-10 = 99 990 ) jaundzimušajiem vīriešiem, kuriem nav muskuļu distrofijas, 99,98% testu būs negatīvi: ((0,9998) reizes 99990 = 99 970 ) zīdaiņi. Tas atstāj (99990 - 99970 = 20 ) jaundzimušos vīriešus, kuru tests ir pozitīvs, pat ja viņiem nav muskuļu distrofijas. Tas ļauj mums aizpildīt skaitļus mūsu hipotētiskajā divvirzienu tabulā:

Pārbaudes rezultāti ir pozitīvi Pārbaudes negatīvas Kopā
Ir muskuļu distrofija 10 0 10
Nav muskuļu distrofijas 20 99,970 99,990
Kopā 30 99,970 100,000

Tagad no tabulas mēs varam nolasīt vēlamo varbūtību: no 30 jaundzimušajiem vīriešiem, kuriem mēs sagaidīsim pozitīvu rezultātu, tikai 10 no viņiem faktiski ir muskuļu distrofija. Tas nozīmē, ka iespēja, ka mazulim Džefam ir muskuļu distrofija, ir tikai aptuveni 33%!

Kā šī varbūtība mainītos, ja izplatība būtu 1/3500? 1/15000? Pamēģini. 36

Kāpēc radās šis pretin intuitīvais rezultāts? Kāpēc šis tests darbojas tik slikti un ar tik lielu jutīgumu? Atbilde ir saistīta ar slimības izplatību.Attiecībā uz retu slimību ļoti mazā daļa cilvēku, kuriem ir slimība, ir pozitīvi, pārspēj ļoti lielo daļu, kas ir pozitīva no ļoti mazās cilvēku grupas ar šo slimību. Viltus pozitīvu skaits var būt daudz lielāks nekā patieso pozitīvo.


Pieņēmumi un ierobežojumi

Korelācijas un regresijas izmantošana ir atkarīga no dažiem pamatā esošajiem pieņēmumiem. Tiek pieņemts, ka novērojumi ir neatkarīgi. Korelācijai abiem mainīgajiem jābūt nejaušiem, bet regresijas gadījumā nejaušam jābūt tikai atbildes mainīgajam y. Veicot hipotēzes testus vai aprēķinot ticamības intervālus regresijas parametriem, atbildes mainīgajam jābūt Normālam sadalījumam, un y mainīgumam jābūt vienādam katrai prognozētāja mainīgā vērtībai. Tādi paši pieņēmumi ir vajadzīgi, pārbaudot nulles hipotēzi, ka korelācija ir 0, bet, lai interpretētu korelācijas koeficienta ticamības intervālus, abiem mainīgajiem jābūt normāli sadalītiem. Gan korelācija, gan regresija pieņem, ka sakarība starp abiem mainīgajiem ir lineāra.

Datu izkliedes diagramma nodrošina sākotnēju regresijas pieņēmumu pārbaudi. Pieņēmumus var sīkāk novērtēt, aplūkojot atlikumu grafikus [4,7]. Parasti atlikumi tiek uzzīmēti atbilstoši uzstādītajām vērtībām. Ja sakarība ir lineāra un mainīgums nemainīgs, tad atlikumiem jābūt vienmērīgi izkliedētiem ap 0 visā uzstādīto vērtību diapazonā (att. & # X200B (11. att. 11).

a) Izkliedētā y diagramma ar x norāda, ka sakarība ir nelineāra. b) Atlikumu grafiks pret uzstādītajām vērtībām panelī a ir skaidrāk parādīts attiecības izliekums. c) Izkliedes diagramma y pret x liecina, ka mainīgums y palielinās ar x. d) Atlikumu grafiks pret c paneļa uzstādītajām vērtībām ir skaidrāk parādīts ar y pieaugošā mainība ar x.

Turklāt var izveidot normālu atlikumu grafiku. Šis ir atlikumu grafiks salīdzinājumā ar vērtībām, kuras varētu sagaidīt, ja tās tiktu iegūtas no standarta Normal sadalījuma (Normal score). Ja atlikumi parasti tiek sadalīti, tad šajā grafikā tiks parādīta taisna līnija. (Standarta normālais sadalījums ir normāls sadalījums ar vidējo = 0 un standartnovirzi = 1.) Normālie grafiki parasti ir pieejami statistikas paketēs.

Attēli & # x200B 12. un 12. zīmējumā parādīti atlikušie A & # x00026E datu grafiki. Pielāgoto vērtību diagramma attiecībā pret atlikumiem liek domāt, ka pieļaujamie linearitātes un pastāvīgās dispersijas pieņēmumi ir izpildīti. Normālais sižets liek domāt, ka atlikumu sadalījums ir Normāls.

Atlikumu grafiks, salīdzinot ar avārijas un avārijas vienības datu uzstādītajām vērtībām

Normāls atlikumu grafiks negadījuma un avārijas vienības datiem.

Izmantojot prognozēšanai regresijas vienādojumu, kļūdas prognozē var būt ne tikai nejaušas, bet arī nepietiekamas modeļa dēļ. Jo īpaši ekstrapolēšana ārpus datu diapazona ir ļoti riskanta.

Pazīstama parādība, kas var rasties, atkārtoti mērot indivīdus, ir regresija līdz vidējam līmenim. Piemēram, ja tiek veikti atkārtoti asinsspiediena mērījumi, tad pacientiem, kuru pirmajā lasījumā rādītāji ir augstāki par vidējiem, otrajā mērījumā parasti būs zemāki rādījumi. Tāpēc atšķirība starp viņu otro un pirmo mērījumu mēdz būt negatīva. Un otrādi ir pacientiem, kuru pirmā mērījuma rādījumi ir zemāki par vidējiem, kā rezultātā acīmredzami paaugstinās asinsspiediens. Tas varētu novest pie maldinošām interpretācijām, piemēram, ka starp asinsspiediena izmaiņām un sākotnējo asinsspiedienu var būt acīmredzama negatīva korelācija.