STATISTIK

Ordet statistik har med stat att göra och det handlar om att samla in, ordna och presentera fakta på ett ändamålsenligt sätt och ändamålet är i allmänhet att vara underlag för beslut och ställningstaganden. Sådant sysslar de som styr stater med.

Varje minsta del av ett insamlat material (ett svar vid en enkät eller en mätning) kallas en observation. Varje nytt svar eller ny mätning (även om svaret eller mätvärdet är samma som fåtts tidigare) är en ny observation. Flera observationer kan alltså ha samma observationsvärde. Antalet observationer med ett och samma observationsvärde kallas frekvensen för detta observationsvärde. Om materialet är klassindelat, kan frekvensen också avse antalet observationer i en och samma klass. Relativa frekvensen är frekvensen dividerad med totala antalet observationer i hela materialet.

BERÄKNING AV OLIKA LÄGESMÅTT

Ett lägesmått anger med ett tal ungefär hur stort värde observationerna i ett statistiskt material har. Lägesmåttet kan ibland användas som något slags "normal" representant för alla observationerna - ett normalläge då det gäller alla observationernas värden. Vi talar om tre olika lägesmått: Medelvärde, median och typvärde. De tas fram på följande sätt:

Ex. Det statistiska materialet

   har medelvärdet

Ex. Det statistiska materialet

   har medelvärdet


Medianen väljs i princip så att hälften av observationerna har ett mindre värde och hälften av observationerna har ett större värde. I praktiken gör man så att om antalet observationer är udda så väljer man till median den av observationerna som gör att de övriga observationerna uppfyller villkoret ovan och om antalet observationer är jämnt så väljer man till median ett tal som ligger mitt emellan den största av observationerna i den hälft som har de lägre värdena och den minsta av observationerna i den hälft som har de högre värdena.

Ex. Det statistiska materialet


   har medianen

Ex. Det statistiska materialet

   har medianen


Om något observationsvärde förekommer oftare än något annat, så kallas detta värde typvärde. Ibland finns inget typvärde - ibland finns mer än ett.

Ex. Det statistiska materialet


   har två typvärden

 och 

Ex. Det statistiska materialet


   har inget typvärde.

BERÄKNING AV OLIKA SPRIDNINGSMÅTT

Ett spridningsmått är ett tal som på något sätt anger hur utspritt det statistiska materialet är dvs hur långt från lägesmåttet observationerna i allmänhet ligger. Vi talar om tre olika spridningsmått: Standardavvikelse, kvartilavstånd och variationsbredd.

Standardavvikelsen är ett slags medelvärde av de olika observationernas avvikelser från materialets medelvärde. Den något komplicerade beräkningen kan med fördel överlåtas till miniräknaren. (Se handledningen för Din miniräknare!)

Ex. Det statistiska materialet


   har standardavvikelsen

Ex. Det statistiska materialet

   har standardavvikelsen


Kvartilavståndet är övre kvartilen minus nedre (undre) kvartilen. Övre kvartilen kallas också 75-percentilen och ska vara ett tal sådant att 75 % av observationerna har ett mindre värde. (I praktiken väljer man då vanligen medianen i materialets övre hälft.) Nedre kvartilen kallas också 25-percentilen och ska vara ett tal sådant att 25 % av observationerna har ett mindre värde. (I praktiken väljer man då vanligen medianen i materialets nedre hälft.) Beräkningen av kvartilavståndet framgår av följande exempel:

Ex. Det statistiska materialet


   har kvartilavståndet

Ex. Det statistiska materialet

   har kvartilavståndet


Variationsbredden är det största observationsvärdet minus det minsta.

Ex. Det statistiska materialet


   har variationsbredden

Ex. Det statistiska materialet

   har variationsbredden


TABELLER OCH DIAGRAM

Statistiska material - särskilt stora sådana med många observationer - redovisas gärna i form av tabeller och diagram. Tabellerna kan vara vanliga frekvenstabeller eller om mer än 10-20 olika observationsvärden förekommer frekvenstabeller i vilka materialet delats in i (5-10) klasser. Vid uppskattning av medelvärde m m, när en sådan tabell är utgångsmaterial, får klassmitterna representera värdet av samtliga observationer i den aktuella klassen. I korstabeller kan procentredovisningen ske på tre sätt - horisontellt, vertikalt eller med avseende på hela materialet.

Följande typer av diagram behandlas:

Stolpdiagramanvänds då observationerna antar ett fåtal heltalsvärden.
Stapeldiagramanvänds framför allt då observationsvärdena inte är tal.
Histogramanvänds vid klassindelat material.
Befolkningspyramid
   (animerad)
är egentligen två liggande histogram.
Stambladsdiagramär som ett liggande histogram där staplarna utgörs av siffror.
Linjediagramanvänds då man önskar illustrera trender/utveckling.
Cirkeldiagramanvänds då man önskar illustrera en fördelning.
Lådagramanvänds då median och kvartiler/kvartilavvikelse beräknats.