Medianen ett mer exakt mätvärde än medelvärdet

Forskningen inom såväl medicin, biologi som folkhälsoområdet har traditionellt presenterat sina olika rön i form av olika medelvärden. Men dessa kan variera till följd av individuella och miljömässiga faktorer, säger Matteo Bottai, professor i biostatistik vid Institutet för miljömedicin. 

I stället för att använda sig av medelvärden i sitt arbete som biostatistiker, har han nyligen börjat fokusera på betydelsen av att beräkna kvantiler, ett annat ord för percentiler som exempelvis medianen eller den 25:e och 75:e percentilen. Om de relativa frekvenserna i ett datamaterial anges i procent, kallas dessa ofta för percentiler.

Att kvantiler kan ge mer utslagsgivande resultat än ett beräknat medelvärde blev uppenbart då han arbetade med data från en större epidemiologisk studie. Han skulle studera medelvärdet av serumkoncentrationen av immunoglobulin typ E (IgE) hos rökare respektive icke-rökare. Men medelvärdet visade inga statistiskt signifikanta skillnader mellan grupperna. Samtidigt kunde han notera att det fanns ovanligt stora skillnader i IgE-värde mellan olika personer i studien, och valde då att i stället mäta IgE-värdenas logaritmer.

- Det visade sig att IgE-logaritmernas medelvärde visade på en stor och signifikant skillnad mellan rökare och icke-rökare. Tvärtemot vad det första fyndet hade visat. Frågan är vad man då ska rapportera; att det inte finns några skillnader mellan gruppernas medelvärde för IgE, eller att det är stor signifikant skillnad på IgE-logaritmernas medelvärde.

När han därefter studerade de båda gruppernas medianvärde för IgE , det vill säga där hälften av IgE-värdena befinner sig under medianen och hälften ovanför, var skillnaden stor och signifikant. Precis samma slutsats drog han också för medianen för IgE-logaritmerna.

- Tanken att i stället beräkna medianen är inte ny. När årliga inkomster eller huspriser ska summeras görs det ofta efter medianvärdet, inte medelvärdet. Det behövs bara en person med skyhög inkomst alternativt taxeringspriset på ett större gods för att påverka medelvärdet. Det är lättare att använda sig av medianvärdet; att kunna säga att hälften av ett antal personer tjänar mindre än medianvärdet.

Beräkningen av medianen och percentiler/kvantiler ser han därför som ett praktiskt alternativ till att mäta medelvärdet. Hans arbete kring detta resulterade tidigare i år i rapporten "Logistic quantile regression for bounded outcomes", som publicerades i tidskriften Statistics in Medicine. Arbetet fokuserar på intressanta variabler som kan mäta procentuella värden inom ett begränsat område.

Han har använt olika metoder, exempelvis kvantil regression, för att dra statistiska slutsatser i sina samarbeten med medicinska och epidemiologiska forskargrupper. Metoden kvantil regression kan beskrivas ungefär på följande sätt; den utformar kvantilerna, exempelvis medianen och den 25:e percentilen, för en funktion eller faktor av intresse.

Exempelvis kan kvantil regression beräkna skillnaden i median, eller vilken annan percentil som helst, när det gäller blodtrycket hos patienter som får blodtrycksbehandling respektive placebo. Metoden motsvarar linjär regression som i stället utformar medelvärdet.

Synliggör samband

Första gången han använde sig av kvantil regression var då han studerade relationen mellan förändringar i lungfunktion över tid och body mass index (BMI) hos ett antal överviktiga personer. Artikeln publicerades i European Respiratory Journal vid en tidpunkt då begreppet kvantil regression fortfarande förekom sparsamt i den biomedicinska och epidemiologiska litteraturen. Studien gav respons i media runt om i hela världen, säger han.

- Vi kunde bland annat visa att när en överviktig person går ned i vikt förbättras samtidigt också lungfunktionen.

Han använde sig också av logistisk kvantil regression vid analysen av data från en mindre klinisk studie kring isolerat fibrin från patienter med kronisk tromboembolisk lunghypertension.

I en studie publicerad redan 2003 presenterade han en klinisk statistisk modell där det går att förutsäga risken för lungemboli, det vill säga blodpropp i lungan. Han tog tidigare i år patent på modellen, som alltså kommer att börja användas kliniskt. Betydelsen av att beräkna kvantiler är ett ganska nytt intresseområde för Matteo Bottai, vars forskning omfattar allt ifrån nya statistiska metoder och design, till analys och spridning av resultat från kliniska och epidemiologiska studier. Hans kontinuerliga akademiska arbete har sin grund i såväl oberoende forskning som samarbetsprojekt inom teoretisk, metodologisk och tillämpad statistik.

Text: Eva Cederquist, publicerad i "Från Cell till Samhälle" 2010

Om forskningsämnet

Biostatistik studerar hur olika slags forskningsdata kan utnyttjas så effektivt som möjligt; vilka slutsatser som kan dras av materialet samt i vilken utsträckning dessa är trovärdiga och kan bidra till förbättringar i människors liv. Vid alla steg i denna process har statistiska metoder en avgörande betydelse och biostatistikern arbetar med att göra datauppgifterna effektiva och lättillgängliga.

Länkar

BiostatistikProfessor