Idag publicerade vi en studie som kritiskt granskar PHQ-9 (Patient Health Questionnaire-9), det kanske mest använda frågeformuläret för att mäta depression inom både vård och forskning. Resultaten är oroväckande och väcker frågan: är det dags att pensionera detta verktyg?
PHQ-9 används överallt – från vårdcentraler till stora forskningsstudier – för att diagnostisera depression och följa behandlingseffekter. Men vår studie med 3384 deltagare från en pågående klinisk prövning visar att formuläret har allvarliga brister som kan påverka både diagnoser och behandlingsutvärdering.
Formulärets tveksamma ursprung
Det få känner till är att PHQ-9 ursprungligen utvecklades på initiativ av läkemedelsföretaget Pfizer i samband med lanseringen av antidepressiva Zoloft (Se: “How a depression test devised by a Zoloft marketer became a crutch for a failing mental health system“). Även om forskarna bakom formuläret insisterade på att testa dess validitet, väcker denna koppling frågor om intressekonflikter som funnits med från början.
Viktiga fynd från studien
- Dålig “passform”: När vi testade om PHQ-9 verkligen mäter en enda underliggande dimension (depression), fann vi att modellen passade dåligt med våra data. Detta tyder på att summapoängen som används för att bedöma depressionsnivå kanske inte ger en rättvisande bild.
- Överlappande frågor: Särskilt problematiskt är att fråga 1 (anhedoni/bristande intresse) och fråga 2 (nedstämdhet) överlappar kraftigt – de mäter i princip samma sak. Detta är problematiskt för ett instrument som ska fånga depressionens komplexitet. Och fråga 1 och 2 mäter ju var för sig ett av de två kardinalsymtomen för just depressionsdiagnosen.
- Fungerar olika över tid: Kanske mest oroande är att formuläret inte uppvisar mätinvarians över tid. Med andra ord: deltagare verkar använda och tolka frågorna olika vid olika tillfällen under behandling. Detta betyder att förändringar i PHQ-9-poäng kanske inte speglar verkliga förändringar i depression, utan snarare förändringar i hur människor förstår och svarar på frågorna.
- Olika för olika behandlingsgrupper: Vi fann även att deltagare som randomiserats till olika behandlingsgrupper inte använder formuläret på samma sätt, trots att de i övrigt är jämförbara. Detta gör det svårt att göra meningsfulla jämförelser mellan individer.
Konsekvenser för vård och forskning
Dessa fynd har viktiga implikationer. PHQ-9 används för att fatta kritiska beslut – vem som får en depressionsdiagnos, vem som kvalificerar sig för behandlingsstudier, och vem som anses vara i remission (Remission vid depression betyder att symtomen har minskat så mycket att personen inte längre uppfyller kriterierna för en depressionsdiagnos). Med en andel av falsk-positiva som ofta överstiger 50% riskerar många att felaktigt få en depressionsdiagnos, med alla de psykologiska och medicinska konsekvenser det kan innebära.
Vägen framåt
Efter 25 år utan större förbättringar i behandlingsresultat för depression kanske det är dags att tänka nytt. Vi föreslår att framtida mätinstrument bör utvecklas från grunden med utgångspunkt i kvalitativa intervjuer med patienter som har levd erfarenhet av depression. En översyn visade att sju vanliga depressionsskalor tillsammans identifierade 52 olika symptom, men även den mest omfattande skalan fångade bara 60% av dessa.
Slutsats
Vår studie ställer obekväma frågor om ett av psykiatrins mest använda verktyg. Att fortsätta använda PHQ-9 utan kritisk granskning riskerar två saker: i bästa fall fortsätter vår teoretiska förståelse och behandlingsutveckling att stagnera; i värsta fall skadar vi patienter genom felaktiga mätningar, olämpliga diagnoser och behandlingar med potentiella biverkningar.
Det är dags för en förändring. Vi behöver utveckla nya, bättre sätt att mäta och förstå depression – sätt som verkligen fångar tillståndets komplexitet och respekterar patienternas upplevelser.
Läs hela artikeln här (open access):
Hlynsson, J. I., Skúlason, S., Andersson, G., & Carlbring, P. (2025). Why are we still using the PHQ-9? A Historical Review and Psychometric Evaluation of Measurement Invariance. Psychiatric Quarterly. doi:10.1007/s11126-025-10208-9