Testaamalla lisää (epä)varmuutta kliiniseen työhön – ymmärrä testaamisen sudenkuopat

Koska olet viimeksi pysähtynyt pohtimaan asiakkaasi tutkimisessa käyttämiäsi testejä? Ovatko ne luotettavia? Tiedätkö, millaisia johtopäätöksiä niiden tuloksista on tutkimukseen perustuen mahdollista tehdä? Teetkö oppimiasi testejä rutiininomaisesti, vai valikoitko sopivat testit tilannekohtaisesti ja vaikuttavatko saamasi tulokset siihen, millaisen hoitointervention suunnittelet asiakkaallesi?

Tuki- ja liikuntaelinten (tule) vaivojen erotusdiagnostiikkaan ja tule-toiminnan tutkimiseen on kirjallisuudessa kuvattu lukematon määrä erilaisia testejä. Riippumatta testin tarkoituksesta, meidän on tarkasti mietittävä millaista ja kuinka luotettavaa tietoa testi meille antaa ja miten tieto ohjaa tai mahdollisesti muuttaa hoidon toteutusta. Jotta tutkimalla ja mittaamalla kerättävä tieto olisi mahdollisimman merkityksellistä sekä asiakkaalle että tule-ammattilaiselle, tulisi molempien osapuolten ymmärtää, mihin mittauksilla pyritään ja miten tietoa hyödynnetään asiakkaan saaman hoidon laadun parantamiseksi. Tässä blogikirjoituksessa käsitellään tule-asiakkaan tutkimisessa käytettyjen testien valintaa erotusdiagnostiikan ja liikkeen havainnoinnin näkökulmista.

Testin valinta ja tulkinta

Oikein valittu ja asianmukaisesti toteutettu testi tai mittari tuottaa tutkittavasta ilmiöstä sen todellisen tuloksen/arvon, joka on toistettavasti sama, kun mitattavassa ilmiössä ei ole tapahtunut muutosta. Näitä testin ominaisuuksia kuvataan termeillä reliabiliteetti (luotettavuus, toistettavuus) ja validiteetti (pätevyys, miten hyvin testi kuvaa/ mittaa juuri sitä ilmiön ominaisuutta, mitä on tarkoituskin kuvata/mitata). Jos testi omaa huonon reliabiliteetin, ei sillä todellisuudessa voi olla hyvää validiteettiakaan. Hyvän reliabiliteetin ja validiteetin saavuttamiseksi meidän tulee ymmärtää käyttämiemme testien sekä testattavien ominaisuuksien tausta ja testaamisen systemaattisen toteutustavan merkitys. Tuntemalla teoriataustan pystymme ymmärtämään mitä testillä oikeastaan arvioidaan, miten tuloksia voidaan hyödyntää kliinisessä päätöksenteossa, ja millaisella kohdejoukolla testiä on tutkittu.

Tule-kuntoutuksessa emme voi välttyä vaihtelulta mittaustuloksissa, koska mikään kliininen mittaus ei omaa täydellistä reliabiliteettia tai kuvaa asiakkaan tilannetta täydellisesti. Harjoittelemalla tutkimista ja toteuttamalla tutkiminen systemaattisesti aina samalla tavalla pystymme kuitenkin parantamaan testien toistettavuutta. Tästä huolimatta emme pysty täysin vakioimaan tutkimistilannetta. Tutkimistilanteessa esiintyy aina kohinaa: asiakkaan asento testin aikana voi vaihdella testikertojen välillä, testaamisen ajankohta voi vaikuttaa tulokseen, samoin testilikkeen tuttuus. Sekä itse testiin että testitilanteeseen liittyy epävarmuustekijöitä, joiden suuruutta tulee pyrkiä minimoimaan ja huomioimaan tuloksia tulkitessa.

Kliininen tutkiminen ja mittaaminen ovat osa kliinistä päätöksentekoa, mutta eivät sen synonyymi. Kliinisesti tehtävät päätökset eivät siten saisi yksinään perustua testituloksiin eivätkä testit anna suoria vastauksia syy-seuraussuhteita koskeviin kysymyksiin. Yksittäisestä viitearvosta poikkeavat mittaustulokset nähdään usein merkkinä esimerkiksi korjattavasta ominaisuudesta tai suorituskyvyn osa-alueesta, vaikka yhtä lailla kyse voi olla luonnollisesta vaihtelusta tai sekoittavan tekijän vaikutuksesta. Esimerkiksi olkapääkipuisen olkanivelen rajoittunut loitonnusliike voi johtua yhtä lailla liikerajoituksesta, kivusta kuin näiden yhdistelmästä. Kyseessä voi siis olla yksi nykyisten oireiden syntyyn johtaneista tekijöistä, oireiden seuraus tai kyseessä voi olla jo aiemmin syntynyt, nykyiseen oireeseen liittymätön ominaisuus.

Erotusdiagnostisten testien valinta

Tule-ongelmien määrittely perustuu vahvasti alkukeskustelusta saatuihin tietoihin ja oirekuvaan, huolelliseen erotusdiagnostiikkaan sekä näiden pohjalta tehtävään kliiniseen päättelyyn. Diagnostiset testit, eli testit, joiden perusteella pystytään tekemään päteviä johtopäätöksiä “taudin” tai kudosvaurion olemassaolosta, ovat harvassa. Ongelman määrittely on muutenkin vain osa kliinistä päättelyä, jossa hoitoa tai ongelmanratkaisua koskevaan päätöksentekoon vaikuttavat lisäksi myös asiakkaan muu terveydentila sekä hänen tavoitteensa ja odotuksensa.

Esimerkkinä hyvästä tule-vaivojen diagnostisesta testistä voidaan mainita polven eturistisiteen repeämää arvioiva Lachmanin testi. Koska eturistiside vastaa suurimmasta osasta polvinivelen anteriorista tukevuutta, voidaan poikkeavan väljäksi todetulla testituloksella epäillä kohtalaisella varmuudella eturistisiteen vaurioitumista.

Kuten minkä tahansa kliinisen testin, asiakkaan ongelman lähtökohdat sekä hänen tavoitteensa korostavat Lachmanin testin merkitystä. Koettu polven epävakaus liikuntavamman jälkeen sekä odotukset palata suunnanmuutos- ja kontaktilajeihin antavat selkeimmät indikaatiot testin tekemiselle, koska testi antaa merkityksellistä tietoa hoitolinjan valinnan tueksi. Täydellisiäkään polven eturistisidevammoja ei automaattisesti lähdetä operoimaan pelkän diagnoosin perusteella tarkoittaen, että positiivinen Lachmanin testi kertoo lähinnä sen mistä asiakkaan ongelmassa on todennäköisesti kyse (kudosrakenteiden näkökulmasta), muttei yksinään sitä, mitä ongelmalle kannattaisi tehdä. Hyväkään testi ei siis useimmiten yksittäin anna vastauksia kaikkiin kysymyksiin, vaan usein kokonaiskuvan saamiseksi tilanteesta tarvitaan monia, eri tarkoituksiin kehitettyjä arviointimenetelmiä.

Asiakkaan kliinisen tutkimiseen käytettyjen testien valinnassa on helposti vaara upota testien valtamereen. Esimerkiksi olkanivelen tutkimiseen liittyen kirjallisuudessa on kuvattu 180 erilaista testiä. Iso osa testeistä on luonnollisesti vain erilaisia variaatioita toisistaan ja ne toimivat luultavimmin paremmin kipuprovokaatiotestinä ennemmin kuin kertovat vaivan patoanatomista syytä. Kivuliaan liikesuunnan tunnistamisesta saattaa olla hyötyä esimerkiksi oiremodifikaatiokeinojen valinnassa, mutta jälleen on hyvä kysyä, kuinka relevantteja testit ovat asiakkalle merkityksellisissä toimissa olevien haasteiden kannalta. Riittäisikö testiksi joskus se, että pyydämme asiakasta näyttämään hänelle hankalan liikkeen? Jos testillä ei taas haeta oireprovokaatiota, vaan halutaan selvittää, onko liike nivelessä “normaali” vai “poikkeava”, siirrytään sekä testin tulkinnan että tehtävien johtopäätösten osalta vahvasti harmaalle alueelle, jossa löydösten ja oireiden välisen syy-seurausuhteen tunnistaminen vaikeutuu huomattavasti. Ihmiskehossa normaaliuden tunnistaminen ainakin kivun läsnä ollessa on yllättävän haasteellista.

Liikkeen ja liikkumisen havainnointi

Yksi kliinisen arvioinnin ongelma on se, että visuaaliseen havainnointiin perustuvat testit ovat usein epätarkempia kuin objektiiviset (mittausarvoja tuottavat) mittarit, heikentäen niiden validiteettia ja siten tulosten hyödynnettävyyttä. Esimerkiksi näyttö alaselkäkipupotilaan tutkimisessa käytettyjen havainnointiin perustuvien laajasti käytössä olevien liikehallintatestien käytöstä on edelleen riittämätöntä. Tutkimukset on tehty suhteellisen pienillä ryhmillä ja tutkimuksissa kohdejoukko on vaihdellut.

Tutkimuksissa on osoitettu, että alaselkäkipupotilailla ja terveillä henkilöillä liikehallinta vaihtelee yksilöiden välillä huomattavasti vaikeuttaen ryhmien välisen eron tunnistamista. Useissa tutkimuksissa ei ole myöskään huomioitu sitä, että testeissä arvioituun lannerangan keskiasennon hallintaan saattaa vahvasti vaikuttaa liikehallinnan (kyky hahmottaa ja hallita lannerangan asentoa) lisäksi myös oirekäyttäytymiseen ja kipuun liittyvien psykologisten tekijöiden läsnäolo. Liikehallintatestien osalta meidän siis pitää uskaltaa kysyä itseltämme, testaammeko me näillä testeillä todellisuudessa sitä, mitä me luulemme testaavamme? Onko kliinisesti havainnoiden ylipäänsä mahdollista luotettavasti havainnoida neutraaliasentoa ja onko neutraaliasennon säilyttäminen ylipäänsä selkäkuntoutuksessa aina tavoiteltava tilanne?

Arjen liikkumisessa käytettävien liikemallien arvioinnissa käytetään terveydenhuollossakin yleisesti esimerkiksi työkyvyn arvioinnissa liikkumisen ja liikkeiden asymmetriaa ja heikkouksia selvittävä Functional Movement Screen (FMS) -testimenetelmää. FMS:n tarkoituksena on arvioida pistein arjen fyysisessä toiminnassa käytettyjä liikemalleja suhteessa ennalta määriteltyihin kriteereihin, jotka liittyvät liikkeen kompensaatioon tai kivuliaisuuteen. Pisteet tarjoavat näennäisesti mahdollisuuden verrata määrällisesti toispuoleisten liikkeiden symmetriaa ja FMS:n kokonaispistemäärän on myös esitetty kykenevän arvioimaan kohonnutta fyysisen aktiivisuuden aikaista vammariskiä.

FMS-liiketestistöä käyttäessä voimme luottaa saavamme toistettavasti samoja pistemääriä, kun testattavan liikkumiskyvyssä ei ole tapahtunut merkittäviä muutoksia. Kokonaispistemäärästä tehtäviin tulkintoihin liittyy kuitenkin merkittävästi enemmän epävarmuutta. Tutkimuksissa on esimerkiksi havaittu tiettyjen osatestien pistemäärän vaikuttavan kokonaispistemäärään muita enemmän altistaen testauksen vinoutuneelle tulkinnalle. FMS-tulos ei myöskään kuvaa vammariskiä, joka liittyy heikentyneeseen tasapainoon eikä rangan kuormittumista nostoliikkeen aikana.

Tutkimusten perusteella näyttäisi siltä, että FMS-liiketestistössä käytettävä kriteeristö on luotettava arvioimaan liikemallien eroja ja muutoksia, mutta FMS:n kyky arvioida vammariskiä on epävarmaa. Vammautumisella ja FMS:n yhteispistemäärällä on havaittu yhteys ainoastaan miespuolisilla sotilailla. Muilla populaatioilla näyttö yhteydestä on joko vähäistä tai ristiriitaista. Vammariskin ollessa todennäköisyyttä kuvaava määrällinen käsite on myös pohdinnan arvoista miettiä, missä määrin kahteen kategoriaan jakava yksittäinen rajapistearvo (14 tai sen alle) ohjaa kliinistä päätöksentekoa käytännön työssä esimerkiksi kuntoutuksen suunnittelun ja toteutuksen osalta. Yhteenvetona tutkimusnäytöstä voidaan todeta, että FMS-tulosten kyky ennustaa vammariskiä on epäselvä, ja monet katsaukset päätyvät täten johtopäätökseen, ettei sen käyttöä suositella. FMS on siis hyvä esimerkki sinänsä hyvin toistettavasta mittarista, jota on lähdetty soveltamaan sen alkuperäisen käyttötarkoituksen ulkopuolelle, ja jonka pohjalta tehdään johtopäätöksiä, joita tutkimukseen perustuen sen tuloksista ei ole mahdollista tehdä.

Johtopäätökset

Huolellinen kliininen tutkiminen on yksi keskeinen osa selvitettäessä asiakkaan vaivaa sekä vaivan ilmenemiseen liittyviä toiminnallisia tekijöitä. Jokaisen tutkimisessa käytetyn testin tai havainnointimenetelmän merkitys voidaan lopulta arvioida sillä, että vaikuttaako tutkimustulos asiakkaalle suunnatun hoitointervention valintaan ja siten hoidon tuloksellisuuteen. Erilaisten testien kaavamainen toteuttaminen kaikille asiakkaalle parantaa harvoin ymmärrystä yksilön ongelmasta ja tällainen toiminta voi johtaa päinvastaiseen lopputulokseen eli epävarmuuteen kliinisessä päätöksenteossa.

Kliinisen tutkiminen on jatkumo alkukeskustelulle ja tutkimisessa kannattaa keskittyä asiakkaalle merkityksellisiin toimintakyvyn haasteisiin. Tutkimisessa käytettyihin testeihin ja havainnointimenetelmiin liittyvän tutkimustiedon hallinta auttaa meitä rajaamaan pois ne testit, joiden luotettavuus ja pätevyys on osoitettu riittämättömäksi. Tutkimustieto ei kuitenkaan yksistään riitä, vaan testien suorittamista pitää harjoitella virhelähteiden vähentämiseksi. Tulosten tulkinta ja hyödyntäminen edellyttävät sekä vaivan että asiakkaan yksilöllisen tilanteen ymmärtämistä.

Tunne testisi ja käytä niitä vain, jos ymmärrät mitä testi testaa ja kuinka luotettavasti, ja osaat perustella miten ne muuttavat toimintaasi. Tämä pohdinta johtaa todennäköisesti tutkimisen yksinkertaistumiseen ja nopeutumiseen, sillä ainakin tämän blogin kirjoittajien osalta aiheen äärelle pysähtyminen on karsinut suuren osan muistikuormitustakin aiheuttaneesta testipatteristosta pois, ja ohjannut keskittymään asiakkaan kannalta merkityksellisiin ongelmiin.

Julius Luomajoki

Fysioterapeutti (YAMK), OMT

Riikka Holopainen

Fysioterapeutti, TtT

Sami Tarnanen

Fysioterapeutti, TtT

Kirjallisuutta

Benjaminse A, Gokeler A, van der Schans CP. Clinical diagnosis of an anterior cruciate ligament rupture: a meta-analysis. J Orthop Sports Phys Ther. 2006 May;36(5):267-88.

Bonazza NA, Smuin D, Onks CA, Silvis ML, Dhawan A. Reliability, Validity, and Injury Predictive Value of the Functional Movement Screen: A Systematic Review and Meta-analysis. Am J Sports Med. 2017 Mar;45(3):725-732.

Brandt M, Danneels L, Meirezonne H, Van Oosterwijck J, Willems T, Matheve T. Clinically assessed lumbopelvic sensorimotor control tests in low back pain: are they actually valid? A systematic review according to COSMIN guidelines. Musculoskelet Sci Pract. 2024 Jun;71:102953.

Cuchna JW, Hoch MC, Hoch JM. The interrater and intrarater reliability of the functional movement screen: A systematic review with meta-analysis. Phys Ther Sport. 2016 May;19:57-65.

Gismervik SØ, Drogset JO, Granviken F, Rø M, Leivseth G. Physical examination tests of the shoulder: a systematic review and meta-analysis of diagnostic test performance. BMC Musculoskelet Disord. 2017 Jan 25;18(1):41.

Moran RW, Schneiders AG, Mason J, Sullivan SJ. Do Functional Movement Screen (FMS) composite scores predict subsequent injury? A systematic review with meta-analysis. Br J Sports Med. 2017 Dec;51(23):1661-1669.

Trinidad-Fernandez M, Gonzalez-Sanchez M, Cuesta-Vargas AI. Is a low Functional Movement Screen score (≤14/21) associated with injuries in sport? A systematic review and meta-analysis. BMJ Open Sport Exerc Med. 2019 Sep 18;5(1):e000501

Warren M, Lininger MR, Chimera NJ, Smith CA. Utility of FMS to understand injury incidence in sports: current perspectives. Open Access J Sports Med. 2018 Sep 7;9:171-182.

>> Tilaa lahjakortti