Anonim

Üdvözöljük az Impact Factor-ban, a heti adag kommentárjában egy új orvosi vizsgálatban. Dr. F. Perry Wilson vagyok.

Ezen a héten egy új számítógépes algoritmus megkísérli a keresztmetszeti vizsgálatokat longitudinálissá tenni, hogy új betekintést nyújtson neurodegeneratív betegségekbe, például az Alzheimer-kórba. A kézirat, amely megjelenik az Agy folyóiratban, új gépi tanulási technika születését eredményezheti, amely átalakíthatja a mezőt.

De nem vagyok teljesen meggyőződve.

Sétáljunk rajta keresztül.

A neurodegeneratív betegségek kutatásának egyik fő problémája a nagy longitudinális adatkészletek hiánya. Ha az erőforrások korlátlanok lennének, évtizedek óta követhetjük több tízezer ember vérgén-expressziós profilját, megnézhetjük, ki fejti ki a neurodegeneratív betegségeket, és alaposan megismerjük a gén expressziójának hosszanti irányú változásait, amelyek a betegséget előidézhetik. Ez az információ nem csak egy új prognosztikai eszközt adhat nekünk, hanem a terápiás célokat is meghatározhatja.

Természetesen nincs korlátlan forrás. A legtöbb neurodegeneratív betegségre vonatkozó adatkészlet keresztmetszeti vagy csaknem ilyen - adatgyűjtések egyetlen időpontban, alkalmanként kiegészítve a posztmortem boncolási vizsgálatokkal.

A McGill Egyetemen Yasser Iturria-Medina vezette kutatók eltérő megközelítést alkalmaztak. Mi lenne, ha a gépi tanulás erejét ki lehetne használni a keresztmetszeti adatok longitudinális adatokké történő átalakításához?

Ez egy bonyolult ötlet, de alapvetően a vérből vett gén expressziós profilokat és boncolási esetekben a neurodegeneratív betegségben szenvedők és egészséges, idős kontrollok agyait vették fel. Az összes adatot egy számítógépes algoritmusba adagolva megkérdezték a gépet, hogy keresse meg, mely génátírások hajlamosak összeilleszkedni.

Most itt kell bevezetnünk néhány gépi tanulási zsargont. A cikk ezt a megközelítést "felügyelet nélkül" írja le. Lát? Itt van a kulcsszavakban.

Image

Ez azt jelenti, hogy a génadatokat további információk nélkül bemutatták az algoritmusnak - például hogy a demencia milyen súlyos volt. Az algoritmusnak csak azt kellett kitalálnia, hogy mely gének lógnak össze anélkül, hogy tudnák, hogy ezek hogyan kapcsolódnak a betegséghez. Ez nagyon fontos, mert ha nem felügyelt módszert használ a génexpresszió klaszterezéséhez, és később bemutatja, hogy ezek a klaszterek előrejelzik a betegség súlyosságát, akkor igazán erős érve van, hogy valami alapvető dolgot fedez fel a betegség folyamatában.

A szerzők itt próbálták megmutatni. Az algoritmus kiképzése után mindegyik beteget meg lehet térképezni, hogy az egydimenziós térben mekkora legyen - mennyire közel állnak az egészséges kontrollokban megfigyelt mintához, összehasonlítva azzal, hogy milyen közel állnak a neurodegeneratív betegségekben megfigyelt mintákhoz.

Image

Feltételezve, hogy a neurodegeneratív betegség lassan fejlődik egészségi állapotról előrehaladott betegségre, ez a térkép tükrözi az időt - vagy amint azt a kutatók nevezik - álnévnek.

Más szavakkal, ha megvizsgálnák az egyén gén expressziós profilját, meg tudnák mondani, milyen messzire ment a betegség útja mentén az a személy. Az álnevek álnév alapján történő sorba állítása lehetővé teszi álnév-hosszanti kohort tanulmány készítését, és esetleg valami alapvető tudnivalót megtanulhat a betegségről.

És úgy tűnik, hogy működik.

Ezek a pszeudotime becslések szorosan összefüggenek a betegség súlyosságával a PET-vizsgálatok eredményei és a posztmortem agyi patológia tekintetében. A különböző kognitív tesztek teljesítményével is összekapcsolódtak, bár nem annyira erősen.

Ez mind nagyon jó, de még nem hajlandó inni a szuper Kool-Aid-t.

Mindenekelőtt a bemutatott technika kohorsz-specifikusnak tűnik. Más szavakkal, nem azonosítottak egy univerzális gén expressziós profilt, amelyet bárki számára alkalmazhatnának, hogy megfigyeljék, hol vannak a demencia útján. Például egy kohorszban ez a technika 845 nagy befolyással bíró gént azonosított. Egy másik esetben 416 befolyásoló gént azonosítottak. Ez azt jelenti, hogy valószínűtlen, hogy hamarosan látni fog egy laboratóriumi tesztet, amely kihasználja ezt a technikát.

A másik probléma finomabb. Az a tény, hogy az új „álnév” konstrukció korrelál a betegség állapotával és a progresszióval, az igazi kitörési eredmény. De ez csak annyira kényszerítő, mert a szerzők azt állítják, hogy a gépi tanulási modell "felügyelet nélküli" volt.

De ez nem volt teljesen igaz. Azokat a kontroll betegeket, akik elengedhetetlenek a normál öregedés zajának kiküszöböléséhez, ilyenként jelölték meg, a Dr. Iturria-Medina-val folytatott levelezés alapján. Az algoritmus a kezdetektől fogva tudta, hogy ki volt kontroll és ki beteg. Megkérdeztem Dr. Iturria-Medintól, hogy ez méltányos-e, ezt nevezzék felügyelet nélküli modellnek. Írta: "Valószínűleg, a perspektíva függvényében, a" félig nem felügyelt "helyesebb besorolást jelenthet."

De a szerzők ezt nem említik a cikkben. Valójában elhagyják magukat, és rámutatnak, hogy a modell felügyelet nélküli jellege különös erőt jelent, mivel "garantálja, hogy … hiányoznak az adatok".

És ez igaz, ha a modell valóban felügyelet nélküli. Mivel azonban kissé felügyelték, most esélyünk van arra, hogy az álnév és a különféle betegségek kimenetelei között megfigyelt szoros kapcsolatokat nem a biológia, hanem a képzési adatok túlteljesítése vezérli.

Mindezt könnyen meg lehet határozni, ha a modellt alkalmazzák egy megtartott tesztkészletre, de erre nem került sor.

Világossá szeretném tenni: ez nem érvényteleníti az eredményeket, de azt jelenti, hogy szigorúan kiállított tesztkészletekkel látnunk kell más replikációkat más csoportokban, mielőtt igazán biztosak lehetünk abban, hogy az algoritmus valamit megtanul a betegségről és nem csak az adatkészlet, amelyben kifejlesztették.

Csodálatos új világban vagyunk, ahol az adattudomány új betekintést ígér a betegségbe, ám ez nagyon bonyolult, és a tanulmánytervezés finom variációi nagy következményekkel járhatnak az értelmezésre. Sokan, köztük magam is, még mindig megtanulják, hogyan kell ilyen módon értelmezni a tanulmányokat. A gépi tanulási algoritmusok lehet, hogy még nem olyan bonyolultak, mint az emberi agy, de elég bonyolultak, hogy e tanulmányok megértése messze nem intuitív.

Perry Wilson, MD, MD, az orvostudomány egyetemi docens és a Yale alkalmazott alkalmazott transzlációs kutatási programjának igazgatója. Tudományos kommunikációs munkája megtalálható a Huffington Postban, az NPR-en és itt a Medscape-en. Tweetet küld a @methodsmanmd-nek, és kommunikációs munkájának tárházát tárolja a www.methodsman.com webhelyen.

Kövesse a Medscape-t a Facebook-on, a Twitter-en, az Instagram-on és a YouTube-on