Aħbarijiet

Il-Mudell tal-Lingwa Kbira (LLM) jista’ jikteb artikli persważivi bbażati fuq kliem immedjat, jgħaddi minn eżamijiet ta’ profiċjenza professjonali, u jikteb informazzjoni faċli għall-pazjent u empatika. Madankollu, minbarra r-riskji magħrufa sew tal-finzjoni, il-fraġilità, u l-fatti mhux preċiżi fl-LLM, kwistjonijiet oħra mhux solvuti qed isiru gradwalment il-fokus, bħal mudelli tal-AI li fihom “valuri umani” potenzjalment diskriminatorji fil-ħolqien u l-użu tagħhom, u anke jekk l-LLM ma jibqax jimmanifattura kontenut u jelimina riżultati tal-output li huma ċarament ta’ ħsara, il-“valuri tal-LLM” xorta jistgħu jiddevjaw mill-valuri umani.

Għadd kbir ta’ eżempji juru kif id-dejta użata biex jitħarrġu mudelli tal-IA tikkodifika valuri individwali u soċjali, li jistgħu jissolidifikaw fil-mudell. Dawn l-eżempji jinvolvu firxa ta’ applikazzjonijiet, inkluża l-interpretazzjoni awtomatika tar-raġġi-X tas-sider, il-klassifikazzjoni tal-mard tal-ġilda, u t-teħid ta’ deċiżjonijiet algoritmiċi rigward l-allokazzjoni tar-riżorsi mediċi. Kif intqal f’artiklu reċenti fir-rivista tagħna, dejta ta’ taħriġ preġudikata tista’ tamplifika u tiżvela l-valuri u l-preġudizzji preżenti fis-soċjetà. Għall-kuntrarju, ir-riċerka wriet ukoll li l-IA tista’ tintuża biex tnaqqas il-preġudizzju. Pereżempju, ir-riċerkaturi applikaw mudelli ta’ tagħlim profond għal films tar-raġġi-X tal-irkoppa u skoprew fatturi li ma ġewx identifikati minn indikaturi standard tas-severità (ikklassifikati mir-radjoloġisti) fil-ġog tal-irkoppa, u b’hekk naqqsu d-differenzi fl-uġigħ mhux spjegat bejn pazjenti suwed u bojod.

Għalkemm aktar u aktar nies qed jirrealizzaw il-preġudizzju fil-mudelli tal-IA, speċjalment f'termini ta' dejta ta' taħriġ, ħafna punti oħra tad-dħul tal-valuri umani mhumiex jingħataw biżżejjed attenzjoni fil-proċess ta' żvilupp u skjerament tal-mudelli tal-IA. L-IA medika dan l-aħħar kisbet riżultati impressjonanti, iżda sa ċertu punt, ma kkunsidratx espliċitament il-valuri umani u l-interazzjoni tagħhom mal-valutazzjoni tar-riskju u r-raġunament probabbilistiku, u lanqas ma ġiet immudellata.

Biex nikkonkretizzaw dawn il-kunċetti astratti, immaġina li int endokrinologu li int meħtieġ tippreskrivi ormon tat-tkabbir uman rikombinanti għal tifel ta’ 8 snin li huwa taħt it-3 perċentil tal-età tiegħu. Il-livell ta’ ormon tat-tkabbir uman stimulat tat-tifel huwa taħt 2 ng/mL (valur ta’ referenza, >10 ng/mL, valur ta’ referenza għal ħafna pajjiżi barra l-Istati Uniti huwa >7 ng/mL), u l-ġene li jikkodifika l-ormon tat-tkabbir uman tiegħu skopra mutazzjonijiet rari ta’ inattivazzjoni. Aħna nemmnu li l-applikazzjoni tat-terapija bl-ormon tat-tkabbir uman hija ovvja u indiskutibbli f’dan l-ambjent kliniku.

L-applikazzjoni tat-terapija bl-ormon tat-tkabbir tal-bniedem fix-xenarji li ġejjin tista' tikkawża kontroversja: it-tul ta' tifel ta' 14-il sena dejjem kien fl-10 perċentil ta' sħabu, u l-quċċata tal-ormon tat-tkabbir tal-bniedem wara l-istimulazzjoni hija ta' 8 ng/mL. M'hemm l-ebda mutazzjonijiet funzjonali magħrufa li jistgħu jaffettwaw it-tul, u lanqas kawżi oħra magħrufa ta' statura qasira, u l-età tal-għadam tiegħu hija ta' 15-il sena (jiġifieri l-ebda dewmien fl-iżvilupp). Parti biss mill-kontroversja hija dovuta għad-differenzi fil-valuri limitu determinati minn esperti bbażati fuq għexieren ta' studji dwar il-livelli tal-ormon tat-tkabbir tal-bniedem użati għad-dijanjosi ta' defiċjenza iżolata tal-ormon tat-tkabbir. Mill-inqas daqstant kontroversja ġejja mill-bilanċ tar-riskju-benefiċċju tal-użu tat-terapija bl-ormon tat-tkabbir tal-bniedem mill-perspettivi tal-pazjenti, il-ġenituri tal-pazjenti, il-professjonisti tal-kura tas-saħħa, il-kumpaniji farmaċewtiċi, u dawk li jħallsu. L-endokrinologi pedjatriċi jistgħu jiżnu l-effetti avversi rari ta' injezzjonijiet ta' kuljum ta' ormon tat-tkabbir għal sentejn bil-probabbiltà ta' ebda tkabbir jew tkabbir minimu biss fid-daqs tal-ġisem tal-adult meta mqabbel mal-preżent. Is-subien jistgħu jemmnu li anke jekk it-tul tagħhom jista' jiżdied biss b'2 ċm, ta' min jinjetta ormon tat-tkabbir, iżda min iħallas u l-kumpanija farmaċewtika jistgħu jkollhom fehmiet differenti.

Nieħdu l-eGFR ibbażat fuq il-kreatinina bħala eżempju, li huwa indikatur tal-funzjoni renali użat ħafna għad-dijanjosi u l-istadjar tal-mard kroniku tal-kliewi, l-istabbiliment ta' kundizzjonijiet għal trapjant jew donazzjoni tal-kliewi, u d-determinazzjoni ta' kriterji ta' tnaqqis u kontraindikazzjonijiet għal ħafna mediċini bir-riċetta. L-EGFR hija ekwazzjoni ta' rigressjoni sempliċi użata biex tistma r-rata ta' filtrazzjoni glomerulari mkejla (mGFR), li hija standard ta' referenza, iżda l-metodu ta' evalwazzjoni huwa relattivament ingombranti. Din l-ekwazzjoni ta' rigressjoni ma tistax titqies bħala mudell tal-IA, iżda turi ħafna prinċipji dwar il-valuri umani u r-raġunament probabbilistiku.

L-ewwel punt tad-dħul għall-valuri umani biex jidħlu fl-eGFR huwa meta tagħżel id-dejta għall-ekwazzjonijiet tat-twaħħil. Il-kju oriġinali użat biex tfassal il-formula tal-eGFR huwa magħmul l-aktar minn parteċipanti suwed u bojod, u l-applikabbiltà tagħha għal ħafna gruppi etniċi oħra mhijiex ċara. Il-punti tad-dħul sussegwenti għall-valuri umani f'din il-formula jinkludu: l-għażla tal-eżattezza tal-mGFR bħala l-objettiv primarju għall-evalwazzjoni tal-funzjoni tal-kliewi, x'inhu livell aċċettabbli ta' eżattezza, kif titkejjel l-eżattezza, u l-użu tal-eGFR bħala limitu biex tinbeda t-teħid ta' deċiżjonijiet kliniċi (bħad-determinazzjoni tal-kundizzjonijiet għat-trapjant tal-kliewi jew il-preskrizzjoni ta' medikazzjoni). Fl-aħħar nett, meta tagħżel il-kontenut tal-mudell tad-dħul, il-valuri umani wkoll jidħlu f'din il-formula.

Pereżempju, qabel l-2021, il-linji gwida jissuġġerixxu li l-livelli tal-kreatinina fil-formula tal-eGFR jiġu aġġustati abbażi tal-età, is-sess u r-razza tal-pazjent (ikklassifikati biss bħala individwi suwed jew mhux suwed). L-aġġustament ibbażat fuq ir-razza għandu l-għan li jtejjeb l-eżattezza tal-formula tal-mGFR, iżda fl-2020, l-isptarijiet ewlenin bdew jiddubitaw l-użu tal-eGFR ibbażat fuq ir-razza, billi jiċċitaw raġunijiet bħad-dewmien tal-eliġibbiltà tal-pazjent għat-trapjant u l-konkretizzazzjoni tar-razza bħala kunċett bijoloġiku. Ir-riċerka wriet li t-tfassil ta' mudelli tal-eGFR f'termini ta' razza jista' jkollu impatti profondi u varjati fuq l-eżattezza u r-riżultati kliniċi; Għalhekk, l-iffukar selettiv fuq l-eżattezza jew l-iffukar fuq porzjon tar-riżultati jirrifletti ġudizzji ta' valur u jista' jaħbi t-teħid ta' deċiżjonijiet trasparenti. Fl-aħħar nett, il-grupp ta' ħidma nazzjonali ppropona formula ġdida li ġiet imwaħħla mill-ġdid mingħajr ma ġiet ikkunsidrata r-razza biex jiġu bbilanċjati kwistjonijiet ta' prestazzjoni u ġustizzja. Dan l-eżempju juri li anke formula klinika sempliċi għandha ħafna punti ta' dħul fil-valuri umani.

Meta mqabbel ma' formuli kliniċi b'numru żgħir biss ta' indikaturi predittivi, l-LLM jista' jikkonsisti minn biljuni sa mijiet ta' biljuni ta' parametri (piżijiet tal-mudell) jew aktar, u dan jagħmilha diffiċli biex tinftiehem. Ir-raġuni għaliex ngħidu "diffiċli biex tinftiehem" hija li fil-biċċa l-kbira tal-LLMs, il-mod eżatt kif jinkisbu risposti permezz ta' mistoqsijiet ma jistax jiġi mmappjat. In-numru ta' parametri għal GPT-4 għadu ma tħabbarx; Il-predeċessur tiegħu GPT-3 kellu 175 biljun parametru. Aktar parametri mhux bilfors ifissru kapaċitajiet aktar b'saħħithom, peress li mudelli iżgħar li jinkludu aktar ċikli komputazzjonali (bħas-serje ta' mudelli LLaMA [Large Language Model Meta AI]) jew mudelli li huma aġġustati b'mod fin ibbażati fuq feedback uman se jaħdmu aħjar minn mudelli akbar. Pereżempju, skont l-assessuri umani, il-mudell InstrumentGPT (mudell b'1.3 biljun parametru) jegħleb lil GPT-3 fl-ottimizzazzjoni tar-riżultati tal-output tal-mudell.

Id-dettalji speċifiċi tat-taħriġ tal-GPT-4 għadhom ma ġewx żvelati, iżda d-dettalji tal-mudelli tal-ġenerazzjoni preċedenti inklużi GPT-3, InstrumentGPT, u ħafna LLMs open-source oħra ġew żvelati. Illum il-ġurnata, ħafna mudelli tal-AI jiġu b'karti tal-mudell; Id-dejta tal-evalwazzjoni u s-sigurtà tal-GPT-4 ġiet ippubblikata f'karta tas-sistema simili pprovduta mill-kumpanija tal-ħolqien tal-mudelli OpenAI. Il-ħolqien tal-LLM jista' jinqasam bejn wieħed u ieħor f'żewġ stadji: l-istadju inizjali ta' qabel it-taħriġ u l-istadju ta' rfinar immirat lejn l-ottimizzazzjoni tar-riżultati tal-output tal-mudell. Fl-istadju ta' qabel it-taħriġ, il-mudell jiġi pprovdut b'korpus kbir inkluż it-test oriġinali tal-Internet biex jitħarreġ ibassar il-kelma li jmiss. Dan il-proċess apparentement sempliċi ta' "tlestija awtomatika" jipproduċi mudell fundamentali qawwi, iżda jista' jwassal ukoll għal imġieba ta' ħsara. Il-valuri umani se jidħlu fl-istadju ta' qabel it-taħriġ, inkluż l-għażla tad-dejta ta' qabel it-taħriġ għall-GPT-4 u d-deċiżjoni li jitneħħa kontenut mhux xieraq bħal kontenut pornografiku mid-dejta ta' qabel it-taħriġ. Minkejja dawn l-isforzi, il-mudell bażiku jista' xorta ma jkunx utli u lanqas kapaċi jkun fih riżultati ta' output ta' ħsara. Fl-istadju li jmiss ta' rfinar, se jitfaċċaw ħafna mġibiet utli u ta' ħsara.

Fl-istadju tal-irfinar, l-imġiba tal-mudelli tal-lingwa ħafna drabi tinbidel profondament permezz ta' irfinar sorveljat u tagħlim ta' rinfurzar ibbażat fuq feedback uman. Fl-istadju tal-irfinar sorveljat, il-persunal kuntrattur mikri jikteb eżempji ta' rispons għal kliem fil-pront u jħarreġ direttament il-mudell. Fl-istadju tat-tagħlim ta' rinfurzar ibbażat fuq feedback uman, l-evalwaturi umani jissortjaw ir-riżultati tal-output tal-mudell bħala eżempji ta' kontenut ta' input. Imbagħad japplikaw ir-riżultati tat-tqabbil ta' hawn fuq biex jitgħallmu l-"mudell ta' premju" u jtejbu aktar il-mudell permezz tat-tagħlim ta' rinfurzar. Involviment uman ta' livell baxx aqwa jista' jirfina dawn il-mudelli kbar. Pereżempju, il-mudell InstrumentGPT uża tim ta' madwar 40 persunal kuntrattur reklutat minn websajts ta' crowdsourcing u għadda minn test ta' skrinjar immirat lejn l-għażla ta' grupp ta' annotaturi li huma sensittivi għall-preferenzi ta' gruppi ta' popolazzjoni differenti.

Kif juru dawn iż-żewġ eżempji estremi, jiġifieri l-formula klinika sempliċi [eGFR] u l-LLM qawwija [GPT-4], it-teħid tad-deċiżjonijiet tal-bniedem u l-valuri umani għandhom rwol indispensabbli fit-tiswir tar-riżultati tal-mudell. Jistgħu dawn il-mudelli tal-IA jaqbdu l-valuri diversi tagħhom għall-pazjenti u t-tobba? Kif nistgħu niggwidaw pubblikament l-applikazzjoni tal-IA fil-mediċina? Kif imsemmi hawn taħt, eżami mill-ġdid tal-analiżi tad-deċiżjonijiet mediċi jista' jipprovdi soluzzjoni bbażata fuq prinċipji għal dawn il-kwistjonijiet.

L-analiżi tad-deċiżjonijiet mediċi mhijiex familjari għal ħafna kliniċisti, iżda tista' tiddistingwi bejn raġunament probabbilistiku (għal riżultati inċerti relatati mat-teħid ta' deċiżjonijiet, bħal jekk għandux jiġi amministrat ormon tat-tkabbir uman fix-xenarju kliniku kontroversjali muri fil-Figura 1) u fatturi ta' kunsiderazzjoni (għal valuri suġġettivi marbuta ma' dawn ir-riżultati, li l-valur tagħhom huwa kwantifikat bħala "utilità", bħall-valur ta' żieda ta' 2 ċm fit-tul maskili), li jipprovdu soluzzjonijiet sistematiċi għal deċiżjonijiet mediċi kumplessi. Fl-analiżi tad-deċiżjonijiet, il-kliniċisti l-ewwel iridu jiddeterminaw id-deċiżjonijiet u l-probabbiltajiet kollha possibbli assoċjati ma' kull riżultat, u mbagħad jinkorporaw l-utilità tal-pazjent (jew parti oħra) assoċjata ma' kull riżultat biex jagħżlu l-aktar għażla xierqa. Għalhekk, il-validità tal-analiżi tad-deċiżjonijiet tiddependi fuq jekk l-issettjar tar-riżultat huwiex komprensiv, kif ukoll jekk il-kejl tal-utilità u l-istima tal-probabbiltà humiex preċiżi. Idealment, dan l-approċċ jgħin biex jiżgura li d-deċiżjonijiet ikunu bbażati fuq l-evidenza u allinjati mal-preferenzi tal-pazjent, u b'hekk inaqqas id-distakk bejn id-dejta oġġettiva u l-valuri personali. Dan il-metodu ġie introdott fil-qasam mediku diversi deċennji ilu u applikat għat-teħid ta' deċiżjonijiet individwali tal-pazjent u l-valutazzjoni tas-saħħa tal-popolazzjoni, bħall-għoti ta' rakkomandazzjonijiet għall-iskrinjar tal-kanċer kolorektali lill-popolazzjoni ġenerali.

Fl-analiżi tad-deċiżjonijiet mediċi, ġew żviluppati diversi metodi biex tinkiseb l-utilità. Il-biċċa l-kbira tal-metodi tradizzjonali jiksbu valur direttament minn pazjenti individwali. L-aktar metodu sempliċi huwa li tintuża skala ta' klassifikazzjoni, fejn il-pazjenti jivvalutaw il-livell ta' preferenza tagħhom għal ċertu riżultat fuq skala diġitali (bħal skala lineari li tvarja minn 1 sa 10), bl-aktar riżultati estremi tas-saħħa (bħal saħħa sħiħa u mewt) jinsabu fiż-żewġt itruf. Il-metodu tal-iskambju tal-ħin huwa metodu ieħor użat komunement. F'dan il-metodu, il-pazjenti jeħtieġ li jieħdu deċiżjoni dwar kemm ħin b'saħħtu huma lesti li jqattgħu bi skambju għal perjodu ta' saħħa fqira. Il-metodu standard tal-logħob tal-azzard huwa metodu ieħor użat komunement biex tiġi ddeterminata l-utilità. F'dan il-metodu, il-pazjenti jiġu mistoqsija liema miż-żewġ għażliet jippreferu: jew jgħixu ċertu numru ta' snin f'saħħa normali bi probabbiltà speċifika (p) (t), u jġorru r-riskju tal-mewt bi probabbiltà ta' 1-p; Jew jaċċertaw ruħhom li jgħixu għal t snin taħt kundizzjonijiet ta' saħħa inkroċjati. Staqsi lill-pazjenti diversi drabi b'valuri-p differenti sakemm ma juru l-ebda preferenza għal xi għażla, sabiex l-utilità tkun tista' tiġi kkalkulata abbażi tar-risposti tal-pazjent.
Minbarra l-metodi użati biex jiġu identifikati l-preferenzi individwali tal-pazjenti, ġew żviluppati wkoll metodi biex tinkiseb l-utilità għall-popolazzjoni tal-pazjenti. Speċjalment diskussjonijiet fi gruppi ta’ fokus (li jġibu flimkien il-pazjenti biex jiddiskutu esperjenzi speċifiċi) jistgħu jgħinu biex jinftiehmu l-perspettivi tagħhom. Sabiex tiġi aggregata b’mod effettiv l-utilità tal-grupp, ġew proposti diversi tekniki ta’ diskussjoni strutturata fi gruppi.
Fil-prattika, l-introduzzjoni diretta tal-utilità fil-proċess ta' dijanjosi u trattament kliniku tieħu ħafna ħin. Bħala soluzzjoni, il-kwestjonarji tal-istħarriġ ġeneralment jitqassmu lil popolazzjonijiet magħżula b'mod każwali biex jinkisbu punteġġi tal-utilità fil-livell tal-popolazzjoni. Xi eżempji jinkludu l-kwestjonarju EuroQol b'5 dimensjonijiet, il-forma qasira tal-piż tal-utilità b'6 dimensjonijiet, l-Indiċi tal-Utilità tas-Saħħa, u l-għodda tal-Kwestjonarju Core 30 tal-Organizzazzjoni Ewropea għar-Riċerka u t-Trattament tal-Kanċer Speċifiku.

Ħin tal-posta: 01 ta' Ġunju 2024