16 Νοεμβρίου 2025

AMIE: Ένα ερευνητικό σύστημα τεχνητής νοημοσύνης για διαγνωστικούς ιατρικούς συλλογισμούς και συνομιλίες

 

Περίληψη άρθρου:

Η Google Research έχει αναπτύξει ένα σύστημα τεχνητής νοημοσύνης με την ονομασία Articulate Medical Intelligence Explorer (AMIE) που στοχεύει στη βελτίωση της διαγνωστικής συλλογιστικής και των συνομιλιών μεταξύ κλινικών γιατρών και ασθενών. Το AMIE βασίζεται σε μεγάλα γλωσσικά μοντέλα (LLM) και εκπαιδεύτηκε και αξιολογήθηκε σε διάφορες διαστάσεις κλινικών διαβουλεύσεων. Για να ξεπεραστούν οι περιορισμοί στα δεδομένα εκπαίδευσης, δημιουργήθηκε ένα προσομοιωμένο περιβάλλον διαγνωστικών διαλόγων, επιτρέποντας στον AMIE να μαθαίνει τόσο από δεδομένα του πραγματικού κόσμου όσο και από προσομοιωμένους διαλόγους. Η αξιολόγηση του AMIE περιελάμβανε τη σύγκριση της απόδοσής του με εκείνη των πιστοποιημένων ιατρών πρωτοβάθμιας περίθαλψης σε διαβουλεύσεις με βάση το κείμενο με προσομοιωμένους ασθενείς. Αν και υπάρχουν περιορισμοί σε αυτή την έρευνα, παρέχει πληροφορίες σχετικά με τις δυνατότητες των συστημάτων τεχνητής νοημοσύνης στις διαγνωστικές συνομιλίες.

 

Κύρια σημεία του άρθρου:

  • Η συνομιλία γιατρού-ασθενούς είναι σημαντική στην ιατρική και τα συστήματα τεχνητής νοημοσύνης θα μπορούσαν να βελτιώσουν τη φροντίδα βοηθώντας τους διαγνωστικούς διαλόγους.
  • Τα μεγάλα γλωσσικά μοντέλα (LLM) έχουν επιδείξει πρόοδο στη διεξαγωγή πλούσιων συνομιλιών, αλλά υπάρχουν μοναδικές πτυχές του ιατρικού διαγνωστικού διαλόγου που πρέπει να αντιμετωπιστούν.
  • Οι ερευνητές ανέπτυξαν το AMIE, ένα σύστημα τεχνητής νοημοσύνης που βασίζεται σε ένα LLM βελτιστοποιημένο για διαγνωστικούς συλλογισμούς και συνομιλίες.
  • Εκπαίδευσαν και αξιολόγησαν το AMIE χρησιμοποιώντας ένα προσομοιωμένο περιβάλλον διαγνωστικού διαλόγου και μια στρατηγική αλυσίδας συλλογισμών σε χρόνο συμπερασμού.
  • Δημιούργησαν επίσης μια ρουμπρίκα αξιολόγησης για την αξιολόγηση των διαγνωστικών συνομιλιών και διεξήγαγαν μια μελέτη σύγκρισης του AMIE με τους ιατρούς πρωτοβάθμιας περίθαλψης (PCP).
  • Η μελέτη έδειξε ότι το AMIE είχε αυτόνομη απόδοση που υπερέβαινε τους μη υποβοηθούμενους κλινικούς ιατρούς και βελτίωσε την ακρίβεια των διαγνώσεων των κλινικών ιατρών όταν χρησιμοποιούνταν ως βοήθημα.

 

Αναλυτικά το άρθρο:

Δημοσιεύτηκε από τους Alan Karthikesalingam και Vivek Natarajan, Research Leads, Google Research

Η συζήτηση μεταξύ ιατρού και ασθενούς αποτελεί ακρογωνιαίο λίθο της ιατρικής, όπου η εξειδικευμένη και σκόπιμη επικοινωνία οδηγεί στη διάγνωση, τη διαχείριση, την ενσυναίσθηση και την εμπιστοσύνη. Τα συστήματα τεχνητής νοημοσύνης που είναι ικανά για τέτοιους διαγνωστικούς διαλόγους θα μπορούσαν να αυξήσουν τη διαθεσιμότητα, την προσβασιμότητα, την ποιότητα και τη συνέπεια της περίθαλψης, αποτελώντας χρήσιμους συνομιλητές τόσο για τους ιατρούς όσο και για τους ασθενείς. Όμως, η προσέγγιση της σημαντικής τεχνογνωσίας των κλινικών ιατρών αποτελεί σημαντική πρόκληση.

Η πρόσφατη πρόοδος στα μεγάλα γλωσσικά μοντέλα (LLM) εκτός του ιατρικού τομέα έχει δείξει ότι μπορούν να σχεδιάζουν, να αιτιολογούν και να χρησιμοποιούν το σχετικό πλαίσιο για να διεξάγουν πλούσιες συνομιλίες. Ωστόσο, υπάρχουν πολλές πτυχές του καλού διαγνωστικού διαλόγου που είναι μοναδικές στον ιατρικό τομέα. Ένας αποτελεσματικός κλινικός ιατρός λαμβάνει ένα πλήρες "κλινικό ιστορικό" και θέτει έξυπνες ερωτήσεις που βοηθούν στην εξαγωγή μιας διαφορικής διάγνωσης. Ασκεί σημαντικές δεξιότητες ώστε να καλλιεργεί μια αποτελεσματική σχέση, να παρέχει πληροφορίες με σαφήνεια, να λαμβάνει κοινές και τεκμηριωμένες αποφάσεις με τον ασθενή, να ανταποκρίνεται με ενσυναίσθηση στα συναισθήματά του και να τον υποστηρίζει στα επόμενα βήματα της φροντίδας. Ενώ οι LLM μπορούν να εκτελούν με ακρίβεια εργασίες όπως η ιατρική περίληψη ή η απάντηση σε ιατρικές ερωτήσεις, έχει γίνει ελάχιστη εργασία που στοχεύει ειδικά στην ανάπτυξη τέτοιου είδους διαγνωστικών ικανοτήτων συνομιλίας.

Εμπνευσμένοι από αυτή την πρόκληση, αναπτύξαμε το Articulate Medical Intelligence Explorer (AMIE), ένα ερευνητικό σύστημα τεχνητής νοημοσύνης βασισμένο σε ένα LLM και βελτιστοποιημένο για διαγνωστικούς συλλογισμούς και συνομιλίες. Εκπαιδεύσαμε και αξιολογήσαμε το AMIE κατά μήκος πολλών διαστάσεων που αντικατοπτρίζουν την ποιότητα σε πραγματικές κλινικές διαβουλεύσεις από την οπτική γωνία τόσο των κλινικών ιατρών όσο και των ασθενών. Για την κλιμάκωση του AMIE σε ένα πλήθος παθήσεων, ειδικοτήτων και σεναρίων, αναπτύξαμε ένα νέο περιβάλλον προσομοίωσης διαγνωστικών διαλόγων με βάση το αυτοπαιχνίδι, με αυτοματοποιημένους μηχανισμούς ανατροφοδότησης για τον εμπλουτισμό και την επιτάχυνση της διαδικασίας εκμάθησής του. Εισάγαμε επίσης μια στρατηγική αλυσίδας συλλογισμών σε χρόνο συμπερασμού για να βελτιώσουμε τη διαγνωστική ακρίβεια και την ποιότητα της συνομιλίας του AMIE. Τέλος, δοκιμάσαμε το AMIE προοπτικά σε πραγματικά παραδείγματα διαλόγου πολλαπλών στροφών προσομοιώνοντας διαβουλεύσεις με εκπαιδευμένους ηθοποιούς.

 

Αξιολόγηση της διαγνωστικής τεχνητής νοημοσύνης μέσω συνομιλίας

Εκτός από την ανάπτυξη και τη βελτιστοποίηση των ίδιων των συστημάτων ΤΝ για διαγνωστικές συζητήσεις, ο τρόπος αξιολόγησης αυτών των συστημάτων είναι επίσης ένα ανοικτό ζήτημα. Εμπνευσμένοι από αποδεκτά εργαλεία που χρησιμοποιούνται για τη μέτρηση της ποιότητας των διαβουλεύσεων και των δεξιοτήτων κλινικής επικοινωνίας σε πραγματικές συνθήκες, κατασκευάσαμε μια πιλοτική ρουμπρίκα αξιολόγησης για την αξιολόγηση των διαγνωστικών συνομιλιών σε άξονες που αφορούν τη λήψη ιστορικού, τη διαγνωστική ακρίβεια, την κλινική διαχείριση, τις δεξιότητες κλινικής επικοινωνίας, την καλλιέργεια σχέσεων και την ενσυναίσθηση.

Στη συνέχεια σχεδιάσαμε μια τυχαιοποιημένη, διπλά τυφλή διασταυρούμενη μελέτη διαβουλεύσεων με βάση το κείμενο με επικυρωμένους φορείς ασθενών που αλληλεπιδρούν είτε με πιστοποιημένους ιατρούς πρωτοβάθμιας περίθαλψης (PCP) είτε με το σύστημα ΤΝ που έχει βελτιστοποιηθεί για διαγνωστικό διάλογο. Διαμορφώσαμε τις διαβουλεύσεις μας στο στυλ μιας αντικειμενικής δομημένης κλινικής εξέτασης (ΟΑΣΕ), μιας πρακτικής αξιολόγησης που χρησιμοποιείται συνήθως στον πραγματικό κόσμο για την εξέταση των δεξιοτήτων και των ικανοτήτων των κλινικών ιατρών με τυποποιημένο και αντικειμενικό τρόπο. Σε έναν τυπικό ΟΑΣΕ, οι κλινικοί ιατροί μπορεί να εναλλάσσονται σε πολλαπλούς σταθμούς, καθένας από τους οποίους προσομοιώνει ένα πραγματικό κλινικό σενάριο, όπου εκτελούν καθήκοντα όπως η διεξαγωγή μιας διαβούλευσης με έναν τυποποιημένο ασθενή-φορέα (που έχει εκπαιδευτεί προσεκτικά για να μιμείται έναν ασθενή με μια συγκεκριμένη πάθηση).

Οι διαβουλεύσεις διεξήχθησαν με τη χρήση ενός εργαλείου σύγχρονης συνομιλίας κειμένου, μιμούμενοι τη διεπαφή που είναι οικεία στους περισσότερους καταναλωτές που χρησιμοποιούν σήμερα LLMs.

 

AMIE: ένα διαγνωστικό διαγνωστικό ερευνητικό σύστημα τεχνητής νοημοσύνης με βάση το LLM

Εκπαιδεύσαμε το AMIE σε σύνολα δεδομένων του πραγματικού κόσμου που περιλαμβάνουν ιατρική συλλογιστική, ιατρική περίληψη και πραγματικές κλινικές συνομιλίες.

Είναι εφικτή η εκπαίδευση των LLMs χρησιμοποιώντας διαλόγους του πραγματικού κόσμου που αναπτύσσονται με παθητική συλλογή και απομαγνητοφώνηση προσωπικών κλινικών επισκέψεων, ωστόσο, δύο σημαντικές προκλήσεις περιορίζουν την αποτελεσματικότητά τους στην εκπαίδευση LLMs για ιατρικές συνομιλίες.

Πρώτον, τα υπάρχοντα δεδομένα του πραγματικού κόσμου συχνά αποτυγχάνουν να αποτυπώσουν το τεράστιο εύρος των ιατρικών καταστάσεων και σεναρίων, εμποδίζοντας την επεκτασιμότητα και την πληρότητα.

Δεύτερον, τα δεδομένα που προέρχονται από αντίγραφα διαλόγων του πραγματικού κόσμου τείνουν να είναι θορυβώδη, περιέχοντας διφορούμενη γλώσσα (συμπεριλαμβανομένης της αργκό, της αργκό, του χιούμορ και του σαρκασμού), διακοπές, ανορθόγραφα εκφωνήματα και έμμεσες αναφορές.

Για να αντιμετωπίσουμε αυτούς τους περιορισμούς, σχεδιάσαμε ένα περιβάλλον προσομοίωσης μάθησης με αυτοματοποιημένους μηχανισμούς ανατροφοδότησης για διαγνωστικό ιατρικό διάλογο σε ένα εικονικό περιβάλλον περίθαλψης, επιτρέποντάς μας να επεκτείνουμε τις γνώσεις και τις δυνατότητες του AMIE σε πολλές ιατρικές καταστάσεις και πλαίσια. Χρησιμοποιήσαμε αυτό το περιβάλλον για την επαναληπτική τελειοποίηση του AMIE με ένα εξελισσόμενο σύνολο προσομοιωμένων διαλόγων εκτός από το στατικό σώμα δεδομένων του πραγματικού κόσμου που περιγράφηκε.

Αυτή η διαδικασία αποτελούνταν από δύο βρόχους αυτο-παιξίματος: (1) έναν "εσωτερικό" βρόχο αυτο-παιξίματος, όπου το AMIE αξιοποιούσε την ανατροφοδότηση των κριτικών στο πλαίσιο για να βελτιώσει τη συμπεριφορά του σε προσομοιωμένες συνομιλίες με έναν προσομοιωτή ασθενούς τεχνητής νοημοσύνης και (2) έναν "εξωτερικό" βρόχο αυτο-παιξίματος όπου το σύνολο των βελτιωμένων προσομοιωμένων διαλόγων ενσωματώνονταν σε επόμενες επαναλήψεις τελειοποίησης. Η προκύπτουσα νέα έκδοση του AMIE μπορούσε στη συνέχεια να συμμετάσχει ξανά στον εσωτερικό βρόχο, δημιουργώντας έναν ενάρετο συνεχή κύκλο μάθησης.

Επιπλέον, χρησιμοποιήσαμε επίσης μια στρατηγική αλυσίδας συλλογισμών σε χρόνο συμπερασμού, η οποία επέτρεψε στον AMIE να βελτιώσει σταδιακά την απάντησή του ανάλογα με την τρέχουσα συζήτηση, ώστε να καταλήξει σε μια τεκμηριωμένη και τεκμηριωμένη απάντηση.

Δοκιμάσαμε τις επιδόσεις σε διαβουλεύσεις με προσομοιωμένους ασθενείς (που υποδύθηκαν εκπαιδευμένοι ηθοποιοί), σε σύγκριση με εκείνες που πραγματοποιήθηκαν από 20 πραγματικούς PCP χρησιμοποιώντας την τυχαιοποιημένη προσέγγιση που περιγράφηκε παραπάνω. Η AMIE και οι PCP αξιολογήθηκαν από την οπτική γωνία τόσο των εξειδικευμένων θεραπόντων ιατρών όσο και των προσομοιωμένων ασθενών μας σε μια τυχαιοποιημένη, τυφλή διασταυρούμενη μελέτη που περιλάμβανε 149 σενάρια περιπτώσεων από παρόχους ΟΑΣΕ στον Καναδά, το Ηνωμένο Βασίλειο και την Ινδία σε ένα ευρύ φάσμα ειδικοτήτων και ασθενειών.

Αξίζει να σημειωθεί ότι η μελέτη μας δεν σχεδιάστηκε για να μιμηθεί ούτε τις παραδοσιακές προσωπικές αξιολογήσεις ΟΑΣΕ ούτε τους τρόπους με τους οποίους οι κλινικοί ιατροί χρησιμοποιούν συνήθως το κείμενο, το ηλεκτρονικό ταχυδρομείο, τη συνομιλία ή την τηλεϊατρική. Αντ' αυτού, το πείραμά μας αντικατόπτριζε τον πιο συνηθισμένο τρόπο με τον οποίο οι καταναλωτές αλληλεπιδρούν σήμερα με τα LLM, έναν δυνητικά κλιμακούμενο και οικείο μηχανισμό για τα συστήματα ΤΝ για τη συμμετοχή σε διαγνωστικό διάλογο εξ αποστάσεως.

 

Περιορισμοί

Η έρευνά μας έχει αρκετούς περιορισμούς και θα πρέπει να ερμηνεύεται με τη δέουσα προσοχή. Πρώτον, η τεχνική αξιολόγησης που χρησιμοποιήσαμε πιθανώς υποτιμά την αξία των ανθρώπινων συνομιλιών στον πραγματικό κόσμο, καθώς οι κλινικοί γιατροί στη μελέτη μας περιορίστηκαν σε μια άγνωστη διεπαφή συνομιλίας κειμένου, η οποία επιτρέπει αλληλεπιδράσεις μεγάλης κλίμακας LLM-ασθενή, αλλά δεν είναι αντιπροσωπευτική της συνήθους κλινικής πρακτικής. Δεύτερον, οποιαδήποτε έρευνα αυτού του τύπου πρέπει να θεωρείται μόνο ως ένα πρώτο διερευνητικό βήμα σε ένα μακρύ ταξίδι. Η μετάβαση από ένα ερευνητικό πρωτότυπο LLM που αξιολογήσαμε σε αυτή τη μελέτη σε ένα ασφαλές και ισχυρό εργαλείο που θα μπορούσε να χρησιμοποιηθεί από τους ανθρώπους και εκείνους που τους παρέχουν φροντίδα θα απαιτήσει σημαντική πρόσθετη έρευνα. Υπάρχουν πολλοί σημαντικοί περιορισμοί που πρέπει να αντιμετωπιστούν, συμπεριλαμβανομένης της πειραματικής απόδοσης υπό πραγματικούς περιορισμούς και της αποκλειστικής διερεύνησης σημαντικών θεμάτων όπως η ισότητα και η δικαιοσύνη στην υγεία, η ιδιωτικότητα, η ευρωστία και πολλά άλλα, για να διασφαλιστεί η ασφάλεια και η αξιοπιστία της τεχνολογίας.

 

Το AMIE ως βοήθημα για τους κλινικούς ιατρούς

Σε ένα πρόσφατα δημοσιευμένο προδημοσίευμα, αξιολογήσαμε την ικανότητα μιας προηγούμενης επανάληψης του συστήματος AMIE να παράγει ένα DDx μόνο του ή ως βοήθημα για τους κλινικούς γιατρούς. Είκοσι (20) γενικοί κλινικοί ιατροί αξιολόγησαν 303 δύσκολες, πραγματικές ιατρικές περιπτώσεις που προήλθαν από τα κλινικοπαθολογικά συνέδρια (CPCs) του New England Journal of Medicine (NEJM). Κάθε αναφορά περίπτωσης διαβάστηκε από δύο κλινικούς ιατρούς που τυχαιοποιήθηκαν σε μία από τις δύο συνθήκες υποβοήθησης: είτε βοήθεια από μηχανές αναζήτησης και τυποποιημένες ιατρικές πηγές, είτε βοήθεια AMIE επιπλέον αυτών των εργαλείων. Όλοι οι κλινικοί ιατροί παρείχαν ένα βασικό, μη υποβοηθούμενο DDx πριν από τη χρήση των αντίστοιχων βοηθητικών εργαλείων.

Το AMIE παρουσίασε αυτόνομη απόδοση που υπερέβη εκείνη των κλινικών ιατρών χωρίς βοήθεια (ακρίβεια στην πρώτη δεκάδα 59,1% έναντι 33,6%, p=0,04). Συγκρίνοντας τα δύο υποβοηθούμενα σκέλη της μελέτης, η ακρίβεια στο top-10 ήταν υψηλότερη για τους κλινικούς ιατρούς που βοηθήθηκαν από το AMIE, σε σύγκριση με τους κλινικούς ιατρούς χωρίς βοήθεια από το AMIE (24,6%, p<0,01) και τους κλινικούς ιατρούς με αναζήτηση (5,45%, p=0,02). Περαιτέρω, οι κλινικοί ιατροί με τη βοήθεια του AMIE κατέληξαν σε πιο ολοκληρωμένους διαφορικούς καταλόγους από εκείνους χωρίς τη βοήθεια του AMIE.

Αξίζει να σημειωθεί ότι οι CPC του NEJM δεν είναι αντιπροσωπευτικές της καθημερινής κλινικής πρακτικής. Πρόκειται για ασυνήθιστες αναφορές περιστατικών σε μερικές εκατοντάδες μόνο άτομα, οπότε προσφέρουν περιορισμένο πεδίο για τη διερεύνηση σημαντικών ζητημάτων όπως η ισότητα ή η δικαιοσύνη.

 

Τολμηρή και υπεύθυνη έρευνα στην υγειονομική περίθαλψη - η τέχνη του εφικτού

Η πρόσβαση στην κλινική εμπειρογνωμοσύνη παραμένει σπάνια σε όλο τον κόσμο. Αν και η τεχνητή νοημοσύνη έχει δείξει μεγάλη υπόσχεση σε συγκεκριμένες κλινικές εφαρμογές, η συμμετοχή στις δυναμικές, διαλογικές διαγνωστικές διαδρομές της κλινικής πρακτικής απαιτεί πολλές δυνατότητες που δεν έχουν ακόμη επιδείξει τα συστήματα τεχνητής νοημοσύνης. Οι γιατροί διαθέτουν όχι μόνο γνώσεις και δεξιότητες αλλά και αφοσίωση σε μυριάδες αρχές, όπως η ασφάλεια και η ποιότητα, η επικοινωνία, η εταιρική και ομαδική εργασία, η εμπιστοσύνη και ο επαγγελματισμός. Η υλοποίηση αυτών των χαρακτηριστικών στα συστήματα ΤΝ είναι μια εμπνευσμένη πρόκληση που πρέπει να προσεγγιστεί με υπευθυνότητα και προσοχή. Το AMIE είναι η εξερεύνηση της "τέχνης του εφικτού", ένα αποκλειστικά ερευνητικό σύστημα για την ασφαλή διερεύνηση ενός οράματος για το μέλλον, όπου τα συστήματα ΤΝ θα μπορούσαν να ευθυγραμμιστούν καλύτερα με τα χαρακτηριστικά των εξειδικευμένων κλινικών ιατρών που τους εμπιστευόμαστε τη φροντίδα μας. Πρόκειται για μια πρώιμη πειραματική μόνο εργασία, όχι για προϊόν, και έχει αρκετούς περιορισμούς που πιστεύουμε ότι χρήζουν αυστηρών και εκτεταμένων περαιτέρω επιστημονικών μελετών προκειμένου να οραματιστούμε ένα μέλλον στο οποίο τα συνομιλητικά, ενσυναισθητικά και διαγνωστικά συστήματα τεχνητής νοημοσύνης θα μπορούσαν να γίνουν ασφαλή, χρήσιμα και προσιτά.

 

Πηγή: AMIE: A research AI system for diagnostic medical reasoning and conversations