Πέμπτη 18 Σεπτεμβρίου 2025 -

Delphi-2: Η τεχνητή νοημοσύνη θα «προβλέπει» την υγεία μας



Επιστήμονες από το Ευρωπαϊκό Εργαστήριο Μοριακής Βιολογίας και το Γερμανικό Κέντρο Έρευνας για τον Καρκίνο ανέπτυξαν το Delphi-2, ένα πρωτοποριακό μοντέλο τεχνητής νοημοσύνης που θα μπορεί να προβλέψει περισσότερες από 1.000 διαφορετικές παθήσεις, από Αλτσχάιμερ και καρκίνο μέχρι εμφράγματα.

Αντλώντας έμπνευση από τα μεγάλα γλωσσικά μοντέλα (LLMs) -πχ GPT-5-  επιστήμονες από το Ευρωπαϊκό Εργαστήριο Μοριακής Βιολογίας (EMBL) στο Κέιμπριτζ και το Γερμανικό Κέντρο Έρευνας για τον Καρκίνο στη Χαϊδελβέργη αναπτύσσουν το μοντέλο, με τη συμβολική ονομασία Delphi-2.

Η έρευνα δημοσιεύτηκε στο περιοδικό Nature στις 17 Σεπτεμβρίου και έχει προκαλέσει ενθουσιασμό σε επιστήμονες.

Οι δυνατότητες είναι συναρπαστικές, λέει στο Economist ο Ewan Birney, γενετιστής στο EMBL. «Νιώθω σαν παιδί σε ζαχαροπλαστείο».

Εκτός από την επισήμανση ασθενών υψηλού κινδύνου, θα μπορούσε επίσης να βοηθήσει τις υγειονομικές αρχές να κατανέμουν προϋπολογισμούς σε τομείς νόσων που ίσως χρειαστούν επιπλέον πόρους στο μέλλον.

Τα LLM εκπαιδεύονται να εντοπίζουν πρότυπα σε τεράστιους όγκους κειμένου που αντλούνται από το διαδίκτυο, πράγμα που τους επιτρέπει να επιλέγουν τη λέξη με τη μεγαλύτερη πιθανότητα να ακολουθήσει σε κάθε δεδομένη πρόταση.

Οι δημιουργοί του Delphi-2M σκέφτηκαν ότι ένα μοντέλο AI που τρέφεται με μεγάλα σύνολα δεδομένων για την ανθρώπινη υγεία θα μπορούσε να έχει παρόμοια προγνωστική ισχύ.

Σε πολλά σημεία, ο σχεδιασμός των καθιερωμένων LLMs ήταν κατάλληλος για το έργο.

Μία σημαντική προσαρμογή που απαιτήθηκε, ωστόσο, ήταν να διδαχθεί σε ένα τέτοιο μοντέλο να λαμβάνει υπόψη τον χρόνο που μεσολαβεί ανάμεσα σε γεγονότα της ζωής ενός ασθενούς.

Στο γραπτό κείμενο, οι διαδοχικές λέξεις ακολουθούν άμεσα η μία την άλλη· το ίδιο δεν ισχύει για τις διαγνώσεις στο ιστορικό ενός ασθενούς.

Η υπέρταση που ακολουθεί ένα θετικό τεστ εγκυμοσύνης, για παράδειγμα, απαιτεί διαφορετικές ερμηνείες ανάλογα με το αν τα δύο γεγονότα απέχουν εβδομάδες—οπότε η εγκυμοσύνη μπορεί να επηρεαστεί—ή χρόνια.

Αυτή η ρύθμιση επιτεύχθηκε αντικαθιστώντας το τμήμα ενός LLM που κωδικοποιεί τη θέση της λέξης με ένα που κωδικοποιεί την ηλικία του ατόμου.

Στη συνέχεια, το Delphi-2M εκπαιδεύτηκε σε δεδομένα 400.000 ατόμων από το UK Biobank, μια βάση που περιέχει, πιθανώς, το πληρέστερο σύνολο βιοϊατρικών δεδομένων παγκοσμίως.

Στο μοντέλο δόθηκαν ο χρόνος και η ακολουθία των κωδικών της διεθνούς ιατρικής συντομογραφίας που χρησιμοποιούν οι γιατροί για την καταχώριση επίσημα αναγνωρισμένων διαγνώσεων, αντιπροσωπεύοντας τις 1.256 διαφορετικές παθήσεις που εμφανίζονταν στο σύνολο δεδομένων του Biobank.

Δεδομένα από 1.9 εκ. Δανούς
Το μοντέλο στη συνέχεια ενημερώθηκε με δεδομένα από τους υπόλοιπους 100.000 συμμετέχοντες του Biobank, προτού δοκιμαστεί περαιτέρω σε δανικά αρχεία υγείας, τα οποία είναι φημισμένα για τη μακρά και λεπτομερή καταγραφή τους.

Σε αυτήν την περίπτωση, η ομάδα χρησιμοποίησε δεδομένα από 1,9 εκατ. Δανούς, που φτάνουν έως το 1978, εξασφαλίζοντας ένα πολύ πιο ποικιλόμορφο και αντιπροσωπευτικό δείγμα από αυτό του UK Biobank.

Γεγονότα που συχνά ακολουθούν συγκεκριμένα προϋπάρχοντα –πχ θάνατος από σηψαιμία-προβλέφθηκαν συχνότερα σωστά, ενώ εκείνα που προκαλούνται από πιο τυχαίους, εξωτερικούς παράγοντες, όπως το να κολλήσει κανείς έναν ιό, ήταν δυσκολότερο να προβλεφθούν.

Όπως αναφέρει ο Economist, το Delphi-2M θα πρέπει πρώτα να περάσει από μια πολύ πιο αυστηρή περίοδο δοκιμών, δίνοντας στους κλινικούς τη δυνατότητα να διερευνήσουν αν οδηγεί σε καλύτερα αποτελέσματα για τους ασθενείς τους.

Αυτή η διαδικασία μπορεί να διαρκέσει πολλά χρόνια, αλλά ήδη ακόμη και η προκαταρκτική εκδοχή του μοντέλου ήδη προσφέρει έναν πιθανό θησαυρό για τους βιολόγους, καταλήγει το βρετανικό δημοσίευμα.