Τα εργαλεία μηχανικής εκμάθησης της αντλούν πληροφορίες από τις εικόνες κυττάρων
Δεν μπορείς να κρίνεις ένα βιβλίο από το εξώφυλλό του, ή έτσι διδασκόμαστε για τους ανθρώπους. Για τα κύτταρα, ωστόσο, αυτό είναι εκπληκτικά λιγότερο αληθινό. Χρησιμοποιώντας μεθόδους μηχανικής μάθησης παρόμοιες με εκείνες που επιτρέπουν στους υπολογιστές να αναγνωρίζουν πρόσωπα, οι βιολόγοι μπορούν να χαρακτηρίσουν μεμονωμένα κύτταρα σε στοίβες εικόνων μικροσκοπίας. Μετρώντας χιλιάδες οπτικοποιήσιμες κυτταρικές ιδιότητες - την κατανομή μιας επισημασμένης πρωτεΐνης, το σχήμα του πυρήνα, τον αριθμό των μιτοχονδρίων - οι υπολογιστές μπορούν να εξορύξουν εικόνες κυττάρων για μοτίβα που προσδιορίζουν τον τύπο κυττάρου και τα χαρακτηριστικά που σχετίζονται με την ασθένεια. Αυτό το είδος προφίλ βάσει εικόνας επιταχύνει την ανακάλυψη φαρμάκων βελτιώνοντας τον έλεγχο για ενώσεις που τροποποιούν επιθυμητά τα χαρακτηριστικά των κυττάρων.
Η Anne Carpenter, υπολογιστική βιολόγος και ανώτερη διευθύντρια της πλατφόρμας απεικόνισης του Broad Institute του Τεχνολογικού Ινστιτούτου της Μασαχουσέτης και του Πανεπιστημίου του Χάρβαρντ, είναι πρωτοπόρος αυτής της προσέγγισης στην έρευνα. Ανέπτυξε το CellProfiler, ένα ευρέως χρησιμοποιούμενο λογισμικό ανοιχτού κώδικα για τη μέτρηση φαινοτύπων (σύνολα παρατηρήσιμων χαρακτηριστικών) από εικόνες κυττάρων. Έχει αναφερθεί σε περισσότερες από 12.000 δημοσιεύσεις από την κυκλοφορία του το 2005.
Ξεκίνησε ως δευτερεύον έργο κατά τη διάρκεια της εκπαίδευσής της ως βιολόγος κυττάρων - αυτό που η Carpenter αποκαλεί «ένα μικρό κομμάτι κώδικα για να κάνει κάτι» που χρειαζόταν, το οποίο με τον καιρό εξελίχθηκε σε μια εργαλειοθήκη που και άλλοι ερευνητές βρήκαν χρήσιμο. «Όταν έφτασα στο τέλος του μεταδιδακτορικού μου, ανακάλυψα ότι θα προτιμούσα να βοηθήσω άλλους ανθρώπους να επιτύχουν την ωραία βιολογία τους φτιάχνοντας τα εργαλεία παρά να επιδιώκω τις δικές μου ιδιαίτερες βιολογικές ερωτήσεις», είπε. "Γι' αυτό κατέληξα να παραμείνω στην επιστήμη των υπολογιστών."
Υπάλληλος της Ακαδημίας Επιστημών της Μασαχουσέτης, ο Carpenter έχει λάβει το βραβείο MIRA των Εθνικών Ινστιτούτων Υγείας, καθώς και ένα βραβείο ΚΑΡΙΕΡΑ από το Εθνικό Ίδρυμα Επιστημών και ένα Βραβείο 2020 Women in Cell Biology Mid-Career Award από την American Society for Cell Biology, μεταξύ άλλων τιμά.
Ο Carpenter μίλησε με το Quanta Magazine σχετικά με τη χαρά της μετάφρασης της ακατάστατης βιολογίας σε υπολογιστικά επιλύσιμα προβλήματα, μια φιλόδοξη προσπάθεια εξέτασης φαρμάκων για 200 ασθένειες σε ένα μόνο πηγάδι και πώς οι ερευνητές που είναι ταπεινοί, περίεργοι και ικανοί να επικοινωνούν με άτομα εκτός του κλάδου τους μπορούν να δημιουργήσουν μια κουλτούρα που βελτιώνει την ποικιλομορφία της υπολογιστικής βιολογίας και της μηχανικής μάθησης. Η συνέντευξη έχει συμπυκνωθεί και επεξεργαστεί για λόγους σαφήνειας.
Οι επιστήμονες υπολογιστών έχουν εφαρμόσει τις δεξιότητές τους στη βιολογία, αλλά εσείς ακολουθήσατε τη λιγότερο συνηθισμένη διαδρομή από τη βιολογία στη μηχανική λογισμικού. Τι σας παρακίνησε;
Η μετάβαση γεννήθηκε από ανάγκη. Κατά τη διάρκεια της διδακτορικής μου εργασίας στην κυτταρική βιολογία στο Πανεπιστήμιο του Illinois, Urbana-Champaign στις αρχές της δεκαετίας του 2000, μελετούσα πώς η χρωματίνη, το σύμπλεγμα DNA και πρωτεϊνών στα ευκαρυωτικά κύτταρα, ανταποκρίνεται στα σήματα που περνούν μέσω του υποδοχέα οιστρογόνου. Αυτό απαιτούσε τη λήψη χιλιάδων εικόνων μικροσκοπίας. Θα χρειάζονταν μήνες για να γίνει χειροκίνητα. Αποφάσισα ότι θα ήταν υπέροχο αν μπορούσα να καταλάβω πώς να αυτοματοποιήσω το μικροσκόπιο.
Δεν είχα επίσημη εκπαίδευση στην επιστήμη των υπολογιστών. Χρειάστηκε περίπου ένας μήνας για να καταλάβω πώς να προγραμματίσω το μικροσκόπιο, αλλά αυτό μου εξοικονόμησε δύο μήνες από τη μη αυτόματη συλλογή εικόνων με έναν πραγματικά βαρετό τρόπο.
Δημιούργησε επίσης μια νέα πρόκληση:τώρα είχα ένα τεράστιο σωρό από εικόνες να αναλύσω. Πέρασα περισσότερους μήνες και μήνες αντιγράφοντας και επικολλώντας κώδικα, για να το καταλάβω καθώς πήγαινα.
Μόλις άρχισα να παίζω με την ανάλυση εικόνων, όμως, κόλλησα. Ήταν τόσο ικανοποιητικό που μπορούσα να μετατρέψω την ακατάστατη, ποιοτική βιολογία σε ακριβείς, ποσοτικούς αριθμούς. Αποφάσισα να αναζητήσω μια μεταδιδακτορική θέση όπου θα μπορούσα να επιταχύνω τη βιολογία δουλεύοντας σε απεικόνιση υψηλής απόδοσης.
Σε ένα πρόσφατο δοκίμιο περιγράφετε τη βιολογία ως «ακατάστατο» αλλά και «λογικό παζλ». Μπορείτε να μιλήσετε λίγο περισσότερο για αυτό;
Η βιολογία είναι αρκετά ακατάστατη. Είναι πραγματικά δύσκολο να καταλάβεις κάτι. Θα ελπίζατε ότι το Α ενεργοποιεί το B, το οποίο ενεργοποιεί το C, και μετά το C καταστέλλει το D, και ούτω καθεξής. Αλλά στην πραγματικότητα, υπάρχουν τόσες πολλές παράξενες, ανακριβείς σχέσεις —όπως ανατροφοδοτήσεις, πολλαπλές εισροές, εναλλακτικές πορείες— που συμβαίνουν στα κελιά.
Ωστόσο, πιστεύω επίσης ότι η βιολογία είναι ένα λογικό παζλ. Το καλύτερο που μπορούμε να κάνουμε είναι να προσπαθήσουμε να περιορίσουμε το σύστημα μοντέλου που δοκιμάζουμε. Τότε μπορούμε να το διαταράξουμε, να μετρήσουμε εισόδους και εξόδους, και ούτω καθεξής. Μπορούμε να μετατρέψουμε τη βιολογία σε ένα λιγότερο ακατάστατο πράγμα επιβάλλοντάς της πολλούς περιορισμούς.
Κατά τη διάρκεια του μεταδιδακτορικού σας στο Ινστιτούτο Whitehead, ξεκινήσατε να εργάζεστε σε αυτό που τελικά έγινε CellProfiler. Πώς το καταφέρατε;
Είχα συνειδητοποιήσει ότι χρειαζόμουν κάποιο σοβαρό νέο κώδικα για το έργο μου, έτσι απλά μπήκα και έμαθα κάποιο προγραμματισμό με δοκιμή και λάθος. Αλλά χρειαζόμουν ακόμα βοήθεια για την εφαρμογή μερικών από τους κλασικούς αλγόριθμους επεξεργασίας εικόνας. Διάβαζα ένα χαρτί και έλεγα, "Αυτό ακριβώς χρειάζομαι" — αλλά δεν είχα ιδέα πώς να μετατρέψω τις εξισώσεις του χαρτιού σε κώδικα.
Έστειλα ένα email στη λίστα μεταπτυχιακών φοιτητών στο Εργαστήριο Επιστήμης Υπολογιστών και Τεχνητής Νοημοσύνης του MIT και ρώτησα:«Θέλει κανείς να με βοηθήσει; Έχω κάποια χρήματα για τη συντροφιά». Ο Thouis (Ray) Jones απάντησε και, σε ένα Σαββατοκύριακο, εφάρμοσε τους βασικούς αλγόριθμους. Ήταν αρκετά επαναστατικοί και αποτέλεσαν τον πυρήνα του γιατί το CellProfiler έγινε τόσο επιτυχημένο:Έκανε αυτούς τους αλγόριθμους διαθέσιμους στους τελικούς χρήστες.
Με την ποσοτικοποίηση των φαινοτυπικών διαφορών σε μια ποικιλία κυττάρων σε μεγάλη κλίμακα, το CellProfiler μπορεί να χρησιμοποιηθεί για "προφίλ βάσει εικόνας". Πώς καταλήξατε στην ιδέα για αυτό;
Οι άνθρωποι έρχονταν σε εμάς και έλεγαν:«Εδώ είναι ο φανταχτερός τύπος κυττάρου μου. Εδώ είναι το ειδικό μου αντίσωμα για την επισήμανση κάποιας πρωτεΐνης στο κύτταρο. Μπορείτε να μου πείτε πόση πρωτεΐνη μου υπάρχει στον πυρήνα;» Φυσικά, με ανάλυση εικόνας, μπορούσαμε να μετρήσουμε ό,τι μας ζητούσαν.
Αλλά κοιτάζοντας τις εικόνες, θα έλεγα:«Παρατηρήσατε επίσης ότι η υφή της πρωτεΐνης αλλάζει; Ή ότι στην πραγματικότητα βρίσκεται περισσότερο στην άκρη του πυρήνα παρά στο εσωτερικό; Και βλέπουμε συνεντοπισμό μεταξύ αυτού του λεκέ και αυτού του λεκέ. Και το συνολικό σχήμα του κυττάρου αλλάζει. Έχει βιολογικά νόημα;» Υπήρχαν τόσες πολλές πληροφορίες που άφηναν οι βιολόγοι στο τραπέζι!
Τότε ήταν που εμπνεύστηκα από μια Επιστήμη του 2004 χαρτί, όπου οι ερευνητές πραγματοποίησαν προφίλ με βάση εικόνα σε κύτταρα που είχαν υποστεί επεξεργασία με διάφορα σετ ενώσεων. Έδειξαν ότι τα κύτταρα που υποβλήθηκαν σε επεξεργασία με λειτουργικά παρόμοιες ενώσεις έτειναν να μοιάζουν μεταξύ τους - οι ενώσεις είχαν παρόμοια επίδραση στο κύτταρο. Ήταν ηλεκτρισμένο. Θα μπορούσε πραγματικά να είναι ότι οι ταπεινές, όμορφες εικόνες κυττάρων φέρουν αρκετές ποσοτικές πληροφορίες για να μας πουν με ποιο φάρμακο είχαν υποβληθεί σε θεραπεία τα κύτταρα; Αυτό το έγγραφο ξεκίνησε πραγματικά το πεδίο της δημιουργίας προφίλ βάσει εικόνας.
Τι περιλαμβάνει αυτό το προφίλ;
Μετράμε ό,τι μπορούμε για την εμφάνιση του κυττάρου. Βασιζόμαστε στη βασική παρατήρηση ότι η δομή και η συνολική εμφάνιση ενός κυττάρου αντικατοπτρίζει την ιστορία του - πώς αντιμετωπίζεται από το περιβάλλον του. Εάν οι εικόνες αντικατοπτρίζουν την κατάσταση ενός κελιού, τότε αν μπορούσαμε να τις ποσοτικοποιήσουμε και να τις κλιμακώσουμε, η αναζήτηση αυτών των μοτίβων θα ήταν πολύ χρήσιμη.
Πού το πήρες από εκεί;
Επινοήσαμε το Cell Painting για να βοηθήσουμε στη συσκευασία όσο το δυνατόν περισσότερων πληροφοριών σε μια ενιαία ανάλυση, αντί να βασιζόμαστε σε οτιδήποτε αποφάσισε να χρωματίσει ειδικά ο βιολόγος. Η δοκιμασία Cell Painting χρησιμοποιεί έξι φθορίζουσες βαφές για να αποκαλύψει οκτώ κυτταρικά συστατικά ή οργανίδια:τον πυρήνα, τους πυρήνες, το κυτταροπλασματικό RNA, το ενδοπλασματικό δίκτυο, τα μιτοχόνδρια, την πλασματική μεμβράνη, το σύμπλεγμα Golgi και τον κυτταροσκελετό F-ακτίνης. Αυτό μοιάζει με μια επιτυχημένη λίστα με τις αγαπημένες βαφές των μικροσκοπίων, επειδή δείχνουν μέρη του κυττάρου που ανταποκρίνονται σε κάθε είδους στρεσογόνους παράγοντες, όπως φάρμακα ή γενετικές μεταλλάξεις.
Ωστόσο, δεν περίμενα ότι οι αναλύσεις που βασίζονται σε εικόνα θα μπορούσαν να είναι τόσο ισχυρές όσο η δημιουργία προφίλ με βάση μεταγραφές RNA ή πρωτεΐνες. Σε ένα μόνο πείραμα, μπορείτε να μετρήσετε χιλιάδες μεταγραφές ή εκατοντάδες πρωτεΐνες. Ωστόσο, έχουμε μόνο μια χούφτα λεκέδες για μια δεδομένη εικόνα. Σκέφτηκα, πόσο μακριά μπορείτε να φτάσετε;
Έχασα πολύ ύπνο τις πρώτες μέρες, προσπαθώντας να αποκλείσω τα τεχνουργήματα και να βελτιώσω τη μέθοδο και να δω αν θα άξιζε πραγματικά τον κόπο. Στη συνέχεια, όμως, η επόμενη δεκαετία περίπου έφερε ανακάλυψη μετά από ανακάλυψη με βάση τη χρήση εικόνων με τρόπο δημιουργίας προφίλ.
Σήμερα, η μηχανική εκμάθηση μπορεί να εξάγει πολλές πληροφορίες από εικόνες. Ήταν αυτοί οι αλγόριθμοι μέρος της αρχικής έκδοσης του CellProfiler που κυκλοφόρησε το 2005;
Καθόλου. Η λειτουργία του CellProfiler ήταν να μετατρέπει τις εικόνες σε αριθμούς αφήνοντας τους κλασικούς αλγόριθμους επεξεργασίας εικόνας να μετρούν τις ιδιότητες των εικόνων. Μόλις αργότερα, η μηχανική μάθηση μπήκε στο παιχνίδι με τρεις τρόπους.
Πρώτον, η μηχανική μάθηση μπορεί να βρει τα όρια των κυττάρων και άλλων υποκυτταρικών δομών. Οι αλγόριθμοι βαθιάς μάθησης είναι πλέον πιο ακριβείς, αλλά και συχνά πιο εύκολοι στην εφαρμογή από τους βιολόγους — είναι ο καλύτερος και των δύο κόσμων.
Δεύτερον, ας υποθέσουμε ότι το CellProfiler εξάγει χίλια χαρακτηριστικά ανά κελί. Εάν θέλετε να μάθετε εάν τα κύτταρα είναι μεταστατικά και εάν αυτός είναι ένας φαινότυπος που μπορείτε να αναγνωρίσετε με το μάτι, μπορείτε να χρησιμοποιήσετε την εποπτευόμενη μηχανική εκμάθηση για να διδάξετε στον υπολογιστή πώς μοιάζουν τα μεταστατικά κύτταρα και τα μη μεταστατικά κύτταρα με βάση αυτά τα χαρακτηριστικά.
Ένας τρίτος τρόπος είναι μια πολύ πρόσφατη εξέλιξη. Αντί να χρησιμοποιήσετε το CellProfiler για να αναγνωρίσετε κύτταρα και στη συνέχεια να εξαγάγετε τα χαρακτηριστικά τους, απλώς δίνετε ολόκληρη την εικόνα με όλο της το ακατέργαστο pixel σε ένα νευρωνικό δίκτυο βαθιάς μάθησης και θα εξαγάγει όλα τα είδη των χαρακτηριστικών που δεν αντιστοιχούν απαραίτητα πολύ καλά σε προκατασκευασμένες ιδέες ενός βιολόγου σχετικά με σχετικά χαρακτηριστικά, όπως το μέγεθος των κυττάρων ή το τι μπορεί να κοκκινίσει στον πυρήνα. Θεωρούμε ότι αυτό το είδος εξαγωγής χαρακτηριστικών είναι αρκετά ισχυρό.
Πώς εξοπλίστηκες στη μηχανική μάθηση, έναν τομέα που μπορεί να φαίνεται αρκετά ξένος και τρομακτικός στους βιολόγους;
Αν είχες πει στην κολεγιακή Anne, «22 χρόνια από τώρα, θα είσαι επικεφαλής μιας ερευνητικής ομάδας επικεντρωμένης στην τεχνητή νοημοσύνη», θα έλεγα ότι είσαι τρελή. Δεν θα ήταν δυνατό να γίνει αυτή η στροφή στη μηχανική μάθηση χωρίς να είχα κάνει φίλους με ειδικούς μηχανικής μάθησης — ιδιαίτερα με τον Jones.
Αφού τελειώσαμε την εκπαίδευσή μας στο MIT, ξεκινήσαμε μαζί ένα εργαστήριο στο Broad Institute το 2007 και σκεφτήκαμε πολλά για το πώς η μηχανική μάθηση θα μπορούσε να βοηθήσει τους βιολόγους. Αυτό που επέτρεψε σε αυτές τις ιδέες να διεισδύσουν και να αναπτυχθούν ήταν να πηδήξουμε και οι δύο πάνω από το φράχτη και να εξοικειωθούμε με την ορολογία και τη δύναμη και των δύο πλευρών, της βιολογίας και της επιστήμης των υπολογιστών. Είναι πραγματικά μια παραγωγική συνεργασία.
Και δεν είναι πια μόνο ο Τζόουνς. Η ομάδα μου είναι περίπου 50-50 όσον αφορά τους ανθρώπους που προέρχονται από την πλευρά της βιολογίας έναντι της υπολογιστικής πλευράς.
Είχατε μεγάλη επιτυχία στην προώθηση της διεπιστημονικής εργασίας.
Μου αρέσει να συγκεντρώνω τους ανθρώπους. Το εργαστήριό μου καλωσορίζει ανθρώπους που είναι περίεργοι και έχουν διαφορετικές ιδέες - κάπως το αντίθετο από την τοξική κουλτούρα των αδερφών τεχνολογίας όπου είναι "είμαστε σημαντικοί, κάνουμε το δικό μας και μην κάνετε ερώτηση εκτός και αν θέλετε να σας κοροϊδεύουν". Όταν συνειδητοποίησα ότι είναι δύσκολο να είσαι γυναίκα στην επιστήμη των υπολογιστών, συνειδητοποίησα αμέσως ότι είναι πολύ πιο δύσκολο να είσαι σε μια φυλετική μειονότητα στην επιστήμη γενικά.
Εστιάζουμε στο αν το άτομο έχει δεξιότητες και ενδιαφέροντα που συμπληρώνουν την ομάδα, αν είναι περίεργο για τομείς εκτός του τομέα του και αν μπορεί να επικοινωνήσει καλά με άτομα χωρίς την ίδια εκπαίδευση. Και χωρίς να προσπαθώ ρητά, το εργαστήριό μου ήταν πολύ πιο διαφορετικό από το μέσο όρο για ένα υπολογιστικό εργαστήριο σε ένα κορυφαίο ίδρυμα. Και η πλειονότητα των ανεξάρτητων εργαστηρίων που δημιουργήθηκαν από τους αποφοίτους μου διευθύνονται από γυναίκες ή άτομα από μειοψηφικές ομάδες.
Αναρωτιέμαι πόσοι άνθρωποι δεν πιστεύουν ότι είναι ρατσιστές ή σεξιστές, αλλά όταν προσλαμβάνουν είναι, όπως, "Αυτός ο τύπος μιλάει όπως εγώ, καταλαβαίνει τη γλώσσα και την ορολογία μας, καταλαβαίνει τον τομέα μας", για να μην αναφέρουμε ότι "είναι ο είδος ανθρώπου με τον οποίο θα ήθελα να πιω μια μπύρα.» Μπορείτε να δείτε πώς θα καταλήξει αυτό σε μια ομάδα που είναι ομοιογενής ως προς τα δημογραφικά στοιχεία αλλά και στην εξειδίκευση και την εμπειρία στον τομέα.
Αυτές τις μέρες, η ομάδα σας επικεντρώνεται στην ανάπτυξη εργαλείων δημιουργίας προφίλ βάσει εικόνας για να επιταχύνει την ανακάλυψη φαρμάκων. Γιατί το επιλέξατε;
Αρκετές σειρές αποδεικτικών στοιχείων βοήθησαν στη σταθεροποίηση αυτής της αποστολής. Το ένα προήλθε από πειράματα που πραγματοποιήθηκαν το 2014 που έδειξαν ότι τα προφίλ που βασίζονται σε εικόνα θα μπορούσαν να είναι εξίσου ισχυρά με τα προφίλ μεταγραφής.
Ένα άλλο περιγράφηκε στο eLife του 2017 χαρτί, όπου υπερεκφράσαμε μερικές εκατοντάδες γονίδια σε κύτταρα και διαπιστώσαμε ότι τα μισά από αυτά είχαν αντίκτυπο στη μορφολογία των κυττάρων. Ομαδοποιώντας τα γονίδια με βάση τα δεδομένα απεικόνισης, μπορείτε να δείτε σε μια όμορφη ανάλυση συστάδων τι χρειάστηκαν οι βιολόγοι δεκαετίες για να συνδυάσουν διάφορα μονοπάτια σηματοδότησης:εδώ, όλα τα γονίδια που σχετίζονται με την οδό RAS που εμπλέκεται στον καρκίνο. εκεί, τα γονίδια στο μονοπάτι Hippo που ρυθμίζει την ανάπτυξη των ιστών, και ούτω καθεξής.
Το να κοιτάξω αυτήν την οπτικοποίηση και να συνειδητοποιήσω ότι είχαμε ανασυνθέσει πολλές βιολογικές γνώσεις για αυτό το σύνολο γονιδίων σε ένα μόνο πείραμα —ίσως εργασία μερικών εβδομάδων— ήταν πραγματικά αξιοσημείωτο για μένα. Μας έκανε να αποφασίσουμε να επενδύσουμε περισσότερο χρόνο και ενέργεια για την ανάπτυξη αυτής της ερευνητικής τροχιάς.
Σε μια Χημική Βιολογία Κυττάρου του 2018 Οι ερευνητές της Janssen Pharmaceutica έβγαλαν εικόνες από παλιά πειράματα - όπου είχαν μετρήσει μόνο το ένα πράγμα που τους ένοιαζε - και διαπίστωσαν ότι συχνά υπήρχαν αρκετές πληροφορίες σε αυτές τις εικόνες για να προβλέψουν αποτελέσματα από άλλες αναλύσεις που διεξήγαγε η εταιρεία. Περίπου το 37% των αποτελεσμάτων της ανάλυσης θα μπορούσε να προβλεφθεί από τη μηχανική εκμάθηση χρησιμοποιώντας εικόνες που είχαν γύρω τους. Αυτό πραγματικά τράβηξε την προσοχή των μεγάλων φαρμακείων! Η αντικατάσταση μιας μεγάλης κλίμακας ανάλυσης φαρμάκων με ένα υπολογιστικό ερώτημα εξοικονομεί εκατομμύρια δολάρια κάθε φορά.
Σε μια κοινοπραξία που βοήθησα να ξεκινήσει το 2019, δώδεκα εταιρείες και μη κερδοσκοπικοί συνεργάτες εργάζονται για να δημιουργήσουν ένα τεράστιο σύνολο δεδομένων Cell Painting κυττάρων που έχουν υποστεί επεξεργασία με περισσότερες από 120.000 ενώσεις και υποβάλλονται σε 20.000 γενετικές διαταραχές. Ο στόχος είναι να επιταχυνθεί η ανακάλυψη φαρμάκων με τον προσδιορισμό του μηχανισμού δράσης των πιθανών φαρμάκων πριν ξεκινήσουν κλινικές δοκιμές.
Ποια είναι μερικά παραδείγματα για το πώς το προφίλ βάσει εικόνας μπορεί να βοηθήσει στην εύρεση νέων φαρμάκων;
Η Recursion Pharmaceuticals είναι η πιο μακρινή εταιρεία στη χρήση προφίλ βάσει εικόνας, με τέσσερις φαρμακευτικές ενώσεις να υποβάλλονται σε κλινικές δοκιμές. Υπηρετώ στο επιστημονικό συμβουλευτικό τους συμβούλιο. Η βασική τους προσέγγιση είναι να πουν, ας διαταράξουμε ένα γονίδιο που είναι γνωστό ότι προκαλεί μια ανθρώπινη ασθένεια και να δούμε τι συμβαίνει στα κύτταρα ως αποτέλεσμα. Και αν τα κύτταρα αλλάξουν με οποιονδήποτε μετρήσιμο τρόπο, μπορούμε να βρούμε ένα φάρμακο που θα κάνει τα κύτταρα με ανθυγιεινή εμφάνιση να επανέλθουν σε υγιή όψη;
Το έχουν πάει ένα βήμα παραπέρα. Χωρίς καν να δοκιμάσουν τα φάρμακα στα κύτταρα, μπορούν να προβλέψουν υπολογιστικά ποιοι φαινότυποι ασθένειας θα μπορούσαν να μετριαστούν από ποιες ενώσεις, με βάση προηγούμενες δοκιμές που έδειξαν την επίδραση μιας ένωσης στα κύτταρα. Γνωρίζω ότι αυτή η στρατηγική λειτουργεί, επειδή το εργαστήριό μου εργάζεται για το ίδιο πράγμα σε ένα έργο που μόλις προεκτυπώσαμε, αν και χρησιμοποιώντας σχετικά πρωτόγονες υπολογιστικές τεχνικές.
Συνεργάζομαι με τον Paul Blainey στο MIT και τον J.T. Neal στο Ινστιτούτο Broad σχετικά με αυτήν την τεχνική γενετικής γραμμοκωδικοποίησης που θα μας επέτρεπε να αναμίξουμε μια δέσμη γενετικών διαταραχών στα κύτταρα και στη συνέχεια να χρησιμοποιήσουμε τη γραμμική κωδικοποίηση για να καταλάβουμε ποιο κύτταρο πήρε ποιο γενετικό αντιδραστήριο. Αυτό μας επιτρέπει να αναμίξουμε μαζί 200 φυσιολογικές και 200 μεταλλαγμένες ανθρώπινες πρωτεΐνες σε ένα μόνο φρεάτιο που μπορούμε να αντιμετωπίσουμε με ένα φάρμακο. Για κάθε φρεάτιο, δοκιμάζουμε εάν αυτό το φάρμακο είναι χρήσιμο για οποιαδήποτε από αυτές τις 200 ασθένειες. Επομένως, είναι 200 φορές φθηνότερο από το να κάνετε 200 ατομικές εξετάσεις φαρμάκων.
Πήραμε εσωτερική χρηματοδότηση για να κάνουμε ένα πιλοτικό με 80 φάρμακα και αναζητούμε χρηματοδότηση για να δοκιμάσουμε περίπου 6.800 φάρμακα. Εάν το κάνουμε αυτό καλά, μπορεί περίπου σε ένα χρόνο από τώρα, το αποτέλεσμα αυτού του πειράματος να προτείνει πραγματικά φάρμακα για αυτές τις διαταραχές που οι γιατροί θα μπορούσαν να συνταγογραφήσουν αφού διαβάσουν την εργασία μας.
Τι σας ενθουσιάζει σχετικά με το μέλλον του προφίλ βάσει εικόνας στη βιοϊατρική έρευνα — και ίσως ευρύτερα, για το μέλλον της τεχνητής νοημοσύνης σε αυτό το πεδίο;
Βρισκόμαστε ήδη στο σημείο όπου η εφαρμογή υφιστάμενων μεθόδων μηχανικής μάθησης βελτιώνει τη διαδικασία ανακάλυψης φαρμάκων. Αλλά μπορώ να δω ένα μέλλον, πέρα από τις τρέχουσες δυνατότητες του προφίλ βάσει εικόνας, όπου θα αρχίσετε να κερδίζετε εκθετικά, με άλματα.
Όλοι οι αλγόριθμοι μηχανικής μάθησης που χρησιμοποιούμε αναπτύχθηκαν για τα μέσα κοινωνικής δικτύωσης για τον εντοπισμό προσώπων και για τα χρηματοπιστωτικά ιδρύματα για τον εντοπισμό ασυνήθιστων συναλλαγών — κάτι τέτοιο. Νομίζω ότι το να δώσουμε περισσότερη προσοχή σε βιολογικούς τομείς και κυτταρικές εικόνες θα μπορούσε πραγματικά να προχωρήσει πιο γρήγορα.