Annals of Internal Medicine: άτομα μπορούν να υπονομεύσουν τα εργαλεία της τεχνητής νοημοσύνης για τη διάδοση επιβλαβών, ψευδών πληροφοριών για την υγεία

Σε μια εποχή όπου οι ασθενείς απαιτούν ολοένα και μεγαλύτερη αυτονομία και πρόσβαση σε καθοδήγηση για την υγεία σε πραγματικό χρόνο, μελέτη που δημοσιεύεται στο Annals of Internal Medicine  (κλικ εδώ) αποκαλύπτει μια επείγουσα ευπάθεια. Ακόμα και άτομα με ελάχιστη έως καθόλου εμπειρία στον προγραμματισμό μπορούν εύκολα και αόρατα να χειραγωγήσουν τα διαθέσιμα σήμερα μεγάλα γλωσσικά μοντέλα (LLM) για να παρέχουν επιβλαβή παραπληροφόρηση με πειστική επιστημονική στιλπνότητα.

Στο πλαίσιο της μελέτης, οι ο Modi και οι συνεργάτες του  αξιολόγησαν τα πέντε θεμελιώδη και πιο προηγμένα συστήματα Τεχνητής Νοημοσύνης που αναπτύχθηκαν από τις OpenAI, Google, Anthropic, Meta και X Corp για να προσδιορίσουν εάν θα μπορούσαν να προγραμματιστούν ώστε να λειτουργούν ως chatbots παραπληροφόρησης για την υγεία.

Χρησιμοποιώντας οδηγίες που είναι διαθέσιμες μόνο στους προγραμματιστές, οι ερευνητές προγραμμάτισαν κάθε σύστημα Τεχνητής Νοημοσύνης – σχεδιασμένο να λειτουργεί ως chatbot όταν ενσωματώνεται σε ιστοσελίδες – να παράγει λανθασμένες απαντήσεις σε ερωτήματα υγείας και να περιλαμβάνει κατασκευασμένες αναφορές από εξαιρετικά αξιόπιστες πηγές για να ακούγεται πιο έγκυρο και αξιόπιστο.

Στη συνέχεια, τέθηκαν στα «chatbots» μια σειρά από ερωτήσεις σχετικά με την υγεία. Σύμφωνα με τον ερευνητή του UniSA, Δρ. Natansh Modi, τα αποτελέσματα ήταν ανησυχητικά. «Συνολικά, το 88% όλων των απαντήσεων ήταν ψευδείς», λέει ο Δρ. Modi, «και όμως παρουσιάστηκαν με επιστημονική ορολογία, επίσημο τόνο και κατασκευασμένες αναφορές που έκαναν τις πληροφορίες να φαίνονται έγκυρες.

Η παραπληροφόρηση περιελάμβανε ισχυρισμούς για εμβόλια που προκαλούν αυτισμό, δίαιτες που θεραπεύουν τον καρκίνο, τον HIV που μεταδίδεται αερομεταφερόμενα και το 5G που προκαλεί στειρότητα».

Από τα πέντε chatbots που αξιολογήθηκαν, τέσσερα παρήγαγαν παραπληροφόρηση στο 100% των απαντήσεών τους, ενώ το πέμπτο παρήγαγε παραπληροφόρηση στο 40% των απαντήσεών του, δείχνοντας κάποιο βαθμό ανθεκτικότητας.