OpenAI Αναβαθμίζει το Κορυφαίο AI Μοντέλο της με Βελτιωμένες Δεξιότητες Λογικής

Περίληψη:
Η OpenAI παρουσίασε το νέο μοντέλο τεχνητής νοημοσύνης, o3, που υπερέχει σε δεξιότητες λογικής και επίλυσης σύνθετων προβλημάτων. Το νέο μοντέλο είναι τρεις φορές καλύτερο από τον προκάτοχό του σε τομείς όπως τα μαθηματικά, η επιστήμη και ο προγραμματισμός. Η αναβάθμιση αυτή ανταγωνίζεται την πρόσφατη ανακοίνωση της Google για το μοντέλο Gemini 2.0, ενώ ενισχύει τη θέση της OpenAI στον αγώνα για καινοτομία στην τεχνητή νοημοσύνη.
Κύρια Σημεία:
- Νέο Μοντέλο: Το o3 αντικαθιστά το o1 και διαθέτει αυξημένες ικανότητες λογικής και επίλυσης προβλημάτων μέσω της μεθόδου deliberative alignment.
- Επιδόσεις: Το o3 είναι τρεις φορές πιο αποδοτικό από το o1 σε μετρήσεις όπως το ARC-AGI και κατά 20% καλύτερο στη λογική από τον προκάτοχό του.
- Ανταγωνισμός με Google: Το μοντέλο Gemini 2.0 Flash Thinking της Google διαθέτει υψηλές επιδόσεις στο SWE-Bench, αλλά το o3 φαίνεται να έχει το προβάδισμα σε πολυπλοκότερα τεστ.
- Εφαρμογές: Η OpenAI εστιάζει στη χρήση των μοντέλων για σύνθετα καθήκοντα, όπως ο προγραμματισμός και οι μαθηματικές λύσεις, ενώ αναπτύσσει καινοτομίες όπως μοντέλα βίντεο και φωνητικής πρόσβασης στο ChatGPT.
- Στρατηγική Ευθυγράμμισης: Με τη νέα προσέγγιση deliberative alignment, το μοντέλο μειώνει την πιθανότητα να παραβιάζει ηθικά ή ασφαλιστικά όρια.
- Μελλοντική Διαθεσιμότητα: Το o3 και το o3-mini θα είναι διαθέσιμα για δοκιμές σε εξωτερικούς συνεργάτες, όχι όμως για το ευρύ κοινό προς το παρόν.
Αναλυτικά:
Η OpenAI ανακοίνωσε σήμερα μια βελτιωμένη έκδοση του πιο ικανού μοντέλου τεχνητής νοημοσύνης της έως τώρα, το οποίο αφιερώνει περισσότερο χρόνο για να σκεφτεί ερωτήματα—μια μέρα μετά την ανακοίνωση της Google για το πρώτο της μοντέλο αυτού του τύπου.
Το νέο μοντέλο της OpenAI, που ονομάζεται o3, αντικαθιστά το o1, το οποίο εισήχθη τον Σεπτέμβριο. Όπως και το o1, το νέο μοντέλο αφιερώνει χρόνο για να εξετάσει ένα πρόβλημα ώστε να παρέχει καλύτερες απαντήσεις σε ερωτήματα που απαιτούν βήμα-βήμα λογική σκέψη. (Η OpenAI παρέκαμψε το όνομα “o2” επειδή είναι ήδη η ονομασία μιας εταιρείας κινητής τηλεφωνίας στο Ηνωμένο Βασίλειο.)
“Θεωρούμε ότι αυτό σηματοδοτεί την αρχή της επόμενης φάσης της τεχνητής νοημοσύνης,” δήλωσε ο Διευθύνων Σύμβουλος της OpenAI, Sam Altman, σε ζωντανή μετάδοση την Παρασκευή. “Όπου μπορείτε να χρησιμοποιήσετε αυτά τα μοντέλα για όλο και πιο σύνθετα καθήκοντα που απαιτούν πολλή λογική.”
Το μοντέλο o3 σημειώνει πολύ υψηλότερες επιδόσεις σε αρκετές μετρήσεις από τον προκάτοχό του, σύμφωνα με την OpenAI, συμπεριλαμβανομένων μετρήσεων για σύνθετες δεξιότητες προγραμματισμού, προχωρημένα μαθηματικά και επιστημονικές δεξιότητες. Είναι τρεις φορές καλύτερο από το o1 στην απάντηση ερωτήσεων που θέτει το ARC-AGI, ένα κριτήριο που δοκιμάζει την ικανότητα των μοντέλων AI να λύνουν εξαιρετικά δύσκολα μαθηματικά και λογικά προβλήματα που συναντούν για πρώτη φορά.
Ανταγωνισμός με Google
Η Google ακολουθεί μια παρόμοια γραμμή έρευνας. Ο ερευνητής της Google, Noam Shazeer, αποκάλυψε χθες σε μια ανάρτηση στο X ότι η εταιρεία ανέπτυξε το δικό της μοντέλο λογικής, που ονομάζεται Gemini 2.0 Flash Thinking. Ο Διευθύνων Σύμβουλος της Google, Sundar Pichai, το χαρακτήρισε “το πιο στοχαστικό μας μοντέλο μέχρι τώρα” σε δική του ανάρτηση. Το νέο μοντέλο της Google πέτυχε υψηλή βαθμολογία στο SWE-Bench, μια δοκιμασία που μετρά τις δυνατότητες δράσης των μοντέλων.
Ωστόσο, το νέο μοντέλο o3 της OpenAI είναι 20% καλύτερο από το o1. “Το o3 ξεπέρασε κάθε προσδοκία,” δήλωσε ο Ofir Press, μεταδιδακτορικός ερευνητής στο Πανεπιστήμιο Πρίνστον που βοήθησε στην ανάπτυξη του SWE-Bench. “Είναι μια πολύ εντυπωσιακή βελτίωση, δεν είμαι σίγουρος πώς το κατάφεραν.”
Νέες Τεχνικές Ευθυγράμμισης
Η OpenAI αποκάλυψε επίσης περισσότερες λεπτομέρειες για τις τεχνικές που χρησιμοποιήθηκαν για την ευθυγράμμιση του o1. Η νέα μέθοδος, γνωστή ως deliberative alignment, περιλαμβάνει την εκπαίδευση ενός μοντέλου με ένα σύνολο προδιαγραφών ασφαλείας και την ικανότητά του να εξετάζει τη φύση της ερώτησης και της απάντησής του. Αυτό το καθιστά πιο δύσκολο να παρασυρθεί σε ακατάλληλη συμπεριφορά, επειδή η διαδικασία λογικής του μπορεί να ανιχνεύσει προσπάθειες παραπλάνησης.
Σημασία για το Μέλλον της AI
Τα μοντέλα λογικής θα είναι κρίσιμα καθώς οι εταιρείες προσπαθούν να αναπτύξουν AI πράκτορες που μπορούν να λύνουν σύνθετα προβλήματα αξιόπιστα για λογαριασμό των χρηστών. “Αυτό σηματοδοτεί πραγματικά ότι προχωράμε στο μέτωπο της χρησιμότητας,” δήλωσε ο Mark Chen, ανώτερος αντιπρόεδρος έρευνας στην OpenAI.
Η OpenAI αναπτύσσει επίσης καινοτομίες όπως ένα νέο μοντέλο δημιουργίας βίντεο, μια δωρεάν έκδοση της μηχανής αναζήτησης που βασίζεται στο ChatGPT, και τη δυνατότητα πρόσβασης στο ChatGPT μέσω τηλεφώνου καλώντας τον αριθμό 1-800-ChatGPT.
Το o3 και η έκδοση o3-mini δεν είναι ακόμα διαθέσιμα στο ευρύ κοινό, αλλά η OpenAI αναφέρει ότι θα προσκαλέσει εξωτερικούς συνεργάτες να τα δοκιμάσουν.
Πηγή: OpenAI Upgrades Its Smartest AI Model With Improved Reasoning Skills