12 Νοεμβρίου 2025

Το AlphaEvolve της Google φέρνει μαθηματικά επιτεύγματα – Νέα μοντέλα από Anthropic, PDF από κείμενο και εργαλείο διαφάνειας από OpenAI

 Περίληψη:

Το νέο AI σύστημα της Google, AlphaEvolve, ανακάλυψε βελτιωμένους αλγορίθμους που ξεπερνούν ανθρώπινη επίδοση και επιλύει μαθηματικά προβλήματα που παρέμεναν άλυτα από το 1969.
Παράλληλα, η Anthropic ετοιμάζεται να λανσάρει νέα μοντέλα Claude, η OpenAI παρουσίασε πίνακα αξιολόγησης ασφαλείας των μοντέλων της, ενώ νέα εργαλεία επιτρέπουν τη μετατροπή κειμένου σε επαγγελματικά PDFs.

 

 

 Κύρια σημεία:

  • Google – AlphaEvolve:
    • Συνδυάζει Gemini με εξελικτικές στρατηγικές.
    • Βελτίωσε τον αλγόριθμο Strassen (1969) για υπολογισμούς πινάκων.
    • Επιλύει 20% των μαθηματικών προβλημάτων με νέες, καλύτερες λύσεις.
    • Χρησιμοποιείται εσωτερικά για βελτιστοποίηση data centers, chip design και AI training.
  • Anthropic – Νέα μοντέλα Sonnet & Opus:
    • Αναμένονται σύντομα, με ικανότητες αυτόματης διόρθωσης και εναλλαγής reasoning/tool use.
    • Υπό δοκιμή το μοντέλο "Neptune" (πιθανό 3.8 release).
    • Παρουσιάστηκε και bug bounty πρόγραμμα για την ασφάλεια των Claude.
  • Grok – Μετατροπή κειμένου σε PDF:
    • Δημιουργία επαγγελματικών εγγράφων (βιογραφικά, μελέτες) απευθείας από prompt.
    • Υποστήριξη LaTeX και απευθείας επεξεργασία.
  • OpenAI – Safety Evaluations Dashboard:
    • Παρουσιάζει δεδομένα για hallucination, harmful content, jailbreaks.
    • Διαφάνεια, αλλά βασίζεται στην αυτοαναφορά της εταιρείας.
  • Νέα AI εργαλεία:
    • Gemini Advanced, GPT 4.1, TikTok AI Alive, CodeRabbit.
  • Θέσεις εργασίας:
    • The Rundown, Writer AI, OpenAI, Siena.
  • Αλλες ειδήσεις:
    • Stability AI: Open-sourced text-to-audio μοντέλο.
    • Nvidia: Νέες συνεργασίες στη Μέση Ανατολή.
    • Meta: Νέα datasets και έρευνες για AI και μόρια.
    • Klarna: Επιστροφή σε ανθρώπινους agents μετά από αποτυχία AI.

 

 

 Αναλυτικά:

Η Google παρουσίασε το AlphaEvolve, έναν νέο πράκτορα τεχνητής νοημοσύνης που συνδυάζει τις δυνατότητες της οικογένειας Gemini με μια εξελικτική στρατηγική για τη δημιουργία νέων αλγορίθμων. Το εργαλείο έχει ήδη οδηγήσει σε σημαντικά επιτεύγματα, όπως η βελτίωση του Strassen algorithm, που παρέμενε αμετάβλητος για πάνω από 50 χρόνια. Το AlphaEvolve επιλύει μαθηματικά προβλήματα, βελτιστοποιεί εσωτερικά τα data centers της Google, υποστηρίζει το σχεδιασμό chips και βελτιώνει την εκπαίδευση των ίδιων των AI μοντέλων της.

Η Anthropic ανακοίνωσε πως ετοιμάζεται να κυκλοφορήσει νέες εκδόσεις των μοντέλων Sonnet και Opus, τα οποία θα μπορούν να συνδυάζουν reasoning και εργαλειακή χρήση. Τα μοντέλα θα μπορούν να διορθώνουν τον εαυτό τους κατά την εκτέλεση κώδικα χωρίς ανθρώπινη παρέμβαση, ενώ ένα μοντέλο με κωδική ονομασία Neptune δοκιμάζεται εντατικά.

Η OpenAI παρουσίασε νέο Safety Evaluations Hub, με δείκτες για την ασφάλεια των μοντέλων της. Αν και αποτελεί βήμα προς τη διαφάνεια, βασίζεται σε αυτοαναφερόμενα δεδομένα. Ταυτόχρονα, η OpenAI λάνσαρε τα GPT-4.1 και 4.1-mini, πιο εξειδικευμένα σε κώδικα.

Η πλατφόρμα Grok εισήγαγε δυνατότητα μετατροπής prompts σε επαγγελματικά PDF, ακόμα και σε μορφή LaTeX, χρήσιμη για ερευνητές ή επαγγελματίες.

Στον χώρο της αγοράς και τεχνολογίας, η Nvidia εξασφαλίζει νέες συμφωνίες στη Μέση Ανατολή για chips AI, ενώ η Stability AI έκανε open source ένα νέο text-to-audio μοντέλο. Η Meta παρουσίασε νέες ερευνητικές βάσεις δεδομένων και η Klarna ανακοίνωσε ότι, μετά από απογοητευτικά αποτελέσματα της AI, θα επαναφέρει ανθρώπινους agents.

Το επόμενο workshop της κοινότητας The Rundown University θα πραγματοποιηθεί στις 16 Μαΐου με τον Dr. Alvaro Cintas, όπου οι συμμετέχοντες θα μάθουν να σχεδιάζουν και να εφαρμόζουν δικά τους AI συστήματα χρησιμοποιώντας το OpenAI Agents SDK.

 

 Sentiment δείκτης:

Θετικό  – Κυριαρχεί ενθουσιασμός για τις δυνατότητες δημιουργικότητας και ασφάλειας της AI, με πρακτικές εφαρμογές και διαφάνεια. Παράλληλα, διαφαίνεται πίεση στην αγορά για αξιοπιστία και ανθρώπινη παρέμβαση.