27 Δεκεμβρίου 2025

Το νέο κύμα στην ΤΝ: Μοντέλα ακραίας μαθηματικής λογικής, παραβιάσεις δεδομένων, εργαλεία ορχήστρωσης και νέες AI εφαρμογές

 Περίληψη 

Η DeepSeek κυκλοφόρησε ένα νέο open-source reasoner που φτάνει επιδόσεις χρυσού μεταλλίου στην IMO· η OpenAI υπέστη διαρροή δεδομένων από τρίτο πάροχο· νέα εργαλεία εμφανίζονται για παραγωγή περιεχομένου, ενώ η NVIDIA δημοσιεύει έρευνα που αμφισβητεί τη λογική ότι «το μεγαλύτερο μοντέλο είναι πάντα καλύτερο».

 Κύρια σημεία

  1. DeepSeek-Math-V2: open-source reasoner επιπέδου IMO χρυσού μεταλλίου
    – Λύνει 5/6 προβλήματα IMO 2025.
    – Σκορ 118/120 στο Putnam (πάνω από τον καλύτερο άνθρωπο).
    – Επιτυγχάνει 61.9% στο IMO ProofBench (Google Deep Think ~64%, GPT-5 ~20%).
    – Νέος μηχανισμός generator–verifier με βήμα-βήμα έλεγχο λογικής.
  2. OpenAI: Διαρροή δεδομένων API χρηστών λόγω παραβίασης Mixpanel
    – Έγιναν export ονόματα, emails, τοποθεσίες και device info.
    – Δεν διέρρευσαν συνομιλίες, κλειδιά API ή στοιχεία πληρωμών.
    – Ο κίνδυνος εντοπίζεται σε phishing και social engineering.
  3. Nano Banana Pro: Δημιουργεί Instagram product feeds
    – Από μία εικόνα εισόδου δημιουργεί 9-εικόνων grid με ποίκιλες λήψεις.
    – Χρήσιμο για brands, TikTok/Instagram stores και e-commerce οπτικό υλικό.
  4. NVIDIA x HKU: ToolOrchestra — η θεωρία ότι “η ορχήστρωση > scaling
    – Μοντέλο 8B, εκπαιδευμένο να καλεί εργαλεία, ξεπερνά GPT-5/Opus σε benchmarks.
    – Πιο φθηνό, πιο γρήγορο, προσαρμόζεται σε νέα tools.
    – Υπογραμμίζει ότι μικρά μοντέλα + έξυπνη ορχήστρωση μπορεί να είναι η μελλοντική κατεύθυνση.
  5. Γρήγορα νέα
    – Νέο stealth AI project από Jeff Bezos (“Project Prometheus”).
    – OpenAI αναγκάζεται νομικά να παραδώσει logs για datasets με πνευματικά δικαιώματα.
    – Perplexity αποκτά persistent memory & multi-calendar assistant.
    – Cohere συνεργάζεται με SAP για enterprise agentic AI.
    – Alibaba παρουσιάζει AI smart glasses στην Κίνα (~268 USD).
  6. Trending AI Tools
    – Perplexity (try-on), DeepSeek Math V2, Character AI Stories για παιδιά, FLUX.2 (image intelligence).
  7. Community Workflow
    –Τραγουδοποιός χρησιμοποιεί AI για να μετατρέπει folk στίχους σε indie-folk style χωρίς να αλλάζει μουσική δομή.

 

 

 Αναλυτικά

Η DeepSeek κυκλοφόρησε το DeepSeek-Math-V2, ένα νέο open-source μοντέλο τύπου Mixture-of-Experts που καταφέρνει επιδόσεις υψηλότερες από τους κορυφαίους ανθρώπινους διαγωνιζόμενους στις δυσκολότερες μαθηματικές διοργανώσεις στον κόσμο. Το μοντέλο λύνει τα πέντε από τα έξι προβλήματα της IMO 2025 και σημειώνει σχεδόν τέλειο σκορ στην Putnam. Η καινοτομία του είναι ο μηχανισμός generator-verifier, όπου ένα μοντέλο δημιουργεί αποδείξεις και το δεύτερο εντοπίζει λογικές αδυναμίες, επιτρέποντας στα δύο μοντέλα να κάνουν αυτοδιόρθωση σε κάθε βήμα. Το γεγονός ότι είναι διαθέσιμο open-source σπάει το προηγούμενο μονοπώλιο των proprietary labs σε προηγμένη μαθηματική λογική.

 Ακολουθεί μια σοβαρή είδηση ασφαλείας: η OpenAI ενημερώνει ότι η Mixpanel, ο analytics συνεργάτης της, έπεσε θύμα παραβίασης και διέρρευσε προφίλ χρηστών API, όπως ονόματα και emails. Δεν εκτέθηκαν συνομιλίες, API keys ή στοιχεία λογαριασμών, όμως υπάρχει κίνδυνος phishing και social engineering. Η OpenAI διέκοψε τη συνεργασία και ειδοποιεί τους χρήστες.

 Ένας πρακτικός οδηγός για το Nano Banana Pro, μπορεί από μία εικόνα να δημιουργήσει ένα πλήρες Instagram feed 9 εικόνων με κοινή αισθητική. Προτείνεται η χρήση συγκεκριμένων reference photos για καλύτερα αποτελέσματα.

 Το ToolOrchestra, έρευνα της NVIDIA με το Πανεπιστήμιο του Hong Kong, δείχνει ότι ο μελλοντικός δρόμος της AI μπορεί να μην είναι τα γιγαντιαία μοντέλα αλλά τα μικρότερα μοντέλα που κάνουν έξυπνη «ορχήστρωση» εργαλείων. Το σύστημα εκπαιδεύει ένα orchestrator μοντέλο που αποφασίζει πότε θα χρησιμοποιήσει τα δικά του tokens και πότε θα καλέσει εξωτερικά εργαλεία ή μεγαλύτερα μοντέλα. Ένα μοντέλο μόλις 8B παραμέτρων ξεπέρασε GPT-5 και Claude Opus σε ανθρώπινα benchmarks, με πολύ χαμηλότερο κόστος.

 Ειδήσεις της αγοράς AI:
– Ο Jeff Bezos εξαγόρασε μυστικά μια startup agentic computing·
– η OpenAI υποχρεώνεται νομικά να δώσει εσωτερικά έγγραφα για datasets με πνευματικά δικαιώματα·
– η Perplexity αποκτά persistent memory και multi-calendar capabilities·
– η Cohere συνεργάζεται με SAP·
– η Alibaba λανσάρει στην Κίνα AI glasses, με πολύ χαμηλή τιμή εισόδου.

 

Δείκτης συναισθήματος

Θετικό/Ενθουσιώδες (≈ 75% θετικό – 25% αρνητικό)

Θετικά:
– Μεγάλα open-source breakthroughs, νέα εργαλεία, νέες δυνατότητες AI.
Αρνητικά:
– Παραβίαση μέσω Mixpanel, κίνδυνοι phishing.