Περίληψη

Η εβδομάδα δείχνει ότι η AI περνά από την απλή απάντηση στην αυτόνομη εκτέλεση. Η σύγκρουση γύρω από τα Mythos/Fable συνεχίζεται σε επίπεδο G7, η χρήση AI αυξάνεται αλλά η εμπιστοσύνη μειώνεται, ενώ νέες μελέτες δείχνουν ότι οι agents αποδίδουν καλύτερα όταν ο χρήστης έχει γνώση του αντικειμένου. Στην ιατρική, agentic συστήματα αρχίζουν να ξεπερνούν γιατρούς σε συγκεκριμένα σενάρια, ενώ νέα μοντέλα δείχνουν πώς μπορεί να ασφαλιστεί ο κίνδυνος από autonomous AI.

Κύρια Σημεία

  • Η διαμάχη ΗΠΑ–Anthropic για τους περιορισμούς στα Mythos/Fable συνεχίζεται, με επίκεντρο την πρόσβαση ξένων χρηστών και εταιρειών.
  • Περίπου οι μισοί ενήλικες στις ΗΠΑ χρησιμοποιούν πλέον chatbots, αλλά η εμπιστοσύνη στο AI μειώνεται.
  • Η εμπειρία του χρήστη στο αντικείμενο έχει μεγαλύτερη σημασία από την τεχνική γνώση coding όταν δουλεύει με Claude Code.
  • Στην ιατρική, agentic AI συστήματα όπως MIRA και AIME πέτυχαν αποτελέσματα ίσα ή καλύτερα από γιατρούς σε διαγνωστικά και θεραπευτικά σενάρια.
  • Η επόμενη πρόκληση δεν είναι μόνο η “ευφυΐα” του AI, αλλά η ασφαλής εκτέλεση, τα δικαιώματα πρόσβασης, το audit trail και η νομική ευθύνη.
  • Νέα προσέγγιση “trace-economic underwriting” προτείνει να ασφαλίζεται ο κίνδυνος από autonomous agents με βάση κάθε ενέργεια που εκτελούν.

Sentiment Δείκτης

7.5/10 – Θετικό αλλά προσεκτικό

Υπάρχει μεγάλη τεχνολογική πρόοδος, αλλά και έντονη ανησυχία γύρω από εμπιστοσύνη, κρατικό έλεγχο, ρίσκο, ασφάλεια και ευθύνη.

Αναλυτικά

Το κεντρικό μήνυμα είναι ότι το agentic AI ωριμάζει γρήγορα και πλέον δεν αξιολογείται μόνο με βάση το αν δίνει σωστές απαντήσεις, αλλά με βάση το αν μπορεί να εκτελεί πραγματικές εργασίες με ασφάλεια. Η συνεχιζόμενη σύγκρουση γύρω από τα Mythos/Fable δείχνει ότι τα πιο ισχυρά μοντέλα αντιμετωπίζονται πλέον ως στρατηγική τεχνολογία εθνικής σημασίας.

Τα στοιχεία της Pew δείχνουν μια ενδιαφέρουσα αντίφαση: περισσότεροι άνθρωποι χρησιμοποιούν AI, αλλά λιγότεροι το εμπιστεύονται. Αυτό σημαίνει ότι η υιοθέτηση δεν αρκεί· οι εταιρείες πρέπει να χτίσουν εμπιστοσύνη μέσα από διαφάνεια, έλεγχο και αποδείξιμα αποτελέσματα.

Η μελέτη της Anthropic για 400.000 Claude Code sessions είναι ιδιαίτερα σημαντική: δείχνει ότι οι agents αποδίδουν καλύτερα όταν ο χρήστης ξέρει καλά το αντικείμενο, ακόμη κι αν δεν είναι προγραμματιστής. Αυτό σημαίνει ότι οι experts σε HR, events, marketing, ιατρική ή operations μπορούν να γίνουν πολύ παραγωγικοί με agents, αρκεί να ξέρουν τι ζητούν και πώς να ελέγχουν το αποτέλεσμα.

Στην ιατρική, τα αποτελέσματα είναι εντυπωσιακά αλλά απαιτούν αυστηρό πλαίσιο. Όταν AI agents παίρνουν αποφάσεις που επηρεάζουν ανθρώπινες ζωές, το κρίσιμο ζήτημα γίνεται η ιχνηλασιμότητα: ποια δεδομένα χρησιμοποίησαν, ποιο guideline ακολούθησαν, ποια απόφαση πήραν και ποιος την ενέκρινε.