Η Google αποκαλύπτει το μοντέλο Gemini 3 AI και το πρώτο IDE με AI που ονομάζεται Antigravity

Η Google ξεκίνησε την κυκλοφορία της Gemini σε υψηλή ταχύτητα τον περασμένο χρόνο, κυκλοφορώντας την πολύ βελτιωμένη οικογένεια Gemini 2.5 και στριμώχνοντας διάφορες γεύσεις του μοντέλου στην Αναζήτηση, στο Gmail και σχεδόν οτιδήποτε άλλο κατασκευάζει η εταιρεία. Τώρα, το όλο και πιο αναπόφευκτο AI της Google αναβαθμίζεται. Το Gemini 3 Pro είναι διαθέσιμο σε περιορισμένη μορφή σήμερα, με πιο καθηλωτικά, οπτικά αποτελέσματα και λιγότερα ψέματα, λέει η Google. Η εταιρεία λέει επίσης ότι το Gemini 3 θέτει ένα νέο σήμα υψηλής απόδοσης για την κωδικοποίηση vibe και η Google ανακοινώνει ένα νέο ολοκληρωμένο περιβάλλον ανάπτυξης (IDE) με την πρώτη τεχνητή νοημοσύνη που ονομάζεται Antigravity, το οποίο είναι επίσης διαθέσιμο σήμερα. Το πρώτο μέλος της οικογένειας Gemini 3, η Google λέει ότι η κυκλοφορία του Gemini 3 είναι ένα ακόμη βήμα προς την τεχνητή γενική νοημοσύνη (AGI). Η νέα έκδοση του κορυφαίου μοντέλου τεχνητής νοημοσύνης της Google έχει επεκτείνει τις ικανότητες προσομοίωσης συλλογισμού και δείχνει βελτιωμένη κατανόηση κειμένου, εικόνων και βίντεο. Μέχρι στιγμής, αρέσει στους δοκιμαστές—το πιο πρόσφατο LLM της Google βρίσκεται και πάλι στην κορυφή του βαθμολογικού πίνακα του LMARena με βαθμολογία ELO 1.501, ξεπερνώντας το Gemini 2.5 Pro κατά 50 βαθμούς. Η πραγματικότητα ήταν ένα πρόβλημα για όλα τα μοντέλα τεχνητής νοημοσύνης της γενιάς, αλλά η Google λέει ότι το Gemini 3 είναι ένα μεγάλο βήμα προς τη σωστή κατεύθυνση και υπάρχουν μυριάδες σημεία αναφοράς για να πει την ιστορία. Στο τεστ SimpleQA Verified με 1.000 ερωτήσεις, το Gemini 3 σημείωσε ρεκόρ 72,1 τοις εκατό. Ναι, αυτό σημαίνει ότι το υπερσύγχρονο LLM εξακολουθεί να βλάπτει σχεδόν το 30 τοις εκατό των ερωτήσεων γενικής γνώσης, αλλά η Google λέει ότι αυτό εξακολουθεί να δείχνει σημαντική πρόοδο. Στο πολύ πιο δύσκολο Humanity’s Last Exam, το οποίο δοκιμάζει τη γνώση και τη λογική σε επίπεδο διδακτορικού, ο Gemini σημείωσε ένα άλλο ρεκόρ, σημειώνοντας 37,5 τοις εκατό χωρίς χρήση εργαλείων. Τα μαθηματικά και η κωδικοποίηση βρίσκονται επίσης στο επίκεντρο του Gemini 3. Το μοντέλο σημείωσε νέα ρεκόρ στο MathArena Apex (23,4 τοις εκατό) και στο WebDev Arena (1487 ELO). Στο SWE-bench Verified, το οποίο δοκιμάζει την ικανότητα ενός μοντέλου να δημιουργεί κώδικα, το Gemini 3 σημείωσε εντυπωσιακό ποσοστό 76,2%.
Δημοσιεύτηκε: 2025-11-18 16:08:00
πηγή: arstechnica.com










