Οι ΗΠΑ χρειάζονται μια παρέμβαση τεχνητής νοημοσύνης ανοιχτού κώδικα για να νικήσουν την Κίνα
Από το 2022, η Αμερική έχει σταθερό προβάδισμα στην τεχνητή νοημοσύνη χάρη στα προηγμένα μοντέλα από εταιρείες υψηλών πτήσεων όπως η OpenAI, η Google DeepMind, η Anthropic και η xAI. Ωστόσο, ένας αυξανόμενος αριθμός ειδικών ανησυχεί ότι οι ΗΠΑ αρχίζουν να υστερούν όσον αφορά την κοπή μοντέλων τεχνητής νοημοσύνης ανοιχτού βάρους που μπορούν να ληφθούν, να προσαρμοστούν και να εκτελεστούν τοπικά. Ανοιχτά μοντέλα από κινεζικές εταιρείες όπως η Kimi, Z.ai, Alibaba και DeepSeek κερδίζουν τώρα γρήγορα δημοτικότητα μεταξύ των ερευνητών και των μηχανικών παγκοσμίως, αφήνοντας τις ΗΠΑ σε μια καινοτόμα περιοχή στον κόσμο. «Οι ΗΠΑ χρειάζονται ανοιχτά μοντέλα για να εδραιώσουν το προβάδισμά τους σε κάθε επίπεδο της στοίβας τεχνητής νοημοσύνης», λέει στο WIRED ο Nathan Lambert, ιδρυτής του Έργου ATOM (American Truly Open Models). Στα πιο προηγμένα μοντέλα αμερικανικών εταιρειών είναι δυνατή η πρόσβαση μόνο μέσω μιας διεπαφής chatbot ή μέσω αποστολής ερωτημάτων στους διακομιστές εταιρειών μέσω διεπαφής προγραμματισμού εφαρμογών ή API. Η OpenAI και η Google έχουν κυκλοφορήσει μοντέλα ανοιχτού βάρους, αλλά είναι πολύ λιγότερο ικανά από τις κινεζικές προσφορές, οι οποίες είναι πιο κατάλληλες για τροποποίηση και προσφέρουν περισσότερη υποστήριξη προγραμματιστών. Οι Κινέζοι κατασκευαστές μοντέλων επωφελούνται επίσης από το open source των μοντέλων τους, καθώς οι καλύτερες ιδέες και τροποποιήσεις από εξωτερικούς ερευνητές μπορούν να αναδιπλωθούν σε μελλοντικές εκδόσεις. Ο Lambert, ο οποίος είναι επίσης ερευνητής στο Allen Institute for AI (Ai2), μια μη κερδοσκοπική εταιρεία στο Σιάτλ της Ουάσιγκτον, ίδρυσε το έργο ATOM για να τονίσει τους κινδύνους που συνδέονται με την καθυστέρηση των ΗΠΑ στον ανοιχτό κώδικα. Η χώρα χρειάζεται ανοιχτά μοντέλα αιχμής, λέει, εν μέρει επειδή η στήριξη σε ξένα θα μπορούσε να αποδειχθεί προβληματική εάν αυτά τα μοντέλα διακόπηκαν ξαφνικά ή γίνονταν κλειστού κώδικα. Τα ανοιχτά μοντέλα ενθαρρύνουν επίσης την καινοτομία και τον πειραματισμό μεταξύ νεοφυών επιχειρήσεων και ερευνητών, λέει ο Lambert. Από εκεί και πέρα, οι εταιρείες με ευαίσθητες πληροφορίες χρειάζονται ανοιχτά μοντέλα που μπορούν να λειτουργήσουν με το δικό τους υλικό. «Τα ανοιχτά μοντέλα είναι ένα θεμελιώδες κομμάτι της έρευνας, της διάδοσης και της καινοτομίας της τεχνητής νοημοσύνης και οι ΗΠΑ θα πρέπει να διαδραματίσουν ενεργό ρόλο ηγετικό αντί να ακολουθούν άλλους συνεισφέροντες», λέει ο Lambert. Το ATOM Project, που ξεκίνησε στις 4 Ιουλίου, παρουσιάζει ένα συναρπαστικό επιχείρημα για περισσότερη διαφάνεια και δείχνει πώς τα κινεζικά μοντέλα ανοιχτού βάρους ξεπέρασαν τα αμερικανικά τα τελευταία χρόνια. Η Meta, όταν κυκλοφόρησε το Llama, ένα μοντέλο ανοιχτού βάρους, τον Ιούλιο του 2023. Τότε, η Meta είδε το Llama ως έναν τρόπο να μπει στον αγώνα της τεχνητής νοημοσύνης. Πολύ γρήγορα, το νέο της μοντέλο έγινε δημοφιλές μεταξύ ερευνητών και επιχειρηματιών. Έκτοτε, η Meta και άλλες αμερικανικές εταιρείες τεχνητής νοημοσύνης προσηλώθηκαν στην ιδέα της ανάπτυξης ανθρώπινης ή υπερανθρώπινου τεχνητής νοημοσύνης, ιδανικά πριν από τους ανταγωνιστές τους, με αποτέλεσμα λιγότερο ανοιχτό. Τους τελευταίους μήνες, ο Ζάκερμπεργκ επανεκκίνησε τις προσπάθειες της Meta για τεχνητή νοημοσύνη με μια σειρά από ακριβές προσλήψεις και ένα νέο εργαστήριο «υπερπληροφορίας». Ο Zuckerberg έχει επίσης υποδείξει ότι η Meta ενδέχεται να μην είναι πλέον ανοιχτού κώδικα για τα καλύτερα μοντέλα της. Η βιομηχανία τεχνολογίας της Κίνας, αντίθετα, στράφηκε προς το μεγαλύτερο άνοιγμα φέτος. Τον Ιανουάριο του 2025, η DeepSeek, μια τότε ελάχιστα γνωστή startup, κυκλοφόρησε ένα ανοιχτό μοντέλο που ονομάζεται DeepSeek-R1 που συγκλόνισε τον κόσμο λόγω των προηγμένων δυνατοτήτων του και του γεγονότος ότι εκπαιδεύτηκε με ένα κλάσμα του κόστους των μεγάλων μοντέλων των ΗΠΑ. Έκτοτε, αρκετές κινεζικές εταιρείες έχουν παρουσιάσει ισχυρά μοντέλα ανοιχτού βάρους που διαθέτουν πρόσθετες καινοτομίες.
Δημοσιεύτηκε: 2025-11-19 19:00:00
πηγή: www.wired.com









