Τεχνολογία
Η Tencent’s GameCraft Είναι ワイルド AI Τεχνολογία για Παιχνίδια Βίντεο
Η ομάδα Hunyuan της Tencent έχει κυκλοφορήσει κάτι πραγματικά φιλόδοξο: μια νέα τεχνολογία που ονομάζεται Hunyuan-GameCraft. Αυτό δεν αφορά την AI που γεννάει στατικές εικόνες ή βίντεο. Αφορά τη δημιουργία παιχνιδιών βίντεο από απλές κειμενικές προτροπές. Γράψτε «ένα σκάφος σε μια λίμνη» και την επόμενη στιγμή, ελέγχετε αυτό το σκάφος σε ήρεμα νερά σε πραγματικό χρόνο.
Εισάγει πραγματικό χρόνο ελέγχου στην AI-γεννημένη βίντεο, φέρνοντας κίνηση, προοπτική και παίκτη-όπως ροή στη διαδικασία. Υποστηρίζεται από μοντέλα διάχυσης και μεγάλης κλίμακας βίντεο παιχνιδιών, το GameCraft συνδυάζει την AI-γεννημένη βίντεο με τον έλεγχο του παίκτη σε πραγματικό χρόνο.
Τι Είναι το Hunyuan-GameCraft της Tencent;
Το Hunyuan-GameCraft είναι ένα μοντέλο γεννήτριας βίντεο που βασίζεται στη διάχυση και αναπτύχθηκε από την ομάδα AI της Tencent. Αυτό που το διακρίνει είναι η ικανότητα να γεννάει μια ελεγχόμενη σκηνή βίντεο χρησιμοποιώντας μόνο μια κειμενική ή εικονική προτροπή. Μόλις δημιουργηθεί η σκηνή, μπορείτε να την εξερευνήσετε χρησιμοποιώντας πλήκτρα και ποντίκι, σαν ένα ελαφρύ παιχνίδι.
Για παράδειγμα, το μοντέλο μπορεί να πάρει την προτροπή «ένα χιονισμένο δασικό μονοπάτι» και να εξαγάγει μια συνεχής βίντεο που μοιάζει με gameplay. Μπορείτε να προχωρήσετε, να γυρίσετε αριστερά ή δεξιά, και το μοντέλο γεννάει κάθε neue καρέ βάσει της εισόδου σας. Δεν υπάρχει παραδοσιακός 3D μηχανισμός πίσω από αυτό. Η βίντεο εξελίσσεται βάσει των ενεργειών σας.
Τι Μπορεί Να Κάνει;
Το Hunyuan-GameCraft της Tencent υποστηρίζει προοπτικές πρώτου και τρίτου προσώπου, με ομαλές μεταβάσεις μεταξύ τους. Μπορείτε να εξερευνήσετε τοπία, δρόμους πόλεων, πεδία μαχών ή ακόμη και επιστημονικής φαντασίας περιβάλλοντα. Κάθε κίνηση, όπως το να κοιτάτε γύρω ή να περπατάτε, συνδέεται με το σύστημα πρόβλεψης του μοντέλου.
Οι έλεγχοι είναι οικείοι, καθώς μπορείτε να χρησιμοποιήσετε τα πλήκτρα WASD ή τα βέλη για να μετακινηθείτε και να κοιτάξετε γύρω. Η AI χειρίζεται το υπόλοιπο. Πίσω από τις σκηνές, διαβάζει τις εισόδους σας ως σημάδια κίνησης και κατασκευάζει κάθε καρέ βάσει αυτών. Τα δεδομένα εκπαίδευσης περιλαμβάνουν πάνω από ένα εκατομμύριο βίντεο από πάνω από 100 δημοφιλή παιχνίδια. Αυτή η ευρεία έκθεση είναι αυτό που βοηθά το μοντέλο να κατανοήσει διαφορετικά στυλ (όπως πόλεις cyberpunk, μεσαιωνικά κάστρα ή φυσικά τοπία) και να τα αναπαράγει πιστευτά.
Στις δημοσιευμένες δημοσιεύσεις μέχρι τώρα, οι σκηνές είναι ποικίλες και οπτικά πλούσιες. Βλέπετε περιβάλλοντα όπως δρόμους πόλεων, χιονισμένα τοπία, riversides, και άλλα. Νιώθει σαν να κινείστε μέσα από μια σκηνή ή ένα προ-αποθηκευμένο επίπεδο παιχνιδιού. Nhưng είναι σημαντικό να θεωρήσετε αυτές τις προεπισκοπήσεις ως έρευνα. Αυτό που βλέπουμε είναι高度 καλά επιλεγμένο αποτέλεσμα. Δεν είναι ακόμη σαφές πόσο συνεπές ή σταθερό θα ήταν η ποιότητα σε μια ευρεία γκάμα προτροπών ή μεγαλύτερες αλληλεπιδράσεις.
Έχουμε δει άλλα projects που στοχεύουν σε παρόμοιους στόχους. Τα μοντέλα WHAM και Muse της Microsoft εστιάζουν στην πρόβλεψη μελλοντικών καρέ gameplay βάσει μαθημένων κανόνων. Odyssey είναι ένα πρόσφατο παράδειγμα που μετατρέπει βίντεο σε μια εξερευνήσιμη σκηνή χρησιμοποιώντας AI.
Πώς Λειτουργεί το Hunyuan GameCraft Πίσω Από τις Σκηνές;
Το Hunyuan-GameCraft είναι χτισμένο σε εύκολη βίντεο-γεννήτρια AI (μοντέλα διάχυσης) με ειδικές τεχνικές. Η βασική ιδέα είναι ότι αντιμετωπίζει τις εισόδους πλήκτρων/ποντικιού σας ως μέρος του «περιεχομένου» ή της ιστορίας της βίντεο. Τεχνικά, μετατρέπει αυτούς τους ελέγχους σε ένα είδος σήματος κίνησης κάμερας, ώστε να γνωρίζει πώς θέλετε να αλλάξει η προοπτική. Στη συνέχεια προβλέπει τα επόμενα καρέ βίντεο καρέ-καρέ, επεκτείνοντας το κλιπ στην κατεύθυνση που «κινείστε» αυτό.
Για να giữσει τη σκηνή από το να πηδάει γύρω, το μοντέλο χρησιμοποιεί μια μεθοδολογία που βασίζεται στην ιστορία. Θυμάται πού σας άφησε (λίγο σαν να κρατάτε την κατάσταση του παιχνιδιού στη μνήμη) ώστε ο κόσμος να μην τηλεпорτάει ξαφνικά αλλού. Αυτό το ονομάζουν «υβριδική κατάσταση ιστορίας». Βασικά, περιστασιακά τροφοδοτεί τα παλιά καρέ πίσω στο εαυτό του, ώστε τα σημαντικά στοιχεία (όπως η θέση αντικειμένων και φωτισμός) να παραμείνουν συνεπή καθώς περπατάτε. Οι δημιουργοί έκαναν επίσης σίγουροι ότι το μοντέλο μπορεί να τρέξει γρηγορότερα με αποσταξυσμό (δηλαδή συρρίκνωση ενός μεγάλου μοντέλου σε ένα μικρότερο, ταχύτερο). Αυτό σημαίνει ότι μπορεί να跟ει τις πιέσεις πλήκτρων σας σε (σχεδόν) πραγματικό χρόνο, με ένα δυνατό GPU.
Σύντομα, σας δίνουμε μια αρχική εικόνα ή κειμενική προτροπή και μια σειρά πιέσεων πλήκτρων. Η AI στη συνέχεια συνεχίζει να προβλέπει новые εικόνες, ώστε να φαίνεται σαν να περπατάτε ή να κοιτάζετε γύρω από τη σκηνή. Χάρη στη特殊 ιστορία τεχνική, ο κόσμος του παιχνιδιού παραμένει περίπου συνεπής με την πάροδο του χρόνου. Για παράδειγμα, αν περπατήσετε κάτω από einen διαδρόμο ή γυρίσετε 180°, τα τοιχώματα και ο πάτος θα παραμείνουν στη θέση τους αντί να γλιστρήσουν. Η ομάδα δείχνει ότι διατηρεί ακόμη και την 3D συνεπή για μεγάλο χρονικό διάστημα, το οποίο είναι khá εντυπωσιακό για γεννημένη βίντεο.
Χρήσεις;
Τι μπορούν να κάνουν οι gamers και οι développers με αυτή τη τεχνολογία; Σε βασικό επίπεδο, είναι ένα δημιουργικό εργαλείο. Οι σχεδιαστές παιχνιδιών θα μπορούσαν να το χρησιμοποιήσουν για να προτυποποιήσουν νέες σκηνές ή ιδέες επιπέδων αμέσως. Οι συγγραφείς και σκηνοθέτες θα μπορούσαν να γεννήσουν storyboards ή σκηνές cắt saja τυπώντας περιγραφές και στη συνέχεια να τις τροποποιήσουν «παίζοντας» τη σκηνή. Για τους gamers, θα μπορούσε να είναι ένας διασκεδαστικός τρόπος να βιώσουν custom mini-paixnidia που δημιουργούνται στην πτήση (όπως «θέλω μια μάχη δράκων στο Άρη» και ξαφνικά μπορείτε να ελέγχετε αυτό). Θα μπορούσε επίσης να βοηθήσει στην εκπαίδευση άλλων AI: για παράδειγμα, θα μπορούσαμε να εκπαιδεύσουμε ρομπότ ή agents σε ατελείωτους εικονικούς κόσμους που η AI δημιουργεί.
Δεν υπάρχει δημόσιο web app ακόμη, και η τεχνολογία vẫn χρειάζεται περισσότερη βελτίωση σε όρους οπτικής ποιότητας και απόκρισης. Σε demos από άλλα παρόμοια μοντέλα, όταν η κάμερα κινείται πολύ μακριά ή περιστρέφεται πολύ, η σκηνή μπορεί να αρχίσει να καταρρέει. Η υβριδική κατάσταση ιστορίας του Hunyuan μειώνει αυτό, αλλά μεγάλες αλλαγές προοπτικής vẫn possono να προκαλέσουν glitches κειμένου ή σπασμένα γεωμετρικά. Για τώρα, λειτουργεί καλύτερα ως έρευνα preview, κάτι που δείχνει τι είναι δυνατό, παρά ως πλήρως playable εμπειρία.
Τελικές Σκέψεις
Σε αυτό το στάδιο, η концепτός είναι στερεή. Υπάρχει ορατή δυνατότητα στο πώς ο έλεγχος εισόδου μπορεί να διαμορφωθεί για να μοιάζει και να αισθανθεί σαν gameplay. Αλλά είναι ακόμη νωρίς. Αυτό είναι ένα έρευνας demo, όχι ένα ολοκληρωμένο προϊόν. Η γεννήτρια σε πραγματικό χρόνο υψηλής ανάλυσης για παρατεταμένες συνεδρίες παιχνιδιού είναι ακόμη μια τεχνική πρόκληση.











