ٽيڪنالاجي
ٽينسينٽ جو گيم ڪرافٽ راند لائق وڊيو جنريشن لاءِ وائلڊ اي آءِ ٽيڪ آهي

Tencent جي هنيون ٽيم ڪجهه حقيقي طور تي پرعزم جاري ڪيو آهي: هڪ نئين ٽيڪنالاجي جنهن کي Hunyuan-GameCraft سڏيو ويندو آهي. هي AI جي باري ۾ ناهي ته ڪيئن اڃا تصويرون يا مختصر ڪلپس ٺاهيا وڃن. اهو ٺاهڻ بابت آهي سادي ٽيڪسٽ پرامپٽس مان هلائڻ لائق وڊيو تجربا. "هڪ ڍنڍ تي هڪ ٻيڙي" لکو، ۽ ايندڙ لمحي، توهان حقيقي وقت ۾ ان ٻيڙي کي پرسکون پاڻي تي هلائي رهيا آهيو.
اهو AI-جنريٽريڊ وڊيو ۾ ريئل ٽائيم ڪنٽرول متعارف ڪرائيندو آهي، حرڪت، نقطه نظر، ۽ تجربي ۾ راند جهڙو وهڪرو. ڊفيوژن ماڊلز ۽ وڏي پيماني تي گيم فوٽيج جي مدد سان، گيم ڪرافٽ اي آءِ وڊيو جنريشن کي ريئل ٽائيم پليئر ڪنٽرول سان ملائي ٿو.
ٽينسينٽ جو هيون يوان-گيم ڪرافٽ ڇا آهي؟
هون يوان-گيم ڪرافٽ هڪ ڊفيوژن تي ٻڌل وڊيو جنريشن ماڊل آهي جيڪو ٽينسينٽ جي اي آءِ ٽيم پاران تيار ڪيو ويو آهي. جيڪو ان کي الڳ ڪري ٿو اهو صرف هڪ ٽيڪسٽ يا تصوير جي پرامپٽ استعمال ڪندي هڪ ڪنٽرول ٿيندڙ وڊيو سين پيدا ڪرڻ جي صلاحيت آهي. هڪ ڀيرو منظر ٺاهي وئي، توهان ان کي ڪي بورڊ ۽ مائوس استعمال ڪندي ڳولي سگهو ٿا، جهڙوڪ هڪ کيڏڻ واري راند جو هلڪو نسخو.
مثال طور، ماڊل "هڪ برفاني ٻيلي جو رستو" پرامپٽ وٺي سگهي ٿو ۽ هڪ مسلسل وڊيو آئوٽ پُٽ ڪري سگهي ٿو جيڪو گيم پلي وانگر نظر اچي ٿو. توهان اڳتي وڌي سگهو ٿا، کاٻي يا ساڄي موڙ ڪري سگهو ٿا، ۽ ماڊل توهان جي ان پٽ جي بنياد تي هر نئون فريم ٺاهي ٿو. ان جي پويان ڪو به روايتي 3D انجڻ ناهي. وڊيو توهان جي عملن جي بنياد تي ترقي ڪري ٿي.
اهو اصل ۾ ڇا ڪري سگهي ٿو
ٽينسينٽ جو هيون-گيم ڪرافٽ پهرين شخص ۽ ٽئين شخص جي نظارن کي سپورٽ ڪري ٿو، انهن جي وچ ۾ هموار منتقلي سان. توهان نظارا، شهر جي گهٽين، جنگ جي ميدانن، يا اڃا به ڳولي سگهو ٿا سائنس فڪشن ماحولهر حرڪت جهڙوڪ چوڌاري ڏسڻ يا هلڻ، ماڊل جي اڳڪٿي نظام سان ڳنڍيل آهي.
ڪنٽرول واقف آهن، جيئن توهان WASD يا تير واري ڪيز استعمال ڪري سگهو ٿا گھمڻ ۽ چوڌاري ڏسڻ لاءِ. AI باقي ڪم سنڀاليندو آهي. پردي جي پويان، اهو توهان جي ان پٽ کي حرڪت جي اشارن جي طور تي پڙهي رهيو آهي ۽ ان جي بنياد تي هر فريم ٺاهي رهيو آهي. تربيتي ڊيٽا ۾ 100 کان وڌيڪ مشهور راندين مان هڪ ملين کان وڌيڪ وڊيو ڪلپس شامل آهن. اهو وسيع نمائش اهو آهي جيڪو ماڊل کي مختلف بصري اندازن (جهڙوڪ سائبر پنڪ شهر، وچين دور جا قلعا، يا قدرتي نظارا) کي سمجهڻ ۽ انهن کي قابل اعتماد طور تي ٻيهر تعمير ڪرڻ ۾ مدد ڪري ٿو.
هاڻي تائين جاري ڪيل ڊيمو ۾، منظر مختلف ۽ بصري طور تي امير آهن. توهان شهر جي گهٽين، برفاني نظارن، دريائن جي ڪناري، ۽ وڌيڪ جهڙا ماحول ڏسو ٿا. اهو هڪ ڪٽ سين يا اڳ ۾ پيش ڪيل راند جي سطح ذريعي منتقل ٿيڻ جي ويجهو محسوس ٿئي ٿو. پر انهن کي تحقيق جي ڏيک جي طور تي ڏسڻ ضروري آهي. جيڪو اسان ڏسي رهيا آهيون اهو انتهائي ترتيب ڏنل آئوٽ پُٽ آهي. اهو اڃا تائين واضح ناهي ته معيار ڪيتري مسلسل يا مستحڪم هوندي پرامپٽس جي وسيع رينج يا ڊگهي رابطي ۾.
اسان ٻيا منصوبا ڏٺا آهن جيڪي ساڳين مقصدن لاءِ مقصد رکن ٿا. مائڪروسافٽ جا WHAM ۽ Muse ماڊل سکيا قاعدن جي بنياد تي مستقبل جي راند جي فريم جي اڳڪٿي ڪرڻ تي ڌيان ڏيو. Odyssey هڪ ٻي تازي مثال آهي جيڪا AI استعمال ڪندي وڊيو کي هڪ قابلِ ڳولا منظر ۾ تبديل ڪري ٿي.
هون يوان گيم ڪرافٽ پردي پويان ڪيئن ڪم ڪندو آهي؟
هون يوان-گيم ڪرافٽ خاص چالاڪين سان فينسي وڊيو جنريشن اي آءِ (ڊفيوژن ماڊل) تي ٺهيل آهي. اهم خيال اهو آهي ته اهو توهان جي ڪيبورڊ/ماؤس ان پٽ کي وڊيو "سياق و سباق" يا ڪهاڻي جي حصي طور علاج ڪري ٿو. ٽيڪنيڪل طور تي، اهو انهن ڪنٽرولن کي هڪ قسم جي ڪئميرا-موو سگنل ۾ تبديل ڪري ٿو ته جيئن اهو ڄاڻي ته توهان نقطه نظر کي ڪيئن تبديل ڪرڻ چاهيو ٿا. پوءِ اهو ايندڙ وڊيو فريم جي اڳڪٿي ڪري ٿو فريم بائي فريم، ڪلپ کي ان طرف وڌايو جتي توهان ان کي "هلايو" ٿا.
منظر کي اُڏڻ کان روڪڻ لاءِ، ماڊل تاريخ تي ٻڌل طريقو استعمال ڪري ٿو. اهو ياد رکي ٿو ته توهان ڪٿي ڇڏيو هو (ٿورو ياداشت ۾ راند جي حالت کي رکڻ وانگر) ته جيئن دنيا اوچتو ٻئي هنڌ ٽيلي پورٽ نه ٿئي. اهي هن کي "هائبرڊ هسٽري ڪنڊيشننگ" سڏين ٿا. بنيادي طور تي، اهو ڪڏهن ڪڏهن پراڻن فريمن کي پاڻ ۾ واپس فيڊ ڪري ٿو ته جيئن اهم تفصيل (جهڙوڪ شين جي پوزيشن ۽ روشني) توهان جي هلڻ دوران هڪجهڙائي رهي. ٺاهيندڙن اهو پڻ يقيني بڻايو ته ماڊل ان کي ڊسٽل ڪندي تيز هلائي سگهي ٿو (يعني هڪ وڏي ماڊل کي ننڍي، تيز ۾ ڇڪڻ). هن طريقي سان اهو هڪ مضبوط GPU ڏنو ويو آهي، (تقريبن) حقيقي وقت ۾ توهان جي اهم ٽيپس سان گڏ رهي سگهي ٿو.
مختصر ۾، توهان ان کي هڪ شروعاتي تصوير يا ٽيڪسٽ پرامپٽ ۽ ڪي پريس جو سلسلو ڏيو ٿا. پوءِ AI نئين تصويرن جي اڳڪٿي ڪندو رهي ٿو ته جيئن اهو لڳي ته توهان هلي رهيا آهيو يا منظر جي چوڌاري ڏسي رهيا آهيو. خاص تاريخ جي چال جي مهرباني، راند جي دنيا وقت سان گڏ تقريبن هڪجهڙائي رکي ٿي. مثال طور، جيڪڏهن توهان هڪ دالان هيٺ هلندا آهيو يا 180° جي چوڌاري ڦرندا آهيو، ته ڀتيون ۽ فرش ٻاهر نڪرڻ بدران پنهنجي جاءِ تي رهندا. ٽيم ڏيکاري ٿي ته اهو ڊگهي وقت تائين 3D مستقل مزاجي کي به محفوظ رکي ٿو، جيڪو ٺاهيل وڊيو لاءِ ڪافي متاثر ڪندڙ آهي.
ڪيسن جو استعمال ڪريو
تنهن ڪري گيمرز ۽ ڊولپرز هن ٽيڪنالاجي سان ڇا ڪري سگهن ٿا؟ بنيادي سطح تي، اهو هڪ تخليقي اوزار آهي. گيم ڊيزائنر ان کي نئين ماحول کي پروٽوٽائپ ڪرڻ يا فوري طور تي خيالن کي سطح تي آڻڻ لاءِ استعمال ڪري سگهن ٿا. ليکڪ ۽ ڊائريڪٽر صرف وضاحتون ٽائيپ ڪندي اسٽوري بورڊ يا ڪٽ سينز ٺاهي سگهن ٿا ۽ پوءِ انهن کي منظر ذريعي "کيڏڻ" ذريعي ٽائيڪ ڪري سگهن ٿا. گيمرز لاءِ، اهو ڪسٽم ميني گيمز جو تجربو ڪرڻ جو هڪ مزيدار طريقو ٿي سگهي ٿو جيڪي توهان اڏام تي ٺاهيندا آهيو (جهڙوڪ "مون کي مريخ تي ڊريگن جي جنگ گهرجي" ۽ اوچتو توهان ان کي ڪنٽرول ڪري سگهو ٿا). اهو ٻين AIs کي تربيت ڏيڻ ۾ پڻ مدد ڪري سگهي ٿو: مثال طور، اسان لامحدود ورچوئل دنيا ۾ روبوٽس يا ايجنٽن کي تربيت ڏئي سگهون ٿا جيڪي AI گھمائي ٿو.
اڃا تائين ڪا به عوامي ويب ايپ ناهي، ۽ ٽيڪنالاجي کي اڃا تائين بصري معيار ۽ جوابدهي جي لحاظ کان وڌيڪ بهتري جي ضرورت آهي. ٻين ساڳين ماڊلز جي ڊيمو ۾، جڏهن ڪئميرا تمام گهڻو پري هلندو آهي يا تمام گهڻو گھمندو آهي، ته منظر خراب ٿيڻ شروع ٿي سگهي ٿو. هون يوان جي هائبرڊ تاريخ جي ڪنڊيشننگ ان کي گهٽائي ٿي، پر وڏيون نقطه نظر واريون تبديليون اڃا تائين بناوت جي خرابين يا وارپڊ جاميٽري جو سبب بڻجي سگهن ٿيون. هن وقت، اهو هڪ ريسرچ پريويو جي طور تي بهترين ڪم ڪري ٿو، ڪجهه جيڪو ڏيکاري ٿو ته ڇا ممڪن آهي، هڪ مڪمل طور تي کيڏڻ لائق تجربي جي بدران.
آخري سوچون
هن مرحلي تي، تصور مضبوط آهي. ان ۾ ظاهري صلاحيت آهي ته ان پٽ تي هلندڙ وڊيو کي ڪيئن شڪل ڏئي سگهجي ٿي ته جيئن اهو گيم پلي وانگر نظر اچي ۽ محسوس ٿئي. پر اهو اڃا ابتدائي آهي. هي هڪ ريسرچ ڊيمو آهي، هڪ تيار ٿيل پراڊڪٽ نه آهي. وڌايل راند سيشن لاءِ اعليٰ ريزوليوشن تي حقيقي وقت جي پيداوار اڃا تائين هڪ ٽيڪنيڪل چئلينج آهي.











