Gaming AI: t: NVIDIA opettaa hermoverkkoa Pac-Manin luomiseen

Viime viikon virtuaalisen GTC-avainsanan ja heidän Ampere-arkkitehtuurinsa julkistamisen jälkeen NVIDIA on pitänyt tällä viikolla konferenssiaikataulunsa takana. Kuten todellisessa tapahtumassa, yritys on lähettänyt lukuisia istuntoja kaikesta NVIDIAsta, Amperesta CUDAan ja etätyöpöydälle. Mutta ehkä mielenkiintoisin keskustelu - ja varmasti hauskinta - on peräisin NVIDIA: n tutkimusryhmältä.

Ryhmä ilmoittaa opettaneensa hermoverkkoa Pac-Man, jonka tehtävänä on kehittää tulevaisuuden tekniikkaa ja löytää uusia käyttötapoja nykyiselle teknologialle.

Lue lisää

Ja ei, en tarkoita kuinka pelata Pac-Man. Tarkoitan kuinka olla Pac-Manin peli.

Esitys, jonka on tarkoitus olla samaan aikaan haamupöytäilyn 40-vuotispäivän kanssa, on tulossa NVIDIA: n Generative Adversarial Networks (GAN) -tutkimuksesta. Erittäin korkealla tasolla GAN-verkot ovat eräänlainen hermoverkko, jossa kaksi hermoverkkoa koulutetaan toisiaan vastaan ​​- tyypillisesti yksi oppii tekemään tehtävän ja toinen oppii havaitsemaan ensimmäisen, joka tekee kyseisen tehtävän - lopputavoitteena on, että Verkostojen välinen kilpailu voi auttaa parantamaan kahta verkostoa pakottamalla ne parantamaan voittoaan. Käytännöllisten sovellusten suhteen GAN-arvoja on tunnetuimmin käytetty tutkimusprojekteissa sellaisten ohjelmien luomiseen, jotka voivat luoda realistisen näköisiä kuvia todellisen maailman esineistä, skaalata olemassa olevia kuvia ja muita kuvan synteesin / manipuloinnin tehtäviä.

Pac-Manin osalta sopivan nimisen GameGAN-projektin takana olleet tutkijat kuitenkin astuivat askeleen pidemmälle ja keskittyivät GAN: n luomiseen, joka voidaan opettaa videopelin jäljittelemiseksi / luomiseksi. Tähän sisältyy pelin ulkoasun palauttamisen lisäksi tärkeimmän mahdollisesti myös pelin sääntöjen palauttaminen. Pohjimmiltaan GameGAN on tarkoitettu oppimaan kuinka peli toimii katsomalla sitä, ei toisin kuin ihminen.

Ensimmäisessä projektissaan GameGAN-tutkijat asettuivat Pac-Maniin, joka on yhtä hyvä lähtökohta kuin mikään muu. Vuoden 1980 pelillä on suhteellisen yksinkertaiset säännöt ja grafiikat, ja ratkaisevan tärkeä koulutusprosessin kannalta, täydellinen peli voidaan pelata lyhyessä ajassa. Seurauksena yli 50 XNUMX koulutuksen jaksoa tutkijat opettivat GAN: lle kuinka olla Pac-Man pelkästään antamalla hermoverkon katsella pelaamista peliä.

Ja mikä kaikkein vaikuttavinta, hullu asia todella toimii.

NVIDIA: n julkaisemassa videossa yritys esittelee lyhyesti Pac-Manin kouluttaman GameGANin toiminnassa. Vaikka tuloksena oleva peli ei ole pixel-täydellinen Pac-Man-virkistys - etenkin GameGANin simuloitu resoluutio on alhaisempi - peli näyttää kuitenkin siltä ja toimii kuten Pac-Manin arcade-versio. Eikä se ole vain ulkonäön suhteen: Pac-Manin GameGAN-versio hyväksyy pelaajien syötteet, aivan kuten oikea peli. Itse asiassa, vaikka se ei ole vielä valmis julkiseen kulutukseen, NVIDIA on jo sanonut, että he haluavat julkaista julkisesti pelattavan version kesällä, jotta kaikki voivat nähdä sen toiminnassa.

Peliin liittyvään tutkimusprojektiin sopivana GameGAN: n koulutus ja kehitys oli toisinaan yhtä typerä. Koska verkon piti kuluttaa tuhansia tuhansia pelisessioita - ja NVIDIA ei todennäköisesti halua maksaa työntekijöilleen pelata Pac-Mania koko päivän -, tutkijat luottivat Pac-Man -pelaamiseen bottiin pelataksesi peliä automaattisesti. Seurauksena on, että AI, joka on GameGAN, on olennaisesti kouluttanut toisen AI: n Pac-Maniin. Eikä tämä ole ilman vaikutuksia - tutkijat ovat heidän esityksessään huomauttaneet, että koska Pac-Man-botti oli niin hyvä pelissä, GameGAN on kehittänyt taipumuksen välttää Pac-Manin tappamista ikään kuin se olisi osa sääntöjä. Mikä, ellei muuta, on paljon lohduttavampaa kuin huomata, että pian tulevat AI-päällikkömme pelaavat suosikkeja.

Kaiken kaikkiaan, GameGAN: n kouluttaminen Pac-Manille kesti quad GV100 -asennuksen neljä päivää, jonka aikana se seurasi 50,000 4 pelisessioita. Mikä 100 GV84.4: n GPU: lla on 10 miljardia transistoria, mikä tarkoittaa käytännössä käytetyn laitteiston määrää, mikä on lähes 80 miljoonaa kertaa enemmän transistoreita kuin alkuperäisessä arcade-pelin ZXNUMX-prosessorissa. Joten vaikka GAN: n opettaminen kuinka olla Pac-Man, on uskomattoman vaikuttava, se ei ehkä ole erityisen tehokas tapa suorittaa peliä.

Samaan aikaan hahmottamisella, kuinka opettaa hermoverkko olemaan Pac-Man, on sillä myös joitain käytännöllisiä tavoitteita. Tutkimusryhmän mukaan tällä hetkellä suuri painopiste on tämän konseptin käyttämisessä simulaattorien nopeampaan kouluttamiseen, jotka ihmisten on perinteisesti rakennettava huolellisesti kaikkien mahdollisten vuorovaikutusten kaappaamiseksi. Jos neuraaliverkko voi sen sijaan oppia, kuinka jokin käyttäytyy seuraamalla tapahtuvaa ja mitä tuloja tehdään, tämä voisi mahdollisesti tehdä simulaattorien luomisesta paljon nopeampaa ja helpompaa. Mielenkiintoista, että koko konsepti johtaa itsestään palautettavaan silmukkaan, koska tarkoituksena on sitten käyttää näitä simulaattoreita kouluttamaan sitten muille hermoverkoille tehtävän suorittamista, kuten NVIDIA: n suosikki tavoite itsenäisistä autoista.

Viime kädessä riippumatta siitä, johtaako se reaalimaailman voittoihin tai ei, hermostoverkossa on jotain huvittavan inhimillistä oppia peliä tarkkailemalla - jopa (ja varsinkin), jos se ei aina oppi haluttua oppituntia.

Alkuperäinen artikla

Related viestiä