Arkistoaarre: Tekoäly mullistaa videopelit – oppivat koneet luovat yksityiskohtia tyhjästä

Janne Pyykkösen muutaman vuoden takainen artikkeli peligrafiikan mullistavasta tekoälyvallankumouksesta on nyt kaikkien luettavissa.

9.3.2021 13:13

Artikkeli on julkaistu alkujaan huhtikuussa 2019 entisessä Pelaaja Extra -palvelussa.

Itseään opettavat neuroverkot saattavat olla pelintekemisen seuraava vallankumous. Tulevaisuuden tekniikan mahdollisuudet voi kokea jo tänään.

Tiedäthän sen kohdan Blade Runner -elokuvassa tai huonoissa poliisisarjoissa, kun etsivä käskee tietokonetta zoomaamaan ja parantamaan valokuvaa? Kone taikoo silloin pienestä ja rakeisesta kuvasta epäillyn naaman kaltaisia yksityiskohtia, jotka olivat aiemmin pelkkää tuhrua. Todellisuudessa sellainen on ollut kuvitelmaa, sillä se vaatisi, että kone osaa tulkita näkemäänsä ja parannella kuvia tavalla, joka vaatisi lähes ihmisen luovuutta. Vuonna 2019 se on kuitenkin jo todellisuutta.

Taustalla on sama tekoälyyn ja neuroverkkoihin liittyvä kehitys, joka on mullistamassa videopelien tekemisen. Samassa teknologiassa ovat avaimet parempiin tekoälyhahmoihin tai jopa loputtoman laajoihin avoimiin pelimaailmoihin. Esimakua tulevaisuudesta voi kokea jo nyt pelimodeissa, joissa tekoälyä apuna käyttävät harrastajat muuntavat vanhan peligrafiikan nykynäytöille sopivaksi.

Yksityiskohtia tyhjästä

Videopelien tekemisessä yhä suuremmaksi kustannuseräksi on noussut näyttöjen ja televisioiden tarkkuus, joka edellyttää peleiltä yhä yksityiskohtaisempaa taidetta. Tarkkuudeltaan valtavien tekstuurien eli pintakuvioiden piirtäminen työllistää taiteilijoita paljon rankemmin kuin vanha pikselitaide. Tekoälyllä on mahdollista helpottaa juuri tätä ongelmaa, ja sitä voi käyttää jo nyt retropelien kaunistamiseen.

Katsotaanpa irrotettua taustakuvaa LucasArtsin klassikkoseikkailu Monkey Island 2: LeChuck’s Revengestä. Alkuperäinen kuva olisi nykynäytöille ja -puhelimille pelkkä postimerkki. Jos se halutaan venyttää suuremmaksi, perinteisesti työhön käytettäisiin erilaisia matemaattisia laskukaavoja. Niiden lopputuloksena on tällainen suurempi kuva, joka on joko sumuinen ja tuhnuinen tai pikselineliöiden muodostama.

Katsotaanpa kuitenkin seuraavaa esimerkkikuvaa, joka on jotain aivan uutta. Jos luet tätä puhelimella, yksityiskohtia voi olla vaikea huomata. Lähelle zoomatessa on kuitenkin selvää, että tässä kasvatetussa kuvassa on täysin uusia yksityiskohtia, joita ei edes ollut alkuperäisessä kuvassa. Nämä yksityiskohdat on kehittänyt sekunneissa omalle tietokoneelleni asennettu tekoälysovellus.

Tulokset eivät ole täydellisiä, mutta kyseessä ei ole pelien paranteluun tehty järjestelmä. Asialla on tutkijatiimin luoma neuroverkko, joka keskittyy oikeasti maisemavalokuvien paranteluun. Maallikolle taikuudelta kuulostavan teknologian taustalla on ohjelmistoja, joita ei ohjelmoida vaan koulutetaan.

Oppivat koneet

Kaiken takana on käsite artificial neural network eli neuroverkko, modernin tekoälytutkimuksen peruskivi. Se on tietojenkäsittelyn malli, jonka idea ja rakenne pohjautuvat ihmisaivoihin. Yhtenä sen tärkeimmistä kehittäjistä pidetään psykologi Frank Rosenblattia, joka kehitteli yrityksen ja erehdyksen kautta toimivan tietokoneen periaatteita jo 1950-luvun lopulla.

Keinotekoisen neuroverkon peruspalanen on ns. neuroni, joka on nimetty ihmisaivojen hermoimpulsseja eli tietoa välittävän solun mukaan. Yksi neuroni on yksinkertainen tietojenkäsittely-yksikkö, joka on kytketty toisiin neuroneihin. Nämä neuronit on rakennettu kerroksiin, joista ensimmäinen ottaa vastaan syötetyn tiedon ja viimeinen antaa tiedosta tehdyn tulkinnan. Niiden välissä on muita, ns. kätkettyjä kerroksia täynnä monimutkaisia yhteyksiä.

Tekoälyn toinen tärkeä perusajatus on koneoppiminen. Sillä tarkoitetaan ohjelmien kehittämistä tavalla, johon ei liity perinteistä ohjelmointia. Sen sijaan ohjelman tai koneen annetaan oppia ihan itse, yrityksen ja erehdyksen kautta. Neuroverkot ja koneoppiminen yhdistyvät termissä deep learning eli syväoppiminen. Moderneja neuroverkkoja kehitellään siksi, että tietokoneilla olisi kyky käsitellä monimutkaista tietoa, jonka tulkitseminen on liian vaikeaa perinteisille ohjelmille. Deep learning -nimi juontaa siitä, että neuroverkot ovat usein erittäin monimutkaisia rakennelmia, joissa on runsaasti kerroksia eli ”syvyyttä”.

Syväoppiminen ja neuroverkot kykenevät nykypäivänä ns. kapean tekoälyn luomiseen. Se ei ole scifielokuvista tuttu ja ihmisen lailla ajatteleva rakennelma vaan äärimmäisen erikoistunut työkalu, joka osaa erittäin hyvin yhden ainoan asian. Ne eivät oikeasti ajattele tai päättele asioita vaan esimerkiksi tunnistavat kuvioita. Verrattuna perinteisiin ohjelmiin neuroverkot ovat erittäin hyviä esimerkiksi tunnistamaan esineitä valokuvista tai ymmärtämään ihmispuhetta. Tietokoneiden tehon lisäksi tärkeä osa niiden kehityksessä on ollut tapa, jolla ne koulutetaan – tai jolla ne itse asiassa kouluttavat toisiaan.

Tekoälyjen kaksintaistelu

Neuroverkot oppivat asioita koulutuksen eikä ohjelmoinnin kautta. Käytännössä se tarkoittaa esimerkiksi sitä, että jos tekoälyn halutaan tunnistavan autoja valokuvasta, sille näytetään tuhansia ja tuhansia valokuvia autoista. Ihmiseltä saamansa palautteen perusteella se luo valmiin mallin, jota voi sen jälkeen käyttää autojen tunnistukseen muttei todennäköisesti mihinkään muuhun.

Mallin luominen voi viedä hyvinkin kauan, ja syvien verkkojen käyttäminen vaatii paljon laskentatehoa. Sitä saadaan nykyisin erityisesti moderneista näytönohjaimista, ja esimerkiksi Nvidian tuoreiden mallien ns. Tensor-ytimet ovat erittäin tehokkaita laskemaan tekoälyn koulutusmalleja.

Lisäksi mallien luominen on aikaa vievää puuhaa, eikä videopelien kehityksessä asioita ainoastaan tunnistava ja lajitteleva tekoäly edes auta. Siihen tarvitaan jotain, joka osaa luoda uutta. Ratkaisu ovat uuden polven neuroverkot, jotka osaavat luoda asioita ja kouluttaa itsensä. Niitä kutsutaan nimellä GAN eli generative adversarial network. Sellaisia ovat myös alun esimerkkikuvan luoneet ESRGAN- ja SFTGAN-verkot.

GAN koostuu kahdesta eri verkosta, jotka ovat sodassa keskenään. Generatiivinen eli luova osa koulutetaan aluksi näyttämällä sille mallikuvia. Sitten sen käsketään luoda aivan uusia samanlaisia kuvia, joissa yhdistyvät opiskeltu materiaali ja satunnaiselementti. Jos verkolle on näytetty esimerkiksi hassuja kissakuvia, sen käsketään luoda tuhansia erilaisia väärennettyjä lolcateja. Ensimmäisen verkon vihollinen on tunnistava verkko, diskriminaattori, joka on opetettu tunnistamaan aitoja kissakuvia.

Paras vertaus kahden verkon suhteelle on taulujen väärentäminen. Ensimmäinen verkko on väärentäjä, joka yrittää luoda aidon näköisiä kopioita tauluista. Toinen verkko on taidetuntija, joka koetta erottaa väärennökset aidoista.

Molemmat antavat toisilleen palautetta onnistumisista ja epäonnistumisista, kunnes kuvia luova verkko osaa kehittää väärennöksiä, joita tarkastaja ei voi enää erottaa aidoista. Silloin luova malli on niin hyvä, että se saattaa huijata jopa ihmissilmää. Se tietää tuhansien esimerkkien kautta sen, millaisia asioita aidossa, käsittelemättömässä kuvassa pitäisi näkyä. Tuloksena on esimerkiksi yllä oleva ”valokuva” lapsesta, joka on oikeasti naamoja opiskelleen StyleGAN-neuroverkon tuottama väärennös. Niitä voit itsekin tuottaa loputtomasti ThisPersonDoesNotExist-sivulla.

Pelintekemisen vallankumous

Koska GAN-verkot sopivat hyvin kuvien paranteluun ja luomiseen, grafiikan parantamiseen koulutettu neuroverkko voi helposti muuntaa vanhoja epätarkkoja tekstuureja nykytarkkuuksiin. Osaa näistä ohjelmistoista, jotka on luotu kilpailuihin ja tutkimustarkoituksiin, jaetaan vapaasti netissä. Valmiiden ja koulutettujen mallien ansiosta lähes kuka tahansa voi valjastaa ne nopeasti käyttöön, ja pelejä muunteleva modausyhteisö on ottanut ne riemulla vastaan.

Päivitysprosessi on yksinkertainen: pelien pintatekstuurit irrotetaan kuviksi ja ajetaan GAN-verkon läpi, minkä jälkeen ne korvaavat pelin vanhat tekstuurit. Käytännössä työ vaatii usein myös ihmisen tekemää jälkikäsittelyä ja viilaamista, mutta ajansäästö on valtava. Tarjolla on jo nyt modeja esimerkiksi peleistä Doom 2, Morrowind, Max Payne ja Final Fantasy VII.

Tekoäly ei ole suinkaan vain amatöörien käsissä, sillä esimerkiksi Nvidia on kehittämässä omaa Gameworks: Materials & Textures -työkalusettiään pelintekijöille. Lisäksi yhtiö on esitellyt muun muassa neuroverkon luomaa avointa pelimaailmaa, joka luodaan täysin eri tavalla kuin perinteinen 3D-ympäristö. Tekoäly on koulutettu näyttämällä sille autoiluvideoita, joten se osaa luoda aidon näköistä katukuvaa liikenteen kera.

Koska neuroverkot ovat hyviä tunnistamaan kuvioita ja luomaan niiden pohjalta lisää materiaalia, niitä voidaan käyttää tulevaisuudessa myös monenlaisten suurten pelimaailmojen luomiseen. Pelintekijät luovat vain pienen siivun maailmaa, jolloin tekoäly luo siitä mallin ja sen pohjalta lisää maisemia.

Nvidia on esitellyt myös piirtämisen mullistavaa GAUGAN-verkkoa. Sen käyttäjä piirtää ruudulle karkeita muotoja, joita maisemakuvilla koulutettu neuroverkko muuntaa silmänräpäyksessä lähes aidon näköisiksi ”valokuviksi”.

Tekoäly voi auttaa myös älykkäämpien pelihahmojen ja bottien kehityksessä. Neuroverkko nimeltä OpenAI Five on jo todistanut olevansa ihmisjoukkuetta parempi pelaaja Dota 2:ssa. Parempi tekoäly ei tarkoita kuitenkaan vaan vaikeutta, vaan neuroverkoilla voidaan luoda tulevaisuudessa esimerkiksi realistisemmin reagoivia ja inhimillisemmältä vaikuttavia hahmoja. Neuroverkot osaavat jo nyt jotain, joka vaikuttaa ihmissilmään luovuudelta: Googlen syväoppimiseen pohjaava DeepDream-ohjelma voi muuntaa tavallisia valokuvia kummallisiksi hallusinaatioiksi.

Tekoälyä on käyttänyt pelintekemisessä jo kotimainen pelitalokin. Perinteisesti videopelien kasvoanimaatiot ja huulien liikkeet puhuttaessa on kehitetty käsin animoimalla tai videoimalla näyttelijöiden kasvonliikkeitä. Suomalainen Remedy-studio on kuitenkin kehittänyt yhteistyössä Nvidian kanssa neuroverkkoon pohjautuvaa järjestelmää, joka osaa yksinään animoida pelihahmojen kasvot aidon näköisillä ilmeillä.

Väärennetty tulevaisuus

Tekoälyn tulevaisuus ei ole kuitenkaan pelkkä auvoa, sillä neuroverkkojen kyky luoda ja tunnistaa kuvia kasvattaa huolta niiden väärinkäytöstä. Viime vuosina kohua aiheutti ns. Deepfake-pornoskandaali, jossa Googlen TensorFlow-tekoälyohjelmaan pohjaava FakeApp loi väärennettyjä seksivideoita julkkiksista.

Kyse oli GAN-tyylisestä järjestelmästä, jossa kuka tahansa sen tietokoneelleen ladannut saattoi vaihtaa ihmisten kasvoja videoissa. FakeAppin ja sen seuraajien käyttö vaatii vain runsaasti kuvamateriaalia kohteiden kasvoista, joten se toi tekoälyn väärinkäytön mahdollisuudet koko kansan ulottuville. Lopputuloksen erottaa edelleen väärennökseksi, mutta kuinka kauan? Samaa teknologiaa hyödyntäviä videoita on jo alkanut yleistyä YouTubessa.

Pahimmissa kauhukuvissa siintää tulevaisuus, jossa neuroverkot voivat luoda täysin aidolta näyttäviä ja väärennettyjä kuvia ja videoita sekä jopa aidolta kuulostavaa puhetta. Silloin ihminen ei välttämättä näe totuutta omilla aisteillaan, ja väärennöksen huomaa vain paremmin koulutettu tekoäly. Tosimaailmassa se, että todellisuutta ei voi erottaa valeesta, kuulostaa painajaiselta. Videopeleissä se saattaa olla täyttä unelmaa.


Lisää luettavaa