Huomasin viime viikolla, että Googlen kielityökalut olivat saaneet suomen kielen joukon jatkoksi. Vielä merkittävämpi muutos on kiinnitetyistä kielipareista (25 kaksisuuntaista paria) luopuminen ja konekäännöksien tarjoaminen kaikkien tarjolla olevien kielien välille (24 x 24 = 276 käännösparia). Suomi ja muut eksoottisemmat kielet ovat tarjolla kaikissa muissa Googlen kielityökaluissa paitsi sanakirjassa.
Wikipedian mukaan Google on luonut valmiiden kieliparien väliset käännöskoneet käsittelemällä eri kielille käännettyjä YK-aineistoja tilastollisesti. Aluksi Googlen kielikoneessa olikin ilmeisesti tarjolla vain YK:n kuuden virallisen kielen (arabia, kiina, englanti, ranska, venäjä ja espanja) väliset kieliparit.
Koska kaikkien 24:n tarjolla olevan kielen välille ei ole luotu suoria kielipareja, ovat joidenkin kielten väliset käännökset mahdollisia vain välikielen avulla. Kielityökalujen ohjelmointirajapinnassa kerrotaan, että välikielenä käytetään englantia.
Suomeen kääntäminen toimiikin yllättävän hyvin esimerkiksi kiinasta. Kokeilin kääntää kiinankielisen Suomi-artikkelin Wikipediasta. Artikkelin noin 1250 sanan joukossa on hyvin vähän alkukielisiä sanoja (noin 10) ja välikieltäkin vain noin 30 sanan verran. Parhaimmillaan kone kääntää selkeitä ja osuvia lauseita kuten
“Toisen maailmansodan aikana Suomi käsittelee Neuvostoliiton kahdesti”
Joskus kielioppivirheet ja tuplakäännöskukkaset kasautuvat näin:
“Matkustus Suomen kansaa, jos ei pestä sauna, vastaa ei ollut Suomi.”
Samalla löytyi asiavirheitäkin: Suomen kulttuuri -osiossa kerrotaan kiinaksi, että suomalaiset lapset odottavat jouluna lahjojen saapuvan takan savupiipun kautta takan reunalle ripustettuihin sukkiin. Nyt voisi tietysti kokeilla artikkelin korjaamista Googlen kielityökalujen avulla… tai sitten ei.