torstai 5. maaliskuuta 2015

Dragon Dictation puheentunnistusohjelma

Testailin iPhonella Nuancen Dtagon Dictation ohjelmaa joka muuntaa puheen tekstiksi. Dragon on ladattavissa ilmaiseksi iOS-laitteille. Tietokoneelle saatavilla oleva Dragon NaturallySpeaking -ohjelma on tosin maksullinen, mutta myös kattavampi toiminnoiltaan.


 Dragon Dictationin käyttöliittymä on mukavan selkeä ja yksinkertainen. Punapalloista nappia painamalla voi aloittaa sanelemisen ja sitten painaa "valmis" kun haluaa lopettaa tai pitää tauon. Saneltu teksti ilmestyy näytölle, jossa sitä voi muokata tuomalla näppäimistön esille tai jatkaa nauhoittamista painamalla nauhoita-nappia uudelleen.

Välimerkit, kuten pisteet ja pilkut, pitää joko puhua ääneen tai sitten muokata ne näppäimistöllä jälkeenpäin.


Vetämällä sormea tekstin yli voi valita sanoja ja poistaa ne näpäyttämällä ilmestyvää valikkoa. Kun teksti on valmis, sen voi kopioida, lähettää sähköpostitse tai tekstiviestillä tai jakaa sosiaalisessa mediassa. Asetuksista saa muunmuassa vaihdettua kielen, joita onkin saatavilla kiitettävä valikoima.


Kokeilin tönköllä suomiaksentillani pölistä monilla eri kielillä ja tulokset olivat yllättävän tarkkoja. Tosin joitain ongelmasanojakin löytyi. Niinkin tärkeä sana kuin "Finland" vääntyi lukuisiin eri muotoihin kuten "mom" ja "Greenland". Vaikka kuinka moneen kertaan toistin ja yritin muunnella ääntämystä, erittäin harva onnistui oikein. Voi olla myös että hento äänensavyni aiheuttaa hankaluuksia.

Monikielisyyden tuessa on hauskaa se, että Dragonia voisi käyttää kielten harjoitteluun. Huomasin keskittyväni paljon enemmän sanojen ääntämykseeni ja oli mukavaa huomata että ohjelma ymmärsi puhettani. Tuntui kuin olisi saanut välitöntä palautetta, vaikka aina ei osannutkaan aina arvioida milloin puheentunnistuksessa itsessään oli ongelmia.

Silti, varsinkin japaninkielisen tekstin kanssa oli opettavaista nähdä puhuttu lause kirjoitusmerkein kirjoitettuna. Tästä olisi iso hyöty kirjoitusmerkkien opiskelussa, varsinkin kun itselle tuntemattomat merkit piti käydä tarkistamassa Google Translate -ohjelmassa jotta varmistui oikean viestin menneen perille.


Apuvälinekeskuksesta suositeltiin Dragonin kanssa käytettäväksi erillistä mikrofonia. iPadin tai iPhonen omakin mikrofoni toimii, mutta tunnistuksen tarkkuus heikkeni hieman. Lisäksi varsinkin iPadin mikrofonia on hankala pitää suun lähettyvillä ja taustamelu sekoittuu mukaan helpommin. Itse käytin iPhonen mukana tulleita mikrofonillisia kuulokkeita. En tiedä toimisiko laadukkaampi mikrofoni paremmin, mutta huomasin että H-kirjaimella alkavat sanat jäivät helposti pois tai ymmärrettiin väärin.

Kaiken kaikkiaan olin melko vaikuttunut että näinkin tarkkaa puheentunnistusta on saatavilla ilmaiseksi. Ainoa iso haittapuoli joka vaivasi oli se ettei tekstiä nähnyt nauhoituksen aikana kuten tietokoneversiossa. Tämän takia on vaikea kuvitella kenenkään latelevan pitkiä tekstipätkiä koska kokonaiskuvaa ja tekstin jatkuvuutta on vaikeaa pitää mielessä. Dragon ei myöskään kunnolla tue VoiceOver -ruudunlukijaa, joten sokeille ohjelmasta ei ole hyötyä.

Käyttäjien kannattaa myös olla tietoisia että Dragon tallentaa kaiken puheen palvelimillensa ohjelman kehittämistä varten. Käyttöönottovaiheessa voi myös sallia Dragonin käyttää iPhonen yhteystietoja jotta nimien tunnistaminen toimisi oikein.

Vaikea sanoa kuinka huolissaan yksityisyydestään tulisi Dragonin suhteen olla. Nuance on jokatapauksessa kuuluisimpia puheentunnistusohjelmistojen kehittäjiä ja sen rakentamia algoritmeja käyttää esimerkiksi myös Apple omassa Siri -assistantti ohjelmassaan.

Siristä puheen ollen ja muutenkin puheentunnistukseen liittyen: Siri on itsessäänkin varsin mielenkiintoinen apuväline, sillä se tarjoaa puheen kautta monia eri toimintoja iOS:lle. Harmiksi suomenkielen tuki ei ole vielä saatavilla, tosin ruotsi lisättiin juuri muutama viikko sitten joten eiköhän suomalaisetkin kohtapuoliin pääse Sirille juttelemaan.


Lisää aiheesta:
- Nuancen kotisivut
- Dragon Dictation AppStoressa
- Video demo: Dragon NaturallySpeaking
- Autistisen pojan kokemus Siri-assistantista








4 kommenttia:

  1. Olet kuvannut todella hyvin tämän puheentunnistusohjelman hyviä ja huonoja puolia. Erityisen merkittävää on mielestäni se, että olet myös pohtinut sitä, miten ohjelmaa voisi hyödyntää opetuksessa. Näitä sovelluskohteita eri oppiaineisiin ja tilanteisiin kannattaa listata. Siitä on valtavasti apua sitten, kun perehdytät tulevia käyttäjiä ohjelman saloihin. Ja tämä pätee myös muihin apuvälineisiin kuten skannaavan kynän käyttöön.

    Huomasin juuri, että tunnisteet eivät näy blogin reunassa. Saat tunnisteet näkyviin ulkoasu- sivulta --> muokkaa --> näytä kaikki tunnisteet.

    VastaaPoista
  2. Hyviä neuvoja ja ohjaita. Kokeilin löytää Sirin puhelimestani, mutta en osannut. Help me, please :)

    VastaaPoista
    Vastaukset
    1. Asetukset->Yleiset->Siri

      Kaikki laitteet ei Siriä tue, mutta uudemmat ainakin.

      Poista