torstai 5. maaliskuuta 2015

Dragon Dictation puheentunnistusohjelma

Testailin iPhonella Nuancen Dtagon Dictation ohjelmaa joka muuntaa puheen tekstiksi. Dragon on ladattavissa ilmaiseksi iOS-laitteille. Tietokoneelle saatavilla oleva Dragon NaturallySpeaking -ohjelma on tosin maksullinen, mutta myös kattavampi toiminnoiltaan.


 Dragon Dictationin käyttöliittymä on mukavan selkeä ja yksinkertainen. Punapalloista nappia painamalla voi aloittaa sanelemisen ja sitten painaa "valmis" kun haluaa lopettaa tai pitää tauon. Saneltu teksti ilmestyy näytölle, jossa sitä voi muokata tuomalla näppäimistön esille tai jatkaa nauhoittamista painamalla nauhoita-nappia uudelleen.

Välimerkit, kuten pisteet ja pilkut, pitää joko puhua ääneen tai sitten muokata ne näppäimistöllä jälkeenpäin.


Vetämällä sormea tekstin yli voi valita sanoja ja poistaa ne näpäyttämällä ilmestyvää valikkoa. Kun teksti on valmis, sen voi kopioida, lähettää sähköpostitse tai tekstiviestillä tai jakaa sosiaalisessa mediassa. Asetuksista saa muunmuassa vaihdettua kielen, joita onkin saatavilla kiitettävä valikoima.


Kokeilin tönköllä suomiaksentillani pölistä monilla eri kielillä ja tulokset olivat yllättävän tarkkoja. Tosin joitain ongelmasanojakin löytyi. Niinkin tärkeä sana kuin "Finland" vääntyi lukuisiin eri muotoihin kuten "mom" ja "Greenland". Vaikka kuinka moneen kertaan toistin ja yritin muunnella ääntämystä, erittäin harva onnistui oikein. Voi olla myös että hento äänensavyni aiheuttaa hankaluuksia.

Monikielisyyden tuessa on hauskaa se, että Dragonia voisi käyttää kielten harjoitteluun. Huomasin keskittyväni paljon enemmän sanojen ääntämykseeni ja oli mukavaa huomata että ohjelma ymmärsi puhettani. Tuntui kuin olisi saanut välitöntä palautetta, vaikka aina ei osannutkaan aina arvioida milloin puheentunnistuksessa itsessään oli ongelmia.

Silti, varsinkin japaninkielisen tekstin kanssa oli opettavaista nähdä puhuttu lause kirjoitusmerkein kirjoitettuna. Tästä olisi iso hyöty kirjoitusmerkkien opiskelussa, varsinkin kun itselle tuntemattomat merkit piti käydä tarkistamassa Google Translate -ohjelmassa jotta varmistui oikean viestin menneen perille.


Apuvälinekeskuksesta suositeltiin Dragonin kanssa käytettäväksi erillistä mikrofonia. iPadin tai iPhonen omakin mikrofoni toimii, mutta tunnistuksen tarkkuus heikkeni hieman. Lisäksi varsinkin iPadin mikrofonia on hankala pitää suun lähettyvillä ja taustamelu sekoittuu mukaan helpommin. Itse käytin iPhonen mukana tulleita mikrofonillisia kuulokkeita. En tiedä toimisiko laadukkaampi mikrofoni paremmin, mutta huomasin että H-kirjaimella alkavat sanat jäivät helposti pois tai ymmärrettiin väärin.

Kaiken kaikkiaan olin melko vaikuttunut että näinkin tarkkaa puheentunnistusta on saatavilla ilmaiseksi. Ainoa iso haittapuoli joka vaivasi oli se ettei tekstiä nähnyt nauhoituksen aikana kuten tietokoneversiossa. Tämän takia on vaikea kuvitella kenenkään latelevan pitkiä tekstipätkiä koska kokonaiskuvaa ja tekstin jatkuvuutta on vaikeaa pitää mielessä. Dragon ei myöskään kunnolla tue VoiceOver -ruudunlukijaa, joten sokeille ohjelmasta ei ole hyötyä.

Käyttäjien kannattaa myös olla tietoisia että Dragon tallentaa kaiken puheen palvelimillensa ohjelman kehittämistä varten. Käyttöönottovaiheessa voi myös sallia Dragonin käyttää iPhonen yhteystietoja jotta nimien tunnistaminen toimisi oikein.

Vaikea sanoa kuinka huolissaan yksityisyydestään tulisi Dragonin suhteen olla. Nuance on jokatapauksessa kuuluisimpia puheentunnistusohjelmistojen kehittäjiä ja sen rakentamia algoritmeja käyttää esimerkiksi myös Apple omassa Siri -assistantti ohjelmassaan.

Siristä puheen ollen ja muutenkin puheentunnistukseen liittyen: Siri on itsessäänkin varsin mielenkiintoinen apuväline, sillä se tarjoaa puheen kautta monia eri toimintoja iOS:lle. Harmiksi suomenkielen tuki ei ole vielä saatavilla, tosin ruotsi lisättiin juuri muutama viikko sitten joten eiköhän suomalaisetkin kohtapuoliin pääse Sirille juttelemaan.


Lisää aiheesta:
- Nuancen kotisivut
- Dragon Dictation AppStoressa
- Video demo: Dragon NaturallySpeaking
- Autistisen pojan kokemus Siri-assistantista








maanantai 2. maaliskuuta 2015

Internetselainten lisäosat apuna

Internetselaimiin on saatavilla lukemattomia erilaisia selaimen toimintaa ja ulkonäköä muokkaavia lisäosia. Googlen Chrome -selaimen lisäosavalikoima taitaa olla kaikkein laajin, mutta usein saman lisäosan saa ladattua kaikille eri selaimille tai vähintäänkin vastaavan samantyylisen toiminnon. Lisäosat saa ladattua ilmaiseksi ja helposti muutamalla klikkauksella. Kannattaa kuitenkin olla varuillaan ettei lataile epäilyttävältä vaikuttavia lisäosia. Liian monen lisäosan samanaikainen käyttäminen myös saattaa hidastaa selaimen käyttöä.


Readability

Sivun normaalinäkymä

Readability näkymä

Readability yksinkertaistaa nettisivun tekstiosuuden helppolukuiseksi. Kuvat ja turhat linkit karsitaan pois näkyvistä ja tekstin fontti yhtenäistetään selkeämmäksi. Kirjainkokoa, fonttia ja taustaväriä voi muokata halunsa mukaan. Readability vaatii joko kirjautumistunnutksen luomista tai liittämistä Facebook -tiliin jotta käyttäjä voi tallentaa artikkeleja omaan lukulistaan myöhemmin luettavaksi.

Kirjautuminen ennen Readabilityn käyttöönottoa
Tallennettujen artikkelien lukulista

Readability on saatavilla Chromelle, Firefoxille, Safarille ja monille mobiililaitteille. Se on myös sisäänrakennettuna iOS:n Safari-selaimeen, jossa osoiterivin vasempaan reunaan ilmestyy neliviivainen painike kun toiminto on käytettävissä.


Speak it!

Chrome
- Firefox

Speak it! on lisäosa joka lukee ääneen selaimen ikkunasta valitun tekstin. Speak it! tukee monia eri kieliä ja puhesyntetisaattoreita. Puheen nopeutta voi halutessaan hidastaa tai nopeuttaa. Olisin toivonut että Speak it! osaisi lukea sivun tekstin ilman valintaa, sillä pitkien tekstisisältöjen maalaaminen on hankalaa ja työlästä, varsinkin jos välissä on kuvia tai linkkejä. Tämän takia onkin suositeltavaa käyttää Speak it! -lukijaa yhdessä Readabilityn kanssa.

Speak it! asetukset

Valittua tekstin, avataan työkaluvalikosta Speak it! -valikko ja painetaan isoa painiketta luetuttamisen aloittamiseksi

AdBlock Plus


AdBlock Plus on lisäosa jolla saa karsittua pois suuren osan nettisivujen mainoksista. Tämä helpottaa sisällön hahmottamista ja luettavuutta. Harmiksi kaikki sivustot eivät suostu toimimaan kunnolla jos mainoksia yrittää karsia ja vaativat AdBlockin poistamista. Tällöin AdBlockiin voi lisätä poikkeuksen sallia mainokset vain tietyillä sivustoilla.

Työkaluvalikon AdBlock -valikosta näkee kuinka monta mainosta kyseiseltä sivustolta on estetty

Hiirieleet


crxMouse Chrome Gestures - Chrome
FireGestures - Firefox

Mikäli nettiselainten käyttämisessä ärsyttää jatkuva kuvakkeiden etsiminen ja valikoiden selailu, avuksi on kaksi vaihtoehtoa. Ensinnäkin voi käyttää näppäinkomentoja, mutta joillekkin niiden muistaminen voi olla hankalaa ja kädet kun eivät aina ole kätevästi näppäimistöllä valmiina.

Itse olen tykännyt käyttää hiiriele -lisäosia. Hiirieleillä käytetään hiiren liikkeitä laukaisemaan komentoja, kuten palaa edelliselle sivulle, avaa linkki uudessa välilehdessä tai sulje selain. Lisäosien eleet ja toiminnot vaihtelevat mutta useinmiten hiiren oikeaa näppäintä pidetään pohjassa ja "piirretään" kuvio tai viiva suorittamaan jokin toiminto. Selkeimpänä esimerkkinä vasempaan suuntaan piirretty viiva laukaisee edellinen sivu -toiminnon, kun taai oikeaan suuntaan piirretty viiva laukaisee seuraava sivu -toiminnon. Nämä hiirellä piirretyt viivat näkyvät selainikkunassa värikkäänä viiruna ja yleensä komennon toimintokin ilmoitetaan piirroksen yhteydessä. Käyttäjä voi muutella eleet vastaamaan haluamiaan toimintoja ja niitä oppii pienen harjoittelun jälkeen käyttämään sujuvammin kuin jos etsisi valikoita tai kuvakkeita.

crxMouse Chrome Gestures -lisäosan asetukset näyttävät monimutkaisilta mutta sitä saa muokattua monipuolisesti. Jokaisesta elekuviosta voi keksiä muistisäännön, esim "sulje välilehti" piirtyy niin kuin L-kirjain eli "lopeta"