Psykolingvistista puhumisen arviointia?

EALTA:n (European Association for Language Testing and Assessment) neljäs kesäkoulu on parhaillaan käynnissä Innsbruckissa 18.-22.7.2016. Teemana on tuottamistaitojen arviointi erityisesti tehtävänlaadinnan ja arviointikriteerien kannalta.

Kurssilla ja kurssin oheismateriaaleissa esiteltiin itselleni uudenlainen tapa arvioida puhumisen taitoa. Alistair Van Moere kuvaa menetelmää artikkelissaan A psycholinguistic approach to oral language assessment (Language Testing 29 (3), 325-344). Menetelmä perustuu reagointinopeuden ja automatisoitumisen arviointiin. Automatisoitumisella tarkoitetaan tässä suorituksen sujuvuutta, tarkkuutta ja kompleksisuutta.

Olemme tottuneet laatimaan edistyneempien kielenoppijoiden puhumisen arvioinnin tehtäviä siitä näkökulmasta, että voisimme arvioida kompleksisten rakenteiden ja harvinaisemman sanaston käyttöä. Samalla testattavalla on usein käytettävissä jonkin verran aikaa tuotoksen suunnitteluun. Van Moere esittää kuitenkin, että voisimme mieluummin keskittyä arvioimaan nopeutta ja tarkkuutta yksinkertaisemmissa ja tutummissa puhetilanteissa.

Van Moere perustelee näkemystään seuraavilla seikoilla. Ensinnäkin kielen prosessointi nojaa enemmän sanaston kuin syntaksin käsittelyyn. On olennaista, kuinka sanastoa ja yhteen liittyviä sanakasaumia (chunks) pystytään hakemaan käyttöön pitkäkestoisesta muistista. L2-oppijoilla toimintojen automatisoituminen on keskeistä. Toiseksi L1-puhujatkin käyttävät enemmän idiomeja ja tuttua, jokapäiväistä sanastoa; samoin useimmat puhetilanteet ovat luonteeltaan toistuvia eivätkä erityisen luovia.

Esitelty psykolingvistinen puhetesti koostuu kahdesta osasta. Ensimmäinen on lauseiden toistamistehtävä (elicited imitation). Testattava kuulee yksitellen 12 virkettä, ja hänen tehtävänään on toistaa ne välittömästi maksimivastausajan ollessa 6 sekuntia. Virkkeet vaikeutuvat koko ajan: niiden sanasto harvinaistuu, rakenteet monimutkaistuvat ja harvinaistuvat, virkkeet pitenevät ja puhenopeus kasvaa. Olennaista on myös kontrolloida tapaa, jolla virkkeet esitetään, kuten painotusta, ääntämisen selkeyttä, äänen voimakkuutta ja laatua. Toisessa osassa testattava kuulee 10 virkettä jaettuna kolmeen sattumanvaraiseen osaan, esimerkiksi ”was reading / my mother / her favorite magazine”, ja hänen on toistettava virke kieliopillisesti oikeassa järjestyksessä. Koko testin pituus on 10 minuuttia. Täysin oikeasta suorituksesta annetaan 1 piste mutta myös osin virheellisistä annetaan pisteiden osia virheiden määrän perusteella.

Ensivaikutelmani oli, etteivät tehtävät ole millään tavoin autenttisia. Van Moere kuitenkin väittää, että puheessa on tavallista kopioida puhekumppanin käyttämiä sanoja ja rakenteita ja että kyseinen toiminta on jäljiteltävän puhujan näkökulmasta palkitsevaa (jopa siinä määrin, että asiakkaiden puhetta toistavat tarjoilijat palkitaan suuremmilla juomarahoilla!). Toisaalta Van Moeren mukaan autenttisemmissa vapaan puheen puhetehtävissä testiolosuhteet ovat vähemmän kontrolloidut ja arviointi on siksi vähemmän luotettavaa ainakin toistettavuudeltaan.

Artikkelissa viitataan useisiin tutkimuksiin, joissa menetelmän toimivuutta on selvitetty ainakin 1980-luvulta lähtien, mutta jätän nyt nämä tutkimukset blogini ulkopuolelle. Tehtävätyyppiä pidetään tehokkaana ja toimivana ja sen katsotaan erottelevan puhujia toisistaan ainakin C1-tasolle asti. Luonnollisestikin edistyneemmät testattavat ja natiivit kielenpuhujat kykenevät toistamaan pidempiä ja kompleksisempia virkkeitä. Selviytyminen edellyttää huomion kiinnittämistä sekä muotoon että merkitykseen. Lisäksi etuna on testitilanteen standardisoiminen: kaikki testattavat käyvät läpi samanlaiset psykolingvistiset prosessit, ja sekä syötös että tuotos ovat standardoituja. Tämä poistaa tutun puhetestin ongelmatilanteen, jossa yksi testattava pyrkii sujuvuuden hinnalla muodostamaan rakenteellisesti kompleksisia ilmauksia, kun taas toinen pitäytyy yksinkertaisissa rakenteissa mutta on nopeudeltaan ja tarkkuudeltaan parempi.

Toki tehtävätyypissä on puutteensakin: Se on luonteeltaan integroiva, jolloin on vaikea tietää, johtuuko heikko suoritus ymmärtämisen vai tuottamisen ongelmista. Suurten testattavamäärien arviointi voi olla arvioijalle varsin rasittavaa (Van Moeren kuvaamassa koetilanteessa arviointi sujuikin koneellisesti). Suurimpana puutteena Van Moeren pitää kuitenkin tehtävätyypin heikkoa validiteettia testattavien keskuudessa, siis heikkoa katu-uskottavuutta. Tehtävätyyppiä voisi mielestäni kuitenkin kokeilla ainakin kursseilla. Valitettavasti valmiita suomenkielisiä materiaaleja ei vielä taida olla olemassa.


Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out /  Muuta )

Google photo

Olet kommentoimassa Google -tilin nimissä. Log Out /  Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out /  Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out /  Muuta )

Muodostetaan yhteyttä palveluun %s