Atzīmējot Eiropas Valodu dienu un publiskojot skaidrojošās un sinonīmu vārdnīcas jaunāko versiju, Tēzaurs.lv aicina savus lietotājus piedalīties sabiedriskajā iniciatīvā Balsutalka.lv. Dalībnieku uzdevums ir nolasīt dažus īsus teikumus, pievienojot savas runas ierakstu latviešu valodas datu kopai, kurā tiek iemūžināta mūsdienās runātā latviešu valoda, lai saglabātu to nākamajām paaudzēm un veicinātu pētījumu un tehnoloģiju attīstību jau šodien.
“Tikko ir iznākusi “Tēzaura” rudens versija, kurā aicinām ikvienu, arī daudzos un dažādos “Tēzaura” lietotājus piedalīties “Balsu talkā” – nolasīt vismaz piecus teikumus un pievienot savas balss ierakstu latviešu valodas datu kopai, kurā tiek iemūžināta daudzveidīga mūsdienās runātā latviešu valoda. Līdz šim savākti ieraksti vairāk nekā 150 stundu apjomā. Vienlaikus aicinām piedalīties arī jau ierakstīto runas paraugu pārbaudē. Kopā paveikto var aplūkot, analizēt un klausīties Balsutalka.lv runas korpusā,” aicina Latvijas Universitātes Mākslīgā intelekta laboratorijas (AiLab) vadošā pētniece Baiba Valkovska.
Lai piedalītos “Balsu talkā”, dalībniekiem nav jāreģistrējas: runātāji ierakstus var veikt anonīmi, neatstājot par sevi nekādus papildu datus. “Arī tad, ja reģistrēsieties, norādītā demogrāfiskā informācija, piemēram, vecums un dzimums, publiskajā datu kopā netiek sasaistīta ar dalībnieka kontu “Common Voice” platformā,” uzsver B. Valkovska.
Par Tēzaurs.lv
“Tēzaurs” ir plaša skaidrojošā un sinonīmu vārdnīca, kas AiLab tiek izstrādāta kopš 20. gs. 90. gadiem. Tā ir apjomīgākā atvērtā latviešu valodas leksiskā datubāze, kas ietver ne vien vārdu nozīmju skaidrojumus, bet arī gramatisko informāciju, izrunu un locīšanas paradigmas. Biežāk lietoto latviešu valodas vārdu nozīmju dalījums un skaidrojumi ir pilnveidoti, balstoties “Nacionālās korpusu kolekcijas” Korpuss.lv datos, un papildināti ar piemēriem, tulkojumiem un saistīto vārdu nozīmēm (t. sk. sinonīmiem).
Par Latvijas Universitātes Mākslīgā intelekta laboratoriju
AiLab tiek veikti pētījumi dažādās dabiskās valodas apstrādes un mašīnmācīšanās jomās. Laboratorijas misija ir attīstīt resursus un tehnoloģijas latviešu valodas pastāvēšanai daudzvalodu digitālajā vidē. Tēzaurs.lv ir viens no populārākajiem AiLab resursiem, bet vārdnīcu platformā ir pieejamas arī citas vārdnīcas: digitalizētā “Latviešu literārās valodas vārdnīca” (Zinātne, 1972–1996), “Mūsdienu latviešu valodas vārdnīca”, ko veido LU Latviešu valodas institūts, un citas.
Par iniciatīvu “Balsu talka”
“Balsu talku” organizē LU Matemātikas un informātikas institūts, LU Literatūras, folkloras un mākslas institūts, Latvijas atvērto tehnoloģiju asociācija un UNESCO Latvijas Nacionālā komisija sadarbībā ar Latvijas Nacionālo kultūras centru. Projektu atbalsta Atveseļošanās un noturības mehānisma plāna projekts “Valodu tehnoloģiju iniciatīva”.
Līga Kleina, projekta komunikācijas konsultante
Reklāma