Jūs atrodaties šeit

Latviešu valodas runas atpazīšana un sintēze medicīnas lietojumiem (1.1.1.1/18/A/153)

Latvijas Universitātes Matemātikas un informātikas institūts sadarbībā ar Rīgas Austrumu klīnisko universitātes slimnīcu ir uzsācis ERAF finansēta pētniecības projekta “Latviešu valodas runas atpazīšana un sintēze medicīnas lietojumiem” (1.1.1.1/18/A/153) īstenošanu.

Projekta mērķis:

  1. Sagatavot latviešu valodas resursus, kas nepieciešami runas atpazīšanas un sintēzes tehnoloģiju pielāgošanai radioloģijā un citās medicīnas jomās.
  2. Izstrādāt nepieciešamās programmatūras komponentes, novērtēt tās radioloģijas un citu medicīnas lietojumu vajadzībām.
  3. Nodemonstrēt jaunās tehnoloģijas potenciālu, izstrādājot un aprobējot inovatīvas, automatizētas medicīnisko aprakstu diktēšanas platformas prototipus.

Projektā plānotas trīs galvenās darbības. Pirmā saistīta ar nepieciešamo pamatresursu – tekstu korpusa, izrunas vārdnīcas un runas korpusa – izveidi. Otrajā darbībā tiks izstrādāti valodas un akustiskie modeļi, kā arī programmatūras komponentes automātiskai runas atpazīšanai un sintēzei latviešu valodā. Trešajā darbībā, izmantojot iepriekšējo darbību rezultātus, tiks izstrādāti diktēšanas platformas laboratoriski prototipi.

Projekta īstenošanas laiks: 01.04.2019. – 31.03.2022.

Projekta kopējās izmaksas: 654 878.70 EUR, t.sk. ERAF finansējums 374 855.36 EUR.

Projekts tiek īstenots darbības programmas “Izaugsme un nodarbinātība” 1.1.1. specifiskā atbalsta mērķa “Palielināt Latvijas zinātnisko institūciju pētniecisko un inovatīvo kapacitāti un spēju piesaistīt ārējo finansējumu, ieguldot cilvēkresursos un infrastruktūrā” 1.1.1.1. pasākuma “Praktiskas ievirzes pētījumi” 2. kārtas ietvaros.

Informācija ievietota 28.06.2019.


2019. gada jūlijs – septembris

Pārskata periodā paveiktais:

  • Reprezentatīvas izlases datu kopas sagatavošana, aptverot dažāda veida radioloģijas izmeklējumus un epikrīzes. Aprakstiem atbilstošo audio datu sistemātiska uzkrāšana. Paraugdatu manuāla pseidonimizācija un anonimizācija. Programmatūras izstrāde izmeklējumu un epikrīžu aprakstu automātiskai apstrādei un anonimizēšanai. Apstrādes un anonimizēšanas procedūru pielāgošana dažādiem dokumentu formātiem.
  • Turpināta literatūras izpēte un eksperimenti automātiski ģenerētas izrunas vārdnīcas izveidē. Uzsākta izrunas vārdnīcas izveides darba vides izstrāde. Metodikas izstrāde vārdnīcas ieejas datu automatizētai izguvei no tekstu korpusiem un no svešvārdu vārdnīcām. Darbs pie izrunas vārdnīcas izveides un saīsinājumu izvēršanas metodikas izstrādes.
  • Sākotnējā eksperimentālā valodas modeļa izveide no salīdzinoši nelielās, manuāli atlasītās paraugdatu kopas (izmeklējumu un epikrīžu apraksti). Iegūtā sākotnējā valodas modeļa novērtēšana.
  • Metodikas izstrāde tekstu korpusā balstītai specifisko tekstvienību – apzīmējumu un saīsinājumu – automātiskai izvēršanai (valodas modeļa pielāgošanai) un saīsināšanai (automātisko transkripciju noformēšanai). Korpusa šablonu lingvistiska un statistiska analīze.

Informācija ievietota 27.09.2019.

 

Informācija atjaunota: 2019.10.10 - 13:33