Random set of recordings extracted from the Donate Speech Corpus on 29th June 2020

Description

Lahjoita puhetta -aineistosta poimittiin kesäkuun 2020 lopussa satunnaisotannalla pieni sadan näytteen testimateriaali, jonka avulla oli ensisijaisesti tarkoitus selvittää, täyttääkö kampanjassa kertyvä puhemateriaali toivotut tekniset vaatimukset. Pientä otosta tutkimalla voitiin myös arvioida, kuinka paljon varsinaista puhetta aineistoon keskimäärin sisältyy. Testiotoksen avulla kokeillaan myös aineiston litterointia käsin ja koneellisesti ja saadaan tulevan tutkimus- ja kehitystyön pohjaksi alustavaa tietoa siitä, miten hyvin tai huonosti nykyiset automaattiset puheentunnistimet selviävät tämänkaltaisesta aineistosta. Tämä ensimmäinen, hyvin suppea testiaineisto on toistaiseksi saatavilla vain rajoitetusti hankkeen sisäiseen käyttöön. Viimeistään keväällä 2021 tullaan tarjoamaan aineistokokonaisuuksia laajemmin tutkijoiden ja yritysten käyttöön.
Show more

Year of publication

2021

Type of data

Authors

University of Helsinki

Lahjoita puhetta Kielipankki - Curator, Creator

Project

Other information

Fields of science

Languages

Language

Finnish

Open access

Restricted access

License

Under negotiation

Keywords

Subject headings

Temporal coverage

undefined

Related to this research data