Talgreining eldra talmáls og uppbygging textasafns

Talgreinirinn er aðgengilegur hjá Tiro ehf, sem bjó talgreininn til fyrir MSHL. Hér er hægt að hlaða upp hljóðskrám eða vísa í síðu með hljóðskrá til að fá hana greinda og skrifaða upp sem texta. 

Hjá Tiro eru nokkrir talgreinar, en hægt er að velja „Íslenska (ÍSMÚS)“ sem er þróaður fyrir eldri upptökur þar sem tungumálið er fornara eða upptökugæði léleg.

Talgreinirinn er frjáls til afnota, en nauðsynlegt er að skrá sig inn til að nota hann.

Talgreinir Tiro
Talgreinir Tiro
Talgreinir Tiro - beta
Talgreinir Tiro - ný beta útgáfa

Talgreinirinn var þróaður til notkunar á hljóðupptökur um íslenskan menningararf (ÍSMÚS). Á vef ÍSMÚS er nú hægt að hlusta á upptökur og lesa talgreindan texta um leið.

Nauðsynlegt er að taka greiningunum með fyrirvara, því gæði afskrifta eru misgóð.

Textasafn Ísmús

Ísmús er í umsjá Tónlistarsafns Íslands, Stofnunar Árna Magnússonar í íslenskum fræðum og Landsbókasafns Íslands – Háskólabókasafns.

Þjálfunargögnin sem voru notuð til að búa til talgreininn fyrir eldra mál eru vistuð og aðgengileg hjá CLARIN á Íslandi. Þau er heimilt að nota með þeim notkunarleyfum sem birt eru hjá Clarin.

Þjálfunargögn hjá Clarin

Verkefnið var styrkt af Innviðasjóði.