Undirbúningur fyrir verkefnið fór fram vorið 2024. Starfsfólk hófst handa í september sama ár við að búa til gagnagrunninn. Verklok eru áætluð vorið 2025 og verður gagnagrunnurinn þá gerður aðgengilegur.
Markmið verkefnisins er þríþætt. Í fyrsta lagi að ljóslesa mikið magn handrita, skjala og prentaðs efnis frá tímabilinu 1540–1850 og gera þannig gríðarlegt magn texta aðgengilegt. Í öðru lagi að marka þennan textamassa málfræðilega og nýta hann sem grunn fyrir fyrirhugaða málheild síðari alda. Í þriðja lagi myndi málfræðileg mörkun textanna sem færi fram í tengslum við gerð málheildarinnar auðvelda aðgengi að hluta íslensks menningararfs sem hefur verið flestum óaðgengilegur til þessa.
Verkefnið nýtir sér íslensk módel í Transkribus, sem voru þróuð með stuðningi Innviðasjóðs.
Verkefnið var styrkt af Innviðasjóði.