Ricevinte komence de la jaro 2025 la tutan kolekton de Literatura Foiro, Ivan García, respondeculo de la retejo Bitarkivo, ĵus komunikis al ties vicĉefradaktoro ke probable jam dum la ĉi-jara novembro ĉiu numero de LF estos elskanita kaj gardata en interreta arkivo. La celo de Bitarkivo, laŭ priskribo en la retejo mem, estas “gardi la Esperantan kulturon por ĉiam”. La retejo jam sukcese arkivis cent ok periodaĵojn kaj indeksis la enhavon de 9.696 numeroj, antaŭvide al la onta arkivado de libroj, podkastoj kaj ceteraj dokumentoj.
La skanado de LF celas ankaŭ alion, nome la riĉigon de esperantlingvaj korpusoj. La plej grandaj publike alireblaj estas Tekstaro, prizorgata de Bertilo Wennergren, kaj Corpus Eye, de Eckhard Bick. Tekstaro enhavas pli ol du milionojn da vortoj kaj celas kovri la periodon de 1887 ĝis nun. Kvankam tiu amplekso povas soni impona, ĝi estas tamen sufiĉe modesta kompare al tiu de la korpusoj uzataj por prestiĝaj vortaroj kiel Oxford English Dictionary, kiu superas du miliardojn da vortoj, dum tiu de Duden Wörterbuch atingas ses miliardojn. Tiurilate en 2024 Kooperativo de Literatura Foiro interkonsentis kun akademiano Jesper Lykke Jacobsen pri la disponigo de kvindek kvin jarkolektoj de LF antaŭvide al la venontaj oficialaj aldonoj al la Universala Vortaro. Laŭ komuniko de Jacobsen, li jam kolektis 14.000 numerojn de revuoj kaj gazetoj, kaj centojn da libroj, kio ekvivalentas al ĉirkaŭ ducent milionoj da vortoj – 10.000% de la enhavo de Tekstaro.
Ni estas ankoraŭ for de la ciferoj de grandaj nacilingvaj korpusoj, sed per la grava laboro de Ivan García ni povos aldoni tricent kvardek gazetajn numerojn al la impona projekto.
Aldonu komenton