ikerkuntza proiektuak


Use of computational resources in the EuroHPC SuperComputer to scale up the experiments and build very large models for European languages with few resources

(2023 - 2024)

Hizkuntza- eredu handiak (HE) Adimen Artifizialaren egungo iraultzaren oinarrian daude, eta Hizkuntza Naturalaren Prozesamenduan aurrerapen izugarriak lortzeko oinarriak ezarri dituzte. HEak eraikitzeko baliabide handiak behar dira, bai konputazioari dagokionez, eta baita datuei dagokienez ere. Horrela, gaur egun soilik enpresa pribatu gutxi batzuk dira gai HEak aentrenatzeko. Ondorioz, HEak baliabide handiko hizkuntzetan eraiki ohi dira dira, ingelesa kasu, baina beste hizkuntza askok, batez ere baliabide urriak badituzte, oso atzean geratzeko arriskua dute. Hainbat proposamen egin dira aldez aurretik aurre-entrenatutako HEan hizkuntza berrietara egokitzeko, baina egin diren saiakerak ereduetan txikiekin egin ohi dute lan. Proiektu honetan, EuroHPC SuperComputer delakoaren baliabide konputazionalak erabiltzea proposatzen dugu, esperimentuak eskalatzeko eta baliabide gutxiko Europako hizkuntzetarako eredu oso handiak eraikitzeko. Kalkuluen eta datuen eskala aldatuz, modeloek zeregin askotara erraz egokitzeko gaitasuna duten aztertuko dugu. Proiektuaren emaitzek hizkuntza horietan NLP aplikazioak sustatzen lagunduko dute, eta hizkuntza gutxituen eta ingelesaren artean dagoen arrakala ixten.
Erakundea:  EuroHPC Joint Undertaking
Ikerlari nagusia: Aitor Soroa
Partaideak
Rodrigo Agerri, Eneko Agirre, Itziar Aldabe, Mikel Artetxe, Gorka Azkune, Iker De la Iglesia, Julen Etxaniz, Aitor Ormazabal, Naiara Perez, German Rigau , Oscar Sainz, Aitor Soroa, Irune Zubiaga


Proiektu gehiago