AnCora-ES

Full Name
Annotated Corpora - Español
Parent corpus
Composer
Centre de Llenguatge i Computació de la Universitat de Barcelona, Grup de Processament del Llenguatge Natural de la Universitat Politècnica de Catalunya, Grupo de Investigación en Procesamiento del Lenguaje Natural y Sistemas de Información de Alacant
Language
Spanish
Iberian Spanish
Language (details)
Also has a Catalan version
Register
Written
Genre
Newspaper
Style
Formal
Period
2000-2100 AD
1900-2000 AD
Number of words
500.000 - 1.000.000
Annotation
Lemmatisation
Parsing
POS tagging
Semantic annotation
Tokenization
Format
Download
Format remarks

Available for download after making an account.

Availability
Free subscription