SAELE, un corpus de aprendices suecos de E/LE
La conformación del Corpus SAELE (suecos aprendices de español como lengua extranjera) sigue las recomendaciones metodológicas de Sinclair (2005), y aspectos propuestos por Lüdeling, Kytoe & McEnery (Lüdeling et al. 2008), Biber (2006), Flowerdew (2008), Hunston (2006), Lozano (2008) y Torruella & Llisterri (1999).
Se han tomado como referencia y adaptados al propósito específico de nuestro estudio aspectos metodológicos de los Corpus ICLE, VICOLSE, ARGUS y CEDEL2, específicamente para la definición de criterios de inclusión/exclusión en la selección de los sujetos, la delimitación del objeto de estudio (tipos y cantidad de textos), y aspectos del procesamiento de textos.
Los aspectos metodológicos más relevantes que se han considerado en el diseño del presente estudio fueron: el contenido, la representatividad, el contraste, la estructura, la muestra, la documentación, el equilibrio, el tema y el etiquetado.
El propósito principal del corpus ha sido describir características de la interlengua del aprendiz sueco de E/LE con un nivel A2-B1, según el MCERL. En su elaboración pueden identificarse dos etapas comprendidas por un período preparatorio centrado en la exploración informativa acerca de la elaboración de corpus de aprendices, el diseño de las estrategias de recogida del material y la elección de instrumentos apropiados para la recopilación de datos. En la segunda etapa o período ejecutorio se realizó la recolección de datos, su procesamiento, análisis de los resultados, elaboración de conclusiones y recomendaciones. Ambas etapas exigieron el uso de herramientas computacionales específicas y la cooperación de investigadores de la Universitat de Barcelona y la Universidad de Gotemburgo.
El corpus SAELE puede considerarse en la actualidad un minicorpus de textos argumentativos escritos por aprendices (nativos suecos) de E/LE recopilado durante los cursos lectivos 2008/09 y 2009/10 en dos universidades suecas. En su primera etapa fueron compilados 135 textos escritos por 45 estudiantes (26 mujeres y 18 hombres), e información acerca de los participantes a través de una encuesta.
En el futuro se pretende continuar la compilación de textos argumentativos elaborados por aprendices suecos de E/LE (nivel A2-B1) y comenzar la recopilación de textos argumentativos elaborados por aprendices suecos de E/LE situados en dos niveles superiores de aprendizaje de E/LE (niveles B2 y C1); de la misma forma se pretende además compilar textos argumentativos en lengua sueca (corpus de control de lengua sueca) a la par que se obtendrían los datos de los participantes utilizando la encuesta elaborada..
Para la revisión y posterior tratamiento del corpus se utilizará el conjunto de herramientas AnCoraPipe, integradas en la plataforma Eclipse[1], las que permiten trabajar con ficheros en XML y utilizan el lenguaje Xpath para las búsquedas y los recuentos estadísticos.
[1] Véase en: http://clic.ub.edu/en/ancorapipi-en en inglés o http://clic.ub/es/ancorapipe-es en español.
2012. p. 157-158
Corpus linguistics, Learners corpus, Swedish learners, Spanish as a foreign language
Lingüística de corpus, corpus de aprendices, aprendices suecos, español como lengua extranjera
4th International Conference on Corpus Linguistics, Jaén, 22nd-24th March, 2012