Recopilación de datos primarios para la descripción y documentación de la lengua

Autores

Tipologia: 
Artigo de revista
Título da revista: 
Études romanes de Brno
Ano: 
2020
Volume: 
41
Número: 
1
Páginas: 
87-98
Publicação: 

Dossier thématique: Lenguas amenazadas en la Península Ibérica. Situación actual y perspectivas para el futuro, coordinado por Vera Ferreira, Miroslav Valeš e Ivo Buzek.

Sinopse do conteúdo: 

[Resumen extraído de la fuente original]

En septiembre de 2018, CIDLeS (Centro Interdisciplinar de Documentação Linguística e Social, Minde, Portugal), en cooperación con la Universidad Técnica de Liberec, República Checa, inició el proyecto: MSCA TUL: Documentación y Descripción de A Fala impulsada por la comunidad. La metodología utilizada en el proyecto se fundamenta en la recopilación de datos primarios y su uso, tanto para los fines de descripción como para la documentación. El objetivo del trabajo es presentar el diseño del corpus de datos primarios, que es la base de todo el proyecto. Los datos primarios tienen una variedad de formas: grabaciones de audio y video, textos escritos publicados o no publicados, recursos lingüísticos existentes y también los datos creados o recopilados por la comunidad de hablantes. En el trabajo se discuten varios aspectos a tener en cuenta al recopilar y procesar los datos. Uno de estos aspectos es el equilibrio entre las tres variedades principales de A Fala, lagarteiru, mañegu y valverdeñu. Otro aspecto a tener en cuenta es la selección de temas para las entrevistas y también la selección de participantes para lograr una muestra equilibrada respecto a edad y género. En el caso de los textos escritos, los derechos del autor deben respetarse y resolverse en los casos en que no sea posible obtener el consentimiento de los autores o editores. Por último, pero no menos importante, el tamaño del corpus también fue uno de los temas a considerar junto con la posibilidad de ampliar la base de datos fácilmente en el futuro. El documento expone la experiencia adquirida en el curso de la recopilación de datos y también la brecha entre las soluciones ideales y las soluciones viables. Palabras clave: A Fala; datos primarios; recopilación de datos; corpus.

In September 2018 CIDLeS (Centro Interdisciplinar de Documentação Linguística e Social, Minde, Portugal) in cooperation with Technical University of Liberec, Czech Republic, launched a project: MSCA TUL: Community-Driven Documentation and Description of A Fala. The methodology used in the project is based on primary data collection and its usage for both description and documentation purposes. The objective of the paper is to introduce the design of primary data corpus, which is the basis of the whole project. The primary data have variety of forms: audio and video recordings, written texts published or unpublished, existing linguistic resources, and also the data created or collected by the community of speakers. The paper discusses various aspects to be considered while collecting and processing the data. One of these aspects is the balance between the three main varieties of A Fala, Lagarteiru, Mañegu and Valverdeñu. Another aspect to take into account is the selection of topics for the interviews and also the selection of participants, to achieve age and gender balanced sample. In case of written texts copy rights have to be respected and resolved in cases when it is not possible to get the consent from authors or editors. Last but not least, the size of the corpus was also one of the issues to be considered together with the possibility to enlarge the database easily in the future. The paper exposes the experience gained in the course of data collection and also the gap between the ideal solutions and the viable solutions. Keywords: A Fala; primary data; data collection; corpus.

Língua: 
Última modificação: 
12/10/2020 - 19:50