Nota prévia
O Tesouro lexical da fronteira hispano-portuguesa (“Tesouro léxico FRONTESPO” / FRONTESPO-TES) é uma obra em constante atualização. De momento, só está disponível uma primeira amostra de materiais que iremos completando progressivamente. Por favor, tenha paciência. Se desejar fazer-nos alguma pergunta ou colaborar connosco cedendo materiais inéditos que tenha em seu poder (por exemplo, recompilações das palavras típicas de uma aldeia ou comarca), escreva-nos através do e-mail frontespo@gmail.com. Obrigado pela sua colaboração.
Descrição do projeto
O Tesouro lexical FRONTESPO é uma base de dados que contém vozes e expressões procedentes de múltiplas obras de caráter dialectal de localidades situadas a menos de 15 km da fronteira. O espaço geográfico que compreende extende-se desde o nordeste do distrito de Bragança até ao sudeste de Faro, em Portugal, e desde o noroeste da província de Zamora até ao sudoeste da província de Huelva, em Espanha. O Tesouro tem a sua origem na linha de investigação Vocabulário partilhado na fronteira do Campo Arqueológico de Mértola, iniciada no ano 2010.
Finalidade do Tesouro e fundamentos
O Tesouro lexical FRONTESPO tem como objetivo a recompilação do vocabulário que permite individualizar a fronteira com respeito a outras comarcas e regiões dos dois países. Os dois fundamentos sobre os que assenta o projeto são os seguintes:
a) A recompilação do que une cada zona fronteiriça (a espanhola e a portuguesa) com o idioma que se fala na outra zona: castelhanismos em zona portuguesa e portuguesismos em zona espanhola.
b) A identificação daquilo que separa as falas da fronteira hispano-portuguesa dos dois idiomas nacionais (espanhol e português): dialectalismos, leonesismos, galeguismos e ocidentalismos.
Para obter mais detalhes sobre as bases teóricas e a metodologia do Tesouro, pode consultar diversas contribuições listadas na página de resultados de FRONTESPO.
Apresentação dos dados
Na página principal da base de dados podem realizar-se pesquisas em três campos: variante, lema e texto da definição. Além disso, a partir de cada uma das fichas do Tesouro pode recuperar-se o léxico que está vinculado a cada lema: variantes lexicais, vocabulário que pertence ao mesmo campo semântico e formas que partilham a mesma origem (portuguesismos, castelhanismos, dialectalismos, leonesismos, etc.).
Campos
As fichas nas quais se apresenta o léxico é composta pelos seguintes campos:
- Variante. É a entrada tal e como a proporciona a obra da qual se toma. Quando os originais só oferecem a variante em transcrição fonética, realizámos uma adaptação com grafias o mais próximas possível da representação fonética.
- Lema. É a entrada normalizada à qual se associa a variante. Ao tratar-se de um campo de hiperligação, permite a recuperação de todas as variantes que dependem do mesmo lema.
- Transcrição fonética. Só se proporciona quando existe na fonte. Em todos os casos, utiliza-se o alfabeto fonético internacional (AFI), o que implica que às vezes —quando os originais empregaram outros sistemas— se tenha tido que realizar uma adaptação das transcrições.
- Definição. Anota-se tal e como aparece na fonte. Se no original só se oferece uma remissão a outra voz, transcrevemos entre parênteses a definição completa da voz à qual se remete. Em determinados casos —quando na fonte não existe definição para alguma variante—propomos a nossa própria definição precedida de asterisco.
- Classificação semântica. Todas as variantes incorporadas na base de dados foram atribuídas a um campo semântico. Para a classificação semântica usam-se as mesmas categorias que as empregadas no Tesouro do léxico patrimonial galego e português, o que possibilitará no futuro que se ponham em relação os dados oferecidos pelos dois repertórios. As categorias da classificação semântica são as seguintes (dentro de cada uma delas há subclassificações): 1. O Universo, os astros e o tempo; 2. A terra (geografia e geologia) e a água (rios, mananciais, mar, balsas, canais, etc.); 3. A agricultura; 4. As plantas e as árvores não frugais; 5. Os animais domésticos e a ganadaria; 6. Os animais não domésticos; 7. O ser humano; 8. A vida quotidiana: vivenda, higiene, alimentação, trabalho; 9. A medição, números e quantidades. Relações espaciais; 10. Termos de difícil classificação; 11. Palavras gramaticais não incluídas em nenhum dos apartados anteriores; 12. Variantes que não se podem classificar semanticamente.
- Exemplos. Quando a fonte contém exemplos de uso da variante anotada, registam-se num campo específico da base de dados. Em ocasiões, os exemplos esclarecem o alcance que têm definições que não foram convenientemente efetuadas nas obras originais.
- Categoria gramatical. Este campo só se completa quando a obra da qual se tomam os dados proporciona uma categoria concreta para a variante. A categoria gramatical anota-se no Tesouro tal como é oferecida pela fonte, independentemente se nela se tenham cometido erros ao indicá-la. Dada a heterogeneidade dos originais, algumas categorias mostram-se de formas diversas (por exemplo, o verbo transitivo pode aparecer neste campo como v. t., v. tr. ou v. trans.).
- Categoria gramatical normalizada. A cada variante atribui-se-lhe uma categoria gramatical normalizada a partir de uma lista fechada que contém só os seguintes elementos: adjetivo (adj.), advérbio (adv.), interjeição (interj.), locução (loc.), preposição (prep.), pronome (pron.), substantivo feminino (s. f.), substantivo masculino (s. m.) e verbo (v.).
- Tipo. Com o objetivo de estruturar o vocabulário da zona fronteiriça segundo a sua procedência, a base de dados do Tesouro contempla as seguintes possibilidades de adscrição das vozes documentadas: portuguesismos, castelhanismos, galeguismos, galeguismo-portuguesismos, leonesismos, ocidentalismos e dialectalismos (localismos, regionalismos e dialectalismos partilhados). O campo “Tipo” é uma hiperligação que permite a recuperação de todas as variantes que partilham a mesma origem.
- Obra. O campo no qual se anota a fonte da qual se extraem os dados é uma hiperligação que dá acesso à ficha bibliográfica completa da obra em questão.
- Localização. É o município (incluídas as entidades menores da população), a comarca ou a região onde foi documentada cada variante lexical. Nas fichas do Tesouro, este campo mostra-se de forma textual e por meio da representação gráfica num mapa.
- Obra de contraste. Para determinadas variantes, transcrevem-se neste campo as definições que oferecem dicionários espanhóis, portugueses, galegos ou asturo-leoneses das variantes, os lemas ou palavras relacionadas.
- Comentários da fonte. São os comentários adicionais, distintos da definição, que proporcionam as obras sobre as variantes.
- Comentários de FRONTESPO. Incluem-se aqui todas aquelas informações relacionadas com a variante ou com o lema que a equipa de FRONTESPO considera de interesse.
- Remissões. A base de dados permite a recuperação de variantes que estão relacionadas entre si na mesma fonte.
Categorização dos elementos lexicais
Como se avançou na descrição do campo “Tipo” no apartado anterior, classificamos o vocabulário da zona fronteiriça hispano-portuguesa numa série de categorias com o objetivo de estruturar o caudal lexical de interesse para o Tesouro. As categorias contempladas definem-se da seguinte forma:
- Portuguesismos: palavras normativas portuguesas que se documentam no lado espanhol da fronteira.
- Castelhanismos: palavras normativas espanholas que se documentam nas aldeias portugueses da fronteira.
- Galeguismos: vozes exclusivamente galegas, ou seja, as que não coincidem com palavras normativas portuguesas na forma ou no significado.
- Galeguismo-portuguesismos: palavras documentadas nas comarcas das Portelas (Zamora) ou Jálama (Cáceres) e que existem tanto em português como em galego.
- Leonesismos: palavras de origem leonesa.
- Ocidentalismos: palavras que têm uma presença ampla no ocidente peninsular e que não pertencem ao espanhol normativo, com independência de que existam ou não em todas as variedades linguísticas da zona fronteiriça.
- Dialectalismos: vozes não assimiláveis a leonesismos ou galeguismos que não aparecem nos dicionários normativos espanhóis ou portugueses, excluídos os vulgarismos. Em função do alcance geográfico que apresentam, dividimo-los em três classes:
- Localismos (palavras que têm uma difusão muito limitada: documentadas numa só população ou num número reduzido de populações próximas entre si).
- Regionalismos (vozes com uma extensão mais ampla: em muitos casos são salmantinismos, estremenhismos, andaluzismos, palavras próprias do Alentejo, do Algarve, etc.).
- Dialectalismos partilhados (palavras dialectais que se documentam em ambos os lados da fronteira).