DETERMINAÇÃO
DAS CATEGORIAS GRAMATICAIS DE SINAIS EM UM CORPUS DE TEXTOS DE LIBRAS PARA
APOIAR A CONSTRUÇÃO
DE UM DICIONÁRIO ON-LINE
Luis Roberto Volz de Oliveira (UCPel)
Antônio Carlos da Rocha Costa (UCPel)
Resumo
O presente trabalho tem por finalidade apresentar os resultados obtidos até o
momento na pesquisa sobre a determinação das categorias lexicais em textos de
LIBRAS (Língua de Sinais Brasileira).Para desenvolver esse trabalho partiu-se
de um corpus de textos em LIBRAS, escritos por alguns colaboradores surdos.
Esses textos abordavam diversos tipos de assuntos, tais como fábulas, material
jornalístico, curiosidades, histórias de vidas etc. O trabalho deu-se em três
momentos: reconhecimento e catalogação dos sinais encontrados nos textos, definição
da categoria gramatical e, por fim, reconhecimento e caracterização das
principais estruturas frasais encontradas. Até o presente momento foram
catalogados e definidos gramaticalmente aproximadamente 1100 sinais em escrita
Sign-Writing. A escrita Sign-Writing é um conjunto de símbolos utilizados para
representar graficamente os sinais. Além disso, percebemos que a maioria das
frases são compostas por substantivos e verbos no infinitivo, as flexões
verbais geralmente são feitas por meio de marcadores, advérbios por exemplo.
Introdução
O presente
trabalho deu-se a partir da necessidade de catalogação, classificação e análise
das principais estruturas lingüísticas (categorias gramaticais e tipo de
estrutura frasal) dos sinais da LIBRAS
( Língua de Sinais Brasileira) encontrados em textos escritos em Sign-writing.
Linguagem
A linguagem diz respeito a um sistema constituído por elementos que podem ser
gestos, sinais, sons, símbolos ou palavras, que são usados para representar
conceitos de comunicação, idéias, significados e pensamentos. Nesta acepção,
linguagem aproxima-se do conceito de língua.
Numa outra acepção, linguagem refere-se à função cerebral que permite a
qualquer ser humano adquirir e utilizar uma língua. Por extensão, chama-se
linguagem de programação ao conjunto de códigos usados em computação. O estudo
da linguagem é chamado linguística, uma disciplina acadêmica introduzida por
Ferdinand de Saussure, no início do século XX, e depois desenvolvida como
ciência.
LIBRAS
Libras é a sigla de Língua de Sinais Brasileira que é a língua natural da
comunidade surda brasileira. Os sinais são formados por meio da combinação de
formas e de movimentos das mãos e de pontos de referência no corpo ou no
espaço. Devido a essa particularidade,
a LIBRAS muitas vezes é tida como um simples conjunto de gestos e mímicas
utilizados pelos surdos na sua comunicação.
A Libras é considerada uma língua natural pois possui uma estrutura gramatical
própria: sintaxe, morfologia, semântica, fonologia.
Segundo a
legislação vigente, Libras constitui um sistema lingüístico de transmissão de
idéias e fatos, oriundos de comunidades de pessoas com deficiência auditiva do
Brasil, na qual há uma forma de comunicação e expressão, de natureza
visual-motora, com estrutura gramatical própria. Decretada e sancionada em 24
de abril de 2002, a Lei N° 10.436, no seu artigo 4º, dispõe o seguinte: "O
sistema educacional federal e sistemas educacionais estaduais, municipais e do
Distrito Federal devem garantir a inclusão nos cursos de formação de Educação
Especial, de Fonoaudiologia e de Magistério, em seus níveis médio e superior,
do ensino da Língua Brasileira de Sinais - Libras, como parte integrante dos
Parâmetros Curriculares Nacionais – PCNs, conforme legislação vigente".
SignWriting
Como foi dito anteriormente, a LIBRAS é uma língua espaço-visual, isto é, se dá
no espaço a partir de uma combinação de movimentos realizados pelas mãos,
braços, corpo e expressão facial.
Sign-writing é um conjunto de regras e símbolos para a notação dos sinais
realizados pela LIBRAS. Abaixo exemplo da palavra “pai” em escrita SignWriting.
Figura 1: PAI
Conceito de Dicionário
Dicionário é um conjunto vocábulos de uma língua ou dos termos próprios de uma
ciência ou arte, dispostos por ordem alfabética e com a respectiva significação
ou a sua versão noutra língua. Geralmente, os dicionários são organizados na
forma de livrosimpressos mas com o advento dos sistemas digitais esses
dicionários passaram a dispor de suas versões digitalizadas (em CD-Rom) e/ou
on-line.
Dicionário
Eletrônico
Os dicionários on-line possuem a função de facilitar tornar mais acessível as suas informações aos seus usuários. O dicionário eletrônico pode ser apresentado de duas formas: a primeira, em CD-Rom, e a segunda, disponibilizado na internet. Esses dicionários possuem como diferencial a possibilidade de apresentação de diversas mídias (imagens, sons, vídeos) à apresentação de seus resultados de busca. Além do mais, esses dicionários podem disponibilizar ao usuário outros recursos como: busca rápida, apresentação de sinônimos, usos mais freqüentes dos verbetes consultados, corretores gramaticais, gramática apresentada de forma simples e objetiva entre outros recursos.
Caracterização do dicionário proposto
O dicionário proposto está vinculado ao projeto SWDB: Dicionário para as Línguas de Sinais usadas pelos surdos. Esse projeto constou no desenvolvimento de um software para a criação e gerenciamento de um dicionário on-line. O dicionário chamado de SWDB (SignWriting Data Base) consiste em desenvolver um dicionário on-line baseado, inicialmente, em um corpus lingüístico fornecido por textos escritos em línguas de sinais que fazem parte do banco de dados do projeto. Em um segundo momento, esse banco de dados do dicionário poderá ser ampliado de forma cooperativa com os usuários cadastrados no sistema.
O sistema de busca do dicionário consiste em digitar o verbete a ser consultado no campo específico e clicar no botão “Procurar Sinal”.
Figura 2: Campo de busca no dicionário On-line
Em seguida, o sistema disponibilizará ao usuário informações sobre o verbete consultado, essas informações são: dados de inserção do sinal no sistema, informações visuais, o código do sinal em escrita realizada pelo editor SignEdit, o sinal apresentado em forma de figura, informações lexicais, morfológicas, sinônimos e exemplos de frases utilizando o sinal.
Figura 3: Apresentação do resultado no dicionário On-line
Metodologia
Para desenvolver esse trabalho partiu-se de um corpus de textos em LIBRAS,
escritos por alguns colaboradores surdos. Esses textos abordavam diversos tipos
de assuntos, tais como fábulas, material jornalístico, curiosidades, histórias
de vidas etc. O trabalho deu-se em três momentos: reconhecimento e catalogação
dos sinais encontrados nos textos, definição da categoria gramatical e, por
fim, reconhecimento e caracterização das principais estruturas frasais
encontradas.
Reconhecimento e catalogação
Para o desenvolvimento desse primeiro momento da pesquisa foi necessária a
colaboração direta dos surdos integrantes da equipe de pesquisa. Os textos
foram impressos e os seus sinais isolados um a um. Em seguida, foi feito o
reconhecimento desses sinais em Língua Portuguesa. Feito isto, os sinais foram
reescritos utilizando o editor Sign-Edit (será descrito no item Materiais) e
salvos em dois formatos de arquivos:
SWMLT (arquivo gerado com o editor Sign-Edit) e em formato .gif (tipo de
arquivo para figuras). Cada um desses arquivos foi separado de outras duas
maneiras: arquivo com o texto integral, arquivo isolado de acordo com a ordem
alfabética de cada sinal. Ao final desse momento, obteve-se, aproximadamente
783 sinais divididos em 596 verbetes, ou seja, como cada sinal pode ser
representado de mais de uma maneira, isso é o que gerou o diferença do número
de sinais para o número de verbetes. Os sinais estão sendo separados, neste
momento, de acordo com a sua categoria gramatical.
Definição
da categoria gramatical
Após a catalogação dos sinais foi feita a definição da categoria gramatical de cada um dos sinais. A definição dessas categorias foi feita de acordo com Ferreira Brito (1997) que faz a seguinte apresentação:
- Verbos: há
basicamente dois tipos de verbos na LIBRAS: os que possuem marca de
concordância e os que não possuem marca de concordância. Exemplos:
Figura 4: sinal TRABALHAR
Figura 5: sinal ANDAR
(verbo que não possui marca deconcordância) (verbo que possui marca deconcordância)
EU TRABALHAR UCPEL pessoaANDAR
“eu trabalho na UCPEL”
- Advérbios: as marcas de tempo geralmente são feitas por meio de advérbios. Exemplo:
Figura 6: sinal
HOJE
Hoje trás a idéia de presente nas orações.
- Adjetivos: os adjetivos sempre estão na forma neutra em LIBRAS, não havendo marca de gênero ou número. Exemplo:
Figura 7:
sinal TRISTE
- Pronomes: os pronomes possessivos, os pessoais e os demonstrativos, também não possuem marca de gênero e estão relacionados às pessoas do discurso. Exemplo:
Figura 8: sinal MEU Figura 9: sinal CASA
O pronome MEU irá concordar com o substantivo CASA, relaciona-se à pessoa do discurso e não à coisa possuída.
- Numerais: os numerais cardinais são idênticos ao português, os numerais ordinais possuem a mesma representação mas seguidos de movimentos distintivos aos cardinais. Exemplos:
Figura 10: sinal
TERCEIRO Figura 11: sinal TRÊS
- Substantivos: os substantivos geralmente são neutros, não possuindo marca de gênero. Exemplo:
Figura 12: sinal
MACACO
O sinal MACACO pode ser utilizado para qualquer um dos gêneros, macho ou fêmea.
Reconhecimento e caracterização
das principais estruturas frasais encontradas
De acordo com Quadros&Karnopp (2004), a LIBRAS apesar da grande
flexibilidade da ordem das frases, mantém como base as construções do tipo SVO
(Sujeito- Verbo-Objeto). Frases desse tipo serão conideradas sempre como
gramaticais. As ordens OSV e SOV ocorrem somente quando há alguma coisa a mais
na sentença, como a concordância e as marcas não-manuais. Em uma análise
preliminar predominaram as sentenças do tipo SVO.
Materiais empregados
Para o desenvolvimento do projeto utilizou-se muitos softwares, na sua maioria os chamados opensource, ou seja, programas gratuitos. Como exemplo de software utizado pode-se citar o editor de sinais chamado Sign-Edit, software desenvolvido pelo coordenador do projeto em parceria com um bolsista de iniciação científica, bolsista esse já formado.
Figura 13: Editor Sign-Edit
Figura 14: Editor SW-Edit
Análise
dos dados
Partindo dos dados quantitativos fornecidos pela catalogação dos sinais, obtivemos 783 sinais divididos em 596 verbetes. Esses verbetes foram divididos nas seguintes categorias:
Categoria gramatical |
Nº de ocorrências |
% do total dos sinais |
Substantivos |
353 |
59,21% |
Adjetivos |
56 |
9,39% |
Pronomes |
16 |
2,68% |
Verbos |
141 |
23,65% |
Advérbios |
14 |
2,34% |
Numerais |
13 |
2,18% |
Preposições |
2 |
0,35% |
Artigos |
1 |
0,16% |
Total |
596 |
100% |
Obs.: cabe salientar que os verbos não foram classificados de acordo com a
distinção dos verbos feita por Quadros&Karnopp (2004), apenas foram
contabilizados.
De acordo com o quadro acima podemos fazer algumas considerações:
- a Língua de Sinais é composta basicamente por substantivos e verbos, essas categorias representam 82,86% do léxico analisado;
- os adjetivos representam 9,39% dos sinais, representam um número pouco significante;
- advérbios, preposições, numerais, artigos e pronomes representam 7,71% dos sinais.
Um dado que
despertou curiosidade foi a ocorrência de 1 (um) artigo que de acordo com Rinaldi (1997) essa categoria não seria
esperada na análise morfológica dos sinais. Essa ocorrência pode ter sido
causada pelo fato de o escritor do texto em SignWriting ter feito uma união da
Gramática da Libras com a Gramática do Português.
Feita esta primeira análise partiu-se para o estudo das principais estruturas
frasais nos textos. De acordo com Quadros&Karnopp a base da gramática da Libras
seria a ocorrência de estruturas do tipo SVO. Essa estrutura pode ser
comprovada na frase abaixo:
Figura 15: sinal MUNDO Figura 16: sinal PODE Figura 17: sinal DOENTE
Conclusões
De posse dos dados obtidos com o trabalho de análise dos textos, obtivemos subsídios suficientes para dar inicio à construção e implementação do dicionário on-line. Chegamos a conclusão de que o léxico da LIBRAS é constituído basicamente por substantivos e verbos, sendo que estes são organizados na maioria dos casos em estruturas do tipo SVO (Sujeito-Verbo-Objeto). A partir dos dados obtidos a equipe do projeto sente-se mais segura a fazer novas e mais detalhadas análises na escrita SignWriting.
Referências
CHOMSKY, N.; LASNIK, H. Principles and
parameters theory. In: GRUYTER, Walter de (ed.) Syntax: an international
handbook of contemporary research. Berlim, 1993.
FERREIRA-BRITO,
L. Por uma gramática de língua de sinais. Rio de Janeiro: Tempo Brasileiro, 1995.
LIDDELL, S. K.; JOHNSON R.E. American
sign language compound formation processes, lexicalization and phonological
remnants. Natural Language and Linguistic Theory.
QUADROS, R. M. de. Língua de Sinais Brasileira:
estudos lingüísticos / Ronice
Müller de Quadros e Lodenir Becker Karnopp. - Porto Alegre: Artmed,
2004.
QUADROS, R. M. de. Phrase structure of brazilian sign language. Porto Alegre:
PUCS, Tese de Doutorado, 1999.
RINALDI, Giuseppe (org.). Deficiência Auditiva. Brasília: SEESP, 1997.
SAUSSURE, F. de. Curso de lingüística geral. 20. ed. São Paulo: Cultrix,
[1916], 1995.
SILVA, T. C. Fonética e fonologia do português. São Paulo: Contexto,
1999.
SOUZA, M. C. P. de; KOCH, I. V. Lingüística Aplicada ao Português: Sintaxe.
11ª Edição. Cortez Editora.
STOKOE, W. C. Sign language structure.
Silver Spring: Linstok Press. [1960] 1978.
SUTTON, V. Lessons in Sign Writing. DAC - Deaf Action Committe for Sign
Writing. Tradução parcial e adaptação do Inglês/ASL para Português/LIBRAS.