DETERMINAÇÃO DAS CATEGORIAS GRAMATICAIS DE SINAIS EM UM CORPUS DE TEXTOS DE LIBRAS  PARA  APOIAR  A  CONSTRUÇÃO  DE UM DICIONÁRIO ON-LINE

 

Luis Roberto Volz de Oliveira (UCPel)

Antônio Carlos da Rocha Costa (UCPel)

 

Resumo


O presente trabalho tem por finalidade apresentar os resultados obtidos até o momento na pesquisa sobre a determinação das categorias lexicais em textos de LIBRAS (Língua de Sinais Brasileira).Para desenvolver esse trabalho partiu-se de um corpus de textos em LIBRAS, escritos por alguns colaboradores surdos. Esses textos abordavam diversos tipos de assuntos, tais como fábulas, material jornalístico, curiosidades, histórias de vidas etc. O trabalho deu-se em três momentos: reconhecimento e catalogação dos sinais encontrados nos textos, definição da categoria gramatical e, por fim, reconhecimento e caracterização das principais estruturas frasais encontradas. Até o presente momento foram catalogados e definidos gramaticalmente aproximadamente 1100 sinais em escrita Sign-Writing. A escrita Sign-Writing é um conjunto de símbolos utilizados para representar graficamente os sinais. Além disso, percebemos que a maioria das frases são compostas por substantivos e verbos no infinitivo, as flexões verbais geralmente são feitas por meio de marcadores, advérbios por exemplo.

Introdução

O presente trabalho deu-se a partir da necessidade de catalogação, classificação e análise das principais estruturas lingüísticas (categorias gramaticais e tipo de estrutura frasal) dos sinais  da LIBRAS ( Língua de Sinais Brasileira) encontrados em textos escritos em Sign-writing.

Linguagem


A linguagem diz respeito a um sistema constituído por elementos que podem ser gestos, sinais, sons, símbolos ou palavras, que são usados para representar conceitos de comunicação, idéias, significados e pensamentos. Nesta acepção, linguagem aproxima-se do conceito de língua.
Numa outra acepção, linguagem refere-se à função cerebral que permite a qualquer ser humano adquirir e utilizar uma língua. Por extensão, chama-se linguagem de programação ao conjunto de códigos usados em computação. O estudo da linguagem é chamado linguística, uma disciplina acadêmica introduzida por Ferdinand de Saussure, no início do século XX, e depois desenvolvida como ciência.


LIBRAS


Libras é a sigla de Língua de Sinais Brasileira que é a língua natural da comunidade surda brasileira. Os sinais são formados por meio da combinação de formas e de movimentos das mãos e de pontos de referência no corpo ou no espaço.  Devido a essa particularidade, a LIBRAS muitas vezes é tida como um simples conjunto de gestos e mímicas utilizados pelos surdos na sua comunicação.
A Libras é considerada uma língua natural pois possui uma estrutura gramatical própria: sintaxe, morfologia, semântica, fonologia.

Segundo a legislação vigente, Libras constitui um sistema lingüístico de transmissão de idéias e fatos, oriundos de comunidades de pessoas com deficiência auditiva do Brasil, na qual há uma forma de comunicação e expressão, de natureza visual-motora, com estrutura gramatical própria. Decretada e sancionada em 24 de abril de 2002, a Lei N° 10.436, no seu artigo 4º, dispõe o seguinte: "O sistema educacional federal e sistemas educacionais estaduais, municipais e do Distrito Federal devem garantir a inclusão nos cursos de formação de Educação Especial, de Fonoaudiologia e de Magistério, em seus níveis médio e superior, do ensino da Língua Brasileira de Sinais - Libras, como parte integrante dos Parâmetros Curriculares Nacionais – PCNs, conforme legislação vigente".


SignWriting


Como foi dito anteriormente, a LIBRAS é uma língua espaço-visual, isto é, se dá no espaço a partir de uma combinação de movimentos realizados pelas mãos, braços, corpo e expressão facial.
Sign-writing é um conjunto de regras e símbolos para a notação dos sinais realizados pela LIBRAS. Abaixo exemplo da palavra “pai” em escrita SignWriting.


Figura 1: PAI


Conceito de Dicionário


Dicionário é um conjunto vocábulos de uma língua ou dos termos próprios de uma ciência ou arte, dispostos por ordem alfabética e com a respectiva significação ou a sua versão noutra língua. Geralmente, os dicionários são organizados na forma de livrosimpressos mas com o advento dos sistemas digitais esses dicionários passaram a dispor de suas versões digitalizadas (em CD-Rom) e/ou on-line.


Dicionário Eletrônico

 

Os dicionários on-line possuem a função de facilitar tornar mais acessível as suas informações aos seus usuários. O dicionário eletrônico pode ser apresentado de duas formas: a primeira, em CD-Rom, e a segunda, disponibilizado na internet. Esses dicionários possuem como diferencial a possibilidade de apresentação de diversas mídias (imagens, sons, vídeos) à apresentação de seus resultados de busca. Além do mais, esses dicionários podem disponibilizar ao usuário outros recursos como: busca rápida, apresentação de sinônimos, usos mais freqüentes dos verbetes consultados, corretores gramaticais, gramática apresentada de forma simples e objetiva entre outros recursos.


Caracterização do dicionário proposto

 

O dicionário proposto está vinculado ao projeto SWDB: Dicionário para as Línguas de Sinais usadas pelos surdos. Esse projeto constou no desenvolvimento de um software para a criação e gerenciamento de um dicionário on-line. O dicionário chamado de SWDB (SignWriting Data Base) consiste em desenvolver um dicionário on-line baseado, inicialmente, em um corpus lingüístico fornecido por textos escritos em línguas de sinais que fazem parte do banco de dados do projeto. Em um segundo momento, esse banco de dados do dicionário poderá ser ampliado de forma cooperativa com os usuários cadastrados no sistema.

O sistema de busca do dicionário consiste em digitar o verbete a ser consultado no campo específico e clicar no botão “Procurar Sinal”.

Figura 2: Campo de busca no dicionário On-line

 

Em seguida, o sistema disponibilizará ao usuário informações sobre o verbete consultado, essas informações são: dados de inserção do sinal no sistema, informações visuais, o código do sinal em escrita realizada pelo editor SignEdit, o sinal apresentado em forma de figura, informações lexicais, morfológicas, sinônimos e exemplos de frases utilizando o sinal.

 


Figura 3: Apresentação do resultado no dicionário On-line

Metodologia


Para desenvolver esse trabalho partiu-se de um corpus de textos em LIBRAS, escritos por alguns colaboradores surdos. Esses textos abordavam diversos tipos de assuntos, tais como fábulas, material jornalístico, curiosidades, histórias de vidas etc. O trabalho deu-se em três momentos: reconhecimento e catalogação dos sinais encontrados nos textos, definição da categoria gramatical e, por fim, reconhecimento e caracterização das principais estruturas frasais encontradas.


Reconhecimento e catalogação


Para o desenvolvimento desse primeiro momento da pesquisa foi necessária a colaboração direta dos surdos integrantes da equipe de pesquisa. Os textos foram impressos e os seus sinais isolados um a um. Em seguida, foi feito o reconhecimento desses sinais em Língua Portuguesa. Feito isto, os sinais foram reescritos utilizando o editor Sign-Edit (será descrito no item Materiais) e salvos em  dois formatos de arquivos: SWMLT (arquivo gerado com o editor Sign-Edit) e em formato .gif (tipo de arquivo para figuras). Cada um desses arquivos foi separado de outras duas maneiras: arquivo com o texto integral, arquivo isolado de acordo com a ordem alfabética de cada sinal. Ao final desse momento, obteve-se, aproximadamente 783 sinais divididos em 596 verbetes, ou seja, como cada sinal pode ser representado de mais de uma maneira, isso é o que gerou o diferença do número de sinais para o número de verbetes. Os sinais estão sendo separados, neste momento, de acordo com a sua categoria gramatical.

 

Definição da categoria gramatical

 

Após a catalogação dos sinais foi feita a definição da categoria gramatical de cada um dos sinais. A definição dessas categorias foi feita de acordo com Ferreira Brito (1997) que faz a seguinte apresentação:

 

- Verbos: há basicamente dois tipos de verbos na LIBRAS: os que possuem marca de concordância e os que não possuem marca de concordância. Exemplos:

 


       Figura 4: sinal TRABALHAR                                            Figura 5: sinal ANDAR

  (verbo que não possui marca deconcordância)         (verbo que possui marca deconcordância)             

EU TRABALHAR  UCPEL                                                        pessoaANDAR

                “eu trabalho na UCPEL”                     

-  Advérbios: as marcas de tempo geralmente são feitas por meio de advérbios. Exemplo:

 


                                                           Figura 6: sinal HOJE

                                             Hoje trás a idéia de presente nas orações.

- Adjetivos: os adjetivos sempre estão na forma neutra em LIBRAS, não havendo marca de gênero ou número. Exemplo:


                                                         Figura 7: sinal TRISTE

- Pronomes: os pronomes possessivos, os pessoais e os demonstrativos, também não possuem marca de gênero e estão relacionados às pessoas do discurso. Exemplo:


 


                                     Figura 8: sinal MEU               Figura 9: sinal CASA

O pronome MEU irá concordar com o substantivo CASA, relaciona-se à pessoa do discurso e não à coisa possuída.

- Numerais: os numerais cardinais são idênticos ao português, os numerais ordinais possuem a mesma representação mas seguidos de movimentos distintivos aos cardinais. Exemplos:


                 Figura 10: sinal TERCEIRO           Figura 11: sinal TRÊS

- Substantivos: os substantivos geralmente são neutros, não possuindo marca de gênero. Exemplo:

 


                                                  Figura 12: sinal MACACO

O sinal MACACO pode ser utilizado para qualquer um dos gêneros, macho ou fêmea.


      Reconhecimento e caracterização das principais estruturas frasais encontradas

De acordo com Quadros&Karnopp (2004), a LIBRAS apesar da grande flexibilidade da ordem das frases, mantém como base as construções do tipo SVO (Sujeito- Verbo-Objeto). Frases desse tipo serão conideradas sempre como gramaticais. As ordens OSV e SOV ocorrem somente quando há alguma coisa a mais na sentença, como a concordância e as marcas não-manuais. Em uma análise preliminar predominaram as sentenças do tipo SVO.




Materiais empregados

 


Para o desenvolvimento do projeto utilizou-se muitos softwares, na sua maioria os chamados opensource, ou seja, programas gratuitos. Como exemplo de software utizado pode-se citar o editor de sinais chamado Sign-Edit, software desenvolvido pelo coordenador do projeto em parceria com um bolsista de iniciação científica, bolsista esse já formado.


 


Figura 13: Editor Sign-Edit


Figura 14: Editor SW-Edit

 


Análise dos dados

Partindo dos dados quantitativos fornecidos pela catalogação dos sinais, obtivemos 783 sinais divididos em 596 verbetes. Esses verbetes foram divididos nas seguintes categorias:

 

Categoria gramatical

Nº de ocorrências

% do total dos sinais

Substantivos

353

59,21%

Adjetivos

56

9,39%

Pronomes

16

2,68%

Verbos

141

23,65%

Advérbios

14

2,34%

Numerais

13

2,18%

Preposições

2

0,35%

Artigos

1

0,16%

Total

596

100%


Obs.: cabe salientar que os verbos não foram classificados de acordo com a distinção dos verbos feita por Quadros&Karnopp (2004), apenas foram contabilizados.

 

De acordo com o quadro acima podemos fazer algumas considerações:

- a Língua de Sinais é composta basicamente por substantivos e verbos, essas categorias representam 82,86% do léxico analisado;

- os adjetivos representam 9,39% dos sinais, representam um número pouco significante;

- advérbios, preposições, numerais, artigos e pronomes representam 7,71% dos sinais.

 

Um dado que despertou curiosidade foi a ocorrência de 1 (um) artigo que de acordo com  Rinaldi (1997) essa categoria não seria esperada na análise morfológica dos sinais. Essa ocorrência pode ter sido causada pelo fato de o escritor do texto em SignWriting ter feito uma união da Gramática da Libras com a Gramática do Português.
Feita esta primeira análise partiu-se para o estudo das principais estruturas frasais nos textos. De acordo com Quadros&Karnopp a base da gramática da Libras seria a ocorrência de estruturas do tipo SVO. Essa estrutura pode ser comprovada na frase abaixo:

 

 


 


              Figura 15: sinal MUNDO    Figura 16: sinal PODE     Figura 17: sinal DOENTE

 

Conclusões

 

De posse dos dados obtidos com o trabalho de análise dos textos, obtivemos subsídios suficientes para dar inicio à construção e implementação do dicionário on-line. Chegamos a conclusão de que o léxico da LIBRAS é constituído basicamente por substantivos e verbos, sendo que estes são organizados na maioria dos casos em estruturas do tipo SVO (Sujeito-Verbo-Objeto). A partir dos dados obtidos a equipe do projeto sente-se mais segura a fazer novas e mais detalhadas análises na escrita SignWriting.

 

 

Referências

 

CHOMSKY, N.; LASNIK, H. Principles and parameters theory. In: GRUYTER, Walter de (ed.) Syntax: an international handbook of contemporary research. Berlim, 1993.

FERREIRA-BRITO, L. Por uma gramática de língua de sinais. Rio de Janeiro:  Tempo Brasileiro, 1995.

LIDDELL, S. K.; JOHNSON R.E. American sign language compound formation processes, lexicalization and phonological remnants. Natural Language and Linguistic Theory.
QUADROS, R. M. de. Língua de Sinais Brasileira: estudos lingüísticos / Ronice    Müller de Quadros e Lodenir Becker Karnopp. - Porto Alegre: Artmed, 2004.
QUADROS, R. M. de.
Phrase structure of brazilian sign language. Porto Alegre: PUCS, Tese de Doutorado, 1999.

RINALDI, Giuseppe (org.). Deficiência Auditiva. Brasília: SEESP, 1997.
SAUSSURE, F. de. Curso de lingüística geral. 20. ed. São Paulo: Cultrix, [1916], 1995.
SILVA, T. C. Fonética e fonologia do português. São Paulo: Contexto, 1999.
SOUZA, M. C. P. de; KOCH, I. V. Lingüística Aplicada ao Português: Sintaxe. 11ª Edição. Cortez Editora.

STOKOE, W. C. Sign language structure. Silver Spring: Linstok Press. [1960] 1978.
SUTTON, V. Lessons in Sign Writing. DAC - Deaf Action Committe for Sign Writing.      
Tradução parcial e adaptação do Inglês/ASL para Português/LIBRAS.