O Programa Informático NUD-IST — análise qualitativa de informação escrita
Vítor Ferreira e Paulo Machado
Grupo de Ecologia Social do LNEC
Portugal



Introdução

Este trabalho surgiu no âmbito de um convite endereçado pelo Grupo de Ecologia Social do LNEC, com vista à exploração de um programa informático adquirido pelo referido gabinete de estudos.

O programa, denominado NUD•IST, é vocacionado para análise de conteúdo e foi concebido e desenvolvido pela Universidade de La Trobe de Melbourne, Australia.

Sendo um programa pouco conhecido entre nós, tornou-se pertinente avaliar as suas capacidades e a forma como pode ser utilizado para a investigação, sobretudo, nas ciências sociais.

É neste sentido que surge esta comunicação, que resume as várias etapas que percorremos neste trabalho, desde a contextualização do programa nas várias técnicas de análise de conteúdo até à experimentação do programa com exemplos concretos.

A análise de conteúdo é um técnica que pretende analisar, sobretudo, as formas de comunicação verbal, escrita ou não escrita, que se desenvolvem entre os indivíduos. Desde o texto literário, passando pelas entrevistas e discursos tudo é susceptível de ser analisado por esta técnica.

No entanto, para sermos mais claros temos dizer que a análise de conteúdo é, no fundo, um conjunto de várias técnicas. Ou seja, existem diferentes formas de analisar um mesmo documento.

Por exemplo, pode ser uma técnica mais qualitativa que dê maior importância aos temas e subtemas em que se divide determinado texto; ou uma técnica mais quantitativa que enquadre as várias unidades do texto numa série de relações estatísticas (como é o caso da análise factorial). Tudo depende da selecção que cada investigador faz, em função do objecto que tem de analisar e dos objectivos a que se propõe chegar.

Por estes motivos, não é fácil enquadrar a análise de conteúdo numa definição que a caracterize num todo. A única possibilidade é generalizar a partir, do que em termos abstractos, pode ser definido como o processo de investigação efectuado em qualquer análise de conteúdo.

Feito o parâmetro podemos definir a análise de conteúdo como um conjunto de técnicas de análise das comunicações visando obter, por procedimentos sistemáticos e objectivos de descrição do conteúdo das mensagens, indicadores (quantitativos ou não) que permitam a inferência de conhecimentos relativos às condições de produção/recepção (variáveis inferidas) destas mensagens. (*)

Partindo desta definição existem dois procedimentos (que podem ser generalizados a todas as técnicas de análise de conteúdo), e que a distinguem de abordagens comuns, como a leitura pura e simples de um texto.

O primeiro é a descrição analítica. A função deste procedimento é no fundo a exploração do próprio texto, tendo como base uma codificação que é constituída por um certo número de categorias, sendo cada uma composta por vários indicadores. Estes indicadores representam determinadas unidades de registo que vamos procurar no texto. Num fundo, trata-se de uma enumeração das características mais fundamentais e pertinentes que encontramos no texto.

O segundo procedimento é a inferência. Esta operação é a que nos vai permitir dar uma significação fundamentada às características que foram encontradas no texto. Ou por outra, é através da inferência que podemos interpretar os resultados da descrição, o que nos vai permitir objectivar as condições de produção que estiveram na base de um determinado texto. Ou seja, a partir das estruturas semânticas ou linguísticas vamos chegar a estruturas sociológicas ou psicológicas.

Este é o percurso natural de qualquer análise de conteúdo. Tentar saber aquilo que está por detrás de texto, e quais foram as condições que levaram à sua produção.

Como dissemos, a análise de conteúdo não é um todo uniforme e unívoco. Pelo contrário, ela exige-nos um esforço de conhecimento (antes mesmo de entramos na investigação em si), por exemplo, temos de saber a priori que tipo de técnicas existem e em que contextos foram utilizadas, que tipo de benefício e de malefício determinada técnica pode oferecer, e sobretudo, que pertinência existe em utilizarmos uma técnica específica.

Outro tipo de questão que pode ser levantada é sabermos até que ponto uma técnica de análise pode ou não ser desenvolvida a partir de um determinado instrumento, como é o caso de um programa de informática que esteja ao nosso dispôr. Ou seja, até que ponto um determinado instrumento nos pode apoiar numa investigação que tenha como base uma técnica específica de análise de conteúdo. No contexto deste debate, esta é a questão mais importante.

Foi-nos proposto investigar um programa de informática (o NUD•IST) que se enquadra nesta problemática da análise de conteúdo. Por isso, à medida que descodificavamos o programa tivemos de pôr algumas questões que, posteriormente, teríamos de controlar.

O primeiro passo a realizar foi tentar contextualizar o programa naquilo que, em termos gerais, é considerado como sendo a análise de conteúdo:

O NUD•IST é como todos, um programa direccionado e que não comporta todas as técnicas que existem. Por outro lado, este não nos diz explicitamente para que técnica é mais vocacionado, isto porque ele próprio pode ser adaptado a várias técnicas e não somente a uma única. Foi a partir deste pressuposto — da não totalidade, por um lado, e da não exclusividade, por outro — que tivemos de empreender um diálogo entre as técnicas existentes e as potencialidades que o programa detém.

Nestes termos, o NUD•IST enquadra-se nas técnicas que desenvolvem uma análise qualitativa, nomeadamente uma análise temática. É sobretudo uma análise relacional com uma vertente estatística muito limitada. A associação e a subdivisão de categorias são as suas operações mais importantes. Com estas podemos desmontar o texto, em função do encadeamento dos núcleos de sentido e da forma como estes se hierarquizam (do geral para o particular). A forma como o programa materializa este conjunto de operações é através da chamada estrutura em árvore invertida, que é utilizada em algumas técnicas de análise de conteúdo.

O outro problema que nos foi posto, foi tentar compreender o programa, no sentido de controlar os perigos que um mau manuseamento pode trazer para uma investigação:

O NUD•IST não nos traz uma "receita de análise", muito pelo contrário, através do seu sistema interactivo, ele dá ao investigador o mérito de conduzir toda a análise. Portanto, é um programa que não basta conhecer os comandos para ter um output final, por mais inconsistente que possa ser. Como nós sabemos, existem programas que nos permitem ter logo resultados accionando uma série de operações (por exemplo, os programas estatísticos). O NUD•IST é nesse sentido um programa "morto" que só "vive" através de uma reflexão e construção precisa do investigador com o próprio programa.

Neste sentido a grande vantagem do NUD•IST é permitir não só a exploração, pura e simples, do texto, mas, também a possibilidade de construir com ele o modelo da análise. Portanto, não temos apenas os resultados, temos também a lógica que lhes estão imanentes. Ou por outra, ele não nos possibilita apenas a descrição analítica, mas também a inferência de um modelo que dê um significado à mera caracterização.

Quanto à lógica de funcionamento, o programa divide-se em duas partes que se complementam: a indexação e a pesquisa.

A indexação consiste na referenciação dos documentos a um modelo de análise.

Assim, em primeiro lugar, temos de introduzir os documentos que vamos analisar no projecto criado no NUD•IST. Após esta operação, criamos o dito modelo de análise, que assumirá a forma de uma árvore invertida. Esta árvore consiste numa estrutura hierárquica de categorias criadas pelo investigador, e que se posicionam consoante a sua maior ou menor especificidade. O NUD•IST permite construir a estrutura categorial quer através de comandos, quer através do próprio interface gráfico onde é apresentada a árvore, atribuindo a cada categoria um endereço numérico correspondente ao lugar ocupado na hierarquia, possibilitando assim, de uma forma intuitiva e organizada, uma mais fácil utilização do programa.

Introduzidos os documentos e construído o modelo de análise, passa-se à indexação, propriamente dita, isto é, à ligação dos documentos às categorias criadas. A indexação pode ser realizada manualmente pelo investigador, escolhendo as unidades de texto que quer indexar a esta ou aquela categoria, ou pode socorrer-se das ferramentas de pesquisa disponibilizadas pelo NUD•IST. E aqui entramos já na segunda parte referida: a pesquisa.

Com o NUD•IST podemos pesquisar, quer os documentos, quer o sistema de índices, isto é, a estrutura categorial criada e devidamente indexada.

A operação de pesquisa de texto, é desenvolvida através do comando search text, que procura em cada documento as unidades de texto que pretendemos medir. Por exemplo, é através deste comando que verificamos a frequência de determinada palavra. Mas, o NUD•IST põe à disposição do investigador uma série de opções a este comando que o tornam bastante mais potente que comandos similares que podemos também encontrar, por exemplo, em processadores de texto.

A pesquisa do sistema de índices consiste na investigação, segundo determinados critérios, das categorias já indexadas. A pesquisa do sistema de índices é, em certa medida, a operação que medeia a fase exploratória da procura, e a fase conceptual presente na estruturação da árvore. É aqui que se realizam as várias relações possíveis entre as unidades de texto recolhidas. Esta operação é composta por uma série de comandos (search index system) que nos permitem cruzar, de várias e diferentes formas, as diversas categorias.

Com base nos resultados obtidos quer pela investigação dos documentos, quer pela investigação do sistema de índices, podemos ir reconstruindo, a par e passo, o nosso modelo categorial, tornando-o mais rico, mais completo e mais preciso.

As virtudes e potencialidades do NUD•IST emergem, sobretudo, quando trabalhamos com material muito extenso ou em grande quantidade. Por exemplo, a pesquisa de uma palavra ou palavras num inquérito com muitas entrevistas, é realizado em apenas alguns segundos. Ou ainda, a selecção das unidades de texto associadas entre si, por este ou aquele critério, levam muito menos tempo do que feitas manualmente pelo próprio investigador. O NUD•IST é portanto exímio e de extrema utilidade na pesquisa transversal de muitos documentos. Mas para o fazermos necessitamos dos documentos editados electronicamente. Aí se associarmos ao NUD•IST hardware e software de leitura e reconhecimento óptico de caracteres, teremos óptimas condições de manuseamento do nosso acervo documental.

Por outro lado, o NUD•IST, para uma maior maximização do tempo e do trabalho, põe à disposição do investigador um comando e uma linguagem de macros para execução de rotinas. Esta linguagem cobre todos os comandos do NUD•IST, e é gramaticalmente de fácil aprendizagem.

Por fim, devido ao NUD•IST não ser um programa directivo, a sua versatilidade permite que se usem os módulos separadamente. Assim, por exemplo, podemos utilizar o interface gráfico para construir uma árvore de catalogação, sem precisarmos do módulo de pesquisa. Além destes módulos, o NUD•IST dispõe ainda de um editor de texto (obviamente não tão potente como os programas vocacionados só para para esse fim), de editores de relatórios e de sumários. Por isto, e pela sua fácil utilização, o NUD•IST não é, pois, um programa exclusivamente dirigido àqueles que fazem análise de conteúdo, podendo servir também outras áreas cientificas.