PROPOSTA PARA UM AMBIENTE INTELIGENTE DE ENSINO A DISTÂNCIA


Honório Assis Filho Crispim
Universidade de Brasília
crispim@nmi.unb.br

Humberto Abdalla Júnior
Universidade de Brasília
abdalla@ene.unb.br

Luis Fernando Ramos Molinaro
Universidade de Brasília
molinaro@nmi.unb.br

(Texto original com imagens: clique aqui)


RESUMO

Os sistemas e ambientes de ensino a distância apresentam limitações quanto ao acompanhamento do processo de aprendizado do aluno, que podem ser minimizadas com o uso da Inteligência artificial. Neste contexto, os autores propõem um modelo de inclusão de mecanismos de raciocínio computacional em um ambiente de ensino à distância chamado Creatio.

PALAVRAS-CHAVE

ambiente,ensino a distância, Web, Creatio, inteligência artificial.


1. Introdução

A grande maioria dos ambientes clássicos de ensino a distância, entre eles o Creatio1, apresenta limitações na implementação da interação entre o aluno e o ambiente de ensino. Este processo interativo utiliza largamente os conceitos da Web, mas as ferramentas carecem de elementos que dêem ao aluno a noção de uma observação presencial.

Do ponto de vista pedagógico, tem melhor aprendizado quem está motivado e possui o acesso ao conhecimento. Perkins aponta os seguintes estados básicos para um bom aprendizado [PER 1992]: a) informação clara, concisa e precisa b) prática do assunto estudado c) resposta do trabalho realizado e d) motivação (intrínseca e extrínseca).

Considerando que as ferramentas Web podem fornecer, parcialmente, as características apontadas por Perkin, ficamos na dependência de um ciclo de ensino que atenda a estes estados básicos. Segundo Bracked, um ciclo de ensino deve atender aos seguintes requisitos [BRA 1998]: a) Apresentar a informação relacionada ao objetivo do ensino; b)Direcionar a ação dos estudantes para estes objetivos; c) Valorizar e avaliar as ações dos estudantes; e) Fornecer feedback; e) Fornecer estratégias de orientação para o aluno; f) administrar e motivar todo o processo de ensino.

Os trabalhos apresentados pelos pesquisadores da área de EAD exigem, para sua efetiva implementação, a adoção de estratégias computacionais mais complexas. Mesmo do ponto de vista humano, o atendimento de todos estes requisitos exige do professor um alto grau de conhecimento do assunto que ele esteja abordando, bem como a definição de um modelo pedagógico e instrucional adequado.

A ferramenta proposta neste trabalho, com o objetivo de atender às metas abordadas e, conseqüentemente, de aproximar-se do professor humano, lançará mão de técnicas computacionais como uso da inteligência artificial e do paradigma softwares agentes.

2. Mecanismos de implementação de inteligência

Considerando a falta de uma definição formal e precisa para Inteligência Artificial (IA), pois antes teríamos que definir a própria inteligência foram propostas algumas definições como: "uma máquina é inteligente se ela é capaz de solucionar uma classe de problemas que requerem inteligência para serem solucionados por seres humanos" [MCC 1969]; e "Inteligência Artificial é a parte da ciência da computação que compreende o projeto de sistemas computacionais que exibam características associadas, quando presentes no comportamento humano, à inteligência" [BAR 1981].

Dada a necessidade de encontrar formas alternativas de expressão do conhecimento que se aproximassem do modelo humano, foram desenvolvidos diferentes modelos de representação de conhecimento. De uma forma geral, um sistema de representação de conhecimento deve possuir uma boa adequação representacional e inferencial, bem como eficácia inferencial e aquisitiva [RIC 1994].

Considerando os inúmeros domínios de problemas e a falta de um modelo genérico e eficiente, foram desenvolvidas diversas propostas como: o uso da lógica de predicados, regras de produção, Redes Bayesianas, redes neurais etc, sendo que cada uma destas propostas tem nichos de ação específicos.

No ambiente em questão, foram utilizados especificamente redes Bayesianas, redes neurais, workflow e softwares agentes. Desta forma, cada um destes tópicos será trabalhado, a posteriori, individualmente a fim de ratificar a escolha dos mesmos.

A primeira aplicação de IA à educação foi a construção de um STI (Sistema de Tutoria Inteligente). O coração de um STI é um sistema inteligente (SI). O SI armazena conhecimento suficiente sobre uma área particular do conhecimento humano e fornece repostas "ideais" para as questões formuladas em cada passo do processo de ensino e não apenas no final de um módulo. Freqüentemente, como professores humanos, ele pode gerar diferentes respostas e caminhos a serem seguidos.

A performance do STI é diretamente proporcional a inteligência do modelo adotado para resolver um dado problema. Ele pode monitorar como o estudante resolve um problema e evidenciar se os passos adotados na solução estão corretos. Desta forma, enquanto no CAI (Computer-Aided Instruction) uma questão é a unidade básica no STI a unidade básica é cada passo de raciocínio individual.

Para suportar este ensino detalhado o STI freqüentemente cria e mantém o modelo do estudante. Este modelo reflete as regras corretas que o STI deve "pensar" que o estudante deve saber. Como os estudantes não são ideais, o modelo pode conter erros. O STI assiste cada parte do raciocínio do estudante no momento em que este está resolvendo um dado problema. Cada vez que o estudante erra no processo de resolução o STI detecta a falha, orienta detalhadamente o aluno e modifica o modelo do aluno. Este processo repete-se até que o aluno resolva o problema.

Uma parte do STI que é pouco mencionada é o componente pedagógico. Enquanto o sistema inteligente contém regras e conhecimento que direciona um dado STI, o componente pedagógico supostamente contém regras similares que codificam a perícia do tutor em si (por exemplo, quando interromper o aluno e quais as informações devem ser fornecidas a ele). Contudo, os STI´s ainda carecem de inteligência aplicada ao contexto pedagógico [MCA 2002].

Considerando as múltiplas formas de expressão de inteligência usadas neste contexto, serão detalhadas as principais:

2.1 Redes Bayesianas

As Redes Bayesianas foram desenvolvidas no final da década de setenta para modelar o processamento distribuído na compreensão de leitura, onde a semântica esperada e a evidência procedural devem ser combinadas para uma interpretação coerente.

A probabilidade condicional é o cerne do tratamento Bayesiano da incerteza (redes causais). Um enunciado de probabilidade condicional pode ser realizado na seguinte forma: "Dado que o evento B ocorreu, então a probabilidade do evento A é x", que corresponde a seguinte expressão matemática é P( A | B ) = x.

A habilidade de coordenar inferências bidirecionais preencheu um vazio na tecnologia de sistemas inteligentes na década de oitenta e, desde então, a Rede Bayesiana vem sendo utilizada como um esquema de representação de conhecimento incerto [JEN 1996].

Redes Bayesianas são grafos direcionados e acíclicos (DAGs) nos quais os nós representam as variáveis de interesse e os arcos representam a dependência causal entre as variáveis. A força da dependência é representada pela probabilidade condicional que é colocada em cada grupo de nós da rede (filhos e respectivos pais).

A Figura 1 ilustra uma Rede Baysiana que descreve o seguinte relacionamento causal: chuva e mangueira são causas de grama molhada para Pedro e apenas a chuva é causa para José.

A predição requer um modelo econômico de representação de uma distribuição conjunta e a Rede Bayesiana atinge este objetivo; a distribuição conjunta é dada pela regra da cadeia:

Nesta representação, cada variável Ai possui a probabilidade condicional P(Ai | p(Ai)), onde p(Ai) é a probabilidade dos pais, que torna a variável em questão independente de outros predecessores que não sejam estes.

Vários algoritmos foram propostos para a propagação de evidências nas Redes Bayesianas e os primeiros usavam uma arquitetura de passagem de mensagens com o uso de árvores limitadas. Técnicas têm sido desenvolvidas e mecanismos melhores, como árvores de junção, adotados.

Uma característica forte da Rede Bayesiana, além de sua organização causal, é a habilidade de representar e responder às mudanças de configurações. Desta forma, qualquer mudança causa a reconfiguração da rede de uma forma simples e imediata.

Nas decisões do dia a dia as crenças que temos a respeito das coisas são ajustadas às novas condições. Desta forma, com as Redes Bayesianas, podemos organizar um plano de crenças, que consiste em sentenças com características lógicas e probabilísticas que reflitam nosso raciocínio lógico e incerto.

A escolha da Rede Bayesiana como modelo para a atividade cognitiva baseou-se na força de sua representação causal e na facilidade de representação do raciocínio humano.

2.2 Rede Neural

As Redes Neurais já são estudadas a mais de 50 anos e seus modelos neurais procuram aproximar o modelo de processamento dos computadores ao do cérebro humano. As redes neurais possuem um grau de interconexão similar a estrutura do cérebro e num computador convencional moderno a informação é transferida em tempos específicos dentro de um relacionamento com um sinal para sincronização [BAR 1998].

A força da estrutura de redes neurais está na habilidade de adaptação e aprendizagem. A adaptação e aprendizagem significam que modelos de redes neurais podem lidar com dados imprecisos e situações não totalmente definidas. Neste contexto, uma rede treinada de maneira razoável tem a habilidade de generalizar quando é apresentada a entradas que não estão presentes em dados já conhecidos por ela.

As redes neurais possuem qualidades superiores às técnicas estatísticas convencionais como: capacidade de auto-aprendizado, exigência de um menor tempo para implementação de um sistema especialista, melhor imunidade a falhas, capacidade de generalização, imunidade a ruídos e alta adaptabilidade.

Da mesma forma que o sistema nervoso é composto por bilhões de neurônios, a rede neural artificial também é formada por unidades que nada mais são que pequenos módulos que simulam o funcionamento de um neurônio. A operação de uma unidade (módulo, neurônio) de processamento, proposta por McCullock e Pitts em 1943, pode ser resumida da seguinte maneira (Figura 2): a) Sinais são apresentados à entrada; b) Cada sinal é multiplicado por um número, ou peso, que indica a sua influência na saída da unidade; c) É realizada a soma ponderada dos sinais que produz um nível de atividade. Se este nível de atividade exceder um certo limite (threshold) a unidade produz uma determinada resposta de saída.

Supondo os sinais de entrada X1, X2, ..., Xp e respectivos pesos w1, w2, ..., wp e limitador t. Considerando os sinais assumindo valores booleanos (0 ou 1) e pesos com valores reais, teremos o nível de atividade dado por: ( a = w1X1 + w2X2 + ... + wpXp). A saída y dada por: (y = 1, se a >= t) ou (y = 0, se a < t).

Um dos objetivos da pesquisa sobre redes neurais na computação é desenvolver morfologias neurais matemáticas, não necessariamente baseada na biologia, que podem realizar funções diversas [KOV 1996]. Contudo, na maior parte dos casos, modelos neurais são compostos de muitos elementos não lineares que operam em paralelo e que são classificados de acordo com padrões ligados à biologia.

A propriedade mais importante das redes neurais é a capacidade de aprender a partir de seu ambiente e com isso melhorar seu desempenho. Isso é conseguido através de um processo iterativo de ajustes aplicado a seus pesos, o treinamento.

Os dois primeiros passos do processo de desenvolvimento de redes neurais artificiais são a coleta de dados relativos ao problema e a sua separação em um conjunto de treinamento e um conjunto de testes [FIL 1996]. Os dados coletados são separados em duas categorias: dados de treinamento, que serão utilizados para o treinamento da rede e dados de teste, que serão utilizados para verificar sua performance sob condições reais de utilização.

O terceiro passo para a produção de aplicativos desta natureza é a definição da configuração da rede - seleção do paradigma neural, determinação da topologia da rede a ser utilizada e determinação de parâmetros do algoritmo de treinamento e funções de ativação.

O próximo passo é o treinamento da rede. Nesta fase, seguindo o algoritmo de treinamento escolhido, serão ajustados os pesos das conexões. Após a implementação deverá ser realizado o teste da rede para posterior integração no sistema do ambiente operacional da aplicação.

A principal idéia por trás do uso de redes neurais para a resolução de problemas é a sua habilidade de aprender com o passado e generalizar quando responde a uma dada entrada. Contudo, existem outras abordagens como análise da rede neural e extração de regras, conhecimento explícito e inserção de regras na arquitetura de conexão como propostas de aproximação do raciocínio [KAS 1996].

A rede neural é tipicamente utilizada no reconhecimento de padrões e classificação. No caso específico do modelo proposto, ela será utilizada no reconhecimento do padrão comportamental do aluno e na conseqüente classificação do mesmo - implementação do modelo do aluno. Esta estrutura irá possibilitar a definição inicial do perfil do aluno e ao seletor de estratégias inferir o caminho do processo ensino/aprendizagem adequado para o aluno em questão.

2.3 Workflow

A organização do conhecimento a ser transferido para o aluno (páginas html) será através de workflow. Neste contexto, teremos um conjunto de caminhos, inicialmente três, definidos pelo especialista no assunto. Basicamente a organização estará focada em diferentes níveis de explicações e respectivos exercícios para teste de aprendizado sobre uma dada parte da disciplina (aula).

O conteudista, perito no assunto, fará a organização do mesmo utilizando páginas html (padrão Creatio) que abordem o tema nos níveis básico, médio e avançado. Cada aluno será monitorado individualmente e encaixado, ao longo de seu aprendizado, num destes perfis.

A definição de um conteúdo como básico ou avançado, apesar de possuir características específicas do especialista que está mensurando a dificuldade, representa uma heurística razoável de classificação dos discentes.

2.4 Agentes Inteligentes

Um agente pode ser visto como uma outra forma de abstração de software, em comparação a abstrações como métodos, funções e objetos. Uma classe (modelo para objetos) é uma abstração de alto nível que descreve métodos e atributos de um dado componente de software. Desta forma, verifica-se que o foco da programação de um agente é na definição de seu comportamento ao invés de classes, métodos e atributos.

Existe um conjunto comum de características que são típicas de um software agente: a) Autonomia - ser capaz de operar sozinho e disparar ações sem a intervenção do usuário; b) Comunicabilidade - comunica-se com o usuário, com outros softwares agentes ou outros processos; c) Percepção - habilidade de perceber e responder às mudanças no seu ambiente de execução [RUS 1995]; d) Adaptabilidade - processar diferentes níveis de tarefas, de acordo com sua competência.

Enquanto softwares agentes devem ser autônomos, comunicativos e perceptivos, eles devem ter diferentes níveis de inteligência. Estes níveis são determinados pelas especificações de seus comportamentos.

Uma vez definido agente, deve-se conhecer as características do mesmo que o tornam inteligente. Newell argumenta que o software para ser considerado inteligente deve possuir as seguintes características [NEW 1988]: a) Habilidade de explorar uma soma significativa do domínio de conhecimento; b) Tolerância a erros inesperados ou resultantes de entradas errôneas; c) Habilidade no uso de símbolos e abstrações; d) Capacidade adaptativa e comportamento orientado ao objetivo; e) Habilidade de aprender com o ambiente; f) Capacidade de operação em tempo real; g) Habilidade de comunicação em linguagem natural.

Vários pesquisadores têm afirmado que agentes com alta capacidade de inteligência podem ser construídos sem terem a capacidade de aprender. Hayes-Roth vê agente inteligente como um ente com necessariamente três funções: 1) Perceber dinamicamente o ambiente; 2) Tomar ações que afetem as condições do ambiente; 3) Entender das percepções, resolver problemas, construir inferências e determinar ações [HAY 1995].

Softwares agentes, como pessoas, podem ser mais produtivos quando trabalham de forma cooperativa e colaborativa. Uma coleção de agentes que se comunicam uns com os outros é denominada agência.

Os desenvolvedores de software e projetistas usam um alto nível de abstração para construir um sistema complexo pela simples razão de ter que administrar a complexidade. Uma abstração foca a atenção nas propriedades essenciais do problema e esconde os componentes de menor nível. Desta forma, os agentes permitem uma nova forma de administrar a complexidade, pois eles fornecem uma nova forma de descrever sistemas complexos.

O sistema abordado neste estudo foi construído com base na administração da informação unificada na tecnologia Web. Desta forma, o paradigma de software agente será usado para facilitar o processo de integração aluno e ambiente de ensino. Inicialmente será estruturado um software agente que execute tarefas complexas e, posteriormente, serão utilizados agentes que colaborem uns com os outros para a resolução dos complexos problemas de interação entre os alunos.

O conceito a ser utilizado no agente implementado para o ambiente proposto é o de informação. Através da observação do aluno, o agente conterá informações que permitiram o seletor de estratégias, outro software agente, a definir o caminho de aprendizado do mesmo.

Esta estratégia de implementação oferece ao ambiente uma noção mínima de acompanhamento comportamental, que representa uma das principais deficiências dos sistemas de ensino a distância da atualidade.

3. Ambiente inteligente proposto

A estrutura do Creatio (Figura 3) apresenta características que evidenciam a necessidade do uso de múltiplas formas de representação de conhecimento e, conseqüentemente, da obtenção de inteligência. De uma forma geral, podemos dividir o sistema em dois ambientes distintos: o primeiro corresponde à porção de código que fica junto ao usuário e o outro a que fica no servidor. Esta divisão, apesar de sugerir uma simples visão cliente/servidor, apresenta características de complexidade que estão muito longe deste paradigma.

No que diz respeito à implementação do ambiente do usuário, o Creatio utilizará os conceitos de agente inteligente e Redes Bayesianas. Durante todo o processo de interação, o aluno estará sendo monitorado não só no que diz respeito às interfaces de ambiente, mas também quanto ao processo lógico de resolução de um dado problema. Desta forma, estes agentes locais podem tomar decisões e, ao mesmo tempo, enviar para o sistema de controle central (servidor) as informações pertinentes ao aluno para subsidiar o mesmo na adoção de novas estratégias de ensino.

O sistema central ficará com a representação e controle do domínio do conhecimento, bem como dos possíveis caminhos de aprendizado (estratégias de ensino). Para implementar este item será utilizado o conceito de workflow em que cada conteúdo terá um conjunto mínimo de rotas distintas e estas serão seguidas de acordo com as propostas do agente seletor de estratégias.

Inicialmente, o sistema terá como suporte para seu sistema cognitivo um modelo de aluno. Este modelo será implementado com base na definição do especialista do assunto, que apontará as características essenciais deste aluno modelo e de um módulo de interação próprio, que será responsável por solicitar informações comportamentais específicas de cada aluno. O correto funcionamento desta ferramenta estará calcado no pressuposto de que o aluno foi rigorosamente coerente em suas respostas quanto aos quesitos comportamentais e na corretude do modelo proposto pelo especialista. O modelo do aluno será altamente influenciado pela classificação do mesmo, que será implementada através de uma rede neural.

Uma vez que tenhamos o modelo do aluno e, ao mesmo tempo, os alunos reais interagindo com o ambiente; podemos então conduzir o processo de ensino aprendizagem com um nível mínimo de balizamento. Esta estratégia de ensino permite que cada aluno tenha um grau de liberdade amplo no seu processo de aprendizado, mas que seja coerente com o modelo adotado para aquela disciplina a ser ministrada.

4. Conclusão

A arquitetura apresentada corresponde ao modelo de inclusão de mecanismos de raciocínio computacional no ambiente de ensino a distância - Creatio.

A adoção dos princípios de IA no Creatio permitirá que o mesmo se aproxime de uma ferramenta ideal de EAD. Neste contexto, o conceito de STI estará associado a um ambiente, que será responsável pela otimização do processo de construção de sistemas de ensino inteligentes.

Uma outra preocupação é o enquadramento de todo este ambiente na produção de conteúdos e na organização dos mesmos de forma a torná-lo compatível com os padrões AICC3.

Atualmente, o Creatio está em fase de implementação da maioria das características abordadas neste texto e possui uma expectativa de teste marcada para o final deste ano. Os testes serão realizados com base em turmas que serão formadas com a utilização do ambiente e turmas que receberam o mesmo conteúdo, porém através do ensino presencial.

Uma vez estabelecidas as duas formações, serão realizados estudos que demonstrem a eficácia da ferramenta em detrimento do ensino clássico. Este item específico ainda não foi tratado e, desta forma, não temos como relatá-lo neste estudo.

Notas

1. Creatio - Ambiente de Ensino a Distância desenvolvido pelo Núcleo de Multimídia e Internet da Universidade de Brasília. 2. Crença - quantificações de conhecimento é o que se chama de crença, pois ela é pessoal e está intimamente ligada à quantidade de conhecimento que a pessoa tem ou adquire pela observação de fatos do mundo real. 3. AICC - Aviation Industry Computer-based Training Committee.

Bibliografia

[BAR 1981] A. Barr and E.A. Feigenbaum, editors. The Handbook of Artificial Intelligence ,volume I-II.William Kaufmann Inc., Los Altos, California - 1981.

[BRA 1998] Bracket, G. "Course Notes - Spring 1998". Designing Educational Experiences - Using Networks and Webs. Harvard Graduate School of Education, Cambridge, MA - 1998.

[FER 1973] Fernandez, Pedro Jesus. Introdução à Teoria das Probabilidades. Livros Técnicos e Científicos, Rio de Janeiro - 1973.

[FIL 1996] Filho, Edson Costa de Barros Carvalho. Modelagem, Aplicações e Implementações de redes Neurais. Anais da IV Escola Regional de Informática da SBC Regional Sul, 21 a 27 de abril de 1996. Páginas 36 - 53.

[HAY 1995] Hayes-Roth, B.. An architecture for adaptive intelligent systems. Artificial Intelligence - 1995.

[JEN 1996] Jensen , Finn V. An Introduction to Bayesian Networks. Springer, New York, 1996.

[KAS 1996] Kasabov, Nicola K. Fundations of neural networks, fuzzy systems, ande knowledge engineering. Massachusetts Institute of Tecnology, 1996.

[KOV 1996] Kovács, Zsolt L. Redes Neurais Artificiais. Segunda edição, editora Collegium Cognitio - 1996.

[MCC 1969] J. McCarthy and P.J. Hayes. Some philosophical problems from the standpoint of artificial intelligence. Edinburgh University Press, Edinburgh, GB - 1969.

[MCC 1979] P. McCorduck. Machines Who Think. Freeman, San Francisco - 1979.

[MCA 2002] David McArthur, Mattew Lewis and Miriam Bishay. The Role of Artificial Intelligence in Education: Current Progress and Future Prospects. RAND Corporation, Santa Monica, CA - 2002.

[NEW 1988] Newell, A. Putting It All Together em D. Klahr & K. Kotovsky (Eds.).Complex Information Processing: The Impact of Herbert Simon. Hills-dale,NJ: Lawrence Erlbaum - 1988.

[PEA 1988] PEARL, Judea. Probabilistic Reasoning in Intelligent Systens: Netwoks of Plausible Inference. 2ed. São Francisco, Califórnia: Morgan Kaufmann Publishers, Inc. - 1988.

[PER 1992] Perkins D. Smart Schools - from training memories to educating minds. The Free Press, New York, N.Y. - 1992.

[RIC 1994] Rich, Elaine e Knight, Kevin. Artificial Intelligence. McGraw Hill Inc. -1994.

[RUS 1995] Russell, S. J., & Norvig, P. Artificial Intelligence: A Modern Approach. Englewood Cliffs, NJ: Prentice Hall - 1995.

[SHA 1987] SHAFER, Gleen, SHENOY, Prakash P., MELLOULI, Khaled Propagating Belief Functions in Qualitaitve Markov Trees. In: International Journal of Approximate Reasoning, New York: Elsevier Science Publishing Co. Inc. - 1987.