Análise dos resultados das avaliações de estudantes: quais são as diferenças entre a TRI e a TCT?

Avaliação da aprendizagem

Leitura em

min

Publicado em

08/2021

Autor

Fabrício Garcia

CEO na Plataforma Qstione

Fabrício Garcia é um professor da área de saúde apaixonado pelas novas tecnologias educacionais. Seu foco principal de trabalho está em ajudar instituições de ensino e professores a implementar novas tecnologias que aumentem a eficiência educacional, justamente por acreditar que a tecnologia é o caminho mais simples para democratizar a educação de qualidade no Brasil.

Receba nossas novidades

Cadastro recebido com sucesso!

Oops! Algo deu errado.

Compartilhe

O objetivo deste artigo é explicar de forma sucinta e objetiva as principais diferenças entre dois dos principais métodos de análise de resultados das avaliações cognitivas de estudantes, a Teoria de Resposta ao Item (TRI) e a Teoria Clássica dos Testes (TCT). No entanto, antes de qualquer coisa, aviso que o enfoque do presente texto não está no aprofundamento dos aspectos estatísticos intrinsecamente envolvidos no tema em questão.

Trata-se de um “papo curto e reto” sobre TCT e TRI.

Então, se você é um professor ou gestor educacional e quer ampliar seus conhecimentos sobre avaliação de estudantes, continue lendo este artigo.

A TCT e a TRI são modelagens provenientes da psicometria. E o que é a psicometria?

Psicometria é um ramo da psicologia composto por um conjunto de técnicas capazes de aferir e promover a interpretação dos processos mentais.

Portanto, no que tange os processos de avaliação de estudantes, a psicometria é um ponto de contato muito forte entre a psicologia e a educação.

Características da TCT

A TCT é um conjunto de técnicas e conceitos que subsidiam o desenvolvimento de instrumentos avaliativos e serve, também, como base para abordagem de medidas psicométricas.
DE VELLIS, 2006

Uma das vantagens da TCT é a sua simplicidade, podendo ser utilizada em uma grande variedade de situações. De um modo geral, as avaliações estruturadas seguindo a TCT apresentam algumas premissas fundamentais:

O resultado do teste deve ser avaliado como um todo. Isto é, avalia-se o somatório total do teste e não o resultado por item;
‍
O aumento do número de itens ou observações elevam a precisão do teste;
‍
A análise dos itens do teste é baseada, principalmente, em dois parâmetros: índice de dificuldade e índice de discriminação:
‍
O índice de dificuldade baseia-se no percentual de acerto do estudante; e
‍
O índice de discriminação visa a diferenciação entre os indivíduos que obtiveram uma elevada pontuação total no teste dos que obtiveram uma baixa pontuação total;
‍
Por fim, a dificuldade dos itens não é uma variável decisiva na construção dos testes.

Limitações da TCT

As medidas da avaliação são dependentes da amostra de estudantes que responderam o teste. Assim a avaliação do teste só é válida se a amostra for representativa ou se o teste for aplicado em outro grupo com características semelhantes.
‍
Os diferentes testes apresentam itens com índices de discriminação e de dificuldade diferentes entre si, impossibilitando a análise comparativa entre avaliações distintas, aplicadas em um mesmo grupo de estudantes. Isso também dificulta a análise cumulativa e evolutiva dos resultados das avaliações.
‍
A avaliação das habilidades dos estudantes é teste-dependente e os parâmetros do teste (discriminação e dificuldade) são dependentes dos estudantes respondentes do teste.
‍
A TCT admite que os estudantes com baixa proficiência mobilizem erros semelhantes aos dos estudantes de proficiência mais altas. Na prática, não é o que acontece. Dessa forma, o conceito de fidedignidade da avaliação se torna confuso.
‍
A análise dos resultados é baseada no resultado global do teste, sem considerar a influência exercida por cada item. Adicionalmente, considera-se os itens como adequados a partir da análise do score total do teste. De certa forma, a análise dos itens apresenta um componente quase que arbitrário e, aparentemente, inexplicável.
‍
Alguns autores sugerem que os testes mais longos são mais confiáveis (EMBRETSON; REISE, 2000).

Características da TRI

A TRI se apresenta como uma avanço da psicometria em relação a TCT. Na prática, a TRI não substitui a TCT, já que utiliza medidas da TCT para qualificar os itens e analisar os resultados individuais dos estudantes. Assim a TRI complementa e aprofunda as análises da TCT.

A TRI também é conhecida como Teoria do Traço Latente. O traço latente é uma habilidade ou aptidão do estudante. Resumidamente, a TRI baseia-se na relação de variáveis observáveis e variáveis hipotéticas para calcular os parâmetros dos itens respondidos pelos estudantes utilizando-se as habilidade solicitadas. Em tese, a aferição do nível do traço latente, permite estimar probabilisticamente se o estudante responderá corretamente ou não a um determinado item da avaliação.

Seguindo esta lógica, os indicadores gerados na TRI podem indicar a probabilidade de um determinado estudante acertar ou não um item considerando o perfil deste estudante.

Atualmente, algumas das mais importantes avaliações internacionais utilizam o método, como: Programme for International Assessment (PISA), TOEFL (exame de proficiência em língua inglesa) e o nosso ENEM.

As vantagens da TRI em relação a TCT, associadas a evolução tecnológica do setor educacional, têm suscitado a ideia do uso da metodologia em larga escala, em escolas e instituições de ensino superior. Mas que vantagens são essas?

Vantagens da TRI

Uma das maiores vantagens da TRI está na análise dos itens. O cálculo dos parâmetros dos itens (dificuldade e discriminação) independe do grupo de respondentes da avaliação. Isto é, o grau de dificuldade e o índice de discriminação são variáveis que não dependem do grupo avaliado (not test-dependent). Isso possibilita um melhor controle de qualidade dos itens.
‍
O cálculo do nível de proficiência independe do conjunto de itens utilizados no teste (not group-dependent).
‍
A TRI permite a calibração do teste de acordo com o grau de dificuldade dos itens. Dessa forma, o teste pode conter itens mais ou menos difíceis de acordo com o nível de habilidade dos estudantes.
‍
Na TRI, é possível comparar o desempenho entre estudantes de populações diferentes que responderam a testes distintos, desde que os testes preservem alguns itens em comum ou entre estudantes de uma mesma população que responderam a testes completamente diferentes. Isso possibilita o acompanhamento longitudinal do desempenho dos estudantes.
‍
Os testes fundamentados na TRI são unidimensionais. Assim cada item solicita uma habilidade ou aptidão específica. Trata-se do postulado da unidimensionalidade. Essa teoria define que há uma aptidão dominante responsável pelo resultado do estudante no teste. Dessa forma, apesar de reconhecer que o comportamento humano é multifacetado, a TRI supõe que existe uma habilidade dominante que vai determinar o acerto do itens de uma avaliação deste tipo. Essa característica permite uma análise mais específica e, consequentemente, a geração de microdados acerca dos resultados do teste.
‍
A TRI admite que o desempenho do estudante no teste como o todo é produto das probabilidades de acerto de cada item. Na prática, cada item avalia uma aptidão específica, e o perfil probabilístico de acerto de cada item determina o padrão de acertos e erros de cada estudante respondente. Dessa forma, cada estudante respondente tem um padrão específico de acertos, de acordo com a sua proficiência

Em suma, a TRI possibilita uma análise mais abrangente dos resultados dos estudantes, com a possibilidade de comparação entre resultados de testes distintos. Além disso, a TRI delineia um padrão de acertos específicos para cada estudante respondente, que varia de acordo com o nível de proficiência de cada estudante. Essas características tornam a TRI extremamente interessante enquanto modelo de análise de resultados de avaliações de estudantes. No entanto, nem tudo são flores — a TRI tem suas limitações.

Limitações da TRI

A TRI deve ser aplicada em um grande número de estudantes respondentes.
‍
É necessária a aplicação de muitos recursos computacionais para realização e análise dos testes baseados na TRI.
‍
Os resultados dos testes baseados em TRI são de difícil interpretação para maioria dos estudantes.
‍
Estimar erros e acertos totais no teste é complicado.
‍
A calibração e qualificação dos itens depende da análise de parâmetros. Isso pode aumentar a complexidade de elaboração dos testes.

Na prática, diante do exposto, a TRI não parece ser um modelo adequado para aplicação de avaliações corriqueiras ou destinada a pequenos grupos de estudantes. Portanto a decisão pelo uso da TRI deve considerar a relação custo-benefício, já que a estruturação desse modelo de teste demanda a aplicação de mais recursos. Entretanto os avanços mais recentes das tecnologias educacionais ampliaram o espectro de aplicação da TRI.

Nesse intuito, você, gestor escolar, pode considerar a possibilidade de aplicar indicadores psicométricos para qualificar os itens, buscando a construção de um banco de itens (questões) qualificado. Isto pode flexibilizar a aplicação de diferentes modelos de avaliação, bem como qualificar as avaliações de uma forma geral.

A Qstione faz análises e dá o suporte necessário para aplicação de testes fundamentados na TRI. Entre em contato com nossa equipe e se informe sobre mais este serviço oferecido pela equipe Qstione.

‍