INTELIGÊNCIA ARTIFICIAL PARA CLASSIFICAÇÃO DE DOENÇAS EM FOLHAS DE ARROZ COM REDES NEURAIS CONVOLUCIONAIS

ARTIFICIAL INTELLIGENCE FOR RICE LEAF DISEASE CLASSIFICATION USING CONVOLUTIONAL NEURAL NETWORKS

REGISTRO DOI: 10.70773/revistatopicos/781657444

RESUMO
O arroz (Oryza sativa L.) é um dos cereais de maior relevância para a segurança alimentar e a economia global, sendo a produtividade das lavouras constantemente ameaçadas por doenças que podem causas perdas severas na produção. Este estudo investiga a aplicação de redes neurais convolucionais na classificação automática de doenças em folhas de arroz, visando mitigar os impactos. Considerando as limitações dos métodos tradicionais de diagnóstico, baseados em inspeção visual e sujeitos à subjetividade, propõe-se o uso de modelos de deep learning para automatizar e tornar mais preciso esse processo. Foram avaliadas as arquiteturas ResNet18, ConvNeXt Tiny e EfficientNet, combinadas com técnicas de data augmentation e balanceamento de dados. Os resultados indicam alto desempenho, com destaque ao modelo ConvNeXt Tiny, que atingiu 99,64% de acurácia no conjunto de teste, evidenciando o potencial da inteligência artificial como apoio à tomada de decisão no agronegócio.
Palavras-chave: arroz; inteligência artificial; visão computacional; redes neurais convolucionais; deep learning.

ABSTRACT
Rice (Oryza sativa L.) is one of the most significant cereals for global food security and the economy, yet crop productivity is constantly threatened by diseases that can cause severe yield losses. This study investigates the application of convolutional neural networks for the automatic classification of rice leaf diseases, aiming to mitigate these impacts. Given the limitations of traditional diagnostic methods, which rely on visual inspection and are subject to subjectivity, the use of deep learning models is proposed to automate and enhance the precision of this process. The ResNet18, ConvNeXt Tiny, and EfficientNet architectures were evaluated, combined with data augmentation and data balancing techniques. The results indicate high performance, particularly with the ConvNeXt Tiny model, which achieved 99.64% accuracy on the test set, underscoring the potential of artificial intelligence as a decision-support tool in agribusiness.
Keywords: rice; artificial intelligence; computer vision; convolutional neural networks; deep learning.

1. INTRODUÇÃO

O arroz (Oryza sativa L.) é uma das culturas agrícolas mais importantes do mundo, desempenhando papel fundamental na segurança alimentar global e na estabilidade econônica de diversas regiões produtoras, ao contribuir diretamente para a geração de renda e emprego. De acordo com a Organização das Nações Unidas para a Alimentação e a Agricultura (FAO, 2025), o arroz está entre os quatro cereais que concentram quase metade de toda a produção agrícola primária do planeta. Indicadores do Statistical Yearbook 2025 revelam que a produção mundial de arroz no ciclo de 2023 atingiu a marca de 800 milhões de toneladas (FAO, 2025).

No cenário nacional, o Brasil é responsável pela maior produção fora do continente asiático, com uma safra estimada em 11,1 milhões de toneladas para o ciclo 2025/2026 (CONAB, 2026), sendo o Rio Grande do Sul responsável por cerca de 70% dessa produção. A cultura apresenta produtividade média de 7.281 kg/ha, volume estratégico para o equilíbrio do mercado doméstico, cuja demanda interna é projetada em aproximadamente 10,5 milhões de toneladas, permitindo um excedente para exportações, que historicamente situam-se entre 1,2 e 1,8 milhão de toneladas (CONAB, 2026).

Nesse contexto, a melhoria da produtividade e da qualidade da produção torna-se essencial para atender à demanda interna e manter a competitividade no mercado agrícola, visto que as produções são frequentemente afetadas por diversas doenças que comprometem o desenvolvimento das plantas. Estima-se que as doenças fúngicas e bacterianas sejam responsáveis por reduções de 10% a 30% na produção global anual (FAO, 2025). Entre as principais enfermidades destacam-se a brusone (Magnaporthe oryzae), a escaldadura (Monographella albescens), a mancha parda (Bipolaris oryzae), a queima bacteriana (Xanthomonas oryzea) e a queima da bainha (Rhizoctonia solani).

O diagnóstico dessas doenças é tradicionalmente realizado por meio da inspeção visual das folhas, método que apresenta limitações críticas de escalabilidade e precisão. A elevada similaridade morfológica entre as lesões das diferentes enfermidades pode induzir a erros de classificação ou a diagnósticos tardios. Como consequência, a incerteza na identificação precoce induz ao uso excessivo de defensivos agrícolas, elevando os custos de manejo em até 15% e gerando impactos ambientais e econômicos negativos que comprometem a rentabilidade final da safra (FAO, 2025).

Nos últimos anos, o avanço da inteligência artificial, especialmente na área de visão computacional, tem proporcionado novas possibilidades para o setor agrícola. Técnicas 
baseadas em aprendizado profundo (deep learning), como as redes neurais convolucionais (CNNs), têm demonstrado elevada capacidade de aprendizado a partir de imagens, permitindo a automatização de tarefas complexas, como a classificação de doenças em plantas.

A aplicação dessas tecnologias na agricultura tem crescido de forma significativa, impulsionada pela necessidade de aumentar a eficiência produtiva e reduzir perdas. Entre as principais vantagens do uso de inteligência artificial destacam-se a rapidez na análise, a capacidade de processamento em larga escala e a elevada precisão dos modelos, o que possibilita a identificação mais ágil de fitopatologias. Dessa forma, sistemas automatizados podem auxiliar produtores e especialistas na tomada de decisão, contribuindo para práticas agrícolas mais eficientes e sustentáveis.

2. FUNDAMENTAÇÃO TEÓRICA

A incorporação de técnicas de inteligência artificial no setor agrícola tem se consolidado como uma estratégia essencial para o aumento da produtividade e a otimização de processos. Nesse contexto, a visão computacional destaca-se como uma das principais áreas de aplicação, especialmente na identificação automatizada de doenças em plantas. O avanço das redes neurais profundas possibilitou o desenvolvimento de modelos capazes de extrair padrões complexos a partir de imagens, reduzindo a dependência de métodos manuais e subjetivos. Assim, esta seção apresenta os principais fundamentos teóricos que sustentam este estudo, abordando conceitos relacionados às redes neurais convolucionais, aprendizado por transferência, técnicas de aumento de dados e arquiteturas modernas de deep learning aplicadas à classificação de imagens.

2.1. Doenças Presentes na Cultura do Arroz

As doenças que afetam o arroz no Brasil surgem principalmente devido ao clima tropical, que oferece a umidade e as temperaturas (entre 25°C e 30°C) ideais para o desenvolvimento de fungos e bactérias. No Sul do país, o sistema de irrigação por inundação favorece o surgimento de patógenos como a Brusone, que se espalha pelo orvalho, e a Queima da Bainha que prospera no calor das lavouras densas. Já nas regiões de sequeiro do Centro-Oeste e Norte, as variações de chuva e calor facilitam infecções como a Escaldura, disseminada por respingos de água, enquanto a Mancha Parda costuma aparecer em solos com carência de nutrientes. Diferente das anteriores, a Queima Bacteriana é causada por uma bactéria que aproveita ferimentos nas folhas por ventos ou tempestades para infectar a planta.

2.2. Redes Neurais Convolucionais (Cnns)

As redes neurais convolucionais (Convolutional Neural Networks – CNNs) constituem uma classe de modelos de aprendizado profundo desenvolvida especificamente para o processamento de dados estruturados em forma de grade, como imagens digitais. Diferentemente dos métodos tradicionais de aprendizado de máquina, que exigem a extração manual de características, as CNNs são capazes de aprender automaticamente representações relevantes diretamente dos dados brutos, tornando o processo mais eficiente e menos dependente de conhecimento especializado (LeCun et al., 1998). Essa capacidade de aprendizado automático é um dos principais fatores que explicam o sucesso dessas redes em tarefas de visão computacional.

A arquitetura das CNNs é composta por diferentes tipos de camadas, cada uma desempenhando um papel específico no processo de aprendizado. As camadas convolucionais aplicam filtros sobre as imagens de entrada, permitindo a identificação de padrões locais, como bordas, texturas e formas. Em seguida, as camadas de pooling realizam a redução da dimensionalidade, preservando as características mais relevantes e contribuindo para a eficiência computacional. Por fim, as camadas totalmente conectadas são responsáveis pela classificação final, combinando as características extraídas ao longo da rede. Essa estrutura hierárquica possibilita a construção progressiva de representações, nas quais padrões simples evoluem para descrições mais complexas e abstratas (Goodfellow; Bengio; Courville, 2016).

Figura 1 – Arquitetura básica de uma Rede Neural Convolucional

Fonte: Adaptado de Singla (2023)

O crescimento da utilização de CNNs ganhou destaque com o trabalho de Krizhevsky, Sutskever e Hinton (2012), que demonstraram desempenho superior em tarefas de classificação de imagens em larga escala. A partir desse avanço, essas redes passaram a ser amplamente adotadas em diferentes áreas, incluindo medicina, segurança e agricultura. No contexto agrícola, as CNNs têm sido aplicadas com sucesso na identificação de doenças em plantas a partir de imagens de folhas, apresentando resultados altamente precisos. Estudos indicam que esses modelos podem alcançar níveis de desempenho comparáveis aos de especialistas humanos, especialmente quando treinados com conjuntos de dados representativos (Mohanty; Hughes; Salathé, 2016). Além disso, quando comparadas a métodos tradicionais como Support Vector Machines e Random Forests, as CNNs demonstram maior capacidade de lidar com a variabilidade visual presente em imagens reais, o que as torna particularmente adequadas para aplicações em ambientes agrícolas.

2.3. Transfer Learning

O transfer learning, ou aprendizado por transferência, é uma técnica utilizada em aprendizado profundo que consiste em reaproveitar o conhecimento adquirido por um modelo previamente treinado em uma tarefa para resolver um novo problema. Essa abordagem é especialmente relevante em cenários nos quais a quantidade de dados disponíveis é limitada, situação comum em aplicações agrícolas (Pan; Yang, 2010). Ao utilizar modelos treinados em grandes bases de dados, como o ImageNet, é possível aproveitar representações genéricas de características visuais, reduzindo a necessidade de grandes volumes de dados para treinamento.

Na prática, o transfer learning pode ser implementado de diferentes formas, sendo as mais comuns o congelamento das camadas iniciais do modelo e o treinamento apenas das camadas finais, ou o ajuste fino (fine-tuning) de toda a rede. As camadas iniciais geralmente aprendem padrões básicos, como bordas e texturas, enquanto as camadas mais profundas capturam características mais específicas. Dessa forma, a adaptação do modelo para uma nova tarefa torna-se mais eficiente, reduzindo tanto o tempo de treinamento quanto o custo computacional (Tan et al., 2018).

Diversos estudos demonstram a eficácia do transfer learning na identificação de doenças em plantas. Mohanty, Hughes e Salathé (2016), por exemplo, evidenciaram que modelos pré-treinados podem atingir altas taxas de acurácia mesmo com conjuntos de dados relativamente pequenos. Além disso, quando comparado ao treinamento do zero, o uso de aprendizado por transferência apresenta vantagens como maior estabilidade na convergência e menor risco de overfitting, tornando-se uma abordagem altamente viável para aplicações práticas no agronegócio.

2.4. Arquiteturas de Deep Learning Utilizadas

A escolha da arquitetura de rede neural é um fator determinante para o desempenho de modelos de classificação de imagens. Diferentes arquiteturas apresentam características específicas que influenciam diretamente sua capacidade de aprendizado, eficiência computacional e desempenho final. Neste trabalho, são analisadas três arquiteturas amplamente reconhecidas na literatura: ResNet, ConvNeXt e EfficientNet.

2.4.1. Resnet

A ResNet (Residual Network), proposta por Kaiming He et al. (2016), introduziu o conceito de conexões residuais (skip connections), que permitem a propagação direta de informações entre camadas não consecutivas. Essa abordagem foi desenvolvida para solucionar o problema da degradação em redes profundas, no qual o aumento do número de camadas não resulta necessariamente em melhor desempenho.

Figura 2 – Arquitetura ResNet

Fonte: Adaptado de He et al. (2016).

As conexões residuais facilitam o fluxo de gradientes durante o treinamento, reduzindo problemas como o desaparecimento do gradiente e permitindo a construção de redes mais profundas e eficientes. Como resultado, a ResNet tornou-se uma das arquiteturas mais influentes na área de visão computacional. No entanto, apesar de sua robustez, a arquitetura pode apresentar maior custo computacional, especialmente em versões mais profundas.

2.4.2. Convnext

A arquitetura ConvNeXt, proposta por Zhuang Liu et al. (2022), representa uma modernização das redes convolucionais tradicionais, incorporando conceitos inspirados em modelos baseados em transformers. O objetivo dessa arquitetura é atualizar o design das CNNs, tornando-as mais eficientes e competitivas em relação às abordagens mais recentes.

Figura 3 – Arquitetura ConvNeXt

Fonte: Adaptado de Liu et al. (2022).

2.4.3. EfficientNet

A EfficientNet, desenvolvida por Mingxing Tan e Quoc V. Le (2019), propõe uma abordagem inovadora para o escalonamento de redes neurais, baseada no balanceamento entre profundidade, largura e resolução. Esse método, denominado compound scaling, permite otimizar simultaneamente esses três fatores, resultando em modelos mais eficientes em termos de desempenho e custo computacional.

Figura 4 – Arquitetura EfficientNet

Fonte: Adaptado de Tan e Le (2019)

Uma das principais vantagens da EfficientNet é sua capacidade de alcançar alta acurácia com menor número de parâmetros, tornando-a especialmente adequada para aplicações com recursos computacionais limitados. Essa característica amplia sua aplicabilidade em cenários reais, incluindo dispositivos com restrições de processamento.

2.5. Comparação Entre Arquiteturas

As arquiteturas analisadas apresentam características distintas que influenciam diretamente seu desempenho em tarefas de classificação de imagens. A ResNet destaca-se pela robustez e estabilidade no treinamento, sendo amplamente utilizada como base em diversos estudos. A EfficientNet, por sua vez, apresenta maior eficiência computacional, oferecendo um bom equilíbrio entre desempenho e consumo de recursos. Já a ConvNeXt combina conceitos modernos com a estrutura tradicional das CNNs, alcançando resultados superiores em diversas aplicações recentes.

A comparação entre essas arquiteturas é fundamental para identificar a abordagem mais adequada para a classificação de doenças em folhas de arroz. Além da acurácia, aspectos como capacidade de generalização, eficiência computacional e robustez a variações nos dados devem ser considerados. Dessa forma, a análise comparativa realizada neste trabalho contribui para a compreensão do desempenho dessas arquiteturas no contexto agrícola, auxiliando na escolha de modelos mais eficientes para aplicações práticas.

3. METODOLOGIA

Esta seção descreve os procedimentos adotados para o desenvolvimento do estudo, incluindo a caracterização do conjunto de dados utilizado, as técnicas de pré-processamento aplicadas, as arquiteturas de redes neurais implementadas e o processo de treinamento e avaliação dos modelos. O objetivo é garantir a reprodutibilidade do experimento e a clareza na análise dos resultados obtidos.

Figura 5 – Fluxograma do processo metodológico

Fonte: Elaborado pelo autor (2026).

3.1. Base de Dados

O conjunto de dados utilizado neste trabalho foi obtido por meio da plataforma Kaggle, sendo constituído a partir da integração de diferentes bases públicas voltadas à identificação de doenças em folhas de arroz. A base final, disponibilizada como “doencas-no-arroz”, foi construída a partir da seleção e combinação de amostras provenientes de múltiplos conjuntos de dados, incluindo Rice Leaf Dataset from Mendeley Data, Rice Disease Dataset, Rice Crop Diseases e Rice Leaf Diseases Detection. Durante esse processo, foram selecionadas apenas classes de interesse, enquanto categorias redundantes ou menos representativas, como o tungro, foram removidas.

Figura 6 – Total de imagens utilizado em cada classe

Fonte: Elaborado pelo autor (2026)

A base consolidada contempla seis classes distintas: brusone, escaldura, mancha parda, queima bacteriana, queima da bainha e saudável. A diversidade de fontes utilizadas contribui para uma maior variabilidade das amostras, tornando o problema mais desafiador e, ao mesmo tempo, mais próximo de cenários reais.

De modo geral, o conjunto de dados apresenta uma quantidade significativa de imagens e uma boa diversidade visual entre as classes, o que possibilita o treinamento de modelos de aprendizado profundo com elevado potencial de generalização. A combinação de diferentes bases também contribui para reduzir limitações individuais de cada dataset, fortalecendo a robustez do conjunto final utilizado neste estudo.

Figura 7 – Representação visual das patologias

Fonte: Elaborado pelo autor (2026)

3.2. Pré-processamento dos Dados

O pré-processamento das imagens foi realizado para padronizar os dados de entrada e melhorar a capacidade de generalização dos modelos. Inicialmente, todas as imagens foram redimensionadas para um tamanho fixo de 224×224 pixels, por ser o padrão de entrada das arquiteturas ResNet, EfficientNet e ConvNeXt, permitindo um equilíbrio entre a preservação de detalhes morfológicos das lesões e a eficiência computacional.

Em seguida, foi aplicada a normalização com base nos valores médios e desvios padrão do conjunto ImageNet, prática fundamental ao utilizar modelos pré-treinados, pois garante que a distribuição dos dados de entrada esteja alinhada à distribuição dos pesos originais da rede, o que acelera a convergência do gradiente e evita distorções no aprendizado de características durante o fine-tuning. Além disso, foi empregada a técnica de data augmentation no conjunto de treinamento para expandir artificialmente a variabilidade dos dados e reduzir o risco de overfitting.

Para simular fotos tiradas em campos, foram aplicadas recortes aleatórios (RandomResizedCrop) e rotações para que o modelo identifique padrões em diferentes escalas e posições. As inversões horizontais (RandomHorizontalFlip), ajustes de brilho e constraste ajudam a rede a lidar com diferentes posições das folhas e variações de luz natural. Para os conjuntos de validação e teste, utilizaram apenas transformações determinísticas (redimensionamento e normalização), assegurando que a avaliação do desempenho ocorra sobre imagens estáveis, proporcionando uma métrica de precisão fiel à realidade.

3.3. Balanceamento de Dados

Para lidar com possíveis desequilíbrios na distribuição das classes, foi utilizada a técnica de WeightedRandomSampler durante o treinamento. Essa abordagem atribui pesos inversamente proporcionais à frequência das classes, garantindo que amostras de classes minoritárias sejam selecionadas com maior frequência durante o processo de treinamento.

O balanceamento dos dados é fundamental para evitar que o modelo apresente viés em relação às classes mais frequentes, o que poderia comprometer a qualidade das previsões. Dessa forma, essa estratégia contribui para a melhoria das métricas de desempenho, especialmente em cenários com distribuição desigual de amostras.

3.4. Modelagem Preditiva

Neste trabalho, foram implementadas três arquiteturas de redes neurais convolucionais: ResNet18, ConvNeXt-Tiny e EfficientNet. Todas as arquiteturas foram utilizadas com pesos pré-treinados, aplicando a técnica de transfer learning.

Na ResNet18, a camada final totalmente conectada foi substituída por uma nova camada linear compatível com o número de classes do problema. Da mesma forma, na ConvNeXt-Tiny e na EfficientNet, as camadas classificadoras foram ajustadas para atender à tarefa específica de classificação das doenças do arroz. Em todos os casos, os pesos das camadas convolucionais foram congelados, sendo treinadas apenas as camadas finais, reduzindo o custo computacional e acelerando o treinamento.

3.5. Métricas de Avaliação

Para a avaliação do desempenho dos modelos, foram utilizadas métricas amplamente adotadas na literatura de classificação, incluindo acurácia, precisão, recall e F1-score. Essas métricas permitem entender não apenas o total de acertos, mas como cada rede se comporta em cada classe específica. Essas métricas são baseadas nos valores de Verdadeiro Positivo (VP), Verdadeiro Negativo (VN), Falso Positivo (FP) e Falso Negaticvo (FN).

A Acurácia indica a proporção total de acertos do modelo entre todas as previsões feitas:

Acurácia = V P + V N V P + V N + F P + F N

A Precisão mede a qualidade dos acertos positivos, ou seja, quantas das amostras classificadas como doentes realmente estavam com a doença:

Precisão = V P V P + F P

O Recall (ou Sensibilidade) mostra a capacidade do modelo em encontrar todas as amostras reais de uma categoria, evitando deixar casos de doenças passarem despercebidos:

Recall = V P V P + F N

O F1-score é a média harmônica entre a precisão e o recall, sendo ideal para verificar o equilíbrio entre essas duas métricas:

F1 - score = 2 × Precisão × Recall Precisão + Recall

Além dessas fórmulas, a matriz de confusão complementa a análise. Ela exibe onde as previsões corretas e incorretas se concentram facilitando a identificação de quais doenças o modelo tem mais dificuldade de diferenciar.

4. RESULTADOS E DISCUSSÕES

Esta seção apresenta os resultados obtidos a partir do treinamento e avaliação das arquiteturas de redes neurais convolucionais empregadas neste estudo. A análise considera métricas quantitativas, como acurácia, precisão, recall e F1-score, bem como a interpretação qualitativa dos resultados por meio da matriz de confusão. Além disso, são discutidas as diferenças de desempenho entre os modelos, destacando fatores que influenciam diretamente a capacidade de generalização.

4.1. Configuração do Treinamento

O dataset foi dividido em conjuntos de treino, validação e teste, cada um contando 70%, 15% e 15% respectivamente do total de imagens para cada classe. O treinamento dos modelos foi realizado utilizando a função de perda CrossEntropyLoss, adequada para problemas de classificação multiclasse. Como otimizador, foi utilizado o algoritmo Adam, com taxa de aprendizado definida em 0.001.

O processo de treinamento foi conduzido por até 100 épocas, sendo aplicado o mecanismo de Early Stopping com paciência de 5 épocas e variação mínima de 0.001 na perda de validação. Essa estratégia permite interromper o treinamento quando não há melhoria significativa no desempenho, evitando overfitting e reduzindo o tempo de execução. O treinamento foi realizado em ambiente com suporte a GPU, quando disponível, garantindo maior eficiência no processamento das operações.

4.2. Desempenho dos Modelos

Os modelos implementados apresentaram desempenhos distintos na tarefa de classificação de doenças em folhas de arroz. A arquitetura ResNet18 obteve acurácia de 93,67%, com valores de precisão, recall e F1-score próximos, indicando um desempenho consistente, embora inferior aos demais modelos. Esse resultado sugere que, apesar de sua robustez, a ResNet18 pode apresentar limitações em capturar padrões mais complexos presentes nas imagens.

A arquitetura EfficientNet apresentou desempenho superior, alcançando acurácia de 96,01%, além de métricas equilibradas entre precisão e recall. Esse resultado evidencia a eficácia da modernização das redes convolucionais, que incorporam melhorias estruturais capazes de aumentar a capacidade de representação do modelo.

Por sua vez, a ConvNeXt apresentou o melhor desempenho entre os modelos avaliados, atingindo acurácia de 99,64%, com métricas de precisão, recall e F1-score igualmente elevadas. Esse resultado demonstra a eficiência da estratégia de escalonamento proposta pela arquitetura, permitindo alta capacidade de generalização mesmo com menor número de parâmetros.

Tabela 1 – Comparação de desempenho entre os modelos avaliados

Modelo

Acurácia (%)

Precisão (%)

Recall (%)

F1-score (%)

ConvNeXt-Tiny

99,64

99,66

99,65

99,65

ResNet18

93,52

93,98

93,49

93,52

EfficientNet

96,01

96,16

95,98

96,03

Fonte: Elaborado pelo autor (2026).

4.3. Análise de Métricas

A análise das métricas permite compreender de forma mais aprofundada o comportamento dos modelos. Observa-se que todos os modelos apresentaram valores elevados de F1-score, indicando equilíbrio entre precisão e recall. No entanto, a ConvNeXt destacou-se por apresentar valores praticamente perfeitos, o que sugere excelente capacidade de generalização.

A diferença de desempenho entre os modelos pode ser explicada por suas características arquiteturais. Enquanto a ResNet18 possui uma estrutura mais simples e consolidada, a ConvNeXt e a EfficientNet incorporam melhorias que aumentam a eficiência do aprendizado. Em particular, a ConvNeXt se beneficia do balanceamento entre profundidade, largura e resolução, permitindo melhor aproveitamento das informações contidas nas imagens.

Outro ponto relevante é a estabilidade das métricas entre as classes, indicando que os modelos não apresentaram viés significativo para categorias específicas. Esse comportamento é essencial em aplicações agrícolas, nas quais a identificação correta de todas as doenças é igualmente importante. A matriz de confusão fornece uma visão das previsões realizadas pelos modelos, permitindo identificar acertos e erros. De forma geral, observou-se que as classes foram corretamente classificadas na maioria dos casos, com poucos erros entre categorias semelhantes.

No modelo ResNet18 , verificou-se maior incidência de erros entre classes com características visuais próximas, como diferentes tipos de manchas foliares. Já nos modelos ConvNeXt e EfficientNet, esses erros foram significativamente reduzidos, evidenciando maior capacidade de distinção entre padrões visuais complexos. A ConvNeX, em particular, apresentou uma matriz de confusão com alta concentração de valores na diagonal principal, indicando elevado número de classificações corretas. Esse comportamento reforça a superioridade do modelo na tarefa proposta.

Figura 8 – Matriz confusão do modelo treinado com ConvNeXt-Tiny

Fonte: Elaborado pelo autor (2026). 

Figura 9 – Matriz confusão do modelo treinado com ResNet

Fonte: Elaborado pelo autor (2026).

Figura 10 – Matriz confusão do modelo treinado com EfficientNet

Fonte: Elaborado pelo autor (2026).

4.4. Evolução do Treinamento

A análise das curvas de treinamento e validação demonstra o comportamento dos modelos ao longo das épocas. Observou-se que todos os modelos apresentaram convergência adequada, com redução progressiva da função de perda e aumento da acurácia.

O uso de early stopping mostrou-se eficiente para evitar o overfitting, interrompendo o treinamento no momento em que a perda de validação deixou de apresentar melhorias significativas. Além disso, o data augmentation contribuiu para a estabilidade do treinamento, reduzindo oscilações e melhorando a capacidade de generalização.

Nos modelos mais avançados, como ConvNeXt e EfficientNet, a convergência ocorreu de forma mais rápida e estável, evidenciando maior eficiência no processo de aprendizado.

Figura 11 – Gráficos de loss e acurácia ao longo das épocas com ConvNeXt-Tiny

Fonte: Elaborado pelo autor (2026).

Figura 12 – Gráficos de loss e acurácia ao longo das épocas com EfficientNet

Fonte: Elaborado pelo autor (2026).

Figura 13 – Gráficos de loss e acurácia ao longo das épocas com ResNet18

Fonte: Elaborado pelo autor (2026).

4.5. Discussão dos Resultados

Os resultados obtidos confirmam a eficácia do uso de redes neurais convolucionais na classificação de doenças em folhas de arroz. A comparação entre as arquiteturas demonstra que modelos mais modernos tendem a apresentar melhor desempenho, especialmente em tarefas que envolvem alta complexidade visual.

A superioridade da ConvNeXt evidencia a importância de arquiteturas otimizadas, capazes de equilibrar desempenho e eficiência computacional. No entanto, é importante destacar que modelos mais complexos podem demandar maior capacidade de processamento, o que deve ser considerado em aplicações práticas.

Além disso, os resultados indicam que técnicas como data augmentation e transfer learning desempenham papel fundamental na melhoria do desempenho dos modelos, contribuindo para maior robustez e capacidade de generalização.

Por fim, destaca-se que os resultados obtidos neste estudo possuem relevância prática para o setor agrícola, podendo contribuir para o desenvolvimento de sistemas automatizados de diagnóstico de doenças em plantas. Tais sistemas têm potencial para auxiliar produtores na tomada de decisão, reduzindo perdas e aumentando a eficiência produtiva

5. CONCLUSÃO

O presente estudo teve como objetivo investigar a aplicação de redes neurais convolucionais na classificação automática de doenças em folhas de arroz, comparando o desempenho de diferentes arquiteturas e avaliando o impacto de técnicas de pré-processamento no desempenho dos modelos. A partir dos experimentos realizados, foi possível observar que a utilização de inteligência artificial, especialmente por meio de técnicas de visão computacional, apresenta elevado potencial para automatizar o diagnóstico de doenças agrícolas, contribuindo para maior eficiência e precisão no monitoramento das lavouras.

Os resultados obtidos demonstraram que todas as arquiteturas avaliadas foram capazes de realizar a classificação com alto nível de desempenho, destacando-se a ConvNeXt, que apresentou os melhores resultados em termos de acurácia, precisão, recall e F1-score. A EfficientNet também apresentou desempenho elevado, confirmando a eficácia de arquiteturas modernas baseadas na evolução das redes convolucionais. Por outro lado, a ResNet18, embora tenha apresentado desempenho inferior em relação às demais, demonstrou-se uma alternativa robusta e eficiente, especialmente considerando sua simplicidade e menor custo computacional.

Além da comparação entre arquiteturas, verificou-se que técnicas como data augmentation e transfer learning desempenham papel fundamental na melhoria da capacidade de generalização dos modelos. O uso dessas abordagens permitiu reduzir problemas como overfitting e melhorar a estabilidade do treinamento, contribuindo diretamente para os resultados alcançados. A organização adequada dos dados em conjuntos de treinamento, validação e teste também foi essencial para garantir uma avaliação confiável do desempenho dos modelos.

Do ponto de vista prático, os resultados deste trabalho evidenciam o potencial da inteligência artificial como ferramenta de apoio ao agronegócio, especialmente na cultura do arroz, que possui grande relevância econômica e social. A adoção de sistemas automatizados de diagnóstico pode auxiliar produtores na identificação precoce de doenças, possibilitando intervenções mais rápidas e eficazes, reduzindo perdas e aumentando a produtividade.

Como limitações do estudo, destaca-se a dependência de um conjunto de dados específico, o que pode impactar a generalização dos modelos para outros cenários ou condições reais de campo. Além disso, o uso de imagens capturadas em condições controladas pode não refletir totalmente a variabilidade presente em ambientes agrícolas reais.

Como trabalhos futuros, sugere-se a ampliação da base de dados com imagens coletadas em campo, bem como a exploração de outras arquiteturas e técnicas mais recentes, incluindo modelos baseados em transformers. Também é recomendada a implementação de sistemas embarcados ou aplicações móveis que permitam a utilização prática dos modelos desenvolvidos, aproximando a pesquisa acadêmica da realidade do produtor rural.

Dessa forma, conclui-se que o uso de redes neurais convolucionais na identificação de doenças em folhas de arroz é uma abordagem viável, eficiente e promissora, com potencial significativo para contribuir com a modernização da agricultura e o avanço do agronegócio.

REFERÊNCIAS BIBLIOGRÁFICAS

Companhia Nacional de Abastecimento. Safra brasileira de grãos pode alcançar recorde e chegar a 358 milhões de toneladas. Brasília, DF, 14 maio 2026. Disponível em: https://www.gov.br/conab/pt-br/noticias/safra-brasileira-de-graos-pode-alcancar-recorde-e-chegar-a-358-milhoes-de-toneladas. Acesso em: 21 maio 2026.

FAO. World Food and Agricuture – Statistical Yearbook 2025. Rome: FAO, 2025. Disponível em: https://doi.org/10.4060/cd4313en. Acesso em: 20 maio 2026

GEEKSFORGEEKS. Residual Networks (ResNet) – Deep Learning. 2026. Disponível em: https://www.geeksforgeeks.org/residual-networks-resnet-deep-learning/. Acesso em: 23 maio 2026.

GEEKSFORGEEKS. ConvNeXt. 2025. Disponível em: https://www.geeksforgeeks.org/computer-vision/convnext/. Acesso em: 23 maio 2026.

GOODFELLOW, Ian; BENGIO, Yoshua; COURVILLE, Aaron. Deep Learning. Cambridge: MIT Press, 2016.

GUIMARÃES, Luiz. Classificação de doenças em plantações de arroz com ResNet18. Google Colab, 2026. Disponível em: https://colab.research.google.com/drive/1axlvDncTAB7llBu2TuZazKq4pteqw6bC#scrollTo=Lv84KNOBbPRP. Acesso em: 29 abr. 2026.

HE, Kaiming; ZHANG, Xiangyu; REN, Shaoqing; SUN, Jian. Deep residual learning for image recognition. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas: IEEE, 2016. p. 770–778. DOI: 10.1109/CVPR.2016.90.

KRIZHEVSKY, Alex; SUTSKEVER, Ilya; HINTON, Geoffrey. ImageNet classification with deep convolutional neural networks. In: Advances in Neural Information Processing Systems. 2012. p. 1097–1105.

LAUNÉ, Leandro. Classificação de doenças em plantações de arroz com ConvNeXt-Tiny. Google Colab, 2026. Disponível em: https://colab.research.google.com/drive/1ztb4146AbrGxKgEtSoFtkxeYjZGLlVWX?authuser=1#scrollTo=n_dHDB9mP6ev. Acesso em: 29 abr. 2026.

LAUNÉ, Leandro. Classificação de doenças em plantações de arroz com EfficientNetB0. Google Colab, 2026. Disponível em: https://colab.research.google.com/drive/1agsqMhIzz_FcPztvkcsYCtF46EAwqWh4#scrollTo=7gurR8aQMy7m

LECUN, Yann; BOTTOU, Léon; BENGIO, Yoshua; HAFFNER, Patrick. Gradient-based learning applied to document recognition. Proceedings of the IEEE, v. 86, n. 11, p. 2278–2324, 1998. DOI: 10.1109/5.726791.

LIU, Zhuang; MAO, Hanzi; WU, Chao-Yuan; FEICHTENHOFER, Christoph; DARRELL, Trevor; XIE, Saining. A ConvNet for the 2020s. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 2022. p. 11976–11986. DOI: 10.1109/CVPR52688.2022.01167.

MOHANTY, Sharada P.; HUGHES, David P.; SALATHÉ, Marcel. Using deep learning for image-based plant disease detection. Frontiers in Plant Science, v. 7, 2016. DOI: 10.3389/fpls.2016.01419.

PAN, Sinno Jialin; YANG, Qiang. A survey on transfer learning. IEEE Transactions on Knowledge and Data Engineering, v. 22, n. 10, p. 1345–1359, 2010. DOI: 10.1109/TKDE.2009.191.

PEREZ, Luis; WANG, Jason. The effectiveness of data augmentation in image classification using deep learning. arXiv preprint, 2017. DOI: 10.48550/arXiv.1712.04621.

SHORTEN, Connor; KHOSHGOFTAAR, Taghi. A survey on image data augmentation for deep learning. Journal of Big Data, v. 6, n. 1, 2019. DOI: 10.1186/s40537-019-0197-0.

SINGLA, P. Undertanding Convolutional Neural Networks (CNNs). Medium, 2 dez 2023. Disponível em: https://medium.com/@prathamsingla4619/understanding-convolutional-neural-networks-cnns-2a2d6d110529. Acesso em: 22 maio 2026

SUN, Huihui et al. Empowering smart soybean farming with deep learning: progress, challenges, and future perspectives. Agronomy, v. 15, n. 8, p. 1831, 2025. Disponível em: https://doi.org/10.3390/agronomy15081831. Acesso em: 28 abr. 2026.

TAN, M.; LE, Q. V. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks. In: INTERNATIONAL CONFERENCE ON MACHINE LEARNING (ICML), 36., 2019, Long Beach. Proceedings [...]. Long Beach: PMLR, 2019. p. 6105-6114. Disponível em: https://www.researchgate.net/figure/EfficientNet-Architecture_fig2_379146600. Acesso em: 25 maio 2026.

TAN, Chuanqi; SUN, Fuchun; KONG, Tao; ZHANG, Wenchang; YANG, Chao; LIU, Chunfang. A survey on deep transfer learning. In: International Conference on Artificial Neural Networks. Cham: Springer, 2018. p. 270–279. DOI: 10.1007/978-3-030-01424-7_27.

TAN, Mingxing; LE, Quoc V. EfficientNet: Rethinking model scaling for convolutional neural networks. In: Proceedings of the International Conference on Machine Learning (ICML). 2019. p. 6105–6114.

UZAL, Lucas C. et al. Seed-per-pod estimation for plant breeding using deep learning. Computers and Electronics in Agriculture, v. 150, p. 196-204, 2018. Disponível em: https://doi.org/10.1016/j.compag.2018.04.020. Acesso em: 28 abr. 2026.

YANG, Si et al. High-throughput soybean seeds phenotyping with convolutional neural networks and transfer learning. Plant Methods, v. 17, p. 50, 2021. Disponível em: https://doi.org/10.1186/s13007-021-00749-y. Acesso em: 28 abr. 2026.


1 Discente do curso de Engenharia de Software do Centro Universitário Unidade de Ensino Superior Dom Bosco. E-mail: [clique para visualizar o e-mail]acesse o artigo original para visualizar o e-mail

2 Discente do curso de Engenharia de Software do Centro Universitário Unidade de Ensino Superior Dom Bosco. E-mail: [clique para visualizar o e-mail]acesse o artigo original para visualizar o e-mail

3 Discente do curso de Engenharia de Software do Centro Universitário Unidade de Ensino Superior Dom Bosco. Email: [clique para visualizar o e-mail]acesse o artigo original para visualizar o e-mail

4 Graduado no curso de Engenharia de Software do Centro Universitário Unidade de Ensino Superior Dom Bosco. E-mail: [clique para visualizar o e-mail]acesse o artigo original para visualizar o e-mail

5 Discente do curso de Engenharia de Software do Centro Universitário Unidade de Ensino Superior Dom Bosco. E-mail: [clique para visualizar o e-mail]acesse o artigo original para visualizar o e-mail

6 Discente do curso de Análise e Desenvolvimento de Sistemas do Centro Universitário Unidade de Ensino Superior Dom Bosco. Email: [clique para visualizar o e-mail]acesse o artigo original para visualizar o e-mail

7 Discente do curso de Engenharia de Software do Centro Universitário Unidade de Ensino Superior Dom Bosco. Email: [clique para visualizar o e-mail]acesse o artigo original para visualizar o e-mail

8 Discente do curso de Engenharia de Software do Centro Universitário Unidade de Ensino Superior Dom Bosco. Email: [clique para visualizar o e-mail]acesse o artigo original para visualizar o e-mail

9 Discente do curso de Engenharia de Software do Centro Universitário Unidade de Ensino Superior Dom Bosco. E-mail: [clique para visualizar o e-mail]acesse o artigo original para visualizar o e-mail

10 Discente do curso de Engenharia de Software do Centro Universitário Unidade de Ensino Superior Dom Bosco. E-mail: [clique para visualizar o e-mail]acesse o artigo original para visualizar o e-mail

11 Docente do curso de Engenharia de Software do Centro Universitário Unidade de Ensino Superior Dom Bosco. Email: [clique para visualizar o e-mail]acesse o artigo original para visualizar o e-mail