Descrição
A cultura do níger (Guizotia abyssinica Cass) é considerada uma cultura oleaginosa de potencial agroenergético, principalmente, pelo seu alto teor de óleo e proteínas, utilizada na obtenção de produtos alimentares, uso cosmético e industrial. O objetivo no presente trabalho foi testar um classificador para qualidade de sementes niger, baseado no modelo de random forest. No total 500 sementes de níger foram radiografadas no equipamento FAXITRON X-Ray MX-20, calibrado para 35kV e 19 s de exposição, e uma distância focal de 22 cm. Após a obtenção das imagens digitais, foram extraídas 12 características morfométricas no software ImageJ. As sementes foram numeradas e colocadas para germinar em caixa gerbox por sete dias a 25 °C em BOD. Em seguida foram avaliadas e classificadas segundo o desenvolvimento das estruturas essenciais (raiz, hipocótilo e cotilédones) em plântulas normais (PN), plântulas anormais (PA) e sementes mortas (SM). Depois, um conjunto de dados foi construído baseado no resultado da germinação e as características extraídas para cada semente. Foi testado o modelo de Random Forest, utilizando a biblioteca Scikit-Learn no Python. A seleção dos hiperparâmentros foi realizada por grid search, e se considerou diferentes combinações para número e profundidade de árvores, atributos e critério de impureza. A melhor configuração foi definida pela acurácia out-of-bag (OOB). Após a seleção, foi aplicada uma validação cruzada estratificada (k-fold, k=5), e o desempenho do modelo foi avaliado pela acurácia e taxa de erro. O teste de germinação mostrou que 68% das sementes germinaram e desenvolveram PN, enquanto 20% e 12%, para PA e SM, respectivamente. Após a análise comparativa por grid search, os hiperparâmetros selecionados foram: n° árvores = 75, máx. profundidade = 3, atributos = None e critério = gini, resultando em uma acurácia OOB de aproximadamente 75%. A validação cruzada do modelo apresentou uma acurácia média de 64% o que pode ser considerada promissória. O modelo mostrou a maior taxa de erro para SM de 53%, seguido de 46% para PA e 30% para PN. O que permitiu entender que o modelo tem uma capacidade maior de identificar sementes que formaram PN. No entanto, as altas taxas de erro para as outras classes, sugerem que estas classes compartilham características semelhantes, que se sobrepõem uma classe a outra. Diante disso, sugere-se aumentar o número de sementes, o que poderia reduzir o desequilíbrio entre as classes, e auxiliar na separação, além de explorar outros atributos que contribuam para uma melhor divisão entre as classes.
| Selecione a modalidade do seu trabalho | Resumo Simples |
|---|