
Eu não entendi duas coisas: 1. Por que utilizar "repeatedcv" como method se a ideia é fazer apenas a validação cruzada simples? Basta usar "cv" se a validação cruzada não for repetida. 2. Particularmente, nunca vi ninguém fazer validação cruzada com mais de 10 folds. No teu caso, tu está usando 683. Desconfio que, ao rodar o algoritmo e fazer as reamostragens para criar os conjuntos de treinamento e validação intermediários, acabem faltando observações justamente para estas etapas de validação intermediárias. Estude um pouco mais sobre validação cruzada e utilize number = 5 que o teu algoritmo deve rodar satisfatoriamente. On Thu, Sep 12, 2019, 06:17 Juliana DS por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:
Olá pessoal, bom dia!
Preciso rodar um código, mas estou com um erro. Poderiam me ajudar,por favor?
library(MASS) library(class) library(caret) library(e1071)
biopsyX = na.omit(biopsy[,-c(1)]) # Removi a coluna ID is.na(biopsyX$V6) biopsyX <- na.omit(biopsyX) # Omitir os valores NA str(biopsyX)
set.seed(1984)
ctrl <- trainControl(method="repeatedcv", number=683) nn_grid <- expand.grid(k=c(1:12)) best_knn <- train(class ~ ., data=biopsyX, method="knn", trControl=ctrl, preProcess = c("center", "scale"), tuneGrid=nn_grid) print(best_knn)
O meu código trava na linha de treinar o modelo, e me retorna o seguinte erro: "Warning message: In nominalTrainWorkflow(x = x, y = y, wts = weights, info = trainInfo, : There were missing values in resampled performance measures."
Eu não tenho valores NA na minha base... não estou entendendo o erro.
Outra dúvida: Está correto o ordem do código? O seed deveria ficar após a linha do ctrl?
Obrigada Juliana
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.