Pessoal,

Estou iniciando os estudos em Random Forest e gostaria de uma ajuda na interpretação do modelo. Tenho um modelo com diversas variáveis tentando predizer mortalidade hospitalar. Após rodar o random forest, ao verificar a importância de cada uma das variáveis (usando o comando varImpPlot) obtive resultados conflitantes. Uma variável por exemplo é a última no gráfico de Mean Decrease Accuracy (8.079) e a terceira no gráfico de Mean Decrease Gini (154.1359).

Como interpretar e lidar com esta diferença? Neste cenário de predição de mortalidade, qual levar em conta?

Ary Serpa Neto, MD, MSc, PhD
Hospital Israelita Albert Einstein, São Paulo, Brazil (http://www.einstein.br): Department of Critical Care Medicine & Jewish Institute of Education and Research Albert Einstein (http://www.einstein.br/pesquisa)
The PROtective VEntilation NETwork (www.provenet.eu)
Associate Editor: BMC Anesthesiology and BMC Pulmonary Medicine
http://publicationslist.org/a.serpa_neto
http://lattes.cnpq.br/0254664157557375