regressão logística com wls

Prezados, Busco referências sobre regressão logística binária com mínimos quadrados ponderados (usando lrm com weights) no seguinte cenário: 1) amostra desbalanceada (n0=10000, n1=700); 2) pesos (sampling weights) para reequilibrar a amostra (w0=1, w1=14.2857); e 3) após a modelagem, ajuste do intercepto para refletir a % esperada de 1’s na população (ex. 7% e não 50%). Já localizei referências que tratam do último ponto, mas não identifiquei nenhum artigo mais conclusivo, quanto ao uso dos pesos em amostras desbalanceadas. A área sob a curva ROC = 0.70, e a probabilidade estimada é próxima à frequência de 1’s em diferentes faixas, o que parece satisfatório. O teste de Hosmer & Lemeshow é não significativo, como esperado. Alguém pode comentar a estratégia adotada, ou sugerir alguma bibliografia específica para a questão do peso e amostra desbalanceada? Obrigado, André Guimarães
participantes (1)
-
Andre Guimaraes