Bom dia,

Primeiramente acho importante analisar os tipos de variáveis para ver que tipos de análises podem ser feitas.

Há um problema no formato das categorias IDA, TGE, NAL e NAS, que são dados numéricos mas já foram sumarizados em categorias (dados categóricos). O resultado é que com isso temos menor poder de análise.

Quanto à variabilidade dos dados, as variáveis SEX, FPO, EES, ESJ, IJS, DBY e GBY (última coluna) possuem variabilidade muito baixa. Assim, como você disse, isso também reduz o poder de análise.

O ideal seria pedir os dados novamente em um novo formato, sem as sumarizações citadas nas variáveis IDA, TGE, NAL e NAS para ampliar o número de análise possíveis. Se não for viável, o que você pode fazer é cruzar variáveis como SEX, IDA, TGE, NAS e NAL com aquelas cuja resposta foi sim e não e fazer um teste qui-quadrado para verificar a independência delas para poder tirar conclusões.

Por fim,  idealmente aquelas variáveis com baixa variabilidade (SEX, FPO, EES, ESJ, IJS, DBY e GBY) deveriam ser desconsideradas, deixando apenas REL e RBY para serem comparadas com IDA, TGE, NAL e NAS, além das comparações entre si no grupo de variáveis IDA, TGE, NAL e NAS.

Minha posição é a seguinte: se isso for suficiente para responder sua pergunta de pesquisa , apesar das limitações apontadas, sua análise é possível, caso contrário peça um novo conjunto de dados mais adequado ou informe os problemas (provavelmente devido à formulação do questionário).

Espero ter dado minha contribuição, e caso a opinião profissional de vocês divergir de algum ponto que comentei, por favor se manifestem para complementar e/ou contribuir com a resposta do Professor Elias Carvalho.

att,

Rodrigo
Doutorando em Estudos Linguísticos
Universidade Federal de Minas Gerais



Em sexta-feira, 1 de junho de 2018 07:48:27 BRT, Elias Carvalho via R-br <r-br@listas.c3sl.ufpr.br> escreveu:


Bom dia

Recebi um conjunto de dados (summary abaixo) para análise, porém vejo alguns problemas:



  1. Amostra muito pequena, apenas 17 registros
  2. Algumas  variáveis com categorias ocorrendo apenas um ou duas vezes como sexo (SEX) por exemplo
  3. Variável idade (IDA) e numero de alunos na sala (NAL) com muitas categoria
  4. Variável gerenciamento (GBY) não possui variabilidade
Esse é um banco de dados sobre bullying na escola, preciso analisar a capacidade do coordenador em definir bullying (DBY) reconhecer bullying (RBY) e gerenciar bullying (GBY)

Alguem pode sugerir que tipo de ações eu poderia executar para conseguir fazer alguma análise sobre esses dados ou me dizer se é impossível fazer isso?


--
In Jesu et Maria

Obrigado
Prof. Elias Carvalho

"Felix, qui potuit rerum cognoscere causas" (Virgil 29 BC)
"Blessed is he who has been able to understand the cause of things"
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.