Estatística e Análise de Dados com R – Nível Avançado

Datas: 

De 18 junho a 10 julho 2024 (3.ª e 4.ª feiras)

8 Sessões:  18h30 às 20h30

Duração: 16h

Local:

Online via Cisco Webex

Formador:

Ricardo São João

Licenciado em Matemáticas Aplicadas, Estatística e Investigação Operacional e Mestre em Matemática Aplicada às Ciências Biológicas. O interesse pela área da saúde levou-o a concluir a sua especialização em Epidemiologia e o seu PhD em Ciências da Vida na especialidade Saúde das Populações/Bioestatística.

Ricardo São João tem-se dedicado à modelação estatística com um elevado background computacional. O entusiasmo e paixão pelo ensino, aliado ao desafio de modelação de fenómenos complexos com grande impacto na saúde e bem-estar das populações, fá-lo-ão sentir-se duplamente motivado. Professor no Ensino Superior desde 2001, ministra cursos graduados, pós-graduados e de curta duração, com especial ênfase na manipulação de software estatístico (SPSS e R).

Professor no Ensino Superior desde 2001, e é membro do CEAUL com interesses de investigação em: Estatística Multivariada, Bioestatística e Epidemiologia.


Programa:

0. Breve introdução ao R 
Descrição do ambiente R, importação/exportação da informação, armazenamento (tipo de dados e variáveis); plug-ins do R e livrarias/pacotes (libraries/packages) a serem utilizados.

1. Análise Discriminante (AD)
– Introdução, contextualização e objetivos da AD;
– Análise Discriminante Linear (ADL) e Análise Discriminante Quadrática (ADQ);
– Pressupostos da AD e apresentação de testes estatísticos a ela associados (Teste de Mardia; Energy test, Teste M de Box) com as respetivas formulações de hipóteses e implementações;
– Etapas na implementação da AD;
– Expressão matemática do modelo AD;
– Modelação da AD recorrendo a amostra de treino e de teste;
–  Função discriminante & representação gráfica;
– Previções e construção da matrix de classificação (confusion matrix);
– Seleção automática vs seleção manual das variáveis integrantes no modelo AD;
– Estudos de Caso envolvendo o modelo ADL e ADQ implementados no R;
– Apresentação de um desafio envolvendo a AD e respectiva resolução.

2. Escalonamento Multidimensional (Multidimensional Scaling- MDS)
– Introdução, contextualização e objetivos do MDS;
– Pioneiros do MDS e respetivos contributos;
– Terminologia e conceitos: Julgamentos de (dis)semelhança; ordenação de preferências; STRESSE; mapa espacial; Scree plot; Diagrama de Shepard; critérios de Mardia e P2;
– Pressupostos do MDS e apresentação de testes estatísticos a ele associados com as respetivas formulações de hipóteses e implementações;
– Tipologia de dados de entrada: diretos, derivados, de preferências;
– Etapas na implementação do MDS;
– Tipologias de MDS: Métrico vs Não Métrico;
– Estudos de Caso envolvendo MDS métrico e não métrico implementados no R;
– Representações gráficas: espaço de grupo (group space) e espaço de indivíduos/objectos (subject space);
– Apresentação de um desafio envolvendo MDS e respectiva resolução.

3. Análise Fatorial (AF)
– Introdução, contextualização e objetivos da AF;
– Tipologias de AF: confirmatória e exploratória;
– Terminologia e conceitos na AF: teste de esfericidade de Bartlett e KMO (Kaiser-Meyer-Olkin); matriz de correlações; comunalidades, valores próprios (eigen values); cargas fatoriais (loadings), scree plot; correlograma, rotação varimax;
– Pressupostos da AF e apresentação de testes estatísticos a ela associados com as respetivas formulações de hipóteses e implementações (teste de esferecidade de Bartlett, testes de normalidade Shapiro Wilk e Kolmogorov Smirnov);
– Determinação do nº de fatores, extração e rotação dos mesmos;
– Nomeação das dimensões associadas aos fatores e interpretação das mesmas;
– Estudos de Caso implementados no R;
– Representações gráfica através do biplot;
– Apresentação de um desafio envolvendo AF e respectiva resolução.

Preço:

Preço:

295€

Pré-requisitos:

– Frequência nos cursos “Estatística e Análise de Dados com R” ou “Data Scientist com R” ou Conhecimento prévio de R;
– Familiaridade e conhecimentos básicos, a nível do utilizador, dos produtos da família Microsoft e/ou MAC;
– Computador com os software R instalado.

Bibliografia:

• Fox, John (2016), Using the R Commander: A Point-and-Click Interface for R. CRC Press;
• Field, A. P., Miles, J., & Field, Z. (2012), Discovering statistics using R. London: Sage;
• Crawley, M (2007), The R Book, Wiley;
• Anderson, R.E, Black, W.C., Hair, J.F. and Tatham, R.L. (2018) Multivariate Data Analysis. 8th Edition. CENGAGE;
• Chapman, C., & Feit, E. M. (2015). R for marketing research and analytics. New York, NY: Springer;
• Grigsby, M. (2018). Marketing Analytics: A Practical Guide to Improving Consumer Insights Using Data Techniques. Kogan Page Publishers;
• Malhotra, N. K. (2019) Marketing Research: An Applied Orientation, 7th Edition. Pearson;
• Sorger, S. (2013). Marketing analytics: strategic models and metrics. San Bernadino, CA: Admiral Press.

Mais informações e inscrições aqui.

Parceria CEAUL e GADES SOLUTION18