Data Scientist com R

  • Prof. Tiago A. Marques, Faculdade de Ciências da Universidade de Lisboa
  • Profª. Soraia Pereira, Faculdade de Ciências da Universidade de Lisboa
  • Online – Ao vivo – 18h00 às 20h00
  • 18/01 a 10/02/2022
  • Referência Projeto: Projecto FCT: UIDB/00006/2020
 

Datas: 

18/01 a 10/02/2022

Local:
Online – Ao Vivo

Formadores:
Prof. Tiago A. Marques, Faculdade de Ciências da Universidade de Lisboa

Profª. Soraia Pereira, Faculdade de Ciências da Universidade de Lisboa

Objetivos:
Este curso resulta de uma parceria entre a GADES Solutions e o CEAUL – Centro de Estatística e Aplicações da Universidade de Lisboa. Através de 4 módulos e com recurso ao software R, aprenda a organizar e analisar dados com foco na obtenção de soluções orientadas para a resolução de problemas.

Módulo 1: Introdução ao R

Introdução ao ambiente R, bem como à manipulação de ferramentas básicas de tratamento de dados neste software.

Módulo 2: Análise Exploratória de Dados em R

Neste módulo serão fornecidas as ferramentas mais usuais para uma análise estatística preliminar usando o software R.

A manipulação gráfica é um dos pontos fortes deste módulo.

Módulo 3: Introdução à Análise de Regressão

Este módulo torna-se especialmente importante para formandos com interesse em identificar quais as variáveis que melhor explicam determinado fenómeno, ou com interesse em extrapolação ou estimação com base em modelos de regressão.

Módulo 4: Visualização Espacial – Mapas

A visualização espacial de determinado fenómeno pode ser muito interessante. Neste curso, fornecemos ferramentas de georeferenciação em R.


Programa:

Módulo 1: Introdução ao R

1. Introdução ao R

1.1 Operações simples com números, vectores, matrizes

1.2 Classes de objectos

1.3 Importação e exportação de dados

1.4 Manipulações simples de dados (leitura, estrutura, variáveis, subconjuntos, substituição, detecção de NAs, ordenação, concatenação, vlookups, pivot-table)

Módulo 2: Análise Exploratória de Dados em R

1. Análise Exploratória de Dados em R

1.1 Medidas de localização e dispersão (média, quartis). Funções sumárias: summary, unique, table, apply, tapply.

1.2 Visualização gráfica com R base e com ggplot (gráfico de pontos, gráfico de linhas, gráfico de barras, histograma, caixa de bigodes)

1.3 Outras potencialidades do ggplot. Representação gráfica por categoria, paralela, e em grid

1.4 Análise exploratória de um caso de estudo

Módulo 3: Introdução à Análise de Regressão com R

1. Introdução à análise de regressão

1.1 Regressão linear simples

1.2 Regressão linear múltipla

1.3 Modelos lineares generalizados

1.4 Seleção de covariáveis (por stepwise)

Módulo 4: Visualização Espacial com R (Mapas)

1. Visualização espacial – mapas

1.1 Polígonos (regiões)

1.2 Pontos (localização das coordenadas geográficas de objectos)

1.3 Polígonos com atributos

Mais informações: aqui.