Introdução ao R

Introdução ao R

15:10 30 abril in MQ 2015, MQ 2016
Professor: Rogério Barbosa (USP/ CEBRAP) e Lucas Gelape
(15 horas/ sem crédito)
A linguagem R tem se tornado cada vez mais popular em pesquisas acadêmicas das mais diversas áreas e também em atividades profissionais. Mas por que utilizar o R? Bem… o R é uma plataforma flexível que vai muito além de um pacote para análise de dados. Nele podemos centralizar tarefas que geralmente são feitas com o uso de softwares diferentes: coletar dados da Internet, formatar e preparar bancos de dados, realizar análises estatísticas, produzir tabelas e gráficos e salvar os resultados. Tudo isso de forma automatizada, eficiente e completamente replicável. Além disso, o R é grátis, livre e aberto!
O conteúdo será focado na realização de análises estatísticas descritivas e exploratórias. Aprenderemos a manipular (criar, recodificar, transformar, fundir) variáveis e bancos de dados, aplicar medidas-resumo e elaborar a apresentação dos resultados (através de tabelas, gráficos e modelos). Revisaremos alguns pontos de Estatística básica e intermediária, como análise de regressão. Pretendo também que o aluno aprenda a buscar caminhos computacionais eficientes e encontrar soluções para os problemas práticos que encontrar em seu percurso de pesquisa. O curso se baseia em aulas expositivas, exercícios em sala e “deveres de casa” (possivelmente diários, mas curtos). Haverá horários diários de atendimento e monitoria para reforço os conteúdos – ambos extra-classe.
Pré-requisitos: 1. É necessário domínio das operações básicas de um computador: salvar/abrir arquivos, criar/deletar pastas, enviar e-mails, navegar na internet etc. 2. É necessário algum conhecimento sobre estatística básica: média, mediana, desvio-padrão, histograma, diagrama de dispersão. Conhecimentos sobre probabilidade, testes de hipótese e modelos de regressão são desejáveis. Abordaremos todas essas coisas, mas seria bom que esse contato fosse uma revisão. 3. É desejável algum contato prévio com software de análise estatística, planilha ou banco de dados (SPSS, Stata, SAS, Access…). 4. Não pressuponho nenhum contato prévio com R, nem qualquer conhecimento de linguagens de programação. 5. E importante que o aluno seja capaz de ler em inglês – uma vez que os arquivos de ajuda do R (que serão extensamente utilizados) estão escritos nessa língua. Além disso, a comunidade mundial de usuários tem o inglês como língua franca (faremos muito uso dos fóruns e listas de discussão).
Tópicos das aulas:
  1. Visão geral sobre o ambiente e a linguagem R: Manuseio de dados (Parte I), Operações boleanas e testes lógicos, Instalando pacotes, Obtendo ajuda online
  2. Rotinas estatísticas básicas: Estatísticas descritivas, uso de ponderação (dados de survey), trabalhando com grandes bancos de dados, fusão de bancos de dados, filtros, seleções e subconjuntos, gráficos básicos.
  3. R como plataforma computacional: Rotinas com repetição, programando funções, acelerando a execução dos códigos.
  4. Rotinas estatísticas intermediárias: Princípios de simulação, associação estatística, Introdução a regressão linear.
Tags: