Minicursos


MINICURSOS 

 

TÍTULO: BINARY REGRESSION MODELS: INFERENCE AND APPLICATIONS 

Ministrante: Rafael Braz Azevedo Farias (Universidade Federal do Ceará)

Ministrante: Jorge Luiz Bazan (Universidade de São Paulo)

Ministrante: Caio Lucidius Naberezny Azevedo (Universidade de Campinas) 

 

RESUMO: Binary regression models are a popular set of statistical tools to analyze dichotomous responses, in the presence of covariates. 
Different topics are associated with these models, including the choice of appropriate link functions, estimation methods, diagnostic 
and residual analysis and model comparison/validation tools. In addition, since the classical books of Hosmer and Lemeshow (1989) and Collet (2003) were published, different extensions to asymmetrical/heavy tailed links, ordinal response, mixed models, item response theory and misclassification problems, have been developed, even thought they are not all available in a single text. 
In this short course, we introduce frequentist and bayesian approaches to different topics of binary regression models, where applications are showed using R codes, as well as some important extensions are presented. Simulation studies and real data analysis are also discussed.

 

 

TÍTULO: ESTATíSTICA PARA DADOS EM ALTA DIMENSÃO 

Ministrante: Florencia Graciela Leonardi (Universidade de São Paulo)

 

RESUMO: Com o avanço de novas tecnologias na obtenção de dados em diferentes áreas de conhecimento é cada vez mais frequente a análise de dados em alta dimensão, isto é quando o número de parâmetros a serem estimados é muito maior que o número de observações.
De modo geral, métodos estatísticos clássicos não são adequados para a inferência neste tipo de situação e novas abordagens tem sido desenvolvidas. Nos últimos anos há havido um grande desenvolvimento metodológico, matemático e computacional que tem possibilitado a inferência estatística em altas dimensões com base em certas noções de esparsidade. Estas técnicas são suficientemente gerais como para cobrir uma grande gama de modelos, como regressão linear e não linear, modelos auto-regressivos e modelos gráficos, entre outros. O objetivo do minicurso será apresentar técnicas atuais de inferência estatística para dados em alta dimensão, fornecendo fundamentos teóricos e exemplos práticos de aplicação.

 

 

TÍTULO: MODELO DE REGRESSÃO GEOGRAFICAMENTE PONDERADO – ENTENDENDO A HETEROGENEIDADE ESPACIAL 

Ministrante: Alan Ricardo da Silva (Universidade de Brasília)

 

RESUMO: A tentativa de representar a realidade por meio de modelos, matemáticos ou não, continua sendo um grande desafio para a ciência que, década após década, procura sempre aprimorar tais ferramentas. Uma das técnicas de modelagem matemática mais utilizada é a análise de regressão, que vem sendo atualizada nos últimos anos devido à incorporação de fatores que ajudam a explicar e entender os fenômenos. Dentre essas atualizações destacam-se a regressão espacial tratada de forma global e a regressão espacial tratada de forma local, na qual se destaca a Regressão Geograficamente Ponderada (RGP), ou do inglês Geographically Weighted Regression (GWR). Esta última se diferencia da primeira por analisar as relações entre as variáveis de forma específica para cada unidade de estudo, e não conjuntamente como é feito em um processo global. No caso, tem-se como pressuposto que as regiões j mais próximas da região i possuem maior influência nas estimativas dos coeficientes da regressão do que regiões mais afastadas. Assim, tendo um ajuste específico para cada área, o resultado final é uma melhor representatividade do processo como um todo. O que justifica tal análise é a violação da premissa de estacionariedade exigida pelos modelos globais, o que permite a esse último atribuir a mesma relação entre as variáveis para todas as unidades de estudo. Devido à heterogeneidade dos municípios brasileiros, por exemplo, dificilmente a relação entre duas ou mais variáveis se mantém a mesma para todas as regiões do país. Por isso a necessidade de se trabalhar com ferramentas mais específicas capazes de proporcionar uma análise mais detalhada, e assim avaliar a variabilidade existente. Dessa forma, o resultado final de um modelo RGP é uma matriz de (n x k) de parâmetros estimados, sendo n a quantidade de dados e k a quantidade de parâmetros, sendo possível assim verificar os resultados por meio de um mapa. O Modelo RGP teve início com o trabalho original de Fotheringham et al. (1996) sobre janelas móveis e sistematizado em Fotheringham et al. (2002). Diversos outros trabalhos vem tratando dessa técnica como os de Wheeler e Tiefelsdorf (2005) e Nakaya et al. (2005), que tratam especificamente dos problemas de multicolinearidade e dados de contagem (poisson). O trabalho de Silva e Rodrigues (2014) extendeu o modelo RGP para dados de contagem com superdispersão, utilizando para isso a distribuição binomial negativa, e o trabalho de Silva e Lima (2017) extendeu o modelo RGP para dados restritos ao intervalo (0,1), utilizando a distribuição beta. Um aspecto interessante dos modelos espaciais (sejam locais ou globais) é que na ausência de dependência espacial, os modelos apresentam exatamente os mesmos resultados dos modelos não espaciais, isto é, de um modelo espacial é possível chegar a um modelo não espacial, mas de um modelo não espacial não é possível chegar a um modelo espacial. O minicurso abordará as características do modelo de regressão geograficamente ponderado, bem como suas vantagens e problemas, além do que vem sendo atualmente desenvolvido sobre o tema.

 

 

TÍTULO: MODELOS EM REGRESSÃO QUANTíLICA: TEORIA E APLICAÇÕES 

Ministrante: Christian Eduardo Galarza Morales (Instituto de Matemática, Estatística e Computação Científica - IMECC)

 

RESUMO: Nos modelos de regressão, estamos interessados ​​em descrever a relação entre uma variável específica (resposta) e outras características. Essa relação é comumente caracterizada por medidas de tendência central, geralmente, pela popular média. Por que não a mediana? Por exemplo, dados assimétricos para muitas aplicações, como na geoquímica, são melhor aproximados pela distribuição log normal. No entanto, não faz sentido considerar a média numa escala logarítmica, pois a propriedade de aditividade não vale mais, lembrando que a média do logaritmo não é o logaritmo da média. Em análise de sobrevivência, raramente se fala de ``sobrevivência média''. A mediana e os quantis reinam nesta área.
Ao ampliar a idéia para os quantiles, a regressão quantílica permite ajustar qualquer quantil da variável resposta em função de uma série de covariáveis, aproveitando as propriedades dos quantis como robustez, invariância, entre outras. Como conseqüência, esses modelos são mais robustos à presença de outliers, não precisam de pressupostos sobre a distribuição do erro e oferecem uma melhor descrição gráfica dos dados.
O minicurso será particionado em duas partes: na primeira exploraremos a teoria que envolve os modelos de regressão quantílica assim como o caso univariado, onde estudaremos um modelo robusto considerando erros com distribuições de caudas pesadas e também o caso para respostas intervales. Modelos de regressão quantílica de efeitos mistos lineares e não-lineares serão abordados na segunda parte do minicurso. Aplicações para os modelos propostos serão apresentados usando os pacotes \texttt{lqr}, \texttt{qrLMM} e \texttt{qrNLMM} disponíveis no \texttt{R}.

 

 

TÍTULO: BAYESIAN DISTRIBUTIONAL REGRESSION 

Ministrante: Thomas Kneib (Georg-August-Universität Göttingen) 

RESUMO: In many modern applications, one is not only interested in explaining the effect of covariates on the expected outcome but would rather like to regress the complete distribution of the response on explanatory variables. In this course, we will introduce distributional regression, a generic framework for performing regression analyses where several parameters of a complex, potentially multivariate response distribution are related to flexible regression predictors. Although classic regression analyses entail easy interpretation, they only focus on means and averages and therefore may lead to erroneous conclusions when modeling complex data structures. The distributional regression framework allows us to overcome these problems. To fully exploit the capabilities of distributional regression, we will consider structured additive regression specifications, which allow for combination of nonlinear effects of continuous covariates, spatial effects, random effects and a number of extensions.