Thursday, November 20, 2008

11 - Correlation and Regression

Sample Covariance Cov(x,y) = [SUM(Xi-X)(Yi-Y)]/(n-1)

Sample Correlation r(x,y) = Cov(x,y)/[(StdDevX)(StdDevY)]

StdDevX^2 = [(Xi-X)^2]/(n-1)

Correlation -> Linearidade

Limitations to correlation analysis
- Outliers (dados extremos que podem levar a falsas conclusões e/ou prejudicar o sample)
- Spurious Correlation (correlação ao azar, sem razão, simples coincidência)
- Nonlinear Relationships (correlaçao é uma funçao de 1o grau, caso haja uma correlaçao mais complexa (ex. y=x^2) não linear acarretará em um r aprox. 0)

Variavéis
- Dependent: Explained, Endegenous, Predicted
- Independent: Explanatory, Exogenous, Predicting

Assumptions
- Linear Relationship (independent -> dependent)
- ñ existe correlaçao (independent -> resíduo)
- Expected Value (resíduo) = 0
- Var(resíduo) = constante
- Resíduo is normally distributed and independent r(residuo,residuo)= 0

Simple Linear Regression Model
- Yi = b0 + b1*Xi
- Beta = Slope Coeficient -> b1 = Cov(x,y)/StdDev^2(x)

Interpretation of Regression Coefficient
Beta -> Sistematic Risc & Alpha -> Risk Adjust



Hypothesis test

No comments: