Blog de Darwin Ugarte Ontiveros: 2015

lunes, 28 de diciembre de 2015

Identificación a travéz de la heteroscedasticidad

En econometría, cuando el supuesto de exogeneidad de los regresores se rompe, los coeficientes estimados no gozan de las propiedades de insesgabilidad y consistencia. Son tres las posibles causas para que este supuesto no se cumpla, ipso facto se tengan regresores endógenos: simultaneidad, heterogeneidad no observada y errores de medida en los regresores. En estos casos, el recurso común existente para lidiar con el problema de endogeneidad es la estimación por el método de Variables Instrumentales y la consiguiente identificación de los parámetros basándose en restricciones de exclusión. Es decir, el uso de regresores (instrumentos) que estén altamente correlacionados con la variable explicativa endógena (relevantes) y que no expliquen directamente a la variable dependiente (válidos), esta última es la restricción de exclusión. Sin embargo, en la práctica, muchas veces es muy difícil obtener instrumentos que apropriadamente satisfagan ambas condiciones, limitando la aplicabilidad de este método y haciendo varios proyectos empíricos inviables.

Recientemente han surgido métodos de identificación alternativos para lidiar con el problema de endogeneidad que no se basan en la restricción de exclusión de los regresores, es decir que no dependen de la existencia de instrumentos externos apropiados. En esta nota describo brevemente estas estrategias de identificación para datos de corte transversal. Las mismas son alternativas bastante interesantes y pueden ser aplicadas en trabajos empíricos bajo las condiciones que se explican a continuación. Espero les sea útil.

Considérese el siguiente sistema:

\[\begin{array}{l}{y_2} = {y_1}{\beta _2} + X{\gamma _2} + {\varepsilon _2}\\{y_1} = {y_2}{\beta _1} + X{\gamma _1} + Z{\alpha _1} + {\varepsilon _1}\end{array}\]

Donde \({y_2}\) es la variable dependiente y \({y_1}\) es la variable explicativa endógena. Este sistema de dependencia simultánea será triangular si \({\beta _1} = 0\), que corresponde a la situación que se considera en este post. \(Z\) incluye el set de instrumentos que para el presente caso se supone que no son disponibles, es decir \({\alpha _1} = 0\). Los errores \({\varepsilon _2}\) y \({\varepsilon _1}\) están correlacionados lo que hace del estimador Mínimos Cuadrados Ordinarios sesgado e inconsistente por la endogeneidad.

En este marco, Lewbel (2012) demuestra que los parametros del anterior sistema pueden ser identificados bajo los siguientes supuestos: \(E({X_i},{\varepsilon _{2i}}{\rm{) = 0}}\), \(E({X_i},{\varepsilon _{1i}}{\rm{) = 0}}\), \(Cov({X_i},{\varepsilon _{1i}}{\varepsilon _{2i}}{\rm{) = 0}}\), y \(Cov({X_i},\varepsilon _{1i}^2{\rm{)}} \ne {\rm{0}}\). Es decir que \(({X_i} - \bar X){\varepsilon _{1i}}\) puede usarse como un set de instrumentos internos. Nótese que los primeros dos supuestos simplemente implican la exogeneidad de los regresores, el tercer supuesto sugiere que \(({X_i} - \bar X){\varepsilon _{1i}}\) es un set de instrumentos válidos ya que no están correlacionados con los errores de la segunda etapa, y el cuarto supuesto insinúa que los errores de la primera etapa son heteroscedásticos en términos de \(X\), este supuesto tambien puede entenderse como la condición de relevancia de estos instrumentos generados, la misma que dependerá de la covarianza de los mismos con \({\varepsilon _1}\) (los errorres heteroscedásticos de la variable explicativa endógena).

Es decir, para la identificación sólo son necesarios regresores que sean independientes del producto de los errores heteroscedásticos. Otra característica de este enfoque es que puede extenderse fácilmente para el caso de dos o más regresores endógenos, así también la estimación puede efectuarse por Mínimos Cuadrados Ordinarios o el Método Generalizado de Momentos, y los códigos para su implementación están escritos en STATA (ivreg2h) y en R (ivlewbel).

Por otro lado, Klein y Vella (2010) proponen utilizar el enfoque de funciones de control para lidiar con la endogeneidad. Inicialmente, tal vez es prudente recordar la manera en la que la estimación de Variables Instrumentales por medio de Mínimos Cuadrados en dos Etapas (MC2E) pertenece al grupo de estimadores del enfoque de funciones de control: los residuos de la regresión de la variable explicativa endógena con los instrumentos y el set de regresores exógenos (de la primera etapa) son incluidos en la ecuación estructural (la segunda etapa) con el objeto de "controlar" o remover el componente de \({\varepsilon _2}\) que se encuentra correlacionado con \({\varepsilon _1}\), y obtener así estimaciones consistentes de \({\beta _2}\).

En este marco, Klein y Vella (2010) sugieren utilizar la siguiente función de control en reemplazo de los residuos de la primera etapa producto de la ausencia de instrumentos aprpiados: \(A(X) = {\rho _0}\frac{{{S_{\varepsilon 1}}(X)}}{{{S_{\varepsilon 2}}(X)}}{\varepsilon _1}\). Es decir, sugieren estimar:

\[{y_2} = {y_1}{\beta _2} + X{\gamma _2} + {\rho _0}\frac{{{S_{\varepsilon 1}}(X)}}{{{S_{\varepsilon 2}}(X)}}{\varepsilon _1} + u\]

Donde: \(u = {\varepsilon _2} - A(X){\varepsilon _1}\), asimismo \({{S_{\varepsilon 1}}(X)}\) y \({{S_{\varepsilon 2}}(X)}\) representan las funciones de varianza condicional para los errores de la primera y segunda etapa, respectivamente, las mismas que se estiman de manera no paramétrica. Para identificar el modelo, Klein y Vella (2010) asumen (i) la presencia de heteroscedasticidad multiplicativa en los términos de error: \({\varepsilon _1} = {S_{\varepsilon 1}}(X)\varepsilon _1^{**}\) y \({\varepsilon _2} = {S_{\varepsilon 2}}(X)\varepsilon _2^{**}\), donde \(\varepsilon _1^{**}\) y \(\varepsilon _2^{**}\) son los términos de error homoscedásticos; y que (ii) el coeficiente de correlación condicional entre los errores homoscedásticos \({\rho _0} = Corr(\varepsilon _1^{**},\varepsilon _2^{**})\), es constante. Como \(A(X)\) es una función no lineal de de \(X\), esta no linealidad es utilizada como una fuente de identificación. Así, la identificación requiere la existencia de heteroscedasticidad en los errores y en especial que la forma de la misma sea diferente en la primera y segunda etapa, es decir que el ratio \(\frac{{{S_{\varepsilon 1}}(X)}}{{{S_{\varepsilon 2}}(X)}}\) no sea constante.
Los códigos para la implementación de este método están escritos en STATA (kvreg).

Finalmente mencionar que probablemente debido a a la facilidad de su aplicación y a que la heteroscedasticidad es una característica general de los datos, ambas estrategias han sido aplicadas en varias publicaciones académicas, generalmente como robustness check o para conseguir modelos sobre identificados, lo que refleja la utilidad y aceptación de los mismos en la literatura.

Referencias

Klein, R., Vella. F., 2010. Estimating a class of triangular simultaneous equations models without exclusion restrictions. Journal of Econometrics 154, 154-164

Lewbel, A., 2012. Using Heteroscedasticity to Identify and Estimate Mismeasured and Endogenous Regressor Models, Journal of Business and Economic Statistics 30, 67-80

°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°

lunes, 14 de diciembre de 2015

Por qué la mayoría de los resultados publicados sobre Raíz Unitaria y Cointegración son falsos

Este es el título de uno de los artículos más visitados en SSRN en el mes de octubre [link]. Escrito por Luiter y Mahal (2015) de la universidad canadiense de Algoma, el trabajo sostiene que la siguiente proposición planteada por Granger(1981), no se cumple en la realidad: si \({x_t} \sim I({d_x}), {y_t} \sim I({d_y})\), entonces \({z_t} = b{x_t} + c{y_t} \sim I(\max ({d_x},{d_y}))\). Es decir, que la suma o diferencia de dos series de diferente orden de integración, tendrá como resultado una serie cuyo orden de integración es el mayor de entre las dos series. Hecho que los autores entienden como un factor que invalidaría los análisis de raíz unitaria y cointegración.

Como habrá percibido el lector, el título del trabajo es bastante interesante y sus conclusiones son sugestivas. No obstante, el contenido del documento resulta muy poco convincente como para tomar en cuenta las aseveraciones escritas a lo largo del mismo. El motivo es, por un lado falta de comprensión, ya que los autores se enfocan en una proposición que es verdadera, en general, como lo menciona el mismo Granger (1981), siendo la cointegración un caso especial en el que la proposición no se cumple. En otras palabras, la proposición dice que una combinación lineal de dos series no estacionarias dará como resultado necesariamente una serie no estacionaria, en general. Aunque, existe la posibilidad de que la mencionada combinación lineal sea estacionaria, \(I({d_z}) < I({d_x},{d_y})\), es decir sea cointegrada. Nótese que en este trabajo, el de 1981, el profesor Granger introduce formalmente en la literatura el término cointegración (Clive Granger recibió el premio nobel de economía en 2003 por desarrollar métodos para el análisis de series de tiempo cointegradas).
Por otro lado, los autores consideran una evidencia empírica como prueba suficiente para refutar o invalidar una propiedad teórica de los tests de cointegración. Ahí está el segundo problema, ya que obviamente muchos otros factores pueden explicar los resultados empíricos del artículo, ya sea la frecuencia de los datos, la muestra, la presencia de estacionalidad, de cambios estructurales, la especificación,......, etc. Así, concluir directamente que un particular caso empírico es una prueba de la invalidez de los tests de cointegración resulta precipitado.

Para responder a la interesante pregunta planteada en el título, inicialmente debería haberse planteado una hipótesis, una causa o escenario que haga "falsos" los tests de raíz unitaria y cointegración. Matemáticamente debería demostrarse que las propiedades teóricas "A" y "B" de estos tests no se cumplen bajo las condiciones planteadas en la hipótesis. Este análisis debería estar apoyado por simulaciones y/o por una mayor evidencia empírica, considerando otras variables y otras muestras, donde se evidencie, nuevamente, que las propiedades teóricas "A" y "B" de estos tests no se cumplen bajo las condiciones planteadas en la hipótesis.

Estos autores están haciéndose famosos, aunque no en el sentido que esperaban [link].

Dado el tema, se puede señalar algunos factores que invalidan las propiedades de los estadísticos de raíz unitaria y de cointegración, por ejemplo Perron (1989) mostró que en caso de su existencia y omisión en el análisis, los quiebres estructurales pueden conducir a un sesgo que reduce la capacidad de rechazar la hipótesis nula de raíz unitaria. Así también, cuando las variables objeto de análisis no son exactamente I(1), es decir poseen más de una raíz o son casi raíz unitaria, los tests de raíz unitaria incorrectamente las identificaran como raíces unitarias (Smallwood y Norrbin, 2004), de igual manera los tests de cointegración las definirán como cointegradas aún cuando éstas no se encuentren correlacionadas (Hjalmarsson y Österholm, 2010). Otro escenario se da cuando existen raíces unitarias en otras frecuencias diferentes a cero, raíces unitarias estacionales, en este caso el test de raíz unitaria de Dickey Fuller sufre distorsiones en su tamaño (Ghysel et.al., 1994).

Finalmente, mencionar que cualquier método o técnica en econometría se basa en supuestos, ciertas condiciones que deben ser satisfechas. Si las mismas no lo son, entonces los resultados empíricos no tendrán las propiedades deseadas, pero no es al revés, es decir "un" resultado empírico no puede invalidar una técnica econométrica.

Referencias

-Granger, C.W.J., 1981. Some properties of time series data and their use in econometric model specification. Journal of econometrics, 16:121:130.
-Luitel, Hari S. y Mahar, Gerry J., 2015. Why Most Published Results on Unit Root and Cointegration are False.
-Perron, P., 1989. The great crash, the oil price shock, and the unit root hypothesis. Econometrica, 57:.1361-1401.
-Smallwood, Aaron D., y Norrbin, Stefan C., 2004. Estimating cointegrating vectors using near unit root variables, Applied Economics Letters, 11:12, 781-784
-Hjalmarsson Erik y Österholm, Pär, 2010. Testing for cointegration using the Johansen methodology when variables are near-integrated: size distortions and partial remedies. Empirical Economics, 39:51–76
-Ghysels, E., Lee, H. S., y J. Noh., 1994. Testing for unit roots in seasonal time series: Some theoretical extensions and a Monte Carlo investigation. Journal of Econometrics, 62: 415–442.

domingo, 18 de octubre de 2015

Presentación

Bienvenidos a mi blog, me llamo Darwin Ugarte Ontiveros en este espacio encontrarán información sobre temas relacionados con la Econometría, así también algunos de mis trabajos sobre la Economía Boliviana.