Enrique Peña Nieto y las encuestas cuchareadas. Parte 4.

Parte 4 de 4: Demostrando el cuchareo.

Nota:

El presente apunte ya había sido presentado por un servidor hace meses en este diario en sus partes sustanciales, cuando recién la Paradoja Peña Nieto se empezaba dejar sentir en su apogeo. Me vi motivado a volver a publicarlo, aunque un tanto adecuado a las nuevas, por los comentarios que hace días externó el señor John Ackerman en la Jornada sobre el asunto de la tasa de rechazo en las encuestas. Aunque la encuesta de Berumen y Observatorio Ciudadano buscó resolver este problema, creo que no lo logró del todo. Y no obstante esto, la corrección de esta encuesta sobre el problema del rechazo se reflejó en un cierre sustancial en las diferencias entre Peña Nieto y AMLO. Esto me hace persistir en la creencia de lo que le diré a continuación.

Una regla básica del muestreo probabilístico:

Las encuestas electorales por muestreo probabilístico tienen valor de prueba científica porque se fundan en la teoría de la probabilidad. Si la muestra está bien diseñada y se encuentra sólidamente fundada en dicha teoría, sus resultados deberán ser aceptados por más paradójicos o absurdos que resulten para nuestro sentido común. Pero una regla fundamental para que todo estudio funcione tal y como dicta la teoría, es que usted no puede alterar la muestra que extraiga en cada ensayo. Es decir, una vez que extraiga la muestra de su población objetivo, no puede sustituir elementos de la misma a placer y a criterio personal. Y cuando digo “no puede”, me refiero a que no puede hacer esto ni tan solo con un elemento de la misma. En pocas palabras, la muestra que usted extraiga de la población, se queda tal y como la determinó el proceso aleatorio de selección.

El rechazo a las encuestas:

Las encuestas tienen una meta ideal consistente en un 100% de respuesta. Con esto me refiero a que todo investigador busca que su encuesta capte la respuesta efectiva de todos los elementos que fueron seleccionados en el procedimiento original de muestreo. Se trata del ideal, de lo deseable. Pero en la realidad esto es casi imposible de lograr. Y es que, en los hechos, toda encuesta siempre cuenta con algún grado de no respuesta, de rechazo a la entrevista. 
El problema con el rechazo es que constituye una fuente potencial de sesgo en los estimadores de la muestra que pueden ser tan o más importante que los mismos errores de muestreo y de medición, y que puede llegar a distorsionar los resultados de una encuesta hasta el grado de invalidarla. 
Digamos que un estudio obtuvo un 50% de rechazo a la hora de aplicar la encuesta. Esto significa que la mitad de las personas en muestra no quiso participar en la misma. Los investigadores, sobre todo en encuestas rápidas como las electorales, suelen recurrir a un recurso muy habitual, pero poco legítimo, para resolver este problema. Este recurso consiste en sustituir a cada persona en muestra que rechaza participar con otra persona que sí está dispuesta a participar, pero que no estaba contemplada en la muestra original, buscando con esto alcanzar el tamaño de muestra meta. 
Normalmente, esta práctica de sustituir elementos en muestra busca establecer un mecanismo que garantice que la sustitución cumpla con ciertos requisitos para no dejarla al criterio de los encuestadores de campo. Generalmente, el criterio de sustitución es elegir a una persona de la vivienda contigua, porque esto permite suponer que los elementos originales de la muestra y los sustitutos respectivos tienen iguales preferencias electorales en virtud de que pertenecen por lo menos al mismo nivel socioeconómico. 
Con todo, esta práctica de sustituir elementos en muestra tiene graves problemas. Me limitaré a señalar los más importantes.
En primer lugar, todo ese proceso de sustitución de elementos en muestra termina por pervertir a la muestra original, hasta el grado de invalidarla. Le recuerdo al lector que al principio de este apunte dejamos en claro que, en estricto sentido, la sustitución de un solo elemento de la muestra original ya invalida a la muestra. Y cuando digo que la “invalida”, me refiero por lo menos a que la muestra adulterada de esta forma deja de ser probabilística.   
En segundo lugar, ese proceso de sustitución de elementos en muestra no elimina el problema de origen, la no respuesta o el rechazo, y su sesgo potencial asociado. Lo único que se logra con esta sustitución es completar la cuota de muestreo establecida como meta, pero a través de un procedimiento artificial e ilegítimo que anula el carácter probabilístico del muestreo y la validez científica del estudio, y que puede potenciar los sesgos aun más, porque los sustitutos se parecen más a los que sí están dispuestos a participar en la encuesta. Incluso esta práctica puede a veces agravar el problema de no respuesta o rechazo. 
En tercer lugar, este recurso de sustitución tiene que trabajar bajo el supuesto heroico y descabellado de que cada persona que rechaza participar en la encuesta es exactamente igual a su sustituto respectivo – el de la casa contigua que sí acepta participar – en lo que toca a las variables bajo estudio, en este caso la preferencia electoral. Sin ese supuesto heroico y descabellado, la sustitución en muestra no tiene fundamento alguno y el estudio se derrumba. Sin embargo, el problema de sesgo con estas prácticas deviene por el hecho de que sí pueden existir significativas y críticas diferencias entre los que rechazan participar en una encuesta y los que sí participan. Y por supuesto que el grado o nivel de este sesgo potencial será mayor a medida que sea mayor la cantidad de rechazo en la encuesta.

Algunos datos históricos sobre el rechazo:

Existe una gran cantidad de investigación empírica que ha demostrado que sí suelen existir diferencias significativas y críticas entre los que sí participan en una encuesta y los que rechazan. Por supuesto que estos estudios están referidos a casos concretos en diversas áreas de investigación, incluidos los procesos electorales. Se ha demostrado en casos concretos, por ejemplo, que un rechazo del 10% llegó a ser suficiente para reportar sesgos significativos en una encuesta electoral al grado de hacerla lanzar inferencias o generalizaciones erróneas o fallidas sobre la población objetivo. Le doy dos ejemplos que son clásicos en este tema en la bibliografía del área.
El Literary Digest se había distinguido hasta antes de 1936 por sus encuestas electorales infalibles. Y fue que en el año de 1936 echó a andar su más ambiciosa encuesta hasta entonces. Envió diez millones de cuestionarios a domicilio y los resultados llevaron a Literary a anunciar que el republicano Alf Landon ganaría las elecciones presidenciales a Frankiln D. Roosevelt con un resultado de 57% a 43%. Sin embargo, dos semanas después Roosevelt ganó las elecciones con 61 % de los votos.
¿Cuál fue el problema? El problema de Literary fue, fundamentalmente, la no respuesta, el rechazo. De los diez millones de cuestionarios enviados solamente algo más de dos millones regresaron debidamente llenados. Y resulta que sí había una grande y crítica diferencia entre los que sí respondieron y los que no respondieron: los primeros, los que sí respondieron, eran republicanos mayormente – clase media y alta -; en tanto que los segundos, los que no respondieron, eran demócratas en su mayoría – clase media y baja -.
En la contienda presidencial Truman-Dewey, Literary volvió a las andadas y declaró a Dewey como el virtual ganador, pero al final Truman gano la presidencia. Otra vez el problema se debió al rechazo a la encuesta. Y esta vez ya los medios hablaron de un fiasco de Literary. Gallup, el monstruo que suplió a Literary en el trono de las encuestas, también cometió un error grave en 1948 por no respuesta y por errores graves de estratificación. 

El rechazo en las encuestas electorales en México y la Paradoja Peña Nieto:

En México hay un problema recurrente en la calidad de las encuestas electorales por lo menos en lo que toca a este asunto del rechazo. Este fenómeno suele alcanzar niveles realmente preocupantes, normalmente alrededor del 50 % y a veces alcanzando el 70 % o más. Usted puede constatar esto en las recientes encuestas electorales. Aunque le advierto que el problema de rechazo puede ser mayor que lo que se reporta públicamente. 
El promedio del rechazo en las encuestas electorales mexicanas debe andar rondando el 50 %. Eso significa que las encuestas solamente están tomando en cuenta alrededor del 50 % de los mexicanos en edad de votar, que son los que sí participan en encuestas. Pero el problema es más grave si usted le resta a ese 50 % que sí participa en las encuestas, el 20 % que en promedio no responde a la pregunta clásica del: “Si hoy fueran las elecciones para presidente de la república, ¿por quién votaría?” Así, en promedio grueso, puede decirse que las encuestas en este país solamente captan la preferencia electoral de entre el 30 % y el 40 % de la población electoral total. 
Todo lo anterior significa que la ventaja de Peña Nieto en las encuestas está referenciada solamente a ese 30 % ó 40 % de la población electoral del país. Pero sobre el restante 70 % ó 60 % de los electores, que rechazan participar o bien que sí participan pero no responden a la pregunta mencionada, nada sabemos en absoluto sobre sus preferencias electorales.
Pero por supuesto que las casas encuestadoras en México jamás le van a decir públicamente que tienen estos problemas y que no alcanzan a cumplir su objetivo de cubrir toda la muestra original meta. Ellos resuelven este asunto apelando al mismo procedimiento práctico que mencionamos arriba: ignorar el problema, proceder a sustituir personas de la muestra original con personas que si quieren participar, asumiendo, para esto, igualdad de comportamientos electorales entre ambos. Sin embargo, y como dijimos arriba, este procedimiento, además de no anular el problema de rechazo y su sesgo potencial asociado, solamente consigue pervertir la muestra original hasta el grado de invalidar su carácter probabilístico. Digo, a menos que usted esté dispuesto a creer en el supuesto heroico y tirado de los pelos de que sus vecinos de al lado piensan exactamente igual que usted en materia de política.
Así que cuando las encuestas electorales hacen estos arreglos prácticos, aunque no legítimos, nos regalan la imagen de un Peña Nieto puntero en las preferencias, pero bajo supuestos heroicos. Se trata, pues, de un Peña Nieto puntero en las preferencias electorales de un mundo hipotético.

Encuestas especulativas:

Algunos podría argüir que sí se puede suponer la igualdad de preferencias electorales entre cada persona en muestra que rechaza y su sustituto, otros podría decir que no, otros que “más o menos”, otros que “casi casi”, otros que “casi no”, otros que “tal vez”. Sin embargo, lo cierto es que ninguna persona tendrá bases objetivas para soportar su afirmación porque se está basando en creencias, en corazonadas. Y como todo en este terreno está en el aire, en las argumentaciones sin bases objetivas, estamos ya en el reino de la especulación, no de la ciencia positiva.
Ahora bien, aun en este terreno de la especulación hay argumentos sobrados para poner en duda las especulaciones de las casas encuestadoras en México en este terreno. Ellas especulan para afirmar que sí hay igualdad de preferencias electorales entre un ciudadano que rechaza entrevistas y uno que sí las acepta. Yo, por mi parte, también me puedo poner a especular para encontrar argumentos muy persuasivos que afirmen en contrario, es decir, para decir que sí hay diferencias críticas entre los dos tipos de ciudadano en México. Y además podría basar mis corazonadas en los resultados de abundante investigación empírica que confirma que sí hay diferencias sustantivas en ese terreno.
Pero el hecho rotundo es el siguiente: como nadie hasta el momento puede demostrar a las casas encuestadoras que sus especulaciones en torno al tratamiento del rechazo son falsas, ellas seguirán montadas en su macho para persistir en su supuesto heroico de que sí hay igualdad entre los dos tipos de ciudadano: entre los que rechazan la encuesta y los que sí aceptan encuesta. Y sobre ese supuesto heroico y tirado de los pelos, se construye la supuesta ventaja de Peña Nieto y su curiosa paradoja. 

Los medios y las casas encuestadoras: el ocultamiento de la verdad. 

Los libros de teoría del muestreo señalan que todo problema significativo de rechazo debe llevar al investigador a una de tres alternativas: o abandonar el proyecto de investigación por fracaso para pensar en otras alternativas de abordaje; o declarar al estudio como representativo solamente de los que sí participaron en la encuesta – una encuesta de voluntarios -; o declarar al estudio como probabilístico pero aclarando pública y claramente que sus resultados se fundan en el supuesto heroico de la multicitada igualdad de preferencias entre los que rechazan y los que aceptan participar.  
Como medios y casas encuestadoras en este país publican sus encuestas favorables a Peña Nieto pese a que trabajan sobre ese supuesto heroico para remediar tasas de rechazo estratosféricas, ahora le pregunto algo: ¿Ha visto alguna vez que esas agencias publiquen sus resultados aclarando que están fundadas en supuestos heroicos?
No, ¿verdad? En efecto, por supuesto que jamás harán eso porque ello asegura el derrumbe completo de la veracidad de sus resultados, y, con ello, el derrumbe estrepitoso de la Paradoja Peña Nieto. 

Una regla práctica de mi hechura:

Algunos podrían atravesar el argumento de que este problema de rechazo es inevitable dado el carácter de prontitud que tienen las encuestas electorales – según es el uso, se realizan en unos cuantos días –, por lo cual no existe tiempo suficiente para dar seguimiento a los que rechazan la entrevista. Razonable argumento éste, pero seguimos en lo mismo: técnicamente no sirve para justificar la sustitución de elementos en muestra. 
Lo cierto es que si somos demasiado rigoristas como para exigir que no exista rechazo alguno en los estudios electorales, podemos caer al extremo de hacer imposible todo intento de estudio porque siempre habrá algún rechazo de manera inevitable. En este sentido, si queremos que las cosas sean posibles al menos aceptablemente, debemos tolerar algún rechazo que no sea significativo. Pero el problema de inicio en este sentido es que la teoría del muestreo habla exiguamente a este respecto, y cuando lo hace ni siquiera precisa normas claras para definir lo que es una tasa de rechazo no significativa o tolerable. Es claro, pues, que eso se deja al criterio del investigador según el problema que esté abordando.
Bien, en el caso de los estudios de preferencias electorales siempre utilicé un criterio de mi hechura para determinar cuál era el nivel de rechazo tolerable en cada lance de investigación. Si el criterio se cumplía, mi estudio tenía validez científica; si no se cumplía, o echaba todo para atrás, o guardaba mucho cuidado de aclarar a mi cliente que el estudio estaba sustentado sobre el supuesto heroico de la igualdad que he mencionado muchas veces en este apunte. El siguiente es el criterio:
Si la tasa de rechazo es menor que la diferencia ente el primer y segundo lugar de las preferencias electorales, el estudio tiene validez sin necesidad del supuesto heroico; si la tasa de rechazo es mayor, el supuesto heroico era fundamental en las proyecciones, con el costo de su carácter especulativo.
Con todo, si usted revisa las encuestas electorales en México, se dará cuenta de que siempre la tasa de rechazo supera con mucho a la diferencia entre el primero y el segundo lugar, y a veces por cifras realmente escandalosas. Y esto nos deja claro que dichas encuestas no se salvan de su dependencia del supuesto heroico ni bajo esta concesión graciosa.

El cuchareo a la vista:

Básicamente, hay dos formas de cucharear encuestas electorales. La primea es acudiendo al expediente de alterar las cifras directamente, y la segunda es a través de la manipulación de la metodología para hacer pasar por legítimo un estudio ilegítimo. 
A lo largo de esta cuarta y última parte del apunte le he explicado cómo es que las encuestas electorales en México acuden al segundo expediente del cuchareo. Estamos, pues, ante encuestas que, en estricto sentido, carecen de bases científicas; que pretenden de manera ilegítima hacer pasar encuestas de voluntarios por encuestas probabilísticas; que solamente son aplicables en sus conclusiones a las personas concretas que aceptaron participar en las mismas; que buscan construir mayorías aparentes a favor de Peña Nieto en base solamente a la mitad del país que sí acepta participar en encuestas; y finalmente, que dejan en el vacío las preferencias electorales de al menos el 50 % de la población electoral que rechaza participar en encuestas.
Cuando vistas las cosas así, en su realidad cruda, empezamos a entender que todos esos mexicanos asombrados de los que hablamos en las partes 1, 2 y 3 de este artículo, tienen sobradas y sólidas razones al reputar a la Paradoja Peña Nieto la condición de una gran mentira fabricada por los medios y las casas encuestadoras de este país. Después de todo, las percepciones de su sentido común parecen estar en lo cierto, sobre todo cuando éste se potencia al nivel de un “sentido en común” en la interacción en redes sociales de internet. 

Democracia y verdad:

Los alcances de la democracia son muy limitados. Lo único que puede ofrecernos es un mecanismo para encontrar una forma de organización social por libre consenso. Pero nada puede hacer por sí sola en lo que toca a la calidad de esa meta, porque eso depende del grado de verdad en las opiniones que confluyen para formar ese consenso. Esa limitación de la democracia es fácil de entender cuando recordamos que la verdad no depende del consenso político o de los votos de una mayoría. La razón y su adaptación adecuada a la realidad dependen de la información que usted le acerque a ella para deliberar. Si la información es buena, la razón nos lleva por el camino de la verdad; pero si es mala, nos lleva al error y al fracaso. Y en este sentido, la calidad de los resultados de toda organización democrática depende en gran medida de la calidad de la información de que disponga el ciudadano promedio para deliberar en torno a lo asuntos públicos. 
Así las cosas, ventilar públicamente estudios electorales en las condiciones señaladas en este apunte, es algo que puede dar lugar a señales distorsionadas de la realidad en el ciudadano; distorsiones que luego pueden llevar a decisiones equivocadas y a consensos fallidos. Y estos riesgos se potencian al máximo en una situación como la nuestra, donde el ciudadano promedio tiene una pobre o nula cultura estadística, lo cual lo pone en la imposibilidad de entender el verdadero y profundo significado de un asunto como la tasa de rechazo en una encuesta electoral.
De grande y fundamental importancia debiera ser para todo político que se precie de ser demócrata aquello de procurar a su comunidad las instituciones necesarias para el logro de flujos de información de alta calidad para la toma de decisiones en el consenso democrático. Y en asuntos de encuestas electorales, la exactitud y la objetividad son los ejes rectores de la calidad, toda vez que la materia lo permite, y no así la especulación y los supuestos heroicos. Sin embargo, vemos que no hay políticos que se estén ocupando en este asunto del cuchareo en los estudios electorales, pese a lo evidente de la situación y pese a los enormes riesgos implicados para la democracia y el futuro de la nación. No hay justificación moral posible a ese tremendo “descuido” en los políticos.

Buen día y feliz votación.

Comentarios