14 de julio de 2012

Aquí está el fraude

Elecciones Presidenciales, México 2012

W. Luis Mochán Backal

Julio 1, 2012-

Última actualización 2012-07-13 Fri 21:47

1 Algunos datos del PREP

Los datos mostrados a continuación son tomados de la base de datos que liberó el IFE el 2 de julio a las 8:00PM. Algunos de ellos son algo irrelevantes y otros tienen más sustancia.

1.1 Sobre la base de datos

  1. La base de datos tiene 144,013 registros.
  2. Hay 320 registros correspondientes al número de sección 0 que acumularon 45,095 votos.
    1. 312 son Básicas con lista nominal de 59,046 y recibieron 42598 votos.
    2. 8 son Contiguas con lista nominal 0 y recibieron 2497 votos.
    3. Parecen ser las relativas al voto en el extranjero.
    4. Mi base de datos de casillas no las tiene.
    5. Incluyen las 305 casillas que tienen TIPO_ACTA=1, que no está documentado en la base de datos, pero también otras 15 casillas más.
  3. Las casillas se distribuyeron en
    1. 91,906 casillas urbanas,
    2. 51,531 no urbanas
    3. 576 sin clasificación.
  4. De las 576 sin clasificación
    1. 15 corresponden a la sección 0, donde (creo) que votan los extranjeros.
    2. 84 son básicas,
    3. 269 son contiguas,
    4. 175 son extraordinarias y
    5. 48 son especiales.
  5. La lista nominal es de 79,392,217 votantes potenciales.
    1. 53,322,775 votantes en casillas urbanas,
    2. 26,169,442 votantes en casillas no urbanas.
    3. 0 votantes en las casillas no clasificadas.
  6. Estos datos son consistentes con los publicados en ésta página, donde se discute el aumento en la lista nominal y en el número de casillas no-urbanas y su comparación con la disminución relativa de la población rural.
  7. Yo hubiera esperado que las casillas con lista nominal=0 hubiesen sido únicamente las especiales. Sin embargo las casillas sin clasificación respecto a ubicación tienen listado nominal = 0 y son
    1. 84 básicas,
    2. 269 contiguas,
    3. 175 extraordinarias y
    4. 48 especiales.
  8. Por otro lado, hubo 1478 casillas donde la lista nominal era cero. Estas fueron
    1. 84 básicas,
    2. 269 contiguas,
    3. 175 extraordinarias y
    4. 950 especiales.
  9. No entiendo por qué hay casillas básicas y contíguas que no son ni urbanas ni no-urbanas y que además tienen listado nominal=0.
  10. Hubo 19 casillas donde la lista nominal superó los 750 votos, incluyendo 15 básicas y 4 contíguas, con lista nominal total de 17,644.
  11. Hubo 15,756 secciones cuya lista nominal sobrepasó los 1500 votantes. Estas secciones incluyen 61,802 casillas y su lista nominal es de 38,118,884.
    1. El COFIPE sí permite en casos excepcionales secciones con más de 1,500 votantes nominales, cuando el crecimiento poblacional lo justifique. Sin embargo, es raro que la mitad de los votantes lo hagan en secciones 'excepcionales'.

1.2 Sobre los resultados

  1. El resultado de la elección fue

    PANPRIPRDPVEMPTMCPANALC-PRI-PVEMC-PRD-PT-MCC-PRD-PTC-PRD-MCC-PT-MCNO-REGISTRADOSNULOSTOTAL-VOTOSLISTA-NOMINAL
    12,560,75814,323,8209,645,472950,8771,218,282986,2601,137,8483,611,1432,940,408610,708181,44192,53446,8631,220,21749,526,63179,492,217
  2. Agrupando los resultados por candidato, obtenemos


    JVMEPNAMLOGQNO-REG.NULOSTOTLISTA-NOMINAL
    Núm.12,560,75818,885,84015,675,1051,137,84846,8631,220,21749,526,63179,492,217
    %25.3638.1331.652.300.092.4699.99
  3. (El error de redondeo en esta tabla suma 0.01%)
  4. El porcentaje de participación ciudadana fue de 62.30%.
  5. Yo hubiera esperado que las casillas con lista nominal=0 hubiesen sido únicamente las especiales. Sin embargo las casillas sin clasificación respecto a ubicación tienen listado nominal = 0 y son
    1. 84 básicas que recibieron 25,269 votos,
    2. 269 contiguas que recibieron 91,560 votos,
    3. 175 extraordinarias con 60,637 votos y
    4. 48 especiales con 24,320 votos

    para un total de 201,786 votos.

  6. En estas casillas hubo 201,786 votos.
  7. Los resultados en estas casillas fueron


    JVMEPNAMLOGQNO-REGNULOSTOT
    Núm.50,83877,31064,4124,352814,793201,786
    %25.1938.3131.922.160.042.38100.00
  8. Curiosamente, los porcentajes sobre estas casillas extrañas son muy similares a los de la elección completa; ¡estas casillas forman un excelente muestreo de todo el país!
  9. Otro conjunto curioso de casillas son aquellas que tienen lista nominal nula y sin embargo no son especiales. De estas hay 528 casillas.
    1. 84 básicas,
    2. 269 contiguas y
    3. 175 extraordinaria.
  10. En estas casillas hubo 177,466 votos.
  11. Los resultados en dichas casillas fueron


    JVMEPNAMLOGQNO-REGNULOSTOT
    Núm.44,24369,73555,0153,943754,455177,466
    %24.9339.2931.002.220.042.5199.99
    Estos resultados tampoco difieren substancialmente del resultado nacional, por lo que éstas casillas también son una buena muestra.
  12. Por otro lado, los resultados sobre las casillas especiales, donde sí era de esperar que hubiese listados nominales nulos, fueron


    JVMEPNAMLOGQNO-REGNULOSTOT
    Núm.165,150166,845244,3129,7164387,308593,769
    %27.8128.1041.151.640.071.23100.00
    Estos resultados difieren substancialmente de los resultados nacionales, y en estos casos AMLO ¡gana por más de 13%!.
  13. En las casillas especiales vota la gente que está de tránsito, lejos de su vivienda o trabajo, por lo cual ha de ser difícil comprar o coaccionar sus votos.
  14. Los resultados sobre todas las casillas con lista nominal cero son


    JVMEPNAMLOGQNO-REGNULOSTOT
    Núm.2093932365802993271365951311763771235
    %27.1530.6838.811.770.071.53
  15. De nueva cuenta, los resultados difieren de los nacionales y se parecen a los de las casillas especiales.
  16. En las casillas con número de sección 0 votan (creo) los residentes en el extranjero.
  17. Los resultados en dichas casillas fueron


    JVMEPNAMLOGQNO-REGNULOSTOTLISTA-NOMINAL
    Núm.18,0977,91217,5989168149145,09559,046
    %40.1317.5539.022.030.181.09100.00
  18. De nueva cuenta, estos resultados difieren notablemente de los resultados nacionales. Los residentes en el extranjero votaron en primer lugar por JVM. AMLO está en segundo lugar pero casi empatado, mientras que ¡EPN queda 22% detrás!.
  19. Los residentes en el extranjero no parecen querer mucho al PRI.
  20. Además, no es fácil comprar o coaccionar el voto del extranjero.
  21. Los resultados sobre las 91,906 casillas urbanas fueron


    JVMEPNAMLOGQNO-REGNULOSTOTLISTA-NOMINAL
    Núm.85172961172242611223203805981329876824683298436153322775
    %25.8235.5434.032.440.102.07

  22. Notamos un resultado muy cerrado entre EPN y AMLO, arriba de JVM.
  23. Los resultados sobre las 51,531 casillas no urbanas son


    JVMEPNAMLOGQNO-REGNULOSTOTLISTA-NOMINAL
    Núm.399262470861044387490327515137955329561634048426169442
    %24.4343.3726.852.000.083.26

  24. Aquí, la ventaja de EPN es enorme mientras que JVM y AMLO están casi empatados.
  25. Es importante la dependencia tan fuerte de los resultados dado que la evolución reciente entre el número de casillas y de votantes en casillas urbanas y no-urbanas no es consistente con la evolución de la población del país registrada por el INEGI.
    1. De 2006 a 2012, el número de casillas no-urbanas se incrementó significativamente más que el número de casillas urbanas y el número de electores potenciales también, pasando de alrededor de 19 millones a cerca de 26 millones, y del 27% al 33% del listado nominal completo.
    2. Estos datos son curiosos en el contexto de los datos del INEGI, que muestran un reducción contínua del porcentaje de la población rural, la que, por ejemplo, bajo de 25% en 2000 a 22% en 2010.
    3. El IFE tiene varios esquemas de clasificación de casillas y que no son consistentes entre sí. En particular, rurales+mixtas no es igual a no-urbanas.
  26. En las 19 casillas cuyas listas nominales superaron el límite de 750, hubo 7598 votos y en ellas gano EPN con 42.88% contra 33.09% para JVM y 20.07% para AMLO.
  27. En las 61,802 casillas que formaron parte de las 15,756 secciones donde la lista nominal sobrepasó el tope de 1500 votantes nominales se recibieron 23,312,572 votos. En esos, ganó EPN con 37.66% vs. AMLO con 32.40% y JVM con 25%.

1.3 Mecanismo de registro

Durante la noche de la elección cada acta tuvo que ser llevada a uno de los Centros Distritales, donde sería acopiada, sellada y puesta en una cola para que sus datos sean capturados e inmediatamente enviados a las computadoras centrales del IFE, donde serían registrados. La base de datos del PREP indica la hora de acopio, la de captura y la de registro.

  1. Hay 3462 actas donde no se registró la hora de acopio, indicando que no llegaron a los centros distritales o no se cumplió el protocolo.
  2. Hubo 1785 actas que no fueron capturadas en los centros distritales (no tienen indicada la hora de captura).
  3. Hubo 1480 actas que no fueron registradas.
  4. Hay 140,551 actas que sí fueron acopiadas.
  5. Hubo 142,228 actas que sí fueron capturadas.
  6. Hubo 142,553 actas que sí fueron registradas.
  7. Aquí empieza lo divertido. Hubo 1677 actas que fueron capturadas ¡a pesar de que no fueron acopiadas!.
  8. Hubo 305 actas que sí fueron registradas ¡a pesar de no haber sido capturadas! De éstas, ninguna fue acopiada. Todas éstas corresponden a casillas básicas tipo 1 (¿qué significa? la base de datos no lo explica) y se distribuyeron en:
    1. Aguascalientes 3
    2. Baja California 8
    3. Baja California Sur 2
    4. Campeche 2
    5. Coahuila 7
    6. Colima 2
    7. Chiapas 12
    8. Chihuahua 9
    9. Distrito Federal 32
    10. Durango 4
    11. Guanajuato 14
    12. Guerrero 9
    13. Hidalgo 7
    14. Jalisco 19
    15. México 40
    16. Michoacán 12
    17. Morelos 5
    18. Nayarit 3
    19. Nuevo León 12
    20. Oaxaca 11
    21. Puebla 16
    22. Querétaro 4
    23. Quintana Roo 3
    24. San Luis Potosí 7
    25. Sinaloa 8
    26. Sonora 7
    27. Tabasco 6
    28. Tamaulipas 8
    29. Tlaxcala 3
    30. Veracruz 21
    31. Yucatán 5
    32. Zacatecas 4.
  9. Y hubo 1982 actas que se sí fueron registradas en las computadoras centrales a pesar de no haber sido acopiadas, sin que hubiesen sido entregadas en ningún distrito. De éstas
    1. 1038 fueron casillas básicas,
    2. 855 fueron contiguas,
    3. 76 fueron extraordinarias y
    4. 13 fueron especiales.

    Además, de éstas,

    1. 1368 fueron urbanas,
    2. 597 fueron no urbanas
    3. 17 no tuvieron clasificación.
  10. Estas incluyen las 305 de arriba, además de otras 1677. Se distribuyern 1038 en casillas básicas 1038, 855 en contiguas, 76 en extraordinarias y 13 en especiales y se distribuyeron como:
    1. Aguascalientes 12
    2. Baja California 110
    3. Baja California Sur 12
    4. Campeche 15
    5. Coahuila 60
    6. Colima 11
    7. Chiapas 91
    8. Chihuahua 79
    9. Distrito Federal 146
    10. Durango 57
    11. Guanajuato 83
    12. Guerrero 128
    13. Hidalgo 19
    14. Jalisco 179
    15. México 247
    16. Michoacán 41
    17. Morelos 22
    18. Nayarit 16
    19. Nuevo León 101
    20. Oaxaca 32
    21. Puebla 35
    22. Querétaro 20
    23. Quintana Roo 21
    24. San Luis Potosí 19
    25. Sinaloa 24
    26. Sonora 95
    27. Tabasco 57
    28. Tamaulipas 93
    29. Tlaxcala 12
    30. Veracruz 97
    31. Yucatán 35
    32. Zacatecas 13
  11. ¿Cómo pudieron registrar dichas actas?
  12. La siguiente figura compara la hora de acopio de los datos en los centros distritales y los correspondientes tiempos de registro de sus datos en las computadoras centrales. ./archivos/registraVsAcopio.jpg
    1. Cada acta (que fuese acopiada y registrada) corresponde a un punto sobre esta gráfica. Su tiempo de registro (a partir de las 0 horas del 1o de julio, hora del centro) se indica en el eje horizontal mientras que el eje vertical grafico el tiempo que tardaron en registar los datos después de haber recibido el acta.
    2. El tiempo en la gráfica está medido en horas.
    3. La gráfica muestra dos líneas verticales en que no hay puntos. Estas regiones muestran que el proceso de registro de actas se detuvo alrededor de las dos de la tarde y de las cuatro de la tarde del dos de julio.
    4. ¿Se habrá caido el sistema momentáneamente?
    5. La segunda interrupción duró alrededor de dos horas y media.
    6. El tiempo mínimo entre acopio y registro fue de 50.94 segundos. Me parece extremadamente rápido.
    7. Las diez casillas más rápidas en registrarse fueron
      1. Ags. (D)istrito 3, (S)ección 234 casilla (B)ásica urbana registrada el 2012-07-01 a las 21:17:00.0 tardó 51s.
      2. DF, D1, S967 (C)ontigua-1 urbana el 2012-07-02 a las 06:20:00, tardó 55s.
      3. Chih. D6 S641 C1 urbana el 2012-07-02 a las 06:07:00, tardó 57s.
      4. Nayarit D1 S491 B no-urbana el 2012-07-02 a las 10:20:00, tardó 60s.
      5. Zac. D1 S277 B no-urbana el 2012-07-02 a las 02:07:00.0, tardó 61s.
      6. México D31 S3523 C1 urbana el 2012-07-02 a las 08:59:00.0, tardó 63s.
      7. Mich. D6 S551 B no-urbana el 2012-07-01 a las 22:25:00 tardó 63s.
      8. Tamaulipas D3 S995 C5 no-urbana el 2012-07-02 a las 09:15:00.0 tardó 66s.
      9. DF D2 S1060 B urbana el 2012-07-01 a las 22:19:00 tardó 67s.
      10. Guerrero D9 S162 C1 urbana el 2012-07-02 a las 07:43:00.0 tardó 67s.
    8. Esto muestra que se tenía la capacidad de capturar un acta en tiempos tan bajos como un minuto, aún en zonas no urbanas.
    9. FALTA: ¿Cómo se ven los resultados de estas actas?
    10. Por otro lado, el tiempo más largo entre acopio y registro ¡fue de 21 horas con 21 minutos!
    11. Las diez casillas más lentas en registrarse fueron
      1. Tamaulipas D1 S902 C1 urbana el 2012-07-01 a las 22:20:00.0, tardó 21.33 horas
      2. Guerrero D1 S1085 B no-urbana, el 2012-07-01 a las 21:27:00, tardó 21.29hrs.
      3. Michoacán D5 S2447 B urbana, el 2012-07-01 a las 21:45:00.0, tardó 21.09hrs.
      4. Veracruz D12 S4799 B urbana el 2012-07-01 a las 21:58:00 tardó 21.07hrs.
      5. DF D22 S2701 C1 urbana el 2012-07-01 a las 22:25:00 tardó 21.01hrs.
      6. Querétaro D2 S571 C2 urbana el 2012-07-01 a las 22:39:00.0 tardó 21.01hrs
      7. Quintana Roo D3 S25 C1 urbana el 2012-07-01 a las 21:48:00 tardó 20.94hrs.
      8. Jalisco D8 S577 C1 urbana el 2012-07-01 a las 21:51:00.0 tardó 20.80hrs.
      9. Jalisco D10 S3137 B1 urbana el 2012-07-01 a las 22:46:00.0 tardó 20.76hrs.
      10. Veracruz D10 S1873 1B urbana el 2012-07-01 a las 22:51:00 tardó 20.69hrs.
      11. FALTA: ¿Cómo se ven éstas actas?
    12. ¿Qué ṕuede explicar estos retrasos?
    13. El retraso promedio entre acopio y registro fue de una hora con nueve minutos.
    14. Hubo 46,838 actas que tardaron más de una hora en fila antes de ser capturadas,
    15. 25623 tardaron más de dos horas,
    16. 13,860 tardaron más de tres horas y
    17. 7,422 tardaron más de cuatro horas.
    18. FALTA: ¿Cómo varía el resultado de la elección como función de este retraso?
  13. El proceso de captura puede ser lento pues es llevado a cabo por humanos y debe repetirse y verificarse. Por ello, es razonable que haya algunos retrasos, sobre todo durante la noche de la elección cuando el flujo de actas hacia los centros distritales es máximo. Esto produce que las actas deban formarse en fila antes de ser capturadas.
  14. Sin embargo, una vez capturados los datos, éstos quedan dentro del sistema de cómputo y pueden transmitirse prácticamente instanténeamente a las computadoras centrales donde es registrada. El retraso entre captura y registro debería ser mínimo.
  15. La siguiente figura compara la hora de captura de los datos en los centros distritales y el correspondiente tiempo de registro de los mismos en las computadoras centrales. ./archivos/registroVsCaptura.jpg
    1. La forma de leer esta gráfica es análoga a la anterior; cada acta correponde a un punto, el eje horizontal corresponde a la hora de registro, medida en horas a partir de las 0:00 del 1o de julio, y el eje vertical corresponde al retraso entre captura y registro.
    2. La figura muestra que efectivamente, para casi todas las actas, el retraso es despreciable.
    3. El retraso mínimo fue de 2.36 segundos y
    4. 142,228 actas fueron registradas en menos de diez segundos despúes de haber sido capturadas.
    5. Sin embargo, 1,431 tardaron más de un minuto, 561 más de una hora, 393 más de dos horas, 122 más de tres horas,
    6. y hubo una decena de actas que tardaron más de 6 horas.
    7. La que más tardó, pasó siete horas en el sistema.
    8. ¿Por qué estos retrasos?
    9. ¿Qué les pudo pasar a los datos durante el tiempo que transcurrió entre la captura en las computadoras de los centros distritales y su registro en las computadoras centrales?
    10. Esta gráfica muestra claramente las fallas a las 14:00 y a las 16:00 horas del lunes 2012-07-02.
    11. Terminando la interrupción de las 16:00-18:30 empezaron a llegar la información que estaba en cola. Sin embargo, los retrasos fueron no de dos y media horas, sino hasta de 7 horas.
    12. FALTA: ¿Averiguar sobre estas actas?

1.4 Problemas con actas.

  1. Existen 2,109 actas donde algún campo fue ilegible
    1. 424 PAN
    2. 442 PRI
    3. 441 PRD
    4. 410 PVEM
    5. 381 PT
    6. 388 MC
    7. 347 PANAL
    8. 475 C-PRI-PVEM
    9. 464 C-PRD-PT-MC
    10. 434 C-PRD-PT
    11. 537 C-PRD-MC
    12. 560 C-PT-MC
    13. 807 NO-REGISTRADOS
    14. 480 NULOS

    La suma de los números previos es mayor a 2109 pues en algunas actas varios campos son ilegibles.

  2. Existen 195 registros donde todos los campos correspondientes a algún partido están marcados como ilegibles.
  3. Existen 3,157 registros donde los campos correspondientes a algún partido quedaron vacíos. De hecho, en estos, los campos correspondientes a todos los partidos quedaron vacíos. Estos tienen cero votos.
    1. 1668 son básicas,
    2. 1287 contíguas,
    3. 180 extraordinarias y
    4. 22 especiales.
  4. Hay 17,140 registros donde se anotó la leyenda 'Sin dato' a alguno de los partidos.
    1. 220 corresponden al PAN,
    2. 354 al PRI,
    3. 624 al PRD,
    4. 3162 al PVEM,
    5. 3023 al PT,
    6. 3598 al MC,
    7. 1139 al PANAL,
    8. 2964 a la coalición CPRIPVEM,
    9. 3341 a CPRDPTMC,
    10. 5620 a CPRDPT,
    11. 8065 a CPRDMC,
    12. 9755 a CPTMC,
    13. 15529 a NOREGISTRADOS,
    14. 1669 a NULOS.
  5. Hay 15,463 registros donde algún partido tiene un campo en blanco o el campo se registró como 'ilegible' o como 'sin dato'. En algunos registros hubo datos de varios partidos faltantes. Estos registros se distribuyeron como
    1. pan-3801
    2. pri-3953
    3. pvem-6729
    4. cpripvem-6596
    5. prd-4222
    6. pt-6561
    7. mc-7143
    8. cprdptmc-6962
    9. cprdpt-9211
    10. cprdmc-11759
    11. cPTMC-13472
    12. panal-4643
    13. nulos-5306
    14. noregistrados-19493

    y agrupándolos por candidato

    1. JVM-3801
    2. EPN-7801
    3. AMLO-14943
    4. GQ-4643

    Note que los resultados son menores que la simple suma, debido a los translapes. Quienes iban en coalición tuvieron más errores de este tipo y AMLO tuvo poco menos del doble que EPN. Esto podría deberse a que había más cuadros en cada acta correspondientes a las coaliciones, aumentando la probabilidad de cometer errores.

  6. Hay 1761 casillas en las que el total de votos supera en más de 14 a la lista nominal (14 corresponde a dos boletas por partido para los posibles representantes que se presentasen).
    1. Estas casillas recibieron 1,002,030 votos.
    2. Sin embargo, este número puede ser engañoso, pues muchas de estas casillas tienen lista nominal nula, como se discute en [[base][esta sección].
    3. Existen 1,478 casillas donde la lista nominal es nula.
    4. De aquellas casillas con lista nominal no nula, hay 327 donde el número de votos excede a la lista nominal más catorce.
    5. El número de votos totales en dichas casillas es 230,796.
    6. El exceso de votos en dichas casillas es al menos 56,840.
    7. El número máximo de votos en cualquier casilla es 750+14.
    8. El número de casillas donde la lista nominal es nula y en las cuales los votos exceden este tope es de 10.
    9. El voto total en estas casillas es 8,597.
    10. El exceso de votos en dichas casillas es de 957.
    11. En algunas casillas, un solo candidato obtuvo más votos que la lista nominal.
      1. En 21 casillas EPN rebasó la lista nominal+14 por un total de 1759 votos,
      2. en 19 casillas AMLO rebasó por 4681 y
      3. en 3 casillas JVM rebasó por 474.
  7. El exceso de votos sobre la lista nominal o sobre los máximos permitidos no parece ser un problema grave. Más grave podría ser la ausencia de un valor para la lista nominal en casillas que no son especiales.
  8. El número de votos que recibieron estas casillas fue
    1. 25269 en 84 casillas básicas,
    2. 91560 en 269 casillas contiguas y
    3. 60637 en 175 casillas extraordinarias,
    4. además de 593769 en 950 casillas especiales.
  9. El total de votos en estas casillas fue de 177856+593769=771625.

1.5 Dependencia temporal

  1. La siguiente figura muestra los resultados de la elección como función del número total de actas procesadas. ./archivos/resultadosVsActas.jpg
    1. Los resultados iniciales difirieron notablemente de los posteriores.
      1. En las primeras 10 actas EPN ganaba con 60% vs. AMLO con 24% y JVM con %20.
      2. En las primeras 100 iban EPN 38% vs JVM 32% vs AMLO 26% en tercer lugar.
      3. En las primeras 1,000 iban EPN 37% vs. JVM y AMLO empatados con 29%.
      4. En las primeras 10,000 ya se había establecido la tendencia global, EPN 36% en primer lugar, AMLO 32% en segundo y JVM 27% en tercero.
      5. El porcentaje correspondiente a la suma de los votos por GQ sumados a los de candidatos no registrados y de votos anulados se estabiliza rápidamente alrededor de su resultado final, cercano a 5%.
      6. Por otro lado los porcentajes correspondientes a EPN, AMLO y JVM ¡nunca se estabilizan!.
      7. En la parte inicial los cambios descendentes de JVM se complementan con los cambios ascendentes de AMLO.
      8. En la parte final, los cambios ascendentes de EPN se compensan con los cambios descendentes de AMLO.

2 Algunos datos de los Cómputos Distritales

2.1 Sobre la base de datos

Los datos que siguen fueron tomados de la tabla casillaspresidente. Estoy apenas ( 2012-07-12 Thu) en proceso de entenderla.

  1. La base de datos tiene 132,437 registros.
  2. 143,292 casillas aparecen una sola vez en la tabla pero
  3. 71 casillas que aparecen repetidas.
    1. 68 aparecen dos veces y
    2. 3 aparecen tres veces.
    3. Éstas tienen tipo de casilla=M, que no está definido en la documentación que viene con la base de datos.
    4. Éstas difieren entre sí en el campo DDISTRITO.
  4. El total de votos para presidente es 52,032,103, para senadores 50,918,661 y para diputados 50,463,416.
    1. La diferencia entre votación para presidente y senadores es 1,113,442 y la diferencia entre presidente y diputados es 1,568,687.
    2. Calculando estas diferencias para las casillas especiales únicamente, obtengo 1,109,164 y 1,574,928 para votaciones de presidente sobre senadores y sobre diputados.
    3. Restando, obtengo una discrepancia de sólo 4,278 votos entre presidente y senadores y -6,241 entre presidente y diputados en casillas no especiales.
    4. Sin embargo, si tomo el valor absoluto de las discrepancias antes de hacer la cuenta obtengo una discrepancia de 1,552,408 entre votos para presidente y para senadores y 1,978,811 entre presidente y diputados.
    5. Haciendo la misma cuenta sólo para casillas especiales obtengo 1,113,324 votos entre presidente y senadores y 1,574,928 entre presidente y diputados.
    6. Eso deja diferencias de 439,084 y 403,883 respectivamente en las casillas no especiales.
  5. Es natural que en la elección presidencial haya más votos para presidente que para senadores y diputados pues aquellos viajeros lejos de su hogar pueden votar por presidente pero no por diputados ni senadores. Sin embargo, ¡la suma de las discrepancia entre el número total de votos por presidente y por diputados o senadores es de alrededor de 400,000! ¿Cuál es el origen de esta discrepancia? Podría deberse a haber añadido y/o substraido boletas de manera ilegal.

2.2 Sobre los resultados

  1. Los resultados (si interpreto bien la base de datos) son


    VotosPorcentaje
    EPN19226784.38.21%
    AMLO15896999.31.59%
    JVM12786647.25.41%
    GQ1150662.2.29%
    Nulos1241154.2.47%
    No Reg20907.0.04%
    Total50323153.100.01%
  2. La siguiente figura muestra la distribución del número total de votos sobre todas las casillas.

    ./archivos/histogramaVotoTotal.jpg

    1. Para suavizar la figura, se agruparon las casillas de 10 en 10.
    2. La distribución es bastante extraña, a pesar de que los resultados se suavizaron promediándolos sobre grupos consecutivos de diez casillas.
    3. El pequeño pico alrededor de 750 votos corresponde a las casillas especiales, donde la participación fue muy grande.
  3. La forma extraña de esta curva ha de deberse a la extraña distribución de casillas sobre las listas nominales, como muestra la siguiente figura.

    ./archivos/histogramaListaNominal.jpg

    1. Cada punto verde sobre la figura muestra el número total de casillas que hay con cierto valor de la lista nominal.
    2. La curva roja corresponde a los mismos datos promediados sobre grupos de diez para suavizar un poco la figura.
    3. Hay 902 casillas con lista nominal igual a cero. Estas corresponden a las casillas especiales. En la figura no se ve el punto correspondiente por estar fuera de la escala.
    4. Así mismo, ¡hay 19 casillas con lista nominal de más de 750 electores! violando así el código electoral.
    5. De éstas, 15 son básicas y 4 son contíguas.
    6. La casilla con mayor lista nominal ¡tiene 1687 electores!
    7. La figura muestra unos brincos curiosos cerca de los 375 electores y 500 electores. Esos han de ser debidos a los criterios que emplea el IFE para dividir casillas cuando crecen demasiado, dando lugar a nuevas casillas pequeñas.
  4. La siguiente figura muestra los resultados de la votación como función del exceso X de votos para presidente comprarados con los votos para diputados. Para cada X, se grafican los resultados sobre aquellas actas donde la diferencia de votos es mayor que X.

    ./archivos/resVsExceso.jpg

    1. Es curioso que para X negativo el resultado casi no depende de X, pero para X positivo hay un fuerte aumento en el número de votos que obtiene AMLO, quien rápidamente alcanza y supera a EPN, cuyo porcentaje en la votación disminuye.
    2. Sin embargo, no debemos saltar a conclusiones, pues la gráfica anterior incluye resultados de las casillas especiales que dominan la votación cada vez más, mientras X aumenta. En las casillas especiales, AMLO obtuvo significativamente más votos que EPN.
    3. Elminando las casillas especiales, todas las curvas se aplanan y queda EPN arriba de AMLO arriba de JVM.
  5. La siguiente figura muestra los histogramas de número de casillas vs número de votos recibidos.

    ./archivos/histCasillasVsVotosPartido.jpg

    1. La distribución correspondiente a EPN es más angosta y recorrida hacia la izquierda que las otras dos.
    2. La de AMLO es más ancha y baja que la de JVM.
    3. El número de casillas donde JVM y AMLO obtienen un número de votos cercano a cero es mucho mayor que el correspondiente a EPN.
    4. El número máximo de votos obtenido en una sola casilla por algún candidato es 716 para EPN, 638 para AMLO y 717 para JVM, fuera del rango en que hice la gráfica.
  6. Es interesante desglozar la figura anterior en términos de sus contribuciones urbanas y no urbanas.
  7. En la siguiente figura se muestran los histogramas tomados únicamente sobre las casillas no urbanas.

    ./archivos/histCasillasVsVotosPartidoNoUrb.jpg

    1. Es notable que la distribución de AMLO y de JVM se vuelven casi idénticas, a diferencia de su distribución global.
      1. Ambas tienen un gran número de casillas donde obtuvieron cero votos, del orden de 150.
      2. El máximo de su distribución corresponde a casillas donde obtuvieron del orden de 10 votos.
    2. La distribución de EPN se vuelve mucho más ancha y recorrida a la derecha, con un máximo alrededor de 350 casillas donde obtuvo alrededor de 135 votos por casilla.
    3. La forma de la distribución de EPN es muy distinta a la de los otros candidatos.
  8. Para completar la imagen, la siguiente figura muestra los histogramas correspondiente a las casillas urbanas.

    ./archivos/histCasillasVsVotosPartidoUrb.jpg

    1. Notamos que en este caso, a diferencia del caso rural, ningún partido obtiene cero votos en un número importante de casillas.
    2. En este caso, la forma de las tres distribuciones se parece entre sí cualitativamente y sólo hay cambios cuantitativos.
  9. Una primera forma cruda para caracterizar las distribuciones es a partir de sus promedios, que son simplemente los resultados de las elecciones discutidos arriba.
  10. Una segunda forma es a través de su ancho, medido a través de la desviación estandard. Obtenemos

    Desviación EstandardEPNAMLOJVM
    Total51.5666.6355.35
    Urbana42.7363.3653.94
    No Urbana63.7965.4356.52
    1. Notamos que los anchos de las distribuciones de AMLO son mayores que las de JVM en aproximadamente 10 votos.
    2. Por otro lado, los anchos de la distribución global de EPN es la más pequeña de las tres en la distribución global.
    3. En el caso urbano, el ancho es todavía menor y disminuye en 9 votos sobre el resultado global, mientras que
    4. el ancho sobre las casillas no urbanas aumenta en alrededor de 12 votos sobre el global.
    5. La diferencia en el ancho de la distribución de EPN entre el caso urbano y el no urbano ¡es de más de veinte votos! ¡El ancho aumenta en casi cincuenta porciento entre el caso urbano y el no urbano! ¿Por qué?
  11. Los anchos de éstas distribuciones podrían estimarse de la siguiente manera.
    1. El número promedio de votantes por casilla fue de Vt=351.
    2. Si en una casilla votaran Vt ciudadanos elegidos al azar de entre toda la población (lo cual no es el caso), podríamos esperar que la probabilidad de obtener uno u otro resultado estuviera regida por la distribución binomial.
    3. De acuerdo a la distribución binomial, la desviación estandard esperada para cada contendiente podría estimarse como sqrt(p (1-p) Vt) donde p es la fracción total de votos obtenidos.
    4. Con este criterio obtenemos

      ContendientePorcentajeDesviación Teórica
      EPN38.219.1
      AMLO31.598.71
      JVM25.418.15
    5. Estos resultados teóricos difieren mucho de los resultados obtenidos arriba.
  12. Una posible explicación para la diferencia sería que los ciudadanos no son la unidad de voto pues quienes votan en una casilla podrían ser familiares o amigos y por tanto tener opiniones y preferencias comunes. Suponiendo que los votantes llegan en grupos de tamaño T, el número de grupos que llega a una casilla sería Vt/T y la desviación esperada para el número de grupos sería sqrt(p q Vt/T). Por tanto, la desviación esperada para el número de votantes sería sqrt(p q T Vt). Usando los datos de porcentaje de votación y las desviaciónes obtenidas, podemos estimar el tamaño de los grupos que votan como unidad por uno u otro partido.

    ContendientePorcentajeDesviaciónTamaño de grupo
    EPN38.2151.5632.1
    AMLO31.5966.6358.5
    JVM25.4155.3546.05
  13. La siguiente tabla trae información similar pero separada por estado.

    EstadoVoto
    T. Grupo
    T. Grupo
    T. Grupo

    Total% EPNEPN% AMLOAMLO% JVMJVM
    135438.615.620.8019.730.928.2
    230937.014.531.219.727.219.5
    330341.331.325.027.2029.722.3
    437039.328.827.029.428.423.6
    534639.420.919.822.636.434.2
    635240.719.122.423.833.320.8
    736945.956.231.250.616.033.9
    826746.534.122.624.524.732.2
    939026.08.452.929.017.428.7
    1028646.837.020.732.728.332.4
    1134340.325.512.923.041.031.2
    1229437.638.846.854.910.927.1
    1335842.227.133.738.217.622.7
    1438440.020.722.623.432.229.7
    1539743.225.834.126.018.228.5
    1629143.128.331.432.920.527.8
    1738034.615.142.421.818.415.6
    1830847.131.631.039.317.621.2
    1935433.219.822.015.839.852.2
    2032734.638.243.458.218.132.9
    2136834.425.434.637.625.829.5
    2239138.632.522.526.233.737.1
    2332233.334.442.023.320.736.3
    2433538.329.423.632.031.029.7
    2525946.741.123.635.525.129.9
    2633439.722.524.631.231.624.1
    2740931.819.159.353.46.019.8
    2833134.418.119.621.441.730.0
    2936935.416.240.433.118.913.5
    3036133.627.329.046.533.638.0
    3143841.828.216.930.137.529.1
    3226351.257.124.539.418.530.0
    1. Los estados están numerados en orden alfabético: 1. Aguascalientes, 2.Baja California, 3.Baja California Sur, 4.Campeche, 5.Coahuila, 6.Colima, 7.Chiapas, 8.Chihuahua, 9.Distrito Federal, 10.Durango, 11.Guanajuato, 12.Guerrero, 13.Hidalgo, 14.Jalisco, 15.México, 16.Michoacán, 17.Morelos, 18.Nayarit, 19.Nuevo León, 20.Oaxaca, 21.Puebla, 22.Querétaro, 23.Quintana Roo, 24.San Luis Potosí, 25.Sinaloa, 26.Sonora, 27.Tabasco, 28.Tamaulipas, 29.Tlaxcala, 30.Veracruz, 31.Yucatán, 32.Zacatecas
    2. Los agregados más chicos son de tamaño 8.4 para EPN en el Distrito Federal (9), 15.8 para AMLO en Nuevo León (19) y 13.5 para JVM en Tlaxcala (29).
    3. Los agregados más grandes son de tamaño 57.1 para EPN en Zacatecas (32) donde arrasa con 51.2% del voto, 58.3 para AMLO en Oaxaca (20) donde gana con una votación de 43.4% y 52.2 para JVM en Nuevo León (19) donde gana con 39.8%. Curiosamente, AMLO saca más votos aún en el DF con agregados de tamaño 29.0 y JVM tiene más votos en Tamaulipas con agregados de tamaño 30.0.
    4. No me es clara la enorme variación en los tamaños de los agregados ni su correlación con los resultados electorales. Quizás esto sea material para algún sociólogo (o sea irrelevante).
  14. Una alternativa para caracterizar distribuciones no gaussianas como las mostradas arriba es la entropía (sugerencia de Adrián Carbajal @adrian_carbajal). Una forma de definirla es calcular para cada posible número de votos i la fracción pi de casillas que obtuvieron i votos y sumar S=-sum(pi log(pi)). Si usamos el logaritmo en base dos, obtendremos el número de bits de información. Mis resultados son

    EntropíaEPNAMLOJVM
    Total7.687.987.68
    Urbanas7.417.927.61
    No Urbanas7.997.807.64
    1. No parece que las variaciones sean muy grandes y no sé interpretar estos resultados, más que como el mínimo número de bits necesarios para codificar sin redundancia el resultado de cada casilla.

3 Contribuciones

He recibido mensajes con información y análisis de la elección que no he tenido tiempo de leer/analizar/valorar. He montado dichos mensajes en ésta página. Aunque debe ser obvio, debo afirmar que no puedo garantizar su veracidad ni que sus análisis sean correctos (ni que no lo sean).

He recibido otras contribuciones que indico a continuación.

  1. Alejandro Marín @aleum1 estudió el comportamiento del número de votantes urbanos y rurales según INEGI. 'En resumen en el 2010, la población de 18 años y mas (con derecho a votar) tiene un comportamiento de 77 % urbano y 23 % rural, mientras que en el 2006 la población de 18 y más 78 % urbano y 22 % rural. Es evidente no hay un movimiento brusco y se mantiene la estructura en el 2006 y 2010.'
    1. Este análisis alimenta la duda, ahora más informada, sobre el aumento en la listanominal no urbana.
  2. Luis Arean @larean escribió una réplica a algunas críticas recientes del PREP.
  3. Jorge López escribió una contra-réplica.
  4. Jorge López ha desarrollado página en la que ha montado artículos de varios autores sobre temas electorales.
  5. Adrian Carbajal ‏@adriancarbajal mandó unos histogramas de número de votos por partido que muestra que el número de casillas con cero votos es mayor para AMLO.
  6. Jesús Ibarra hizo unos cálculos comparando casilla a casilla las votaciones totales por presidente, diputados y senadores. Uno esperaría que coincidieran entre sí y con el número total de votantes.

Date: 2012-07-13 22:00:11 CDT

Author: Luis Mochan

Org version 7.8.09 with Emacs version 23