Solución D33 – Cómo eliminar el sesgo de una tabla


Acceder desde AQUÍ.

Llamamos serie resultado a la serie de bits que se pide construir en el desafío. Una solución sencilla es la siguiente:

1) Tomamos la primera pareja de la serie de bits generada con la taba.

1.a – Si la pareja es repetitiva (es decir o bien 00 o bien 11) la desechamos.

1.b – En otro caso (es decir o bien 01 o bien 10) nos quedamos con el primer bit de la pareja, que será el primer bit de la serie resultado.

2) Repetimos el primer paso con la siguiente pareja de la serie de bits de la taba. Si no es repetitiva, el bit que extraemos de esta pareja se añade al final de lo que llevamos de la serie resultado. Y así sucesivamente hasta agotar la serie de bits de la taba.

Para demostrar la validez de esta solución vamos a usar la letra p refiriéndonos a la probabilidad de que, tras lanzar la taba, queden hacia arriba las partes hundidas del hueso, lo que corresponde a un 1. En consecuencia la probabilidad del 0 es 1-p. Calculamos la probabilidad de que, en la serie de la taba, salga una pareja no repetitiva. Como cada lanzamiento es independiente del anterior multiplicamos las probabilidades individuales:

Probabilidad del suceso 01 = (1-p) × p

Probabilidad del suceso 10 = p × (1-p)

Sabemos que el orden los factores no altera el producto y entonces notamos que ambos sucesos 01 y 10 tienen la misma probabilidad de ocurrir dentro de la serie de la taba. Por este motivo la serie obtenida siguiendo este método no tiene sesgo. Además conserva la propiedad de ser aleatoria que le viene de que también es aleatoria la serie original de la taba. No sabemos cuál es el valor concreto de p, sin embargo ¡no hace falta saberlo! Si usamos una taba distinta tendrá posiblemente otra carga y en consecuencia otro valor para p, sin embargo esto no impide que la solución siga funcionando.

Solución de José Luis Miota: 33 Azarosa taba.Maito

33 comentarios

Archivado bajo OTROS

33 Respuestas a “Solución D33 – Cómo eliminar el sesgo de una tabla

  1. SOLUCIÓN DE PEDRO CORREA:

    “Sea x_1,…x_n la sucesión de bits obtenida de la taba. Sea p (que es desconocido) la probabilidad de que la taba dé valor 1.

    Generaremos una sucesión (y_k).
    Si x_1=1, x_2=0 -> y_1 será 1.
    Si x_1=0, x_2=1 -> y_1 será 0.
    Si x_1=x_2 -> no damos valor a y_1 (o le damos valor nulo).

    Si x_3=1, x_4=0 -> y_2 será 1.
    Si x_3=0, x_4=1 -> y_2 será 0.
    Si x_3=x_4 -> no damos valor a y_2 (o le damos valor nulo).

    en general, haremos lo siguiente

    Si x_(2k-1)=1, x_(2k)=0 -> y_k será 1.
    Si x_(2k-1)=0, x_(2k)=1 -> y_k será 0.
    Si x_(2k-1)=x_(2k) -> no damos valor a y_k (o le damos valor nulo).

    Si n es impar, el último bit lo desechamos.

    Notar que la P(y_j=1)=p(y_j=0)=p(1-p)
    además P(y_j=nulo)=p^2 + (1-p)^2

    Por tanto P(y_i=1|y_i no nulo)=p(y_i=0|y_i no nulo)=1/2. De esta manera, si consideramos la sucesión z_j que resulta de tomar las y_k y quitar los nulos, tendremos que en todo caso P(z_j=1)=P(z_j=0)=1/2, por lo que sería no sesgada, al no poderse diferenciar de una moneda no trucada. Es importante reseñar, además, que cada bit es independiente del resto, al haber sido calculado con observaciones distintas de la tabla.

    Esa sucesión (z_j) es la solución que se nos pide. Será nula siempre que los elementos de la serie inicial no sean iguales por parejas.

    Lo siguiente sería una mejora o alargamiento de la serie que aunque quizá excede el propósito del desafío, me apetece comentar:

    Así, podríamos mejorar la serie comentada anteriormente, por ejemplo, de la siguiente manera. Tomemos únicamente los x tales que los y correspondientes han dado como resultado nulo. Obtenemos una sucesión con unos y ceros 2 a 2 emparejados. Así, los dos primeros serían iguales, los dos siguientes también (aunque no tienen por qué ser iguales a los primeros), los dos siguientes también… y así para todos. Si nos quedamos con un único representante de cada pareja, tendríamos una sucesión, mucho más corta que la inicial en la que la probabilidad de que cada bit fuera 1, sería también p. A esa sucesión le podríamos aplicar el algoritmo definido arriba y añadiríamos nuevos elementos a la sucesión de z’s. Este proceso podríamos hacerlo tantas veces como fuera necesario hasta que se acabaran los bits. Notar que en cada paso de este proceso, como mínimo dividimos entre 2 el número total de elementos de la sucesión (al quedarnos con un representante de cada pareja). Así que en un número finito h de pasos (con h menor a la potencia de dos mayor que n, pero más próxima a n), concluiríamos con el algoritmo.

    Se debe notar que de esta manera, la única posibilidad de que la serie final fuera nula sería que fueran todos los elementos iguales (salvo, quizá, los que se desecharan en cada paso).

    Voy a acabar con un ejemplo para ilustrar todo esto:

    Sea la serie inicial de (x_k): 11 10 10 11 00 01 10 01 01 11 01 00 10 01 11 01 01 10 10 11 11 00 11 0
    Tendríamos (y_k): . 1 1 . . 0 1 0 0 . 0 . 1 0 . 0 0 1 1 . . . . y el último 0 lo quito (los . representan nulos)
    Quito los nulos, me queda 1101000100011
    Las x correspondientes a los nulos son: 11 11 00 11 00 11 11 11 00 11
    Eligiendo uno de cada pareja: 11 01 01 11 01
    Sigo -> . 0 0 . 0
    Quito nulos y añado a la serie insesgada: 1101000100011-000
    Las x correspondientes a los nulos son 11 11
    Elijo uno de cada pareja: 11
    Sigo -> .
    Quito el nulo… y no tengo nada que añadir a la serie insesgada 1101000100011-000
    Las x correspondientes a los nulos son 11
    Elijo uno de cada pareja: 1, que como está desparejado, lo elimino y ya he terminado

    La serie insesgada es 1101000100011000”

  2. mariaylaura@hotmail.com

    ¿Esto se estudia en ESO?

    Yo me quedé en BUP hace treinta años…

  3. jabon

    Enhorabuena Pedro, he visto que eres uno de los nominados en la solución.
    Mi respuesta se asemeja a la de Maito, usando porcentajes; sólo que el sistema de eliminación lo he versado en lo que serían unas apuestas (por el tema de la introducción de Colmenar), me salía un 3,02 a 1, con lo que respetaba todos los ceros y solo los unos que ocupaban el lugar múltiplo de tres, de ese modo eliminaba 2/3 partes de unos . Al parecer no se ha dado por buena, y lo entiendo porque frecuencia y probabilidad no es lo mismo; aunque sé que a los vecinos de Colmenar les interesa más saber la probabilidad que obviarla, y la única técnica que conocen para estimarla es la de ir tirando la taba y anotar los resultados, para luego sacar los porcentajes.

    • Pedro Correa

      Al principio, también tiré por algo similar a lo que comentas. Pero con eso sólo llegaba a que para cualquier épsilon era capaz de encontrar una serie basada en la original con un sesgo menor que épsilon… lo cuál, en realidad, se acerca bastante a lo que se pide…

    • Maito

      La respuesta es incorrecta, porque entre otras cosas hace que se concentren los unos, es decir, al eliminar ceros proporcionalmente, algunos unos se van juntando, con lo que hay sesgo. Pero esto lo ví en el apagón digital por puente.

      • jabon

        Voy a poner un ejemplo que aclara mucho las cosas,
        imaginemos la serie (puede hacerse infinitamente más larga pero la dejamos en):

        01 01 11 11 11 11 01 11 01 11 (compuesta por 4 ceros y 16 unos)
        Apliquemos el razonamiento matemático y se obtiene la serie sin sesgo:

        0000

        Apliquemos otro criterio, aparentemente es cuatro veces más frecuente el uno que el cero ( así que damos el valor de 1/4 al primer uno, 2/4 al segundo, etc, y sólo contabilizamos los que den resultado entero, los ceros se mantienen) y se obtiene:

        00110101

        Ahora nos vamos a Colmenar Viejo y les explicamos la cuestión. Es “probable” que alguien salga del pueblo a tabazos. ¿Quién será….?

        P.D. Que nadie malinterprete, es un simple ejemplo…

        • Prodem

          jabón, ¿quieres decir que sería “raro” que si lanzas una moneda al aire 4 veces te salgan 4 caras? No es lo más frecuente, pero pasa (en media) 1 de cada 16 veces. También es un simple ejemplo :-)

          En mi humilde opinión, la probabilidad es, con mucho, el campo más paradójico de las matemáticas. Quizás eso explique por qué no se axiomatizó completamente hasta 193, aproximadamente 2200 años después que la geometría euclidea (otro simple ejemplo).

          • jabon

            No, Prodem, no van por ahí los tiros.
            Te planteo el escenario. Sitúate en el lugar, toma los datos, y luego sacas las series no sesgadas (ya pongo que podía haberlo hecho infinitamente más larga con igual resultado).
            Si haces la comparación sería muy difícil que a un ciudadano medio le hagas comprender que la que es perfecta es la primera.
            Sé reconocer que frecuencia y probabilidad no es lo mismo, y que se aproxima mucho cuanto mayor es el número de dígitos.
            Que nadie me entienda mal, que no critico para nada que mi respuesta se de por mala. Participo por aprender y divertirme.
            He querido poner un ejemplo con mala intención, pero no creas que es tan difícil encontrar muchos similares.
            Vengo a decir que considero más justo (no más matemático por supuesto), mi propuesta. Evidentemente, en tiradas cortas se comete más error. Las casas de apuestas no creo que tengan en cuenta la primera opción.

  4. rogelio

    Como diria Penelope: Peeedrooo!!!

  5. Josep

    Una variante a la solución indicada por EPS sería considerando las parejas de bits donde el primer bit sería el de la secuencia orginal y el segundo el resultado de un nuevo lanzamiento de la taba. El enunciado no deja muy claro que no pueda usarse este procedimiento y no se si la habrán considerado como válida. Enhorabuena a Pedro. Creo que ya se va a cercando el premio a algún participanrte de este blog.

  6. Pedro Correa

    Gracias a todos. Lo de la reseña, en realidad es una chorradilla, pero hace ilusión.

  7. Divagante

    Mi respuesta, que no se si es valida o no (y los matemáticos me dirán que opinan) fue
    Si vamos avanzando por la serie de unos y ceros, cada vez que encontremos 2 numeros iguales cambiamos el valor del segundo. La nueva serie entiendo que no tiene sesgo y sigue siendo aleatoria.

    P. ejemplo
    Dada la serie 1 0 0 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0 0 1 0
    obtendriamos 1 0 1 0 1 0 1 0 1 1 0 0 1 1 0 1 0 1 0 1 0

  8. Pedro Correa

    De todas formas, creo que este es el desafío peor explicado de los 33 que ha habido hasta ahora. Para mí, las soluciones basadas en frecuencias que eliminan ceros o unos de manera sistemática tal y como proponían Maito y Jabon deberían haber entrado, al menos en el sorteo. El “error” que cometen es el de suponer que la probabilidad de que haya unos coincide con el número de unos/ el número de tiradas. Lo cuál no puede asegurarse sólo con un número finito de tiradas de tabas, pero se aproxima mucho a medida que el número de tiradas aumenta.

  9. Prodem

    Como por algún motivo no puedo “recomentar” a Jabon, lo pongo aquí.

    Entendido, gracias. Nos reafirmamos entonces en lo paradójica que resulta a veces la probabilidad.

  10. jabon

    Me imagino que habrá un límite de respuestas por comentario y no habrás podido por eso.
    Muchas gracias Prodem, vuestra respuesta es la correcta, simplemente me dedicaba a comentar curiosidades, por animar el tema.
    Vosotros sabéis muchas más matemáticas que yo, y tengo que aprender de lo que comentáis.
    Y también gracias a Pedro por su benevolencia, es verdad que muy mal no íbamos encaminados, pero las cosas son como son.

  11. rogelio

    Se acabaron los deafios??!?!?

  12. jabon

    Rogelio, he visto que en el país el organizador comenta que han tenido un problema con los vídeos, pero en cuanto lo resuelvan (el desafío no, me refiero al percance) lo colgarán (el vídeo, no al organizador).

  13. Uno de los organizadores....

    A mí de momento no me han colgado, y al organizador de El País parece que tampoco porque ha conseguido resolver los problemas técnicos

    http://www.elpais.com/videos/sociedad/gusanitos/golondrina/voraz/elpepusoc/20111104elpepusoc_1/Ves/

  14. jabon

    Muchas gracias, y enhorabuena por vuestro trabajo.
    Ya veis que vuestros problemas nos tienen enganchados.
    Ya no va a hacer falta ninguna cuerda, al menos para colgar a nadie.
    Para mariaylaura, este no recuerdo haberlo estudiado en el B.U.P., y no se lo he visto ni a mi hijo de la ESO, ni a la chica que va a bachiller, pero te aseguro que se puede sacar.

    • Pedro Correa

      Pues a mí, el de la golondrina y los gusanos me parece dificilillo sin meterse en Análisis Matemático de nivel de Universidad… aunque si vas por donde yo creo, igual estamos yendo por el mismo sitio…

      • Anónimo

        Pedro, tu comentario me asusta.
        He descartado una posible vía por una cuestión de lógica.
        A partir de ahí, sólo he encontrado otra posibilidad.
        ¿Necesito analizar más?

      • Pedro Correa

        Pues estaba equivocado, ya que ese camino que pensaba era una vía muerta.

        Y cuando ya me veía haciendo integrales para calcular distancias en el espacio, ha aparecido una forma sencilla e intuitiva de llegar a la solución.

        Sin embargo, si el gusano “listo” fuera yo, seguro que habría llegado el último a casa, porque he tardado mucho más que 3 minutos (y que 60 minutos) en que se aparezca la musa.

        Y con esto no quiero decir que el que gana sea uno u otro, ¿eh?

  15. Anónimo

    Pedro, como siempre me asustas.
    A mi me pareció (digo pareció, porque ya no estoy seguro), encontrar la respuesta muy rapidamente, como si fuese un acto reflejo.
    Seguro que tendré que repasar.

    Me sale, no digo a favor de quien, una diferencia de “x” minutos y de “y” segundos que casi prefiero no nombrar.

  16. jabon

    No sé que ha pasado con otro mensaje que he mandado. seguro que luego se duplica.
    Pedro, me asustas.
    Me pareció verlo directamente, y ahora me haces dudar.

    Si has calculado tiempos. En las unidades de segundo prefieres decirlo o no?

  17. Maito

    Aunque es sencillo y de ESO, mis neuronas también van más lentas que las del gusano. Esperemos que la golondrina se harte de esperar dado el paso cansino de ambos y puedan vivir ambos, ya que me caen simpáticos tanto el friki de las mates como el que disfruta del paseo por el campo.

  18. jabon

    Maito o Pedro, habéis utilizado la vía que insinúo en el mensaje que puse nada más saber que ya estaba el video colgado?

  19. Divagante

    Me ha parecido el mas facil despues de las alfombras. Quizas he tenido inspiracion, pero he tardado mas o menos los 3 minutos del gusanillo.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s