ESTADISTICA ESPAÑOLA Núm. 94, 1982, págs. 53 a 66
Inferencia estadística e indu cción por SEGUNDO GUTIERREZ CABRIA Catedrático de Estadistica Matemgtica Departamento de Eafadística e Investigación Operativa. Universidad de Vaiencia
RESUMEN Se estudian las interrelaciones existentes entre inferencia estadística e inducción. Se examinan, en particular, las posibilidades que ofrece la estadística en relación con el problema de la inducción según la versión de Hume; se estudian los intentos Ilevados a cabo por Bernouilli y Laplace. Se concl uye que las inferencias de la estadística son «secundarias» y, en consecuencia», no constituyen una respuesta al problema de la inducción. Palabras clave: Deducción, reducción, inducción. Lógica inductiva, lógica probabilística. Inferencia inductiva, lnferencia estadística.
0.
INTRCIDUCCIt^N
EI problema fundamental que tiene planteado el conocimiento científico puede formularse así: I}ado que las proposiciones de las ciencias experimentales na pueden deducirse de la lógica formal, por ser verdades de hecho y no verdades necesarias, ^de dónde obtienen su justificación? Las filosofías tradicionales de la inducción manifiestan claramente sus insuficiencias para contestar adecuadamente a esta cuestión. Quizá se les ha exigido demasiado. Se ha pedido la certeza de las conclusiones inductivas en tanto que se sabía que toda inducción, de por sí, es precaria. La situación sería posiblemente distinta si nos limitáramos a afirmar la «probabilidad de las conclusiones
S4
ESTADiSTICA ESPAÑOLA
inductivas^. ^,No podría, con este nuevo planteamiento, construirse una teoría lógica de la inducción? Esta idea iba a recibir un desarrollo sistemático cuando los filósofos de la escuela nevpositiva se apropiaron de ella. Se han hecho diversos intentos de construir lógicas inductivas prababilistas y se ha pensado en que la inferencia estadística podría servir ai menos de rnodelo para tales construcciones e, incluso, constituir ella misma una teoría general de la inducción. En este trabajo se estudian las posibilidades que, desde nuestro punto de vista, ofrece la inferencia estadística en conexión con el histórico problema de la induccián. En el primer párrafo se da la nvción de inducción y sus diversas acepciones e interpretaciones en relación con los métodos reductivos y deductivos. En el párrafo segundo se formula el Ilamado «problema de la induccicín» y se exponen las distintas actitudes adoptadas frente a él por la ciencia y la filosofía y, principalmente, ante el desafío de Hume. En el párrafo tercero se analizan las interrelaciones enire inferencia estadistica e inducción. Se contempla, primero, la presencia de la inducción en los distintos argumentos de naturaleza estadística y se estudian, luego, las posibilidades de la inferencia estadística frente al problema de la inducción y las razones que hacen inviable su solución.
1.
DEDUCCION, REDUCCION E INDUCCION 1.
Nos abstendremos aquí de indagar acerca del conocimiento humano y partire-
mos de un estado del saber en el que ciertas proposiciones han sido previamente establecidas. Esas proposiciones constituyen los juicios perceptivos que el sentido común tiene por ciertos, aunque la razón filosófica pueda ponerlos en duda. Lo que se pretende (y este es el objetivo de la lógica) es pasar de la aserción de ciertas proposiciones, llamadas premisas, a otras, llamadas conclusiones, que se deducen de ellas. A esta operación se la llama dYmostrucivn y al sistema, r^r^umentc^. 2.
Hay dos formas esencialmente distintas de argumentar: por induccivn
y por
reúuc•c•ic^n.
En la deducción se concluye su premisa menor de un enunciado condicional y de su premisa mayor: Si A, entonces B; es así que A, luego B. En la r^duc^cic.in, por el contrario, se concluye de un enunciado condicional y de su premisa menor, su mayor: Si A, entonces B; es así que B, luego A.
1NfiERENCIA ESTADISTICA E [NDUCC[ON
SS
La reducción puede ser progresiva y regresiva. En ambas se conoce la premisa menar, pero no la mayor. En la reducción prvkresi^^a se comienza por la premisa mayor desconocida según su valor de verdad y se procede hacia la premisa menar conacida a comprobable. La reducción progresiva se llama también «verificación» . La reduc•cián regresi^^a comienza en la premisa menor conocida y va hacia la mayor desconocida. La reducción regresiva se Ilama también «explicación» . En el llamado «método hipotético-deductivo» se dan las dos direcciones del procedimiento reductivo: es «hipotético» por cuanto en él se establecen hipótesis explicatorias (reducción regresiva) y es «deductivo» (esta palabra tiene aquí un sentido propio) porque de las hipótesis se «deducen» las premisas menores verificables (reducción progresiva). 3. Cuando la premisa rnayor es una ^;eneruli^,acián de la premisa menor, la reducción se llama induccián. Tal es et concepto tradicional de inducción desde Aristóteles, quien empleó el vocablo «epagogue», que significa «Ilevar a», para designar el proceso de llevar, por la contemplación de casos particulares, al conocimiento de una verdad general. En la actualidad no todos están de acuerdo con esta de^nición restrictiva de la inducción. Stuart Mill (Mill, S., 1843) observó ya que no es necesaria que una inferencia inductiva lleve a una generalización sino que podemos extender la concl usión a un número limitado de miembros desconocidos de una clase al siguiente miembro que aparezca en la serie, por ejemplo. A este procedimiento, de pasar de particulares a particulares, la denaminó Johnson educcián w (Johnsan, VV. E., 1921) y Carnap (Carnap, R., 1952) señalá su impartancia. Max Black (Black, M., 1979) define la inducción como «argumento na demostrativo, en el que la verdad de las premisas, aunque no entraña la verdad de la conclusión, constituye una buena razón para aceptarla». A tales argumentaciones, para las que la conclusión puede presupaner la existencia de individuos no presupuestadas par las premisas, san llamadas por Peirce «ampliativas» {Peirce, C. S., 1902). Este ir «más allá de las premisas» , que son los hechos singulares de la experiencia (de ahí su carácter ampliativo), posibilita la inferencia de hechos observados a hechos inobservados y, en particular, a la predicción del futuro. La esfera de aplicación más importante de esta inducción es la ciencia natural. En los «Analíticas Posteriores» , de Aristóteles, se lee: « E1 conocimiento de las premisas inmediatas es independiente de la demostración». Y esto, añade, «porque el regreso debe acabar en verdades inmediatas que deben ser indemostrables» . Esto nos
ESTAD[STiCA ESPA140LA
Ileva a formular la siguiente pregunta: Reducir la inducción a la operacíón que permite el paso de la percepción a las leyes experimentales y de éstas a los principios de las teorías científicas, ^,no es olvidar que el juicio má.s simple de percepcián es el producto de una inducción? Por supuesto que toda subsunción de un dato s^ensible lo es. Admitimos, pues, que no hay pensamiento acerca del objeto sensible que no constituya una inducción. A este tipo de inducción se le denomina intuitiva o"aóstrac^ivu".
4. A estas inducciones no demostrativas podemos añadir otras rr^al llamadas inducciones, o inducciones «impropias>^ . Tenemos, en primer lugar, la inducción «recursivari o maternátiea, formulada explícitamente por Ferrnat en el siglo xv^^ y empleada, de modo sistemático, por Jaeobo Bernouilli, por lo que se la conoce también con el nornbre de «inducción bernouilliana^ . Se puede expresar asi: Si el primer elemento de una sucesión posee una propiedad y la posee también el sucesor de todo elemento de la serie que tenga esa propiedad, todos 1os elementc^^ s de la sucesión poseen la propiedad en cuestión. Aunque por este procedimíento se establecen proposiciones generales, a partir de casos particular^es, se trata más bien cie una deducción que de una reducción. Aristóteles ofrece en los «Analíticos Primeros» el siguiente ejemplo de argumento ínductívo: «El hombre, el caballo y el mulo son longevos; pero el hombre, el caballo y el mulo son todos los animales sin hiel; luego todos los animales sin hiel son longevos». A este tipo cie inducción, en la que se enumeran todos los casos que caen bajo una generalización, se la llama «sumativa» o«completa», por oposición a la «matemática» en la que no se realiza una enumeración completa. También este argumento es una especie de deducción. S.
Es importante, a los fines de este trabajo, la distinción hecha por Nicod entre
inducciones «primarias» y«secundarias». Las inducciones primarias son argumentaciones no demostrativas «cuyas premisas no obtienen su ^certeza o probabilidad a partir de ninguna inducción» {Nicod, J,, 1961). Las secundarias
son las que no cumplen ese
requisito.
2.
EL PROBLEMA DE LA INDUCCION
1. EI problema de la inducción, suscitado ya por Aristóteles, está en que los distintos argurnentos inductivos no son conclusivos, esto es, no demostrativos. David Hume tiene el mérito incomparable de haber planteado el problema de la inducción en los términos más netos, si bien restringido a los casos de inferencia causal, ya q ue la única cuestión que plantea es la de saber con qué derecho concluimos que tal efecto
1NFERENCIA ESTADISTICA E [1VDUCCION
S7
seguirá necesariamente a tal causa. Pero los resultados que obtiene son aplicables a todos los tipos de inferencia inductiva (puede consultarse: Hume, D., 1888 y 1894}. EI problema de la inducción comporta estas dos cuestiones fundamentales: aná^lisis formal del pensamiento inductivo y justificación de la inducción. E1 análisis formr^l se aplicará a la «reconstrucción racional» de los métodos inductivos cuya validez está reconocida por todas las mentes sanas y a la codificación de los principios en los que se apoyan. Por «reconstrucción racional^ habrá de entenderse, no una simple descripción de esos métodos, sino la determinación de un «sustituto» lógico, en expresión de Reichenbach ( Reichenbach, H. 1938); no su «representacián con todas sus ambigiiedades, sino una sistematizaci:ón que comprenda la explicación de los concepto^. y principios que utilizan, y que no excluye la posibilidad de una critica, en frase de Carnap ( Carnap, R., 19b2). E1 problema erítico de la justificación consistirá en la legitimación del sistema formal construido. ^ Por qué es razonable aceptar las conclusiones de ciertos argumenios inductivos como verdaderas © probablemente verdaderas? ^ Por qué es razonable, si lo es, emplear ciertas reglas de inferencia inductiva? 2. La contestacián dada a lo largo de la historia al problema de la inducción ha hecho correr mucha tinta y ha seguido distintas vertientes que pueden resumirse así: a) Al reto lanzado por Hume no se puede responder adecuadamente; en consecuencia, la inducción es insostenibie y debe excluirse de todo razonamiento que pretenda ser racional. Tal es la postura de VWhewel y Popper, entre otros. 6) A la luz de la crítica de Hume se observa que los argumentos inductivos, tal como se presentan de ordinario, necesitan de perfeccionamiento. Esto puede hacerse de dos modos: (i) con la adición de nuevas premisas; (ii) mediante la sustitución de las conclusiones por aserciones de probabilidad. (i} Las premisas que se han añadido, en un intento de resolver el problema de la inducción mediante la construcción de una lógica inductiva, de corte análogo a la deductiva, son ciertos principios de inducción «suprema» como los siguientes; «el futuro ha de asemejarse al pasado» (Hume); «el efecto de cualquier acontecimiento ha de tener una causa suficiente» (Mill); «la variabilidad de los hechos es limitada e independiente» . Keynes» ;«existe homogeneidad en el curso de la naturaza» (Miilj. Estos principios permitirian dar base a las inducciones. Los esfuerzos llevados a cabo, en esta dirección, por Bacon y Mill han sido infructuosos. (ii) La incorporación del concepto de probabilidad a la resolución del problema de a inducción ha dado lugar a las diversas lógicas inductivas probabilísticas, esto como
ESTADISTiCA ES^PAÑUL.A
consecuencia de la irnporteneia de las clásicas. Estas son de dos clases: las que pretenden asignar probabilidades a toda clase de hipótesis y justificar, tal como intentá Hans Reichenbach, tos principios en Ios que se basa esta asignación, y las que se esfuerzan por construir parcelas limitadas de la lógica inductiva y defini'r' la probabilidad de una hipótesis en condiciones muy restringidas. Estas restricciones s©n debidas a la debilidad del sistema construido por Reichenbach y consisten en la debilitación del concepto matemático de probabilidad (para gozar de más libertad en la construcción} y iimitación de fórrn^ ulas a probabilizar. Las lógicas que más éxito tienen en Ia actualidad son las comparativas, como Ias de Keynes y Koopman, que permiten discernir cuál de dos hipótesis inductivas es más probable. Las pretensiones modestas de estas iógicas se limitan a determinar la medida de la eunfrrmc^c•rcín que los datos experimentales aportan a una hipótesis. Tal es la po4ición de los que se sitúan en la óptica de Rudolf Carnap. c•) Aunque la argumentación inductiva no pueda justificarse, ajustada al modelo deductivo, esto no obsta para que las normas deducidas sean razonables. La racionalidad no tiene por qué estar ligada a la deducción ni a la justificación. Puede, pues, hablarse de justificación en el sentido de que se sabe que la afirmación de una conclusión se <=sigue^ (no en el sentido deductivo de seguirse} estrictamente de premisas que se saben verdaderas. d} El problema de Hume es debido a confusiones conceptuales y lingiiísticas. Estas confusiones y sus origenes deben ser claramente expuestas, lo que debe conducir a la disolución del problema (a la no existencia) y no a su solución. Es el planteamiento lingiiístico del problema, hoy tan en boga. Se pretende aquí analizar el problema de la inducción a la luz de la esiadística. Este análisis lleva implíeita la <=incorporación del concepto matemático de probabilidad». LTiene sentido presentar la inferencia estadística como una teoría del razcanamiento inductivo`? ^Son competencia de esta disciplina los problemas que se presentan en un contexto cientifico determinado o se extiende, por el contrario, su área al problema general de la inducción? Son estas cuestiones de suficiente entidad camo para que se las presta la debida atención. Es lo que hacemos a continuación.
3.
IN I=ERENCIA ESTAD^ IST[CA E INDUCCI()N
l. En «The logie of inductive inference» (Fisher, R. A., i935), Fisher se refiere al conjunto del razonamiento inductivo como si todo él dependiera de la. inferencia est^idística. En «The design of experiments», después de discutir ciertas ideas de Bayes, cuyo mérito reconoce, atribuye a este autor el privilegio de ser «el primero en pre ver la importancia de1 desarrollo de una teoría exacta y cuantitativa del razonamiento induc-
INFERENCIA FSTADISTiCA E 1NDt1CClUN
S9
tivo, de la argumentación que conduce de los hechos observados a las teorías capaces de explicarlos» { Fisher, R. A., 1935). E1 desarrollo de la infereneia estadística se ha producido na sin resonancia en el campo de la f~ilosofía de la inducción. Las cuestiones que trata, el modo de tratarias, los principios en que se apoya, nada es ^jeno a la problemática tradicional de la inducción. Tanto en la conducción de experiencias como en la utilización de los datos obtenidos, la teoria de la inferencia estadística parece haberse responsabilizado, en parte por la menos, con problemas que dependen de lógica inductiva clásica. í,No se presenta acaso como un ejemplo de lógica probabilistica de la induccián, construida por hombres de ciencia, al margen de los filósofos? Antes de entrar en el fondo de esta pregunta, vamos a intentar un análisis de la presencia de la induccián en la metodología estadística. 2. Un examen detallada de las distin'tas argumentacíones utilizadas por las diversas escuelas estadisticas, lleva a la conclusión de que todas son de naturaJeza «reductiva». En consecuencia, caen dentro del ámbito de alguna de las definícíanes de inducción que hemas dacio. Las más usadas son las siguientes: u) La ^nc^ttc•c•ivrt propc^rc•ic.^nul, que es una «reducción regresiva» que parte de la frecuencia de algún carácter en la muestra y concluye con la frecuencia del mismo carácter en la poblacián. De la afirmación .^m , de los n, elementas seleccionados en A son B» se conctuye que «m de los n elementos contenidos en A son B» . La estimaciones puntuales y por intervalo son inferencias de este tipo. La proporción establecida en la conclusián puede ser distinta de la establecida en la premisa. h) La ^^drrc•ci^^n ^^rc^^^carc•i^anul, que es la argumentación regresiva que parte de una muestra y«reí;resa» a otra muestra. La premisa es la misrna de la inducción praporcional, pero la conclusión concierne a la frecuencia aproximada de una muestra ulterior, obtenida por el mismo procedimiento. Numerosos procesos de análisis estadístico basados en la camparación de muestras, corno el control estadístico de la calidad, diseño de experimentos, etc., se basan en la educción. c•) La inc^ucc•ic^^n prc.^Xresii^u, concebida como proceso reductivo que conduce del examen de una muestra aleatoria a la prueba de una hipótesis. Toda la teoria de decisión estadistica Bayesiana y de Wald, así como la teoría de cantrastes de hipótesis estadíscticas de Neyman-Pearson, se inspiran en este proceso inductivo. d) La d^cfuc•c•ivn prvpvrc•innul, llamada también «silogismo estadístico» o«deduccián estadística» y que puede formularse así: «m de los n elementos C son B para m> ^ ; A es un elemento C, luego A es un B» . Par ejemplo: La mayor parn 2
^
ESTALIISTiCA ESPAÑOLA
te de los españoles saben leer; Juan es español, luego Juan sab^e leer. La validez de la conclusión está en función, naturalmente, de la razón m/n. e) La Uhr^uc^r^ir.^n, así nominada par Peirce, formulación creativa de hipótesis y único modo de inferencia estaciística que introduce nuevas ideas. Es una especie de inversión cie la deducción estadística y no tiene apenas valor demostrativo. Sirve para obtener nuevas generalizaciones que precisan de verificación y que tienen alguna posibilidad de ser verdaderas. Todas estas argumentaciones llevan en la conclusión algún grado de plausibilidad, fiabil idad o probabil idad . ^.
LA 1NFERENCIA ESTADiST[CA Y EL PROBLEMA DE LA 1ND[.1CCION
1. Estudiada la inducción en su sentido rnás amplio, como todo procedimiento que conduce de lo particular a lo más general o a«otro particular», como modo de pasar de un conocimiento a otro del que no se tenga certeza absoluta, parece claro que la inferencia estadística constituye una teoria de la inducción, lo cual no equivale a afirmar que constituye una lógica inductiva y, en cansecuencia, que sea una solución del problema de la inducción. La razón está en que, cualquiera que sea la forma que adopte, siempre se refere a inducciones secundarias y nunca a la inducción primaria. La creencia de que en la estadística pudiera estar la clave para la sol ución del problema de la inducción proviene, sin duda, de la fe depositada, p ^or los hombres de ciencia, en la verdad de las hipótesis contrastadas estadísticamente y de los éxitos cosechados durante estos últimos años, por la estadística, en el campo de la investigación científica. Pero no basta con el testimonio de la fe; es preciso un análisis de las razones en ias que esa fe se asienta. i} Toda inferencia estadistica parte de algún supuesto que presupone, a su vez, un proceso inductivo. Si se trata de un problema de estimación, hay que presuponer la familia de distribuciones que lo soporta. Si se contrasta una hipótesis, se admite de antemano que la familia cansiderada es completa. Si se plantea un problema de decisión estadística, se fijan «a priori» los posibles estados de la naturaleza, ia función de pérdida y hasta el conjunto de decisiones terminales. Si el proceso es secuencial, se predetermina !a regla de parada. Todos estos presupuestos denuncian la presencia de inducciones primarias, previamente asumidas, y, en consecuencia, ponen de manifiesto que todo lo que se hace en el terreno de la inferencia estadística se reduce a inferencias secundarias. El problama de la inducción cae así en círculo vicioso. ii) La inferencia estadística presupone la existenc'ra de una clase completa de hipótesis rnutuamente excluyente que pueden ser eliminadas paulatinamente, a partir de un
lNFERENCIA ESTADISTICA E IND^ UCC10N
fil
número finito de experiencias, hasta quedarse con la más plausible. Admirablemente adaptada a problemas concretos, incluso a ciertos procedimientos que juegan papel preponderante en la investigación experimentai, la inferencia estadística parte de und situación en la que está cerrado el campo de lo posible (por trabajar con número limitado de hipótesis) y sus resultados son válidos sólo a ese precio. Todo esto está en pugna con los postulados de la lógica que no admite limitación en sus posibilidades.
iii) Existen serias dificultades en la transposición de los conceptos y métodos de la inferencia estadística a una teoría general de la inducci+ón. Tal ocurre con el principio de inferencia de Laplace, con los esquemas bayesianos, con la versomilitud comu medida del grado de creencia en una hipótesis, con la función de pérdida cuando se trata de decidir acerca de la admisión de una hipótesis estadística, etc. Todos los intentos históricos de resolver el pr^blema de la inducción, por vía estadística, han chocado con uno u otro de esos escollos. Como ejemplo representativo hemos elegido el problema de inversión del teorema de Bernouilli y la regla de sucesión de Laplace.
4.1.
EL TEOREMA DE BERNGIUILLI
1. Durante veintiún años estuvo Bernouilli, según su propia confesión, preoc upad^ por obtener medidas de frecuencias a partir de probabilidades y recíprocamente . E1 resultado fue el teorema que Ileva su nombre, que de modo muy simple puede enunciarse así: «Si la probabilidad de un suceso, bajo ciertas condiciones, es ^, y si estas condiciones se presentan en n ocasiones, el número más probable, x, de oc urrencias del suceso es n^». Es éste un ejemplo de «reducción regresiva» que conduce de la probabilidad ^ a la frecuencia x/n. La demostración de este enunciado puede verse en el «Ars conjectandi» de Bernouilli (Bernouiili, J., 1713). Noy se obtiene fácilmente a partir de la desigualdad de Chebyschev. Las condiciones a las que alude el teorema puecfen cc^mpendiarse en ésta: la probabilidad del suceso en la (n + 1} ocasión no debe ser afectada por el conocimiento de la frecuencia de ocurrencias en las n precedentes y debe ser igual a la probabilidad «a priori» de la primera. El enunciado de Bernouilli produjo tanto impacto que Ellis (Ellis, R. L., 1K^3) y Venn (Venn, J., 1K66), lo utilizaron como base de la definición axiomática cie probabilidad y Laplace creyó que expresaba una ley natural de la naturaleza. Con todo, las condiciones que exigen lo hacen aplicable sólo a ciel-tas clases especíticas de sucesos. Si la probabilidad inicial está basada en la experiencia, está claro que está ligadd a l^i información de una nueva experiencia, lo que contradice las condicicanes impuesta^.
ó2
ESTAUiSTICA ESPAÑOi.A
Esta última indicación pone de manifiesto que estamos trabajando con inducciones secundarias. Además, del conocido experimento de Buffon, dirigido a la comprobación del teorema de Bernouilli, otros análogos, empleando monedas, bolas o dados, así como loterías y ruletas de Montecarlo, fueron diseñados, con el mismo fin, por De Morgan, Quetelet, Jevons, Weldon, Wolf, Czuber y Karl Pearson. 2. En carta dirigida por Jacobo Bernouilli a Leibniz (Leibniz, G., ^855), fechada en 1^03, le dice: «Podemos determinar, por consideraciones "a priori", en qué cuantia es más probable obtener la suma siete, al lanzar das dados, que ta suma ocho; pero no podemos determinar, por tales procedimientos, la ^+robabilidad de que un hombre de 20 años sobreviva a otro de óo. ^,No será posible aún obtener este conocimíento, "a posteriori", de haber observado un gran número de parejas de hombres análogas a la anterior?». En la réplica de Leibniz se encuentra la raíz de la dificultad de la respuesta. «El cálculo de probabilidades --escribe-- es del más alto valor, pero en investigaciones estadísticas es necesario, no tanto la sutileza matemática cuanto al enunciado preciso de todas las circunstancias. Las posibles contingencias son demasiado numerosas para ser cubiertas por un número finito de experiencias y el cálculo exacto está, en consecuencia, fuera de la cuestión. Aunque la naturaleza tiene sus hábitos, debido a la concurrencia de causas, no son generales, inmutables. Con todo, cálculos empíricos, aunque inexactos, puecien ser adecuados en asuntos prácticos». Bernouilli vc^lvió, en su respuesta, a insistir en la analogía con las bolas extraídas de urna y mantuvo que «sin estimar cada contingencia por separado, podemos determinar, dentro de estrechos limites, la proporción que ofrece cada alternativa». Y añadía en su carta: «^tito es cierto, se acabó la controversia; te agr-adará la demostr<ación que publicaré.» Lo cierto es que la demostración no llegó. Después de tratar de algunas de las objeciones apuntadas por L,eibniz, y prometer algún procedimiento para estimar probabilidades «a posteriori», mediante una inversión de su teorema, da la demostración directa y termina sin más el «Ars conjectandi». Durante el siglo XVl[1 no hay ningún indicio de explicar el uso de la inversión del teorema de Bernouilli. Las investigaciones de D'Alembert, Daniel Bernouilli y otros, se orientan al estudio de las condiciones de aplicabilidad del teorema directo. Laplace supone, sin prueba, una inversión del teorema. EI análisis bayesiano actual da la siguiente respuesta al problema de la inversión: Si la probabilidad
«a priori»
j1
es
X
n -x
n (1 - nl
de un suceso es p,
s^^ aparición x
veces en n
pruebas
b3
[NFERENCIA ESTADISTICA E [NDUCCIUN
Que p, considerada como variable, adquiera un valor determinado, constituye una n hipótesis cuya «verosimilitud» es x pxt^ - v^"-X• Los diversos valores de p constituyen una clase completa de hipótesis. Se torna asi el ..clásico problema de la «Probabilidad de las causas» . Considerada p como una variable aleatoria de densidad f{p ), el teorema de Bayes de la probabilidad «a posteriori» de que p esté entre dos números p' y p" después de haber observado x veces el suceso en n pruebas: p• p,
p[(P' < p S p")lx
n p X^ 1_ p) n-X,^f-(P )dP X
i n pX(1 ^ p)"-x.f^P)dp o x
Como f(p ) está acotada, es f(p ) = U, para p fijo . Ade más,
^ f{p )- dp = 0
1, por se r
0 S p S 1, luego la convergencia de las integrales de la expresión anterior queda asegurada lo cual permite calcular la probabilidad a partir de la frecuencia. +Queda, naturalmente, abierta el problema de la determinación de f(p) al que intenta responder el análisis bayesiano. A efectos de nuestra tesis, el punto esencial que hay que señalar es que las probabilidades «a posteriori» presuponen el conocimiento no sólo de las verosimilitudes, sino también de las probabilidades «a posteriori» . Ambos conocimientos impl ican inducciones primarias, por lo que la inducción obtenida, al ser secundaria, no sirve a la solución del problema humeano. En el caso en que la distribución «a priori» sea uniforme en [0, 1] es f{p) = 1 y la densidad «a posteriori» de p, después de n observaciones tiene un máximo para x/n. Es el caso aplicado por Laplace a la solución del problema de Hume.
4.Z.
LA REGLA DE SUCESI+CSN DE LAPLACE
Laplace toma como ejemplo, en su disertación, el mismo utilizado por Hume expresado por la ley: «EI sol saldrá todas las mañanas» . La argumentación empleada es del tipo "Si B también A; si ei sol ha _~^lido todas las mañanas hasta ahora, segui rá saliendo en lo sucesivo"» . Según Laplace, se puede considerar la posesión dei ^tributo A por un objeto que es un B, como un suceso aleatorio. Se asimila así la ley a una serie de extracciones de bolas de una urna cuya composición sea canstante . En su «Essai philosophique sur les probabilités» {Laplace, p. 1814), capítulo III, 7.° principio, enuncia: <^ `.a probabilidad de un suceso futuro es la suma de los productos de las probabilidades de cada causa
^STADISTICA ESPAIrtol.A
extraida del suceso observado, por 1a probabilidad de que, existiendo esta causa, ocurra el suceso futuro^». Pone a continuación un ejemplo que generalizado conduce a esta regla: Si el suceso ha ocurrido siempre en n ucasiones, la probabilidad de que se n+1 verifique siempre en una nueva serie de m pruebas es . El caso m= 1, en n + m + 1 que la probabilidad toma el valor (n + 1) /(n + 2}, fue bautizado por Venn ( Ve nn, J. l 889) con e! nombre de «regla de sucesión de Laplace ^» . La prueba de esta sucesión puede hacerse brevemente así: Sea p la probabil idad «a priori^^ de un suceso en condiciones dadas. La probabilidad de que el suceso ocurra m veces en esas condiciones y falle en otras n ocasiones es pm •( l - p}n. Luego la probabilidad «a posteriori^ de p, tras m ocurrencias del suceso en m + n pruebas de q ue p está enire p y p + dp , es Pm(1 ' p)" ^p
^
P^(1
- p)^r(m + n + 2)
rt^^ + 1) r (n + i)
^0 p^(1 - p)"^p Por lo tanto, la probabílidad de que el suceso ocurra en la (^n prueba, habiendo oc urridc^ m veces en rr1 + n pruebas es:
+ n + l)-ésima
t r(m + n + 2)
0
pm+t(1 - p)^d,p
r(m + l)r(n + l)
r(m + n + 2} r(m) r(n) "(m + 1) r (n + l ) r (m + n ) m+1 m + n + 2
Para n= U, esto es, cuancio el suceso ha ocurrido invariablemente, la fórmul^^ e^ ( m+ 1)/(^rr + 2). En el caso en que las condiciones del suceso se han dado una ^;ula vez y éste ha ocurrido, el resultado es 2/3. Si ias condiciones del suceso no se han dadu nunca, la probabilidad del ^uceso es 1/2 y en el caso en yue las condiciunes se dieran una sola vez y el suceso no ocurriera, la probabiliciad seria l l3 ( resultados totalmente absurdos). Aparte estas absurdidades, la fórmula de Laplace involucra la teoría de «probabilidades desconacidas» introducidas por él como suplemento del principio de indiferencia, con tocia la problem^^tica yue ello encierra. Las objeciones hechas a esta fórmula son muchas. Con respecto a la demostración anterior hay una que aparece en seguida: Si p es la probabilidad « a priori» del suceso acaecido una vez, pn es la probabilidad «a priori» de haber acaecido n-veces sucesivamente. Ahora bien, del prcapio teorema se deduce que si ocurre una vez modifica la ocurrencia de la vez siguiente, luego las sucesivas ocurrencias nu son independientes. Asi, si la probabilidad «a priori» es 1/2, la
INFERENC[A ESTADtSTECA E INDUCCION
óS
probabilidad de la segunda ocurrencia es 2/3, luego la probabilidad «a priori^ de 1 1 1 2 1 ocurrencia dos veces es no 2• 2, sino 2- 3= 3; y, en general, la probabilidad «a
priori» de su ocurrencia n-veces no es
1 2: ,,, sino 1/(n + 1).
Las primer•as criticas a esta regla provinieron del propio Venn en la obra citada, por no estar de acuerdo, según él, con la experiencia. Pearson, que ia acepta, resuelve estas discrepancias. Es rechazada también por Boole (Boole, CC., 1854), que dice se basa en hipátesis arbitrarias; por Bertrand (Bertrand, J., 18^39), que niega su aplicabilidad al caso de un númeru finito de alternativas y que la califica de ridícula, etc. En cambio, merece la aprobación, entre otros, aparte de Pearson, de De Morgan, Jevons, Lotzey y Czuber. Con respecto a la materia que nos ocupa, la crítica ha de centrarse en si es o no coherente reducir el problema a la cuestión de determinar una probabilidad desconocida, aunque constante. Supuesto aceptable la introducción de probabilidardes «a priori», se mar^tiene la hipótesis de que B da a la posesión de A una probabilidad determinada. Esto es, el razonamiento de Laplace supone que entre B y A existe una implicación probable: Si .^ es una B hay una probabilidad de que x sea un A. Ahora bien, para que este razunamiento lleve a alguna conclusión con cierta validez es preciso que B determine A(al menas en términos probables) y que sea B el único factor cietermin^^nte de A. Está claro que estas suposiciones implican una induceión previa, con lo que se vuelve a caer en un círculo vicioso. C[^^tsfcic^ruc'l^ II ^Illtl%. Tanto en la regla de sucesión de Laplace como en el teorema cie í3ernuuilli, cum^^ en c^i^^lquier investigación con base estadística, el uso de muestras aleatori^^s es imprescindible. Las diversas técnicas de selección de estas muestras ponen especial énfasis en eliminar todo factor de naturaleza ^causal que pueda dar lugar a algún sesgo. L.a carencia de todo sesgo en la elección es lo que garantiza el carácter aleatorio de la muestra. Lus diversos procedimientos para la obtencián de muestras aleatorias parten, pues, de la hipótesis de que eliminan todo factor causante de sesgo, í, Hasta qué puntu podemos estar ciertoti de que estas hipótesis se cumplen? Aun en el caso de que se cumplan, ^,no estdn presuponiendo un conocimiento previo di^cil de adquirir por la vía de la inferencia estadistica? Nuevamente nos vemos recorriendo un camino que termina en el punto cte salida.
ESTADISTiCA ESPAI^O^.,.A
REFERENCIA BIBLIOGRAFICA BERNOU[LL1. J.: Ars corEjeetandi. Basilea (1713). BooLE. G.: .^n investigation of the Larvs vf Thought. Londres (1854). BERTRAND, J.: Caleul des prvbabilités. Pañs ( 1889). CARNAP, R.: The cvntinuum of inductive methods. Chicago (1952). -- Lngícal Foundations vf Probability. Chicago ( 19ó2). EL[.^s. R. t..: «On the Foundations of the Theory of Probability*. Cmab. Phil. Soc., vol. VIII (1843). FISHER, R. A.: «The Iogic of inductive inference», J. Royal Star. Soc., XCVI II. Pt. I(1935). - The desiRn af Experiments. Edimburgo y Londres (1935). HuNtE, D.: «Treatise ©f Human Natur+e^^ . Oxford Univ. Press (1888). «An enquiry concerning Human Understanding^. Oxford Univ. Press (1894), JUHNSON. W. E.: Logic. Cambridge, I11, iv. (1921-24). LEtBN^z, G.: «Correspondence between Leibniz and Jac. Bernouilli^. L.'s Cesammelte Werk (ed. Pertz and ^erhart), vol. 3, Halle (1855). LAPLACE, F.: «Essai philosophique sur les probabilités^, en ^euvres, tomo 7, París {1847). M1LL, J. S.: «System of Logic^^ . Book III, Chap. 18, 23 (1843). N ^con, J.: « Le probl^me logique de 1'induction» . Paris (19^61), PEIRCE, C. S.: «Collected Papers of Charles Sanders Peirce^, 8 vols. Cambridge, Mass. {1931-58). REICNENBACH, H.: «Exper^ence and Prediction^. Chicago (1938). VENN, J.: «The Logic of Chance^ (1866). BLACK, M.: «Inducción y probabilidad» . Ediciones Cátedra, S. A. Madrid { 1975).
SUMMARY The interrelations between statistical inference and induction are studied. In particular, the possibilities of Statistics for the Hume's problem of induction are examined; the trials implemented by Bernouilli and Laplace are studied. It is conclued that the inferences of Statistics are secondary and therefore they do not solvet the problem of induction. Key words: Deduction, reduction, induction. Inductive logic, probabilistic logic. Inductive inference. Statistieal inference. AMS, 1970. Subject classification. 62F99.