.:
Fundamentos
de la Ciencia
Josí A. D í a (Barcelona, 1961) es Doctor en Filosofía por la Universidad de Barcelona con una tesis sobre la teoría de la medición. Ha publicado numerosos artículos en revistas y antologías nacionales e internacionales y en la actualidad es Profesor Titular de Lógica y Filosofia de la Ciencia de la Universitat Rovira i Virgili.
C. ULISESMOULINES (Caracas, 1946) es Doctor en Filosofía por la Universidad de Munich con una tesis sobre las teorías termodinámicas. Ha sido profesor en diversas universidades de México, California y Alemania y en la actualidad es Catedrático de Teoría de la Ciencia de la Universidad de Munich, donde dirige el instituto de Filosofía, Lógica y Teoría de la Ciencia. Es coautor, junto con W. Balzer y J. D. Sneed de An Architectonic for Science. The Structuralist Program (Dordrecht, 1987) y ha publicado, además de numerosos artículos en las principales revistas internacionales, varias obras en castellano, entre otras, La estructura del mundo sensible (Barcelona, 1973), Exploraciones metacientíficas (Madrid, 1982) y Pluralidad y recursión (Madrid, 1991).
Dirño c~tncrtl.Sacho Soriano
k c c . h uclurirw dc cdicibn en espafiol r - r r \ das para ( d o CI mundo: O 1997: Edriorial Antl. S. A. C 6 r a g r 270 OSDOS Barcelona
Singuru pyu dc publicuibn. incluido el diseño dc 12 cuSicm. pucdc rcr rcprojuci3~.rilmacenadn o transmitida cn rn2ncr;l alguna ni pr ningun medio. ya sea eléctrico. quinii:~. mccfrnuo. 6p:ico. dc gnbaci6n o de foiocopia. h i n r*r;niw prrvio del cdrior.
SÓCRATES:He aquí lo que me llena de perplejidad y no acierto a comprender suficientemente: ¿qué puede ser la ciencia? ¿Encontraremos una respuesta a esta pregunta? ¿Qué contestáis vosotros? ¿Quién de entre nosotros será el primero en hablar? PLATÓN, Teeteto
............................................
9
CAPÍTULO 1. Introducción: Naturaleza y función de la filosofía de la ciencia . . . . . 1. La ciencia como objeto. Los estudios sobre la ciencia . . . . . . . . . . . . . . . 2 . La ciencia como objeto de estudio filosófico. La filosofía de la ciencia . . . . . . ? . Nuestro tema: Filosofía general de la ciencia empírica . . . . . . . . . . . . . . . 4 . Panorama sucinto de la historia de la filosofía de la ciencia . . . . . . . . . . . .
15 15 19
Prólogo
25 27
CAPÍTULO 2. Argumentos deductivos y argumentos inductivos . . . . . . . . . . . . . 1. Argumentos. validez y verdad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 . Argumentos deductivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . Argumentos inductivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35 35 41
CAP~TULO 3. Contrastación de hipótesis . 1. Algunos episodios históricos . . . 2 . Elementos de :a contrastación . . . 3 . Condiciones para la contrastación . 4 . Resultado de la contrastación . . . 5 . Consideraciones finales . . . . . .
......................... ......................... ......................... ......................... ......................... .........................
61 63 71 75 79 8s
CAPÍTULO 4 . LOSconceptos científicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 1. ¿Qué es un concepto? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 . Conceptos clasificatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . Conceptos comparativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 . Conceptos métricos: estudio preliminar . . . . . . . . . . . . . . . . . . . . . . .
91 91 101 108 112
CAPITULO5 . Las leyes científicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1. Tipos de generalizaciones y de leyes . . . . . . . . . . . . . . . . . . . . . . . . 2 . Leyes y regularidades accidentales . . . . . . . . . . . . . . . . . . . . . . . . . 3 . Acaecimientos, causalidad y leyes causales . . . . . . . . . . . . . . . . . . . . . 4 . Cláusulas cererisparibus y leyes no estrictas . . . . . . . . . . . . . . . . . . . . 5. Probabilidad y leyes probabilistas . . . . . . . . . . . . . . . . . . . . . . . . . . 6 . La naturaleza de las leyes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
125
50
126 136 144 149
156 166
+-
CAP~TULO 6. La medición en la ciencia . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . Magnitudes. Medición y metrización . . . . . . . . . . . . . . . . . . . . . . . . 2 . Función de la medición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3. Metnzación fundamental (*) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 . Metrización derivada (*) . . . . . . . . . . . . . . . . . . . . . . . . . :. . . . . 5 . Procedimientos de medición directa (*) . . . . . . . . . . . . . . . . . . . . . . . 6 . Procedimientos de medición indirecta (*) . . . . . . . . . . . . . . . . . . . . . . 7 . Consideraciones finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
173 173 180 184
199 205 211 215
CAP~TULO 7. La explicación científi.ca . . .'. . . . . . . . . . . . . . . . . . . . . . . . . 1 Explicación y explicación científica . . . . . . . . . . . . . . . . . . . . . . . . . 2 . Cobertura Iegal inferencia1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . Relevancia estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 . Pragmática de la-explicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5. Explicación y causalidad . . . . . . . . . . . . . . . . . . . . . .. . .. . . . . . . ... . . . . . . .r .....";)"?. . . .: . . ... ... . . P! . . ...... . .. . . . .< 6. Unificación teófha . . . . . .. .. ... .. .... 7 . Apéndice: Explisación t e l e o l ó ~ ~ % ~ ~ ~ n .@;... ' ~ o. .~.a. .] ;~ ~ ~ '... . :. . . " ."... ! . < ..... ... ! e .
.
$ "
S
. . . . s .
l i
i
.
s
.
t
"
.
.
.
<
\
..
S . . . .
.
: : \
i
tíeq
I
il
?.i :
.
C A P ~ ~ 9~.L Análisis O si.ncrónico de teorías 11 Las concdpkiartes hf%@rlcista$:4% . teorías como proyectos de investigación . . . . . . . .<>. . . . . . . .*: . . . . . . . . 1. La revuelta historicista y la naturaleza sincrónica de las t ~ o d b. . . . . . . . . . . . 2. Los paradigmas-matrices disciplinares de Kuhn . . . . . . . . . . . 1' . . 1 3 . Los programas de investigación de Lakatos . . . . . . . . . . . . . . . . . . . . . 4 . Las tradiciones de investigación de Laudan . . . . : . . . . P. . . . .:. . . . . . . : 5 . Consideraciones finales . . . . . . . . . . . . . . . . . . . . . . ...... ......... - + ...... CAPIWLO10. Análisis. sincrónico de teorías 111 Las comcepcioneS &iaSW&: 'lag ...... teorías como entidad'esmodeloteóricas . . . . . ; . . . .. . . . . . . <. .. .. . ?. . . . . :.. 1. Teorjas, enunciados y modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . " 2 . La noción de teorla de Suppes ... : . ; . . . . . . . . . . ..r ... . . ... L .." . ... ....... . . . . . ". ! . , ! ...... . . . 3 . Adams.y las aplicaciones intencionales . . . . . : . . . . . . . . . : ......... 4 . La familia sernanticista . . . . . . . . . . . . . . ..... .+-, .< . . . . . . .I . . . . . . . ... i 5 . La concep<riónestmct."ralista de ]as teoría&:: : . .*.> i: . \: i" .8 .. ::....:.. 6. Consideraciones finales . . . . . . . . . .:". . .. 4 . .;2!.G . . . . ... . .. ... +.. . .. .: I. . .
.
.
'..,5?d7," 251 256 . . 261
?
.
. Análisis sincrónico ded.teVfí%@LLa eb&ckpriióna%iOiii&~la&eon'":s ti"d: ' ' t i como cálculos interpretados. Y . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1. Teorías axiomáticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. Teorías y modelos . . . . . . .'L.?... . . . .... . . . . .* +.* ! - .; . . . . . . . . ? . . . 3. Caracterización general de las teorías empíricas camo~&rul'os irite~retados. : . 4 . Las regIas de correspondencia y la cuestión de la elirninabiridz~dde los t6rmintG teóricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5. La distinción teórico/observaciona1 y la naturaleza de la base ...... ......... .empírica 6 . Consideraciones finales . . . . . . . . . . . . . . : . e . . . .:. . . . . . .
C A P ~ L O8
219 219 224 243
.
.>S.
.VI
-Y;
267 267 .283 886 993 299 '397 309 309 311 318 320 325
S
.
'
?,
P.....
"
...L....
.
. .
i
.
:2
. '.i
S-
'*$o>
.o.
. . . , S .
.
.
.
..f.
.-
4
327 328
533 337 341
351 365
C A P ~ V L1O1 . Relaciones interteóricas . . . . . . . . . . . . . . . . . . . . . . . . . . . E 367 1 Concepto general de relación interteórica . . . . . . . . . . . . . . . . . . . . . . 367
.
.
2 . Teorización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . Reducció . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 . Equivale cia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 . Apéndice . Ciencia especial y ciencia básica; reducción. múltiple realizabilidad y superveniencia (*) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
CAP~TULO 12. La evaluación de teorías y el problema de la inducción . . . . . . . . . 1. Evaluación epistémica. El problema de la inducción . . . . . . . . . . . . . . . . 2 . Aproximaciones al problema de la inducción . . . . . . . . . . . . . . . . . . . . 3 . Justificaciones. grado de confirmación y lógica inductiva . . . . . . . . . . . . . 4 . Falsacionismo. grado de corroboración y verosimilitud (*) . . . . . . . . . . . . 5 . Complejidad de las teorías. anomalías y falsación . . . . . . . . . . . . . . . . . 6. Consideraciones finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . CAP~TULO 13. Análisis diacránico de teorías: El cambio teórico . . . . . . . . . . . . 1. La perspectiva diacrónica en filosofía de la ciencia . . . . . . . . . . . . . . . . . 2 . Cambio intrateórico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3. Cambio interteórico en general . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 . Cambio interteórico como incorporación . . . . . . . . . . . . . . . . . . . . . . 5 . Cambio interteórico como suplantación . . . . . . . . . . . . . . . . . . . . . . . 6. Consideraciones finales: Las formas del progreso científico . . . . . . . . . . . . APÉNDICE . Recordatorio de teoría de conjuntos . . . . . . . . . . . . . . . . . . . . . 1. Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 . Relaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . Funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 . Sistemas y morfismos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Referencias bibliográficas Índice onornástico
..................................
......................................
Índice temático expandido
..................................
La obra que el lector tiene en sus manos es, básicamente, un "libro de texto" para la enseñanza universitaria de la materia Filosofía de la Ciencia. Su finalidad principal es servir de guía a alumnos y profesores en un curso introductorio general de dicha materia. Ésta es la finalidad que ha determinado tanto la selección de los temas como el desarrollo de los mismos. La puesta en obra de un proyecto como éste exige por parte de los autores una serie de decisiones y compromisos de los que depende, para bien o para mal, el éxito de la empresa. En este caso, las características más destacadas de la obra que se derivan de las opciones tomadas por los autores son las siguientes. En primer lugar, se trata de una introducción temática, no histórica, a la materia. Aunque ambas aproximaciones son legítimas, y cada una tiene sus propias ventajas e inconvenientes, creemos que, en una introducción general a esta materia, es más conveniente centrarse en "los problemas mismos". Eso no excluye, obviamente, las referencias históricas a las diferentes tradiciones y escuelas. Además, en algunos de los temas, como los de la explicación y la estructura de las teorías, el estudio de los mismos sigue aproximadamente el orden histórico de las diferentes alternativas propuestas. En estos casos, el motivo de que la presentación temática siga el orden histórico es que la historia misma del problema tiene algo que enseñarnos. X veces, las primeras propuestas filosóficas no son las primeras por casualidad sino, casi podría decirse, por necesidad conceptual: ellas recogen las intuiciones más inmediatas y las expresan de la forma en principio más natural. Las alternativas posteriores sz encargan de corregir las eventuales deficiencias, poner de manifiesto aspectos más profundos y, llegado el caso, reformar alguna de las intuiciones originales. Cuando eso sucede, una comprensión cabal de las propuestas ulteriores, más desarrolladas y en cierto sentido "mejores", requiere haber percibido antes claramente el núcleo del problema en su versión más simple. Éste es el motivo por el que en algunos capítulos seguiremos en la exposición un orden parcialmente coincidente con el histórico. En segundo lugar, es una introducción temática a la filosofía general de la ciencia, no a la filosofía de las diferentes ciencias específicas. Eso quiere decir que 10s
temas elegidos se centran en problemas comunes a las diferentes ciencias y no en problemas específicos de algunas de ellas (como el de la medición en mechica cuántica, o el de la información en biología). Algunos filósofos que se dedican a la filosofía de una ciencia en especial ponen en duda que haya problemas filosóficos comunes a todas las ciencias. Defendemos la legitimidad de una filosofía general de la ciencia en el capítulo 1 ($3). Presuponiendo dicha defensa, aquí simplemente dejamos constancia de que, en esta introducción general no dirigida específicamente a estudiosos de una ciencia en particular, nos hemos limitado al ámbito de la filosofía general de la ciencia por considerarlo el más acorde con los intereses del lector al que esta obra va dirigida (para una buena introducción a la filosofía de las ciencias particulares, cf. Salmon et al., " 1992, partes I1,III y IV). En tercer lugar, ésta es una obra, en cieno sentido, "clásica". Es clásica en el sentido en que su núcleo principal se centra en temas y problemas "clásicos" de ]a filosofía de la ciencia. Por otro lado, la obra también pretende ser "completa" en tanto pretende abarcar los pfi:ncipaleS'de~e$osp ~ o b h sb4nsa&walejictde , Ips ccmcqgtos . científícos, lai leyes, la meaición, la explica&.ionQ~ndf?ca,lzwes~cpgr&~ gvoluci4$ipx red~cc* de teokis, ia contrahacihn y el problema de la hducci6r9. pretensi-64 cornpletud también lo es regPec\o del deSgriollo iblxio de los,$e&asi.&~o aqui i e b tkPid6 $< llegar a un equilibrio entre la exhaustividad del estudio y el espacio dispo$~le, y a ~isn&mente.~onsidera'bl-e:. Podriam6s h a b ~ r p f u n d i z a d m4.q a enalguqos @m*sa costa dé prescindir de &os, perd j s Ba paiecido un precio ex&six9;,sawificcar alsrligdD \os,temas - . que condderarnos 6ásicos en una intpbducci6n.a la1rnateria., . + - - - ,>-> , cuarto lugar, aunque cl6sica,-&t& obra p$etmd~ +&%.vezsqq :'aGfual:' y a .. En diiciPlina tan joven codó la1&or8fí%*ds~ b oY.Oa, y ;ea b q i i e se $roJuc,4ra, un ritmo inclux, superior al de las restahte3ai5diplhas filos6fi6aaFZps. inüodyciops t CP,-~,~ p g e t q l ~ s cok& el piiigrd de qukd&i&ie:riipidanient'e ~&%sadasi.~lnds~q~&ienfh!rne?t~ 4%eventuales * i -'*-- acnializaciones,heni4 intentado'que ik~p%senke&~Bl;he~~~kgq las*Ú&qa+ cpntribb$nes de interés en los dike~ehdsáfhbitl, en %PPgunosidsor.r&papuntada? +,t$do*a la falta de p&specti& para Valorar su asenta&bwto en la commi&d mtacigntíf$ila. , En 1dg6r,'adnque la dbr; prtsende nex $@tualen-,d seatido,$&icad&.;fib pretende serlo en o&b befitido, niás ~ s ~ ~ ~ i ~ e , ~ ~ ~ n ~ ~ab\$r&.allgum i ~ ~ ~ , . r , nos temes que hctualme~fedd&t&&Yando "ha~eenci8n&;m3chus, teó<~$~@e lx?cjepcia, principalmente s o c f ó l o ~ sy psio%ogo$ ddeak'oiemia. .E9 d. capiiulo pnrnqq defe'ndemos qbe, aúiique ie~a~iona&~s,~lb~Bil~~fda, @ soaii~bgíay J a psi~glsrgí?d~ fa Eiencja san disciplinas aferentes. 'IndF$@n%ietr&~mente .detal; Qefensa, s e $uedeadbci;,- $Le muchos aspectos de ids ~ & ~ d o l l a & s p r o r s o c ~ G ~iiqsic61ii& gps de 1%ei&énxia 8on relevante; para la fiFosofíaJf&t?ral de la oiencia.&Mp es cieqp. @n, 2s ?;?llcuando menos debatibld @re dicho5 sspectOs deban pr$q@tarp y"ra@l&a(s6 'en detalje en un estudib introauctOrio d6~2bisoiplina. 3% nqestmpyeoib, aun,gbq. pn. .clubs irnsprtantes, para qire 21' estrrdio tal@s%uestiones~noLresulteplesorientad~q,es ~oi$eniehte que,quieh las abordqciisponga ya de un bagaje sólido considerable en "los p&ble.m& ' ' ~ l á ~ i c o 'En s ~ ~este . sentida, nb !son.aspecto&wtfnf~guqtan bási(;o,s como los aquí priorizados, iues '&a apoxihicidn adecuada a:los .&mps exige ~ a ' ~ s í m i 1 ~ c iprevia ón +
*
bl
.
&$
a
v
I
,ttiL
. \ s .
de otros más fundamentales. El resultado, ante los necesarios límites de espacio, ha sido su exclusión. Somos conscientes de que ello supone cierta insuficiencia, pero lo único que cabe es asumirla y dar las referencias bibliográficas para que el lector interesado pueda completar nuestra presentación con el estudio de las fuentes correspondientes; para ello, el lector puede acudir a las entradas de los siguientes autores que se incluyen en la bibliografía: Barnes, Bloor, Johnson-Lair, Knorr-Cetina, Latour, Merton, Mulkay, Thagard y Woolgar. En sexto lugar, esta obra no incluye un estudio específico de las consecuencias de los temas tratados en relación a cuestiones filosóficas generales como las del significado de los términos teóricos, la naturaleza de la observación en el conjunto de la ciencia o el realismo científico. Dos tipos de consideraciones han hecho aconsejable prescindir de tal estudio: por un lado, la obra ya resulta considerablemente extensa en su presente forma y una exposición mínimamente adecuada de los problemas que se debían tratar superaba los límites exigidos; por otro, dada la naturaleza de los problemas filosóficos a tratar, esta tarea, incluso si no se pretende defender la propia opinión sino tan sólo presentar las diferentes alternativas, es mucho más difícil de realizar conjuntamente en un espacio razonable. La naturaleza de estos problemas es tal que, frecuentemente, la exposición de los mismos presupone ya cierto posicionamiento ante las diversas alternativas y los autores de esta obra no coinciden siempre en sus opiniones al respecto. Todo ello ha hecho aconsejable aplazar dicho estudio para una publicación futura, más breve, de carácter filosófico general en la que se expresen y defiendan las diversas posiciones sobre estas cuestiones. En séptimo lugar, aunque la obra pretende ser relativamente completa en el tratamiento de cada tema, el nivel general es introductorio. Se ha procurado presentar los diferentes problemas, y las principales posiciones en cada uno, del modq más básico posible. Obviamente esto supone en ocasiones cierta complejidad, pues los problemas mismos son complejos, pero se ha intentado en todo momento simplificar la exposición siempre que ello no afectase a la comprensión de las cuestiones involucradas. En cuanto al aparato técnico, el grueso de la obra apenas requiere ninguno y es por tanto accesible a cualquier lector sin formación específica previa. Únicamente algunas partes de algunos capítulos requieren cierto conocimiento del instrumental de la teoría intuitiva de conjuntos, conocimiento que muchos lectores deben haber adquirido en cursos previos. Para el lector que carezca de él, o para el que lo tenga olvidado, se incluye un apéndice sobre las nociones generales de la teoría de conjuntos en el que se presenta todo el instrumental necesario. En cualquier caso, las eventuales dificultades en el manejo del instrumental formal no debe afectar la comprensión y aprovechamiento de la mayor parte de la obra. En octavo lugar, aunque la mayor parte de la obra es de nivel introductorio, algunas secciones se han concebido para que puedan utilizarse, bien como profundización de algunas de las cuestiones vistas (como la medición o la inducción), bien como extensión de ellas (como la explicación teleológica o el problema de la reducción de las ciencias especiales a la ciencia básica). Estas secciones exceden ligeramente el nivel introductorio general y se pueden usar como guía pira cursos más especializados. Las correspondientes secciones se han marcado con un asterisco.
En noveno lugar, dado su carácter de libro de texto, en esta obra no se defienden tesis filosóficas sustantivas. Obviamente los autores tienen sus propias opiniones, muchas veces coincidentes, sobre muchos de los problemas y cuestiones que se analizan. Pero la finalidad principal no es exponer las propias ideas, sino presentar del modo más claro y neutral posible las de aquellos filósofos o corrientes que han realizado contribuciones de reconocida importancia en los diversos ámbitos tratados. Por ello, las propias opiniones filosóficas de los autores no han influido en el desarrollo de la obra, o al menos así se ha pretendido. Lo único que ha determinado la concepción y desarrollo de la obra es cierta posición metafilosófica general, expuesta explícitamente en el capítulo 1 ($2), que entiende la filosofía de la ciencia como el análisis de los principales conceptos vinculados a la actividad científica (como los de aplicación, ley, contrasración, etc.) y de los productos resultantes de dicha actividad, las teorías científicas. Compartir esta perspectiva metafilosófica general, además de una idea común sobre cuáles son los temas centrales para una introducción a la disciplina y qué es lo fundamental en cada uno de ellos, ha sido la condición de posibilidad para realizar una obra como ésta conjuntamente. Como única concesión a la propia posición filosófica de los autores, quizás deba contarse la presentación detenida que en tres cuestiones se hace del análisis estructuralista de las mismas. Ambos autores son de la opinión que el estructuralismo metacientífico proporciona un análisis particularmente interesante de los aspectos estructurales de las teonas y de sus relaciones mutuas. Lndependientemente del acuerdo o no con esta comente, no se puede negar que el estructuralismo es la escuela metacientífica que más ha desarrollado tal análisis y que más rico instrumental reconstructor ofrece. Por ello, y no por mera profesión de fe, hemos presentado con detenimiento el análisis estructuralista de la estructura de las teorías (cap. 10 $5), de las relaciones interteóricas (cap. 11) y de los aspectos estructurales d.el cambio teórico (cap. 13). Una última observación relativa a las referencias bibliográficas. Las citas se han realizado, salvo que se advierta lo contrario, sobre las ediciones originales. Para facilitar el acceso a las fuentes a lectores que manejan ediciones traducidas, y cuando la mención del parágrafo, sección o apartado es suficientemente precisa, la referencia de la cita no menciona la página de la edición original sino sólo la sección (parágrafo o apartado); únicamente cuando tal procedimiento dejaba la referencia bibliográfica impracticablemente amplia se ha indicado la paginación original. Por otro lado, el texto contiene numerosas referencias bibliográficas complementarias en cada uno de los temas. La finalidad de tales referencias es que el lector pueda completar o ampliar el estudio de la parte correspondiente acudiendo a las fuentes. Éstos son los principales criterios que se han seguido en la elaboración de este texto. El núcleo temático lo conforma la tríada "conceptos-leyes-teorías", en tomo a cuyos componentes se presentan los restantes temas: medición, explicación, relaciones interteóricas, inducción y cambio teórico. El contenido está pensado para poder agruparse en dos partes, susceptible cada una de ser trabajada en un curso semestral. La primera parte, centrada en los conceptos y las leyes científicas, incluye los capítulos 4 (conceptos científicos), 5 (leyes), 6 (medición) y 7 (explicación); la segunda, centrada en las teorías, los capítulos 8 a 10 ( e s t ~ c t u r asincrónica de teorías), 11 (relaciones interteóricas), 12 (evalua-
ción de teorías y el problema de la inducción) y 13 (cambio teórico). En la primera parte se puede incluir también el primer capítulo, que contiene la introducción conceptual a la disciplina y un breve repaso de su historia. El capítulo 2 es instrumental, presenta las nociones de argumento deductivo y argumento inductivo que se van a usar por extenso a lo largo de la obra. El lector familiarizado con las mismas puede prescindir de él, o de la parte que considere conocida; pero debe asegurarse bien de que conoce lo que a q u í se expone, en particular sobre los argumentos inductivos, pues se incluyen algunas consideraciones sobre estos argumentos a las que se recurre en varios lugares de la obra y que no suelen tratarse en las exposiciones introductorias usuales. Por último, en el capítulo 3 se realiza una presentación muy básica y estrictamente metodológica de los procedimientos de contrastación de hipótesis. En este capítulo no se abordan los aspectos filosóficos de la contrastación, cuyo estudio se pospone hasta el capítulo 12. Este capítulo metodológico puede tratarse, bien como uno de los capítulos introductorios en la primera parte, bien como introducción metodológica al capítulo 12 en la segunda parte, bien como tema aislado en cursos metodológicos generales de otras disciplinas. Las dependencias conceptuales e instrumentales entre los capítulos se expresan, de derecha a izquierda, en el siguiente gráfico. Las Iíneas continuas indican que la dependencia es fundamental, no se puede abordar satisfactoriamente el estudio de un tema sin haber realizado previamente el del otro; las líneas discontinuas indican que la dependencia es sólo parcial, el estudio previo de un tema es conveniente, pero no imprescindible, para el del otro.
Durante la elaboración de una obra como ésta, muchas son las personas e instituciones que han contribuido a que la tarea inicialmente concebida Ilegue a su fin. Maria Ramon Cubells, Manuel García-Carpintero, Joan PagCs, Manuel Pérez Otero y David Pineda han leído versiones previas de la obra y han realizado numerosas y detalladas críticas, correcciones y sugerencias. A ellos debemos agradecer la mayoría de mejoras introducidas en la versión definitiva, además de la inestimable ayuda que su buena disposición y paciencia han representado para la ardua tarea de revisar el mecanuscrito original. Ramon Cirera, José Luis Falguera, Andoni Ibarra, Josep Macih, Eulalia Pérez Sedeño, Francesc Pereña y Daniel Quesada han leído partes de la obra y han realizado también importantes correcciones y sugerencias. La señora Margrit Barrios ha transcrito parte del material. Javier Donato ha realizado una cuidada revisión de las pruebas de imprenta. A todos ellos queremos expresar nuestro más sincero agradecimiento. Muchas otras personas han contribuido a la gestación y desarrollo de este proyecto, especialmente los alumnos de las diversas universidades de España, Ivféxico y Alemania en las que los autores han
impartido sus cursos de filosofía de la ciencia. Por último, deseamos agrddecer a la DGICT (Ministerio de Educación español, proyectos PB92-0846-C06-06 y PB95-0125C06-05). a la CIRIT (Comissionat per a Universitats de la Generalitat de Catalunya) y a la Fundación BBV la ayuda económica con la que a través de diferentes proyectos han contribuido a la consecución de esta obra. Barcelona / Munich, julio de 1997
1. L a ciencia como objeto. Los estudios sobre la ciencia
El conocimiento científico es el resultado de determinada práctica o actividad específica que podemos denominar, en sentido amplio, teorización, y la filosofía de la ciencia consiste en un determinado tipo de saber reIativo a dicha práctica. Para clarificar la naturaleza y función de la filosofía de la ciencia es preciso distinguir dos sentidos en que se puede hablar de "saber" en reIación con una práctica o actividad. En un primer sentido, el saber relativo a una actividad consiste simplemente en realizar dicha actividad satisfactoriamente; en otro sentido, el saber relativo a una actividad consiste en conocer y ser capaz de formular explícitamente determinadas propiedades o características de esa actividad. Consideremos, por ejemplo, la actividad de proferir oraciones gramaticales, o la de argurnetztar. Una cosa es saber realizar estas actividades correctamente y otra muy distinta es saber en qué consiste realizar estas actividades correctamente. Debe quedar claro que lo primero no es condición suficiente para lo segundo. Se puede saber hablar correctamente sin saber formular en qué consiste ello exactamente, y se puede argumentar correctamente sin ser capaz de explicar qué es una argumentación correcta. En ambos casos se tiene cierto conocimiento implícito, puesto que la actividad se realiza correctamente, pero hace falta realizar una tarea adicional para ser capaz de hacer explícito dicho conocimiento implícito. Eso es lo que hace la Grarnática en el caso de las preferencias gramaticales, o la Lógica en el caso de las argumentaciones. Y hay por supuesto muchos otros hechos relativos a estas prácticas que, por no consistir en reglas para su correcta realización, ni siquiera se conocen implícitamente; hechos tales como el desarrollo histórico de las prácticas, o sus características o variaciones etnosociales. La capacidad de realizar correctamente una actividad, por tanto, no basta por sí sola para poder formular explícitamente en qué consiste la práctica correcta de dicha actividad. Por otro lado, si bien quizás menos manifiesto, es igualmente cierto que lo primero tampoco es condición necesaria para lo s e p d o . Aunque poco probable, es posible que alguien conozca explícitamente las reglas que rigen la argumentación correcta
y que, por ejemplo debido a algún tipo de disfunción cognitiva, no sea capaz de aplicarlas y argumente en general incorrectamente. 0, para tomar ouos ejemplos menos controvertidos, es claro que se puede ser un excelente entrenador de un deporte y ser un pésimo jugador del mismo, o que se puede ser uti comperente crftica de arte y ser un perfecto desastre como artista. Estas consideraciones se aplican también. en principio, a esa actividad que hemos denominado, en sentido amplio, tcori:ar. Teorizar, como hablar o argumentar, también es una actividad que se puede realizar correctamente sin saber formular explícitamente las reglas que la guían, ni por supuesto otros hechos histónco-sociales relativos a ella. Sin embargo, teorizar, a diferencia de proferir oraciones gramaticales o argumentar, es una práctica que genera un cuerpo de saber explícitamente formulado acerca de cierto ámbito. El resultado de realizar correctamente un actividad no consiste en general en la formulación explícita de cierto saber sobre determinado ámbito. El resultado de realizar correctamente la proferencia de oraciones gramaticales produce proferencias correctas, y éstas no tienen por qué consistir en general en la formulación explícita de saber sobre cierto ámbito; el resultado de argumentar correctamente produce argu1nentacioizes correctas, y éstas no consisten en saber explícito sobre determinado ámbito. Esto es todavía más claro de otras prácticas, como las deportivas o las artísticas; sea lo que sea el resultado que genera practicar correctamente un deporte, es claro que no consiste en la formulación de un cuerpo de conocimiento. Pues bien, en este aspecto la práctica de teorizar es peculiar, pues el resultado que genera es la formulación explícita de cierto conocimiento sobre determinado ámbito. Así, si denominamos "saber" en sentido estricto a la formulación explícita de cierto conocimiento, entonces teorizar produce saber en sentido estricto, mientras que proferir oraciones gramaticales, argumentar o practicar un deporte, no. En este sentido se puede considerar que teorizar es (genera) saber explícito. Ahora bien, el contenido del saber explícitamente formulado en cierta teorización espec9ca no versa (en general) sobre la teorización misma, sino sobre otro objeto o dominio. El conocimiento formulado explícitamente en cierto teorizar no consiste en la explicitación de las prácticas seguidas implícitamente en ese teorizar, ni tampoco en la formulación de sus peculiaridades socio-históri~as.Estas cosas son (o pueden ser) objeto de estudio y de formulación explícita de otro teorizar, que toma así el primero como su objeto. El resultado de este nuevo teorizar es también un saber en sentido estricto, pero es un saber de otro orden o nivel. Decimos que es un'saber de segundo orden, un saber que tiene otro saber por objeto, saber-objeto que se considera en ese contexto un saber de primer orden. En general, los saberes de primer y segundo orden son, en cada contexto, diferentes; por ejemplo: economía y sociología de la economía, biología y filosofía de la biología, filosofía de la física e historiografía de la filosofía de la física, etc. Pero hay al menos un tipo de saber que parece reflexivo, en el sentido de que se estudia a s í mismo, y ése es la filosofía. No nos referimos sólo a la iteración de estudios de segundo orden. Se pueden hacer estudios históricos de las teorías biológicas, y tambien estudios históricos de los estudios históricos de las teorías biológicas. Pero la historiografía biológica y la historiografía de la historiografía biológica son disciplinas diferentes, el saber-objeto de la primera son teorías biológicas, el de la segunda son teorías históricas. Esta distinción, en
cambio, no puede trazarse de manera tan tajante en filosofía, la cual, cuando se itera, parece reflexiva en un sentido específico que la distingue de las demás disciplinas de segundo orden; en filosofía, Ia iteración no parece generar un nuevo nivel de teorización. Así, mientras que la historiografía de la disciplina x y la historiografía de la historiografía de la disciplina x son teorizaciones de segundo orden diferentes, y lo mismo sucede por ejemplo con la sociología, ello no está nada claro en el caso de la filosofía. Por ejemplo, apenas tiene sentido hablar de la filosofía de la filosofía de la biología (o del derecho, o etc.) como algo diferente de la filosofía de la biología (del derecho, etc.) misma. En principio parecería que sí, que el objeto de la primera son las teorías biológicas, mientras que el de la segunda son las teorías filosóficas sobre las teorías biológicas. Pero en este caso el estudio filosófico de las teorías biológicas no se distingue del estudio filosófico de las teorías filosóficas de las teorías biológicas. En esto consiste el carácter reflexivo de la actividad filosófica, carácter que se deriva de la naturaleza de la filosofía como análisis conceptual. La actividad científica es una de las formas de esa práctica que hemos denominado genéricamente teorización. Como toda teorización, la teorización científica sobre los diferentes ámbitos de la realidad genera diversos saberes, los cuales pueden a su vez ser objeto de estudio de nuevas teorizaciones (científicas o no). Como se ha sugendo en el párrafo anterior, hay por lo general más de una dimensión desde la que se pueden estudiar las teorizaciones científicas. La investigación metacientífica tiene por objeto determinar ciertos hechos o propiedades de la investigación científica y no todos esos hechos o propiedades, aunque indudablemente interrelacionados, son exactamente del mismo tipo, requieren del mismo tipo de investigación. Así, cada uno de los aspectos de la actividad científica abre una dimensión desde la que se puede estudiar dicha actividad, da lugar a un saber de segundo orden específico. Llamaremos esrudios rnetacientcjkos, o estudios sobre la ciencia, a las diversas teorizaciones de segundo nivel sobre las teorizaciones científicas de primer nivel, y distinguiremos al menos cuatro aspectos diferentes de la actividad científica susceptibles de investigación metateórica: el psicológico, el sociológico, el histórico y el filosófico. La distinción entre los correspondientes ámbitos metacientíficos no se pretende tajante sino gradual, pero no por ello es menos importante. La filosofía de la ciencia, por tanto, pertenece al campo de los estudios metacientíficos, pero es sólo una parte de ellos; no es ni historiografía de la ciencia, ni psicología de la ciencia, ni sociología de la ciencia, aunque está relacionada con todas ellas. Por otro lado, la filosofía de la ciencia pertenece también al campo de los estudios filosóficos, pero es sólo una parte de ellos; no es ni lógica, ni filosofía del lenguaje, ni filosofía de la mente, ni filosofía de la técnica, aunque está relacionada con todas ellas. Estas afirmaciones pueden parecer obvias, y a nuestro juicio lo son, pero conviene recordarlas. Es inadecuado tomar estas distinciones de un modo rígido, pero igualmente, o más, incorrecto es negarlas. La fluidez de estas distinciones sólo supone una mayor dificultad en su fundamentación, no su inexistencia. Es cierto que "todo es cuestión de grado", y que todo tiene que ver con todo, pero no todo es lo mismo. Entre el sueño ilusorio de las distinciones rígidas y el caos paralizante de la indistinción absoluta se encuentra el mundo real de las distinciones graduales. Una justificación precisa de la naturaleza y límites de estas distinciones
requiere una discusión metafilosófica que excede los límites de esta introducción. Nos limitaremos pues a unas breves consideraciones para motivar nuestra posición. El método correcto en filosofía, en tanto que análisis conceptual, exige fijar la atención en las intuiciones más firmes sobre nuestros conceptos y, "teorizando" sobre ellas, explicarlas, y a la vez. arrojar nueva luz sobre otras "situaciones conceptuales" menos claras, proceso éste que puede exigir, siempre como última instancia, la revisión de algunas de nuestras intuiciones originales. Parte de esta tarea es común a toda disciplina explicativa: a partir de ciertos casos paradigmáticos se desarrolla una "teona" que los explique y, a la vez, pueda dar cuenta de nuevos casos menos claros, siendo posible, aunque inusual, modificar a lo largo de este proceso nuestras ideas originales sobre algunos de los casos paradigmáticos. Lo peculiar de la filosofía es, fundamentalmente, que los datos básicos que en ella manejamos son las intuiciones que tenemos sobre nuestros propios conceptos, un temtorio por lo general más movedizo que el del resto de disciplinas. Estas observaciones muestran que, para ciertos fines, puede ser suficiente ilustrar las diferencias que se quieren destacar mediante la presentación de algunos ejemplos paradigmático~.Tal es nuestro caso. No vamos a intentar siquiera ofrecer Q e s b u a r una teoría metafilosófica sobre la natural,%zrtde la filosofía de la ciencia y sii diferencia respecto de otras disciplinas, tanto metacientíficas como filosóficas; nos limitaremos a presentar unos pocos ejemplos que expresan, en nuestra opinión de forma clara, las intuiciones que queremos destacar. Los que siguen son ejemplos claros d e cuestiones que corresponden a diferentes disciplinas, y muestran que tenemos conceptos diferentes de cada una, por más que estén estrechamente relacionadas y de que respecto de otros ejemplos nos sería más difícil establecer, fuera de toda duda, la asignación a una disciplina dada. Historiografía de la ciencia: ¿a quién corresponde la prioridad histórica en el establecimiento del principio de conservación de la energía?, jcómo influyó el descubrimiento del telescopio en el debate entre geocentristas y heliocentristas? Sociología de la ciencia: ¿qué papel juegan las instituciones estatales en la constitución de las comunidades científicas?, jcuáles son los criterios de aceptación de un nuevo miembro de una comunidad científica? Psicología de la ciencia: ¿hay algún patrón común de comportamiento individual asociado a la pérdida de confianza en una teoría en los períodos de crisis científica? Filosofía de la ciencia: ¿cuál es la diferencia entre una generalización accidental y una ley?, ¿en qué consiste la distinción entre términos teóricos y términos no teóricos? Filosofía del lenguaje: ¿depende el valor veritativo de una oración sólo de las entidades denotadas por las partes de la oración, o depende también de los modos en que éstas denotan a aquéllas?, jllevan asociados los nombres propios modos de presentación? Filosofía de la mente: jtienen los estados mentales poder causal?, jexpresan los predicados mentalistas conceptos funcionales? Podríamos seguir con más ejemplos, pero los mencionados bastan para mostrar que, al menos a veces, las diferencias, aunque graduales, son claras (y ello, por supuesto, independientemente de que incluso para responder "hasta el final" a cuestiones como las planteadas sea preciso muchas veces usar conocimiento de las otras disciplinas). Pues bien, ¿qué muestran, por lo que a la filosofía de la ciencia se refiere, estos ejemplos?, ¿en
qué consiste su especificidad?, ¿qué la distingue de las otras disciplinas? La respuesta general más apropiada, aunque parezca tautológica es: del resto de los estudios sobre la ciencia se distingue por su carácter filosófico, y del resto de disciplinas filosóficas se distingue porque su objeto es la ciencie Que su carácter es filosófico significa que se ocupa principalmente de problemas conceptuales, esto es, de arrojar luz sobre los conceptos relativos al objeto en cuestión. Esto distingue la filosofía de la ciencia de la historiografía, la sociología y la psicología de la ciencia; ello, una vez más, no presupone tampoco que haya una distinción rígida entre cuestiones de hecho y cuestiones conceptuales. Que su objeto es la ciencia la distingue de otras disciplinas filosóficas y en especial de la filosofía de la técnica y del lenguaje: ciencia, técnica y lenguaje son todos ellos productos culturales humanos íntimamente relacionados, pero no son el mismo producto. Resumiendo, la filosofía, en tanto que análisis conceptual, es un saber sustantivo de segundo orden, interrelacioptilo tanto con otros saberes de segundo orden como con losb saberes usuales de primer orden. La filosofía de la ciencia tiene por objeto poner de manifiesto o hacer explícitos los aspectos filosófico-conceptuales de la actividad científica, esto es, elucidar conceptos fundamentales de la actividad científica, como los de le)?, contrastacián, explicacidn o medición, y reordenar conceptu2lhente o reconstruir esos sistemd de" conceptos producidos por la ciencia que son las teorías científicas. En ambas tareas se ve influida por, y debe tomar en cuenta, tanto otros estudios de la ciencia (historiografía, psicología, sociología), como las ciencias mismas, así como otras áreas de la filosofía, pero ello no la vacía de contenido ni la disuelve en otros saberes. Veamos ehora con un poco más de detenimiento en qué consiste la tarea específica de nuestra disciplina.
2. L a ciencia como objeto de estudio filosófico. La filosofía de la ciencia
Los científicos, por regla general, suelen mirar con cierta desconfianza a los filósofos de la ciencia. ¿Qué más hay que saber de la ciencia que lo que ellos ya saben?; en cualquier caso, ¿quién mejor para saber lo que es la ciencia que el que la practica?, ¿quién que no sea un científico consumado puede decir algo sensato sobre la ciencia? Esta actitud está en parte justificada y en parte no. Está justificada en la medida en que, ciertamente, no se puede decir nada sensato sobre la ciencia siendo un ignorante en ella; de hecho, muchos de los más importantes filósofos de la ciencia han dispuesto de una formación científica considerable. Pero no está justificada en tanto confunde saber ciencia con saber qué es la ciencia, saberes que corresponden a niveles o ámbitos diferentes. Hay algo más que saber de la ciencia que sus contenidos, como hay algo más que saber de una lengua que el hablarla. Hemos visto que en un sentido importante de 'saber', el saber relativo a una actividad no se agota en practicarla, queda todavía saber en qué consiste practicarla, ser capaz de formular las reglas o principios que se siguen. Lo primero no es condición suficiente de lo segundo, se puede realizar correctamente la práctica sin ser capaz de explicitar las reglas seguidas, si bien, ciertamente, hay que suponer el conocimiento implícito o inconsciente de las reglas involucradas; todos hablamos correctamente antes de recibir cursos de gramática, y la mayoría de gente que argumenta bien no ha estudiado
20
FüND.;\i\lEir;TOS
DE F I L O S O F DE ~ ~ LA CIENCIA
jamás lógica. Y aunque es obvio que ser un practicante competente de una actividad facilita por lo general la investigación sobre la misma, ya vimos que, estrictamente, lo primero tampoco es condición necesaria de lo segundo. Lo misma se aplica, mutatis mutandis, al caso de la práctica científica y su relaci6n con los principios que la rigen. La tarea del filósofo de la ciencia es investigar los principios que rigen esta actividad, principios que, si suponemos que son seguidos implícitamente por 10s científicos, la hacen comprensible. Vamos a ver a continuación que esta tarea involucra tres dimensiones diferentes pero, contra lo que se suele sugerir, complementarias, a saber, las dimensiones descriptisa. prescripriva e interpretativa. A veces se intenta caracterizar la naturaleza de la filosofía de la ciencia en el contexto de la dicotomía "descripción/prescripción" y se discute cuál de las dos funciones ha de desempeñar la disciplina, si la normativa o la descriptiva ,(un caso notorio de discusión en estos términos lo representa la polémica entre Pofiper, fakatos y Kuhn sobre la falsación, cf. cap. 12 $5). Según los partidarios de la perspectiva normativa, la tarea de la filosofía de la ciencia consiste en imponer normas que se supone deben seguir los científicos en su práctica, y ''juzgarles" o evaluarles de acuerdo,,con tales normas. Para los partidarios del descnptivismo, eso no tiene ningún sentido y lo tlIlico que cabe es describir cómo operan de hecho los científicos. En nues& opinión, este modo de plantear la cuestión es completamente confundente. En primer lugar, descripción y prescripción, aplicados al análisis de la actividad científica, no son excluyentes. No se trata de dos cuernos' de un dilema sino de dos caras de una misma moneda. En segundo lugar, estos aspectos no cubren sino parcialmente la función de la filosofía de la ciencia. Junto a ellos, esta disciplina tiene también una dimensión interpretativa fundamental. Por decirlo brevemente: algunas de las tareas de la filosofía de la ciencia son a la vez descriptivo-normativas, y otras son interpretativas. O más exactamente, en casi todas están presentes ambas dimensiones, en unas prima más el aspecto descriptivo-normativo (p.ej. ante el estudio de la contrastación de hipótesis), en otras ambos tienen análoga presencia (p.ej. el análisis de la explicación científica o el de la evaluación teórica), y en otras, por último, domina la dimensi6n interpretativa (p.ej. el análisis y reconstrucción de teorías). Contra lo que muchas veces se ha sugerido, descripción y prescripción no siempre se oponen. En concreto, no se oponen cuando son relativas a las prácticas convencionales: . las prácticas convencionales se atienen a convenciones o reglas, y la descripción de tales convenciones tiene implicaciones normativas. O bien, viéndolo desde el otro lado, 'establecer prescripciones-normas' es una expresión ambigua. En un sentido significa imponer. normas, reglas o mandatos para dirigir una actividad o conducta previamente no regulada; ejemplos paradigmáticos de ello son algunas normas de circulación o, sobre todo, la "invención" de un juego. En otro sentido, significa investigar y hacer explícitas las reglas, normas o .convenciones que rigen ya de hecho cierta actividad o conducta. La primera tarea no es a la vez descriptiva (en el sentido interesante de 'descripción', las reglas de un juego no son descriptivas), la segunda sí. La clave para comprender el segundo tipo de tarea es el concepto de convención (para un análisis exhaustivo de este concepto, cf. Lewis, 1969). Las convenciones, a diferencia de los mandatos explícitos, son normas que han devenido tales sin que medie
2
ningún acto de imposición arbitraria o decisión explícita colectiva (p.ej. la convención de
34
los conductores de avisar mediante ráfagas luminosas la presencia de la policía). Una actividad convencional es pues una actividad que está regida por normas seguidas implícita o inconscientemente por los que llevan a cabo dicha actividad. Pero las convenciones son normas y por tanto las actividades convencionales son susceptibles de llevarse a cabo correcta o incorrectamente, siguiendo las reglas o no. Quizás se diga que en este sentido las leyes naturales que rigen todos los entes sin conciencia son convenciones, que la actividad de estos seres es convencional, pues "siguen" estas leyes-reglas inconscientemente. Podemos hablar como queramos, pero desde luego no es eso lo interesante. No se suele usar así el término, no sólo para los entes inanimados, sino tampoco para muchos seres animados, incluso aunque se les atribuya ciertas capacidades cognitivas o representacionales. No sólo no decimos que la actividad de un átomo sigue una convención, tampoco lo &cimos de una bacteria o un perro, aunque al menos este último es probablemente un ser con cierta capacidad cognitiva. Es claro que 'convencional' sólo se aplica a actividades de seres susceptibles de desarrollar capacidades representacionales especialmente complejas, en particular capaces de tener determinado tipo de representaciones de segundo orden. Para seguir una convención no basta tener estados representacionales conativos (deseos) y doxásticos (creencias) básicos, hay que tener además representaciones de segundo orden: creencias sobre las creencias y deseos de otros, creencias sobre las creencias de otros acerca de nuestras creencias y deseos, etc. Esto es lo fundamental, y sean lo que sean estos estados, involucren o no la conciencia, y por mucho que, caso de que la involucren, no tengamos mucha idea de qué es la conciencia, el caso es que claramente no todos los seres con capacidades representacionales disponen de este tipo de representaciones de segundo orden. Por tanto, no todo comportamiento guiado por reglas se puede calificar de convencional, ni siquiera cualquier actividad regulada que requiera alguna capacidad representacional. Sólo son convencionales las conductas reguladas cuya realización supone el uso de representaciones de segundo orden específicas. Por lo que sabemos, parece que sólo el ser humano dispone de estados representacionales con esas características, y por tanto que sólo él es capaz de desarrollar conductas convencionales (ésta es una cuestión empírica abierta que, en cualquier caso, no afecta lo que sigue). Hay muchas actividades humanas convencionales, por ejemplo, el tipo de saludo específico de cada comunidad, o la mencionada práctica entre los conductores de indicar mediante ráfagas la presencia de la policía. La actividad humana convencional más paradigmática es sin duda el uso del lenguaje, el hablar determinada lengua. El Ienguaje es convencional y por eso es normativo, porque está sometido a reglas. Hablar un lenguaje es fundamentalmente seguir reglas, las reglas lingüísticas gramaticales, semánticas y pragmáticas, que son convencionales en el sentido apuntado (cf. Lewis, op. cit., cap. 5, y también Grice, 1957). Hablar consiste en (intentar) seguir unas reglas implícitas en la comunidad en la que se desarrolla la actividad y por ello es una actividad que se puede desarrollar correcta o incorrectamente, esto es, una actividad susceptible de evaluación. Hay muchas otras actividades humanas convencionales reIacionadas, en sentido más o menos laxo según el caso, con el lenguaje. Cada una de esas actividades tiene una finali-
FUND.4MEh'TOS DE FILOSOF~DE LA CIENCIA
dad y está regida por un sistema implícito de reglas que, de seguirse correctamente, conducen a la consecuci6n de la finalidad en cuesti6n. Actividades de ese 'tipo son, por ejemplo, real~:ar~proferenciasgramaficdt?~(que es parte constituyente de la actividad de hablar un lenguaje), argurnenrar, expli~aro seoricar. Como ya señalamos más arriba, en relación a estas actividades regidas por reglas
hay dos sentidos en que se puede hablar de1 conocimienfo d$ las reglas. El primero es un conocimiento implícito, que consiste en realizar con éxira la actividad, en seguir las reglas; a los que practican correctamente la actividad hay que atribuirles el conocimiento implícito de las reglas. El sesundo es conocimiento exptíciio, saber en qué consiste practicar correctamente la actividad, y a él se llega mediante una tarea o investigación .de segundo orden. La función de las disciplinas que+IlEviina cabo esta investigación (p.ej. parte de ia Lógica, parte de Ea Gra*tica) es hacer' explkitas las reglas que rigen las actividades m cuestión, descubrir y d%ribir el conyunto de normas~conv~ncione~en cuy* seguimiento consiste e1 de$'atrolJo e#itosoUdela actividad. PeW entonces es' cl&o qke $ función de tales disciplinas es a la ves descriptiva y no?-mativa (o evaluativa). Al hacer explícitas, al describir, las reglas que rigen la actividad, permiten evaluar si tales reglas se han seguido o no en un caso concreto, si la actividad se ha llevado a cabo correctamente. O mejor dicho, hacer explícitas las reglas y evaluar la actividad son en este caso dos caras de la misma finalidad. Resumiendo: describir normas o convenciones en cuyo intento de seguimiento consiste una actividad es a la vez dar criterios de evaluación sobre la realización correcta o incorrecta de dicha actividad (y por tanto tabbién sobre el éxito o fracaso del fin perseguido con ella). Pues bien, sucede que hacer ciencia es parcialmente semejante, en 'el sentido indicado, a -argumentar o hablar una lengua, a saber, una actividad humana regida también por ciertas reglas-convenCiones'implícitas.En este caso se trata de una maero-actividad que consta de un cúmu'lo de otras actividades menores, p.ej., contrastar hipótesis, realizar experimentos, dar explicaciones, formular teonáS, etc. En este sentido, al menos parte de la filosofía de la ciencia tiene por tarea hacer'explícitas las reglas que rigen las diversas partes de esa actividad que es hacer ciencia. Y al igual que los buenos argumentadores saben argumentar sin ser por ello capaces de decir en qué cOnsiste argumentar bien' (tarea del 16~ic8),los buenos científicos que, por ejkmplo, saben contrastar (cdkectamen. te) sus hip6tesis no tienen por ello por qué ser capacés de decir en qué consiste realizar una buena contrastación, ésa es la tarea del filósofo de la ciencia (y si algún científico realiza esta tarea, no lo hace qwa 'cfentífico sino qua Pilóso$o ¿Fe la ciencia). En consecuencia, también la filosofía de la ciencia (o.al menos parte de ella) es a la vez descriptiva y normativa: describiendo las reglas que rigen, por ejemplo, ja contrastación correcta, evalúa casos concretos de esa actividad. En este sentido e's pre~erfptivao normativa: dice cómo hay que hacer las cosas. Pero no es normativa en olro sentido más radical; no dlce cómo hay que hacerlas porque ella lo diga, porque ella "lo decida", autónomamente, inde- ' pendientemente 'de Ia actividad científica por así decir. Justamente lo contrario, especifica cómo hay que hacerlas porque ésas son las reglas qrie rigen dehecho la práctica científica, esto es, hace explícitas las cowenciones que siguen implícitamente los cientrficos. Estas consideraciones dan cuenta de la naturaleza de parte de la filosofia de la
ciencia y sugieren que la mayoría de las polémicas sobre el presunto dilema descriptivismo-prescriptivismo son vacuas, pues estos dos conceptos conforman una dualidad pero no un dilema. Algunas disciplinas pueden ser, en alguna de sus partes, a la vez descriptivas y normativas, y la filosofía de la ciencia es una de ellas. Ahora bien, asentado este punto hay que advertir inmediatamente que la dimensión descriptivo-normativa no es la única. Por ejemplo, una de las tareas de la filosofía de la ciencia es el análisis y reconstrucción de las teorías científicas y, como veremos, ese análisis no es una tarea descriptivo-normativa sino inrerpretnriva. Así, además de su dimensión descriptivo-normativa, la filosofía de la ciencia tiene también una dimensión interpretativa fundamental. La filosofía de la ciencia tiene por objeto la actividad científica. Esta actividad involucra prácticas regidas por normas-convenciones y la explicitación de estas convenciones constituye la parte descriptivo-normativa de la filosofía de la ciencia. Pero la actividad científica no sóio involucra prácricas convencionales, también involucra esencialmente entidades, constructos científicos. Contrastación, medición o experimentación son ejemplos de prácticas científicas; conceptos, leyes y teorías son ejemplos de constructos científicos. El análisis metacientífico de las prácticas tiene un carácter descriptivo-prescriptivo, el análisis metacientífico de las entidades científicas es esencialmente interpretativo. Ya hemos visto con cierto detalle en qué consiste su carácter descriptivo-normativo, nos detendremos ahora brevemente en la dimensión interpretativa. Como en muchos otros campos, la investigación teórica de cierto ámbito de la realidad y de las entidades presentes en el mismo (investigación que en nuestro caso es metateórica, pues se trata de formular teorías -filosóficassobre las teorías científicas y sus diversos componentes) consiste en desarrollar cierta interpretación de dicho ámbito. Las entidades o constructos científicos constituyen un ámbito de la realidad específico, un ámbito que en este caso es parte de la realidad culrural, y su estudio es pues fundamentalmente interpretativo. Como cualquier otra ciencia de la cultura que haya alcanzado un mínimo nivel de abstracción y de articulación sistemática, la filosofía de la ciencia se caracteriza por construir modelos interpretativos de las entidades estudiadas, en nuestro caso los constructos científicos. Estos modelos interpretativos no son, por su naturaleza más propia, ni códigos de conducta, ni recuentos de datos; por el contrario, se trata de marcos teóricos, que usan conceptos específicos, generalmente de un considerable nivel de abstracción e "idealización", cuya finalidad es hacer inteligibles las estructuras esenciales de ese vasto edificio que es la ciencia, o al menos partes de él. La forma de discurso que conviene a tales modelos no es ni la forma prescriptiva ni la descriptiva, ni siquiera en su versión sintética descriptivo-prescriptiva que hemos visto para el caso de las prácticas científicas. Por lo que a las entidades o constructos científicos se refiere, no se trata de normar el modo como "deben ser", pero tampoco de establecer una lista de enunciados que reflejen especularmente supuestos "hechos puros" relativos a dichas entidades. De lo que se trata es de modelar, de reconstruir bajo cierta óptica determinados aspectos de los constructos científicos que nos parecen especialmente reveladores para entender lo que es esencial de ellos. Diversas corrientes, escuelas y autores en filosofía de la ciencia han propuesto
diltersos modelos de interpretación (divgrsas "metqorías':, pomo pue* decese) de, la ' -'i " ciencia y, e 9 ganicular, de sur conat~ctTimás iqport&tes,,b las teorias, ciept&-$% %\ot modelos pueden ser más o menos adecuados a su o%etg, m á s o m y o s *pipsjbJgs, rn4s.o menos p ~ s i s o s ,pás o menos g e ~ a ! e s .Pera, cn ..q.w J g ~ k rcasp ;tceptc&&ddad no. depende de .que-gstablezcannormas del :lb,ywZ'co@ponapi~nto cie~tífico ,($ye, .nqd;~,está dispuesto a seguir-de todos ,mcxbs, y,.@enos que nadielof practirantes,de la ciencia), ni tampoco de que reflejen fielmente ciertos "'hechas puros:' V r c a 4e los coinstmqtqs científicos (siendo, por. lo de&, muy dudoso que puedan dete~tqse+les hechos con independenya d e toda teoría, es deck@detodo @arco @eiweqxetaciónh. De JQ cpue .de:i&de ,la aceptabiÍidad de los modelos o metateorías es de su perspicuidad, o sea, de 1 capacidadque tengan para hacemos comprender Jq esencial de Jos constructos cientíijws al nivel más profwds posible, ., . .Cualquiq actiqidad t e & i ~ pqr, ~ medii\o-d~la cval,~econstwyen y agliqans7$eo.n"aq, tiene unadimensión interpretativa fu:n,daqtp~al.Esto o&dg d<l& ciencias e-~píricas* de "primer ordeny' (sean.naturales a so~igle;s),y valet6;rliimayor medida, si:cabe, pa~4las ci~nciasde "segundo cyden':, coalo Ja Qlosof@ de-la cimc~a~~Te@~izar,no,consjstp1, simplementaen explio3tar.nmas ni en íegistrqr hecho^ consiste m "Conceptudizar.'~o "qeconstruir", es decir, intexpretar el ,gna~erialde s s t u d i ~d@rg.,de cierto:,marc¿p .corzcept.ual, previamente dada, 'que es ,preciral;ne%k lo que ll@~namog':una teoría.". Toda mor@ res interpretación, y e110 vale naturalmente.tambitn, y +wsyz,especiaImente, para las teorías que produce la fil.osofia de la gknci;i. , , , , e , Lo dicho hasta aqui puede 8ugerir que a&& djrnensione~,desla filo*;ofí~'~de la ciencia, la. descriptivo-nomUiva y intete~pretativa,sois:eomp?ement@riaspeFo .oxcluyemtes. A l g u m de las tareas deswqlb5idagj p o ia,fiEw.afh ~ de la ciencia,se~íandefi~r.jpti~o-noxmativas y no .interggt&ativas,las restantes sexían .int~rpret&v# pero ,-,O d & ~ c r i ~ t i v ~ ~ ~ q p a tivas. Las @meras tendríanique ver,<-one;l wálisis de b,psác$c.as cientxcq, das segundas con el-de los cons&pctoscjentíficps;.Bues bien, centra lo que la exposición si~plifjqa; da que hemos afrecido parece sugerir, m es éste ,ek,eaa Es sierto que: .en algunas de las tareas. el componente desajpbiuo-normativo,es-el fundamqptal, y,que, en otra+ ,lo,es ,el interpretativs; un ejemplo de I,o primer^-lo con~t~itpye e4 +tudio deda eontrasta~ió,n.cieqtífica y un ejemplo de .lp segundoresel+nális&sy recenstw$in de.tqo;ía.s, Peso hay casos, como el análisis de la explicaciba cjentíiica, enel que -a&s funciones+stán práctiqamente a la gag, Y lo que es rnás*importa~&e, incluso $n p5;;"@lps case& 6 que uno de .)os campeneptee,,pqece el f~ndarneqta4~%1 otlo nunca-e$S jt~~.alrnes;l-trs. ausente. El motivo e s que 1.aprdaicas científicas siernpxe iny~luqan~gu~os~oonstru~tos~~teOri~~,~y viceversa, los4C O ~ S E ~ ~ C ~ Ocientíficos S ~a el .resulta&+de+i~rtas,práS;tia~as. PQZejempl-o9la contmsta- . cidn de hi@tesis suponei entre otra$ co~as,.e(u s de ~ &ns&tos con~eprualesy d,eleyes, y una difaente interpretación de.la natpmlwa de l~s,~kyes.gitede.tener consecuencias, a-la hma de egiplicitar las eonveqcigpes qu$ rigen la a&ivhM contrastacional. En Ja otra.. dicección, la constnicción dq teoías :ii~mlucr+~Ie;~fas ~ ~ á c t i ~Guya,s a s , regla8 ~se.dq?xn seguia,p penñde quqdctt dedegigqadp eI-constm~$o r~s&@nteea taotp que teoria científica. Si un científico construye una supuesta teoría que resuita ser directamep. autojustificativa, esto es, una teoría tal que su cmlrastacjón pre+uRone inmediatamqnte su ya&i#ez,la
su
+
%
I
,
f
_ >
,
a-
s3
%
IYT'ROD~~CCIÓ'I. NATURALEZA Y
mxcrbn DE LA RLOSOF~ADE LA CIENCIA
25
comunidad no aceptará esa entidad como una genuina teoría empírica. Así pues, la determinación dz ciertas condiciones en las prácticas de contrastación de las teorías tiene consecuencias para la tarea reconstructiva, puede determinar ciertas constricciones a las que toda reconstrucción se debe atener. Resumiendo: adecuadamente consideradas, Ias dimensiones descriptiva y prescriptiva no se oponen sino que son dos aspectos de la misma función; esta función descriptivonormativa, además, no es exclusiva sino que se combina con otra interpretativa. Aunque en algunos ámbitos metacientíficos es más explícito el componente descriptivo-normativo y en otros el interpretativo, ambos están siempre presentes, quizás en diverso grado. Así pues, estos dos aspectos de la actividad metacientífica no son excluyentes, la filosofía de la ciencia es una actividad a la vez interpretativa y descriptivo-normativa. Es cierto que, como apuntaremos en la breve revisión histórica, a veces algunos filósofos de la ciencia han defendido la prioridad, o incluso la exclusividad, de alguna de estas funciones, ya sea de la descriptiva, ya de la prescriptiva, ya de la interpretativa; por ejemplo, los partidarios del descriptivismo exclusivista reducen la tarea de la filosofía de la ciencia a la simple descripción de los avatares científicos sin prestar especial atención a las normas que rigen implícitamente la práctica científica. Debe quedar claro que tal actitud es un error, derivado de una inadecuada concepción, por lo que a la actividad metacientífica se refiere, de la naturaleza de cada una de estas funciones y de sus relaciones mutuas.
3. Nuestro tema: Filosofía general d e la ciencia empírica
Hemos visto que la filosofía de la ciencia tiene por objeto poner de manifiesto o hacer explícitos los aspectos filosófico-conceptuales de la actividad científica, esto es, elucidar conceptos fundamentales de la actividad científica, determinar las normas que rigen esa actividad y reordenar conceptualmente o reconstruir esos sistemas de conceptos producidos por la ciencia que son las teorías. La filosofía de la ciencia, tal como la hemos caracterizado, es extremadamente amplia y diversificada. Puesto que las manifestaciones de la actividad científica son múltiples y variadas, también lo serán sus análisis filosóficos si no hacemos abstracción de algunas diferencias entre las diversas manifestaciones científicas. Si no abstraemos nada en absoluto nos encontramos con la total diversidad de sistemas conceptuales y teorías. En un primer nivel de abstracción tendríamos las teorías agrupadas por disciplinas: física, química, biología, psicología, economía, lingüística, matemática, lógica, etc. En otro nivel se agruparían las diversas disciplinas en diversos grupos, los correspondientes a la ciencia natural, la ciencia social y la ciencia formal. Y todavía en otro grado de abstracción podríamos reunir las dos primeras, ciencia empírica, frente a la última, formal. Por supuesto, esto es sólo indicativo, son posibles grados intermedios de abstracción y las diferencias en cada grado son muchas veces fluidas. El nivel de abstracción que va a guiar en general nuestro estudio de la materia es el que corresponde a lafilosofín general de la ciencia empírica. En primer lugar, no se van a tratar problemas especrjTcos de las ciencias formales, aunque eso no significa que no sea
aplicable a ellas nada de lo que aquí se estudie (como se verá, por ejemplo, cuando se analice la estructura axiomática de las teorías). En segundo lugar, se hará abstracción de las diferencias entre las diversas ciencias empíricas, las naturales y las sociales, de modo que el estudio se aplique por igual a ambos tipos. Esto es, el estudio lo será de sus aspectos comunes; en la medida en que las ciencias sociales requiriesen un análisis adicional por disponer de características específicas, ello no se hará aquí. En tercer lugar, el análisis filosófico de la ciencia empínca se va a desarrollar a nivel general, va a versar sobre los aspectos comunes a (la mayor parte de) la ciencia empínca. No se van a tratar problemas específicos de ciencias o teorías empíricas particulares, como el espacio-tiempo en la teoría de la relatividad, la medición en mecánica cuántica, la información en biología o el probletna de la predictibilidad en economía. Ante esta alternativa se puede objetar que no hay tal cosa, que la filosofía general de la ciencia es un mito, que los únicos problemas interesantes tienen que ver con las ciencias especiales y que, incluso. cuando pretendemos lo contraio nos vemos forzados, si se nos obliga a precisar, a descender a ciencias específicas. ¿Qué es eso de "el problema de la justificación", o "el problema de la explicación"? Una cosa es en física, otra en biología, otra en economía, y si nos apuran, una cosa es en mecánica, otra en termodinámica, otra en cosmología, etc. Bien, ello es parcialmente cierto, y parcialmente falso. Es parcialmente cierto, pues no sólo hay problemas específicos de cada ciencia sino que los problemas coinunes a las diversas ciencias presentan algunos elementos específicos en cada una de ellas. Pero es parcialmente falso, pues lo anterior no excluye que, como es el caso, algunos otros elementos de esos problemas sí sean comunes a toda manifestación científica. Quien abunda en esta línea de crítica olvida que lo mismo podría decirse respecto de las ciencias mismas. ¿Qué es eso de la energía? Una cosa es la energía mecánica, otra la calórica, otra la radiante, etc. ¿Qué eso de la herencia genética? Una cosa es en los mamíferos, otra en las aves, otra en las legumbres, etc. Es obvio que en este ámbito la crítica es claramente infundada. Pues bien, a menos que se aduzcan motivos adicionales relativos a la especificidad de la investigación metacientífica, no tiene por qué ser diferente en nuestro ámbito. En nuestra opinión, la especificidad de la investigación metateórica no proporciona tales motivos. La crítica es infundada en ambos casos, el científico y el metacientífico. Y lo es por el mismo motivo; en ambos casos se comete el mismo error, a saber, pensar que porque algo es diferente, todo (lo interesante) es diferente. Nadie duda de que, aunque la herencia genética presente aspectos específicos en los animales y en las plantas, hay algo común que es merecedor de estudio (científico). Pues bien, lo mismo es cierto de la explicación, o de las leyes. Aunque las leyes científicas presenten aspectos específicos en las teorías mecánicas y en las económicas, hay algo común que es merecedor de estudio (metacientífico). Como estableció Aristóteles, la ciencia, toda theoria, busca lo general en lo particular, lo similar en lo diferente. Pero para ello es necesario abstraer las diferencias, pues sin abstracción no hay, no ya ciencia alguna, sino ni siqaieka l&tgaaje. Y, por lo que a la abstracción de las diferencias se refiere, es claro que no hay un único modo de hacerlo, un único grado de abstracción. En eso, como en muchas otras cosas, la filosofía no difiere apenas de otras disciplinas.
4.
I I
!
i
I
1
Panorama sucinto d e la historia de la filosofía de la ciencia
En sentido estricto, la filosofía de la ciencia, como disciplina filosófica específica y sociológicamente identificable, es relativamente joven, se origina en el cambio de siglo y se asienta definitivamente en el período de entreguerras. Sin embargo, en un sentido más amplio, la filosofía de la ciencia es tan antigua como la filosofía misma. Uno de los principales fenómenos objeto de la reflexión filosófica casi desde los inicios de la filosofía es el conocimiento humano. Ahora bien, parece hoy día generalmente admitido que el conocimiento humano encuentra su máxima expresión en el conocimiento científico, el cual, aunque especialmente importante a partir de la Revolución Científica del siglo xvrr, ya estaba presente en algunas de sus formas en la Antigüedad (especialmente geometría, astronomía y estática). Este conocimiento científico fue objeto de especial atención en una reflexión de "segundo orden" ya en algunos pensadores griegos, principalmente en Aristóteles. A él se debe la primera concepción del método axiomático en general, como modo de sistematizar el conocimiento científico, concepción que luego fue aplicada (con ligeras variantes) por Euclides a la geometría y por Arquímedes a la estática. No podemos exponer aquí la historia de la filosofía de la ciencia con mínimo detenimiento, tarea que exigiría por sí misma un tratado de la misma extensión, si no más, que el presente. Aquí sólo podemos señalar muy someramente los hitos más sobresalientes en el desarrollo de nuestra disciplina (para un estudio más detenido, aunque todavía abreviado, de toda su historia, cf. Losee, 1972; para la historia reciente, cf. p.ej. Brown, 1977 y Echeverría, 1989). Por lo demás, una porción considerable de la evolución de tzmas, corrientes y autores a partir de la Segunda Guerra Mundial se tratará con detalle, aunque sin pretensiones historiográficas, en diversas partes de esta obra (cf. especialmente caps. 7 a 10 y 12). El advenimiento de la llamada "Revolución Científica" (no discutiremos aquí la pertinencia o no de esta denominación), fenómeno cultural cuyos inicios pueden fecharse con los trabajos de Simon Stevin en mecánica y Johannes Kepler en astronomía, a principios del siglo xvri, y cuya conclusión puede verse en la síntesis newtoniana al final del mismo siglo, proporcionó pronto material científico suficiente como para que algunos pensadores, ya fueran ellos mismos científicos practicantes o no, se pusieran a reflexionar sobre lo que ellos u otros hacían al hacer ciencia empírica. Las cuestiones de método pasaron al primer plano de esta reflexión, siendo la pregunta fundamental: jcuáles son las reglas que determinan el buen método de investigación científica? Por eso podemos caracterizar estos primeros conatos de una reflexión de segundo orden sobre la ciencia como una filosofía principalmente normativista. El tratado más sistemático, divulgado e influyente de metodología científica en esta época fue el Novum Organon de Francis Bacon, cuya concepción puede considerarse precursora de una curiosa combinación de la metodología inductivista con la hipotético-deductivista en el sentido actual. Bacon no fue en rigor un científico profesional, sino precisamente alguien que hoy día consideran'amos como un especialista en filosofía de la ciencia. Pero también algunos de los grandes campeones de la ciencia del momento dedicaron una porción considerable de su esfuerzo intelectual a la reflexión de segundo orden sobre lo que ellos mismos estaban haciendo. Los dos casos
más notables son René Descartes e Isaac Newron, ambos impulsores del método axiomático en física. De manera explícita y sistemática formuló Newton su metodología genera] bajo el título Regitlae Philosopllandi (o sea "Reglas para filosofar", donde 'filosofar' significa aquí "hacer investigación empírica"), al principio de la Tercera Parte de su obra cumbre, los Philosophiae Narurafis Principia hfatheinatica. Estas Regulae pueden entenderse como un "mini-tratado" de filosofía de la ciencia. Si la actitud normativista es lo que caracteriza estos primeros conatos de la filosofía de ]a ciencia en el siglo xvi~,en cambio, en el siglo siguiente, cuando la idea general de una ciencia matemático-experimental ya estaba bien establecida, es más bien el punto de vista descriptivista el que predomina en los estudios sobre la ciencia. Ello es particularmente manifiesto en los enciclopedistas, especialmente D'Alembert y Diderot. Se intenta dar aquí una visión sistemática y de conjunto de las diversas disciplinas científicas y sus interrelaciones. En contra de lo que a veces se supone, no hay una filosofía de la ciencia verdaderamente tal en los empiristas británicos del siglo XVIII. Lo que hay en ellos es una teoría crítica del conocimiento humano en general, la cual tiene implicaciones para la filosofía de la ciencia sólo en la medida en que ciertos temas muy generales de la filosofía de la ciencia son también temas de la teoría del conocimiento (por ejemplo, percepción, causalidad, inducción) y en el sentido de que si se cuestiona toda forma de conocimiento humano, ello obviamente también tiene consecuencias para la forma específícamente científica del mismo. De hecho, las filosofías de Berkeley y Hume no planteaban tesis precisamente constructivas con respecto a la ciencia establecida de su tiempo: Berkeley no creía en la relevancia de la matemática para el conocimiento empírico, y Hume no creía ni en la causalidad ni en la inducción; pero precisamente estos tres elementos, matematización, causalidad e inducción, constituían los pivotes de la síntesis newtoniana (y no sólo de ella). La filosofía de la ciencia no recibe un nuevo impulso hasta finales del siglo XVIII con la obra de Immanuel Kant. La filosofía trascendental kantiana (especialmente en sus planteamientos de la Crítica de la Razón Pura y los Fu?tdarnenros Meraflsicos de la Ciencia Natural) representa un hito importante en la "protohistoria" de nuestra disciplina y ello no sólo por su influencia en las discusiones posteriores hasta bien entrado el siglo xx, sino también porque es el primer ejemplo histórico de lo que hemos denominado antes un modelo i11terpretatir.ode la ciencia, una metateoría sistemática de las teorías científicas. En efecto, Kant se encuentra ya con dos teorías bien establecidas, la geometría euclídea como teoría del espacio físico y la mecánica newtoniana como teoría del movimiento, y se pregunta por la estructura esencial que "se esconde" detrás de estas teorías; quiere establecer lo que hace comprensible por qué ellas proporcionan conocimiento genuino de la realidad empírica, aun siendo tan altamente abstractas o "ideales". La teoría kantiana de los juicios sintéricos a priori, de las categorías del enterzdimienro y de las formas pul-as de la intuición (espacio y tiempo) puede verse como una propuesta de interpretación general de aquello que es esencial en el conocimiento científico, y que está paradigmáticamente contenido en la geometría y la mecánica. La respuesta kantiana en sus rasgos específicos probablemente ya no sea aceptada hoy día por ningún filósofo de la
ciencia. Sin embargo, ella marcó la pauta de la discusión de una serie de temas y conceptos que han jugado un papel central en la filosofía de la ciencia de la época contemporánea (relación teoría-experiencia; función de las matemáticas en la ciencia empírica; carácter de las regularidades nómicas; naturaleza de la causalidad, del espacio y del tiempo; ...). De los filósofos del idealismo alemán posteriores a Kant no puede decirse propiamente que hicieran contribuciones significativas a la filosofía de la ciencia, al menos tal como entendemos ésta hoy en día. Más bien se trató en ellos, sobre todo en Hegel y Schelling, de una filosofía de la naturaleza, es decir, una especulación filosófica directa (de "primer orden") sobre la realidad empírica, basada en sus propios sistemas metafísicos. En realidad, estos filósofos se mostraron muy escépticos, cuando no abiertamente opuestos, al espíritu de la ciencia empírico-matemática moderna, tal como ella se desarrolló a partir del siglo xvrr. Con cierta benevolencia, podría verse en sus especulaciones el intento de formular un programa alternativo al de la ciencia moderna, proyecto que al final condujo a un callejón sin salida. La filosofía de la ciencia cpmo explícita reflexión de segundo orden sobre la ciencia retorna vuelo en la primera mitad del siglo xrx con la obra de Auguste Comte, el fundador del positivismo. Dentro de la clasificación general de enfoques que hemos presentado más arriba cabría considerar el enfoque comtiano como primordialmente descriptivista: se trata de presentar la totalidad de las disciplinas establecidas de su tiempo dentro de un esquema jerárquico general, tanto en perspectiva sincrónica como diacrónica. Ahora bien, de su descripción general de lo que considera el estado de la ciencia de su época, Comte saca también algunas consecuencias normativas acerca de cómo hacer "buena ciencia", que posteriormente iban a tener bastante influencia en los practicantes mismos de algunas disciplinas, como la medicina y las ciencias sociales. Un enfoque parecido puede verse en otro autor de mediados del siglo xrx, John Stuart Mill, en quien, sin embargo, la problemática metodológico-normativa iba a jugar un mayor papel, y a tener una influencia posterior más profunda, que en el caso de Comte. Los planteaniientos kantianos, que habían quedado eclipsados por largo tiempo, retornan con vigor a finales del siglo xut y principios del xx, con una serie de corrientes, escuelas y autores que, aunque muy distintos entre sí, toman su fuente de inspiración más de Kant que del positivismo inmediatamente anterior, y con ello elaboran enfoques más bien interpretativos (metateóricos) en el sentido apuntado más arriba. Los filósofos de la ciencia más obviamente influidos por Kant fueron, por supuesto, los neokantianos, con Ernst Cassirer a la cabeza, quienes trataron de compaginar del mejor modo posible los principios de la teoría kantiana original con los nuevos desarrollos de las ciencias, especialmente de la física. Pero, además de los neokantianos, a esta época pertenecen una serie de autores que, aun siendo más o menos críticos (a veces radicalmente críticos) de Kant, retornaron las preocupaciones y el modo de encarar los problemas de éste y elaboraron sus propias metateorías en el sentido de modelos acerca de la estructura esencial del conocimiento científico, sobre todo de la física. De esta plétora de enfoques aquí sólo podemos mencionar unos pocos, aquellos que mayor influencia tuvieron en la filosofía de la ciencia posterior: el ')sercdo-kantismo" empirista de Hermann von Helmholtz, el convencionalismo de Henri Poincaré, el instrrcmentalismo de Pierre Duhem, el pragrnatisrno de
30
F U N D . A ~ DE I EFILOSOF~A ~ ~ S DE ~.+i CIENCIA
Charles S. Peirce y el emnpirio-criticismo (quizás sería más adecuado calificarlo de "operacionalismo radical") de Ernst hlach. Aunque existen profundas discrepancias entre estos pensadores, tienen, no obstante, un indudable "aire de familia". Por las preocupaciones, intereses y objetivos que comparten, puede considerarse a estos autores uno de los puntales para la formación, en la ~eneracióninmediatamente posterior, de la filosofía de la ciencia tal como la entendemos hoy día como disciplina relativamente autónoma. (Otros pensadores importantes en este proceso de zestación de la disciplina, a los que sólo podemos aludir aquí, son Herschel, Whewell, Jevons, Hertz y Campbell). El otro gran puntal para la constitución de nuestra disciplina fue la Iógica moderna, establecida de nuevo cuño por Gottlob Frege en el último cuarto del siglo XIX, y que iba a ser consolidada y propagada por los Principia Mathematica de Bertrand Russell y Alfred N. Whitehead a principios del siglo xx. Como parte de este otro puntal habría que incluir, en realidad, no sólo la lógica en sentido estricto, sino la filosofía de la Iógica y las investigaciones sobre fundamentos de las matemáticas iniciadas en esa época por los propios Frege y Russell, pero no sólo por ellos, sino por muchos otros autores, entre los que cabe mencionar a David Hilbert y Ludwig Wittgenstein. Sobre estos dos puntales - e l del contenido de los temas y planteamientos, debido a los físicos-filósofos de fines del XIX y principios del xx, y el del método, debido a los lógicos y fundamentadores de las matemáticas- se constituye, inmediatamente después de la Primer Guerra Mundial, la nueva disciplina de la filosofía de la ciencia. Ello es obra principalmente (aunque no exclusivamente) de dos grupos de investigadores que iban a causar un impacto duradero y profundo no sólo en el desarrollo de la filosofía de la ciencia, sino en el de la fiIosofía en general para el resto del siglo: el Círculo de Viena, con Moritz Schlick, Rudolf Carnap y Otto Neurath como figuras señeras, y el Grupo de Berlín, con Hans Reichenbach a la cabeza. En este período, que duró aproximadamente hasta el fin de la Segunda Guerra Mundial y al que, de manera bastante laxa, suele subsumirse bajo el epíteto de "positivismo lógico" o "empirismo lógico", se establecieron los temas principales de la filosofía de la ciencia y sobre todo el modo de abordarlos. Por ello puede considerarse esta fase como el período constituyente o "germinal" de la actual filosofía de la ciencia, a pesar de las innumerables y a veces agrias controversias que tuvieron lugar (tanto con los adversarios de la filosofía de la ciencia así entendida como entre los propios representantes de la misma) y de que la casi totalidad de las tesis sustantivas sostenidas entonces (como el verificacionismo, el fenomenalismo, el fisicalismo y el sintactismo) han sido rechazadas posteriormente, A este período constituyente siguió, después de la Segunda Guerra Mundial y hasta mediados de los años sesenta, lo que suele calificarse como per;odo clásicc~~.de nuestra disciplina, en el que se acuña y desarrolla lo que se conocefá && Pción Heredada ('Received I;"ied)).En él se articularon de manera definitiva muchos de los conceptos, problemas y análisis que siguen presuponiéndose hoy día. Además de los ya citados Carnap y Reichenbach, que siguen haciendo aportaciones importantes e influyentes (sobre todo el primero, pues el segundo morirá apenas iniciado este período), los autores más destacados son Karl R. Popper, Carl G. Hempel, Herbert Feigl, Nelson Goodman y Emest Nagel. El extenso tratado de este último, La Estructura de la
Ciencia, d e principios de los sesenta, representa la síntesis más completa de la filosofía "clásica" de la ciencia. Por supuesto que, en muchos aspectos, tanto de contenido como de forma, esta filosofía de la ciencia puede considerarse hoy en día como "superada"; no obstante, su trasfondo conceptual y temático está presupuesto, de manera implícita o explícita, en los enfoques posteriores y resulta imprescindible para comprender y valorar cabalmente estos últimos. Ninguna persona seriamente interesada en la filosofía de la ciencia actualmente puede permitirse desconocer los elementos esenciales de las aportaciones de dicho periodo, aunque sólo sea para "refutarlos". Por lo demás, a pesar de todas las "superaciones" y "refutaciones" posteriores, hay una serie de resultados y conceptos característicos de esta época que pueden considerarse sólidamente establecidos y que no pueden pasarse por alto en un estudio mínimamente completo de la disciplina. Tanto los elementos controvertidos o superados de la filosofía clásica de la ciencia, como los resultados firmemente asentados de la misma, constituyen buena parte dzI contenido de este libro, especialmente los caps. 3.7, 8 y 12. Sobre las contribuciones de los enfoques posteriores a la filosofía clásica de la ciencia nos extenderemos en los capítulos 7 , 9 , 10, 12 y 13. Aquí indicaremos sucintamente sus rasgos más sobresalientes. Aparte de ciertos desarrollos colaterales, en la filosofía "posclásica" de la ciencia pueden identificarse dos líneas claramente distinguibles: por un lado, la corriente historicista, y por otro, las concepciones llamadas frecuentemente semdnticas, aunque quizás sería más propio calificarlas de modeloteóricas o representacionalistns (ninguna de estas denominaciones es completamente apropiada, pero de momento no disponemos de otras mejores; quizás algún futuro historiador de las ideas logre forjar una clasificación más adecuada). Estas dos líneas tienen orígenes y motivaciones muy diferentes, pero no por ello son necesariamente incompatibles; como veremos en diversas partes de esta obra, en el caso de algunos enfoques particulares de una y otra línea (como el kuhniano y el estructuralista) puede hablarse de un acercamiento o principio de síntesis. Por otro lado, e independientemente de su diferente origen e intereses, ambas líneas se caracterizan en buena medida por su vocación de ruptura, por su oposición a una serie de elementos, diferentes en cada caso, considerados esenciales de la concepción clásica. En la corriente historicista, la oposición es mucho más manifiesta y genera abierta polémica; en los enfoques semánticos la oposición es más sutil, pero en algunos de sus aspectos igual de radical, si no mis. Sin embargo, y sin negar los elementos reales de crítica profunda presentes en estas nuevas orientaciones, la ruptura es menos drástica de lo que a veces se pretende; los elementos de estas nuevas concepciones que provienen de la etapa clásica son, incluso en el caso de los historicistas, más numerosos y significativos de lo que con frecuencia se piensa, principalmente respecto del ámbito de problemas abordados y de algunos de los conceptos más básicos utilizados para el análisis. Por lo que a la revuelta historicista se refiere, aunque en las décadas anteriores hay al;ur?os precursores de la crítica historicista a la filosofía clásica de corte "positivista" (principalmente Ludwik Fleck y Michael Polányi), la corriente historicista se hace fuerte como nueva alternativa a partir de los años sesenta, principalmente con los trabajos de Thomas S. Kuhn, Paul K. Feyerabend e Imre Lakatos, entre los que destaca de modo particular La estrrtctura de Las revollrciones ciet1tr;ticcrs de Kuhn, aparecido en 1962. Estos
trabajos se autoconeibe.n (y así,s,on.también interp~etadaspor el pqbIjco interssado) como una "rebelión" contra la filosofia de,kicj~ncia e~aM~$i&++ en~sua n~q@iei$e.~ca$~@a~ na" como en la Ypapperjana". id 1>11ngipaly ,mApteqJlcito repmh&g6e estos autoles. hace&a la filmofia cl6sica de la cienciq estrib? en q& es& no se tqrnara-~ahistoria de la ciencia en serio .y que, en consecuancia, prqanian yna imagcq muy pobre, ,tot&nente inadecuada, de la dinámica del ~xao&niensoc i ~ i f i m . El 6nfasis puesto en k relevancia2 de los e s t u d i o s h i s t a r i ~ r á f i e ~ la~filosofía ~~~a de la ciemaia parece ir atinad&, en IQS, autores hismic%ista&, con<up desprec@ total por el uso de métados farmaks e8 mesira discipkina. Pox-ello,seha ,&lifica$p a veces &ql+ filosofía historicista' de lasi&cia como una filcwofia "a~ti-formalistp','por oposici6n a la .filosofía -"formalista" cltlsica. Sin embargo, gsta di.ihq8tpcia es Fenos~significativa_delo ~ no:@do&-losautqes o cnijquqs importanque pue&.parece~;apñmkra vista. P O Pladg tes dentro de lo que hemos dado ea HamwJ;Jos~~í~cl6sicn de la ciencia bic&r>& uso sistemático de métodos formales; par.@j~er~lpIo; dqa &LQS más cgrackrí6tiqos tratados,de dicha filosofía, La ló$rca de !a i t s cie@t&&q1& P@pp@.xLa-estfwcrura de la ciencia de Na-1 (qw ,suelen consideqame corno 9bjeFito.s de *ataque+ p m , p q e,de los hlst&~cistas),apenas uzf1i.m alguna fumalizaci.óa. Por-otra;,@o, t o d ~ los s whres,historicista se temicman t&UItem@Q@ adYwd;ados n-k$FSJdm fomaEes. 9-@e$$ F ~ v. g e w..-& s e declara expEcíta y &&*me d@@miallaEa.K&k y L&stos,pos su j&q$3nqv h a z a n $ 0principio. ~ la oportunitE~d. de la fmmalizscióo en cib ~ @ ' & x.úno,:s8& t-o~ fi modo .. . r *s,. . ,/ específico en que sus adversarios "elásiws"10 hiqjexw.:. - ; Más dgnificativa esLotre,divwgeocia coa la?&los~fia~dásfka da la'cíe~)cikgue, aunque planteada de manera ings implícita qas eXpliQjtta,ibg a - w u l t w a -La Jqga más profunda: los histoficiistas proponen una mción ktuitivaade teo& ciephf£ica* mucha' más compleja, que pone de mqifies$o>eicarkter ex@$~1i!r7'mesik~simp~sta del coq6epto- de teorfa comdn .t,tanto a carna@ano~coa@: a gioppe$an@s>~&f Gap. 9); esta im~vaciónes la que se encuentra d a s veces &as polémicas ap&~t;6~1pte-~eatradas en oqas cueptiones (efi,cap. 12 35). ; I . Esta úIri:malestambién la hjeción más fum$e,.yae~jíuita que hace la otra,Jínea de la nfieva fiIosofía de la ciencia; lal.& -las c o n @ q c ~ wsemántigw s >o.,modelok6ric~q:la .idea clásica de: tomar las (teorías cientifica6 s i m p l e ~ t e ~ m sistemas o axio&~co&.de enunciado$'es demasibdo. primitiva e inadecuadb a lai&m@ejidad est@c%u$akdc"las 60rías. Coh esta crítica ]general está empar&ad~ a&a d ~ . ~ ~ ~ ád-p@igr&r, cter Eero no menos importante: la~:eseasa~imp~ancclja qve rBvistsnrea:fbfi$osofía ~lásjcaQaJa ciencia los estudios de cases, es decir, -el anAlisisyplarecons~ciión~detallados Qe ejeslpl~sreQles de teorías cientificas..Pw5ello;es ~ax$cIen'ostic~ de 1.wcomeepciones &ernán&i~at+,Csi jio de todas, al menos si de unLr7grt-q parte:* de ellas)-eI'hgheq$qibado una.:grar+@gr~i6nde sus esfuerzos at análisis muy. dep&Ea$o;deteorías concaeras, aitxnenos mucho q6s que la cadente clásica, y también que 3a hist,&i,eista,, ,, Esta línea es en parte anterior y en psne po$~.e~~a.~&~inaahistoriciqta. IjR rekidad, aún menos que Ja filasoEa.c~sicade5l&~ien~ia,y que-19 hjggicista, puede habjage -uí'de un%concepción unitaria. Se f rata más,bien de .nna fanU.1~i.agggdifusa de enfoquq?. Sus,.taíces coaunes e s t h en los trabaj.bs detecofisrncción de tegriaide Patriqk S q e s y sus colhoraIr
5 ,;i.i
u,*.
~
'
.
-
( -
dores (especialmente Ernest N'. Adams) en los años cincuenta y sesenta. Éstos inspiraron la emergencia del estr~~ctcirnlisino metateórico de Joseph D. Sneed y Wolfgang Stegmülier en los años setenta y del etnpirisnzo constntctivo de Bas van Fraassen en los años ochenta. A esta familia pueden asignarse también los trabajos de Frederick Suppe y Ronald Giere en EE.UU., del gmpo polaco alrededor de hlarian Przelecki y Ryszard Wójcicki, y los de la Escuela Italiana de Toraldo di Francia y Mana Luisa Dalla Chiara, todos emergentes más o menos por las mismas fechas. A pesar de las considerables diferencias que existen entre estos enfoques en cuanto a intereses, métodos y tesis sustantivas, su "aire de familia" les proviene de que en ellos juega un papel central la idea de que las teorías científicas, más que sistemas de enunciados, consisten en sistemas de niodelos, en cuanto que estos últimos son representaciones conceptuales (más o menos idealizadas) de "pedazos" de la realidad empío representclcionnles para estas rica (de ahí la denominación sernbrlticas o nlodeloteóric~~s concepciones). Y, a diferencia de los historicistas, estos enfoques no ven ninguna dificultad en el uso de instrumentos formales en el análisis de las teorías científicas: al contrario, su reproche a la filosofía clásica de la ciencia no es que ésta haya usado (a veces) métodos formales, sino que los utilizados (en lo esencial, la lógica de primer orden) eran demasiado primitivos y por ello inapropiados a la tarea; conviene utilizar porciones "más fuertes" de las ciencias formales: teoría de modelos, teoría de conjuntos, topología, análisis no-estándar, teoría de categorías, etc. Carecemos todavía de la suficiente perspectiva histórica para presentar una evaluación mínimamente ajustada de los desarrollos en la filosofía general de la ciencia de los últimos años. Concluiremos este breve recuento histórico señalando solamente lo que, al menos a primera vista, parecen ser rasgos notorios de la situación actual. Por un lado, la filosofía historicista de la ciencia parece haber dado todo lo que podía dar de sí, al menos como propuesta de metateorías generales. Ella parece haber desembocado, o bien en una pura historiografía de la ciencia, o bien en un sociologismo radical de corte relativista y frontalmente adverso a cualquier teorización sistemática (que no sea sociológica). En cambio, los enfoques de la familia semanticista han seguido desarrollándose y articulándose como metateorías generales de la ciencia; una tendencia que parece cada vez más fuerte dentro de al menos parte de esa familia estriba en combinar la línea modeloteórica general con conceptos y métodos de las ciencias cognitivas y de programas computacionales de simulación. Asimismo es notoria la proliferación cada vez mayor de estudios de casos, es decir, de interpretaciones y reconstrucciones de teorías particulares de las diversas disciplinas, inspiradas de modo implícito o explícito en las metateorías generales, pero que también pueden llevar a una revisión de estas últimas. Se trata en lo esencial, pues, de un desarrollo acelerado de lo que más arriba hemos caracterizado como filosofía especial de la ciencias, la cual, coino hemos advertido, no es tema de este libro.
CAP~TULO 2 ARGUMENTOS DEDUCTIVOS Y ARGUMENTOS INDUCTIVOS
Este capítulo está destinado a presentar, a modo de recordatorio, algunas nociones lógicas fundamentales, específicamente las de argrrmentación, argumento deductivo y argumento inductivo, cuyo conocimiento se presupone en varios lugares de esta obra (especialmente en los capítulos 3, 5,7,8 y 12). Puesto que éste no es un texto de lógica no podemos detenemos por extenso en ellas y la presentación de las mismas va a ser muy introductoria. El lector al que le resulte insuficiente puede consultar cualquier manual de lógica al uso; el lector ya familiarizado con estas nociones, o con alguna de ellas, puede prescindir de este capítulo, o de la correspondiente sección, sin pérdida de continuidad.
1. Argumentos, validez y verdad 1.1.
RAZONA?V~~E~TOS, ARGUMENTACIONES, ARGUMENTOS E INFERENCIAS
Aquí vamos a considerar equivalentes las nociones de razonamiento, argurnentación, inferencia y argumento. El lenguaje cotidiano distingue a veces ligeramente entre las dos primeras y las dos últimas. A veces las primeras tienen cierta connotación de extensión o complejidad respecto de las segundas. Los razonamientos o argumentaciones tienden en ocasiones a identificarse con procesos argumentativos relativamente largos y complejos, mientras que los argumentos y, sobre todo quizá las inferencias, tienden a considerarse procesos más simples que son los componentes o "pasos" de una argumentación compleja. Esta diferencia no es ni mucho menos general y, en la medida en que exista, es irrelevante para nuestros intereses actuales, de modo que no vamos a distinguir aquí entre estas nociones y las utilizaremos indistintamente como variantes estilísticas. Un argumento (razonamiento, argumentación, inferencia) es un tipo especial de acto de habla y, como tal, es algo esencialmente pragmático caracterizado por la pretensión del hablante de llevar a cabo determinada finalidad. En relación con dicha finalidad, los argumentos se pueden ver como secuencias de (al menos dos) afirmaciones, enunciados o proposiciones. Aunque la diferencia entre enunciados y proposiciones es fundamen-
tal, a los efectos presentes no vamos a distinsuir entre ambos; o mejor dicho, vamos a considerar que los constituyentes de los argumentos pueden considerarse [anto entidades lingüísticas, los enunciados, como proposicionales, los contenidos de los enunciados. Si bien tendemos a preferir la segunda versió-n, usaremos en general 'afirmación' para referirnos indistintamente a ambas posibilidades. Pues bien. un argumento es una secuencia de afirmaciones caracterizada por cierta pretensión, la pretensión de que una de ellas "se sigue", "se infiere", "recibe apoyo" o "recibe justificación" de las restantes. A la afirmación de la que se pretende que recibe apoyo se.la llama conclusión, y a las afirmaciones de las que se pretende que se sigue la conclusión se las llamapremisas. En la reconstrucción foqal , y a e j ~ t o ps u r ~ ~ m ~ y p i c t o g r 6 fsp@e i ~ o scolocarse , la conclusión como Últiíllla afihaci6n be la secuencfa, pero én el lengua$ hatTG"3la con~lusión puede estar en cualquier lugar de la serie, aunque comúnmente suele estar al principio o al final. Lo que .sirve en el lenguaje natural para identificar la conclusión es cierto tipo de "marcadores" que se usan al efecto, expresiones como 'por tanto', 'en consecuencia', 'por e ~ l o ' ; * ~ ~ que', e s t o 'ya que', etc. Algonos de en6s mG2adbf~s,'como'por lanton,"indicanque lo que' le'antecede só~ilaspkmisasy lo qukqsiguela:conclusión: otros~corno'puesto &e7. furicionan en general inversamente, prec&dos por la. c66clusión y seguidbs Por las preiIusao, pem también ptledkn iniciii-'el !ariu&it<r esrhda segbigiúool primero por l"'$terni.s$k y despliés p&Ia kon&5sión: A i.&ceSYif bhklusión éstd eii ihedió, combin@d~>e%ai*riboS*ti~ós de marcadores. Incluso puede &e& oaya m8ca&reS kxp!kitos y que Sea el kmtexto' el $e clarifipue cuáles s6n las prernisas y fa conclu&ón.En oc$si~dt?sbasta,~"~i?ie faliar alguna de las piemisas, si el contdto hace suficientemen~ecfka su'Ijresbniia impi~=ita. &S siiuiéntes casos son ejemplos de las diversas posibilidades. ,* . . . . A l "Seguro que su marido está con otra, puestoque o está En casa, o eii ellfibajo o con otra, y no está en casa ni en- <el~ trabajo." ,.!/?,... '. * *a:,*; .,:*-; A2 "Todos 10,; za@foi 66; he io@ado Ylasta ahbra en'la'&iciteria Pfe ~ i ~ e m me han dado un excelente resultado. Por tanto, los zapatos que me acabo de 8:h4* U* ta&~:~~lel$~tee,, comp;+en, dkh6iap&+akeguro * . ..,l;r... ,,; , ! , o ..".! ; . A 3 ZWpue~t&q$cf&s'tir&&~y~&&fiieomp.~gJa 'iiiprioridad y tlri*o, .Hitler.i& \C~mpll~o' d; i;.fciiqid&i',? ,' , . . ,t.! .::: ; * . . A4 . ,,$Los lIeT;afii,.~~k $ i d , .$.. & h:k#;no una v ~ ~ a ~ ~ o h & $ , 'p~~est&~:qüe'e5 aiti ,. . "..: . !.'2,; ,. c f * ,;. *-; *..'"i,' . ' T ~ ~ $dS O presi@ntei ~ @s~bdd&iil~$~kish~st~a a$i)li&$&n varonkr.' ;*. ty.:;v: < . . ,El'pr6*im0.predd6*te',a;*e11"~&.&s.efA.~ar~*~; " - :, < ,,, . Ae ." I = ~+;ii$*tes G tieh dap&;$Srl kh/3#3tQ'&. &ba;idía. Por tanto, ..Xi. -., . -: m;&3&hs .,:. .. . . . . A g ~ e h ' 6 ; - : . $ + &. ' ee$ar@fi!i oi;_asiiíh.,,? .;. . .:! ,: . - e , . ' ' ". u. "
'
,:
,
?
"
,,.'S'
'i
,
.
*a
lesu,
S
,
'i
:
;
!
. : . . . d
' 'i
.,(
-
'.
\
:
C.
,
:
.,
Debe 'quedx d&' desh$%i -cokier"izoque los árguméaios no 'kofi' verdaderos' ni falsos. Sólo 'las afirmaciones (1os'-muhcihd0~, o -16 qui! ellos eipfe$afi, las proposicioñes)
pueden ser verdaderas o falsas, y los argumentos no son afirmaciones, son series de afirmaciones con cierta característica, a saber, que de esas afirmaciones se pretende que una de ellas se sigue de las restantes. Los argumentos no son pues verdaderos o falsos. Pero eso no quiere decir que todos los argumentos sean iguales, que no podamos hablar en ellos de "éxito" o "fracaso". El éxito de un acto de habla es la consecución o logro efectivo de la finalidad pretendida mediante su realización. En una afirmación, en un acto de habla asertorico cuya finalidad es describir cómo son las cosas, se satisface dicha finalidad si las cosas son efectivamente como se asevera que son; en una afirmación, por tanto, el "éxito" es la verdad y el "fracaso" es la falsedad, el acto es exitoso si la afirmación es verdadera y no exitoso si es falsa. Pues bien, también los argumentos son exitosos o no, sólo que ahora el éxito no consiste en la verdad sino en la corrección o validez. Los argumentos son correctos o incorrectos, válidos o inválidos (algunos autores prefieren hablar de validez sólo para los argumentos deductivos, aquí consideraremos en general sinónimos ambos términos). Puesto que los argumentos se caracterizan por la pretensión de que la conclusión recibe apoyo de las premisas, el éxito o fracaso de un argumento dependerá de que tal pretensión sea o no acertada. Un argumento es correcto o válido si efectivamente las premisas apoyan la conclusión, y es incorrecto o inválido si no la apoyan. Por tanto, las premisas y la conclusión pueden ser verdaderas o falsas; el argumento mismo no, es válido o inválido. Es obviamente cierto que la afirmación que asevera que determinado argumento es válido, ella misma sí verdadera o falsa, y lo es dependiendo de la validez del arsumento: la afirmación 'el argumento "a,, ..., a,, por tanto p" es válido' es verdadera si y sólo si el argumento "a,, .,., a+,, por tanto B" es válido, pues es esto lo que asevera dicha afirmación. Pero ello no hace que podamos considerar al argumento mismo como verdadero o falso en ningún sentido interesante. Una cosa es un argumento y otra la afirmación de que el argumento es válido. El hecho de que la segunda sea verdadera si y sólo si el primero es válido no convierte al primero en una afirmación. La diferencia entre verdad/falsedad de las afirmaciones involucradas (premisas y conclusión) y validez/invalidez del argumento muestra lo que son los dos componentes de la adecuación o "bondad" de un argumento. Hay dos sentidos en que se puede decir que un argumento es un "buen argumento". En un primer sentido, muy general, un argumento es "bueno" (exitoso) simplemente si es válido. Ahora bien, salvo quizá en cursos de lógica, no argumentamos por el placer de hacerlo sino con la intención de establecer o justificar ante la audiencia cierta afirmación, la conclusión del argumento; y para que la intención de justificar la afirmación se realice satisfactoriamente no basta que el argumento sea válido, pues obviamente puede haber afirmaciones injustificadas que sean conclusiones de argumentos válidos, a saber, cuando alguna de las premisas es ella misma injustificada. Que el argumento es válido significa que las premisas apoyan o justifican la conclusión, en el sentido de que caso de estar las premisas justificadas, la conclusión queda también justificada; esto es, los argumentos válidos "trasladan" la justificación de las premisas a la conclusión. Por tanto, aunque la conclusión se infiera efectivamente de las premisas, puede carecer de justificación si alguna de las premisas carece de ella. La validez de un argumento no justifica por sísola la conclusión. Las mismas consideraciones se pueden hacer presentando la cuestión, no en térmi-
28
FiJNDlrSIEhTOS DE RLOSOF~ADE L.4CIENCIA
nos epistemológicos, hablando de justificación, sino semánticos, hablando de verdad. Estos dos ámbitos están íntimamente relacionados, pues por 'justificación de una afirmación' se entiende "justificación de la creencia en su verdad". Pues bien, planteada la cuestión en términos semánticos, la validez del argumento por sí sola no "apoya" ]a verdad de la conclusión, para ello es necesario además que las premisas sean verdaderas. El siguiente ejemplo es un caso de argumento válido con premisab) falsa(s): 'fxodos los atenienses son fil6sofos. Sócrates es ateniense. Por tanto, Sócrates es fi~ósofo." Hemos elegido intencionadamente un caso en el que la conclusión es verdadera, para mostrar que incluso una afirmación verdadera que es conclusión de un argumento válido puede no estar "bien apoyada" en el contexto de ese argumento; no lo está si alguna de las premisas es falsa. Distinguiremos en general la corrección f o m l de un argumento d e su correccidn inarerial. Diremos que un argumento es formalmente correcto si es válido, y que es materialmente correcto si sus prernisas son verdaderas. Ahora podemos precisar el segundo sentido en que se puede decir que un argumento es un "buen argumento": en este segundo sentido, más exigente, un buen argumento es un argumento formalmente correcto, e.e. válido, que además es materialmente correcto, e.e. con premisas verdaderas. Para no confúndir estos dos sentidos de 'buen argumento' utilizaremos 'válido' para el primero y 'satisfactorio' para el segundo,dmás fuerte, puesto que implica elApr2mero).Así, podremos considerar justificada una afirmación presentada como conclusión de un argumento en la medida en que estemos justificados en considerar satisfactorio el argumento. Esto es, estamos justificados en creer en la verdad de la conclusión de un argumento en la medida en que (estemos justificados en creer que) el argumento es válido y estemos justificados en creer en la verdad de las premisas.
Hasta ahora hemos hablado de corrección o validez de argumentos d e un modo muy general e impreciso: un argumento es válido si la conclusión es apoyada por, o se sigue de, las premisas. La cuestión es cómo hay que entender la noción de seguirse de o apojar, pues en tanto no se precise esa noción, la noción de validez permanecerá imprecisa. Aquí es donde es importante insistir en que los argumentos se caracterizan por cierta pretensión de quien lo realiza, pues hay diferentes sentidos en los que se puede pretender que una afirmación se sigue de, o es apoyada por, otras. En función de cuál sea ese sentido tenemos diferentes tipos de argumentos, cada tipo con sus correspondientes criterios de validez. Aquí examinaremos los dos tipos clásicos de argumentos, los deductivos y los inductivos. En una acepción extremadamente amplia de 'argumento' habría más tipos de argumentos. Si, según esta acepción, lo que se pretende al argumentar es simplemente persuadir a la audiencia de que forme cierta creencia, entonces hay muchas formas de pretender "apoyar" la "conclusión"; por ejemplo, apelando a la fuerza mediante amenaza, como en las "argumentaciones" ad baculurn ("la Tierra no se mueve, si no te lo crees verás lo que es bueno"), o
a cienas emociones ("jmi defendido es inocente de la acusación de abusos deshonestos!, ¿cómo pueden pensar lo contrario de un amante padre de familia y respetado benefactor de la ciudad?')), o a otros variados recursos. Pero aunque hay mucha gente que "argumenta" así (los demagogos son un caso paradi,mático de ello), sólo son argumentos en apariencia, no se pueden considerar argumentos en sentido propio. Son formas de "discurso persuasivo" no argumentativas. Aunque a veces en el lenguaje común se tiende a utilizar 'argumentar' para cualquier forma de discurso persuasivo (p.ej. el de los abogados ante los jurados), en sentido estricto los argumentos son sólo una de las formas del mismo, la forma más racional en tanto que intenta persuadir mediante razones. Hay casos intermedios difíciles de clasificar, como el de la retórica, que en parte parece una forma específica de discurso argumentativo y en parte una variante sofisticada de la mera persuasión. Como hemos indicado, aquí vamos a considerar sólo dos tipos de argumentación, la deductiva y la inductiva. Es cierto que hay otros tipos de argumentos, en principio diferentes de los deductivos e inductivos, que no son meramente persuasivos o retóricos y que muchos autores consideran "legítimos" en contextos científicos, principalmente los argumentos por analogía y por abducción. De los segundos diremos algo en el capítulo 12, donde veremos que se pueden considerar inductivos, en el sentido amplio de 'inducción' como "inferencia ampliativa". Los primeros, que constituyen una especie argumentativa peculiar, dependen de fenómenos pragmáticos muy complejos que exceden los límites de nuestro estudio; en cualquier caso, para las necesidades de la presente obra su estudio no es imprescindible y bastará con limitar la actual revisión a los argumentos deductivos e inductivos. Antes de pasar a ver ambos tipos de argumentos con más detalle, es conveniente insistir en que su diferencia radica exclusivamente en la pretensión del hablante. Los argumentos deductivos se caracterizan porque en ellos se pretende que la verdad de las premisas hace segura la de la conclusión, mientras que en los inductivos se pretende que las premisas apoyan la conclusión sólo en cierto, grado. P.emen principio, y salvo convenciones que siempre podemos adoptar, nada formal o estmctural distingue los argumentos deductivos de los inductivos; la diferencia es intencional, radica exclusivamente en las intenciones del hablante respecto del sentido pretendido en que la conclusión se sigue de las premisas. El lector avisado con nociones previas sobre estos tipos de argumentos quizá se sorprenda, pues no le habrá sido difícil adivinar, de entre los ejemplos que hemos puesto más arriba, cuáles eran deductivos y cuáles inductivos sin que le hayamos informado de nuestras pretensiones. Pero ése es un efecto ilusorio derivado de que los ejemplos son todos argumentos válidos (según el tipo -no declaradc- que hemos pretendido que tiene cada uno y que el Iector ha adivinado). Es cierto que un argumento deductivo, si es válido, es válido en virtud de su forma, pero no es cierto que un argumento, si es deductivo, es deductivo (válido o inválido) en virtud de su forma. Considere dicho lector los siguientes argumentos (que no contienen premisas implícitas).
A7 "El primer coche de Fernando le dio buen resultado. La segunda casa de Luis le dio buen resultado. Por tanto, el tercer ordenador que me compre me dará buen resultado."
Al3 ''Juaaa.es aqwitecio,,&q$a:as ~ ~ L % c , Por Q . tanto, Fernando p s . c c ~ i t ~ ~- ..". , A9 , "El tiltimo presidmte ,sst.ad,ouaidmse es -~~\i;u;6n. Por tanto, .el :pr6~imppresj. den& es3adouinide~sase~&;var6n,". . . * & , A 10 '!E1úIt4dmo2 p~esideak~sfiad~unideme &S @epóqr&i.a.P Q tantp, ~ el. ~g¿jximo presiden&e+:es~iido~i;defibe~swd* demóqs~tl.' . .. Al 1 "Algunos homb~essonmp@&&~Por.t@nto.todos los,hgBbres son ~@nal~+... A12 ."Algunos hombres s~,rai.olrtaIes.SÓcrates es-hombre. Par @ntoLS6craacs es mortal." , ' , ! . .
+
.
e
~
4
iS.
p
. " .' , Seguramente ahora ya:nrii Fi pabecer4aal4ao~quepuede: idmti$car tm fácilmente cuáles son deductivos y cuáles inductiveg: S i m p k m n ~ e n oes poslbfe+eo1xyoO tampoco 10 era antepcon A I-A&(a n@.sezque nos dijera&, o w ~ r e ~ i ~ p u s i ~ a ; ~ha c cbeaho ~ n . oel lector, qiile eran válidos). L~lrquehw.,q@n.agumeTito.indbi&~13 o deduetivoes la natwale~tidel apoyo pretendido enge*prem?tsas y oonc&asi6n.Fw&m"que d i c k ap@y<opetendido *es diferente, los criterios .de corrección también son difterenteg; un:argumento puede ser dedudvmente inválido pero indupivaniente ~@ido.&ra~eya$uarla valide& de un argumento es preciso entonces conocer mtes si es deductivo winductivo; ymda en la forma del arp-nto (si incluirncs ros amv5lidos.) indica taL sosa, .Eso.,sdi~se,puede saber conoc i e a o las pretensionqs &l.hablanted Esto es asi~hth-iandoestdctimente, p a c o a es que el contexto sugiera de algún rnok2!l t i p de akgum~o:dsquiese trate, .e& es?sugiem las intenciones del hablarlte o proponente-dslarguheni@xz . Aunque ya se ha sugerido en la exposición, conviene aclarar explícitamente-que*las antabares consideraciones+sa~refiízren a la difere13@;tmm,argumentw~ded;i~ctivosy argumentos Pnductivm, no a la- difereiieiamtre argammros J&dadws x&lidw y, agurnmms induetiv@&-r;flrá.Ei&st. :L&a#@f e9cia w& ~ ~ % ~ ~ Q S ~ S ~ e@ilEkWhs, & . % Vka&~a-ea.~&s OS intémioaes del hamnt@s&d .Per~ ~ - ra, e .,& $ ;-,+ A ,s-~ & &'.. ~ k.. ai.9&.1af&fe~cj,~imtrew~& mmtos de1.i"m*fgs;y&~i$as*p O $ ~ & B ~ ~ ~ ~ ~ V &s~$$+Or P a ~ ~ %.S : i i,eP & a & ~ e m t e d i l i s in&&i&es o.:&! dmtegta Esrrnegmda &&e~&:w~&Lf:mene~.a agetixa,+iin&pendiente de4 h ~ i n t ye del contexto,-y consiste m@d.~ntre.~&$&as.y ~k&usi6x.ee'& una de dos ~elacionesobjetivamente diferentes.-Un~a~~imenW~:com~~ricto de hab1a.de .un hablante*es~deductivoLo.induc~vo Si el h a b l a n t e . p ~ ; e W q u c : ~ ~pzemikas tre y condEsi6n se da .fa relgción objetiva de apoy&tde$ncrivo o si pktende qrsiw:se da la relación ~bje$ivade apojlo iZductivo; .y el argurnentiocse~i$ ..vgiido si Ba;rekación- obj&vaa eatre .pemisa-sc y conchrsien es dehekho-l,aque el-h~blai?te.pmten&~~qx& ES: En tanto-quewto~d~~habl;a; no hay modo de sabersi unLargummP&.eodedwctive aindvctivo .sin ~anocerlaisiaten&ne,s del hablante; perobuna.vea~ o ~ o c k i a ~ ~ qváEidaa,h~4lido,es ae~ka pe&ctamenze objetivo . .,;". , e independiente de sus jnteneknes y del :contexto: . Un posible muda altemivo de seii~~lar eb mis&@punto'es c~nsidsrzir-Quelos argumentos no son actos de hablapsino entidades oh$itivas y-qOe~.los actos da ~hzbla consisten en intentar expresar argumentos. Así, entre todas las posibles secuencias de qiie.serííi.n t~cjuellasen las premisas más conclusión, rendrhmos. a~nhentczs=d~ctvctivo% que entre prem~isas~y conclusiónse da Iti~rtlmiónde ap;O)~d~$eduesu'wa~at~zs, lo que antes hemos llamado argumentos deductivos válidos); argumentos indmtivos, aquellas en las L
1
I&
I
S
Y ,4
?%b
d
.%
(
L A , . r
v
ARGUMENTOS DEDUCTIVOS E INDL%TIVOS
41
que entre premisas y conclusión se da la relación de apoyo inductivo (esto es, lo que antes hemos llamado argumentos jnductivos válidos); y pseudo-argumentos, aquellas en las q u e
entre premisas y conclusión no se da ninguna relación de apoyo. Los hablantes, al argumentar, intentarían expresar argumentos, unas veces argumentos deductivos y otras inductivos; y, por ejemplo, si un hablante intenta expresar un argumento deductivo y lo logra, el acto de habla es exitoso, y si no lo logra (si expresa uno inductivo o un pseudoargumento), el acto es fallido. Es esencial darse cuenta de que este modo de presentar las cosas es equivalente al anterior. En ambos casos el hablante, al argumentar, tiene la pretensión de que entre premisas y conclusión se da una determinada relación .objetiva de apoyo (de entre dos posibles) y la argumentación es exitosa si su pretensión es correcta, si efectivamente se da la relación que según él se da. La diferencia entre ambos modos es meramente terminológica. En general aquí seguiremos usando el primer modo de expresión, aquel que considera los argumentos mismos como actos de habla y considera por tanto la diferencia entre argumentos deductivos e inductivos (tanto válidos como inválidos) relativa a las intenciones del hablante.
2. Argumentos deductivos
En los argumentos deductivos el sentido pretendido en que las premisas apoyan o j'istifican la conclusión es el más fuerte posible. Estos argumentos se caracterizan por la pretensión de que la verdad de las premisas garantiza plenamente la verdad de la conclusión. Un argumento deductivo es válido si efectivamente las premisas apoyan la conclusión de tal modo, si no puede ocrcrrir que las premisas sean verdaderas y la conclusión falsa. Recuérdese que para la validez o corrección formal no importa que las premisas sean o no de hecho verdaderas, lo que se pretende es que si las premisas fuesen verdaderas entonces la conclusión también sería verdadera. Por tanto, en los argumentos deductivos no se puede dar cualquier combinación entre validezlinvalidez y verdadlfalsedad de premisas y conclusión. Si el argumento es inválido se puede dar cualquier combinación de verdad y falsedad de premisas y conclusión, pero no si es válido. Puede haber argumentos deductivos válidos con premisas verdaderas y conclusión verdadera, como el siguiente A13 referente a la humanidad de Sócrates (en lo que sigue, en el resto de esta sección pretendemos que los argumentos son deductivos); o con premisas falsas y conclusión verdadera, como A14; o con premisas falsas y conclusión falsa, como A 15. A13 "Todos los hombres son mortales. Sócrates es hombre. Por tanto, Sócrates es mortal." A14 "Todos los hombres son griegos. Sócrates es hombre. Por tanto, Sócrates es griego." A15 "Todos los hombres son rusos. Sócrates es hombre. Por tanto, Sócrates es ruso.''
42
FUNDAMLXTOS DE FILOSOFL.~ DE LA CIENCIA
Pero no puede haber un argumento deductivo i.álido con premisas \.erdaderas y conclusión falsa. Esa es la única combinación excluida pues la validez deductiva significa precisamente eso, que caso de ser verdaderas las premisas la conclusión también lo es. En adelante, cuando queramos esquematizar los argumentos deductivos escribiremos en serie las afirmaciones involucradas separando la conclusión de las premisas mediante una línea continua para connotar que el apoyo pretendido es el máximo.
La disciplina que se ocupa de investigar los criterios de validez de los argumentos deductivos es la lógica deductiva. Como ya hemos indicado, la validez deductiva se entreJa verdad de las premisas y la de la conclusión: un y&r&s@y,g# @h0"p~ed'&?@&3$&-!1&$ * r e ~ h a s.sean wdap i66 ~&a~bft?ii%2% validez de 1 4 h u m e n t o s deductivos depende "%e 1% aigúmentos. La estructura o forma Iógica de un argurnento es el resultado de abstraer o "vaciar" del argumento sus expresiones no lógicas, o como se dice técnicamente, de convertir el argumento en un esquema argumentativo sustituyendo las expresiones no lógicas por variables. Las expresiones lógicas son expresiones como 'todos', 'algunos', 'y', 'no', 'si ... entonces', etc. Aunque no podemos extendemos aquí en ello, estas expresiones se consideran partículas lógicas porque de ellas depende la validez de los argumentos (deductivos) en el siguiente sentido: si en un argumento sustituimos alguna de estas expresiones por otra de la misma categoría sintáctica (p.ej. 'y' por 'o', o 'todos' por 'algunos', etc.), la validez del argumento puede verse afectada, mientras que la sustitución de las otras expresiones (p.ej. 'Sócrates' por 'Platón', o 'mortal' por 'griego') no afecta a la validez. Así, por ejemplo, si en A l cambiamos todas las ocurrencias de 'y' por ocurrencias de 'o', el argumento pasa de ser válido a ser inválido, y si en A13 sustituimos 'todos' por 'algunos' (e.e. A12) ocurre lo mismo; contrariamente, si en A13 sustituimos 'mortal' por 'griego' (e.e. A14) o 'Sócrates' por 'Platón', no se altera su validez. Los esquemas argumentales que usaremos en adelante se obtendrán de sustituir en los argumentos las expresiones no lógicas por variables apropiadas que indiquen el tipo sintáctico de la expresión no Iógica, Cuando 10s esquemas argumentales de dos argumentos coinciden diremos que los argumentos tienen la misma forma lógica. Por ejemplo, los tres últimos argumentos, y A3, tienen la misma forma lógica:
Todos los S son P aesS
A 1 tiene la forma:
La lógica deductiva se ocupa de estudiar los esquemas o patrones de deducción válida; o mejor, no establece en concreto todos y cada uno de los (infinitos) esquemas válidos posibles, sino que estudia los criterios generales en virtud de los cuales unos esquemas son válidos y otros no. Los dos esquemas indicados se adecuan a esos criterios. Otros esquemas válidos son el modr<sponens: si a, entonces
B
a
o el rnodrrs tollens: si u, entonces p no P
Como éste no es un libro de lógica, no vamos a detenemos en los criterios generales ni en más esquemas específicos. Cuando sea necesario hacer mención a algún esquema concreto, lo haremos presentándolo como válido o inválido sin ulterior justificación, de modo que el lector sin conocimiento lógico previo deberá apelar a sus intuiciones o, si tiene alguna duda, recurrir a algún texto de lógica deductiva elemental. En cualquier caso, es útil que el lector no avezado, cuando se le presente un esquema supuestamente inválido, intente encontrar un caso del mismo en el que las premisas sean verdaderas y la conclusión falsa. Si da con un caso así, el propio lector habrá demostrado que el esquema en cuestión es inválido. Puede practicar con el siguiente (conocido como falacia de afirmación dé1 consecuente): si a, entonces p
P
4.4
FUNDAhZE$JTQS DE~JLOSñrFhDE L4 CIENCIA
A veces se caracteriza la dedp~ciánw o ( , ' @ paso de lo general a lo particular", por oposición a la inducción que p r o c e d a ep sentido contrario. Si con ello se quiere decir que en los argumentos deductivos válid~laspremisasson todas afirmaciones generales y la conclusión es una afirmación particurk, entonces es falso. No siempre ks así, en reaIidad son muy raros y poco interesantes los argumentos deductivos válido)de ese tipo, p.ej. los siguientes A16 y A17. Lo usual es que, cuando la conclusión eb'$artic&lar, I h premisas combinen afirmaciones generales y particulares, como en A13 (y sus equivalentes), o que todas las premisas sean panicul&~s como en A l . Pero además también hay .* ,7ba? argumentos deductivos válidos con conclusion geizeral, como A1 8 (en A 18 la conclusión general es universal, idee el lector otro argumento válido con conclusión general existe!~cial). ~3
r
3
,
A1 6 "Todo es rosa. Por tanto el GMtlefi.Bdte & rosa.'" A 17 "Todos 10s hombres; son mort8te.s. 'Par tifrlto, sl Espeto 'es hohbr-e entonces > es morta1.%' A18 "Todos los hombres son mortaleK TodOs,%i@dfidscs soh hambres. Por tanto todos los dioses son moqales." I
i
t
i
L
f
Hay un sentido en que sí se puede cxnsiderar que la deducción va de lo general a lo particular. En los argumentos deductivos válidos, la información que da la conclusión ya está contenida, sólo que implícitamente, en las premisas conjuntamente consideradas. Al "decir" las premisas ya "hemos dicho" implícitamente la conclusión; justamente por eso no puede ocumr que las premisas sean verdaderas y la conclusión falsa,,la cm,clpsi6n no dice nada que no esté implícitamente contenido en las premisas, y lo que hace el argumento es, justamente, hacer expIikii@ eske hecha En términos tradicionales podemos decir que los argumentos deductivos no son ampliativos sino explicativos (explicitativos), no proporcionan conocimiento fáctico nuevb, dan conocimiento sólo en e1 sentido en que hacen explícita cierta información contenida en otra. Éste no es un conocimiento banal, o poco interesante, c m o muestrq,@ysg de la<deducci$nen la ciencia, la filosofía y la vida ,dqja $&mi tasce.qde@k darse. cuenta dé 16 gue ' s i deduce cotidiana; muchas buece,ssas de ciertas otras, c~sas.~Pero es 6n c o q o c i ~ i y t oque cab;. calificar .... de meramei~f~ex~li~ativo, pa ampliativo. ES eq, este seatidq que se puede de?if<uizb que la'dk$~cciónv i kid lo general a lo particular. La d$duc&5np&te d d ~ o n i e n i dgefieial ~ o t6tai &ela'infohaCióG presente en las piekisas j> ex_trae,oexplicita '.'unapartene.'del mismo.* /.
$'
Casi todos cometemos errores en la argumentación en algunas ocasiones:*algunos en muchas ocasiones y unos pocos.'..$ti. @c.amente siempre. En 10s argumentos deductivos, el error consiste como hemos visto en que las premisas pueden ser verdaderas y la conclusión falsa, eso es lo que ciracterisa a un argumento qüe pretende ser deductivo y que es inválido. Hay por supuesto muchas formas de argumentar inválidae
ARGUMENTOS DEDUCTIVOS E INDUCTiVOS
45
mente, muchos esquemas de inferencia inválidos. Por lo general, sin embargo, ni siquiera quienes casi siempre argumentan mal producen argumentos totalmente descabellados. Con frecuencia las argumentaciones inválidas siguen ciertos patrones típicos. A estas formas típicas o usuales de argumentar inválidamente se las denomina falacias. A veces también se denominan así esas otras formas de "argumentar" a que nos referíamos más arriba, en las que no se pretende propiamente construir un argumento en sentido estricto sino utilizar alguna otra forma de persuasión. Aquí aplicaremos el término sólo cuando esté presente la intención de producir un argumento en sentido estricto, limitándonos además de momento a los argumentos deductivos. Y ni siquiera vamos a ver aquí todas las falacias correspondientes a estos argumentos. Hay muchos tipos de falacias, Aristóteles menciona trece en sus Refutaciones sofísticas, y se han identificado más de cien (cf. Hackett, 1970). Comentaremos brevemente sólo las más conocidas e importantes para nuestros intereses.
Petición de principio. Antes de ver las falacias propiamente dichas, mencionaremos un tipo de argumentación "insatisfactoria" que no es exactamente una falacia en el sentido indicado, pues constituye de hecho un patrón formalmente válido. aunque trivial. Se trata de la petición de principio @etitio principii). Brevemente, se comete una petición de principio cuando se da por probado lo que se quiere demostrar, esto es, cuando se incluye (quizá subrepticiamente) la conclusión como una de las premisas. Por supuesto que es un argumento formalmente válido, pues responde al patrón de inferencia válido indicado a continuación, pero es un argumento insatisfactorio por trivial. Si éstos se considerasen satisfactorios, no haría falta mucho para argumentar satisfactoriamente.
4
x
3:
$
Quizá se piense que no se puede ser muy estricto en este punto, pues después de todo en los argumentos deductivos válidos siempre ocurre que la información de la concIusión "ya está de algún modo contenida en las prernisas". Bien, pero si deducir satisfactoriamente consiste en hacer explícitas consecuencias implícitas, hay una diferencia entre estar implícitamente y ser directamente una de las premisas. En las deducciones interesantes la conclusión se obtiene por el efecto combinado de varias premisas. Tampoco éste es el criterio definitivo, pues hay deducciones con una única premisa y, en cualquier caso, todo argumento se puede reescribir siempre como constituido de una única premisa conyuntando las que tenga originalmente. Se comete petición de principio cuando la conclusión está en prácticamente su misma forma como una de las prernisas. Esta caracterización es reconocidamente vaga; a veces no está claro si se comete esta irregularidad o no, pero hay casos claros, aunque sutiles, de este truco argumentativo. El discurso filosófico contiene interesantes ejemplos en los que se pretende que se están usando ciertas prernisas para establecer determinada conclusión, cuando en realidad ésta se presupone "casi en su
misma forma", quizá a veces como premisa oculta (por ejemplo, el famoso circulo cartesiano que, en algunas interpretaciones, presupone la existencia de un Dios no engañador en la "demostración" de sil existencia a partir del cogito). Pasemos ahora ya a las falacias propiamente dichas. El primer grupo de falacias a destacar son las estrictamente formafes.
Falacias formales. Estas falacias corresponden a esquemas argumentativos cuya estructura "está clara" (no hay p.ej. problemas de ambigüedad) y tales que muchos usuarios no adiestrados en lógica tienden a considerar esquemas de inferencia válidos, pero no lo son. La más renombrada de este tipo es la falacia de ajinnación del consecuente, cuyo esquema presentamos más arriba. Que este esquema es inválido se muestra fácilmente (como proponíamos de ejercicio al lector) construyendo un argumento de esa forma en el que las premiras puedan ser verdaderas y la conclusión falsa. Un ejemplo típico es el siguiente: "si ha llovido las calles están mojadas; las calles están mojadas; por tanto, ha llovido"; es sencillo pensar en una situación en que las premisas son verdaderas y la conclusión falsa. Otra falacia muy similar es la de negación del antecedente (piense el lector un ejemplo que muestre su invalidez): si a, entonces no aí
B
no P Los siguientes dos esquemas también son tomados muchas veces erróneamente como válidos (compruebe el lector que no lo son): algunos P son Q algunos Q son R algunos P son R
ningún P es Q ningún Q es R ningún P es R
Hay muchas más falacias formales, pero no las vamos a ver aquí. Si interviene más adelante alguna otra lo indicaremos en su momento.
Ambigüedad e imprecisión. El siguiente grupo importante de falacias tiene que ver con alguna forma de indeterminación de algunas de las afirmaciones involucradas. Esta indeterminación puede ser debida a ambigüedad o a vaguedad; la ambigüedad a su vez puede ser formal o material. Los casos de ambigüedad formal son aquellos en los que no está clara la forma lógica de alguna de las afirmaciones involucradas, se puede interpretar de varios modos y en alguno de esos modos el argumento es inválido. Un ejemplo típico es la afirmación de la forma .todos-los P no son Q , que se puede interpretar como "no todos los P son Q ' o corno "to86s 10sP son*&-p. Así, un argumento como "todos los programas informáticos no son infalibles, Deep Thinking es un programa informática; por tanto Deep Thinking no
4
fl(
es infalible", es ambiguo; puede corresponder a uno de los dos patrones siguientes, sólo el segundo de los cuales es válido.
no todos los P son Q aesP
todos los P son no-Q a es P
,-
anoes Q
,Ld$
)
Cuando se argumenta de esa forma y la primera premisa significa lo primero y no lo segundo, puede creerse que es válido por serlo en la otra interpretación; estamos pues ante un típico error de argumentación. Otro caso típico de ambigüedad formal tiene que ver con la acción conjunta de dos cuantificadores, como en la primera premisa del siguiente argumento: "los alumnos admiran siempre a un profesor, Juan y Luis son alumnos; Juan y Luis admiran al mismo individuo" (reconstruya el lector las dos interpretaciones posibles y determine cuál es la válida). Esto basta de momento para ilustrar las falacias de ambigüedad formal, llamadas a veces anfibologías. Las falacias de ambigüedad material se deben a la ambigüedadde alguna de las expresiones no lógicas del argumento, que pueden significar dos cosas diferentes (palabras como 'banco' o 'gato'). Si en una de las afirmaciones la expresión significa una cosa y en otra significa otra cosa diferente, el argumento puede ser inválido. Considérese el siguiente caso: "algunos animales son gatos, los patos son metálicos; por tanto, algunos animales son metálicos". El argumento tiene dos interpretaciones, correspondientes a los siguientes esquemas: l
algunos A son G todos los G son M algunos A son llf
S
3
E6
,L La
cw
3
algunos A son G todos los T son M algunosA son M
,,
En la primera versión el argumento es formalmente válido, pero inadecuado materialmente al ser falsa la segunda premisa. Si alguien pretende que es adecuado materialmente, que las premisas son verdaderas, le corresponde la segunda forma, pero entonces es inadecuado formalmente pues se trata de un esquema inválido. En estos casos se dice que se ha cometido una falacia de equivocidad.Este ejemplo es muy tonto, pero falacias de equivocidad más sutiles, en las que muchas veces es muy difícil identificar el doble sentido de las expresiones utilizadas, abundan en filosofía (por ejemplo, en argumentos que confunden diversos sentidos de 'posible'). Las falacias de ambigüedad material se parecen a otro tipo de falacias materiales, las de vaguedad o imprecisión. Muchos argumentos inadecuados parecen adecuados porque contienen premisas imprecisas. Las premisas parecen aceptables justamente por su imprecisión, pero si no se precisan más el argumento es formalmente inválido; se podrían precisar de modo que el argumento fuese una inferencia válida, pero entonces las prernisas ya no serían aceptables. Mediante una argucia semejante, un obispo español concluía a principios de los noventa que la campaña del gobierno en favor del uso del preservativo
48
FUNDAMEhTOS DE FILOSOF~ADE LA CIENCIA
producía un aumento del SDA: "La campaña aumenta el uso del preservativo, pero también la promiscuidad sexual. El uso del preservativo disminuye el riesgo de contagio, pero el aumento de promiscuidad sexual favorece la expansión del SDA. Por tanto, la campaña favorece el contagio del SIDA." Así de vagas las premisas parecen verdaderas, pero con estas premisas, sin precisarlas más, el argumento es claramente inválido; es sencillo diseñar una situación en la que todas las premisas son verdaderas y la conclusión falsa (cualquiera en la que el efecto positivo del preservativo supere el efecto negativo de la promiscuidad, el lector puede diseñar una situación tal como ejercicio). Se pueden precisar las premisas de modo tal que el argumento sea formalmente válido, pero la cuestión es si entonces es materialmente adecuado, esto es, si en dicha interpretación más precisa las premisas siguen siendo verdaderas. No atinencia. Otro tipo de falacia se caracteriza porque las premisas son, de diversos modos, "no atinentes", insuficientes o irrelevantes para establecer la conclusión. No es claro si se trata de falacias en sentido estricto de 'argumentación', o si son más bien recursos no argumentativos para la persuasión, como los comentados más arriba en los que se apelaba a la fuerza o a las emociones. En cualquier caso son recursos muy usuales en muchas discusiones y polémicas pretendidamente argumentativas. Estas falacias se conocen por sus nombres latinos: ad ignoranriam, ad hominem, ad verecundiam e ignorario elenchi. En el argumento ad ignorantiam se pretende establecer cierta afirmación sobre el único fundamento de que no se ha demostrado que es falsa. Algunos creyentes en la astrología defienden su tesis de que las posiciones astrales determinan el futuro de las personas apelando a que no se ha demostrado que no sea así. Pero, por supuesto, de la ausencia de prueba en contra sóIo se sigue la (provisional) posibilidad de que la afirmación sea verdadera, no su verdad efectiva. En los argumentos ad hominem se pretende establecer cierta afirmación atacando o desautorizando a quien defiende la contraria. Por ejemplo: "no hay un peligro real de desertización por efecto del agujero de ozono, pues ya se sabe que eso sólo lo defienden los ecologistas", o "no es verdad que, como dice Fidel Castro, en Latinoamérica hay explotación, ¡qué va a decir un comunista!". Es claro que, sin premisas adicionales, estos verdades son verdades aunque argumentos son falaces pues, como decían los clásicos, 'as * 14s lpa-ql diablo, Los argumentos ad verecundiam son en cierto modo opuestos a los anteriores. Estos argumentos son un caso degenerado de la argumentación por autoridad, esto es, de argumentos que apelan a la opinión de un experto en el tema, como por ejemplo: "el SIDA crece más en América que en Europa, lo ha dicho el presidente de la Organización Mundial de la Salud". A veces esos argumentos son legítimos, cuando está justificada la premisa implícita de que los juicios del experto sobre el tema en cuestión son correctos. Pero muchas veces la apelación a la supuesta autoridad carece de fundamento, es una mera argucia, en cuyo caso estamos ante una falacia ad verecundiam; la pretensión de muchos tiranos de que "las cosas son así porque lo digo yo" es un ejemplo extremo, muy próximo a la mera persuasión por la fuerza (o "argumentaciones" ad baculum).
+i
La falacia ignoratio elenchi se produce cuando en un argumento que procede correctamente hacia determinada conclusión se cambia al final la legítima conclusión por otra ilegítima diferente pero relacionada, unas veces más general, otras más específica. El discurso social proporciona buenos ejemplos de ambos casos. Nos encontramos en el primer caso, por ejemplo, cuando en un argumento cuyas premisas establecerían correctamente que el consumo de heroína es pernicioso, se pretende concluir que el consumo de cualquier droga es pernicioso. Y en e1 segundo caso, por ejemplo, cuando en un argumento que concluiría válidamente que se debe rebajar el déficit se concluye que hay que subir los impuestos. Las conclusiones pretendidas no se siguen sin premisas adicionales.
Premisas ocultas. Para concluir, conviene distinguir los argumentos falaces de otros que, aunque en cierto sentido son "incompletos", no son inválidos. Nos referimos a los argumentos con premisas ocultas o elípticas. En la mayoría de los argumentos que realizamos no explicitamos todas las premisas y dejamos que el contexto indique cuáles son las premisas elípticas que presuponemos. A estos argumentos, que se pueden completar adecuadamente explicitando prernisas implícitas ocultas, se les denomina entimemas. El caso más famoso es cierta interpretación del cogito cartesiano: "Pienso, luego existo." Según esa interpretación, se trata de un entimema que tiene como segunda premisa, oculta, la afirmación "todo lo que piensa existe", siendo por tanto un argumento deductivo válido. Considérese el siguiente argumento: A19 "El Estado no debe ser paternalista, sólo debe prohibir acciones individuales que tengan consecuencias directas o indirectas contra terceros. El consumo de drogas tiene consecuencias contra terceros. Algunas de esas consecuencias son producto de la penalización, como la delincuencia vinculada al tráfico ilegal, los robos para poder costearse el precio derivado de su prohibición, la degradación y coste del sistema carcelario, o la tensión internacional entre países productores y consumidores; en este aspecto la penalización es perjudicial. Otras consecuencias no se deben a la penalización, como la ruptura del medio familiar del adicto, su bajo rendimiento laboral, las acciones incontroladas bajo efectos de la droga, o la carga económica que representa para el sistema sanitario público; la penalización tiende a reducir el consumo y, con ello, este tipo de consecuencias, siendo pues beneficiosa en este aspecto. Pero los perjuicios de la prohibición son mayores que los que cabe esperar del aumento de consumo que se derivaría de la despenalización. Por tanto, hay que despenalizar el consumo, producción y venta de droga." Independientemente de que pueda rechazarse por desacuerdo con alguna de las premisas, este argumento tiene toda la apariencia de ser formalmente correcto. Sin embargo, si lo formalizáramos resultaría un esquema inválido. El motivo es que no menciona explícitamente toda una serie de premisas que supone compartidas por la audiencia del contexto. Si completamos el argumento con esas premisas ocultas obtenemos un esquema válido. Pero
L,.
f
si $! aee$r este expediente~iridlrcriminadahay que tener cuidado on e i p situación, , I *:yb ~%i&66?En ef~cfof.ta30:argumenro mente enmnces todos laq~b&~Ú~entos ,-p6dd'an inválido, hasta Ci m+ d e s f i a b d ~ a d q ~ $ gcont.etf~d e~~ en ii2ilia4i f i e ~ i t i ~ o s i e ~ r n ~ i e e ~ * con las ppni+as adjcio%les neosanas,.+ D=fi&hb;'rnU~fibi 'perssnás *irra&iaraIesa;@menpyJ, o mejor ase' poniendo y qkitaidu- d9bl)er;ori prhniiitls~aY6lhfirad. .-he 6 Comq.todo fenákepa p r a g d i c o , &S dirícil prec8ar.c~@e%elIrnihe d & l ' u sleg6~mob<le ~ este recurro, pero ello y sj$i!!ca"&e , no . &iYá&"~iil&&nios:los -. &€id&ds se pueden en pneral ca>s&rar f?laces o i1:gítirnos si 1;s premisakocultas+no~ rlaráihente-consideradas justificadas por la audiencia. . :(
a
a ";
<<.*.d.
6%
i
S <
I
&
'
A
.
3. Argumentos ind"&ivos '
Los argumentos dediictivos son <&lo explic~tivos,rne&$n'te ellos no se~establepe infomacióaGmaterial nueva. S i ellos',constituyesem 'el 82&6 dpo ;& ?&zumentdd6n, no
4
podríamosestablecer justifica r&riinenrativarnd$e k f o ~ ~ c i 6r?u&g?.kro; & en cie~to s e ~ t i d oque hay &e pl&isar, a veCe~j'u$fi~amos&&earaifhente'infomae~il nueva. ,% Pw tanto, hay argqlgcnfos~ustificativpsno deductivos: Estos argumentbs en 18s que, aun siendo cb?rectoi'la CdnclPsidn contiene más información que las premisas son los argumentos ind&ti~os:Así,M w i a m = n r e al c ~ á c . ter meramente explicativo d~los,deductivos,los argumentos inductivos se caracterizan por ser awnentarivos. Esta Faracterhiica supone qtie '& $fiio de' vdlide~no puede ser el .mismo que, el de las delSl;ctivos: si la conclusión' coiicene, in81iso e;rt los argumentos válidos, más infomnicirín que las pgnisas, en el%% l% se fuede pieie~akrque la verdad de las premisas garantiFanp?enameq$ijaverdad de la hon&lu$dii.~nun argumento inductivo válido es posible cualquier Fqn$:nacidn de v&&d y'falseaad d&lks afirhaciones involucradas, incluida e& qtík 1s; pr&$as sean ve~&a~lk&.?:~' lá.r8icld$~ónfalsa. ¿Qué preteqsión caracteriza ento?ces ,?;tos &gumentos? ¿Queti36 de ap6yo se pretende que confieren las p ~ e m i ~ a s -la? conclúsi6n? Se preteiide s b b 'que"l~s*~&ihisas apoyan o j~stifiiowla conclusián en &e60 @do, que la verda~~kL18s$re'misas'h%Ce"probable" la concjusión. Nuestra pretensión ,en y A5 era de este tipo:'ambi(sxin, de acuerdo con las intencipnes can q y r 1;s f i e ~ e ~ r a ~aigumentb~lnd~&ivuss. ~$; En aeelantd, cuando quera..t .>,C sarie'las afirmaciones invomos esquemati,z&,los aigumentos i~ductivasescribirédos'en ~u~adas'separando 14 cQiClusión de las préfiisas rrikd~~€e'ud&'r'$í~ea'discontinua para csnnotar que el apoyo 6reteRdido e$ sólo parefal. ".'" , "
rtRGU.\.lEhTOS DEDUCTIVOS E ISDUCnVOS
3.1.
ARGUMENTOS INDUCnVOS Y
51
FORMA DE PREMISAS Y CONCLUS(ÓN
Como ya mencionamos, a veces se expresa la diferencia entre deducción e inducción diciendo que la segunda, contrariamente a la primera, "va de lo particular a lo general". Si con ello se quiere decir que en un argumento inductivo válido las premisas son siempre todas afirmaciones particulares y la conclusión es una afirmación general (esto es, cuantificacional), no es cierto. Para empezar, hay argumentos con premisas particulares y conclusión general, aunque existencial, que son deductivamente válidos, p.ej. el A20 a continuación. Por otro lado, aunque muchos argumentos inductivos, como A22, tienen premisas particulares y conclusión general universal, no siempre es así, la conclusión puede ser también particular, como en A21. Además, hay argumentos inductivos con premisas generales y conclusión particular, como A5, y también con conclusión general universal, como A23. A20 "Sócrates es filósofo. Por tanto, alguien es filósofo." A21 "3 es la suma de dos primos. 5 también. 7 también. 9 también. 11 también. 13 también. ... 4817 tambikn. Por tanto, 4819 es la suma de dos primos." A22 "3 es la suma de dos primos. 5 también. 7 también. 9 también. 11 también. 13 también. ... 4817 también. Por tanto, todo impar mayor que 1 es la suma de dos primos." A23 "Todos los cuervos observados son negros. Por tanto, todos los cuervos son negros." En los argumentos inductivos válidos, por tanto, es posible cualquier combinación de afirmaciones particulares y generales en premisas y conclusión. La caracterización de la inducción como "paso de lo particular a lo general", aplicada a estos argumentos, expresa sólo que en ellos la conclusión contiene información nueva respecto de las premisas, sólo en ese sentido es más general que aquéllas. Quizá se piense que en los casos con premisas generales mencionados (A5, A23), éstas son generales sólo en apariencia, pues son equivalentes a una conjunción finita de afirmaciones particulares (como en A2l). En primer lugar, dicha equivalencia no las convierte formalmente en particulares; pero es cierto que esos casos no serían esenciales pues siempre se podrían sustituir por otros argumentos equivalentes. En segundo lugar, y lo que es realmente importante, las prernisas pueden ser generales y no equivalentes a una conjunción finita de particulares. Estos son los casos que incluyen premisas probabilistas o estadísticas, como en los casos A24 y A25 (para esto y lo que sigue, cf. los argumentos A24-A30 que siguen a continuación). Puede parecer que hay argumentos inductivos que contienen esencialmente alguna premisa general no estadística y no equivalente a una conyunción de afirmaciones particulares, como la segunda premisa de A26. Pero estos casos no son inductivos "puros", pues aunque la pretensión última es inductiva contienen algún paso intermedio que es deductivo; estos argumentos son mixtos, se pueden expresar como combinación de un argumento inductivo y otro deductivo (hágalo el lector con A26). Por otro lado, no siempre que aparecen prernisas probabilistas el argumento es (pretende
ser) inductivo, A27 y A2gatienen premisi%~robab?listas'ys6n &cüvo?(en el casó &e A28 con premisas ocultas pertenecientes a la teoría de la probabilidad). En general, el , d
.&Y.*
quinento será (preTende s&).%?ductí+o c@ndu alguna$' ~ & m i ~ d s " + s ~ n ~ * ~o~ ~ ~ b i ~ estadística y-la coiclusión n6 lo &S; pero ho %eh$tk o@& así; A29 es%edÜc%+6koii Una premisa estadística y tmc~dsiód*~o'es~diS;tica. ~amp6Ebis'6f caso que siémpre hay pretiiisas probabilistas 'y la t*n&tslón tarnbié$es pr6bat$fista o estadíitic9, 21'iiigúrnhto es deductivo, por ejemplo A25pretende ser inductii~oy Sii c6nclus;6h es ecfhbística. i.t . vez jugando alehativamenb F A L A24 *.Enla ruleta, la pmWilidid de aceiai I a rojos y negros dt!trhte armenos cincuent%t'paftidas,es mhy cei~an9.a1. Juan jugó cien partidas altemativamen~k'h%j6s-y ndkros. por t&to, icen6 alguna vez." 1 A25 "La probabilidad de que un obeso tenga problefnas cardíads'es de 03.Mis alumnos de este año son todos obesos. Por tapo, el 50 % de ellos tendrá m l problemas cahíados." ' A26 'Todos los't%ros que ha kscrip hani ahofaS.'~inghan sido beir-sellers. Los besi-sellers 'acaban convk%itndoie en &i8nés 'cin&m&togrf$icos. Por libró deJ%King re l l w & ' ~ i ' ~ i k " ~ tanto, el A27 "La probabilidad ae que un obeso tea& pioblemas cardfacos es mayor que 0,5. Juan-es obeso. Por tanto, la probabilidad Juan @iigaproblemas O [< > cardiacbs es mayor que 0,5.'" A28 "La probabilidad de que al extraer una cana de una baraja salga osos es de 1/4. La probabilidad de que salga un as es de 1/12. Por tanto, la probabilidad .D.f. " de que salga él as &e*oroses de 1148.". A29 "E40 % be los diputados son sbcjal!!?tas. %y e$actamen&*200diputados. ' " Por tanto, hay R),dfpntaddssocia~ist'as." A30 "La pdikibikd8@i>.dk '¶ue un fuimador d/ i&zaaduiacid*-p~deLa2g&p enfermedad pulmonar crórrica>e< exttf'e~a'da'@eniz alta. h& 13s fuP36r"lcfe ' larga .duráción. -~uy'~robh6lemen'te; por tanto: juán &de+& &&*a enferT medaddpulmonat.crdfiica." "' .< -.; >-, #
I
+
\n\J
a
.*
*
/
J
,
1'
6
,
c'%
*
En general, pses; hay mdy divgrsas c6m6inach~esakeargumedfos'-&educti~9~ %~ *b E'J induchvos con premisas o conBlirion2s @robabilistds"~ h pr@enciazdc@rnac@n&s probabiiistas no sirve por ianto pifa fbkntifichri in geaeih~,el'iiib deba&urnenfo de, ' Se se Y%, .:i trata. HastahA29no hemos utilizdo en 16sej&rkplos~un.m~kadbr espétid para laexpre&"S J ' "'. sión de h pretensi6n iifthkfiva en lenguajen&ciral; Fiefior uñdb, como en la pretChsión ' deductiva, é1 generico *poi tantb7,'y hetlibs dejadi, que el t6riteXfo,o nuistras' declgaciones explícitas, incfiquen la ñafira-l&a indpciida d e los,'&gu~entosque preteg&iamcwposentar como tales. En la p~áCticP'argurnení~~iva co&iána$%cha~veces se añade algo gI .x*$\<**" m&cfador gendricapara indicar qüe~el'aigumbhio $reteade sirxfnbucti?~~ al por tanto' se añade '(muy) probablemefite' -(o (oal&n'dnPo~ra~~x~~iók~d?~cida). ,. ,, En gk&ril e l i&unb' funciona bastante bien2 por ejenipro, sí motiíficainos A5' t"o este eipediente:h6 háy. ninguna duda de quC pr'etendernos ipease%'ind~cii~o: ~&dktltndo'Pasp'reniitas incluyen ' i"
.'
4
a"
ARGUMENTOS DEDUCI-IVOS E ISDUCnVOS
53
afirmaciones probabilistas, el expediente puede no ser suficiente y a veces son posibles las dos interpretaciones. Por ejemplo, A30 se puede interpretar naturalmente de cualquiera de los dos modos indicados a continuación, el primero deductivo y el segundo inductivo, ambos válidos. Por tanto, ni siquiera sabiendo que el argumento es válido es siempre posible identificar si es deductivo o inductivo. Si en la formulación del argumento se usan expresiones como 'probablemente' al presentar la conclusión, se abren dos posibilidades interpretativas: que dicha expresión forme propiamente parte de la conclusión; o que no forme parte propiamente de ninguna afirmación y sea una marca de la pretensión de que la inferencia es inductiva. A30-D La probabilidad de que un fumador de larga duración padezca alguna enfermedad pulmonar crónica es extremadamente alta. Juan es fumador de larga duración. La probabilidad de que Juan padezca alguna enfermedad pulmonar crónica es extremadamente alta. A30-1
La probabilidad de que un fumador de larga duración padezca alguna enfermedad pulmonar crónica es extremadamente alta. Juan es fumador de larga duración.
............................................................................ Juan padecerá alguna enfermedad pulmonar crónica.
La pretensión que caracteriza a los argumentos inductivos también puede ser, como en los deductivos, satisfecha o no, y en función de ello se consideran válidos o inválidos. Como ya mencionamos, algunos autores prefieren reservar 'válido' s610 para los argumentos deductivos y utilizar 'correcto' o 'fuerte' para los inductivos. En cierto sentido ello es preferible, pues 'válido' no se dice igual de los argumentos inductivos que de los deductivos. Pero para ello basta cualificar el tipo de validez, y usar 'validez deductiva' y 'validez inductiva' según sea el caso. Por otro lado, utilizar en ambos casos la misma expresión (adecuadamente cualificada en cada caso) expresa la idea de que hay algo común en los dos tipos de validez, a saber, que se ha satisfecho adecuadamente cierta pretensión, aunque en cada caso ésta sea distinta. Aquí seguiremos ateniéndonos a esta práctica. La disciplina que se ocupa de los criterios de validez de los argumentos inductivos. de las condiciones en las que se cumple efectivamente su pretensión, es la lógica inductiva. Esta disciplina es mucho más difícil y problemática que la lógica deductiva, tanto que para muchos autores está condenada al fracaso. De algunos de esos problemas nos ocuparemos por extenso en el capítulo 12. Por el momento bastarán como introducción las consideraciones siguientes. Hemos dicho que lo que se pretende en los argumentos inductivos no es que la
9,
'
.
.
.'j.
.
$" .)
--: \ z?
, i"b-1
,
>
::
virdad d e las prqtaise&vanti=? p l e p p q ~ la e ~ e ~ dLde&+jcoRFhisi6n. ql s i ~ ~ ~ s ,cjuel$a ¿il~. en cierto grado, que IasLpp@sa%.np,?~e.q C ~ ~ ~ + ) ~ , & ~ssino CIU s 6S~~o~b B re&t~~e~. ~ e d i a n t el e entrecomil~d~,,quere~qn~ndi~~ cyie la-noWrjsedeprqbab'iJidad &&da en esta caI.acteqización es-unapqpjon p ~ e t e ó ~ 5 ~ a ~ i n @@wal, t ~ i t j . v ~Hs,pfetende ~~ ~ef&iiú~p alguoa noción técnica específica4q +gyg-.ta@a-o. conwpeih~anioularde ;la probabilidad. Estas nocipoes tépicas spr+ juspm~nte&g@pp@niediaofe &gur a l g i n a ausoEs construyen su propia EQgjcq@duc<ixa:$pmoe1.&q@ció-y p&ecj;si6s3@e laZgar;ac@ rización general que hemos dado. De momento, por tanto, el lectos deber4 recurri~sólo~a sus propias intuiciones sobre esta noción. Y ya la noción intuitiva de probabilidad muestra algunas peculiaridades de,los ~gprn~ntes;induc~~~os, La primera se deriva del carácter gradual de la probabilidad. > , En cualquier acepción que se q$e&q,-la p~ohqbiiiw6 es+?lgoque no se da bipolarmente segíin un "todo o nada". %,a. verdad m q e s p a ? d ~g.&s ~~~~aciones bipolannente, una afirmación 8s ~erdadeiao~?I~~Io'&s, notes "más b he68~~~&$dkza: o "verdaden en cierto grado", a no ser que ello sea justamente s610 oúó'&o6"0 de dicii que es probable. Una afirmación verdadera no puede ser más verdadera que otra también vesdadera. Ello no ocune con' la' probabilidad. ~ u i z f i$beda ' haber un askn@do'n que una 'arihaci6n ' simplemente es probable D nÓ lb e$,'~&dóla.jtbbaS;iliB~8'hij es"n~?á,~bero es un sentido derivado del sentido usual,-gradual. L o esencial es &e.siibna afibación es probable (tiene prob8bi~idadno nula)~psbede;s&m6sSo meno~i:.&&h~rsLis gi,n.dos: una afirmación probable puede ser más probable que otra también probable. Ésto tiene consecuencias para la noción de validez inductiva. Los argumentos inductivos son válidos si es efectivamente satisfecha la pretensión de que la verdad de las premisas hace probable lanohcbk6h. Pero como, relativamente a la vedad de las premisas, la conclusión puede ser más o menos probabb, ese carácter ,gr$duaz\deda p&$l$lidad se mats1adit~:la~satisf~ción &e 18.pretensión, esto es,. a la ~ l i d e induc$va. z No .wgurnentas de&@iv&&más,Q~Qea6% vAlidos, un argumento deductivo vábdo n o gueda settm4s vl41ida que ,$uo. La v a 1 i ~ ~ d k d u c es ~va cuestión de todo.,o nada.-Eso no gas&&pxJa vali&+&dustiva. Un argummtcrimililcrÉro pu,de ser mejor (másfuerte) que otro, si_ el primer%las premjsas confieren mávqpoyo a la cbnclusión l. . que en el segundo; o un ~gu3nen(o,inducUwi,p"osede $er~.só+-wtpoco%$ido (muy débil); .o , p válido ~ +.(qgy.fvexw), e t r Cuél e& el gado minini6 )deapoyo d c l a s ' premisas a la 2~onclusión @qc@wjderp:al,afgumenta tk~fieien~eme~re m&1idoSJ,:y cámo se dgbe medir dicho arad9 spn dos princi~alqspmblmas +b 16gio*in4t1@tiw (sobre los. haWaremos aqii6 d e argumento&que nos .detexyhe&s en. 9+c&. 12): ~r~vi;i~nalmente, inductivos válidos / inválidos sin más, en el sentido de "el grado de apoyo es claram&nte suficiente I ksuficieqte". Este senGdo e~xinzyeptablementeyago y de momento sóld podemos apelar 8 las intuiciones, y a$ beee,uolencia, del laitpr, - * Hemos dicho que lo cyacterístjcq de la,v?ljdez.bndu~tiva.es-el gñ.&bide apoyo o prohabilidad que,las premisas ,cp$fi,e~,n a?la .conclu$6n., @he quedar qlam que!.,Iaiqrie importa aquí>IIO es la piobabilid,d 49 la coqclusi6n si. mas3:ap imparta ruáa prohab1e.s. la conc-sión "en si misma", independientemente de las premisas (incluso si $iane~senti& . hablar de probabilidad de una a f q m q i 6 ~sin re]a$y\mla a otras, ~obreseshovolvefemos en el cap. 5 $5). Lo que importa es la probabilidad de la conclusión relativamente a (la .í
a
l
?
S
,
ARGUMENTOS DEDUCTIVOS E I S D U ~ V O S
55
verdad de) lus prernisas. En los argumentos deductivos la verdad de la conclusión no determina la validez del argumento, puede haber argumentos deductivos inválidos con conclusión verdadera (y premisas también verdaderas). Análogamente, en los argumentos inductivos la alta probabilidad de la conclusión "en si misma" no determina que el argumento sea válido; puede haber argumentos inductivos inválidos con conclusión muy probable (y premisas verdaderas). Por ejemplo, el siguiente es inductivamente inválido y la conclusión es muy probable (caso de que tenga sentido hablar de probabilidades absolutas): "Todos los días hasta la fecha ha salido el sol. Por tanto, en la próxima tirada de la ruleta saldrá un número diferente de 1." Lo que importa para la validez inductiva, insistimos, es la probabilidad de la conclusión relativamente a la verdad de las premisas (lo que más adelante denominaremos probabilidad condicionada, cf. caps. 5 y 12). Hemos visto que la dificultad más inmediata de la Iógica inductiva es el carácter primafacie gradual de la validez inductiva. Otra no mznos importante tiene que ver con la cuestión de su carácter "formal". En principio, toda lógica es formal. No se estudia tanto la validez de inferencias concretas cuanto patrones o esquemas.de inferencia válida, pues la validez no depende de los aspectos materiales de las inferencias. La Iógica deductiva es el mejor ejemplo de ello. En la Iógica inductiva, sin embargo, no está claro en qué consiste exactamente su carácter formal. La invalidez inductiva absolrcta sí parece ser formal en un sentido inmediato pero poco interesante. Considérese, como ejemplo, el "argumento" (supuestamente inductivo) mencionado en el párrafo anterior, o el siguiente (también, supongamos, pretendidamente inductivo): "los presidentes estadounidenses han sido todos varones hasta el momento, por tanto el próximo par de zapatos que me compre me dará buen resultado". Pero estos casos tan claros, por absurdos, no son interesantes. El problema lo plantean argumentos mínimamente interesantes, por ejemplo A2 y A5. Según qué entendamos por forma lógica, las afirmaciones de A2 y A5 tienen la misma forma Iógica, ambos argumentos tendrían la misma estructura. Pero imaginemos, respecto de la primera premisa de A2, que sólo he comprado un único par de zapatos antes en dicha zapatería; es claro que en tal caso no se pueden equiparar ambos argumentos en validez o fuerza inductiva. Parecería, entonces, que la validez inductiva depende, en algún sentido a precisar, de algunos aspectos "cuasi-materiales" y que por tanto la lógica inductiva no es exactamente formal. La anterior conclusión es sin embargo apresurada. A2 y A5 tienen la misma estructura, la misma forma Iógica, sólo si por forma Iógica de una afirmación entendemos aquí aproximadamente lo mismo que entendemos en la lógica deductiva. La forma Iógica es el esquema que queda cuando abstraemos todas las expresiones salvo las partículas lógicas, esto es, salvo los componentes de los que depende la validez de la inferencia. Pero en ese caso la forma lógica indrictiva de una afirmación no tiene por qué coincidir, o aproximarse, a su forma lógica deductiva, pues los componentes de los que dependen ambos tipos de inferencias no son los mismos. Por tanto, no es que la lógica (validez) inductiva no sea formal, sino que la forma lógica inductiva es extremadamente compleja y toma en consideración algunos aspectos que en la lógica deductiva tienden a considerarse materiales; por ejemplo, los sistemas de lógica inductiva toman en cuenta el número de casos particulares que sustentan una afirmación general (como las primeras premisas de A2 y A5);
algunos de ellos toman en cuenta además la calidad de los casos particulares, otros incluso el nexo causal involucrado. Todo ello hace que esta disciplina sea extremadamente difícil de desarrollar satisfactoriamente, y que, a pesar de haber nacido casi al mismo tiempo que la lógica deductiva, apenas haya avanzado y no se disponga todavía de una versión estándar aceptable para todos.
Las dificultades para el estudio de la validez inductiva se trasladan al de las falacias de este tipo de argumentos. Es difícil establecer en muchos casos si un argumento inductivo, que no sea totalmente descabellado, es (suficientemente) válido o no, Todavía lo es más establecer patrones de inferencias inductivas inválidas típicas. A pesar de ello, algo se puede decir, con todos los matices derivados de la discusión anterior. EI primer error inductivo sobre el que hay que advertir tiene un patrón similar a una de las falacias deductivas. Vimos que una inferencia deductiva inválida tomada a menudo por válida es la falacia de afirmación del consecuente. Quizá se piense que la falacia se deriva de que la pretensión deductiva es excesiva, que la inferencia sí es legítima en su versión inductiva, esto es, si sólo pretendemos que la afirmación del consecuente hace altamente probable el antecedente. Pero no. La afirmación del consecuente no es ni un argument'o deductivo válido ni tampoco un buen argumento inductivo. Un ejemplo típico para mostrar esto, y que reaparecerá más adelante, es el de la paresis, fase avanzada de la sífilis que desarrolla un porcentaje muy pequeño de hombres que han-contraído dicha enfermedad. Supongamos que Juan tiene sífilis y consideremos el siguiente argumento:
Si Juan tiene paresis entonces tiene sífilis Juan tiene sífilis ............................................. Juan tiene paresis Las premisas son verdaderas y sin embargo la conclusión es muy improbable (relativamente a las premisas). La inferencia inductiva es pues inválida, la verdad de las premisas no hace (muy, bastante) probable la conclusión. Contra lo que se suele creer, y en este sentido es una falacia, la ocurrencia del consecuente no hace altamente probable el antecedente. Y lo mismo ocurre con la versión, un poco más sofisticada, con premisas estadístico-probabilistas, incluso si la correlación probabilista es tan alta como queramos. Considérese el siguiente caso: El 99 % de loS ingleses admira a Mana Callas Plácido Domingo admira a Maria Callas Pláci,do Domingo es inglés
I
~
L
L
mw
ARGUMENTOS DEDUCTIVOS E INDtiCnVOS
57
Otra falacia inductiva típica es la de insuficiencia de datos, como ocurriría con A2 en el caso de que la muestra previa haya sido escasa. El caso límite de generalización inadecuada responde al siguiente esquema.
El único caso de P conocido hasta el momento es Q Todos los P son Q
i
1
Sin embargo a veces estamos dispuestos a considerar la inferencia no totalmente desencaminada, "aceptablemente válida", incluso si el número de casos previos es relativamente escaso, sobre todo si la conclusión no es general sino sólo acerca del próximo caso. Por ejemplo, consideremos resultados de actividades que requieren calidad y adiestramiento, y tales que normalmente sus autores mantienen durante cierto tiempo la capacidad de realizarlas satisfactoriamente, actividades como la producción artística, la investigación científica o la práctica deportiva. Que las tres primeras monedas que he extraído de mi bolsillo sean plateadas no es motivo inductivo suficiente para que lo sea la próxima. Pero que las tres primeras piezas musicales de cierto compositor sean obras maestras confiere suficiente fundamento inductivo a que la próxima al menos no sea mala; si en las primeras tres carreras de 100 m un atleta baja de 10 S, está inductivamente fundado esperar, por ejemplo, que en la siguiente no supere los 11 s. De todas formas nuestras intuiciones no son totalmente claras al respecto; quizá podría pensarse que estos casos también son falaces, a no ser que se interpreten como conteniendo premisas ocultas consideradas ausentes en los otros casos que sí nos parecen claramente falaces. Este tipo de argumentos, si no son falaces sin añadir premisas adicionales, sugiere a algunos autores que el peso de la validez / invalidez inductiva no descansa sólo en e1 número de caso previos sino en la calidad de los mismos. Una versión específica de ello es tomar en consideración nexos causales. Entonces, otra forma típica de inducción errónea consiste en errar en los nexos causales. Un modo usual de confusión se da cuando coinciden accidentalmente hechos inesperados. Por ejemplo, es sabido que ciertos acontecimientos no directamente económicos, como una repentina, aunque no grave, enfermedad de un mandatario es muchas veces seguida de una bajada de la bolsa; estos casos, y otros más raros, son indicio de que la "causalidad económica es a veces inescrutable". Si después de un desastre deportivo nacional hay una bajada súbita de la bolsa, tras otro desastre deportivo de igual magnitud alguien puede concluir apresuradamente que también bajará la bolsa. Las falacias por erróneas conexiones causales se pueden producir incluso si las relaciones estadísticas son extremadamente altas. Estas cuestiones nos introducen ya en problemas filosóficos sustantivos relacionados con la causalidad, las leyes, la explicación, etc., cuyo estudio excede la finalidad introductoria de este capítulo. No vamos a detenemos ahora en ellas puesto que serán tratadas en otros lugares (caps. 5, 7 y 12). Para concluir, comentaremos un patrón argumentativo inductivo inválido cuya invalidez es particularmente interesante para cuestiones que hemos de ver más adelante, principalmente la explicación estadística, las leyes probabilistas y el problema de la inducción. En tanto que inferencia inválida, se trata de una
58
FUND.4SIEhTOS DE FILOSOF~ADE LA CIENCIA
falacia inductiva (aunque no está claro que sea un error ar~umentativo"típico" en el sentido de que las personas no adiestradas suelen cometerlo). En los argumentos deductivos el siguiente patrón arsiimentativo de inrrodircción de coizdiciórt arttecedertte es válido: Todos los A son B Todos los A y C son B Por ejemplo: "Todos los filósofos son aburridos. Por tanto, todos los filósofos alemanes son aburridos." Lo mismo sucede con un ~ a t r ó n ~ c oconclusión n particular derivado d.el anterior: Todos los A son B aesAyaesC
Sin embargo, en lógica inductiva el patrón análogo al segundo no es válido: Prácticamente todos los A son B
Por ejemplo: "La gran mayoría de las mujeres tienen hijos. Sor Remedios es mujer y monja. Muy probablemente, por tanto, sor Remedios tiene hijos." Y sin embargo el siguiente patrón s í es inductivamente válido: Prácticamente todos los A son B aesA aes B Quizá se piense que el ejemplo de sor Remedios muestra lo contrario: "La gran mayoría de las mujeres tienen hijos. Sor Remedios es mujer. Muy probablemente, por tanto, sor Remedios tiene hijos." Pero no es así, este argumento inductivo es perfectamente (muy) válido (a no ser que consideremos que la partícula 'sor' en el nombre de la mujer introduce como premisa implícita la premisa adicional de que sor Remedios es monja). Que las premisas sean verdaderas y la conclusión falsa sólo muestra que en los argumentos inductivos válidos, a diferencia de los deductivos, la verdad de las premisas no garantiza la verdad de la conclusión. Pero esto ya lo sabíamos. Precisamente así habíamos introducido la diferencia entre validez deductiva e inductiva. Pues bien, si uno es inductivamente válido y el otro no, es justamente porque de "todos los A son B se deduce "todos los A y C son B , mientras que de "la práctica totalidad (la mayoría, el 99 %, etc.) de los A son B" ni se deduce ni se irzduce "la práctica totalidad (la
mayoría, el 99 %, etc.) de los A y C son B". Este hecho tiene como consecuencia otra diferencia entre la validez deductiva y la inductiva, diferencia que en el fondo no es más que otra versión de la anterior: mientras que en la lógica deductiva podemos "conyuntar" las conclusiones de diversos argumentos si combinamos las prernisas, en la lógica inductiva no. Si de "al y ... y a"se concluye deductivamente Di, y de ' ' ~ yi ... y cr," se concluye deductivarnente b, entonces necesariamente de "al y ... y u, y afiiy ... y a"se concluye deductivamente "P1 y P;'. Sin embargo, aunque de "ul y ... y a,''se concluya inductivamente Di, y de "a,, y ... ya;' se concluya inductivamente p2,no necesariamente de "aly ... y a, y CL+I y ... y a"se concluye inductivamente "P, y P2>'. Esta peculiaridad es lo que Hernpel denomina ambigüedad inductiva, sobre la cual nos extenderemos en otros lugares (cf. cap. 7' sobre la explicación y cap. 12 sobre la inducción).
En este capítulo vamos a estudiar los procedimientos de contrastación d-, hipótesis científicas. Las hipótesis científicas, y su contrastación, plantean numerosas cuestiones filosóficamente sustantivas, como las relativas a la causalidad, la inducción, las leyes científicas, su organización en teorías, etc. Esta primera aproximación pretende ser estrictamente rnetodológica, vamos a limitarnos aquí a analizar la metodología de la contrastación de hipótesis sin entrar en problemas epistemológicos y ontológicos sustantivos. En particular, este estudio puramente metodoló,oico va a obviar las siguientes cuestiones:
a ) La elaboración o invención de hipótesis. Esto se tratará parcialmente en el capítulo 12 dedicado a la inducción. b) La naturaleza de las hipótesis. Vamos a suponer que lo que se somete a contrastación son "hipótesis" (empíricas) en el sentido más general del término, esto es, cualquier afirmación, simple o compleja, que tenga consecuencias empíricas constatables. No vamos a distinguir de momento entre grandes agregados de hipótesis, como la teoría newtoniana, o leyes aisladas, como la de dilatación de los metales, o hipótesis en un sentido más básico que no reciben el calificativo de ley, como la de Semmelweis sobre el origen de la fiebre puerperal. De las leyes nos ocuparemos en el capítulo 5 y de las teorías en los capítulos 8,9, 10 y 13. c) La naturaleza de los datos. Supondremos que los datos en relación a los cuales se contrasta la hipótesis son "neutrales" o "aproblemáticos". Algunos comentarios que haremos sobre las hipótesis auxiliares mostrarán ya que este supuesto es discutible, pero pospondremos la discusión explícita del mismo a los capítulos 8 y 12. 4 .El carácter aproximativo que, en la actividad científica real, tienen las afirmaciones o hipótesis así como las observaciones y mediciones mediante las que aquéllas se contrastan. e ) Aspectos específicos de la contrastación de las hipótesis cuya predicción es esencialmente estadística o probabilista, como ocurre por ejemplo en las hipótesis causales sobre las correlaciones entre el consumo de tabaco y algunas formas de cáncer y
afecciones de corazón. Algunos aspectos de esta cuestión se tratarán en el capítulo 5 dedicado a las leyes y en el 7 dedicado a la explicación. j) Las consecuencias de la contrastación para la dinámica científica, e.e., las acciones que realizan o actitudes que adoptan los científicos tras la contrastación, así como la supuesta fundamentación. o no, de dichas acciones y actitudes en los resultados de la contrastación. Estas cuestiones se tratarán en e1 capítulo 12 dedicado al problema de la inducción y la evaluación de teorías y en el capítulo 13 dedicado al cambio teórico. 4 ) Relacionado con el punto anterior, la evaluación epistemológica de la contrastación. No vamos a tratar aquí de si cabe o no atribuir ciertas propiedades epistémicas a las hipótesis en función del resultado de la contrastación, ni de si, caso de que quepa tal atribución, cuáles son esas propiedades y qué problemas filosóficos suscitan. De ello se tratará en el capítulo 12. Las dos últimas restricciones son especialmente importantes ¿Qué queda, se dirá, después de prescindir de todas estas cuestiones, y especialmente de las dos últimas? Pues quedan los aspectos puramente estructurales y metodológicos. Los científicos siguen aproximadamente una misma práctica a la hora de contrastar sus afirmaciones con la experiencia. Realizan sus afirmaciones de modo tal que de ellas se siguen ciertas predicciones sobre hechos empíricos particulares constatables, y reconocen que la presencia o ausencia z a evidencia a favor o en contra de sus afirmaciodel hecho predicho constituye p r i ~ ~ facie nes. Quizá tengan después buenos motivos para relativizar los efectos de esa evidencia en sus acciones y actitudes. quizá los filósofos tengan o no razón acerca de si en base a esa evidencia es o no posible atribuir a las afirmaciones determinadas propiedades epistémicas. Pero antes de estas importantes cuestiones hay que clarificar los elemzntos, estructura y procedimientos de la práctica en cuestión, de la "puesta a prueba" con la experiencia. A esto nos referimos con la dimensión puramente metodológica de la contrastación. Aunque los aspectos filosóficamente más interesantes queden provisionalmente aplazados, este estudio previo contiene ya suficientes elementos de interés para la comprensión de una parte esencial de la práctica científica. La caracterización de los procesos de contrastación se puede presentar de diversos modos. Se puede presentar la estructura de tales procesos en forma de un argumento o de una serie de ellos, o presentarlo más bien como un programa o proceso algorítmico de decisión. Originalmente se tendía a presentarlo del primer modo (cf. p.ej. Popper, 19351958, caps. IV y X y 1963, cap. 1 y Apéndice; Hempel, 1966a, cap. 3; Salmon, 1966, y el clásico Giere, 1979, cap. 6), pero la generalización en los últimos años de los modelos cognitivos y computacionales ha motivado enfoques más algorítmicos (el caso paradigmático es Giere, 1991, revisión sustancial en términos cognitivistas del original, 1979). No hay grandes o sustantivas diferencias entre uno y otro modo de presentar o reconstruir el proceso de contrastación, las preferencias responden en gran medida a criterios estéticos o de orientación metacientífica general (logicistas iSerszrscognitivistas). Lo importante, independientemente de la presentación que se prefiera, es que en el proceso de contrastación intervienen una serie de elementos, que estos elementos están en ciertas relaciones y que en el proceso se han de satisfacer una serie de condiciones. Veremos primero cuáles son
esos elementos y condiciones, y con ellos reconstruiremos después el proceso de contras(ación. Para esto último, vamos a seguir aquí en general el modelo argumentativo clásico, pero incluiremos también una versión algorítmica simplificada a modo de resumen final. La presentación de la metodología de la contrastación va precedida de una serie relativamente amplia y variada de episodios históricos, que tienen la función de servir de 'ejemplos para la presentación de las diversas nociones y de proporcionar material para que el lector contraste su comprensión de los conceptos básicos aplicándofos a esos casos a modo de ejercicios.
1. Algunos episodios históricos
Como es sabido, para Aristóteles el movimiento sólo se produce ante la presencia de una fuerza actuante. Generalizando sobre efectos dinámicos cotidianos, principalmente sobre la tracción (dos bueyes mueven más rápido un carro que uno; un buey mueve más rápido un carro que dos carros), Aristóteles formula una especie de ley mecánica general: la velocidad es directamente proporcional a la fuerza actuante e inversamente proporcional a la cantidad de materia y a la resistencia o rozamiento del medio. Para dar cuenta de hechos conocidos, esta teoría era completada con una hipótesis "de umbral": dados un cuerpo y un medio, por debajo de cierto umbral la fuerza no produce movimiento (un hombre sólo tirando de un barco no lo mueve). En el siglo siguiente, Arquímedes, el creador de la polea, la palanca y la estática de sólidos, refutó dicha hipótesis al mover (según la tradición) con una sola mano, mediante un sistzma de poleas, un barco totalmente cargado en el puerto de Siracusa.
El primer modelo de sistema astronómico geocéntrico es el de las esferas hornocéntricas. Este sistema es propuesto inicialmente por Eudoxo y Calipo. discípulos de Platón, y desarrollado posteriormente por Aristóteles. El sistema, ideado para dar cuenta de los movimientos aparentes de los astros, consiste en una serie de esferas concéntricas encajadas unas en otras, con movimientos rotacionales con diferentes ejes, velocidades y direcciones que se van acumulando; los diferentes planetas están "clavados" en algunas de esas esferas. En este modelo la distancia de cada uno de los planetas a la Tierra es por tanto siempre la misma. Puesto que se aceptaba que el brillo de los astros depende sólo dc su distancia a la Tierra, no debería apreciarse ningún cambio de brillo en la observación nocturna. Sin embargo, al menos Venus y Marte manifestaban un claro cambio de brillo a lo largo del año. Este hecho fue considerado un problema para el modelo homocéntrico por Apolonio e Hiparco, quienes propusieron y desarrollaron como alternativa el modelo de epiciclos, deferentes y excéntricas, en el que la distancia de los planetas a la Tierra es
63
FCSDAI\iEI\TOS DE FILOSOFL~DE LA CIENCIA
variable. Otros astrónomos consideraron sin embargo que la evidencia se podia acomodar haciendo depender el brillo no sólo de la distancia sino de la densidad de las esferas y postulando diferentes densidades.
El sistema heliocéntrico sustituye el movimiento de las esferas celestes en tomo a la Tierra estática e inm6vil por el movimiento de rotación diario de la Tierra sobre sí nlisma y el de traslación anual alrededor del Sol?en tomo al cual giran también los otros planetas. El movimiento de rotación da cuenta de los movimientos aparentes diarios y el de traslación de los movimientos anuales a través de la eclíptica. Ya en la antigüedad Aristarco (siglo III a.c.) había propuesto el modelo heliocéntrico, pero fue desestimado por presentar diversas dificultades empíricas. Una de las principales objeciones iba dirigida contra la rotación de la Tierra, cuya posibilidad planteó por primera vez Heráclides de Ponto (siglo IV a.c.). Si la Tierra girase constantemente sobre su eje, se objetaba desde la física aristotélica dominante, al lanzar un objeto hacia arriba debería caer al suelo en un punto diferente y retrasado respecto del original, pues durante el intervalo temporal el lanzador, sujeto a la superficie de la Tierra, se habría movido con ella. Pero nada así se observaba. Como mostraron los físicos del í~nperusde final de la Edad Media, esta objeción descansa sobre el supuesto cuestionable de que los movimientos no se acumulan. Si, como se manifiesta en los barcos en movimiento al dejar caer un objeto desde el mástil, el movimiento de traslación horizontal se conserva y "combina" con el moviniiento vertical de caída, la objeción pierde su peso.
1.3. PARALAJE ESTELAR
Otra objeción tradicional, y para muchos definitiva, al sistema heliocéntrico, en este caso a su hipótesis del movimiento anual de la Tierra en tomo al Sol, tenía que ver con la aparente ausencia de paralaje estelar. Al girar la Tierra en tomo al Sol, desde posiciones opuestas de la órbita, e.e. cada seis meses, se deberían observar modificaciones en la forma aparente de muchas constelaciones por efecto de la perspectiva. Pero nada así se observaba. Este hecho ya era conocido por el primer defensor conocido del heliocentrismo, Aristarco (siglo 111 a.c.), quien parece ser que justificó esta evidencia contraria a su teoría postulando que el radio de la órbita terrestre era despreciable comparado con la distancia a la esfera de las estrellas fijas (la esfera en la que se suponía que estaban "incrustadas e inmóviles" las estrellas). Copémico utiliza la misma defensa en el siglo XVI, aumentando para ello casi doscientas veces el diámetro del universo estimado hasta entonces. Esto le parecía una estrategia inaceptable a Tycho Brahe, quien, disponiendo pocos años después de observaciones incomparablemente más precisas, seguía sin observar paralaje. De ahí no infería Tycho la validez del sistema geocéntrico tradicional. Tycho propuso un sistema geocéntrico mixto, con el Sol y la Luna girando en tomo a la Tierra y el resto
de planetas girando en tomo al Sol, que implicaba también, como el tradicional, la ausencia de paralaje. Ni siquiera Galileo con su telescopio pudo observar este fenómeno, que no sería detectado sino hasta 1838.
Es tradicional considerar que con las observaciones de los cielos mediante telescopio realizadas por Galileo el heliocentrismo recibe un impulso definitivo. Sin embargo, muchas de esas observaciones, como la de las lunas de Júpiter, no eran directamente contrarias al modelo geocéntrico tradicional. Por eso los partidarios del heliocentrismo recibieron como una confirmación definitiva la observación por Galileo en 1610 de las fases de Venus. Según el modelo geocéntrico tradicional, Venus debería verse desde la Tierra, aproximadamente, con la misma forma luminosa siempre. Según el modelo heliocéntrico, Venus debe presentar cambios considerables en la superficie iluminada, deben observarse fases crecientes y menguantes muy marcadas. En 1610 Galileo observó con su telescopio que la forma luminosa de Venus cambiaba desde un disco prácticamente negro hasta otro iluminado casi en su totalidad, lo que se consideró una victoria definitiva del heliocentrismo. El fenómeno, sin embargo, no le hubiera parecido tan definitivamente favorable al heliocentrismo a Tycho Brahe, muerto en 1601, pues su propio sistema mixto también predecía fases en Venus. Así pues, el fenómeno sólo constituye evidencia clara contraria del modelo geocéntrico tradicional no tycheano, no proporciona una evidencia clara favorable al sistema heliocéntrico.
En la época de Galileo, y ya desde antes, se sabía que en un pozo la bomba no puede elevar la columna de agua mucho más de 10 m por encima de la superficie. Algunos aristotélicos explicaban el fenómeno apelando al horror vncrri. Galileo ensayó contra ellos cierta explicación, pero no tuvo éxito. Torricelli, discípulo de Galileo, propuso siguiendo a Baliani la siguiente explicación: el mar de aire que rodea la tierra ejerce, por su peso, una presión sobre la superficie del pozo, que es la que empuja el agua hacia arriba cuando se libera el pistón; el límite de altura se debe a que para esa altura la presión del agua iguala la del aire. Para contrastar su conjetura, predijo que en un tubo lleno de mercurio, al invertirse y sumergirse en un recipientz con esa sustancia, la columna de mercurio descendería hasta alcanzar 1/14 de la altura para el agua, pues la densidad del mercurio es 14 veces la del agua. La prueba resultó exactamente como había predicho. Años más tarde Pascal (que había repetido el experimento de Torricelli con vino obteniendo la altura predicha de aproximadamente 18 m) realizó una confirmación adicional. Según la hipótesis de Torricelli, la columna de mercurio debe ser mayor en la base de una montaña que en su cima, pues la columna de aire envolvente decrece con la altura. Predijo que la diferencia debería ser aproximadamente de 1 cm por cada 200 m de
desnivel. En 1648 su cuñado Périer (Pascal era un enfermo crónico) realizó la prueba en el Puy-de-Dome y observó los resultados esperados. Pascal consideró el resultado una refutación decisiva de la teoría aristotélica y una confirmación de la de Torricelli. Sin embargo, algunos aristotélicos se defendieron apelando a una supuesta disminución del horror ilacrri con la altura.
A finales del siglo xv~rse aplica la teoría newtoniana al estudio de los cometas, cuerpos celestes tradicionalmente considerados misteriosos por sus apariciones aparentemente irregulares. La teoría es compatible tanto con que los cometas describan elipses muy excéntricas (con los focos muy separados) como con que describan parábolas; en el primer caso el astro pasa varias veces por una misma región, en el segundo no. En 1682 se produjo la visita de uno de esos cometas, y Halley, entre otros, observó y anotó cuidadosamente los datos del mismo. Halley defendía la hipótesis de que al menos ese cometa era de órbita elíptica y, por tanto, recurrente. Repasó los datos astronómicos disponibles de los 150 años anteriores, con más de veinte visitas de cometas, y vio que al menos en dos casos (1530 y 1606) podría tratarse del mismo cometa. Sobre la base de esos datos predijo que el cometa aparecería nuevamente a finales de diciembre de 1758. El día de Navidad de 1758 apareció efectivamente de nuevo un cometa en el cielo visible, que se identificó con los anteriores y que desde entonces lleva su nombre. El episodio se consideró una validación no sólo de la hipótesis sobre la órbita elíptica del cometa sino también, en general, de toda la teoría newtoniana.
La teoría del flogisto, desarrollada durante el siglo XVIII por Stahl, explica la combustión atribuyendo a los cuerpos combustibles una sustancia, el flogisto, que éstos liberan al arder. La teoría daba cuenta de diferentes fenómenos; por ejemplo, explicaba que una vela encendida encerrada en un recipiente acabara apagándose puesto que el aire se satura de flogisto y ya no permite más liberación de esa sustancia proveniente de la vela. A finales de siglo, Lavoisier, que se oponía a la teon'a del flogisto, diseña un experimento para contrastarla. Una consecuencia inmediata de la teoría es que los cuerpos combustibles pierden materia al quemarse, por lo que los restos más las cenizas deben pesar menos que el cuerpo íntegro antes de la combustión. En el experimento de Lavoisier se coloca una determinada cantidad de sustancia combustible (p.e. mercurio) sobre un sólido flotante en agua y se encierra bajo una campana de cristal. Mediante una lupa se enciende el mercurio. De acuerdo con la teoría se tendrían que observar dos cosas: a) el cuerpo 'flotante está menos sumergido tras la combustión, pues la cantidad restante de sustancia junto con las cenizas debe pesar menos que la cantidad inicial; b) el volumen de aire dentro de la campana debe aumentar como efecto de la asimilación de flogisto, y con
ello el nivel del líquido encerrado debe ser más bajo que al comienzo. La realización del experimento produjo justamente los resultados opuestos.
Hacia 1830, en la Primera División de Maternidad del Hospital General de Viena, había una mortandad alarmante producto de una enfermedad que por su sintomatología se denominabafiebre puerperal o posparto (8,2 % de muertes en 1844,6,8 en 1845 y 1 1.4 en 1846). En la Segunda División de Maternidad, el porcentaje era muy inferior y aproximadamente estable (2,3,2 y 2,7 respectivamente). Después de buscar durante años la causa y probar soluciones infructuosamente, en 1847 Semmelweis, uno de los médicos de la División Primera, realizó una nueva conjetura al observar que un colesa había muerto con síntomas parecidos tras cortarse con un bisturí usado para realizat una autopsia de una embarazada: las muertes podían deberse a la irrupción de "materia cadavérica" (infecciosa) en la sangre. Las diferencias se deberían a que a menudo él, sus colegas y sus alumnos intervenían a las mujeres de la División Primera inmediatamente después de realizar autopsias, mientras que en la División Segunda eran atendidas mayoritariamente por comadronas. Ellos eran los transmisores de la materia infecciosa. Si ésa era la causa, deberían desaparecer las diferencias entre ambas divisiones, e incluso bajar algo el nivel de la Segunda, si se desinfectaban antes de intervenir. Ordenó que todo el personal se lavara con sal clorada, un fuerte desinfectante, antes de atender a las pacientes. En 1848 la mortandad fue de 1,27 70en la División Primera y de 1,33 7é en la Segunda.
Durante los siglos XVIII y xuc la dinámica newtoniana, con su teoría de la gravitación, se había aplicado desde sus inicios con notable ésito a la astronomía, aunque presentaba tambiér, algunas anomalías importantes. Uno de los principales problemas a mediados del siglo XIX era el de la órbita de Urano, que difería de los valores previstos por la teoría bastante más de lo que eventuales errores de medida podían explicar. La mecánica celeste estaba bastante bien contrastada, de modo que tenía que haber una solución acorde con la teoría. Algunos astrónomos (Adams y Leverrier) conjeturaron que las anomalías en la órbita de Urano podían deberse a la presencia en sus alrededores de un astro de gran tamaño hasta entonces desconocido. Aplicando las leyes de la mecánica celeste a los datos de la órbita de Urano, calcularon cuál debía ser la órbita aproximada del supuesto astro. En 1846 Leverrier descubrió el nuevo planeta, Neptuno, en una posición y momento acordes con la órbita prevista. Bajo la influencia del notable éxito obtenido en el caso de la órbita anómala de Urano y el descubrimiento de Neptuno, los astrónomos aplicaron el mismo expediente a otra anomalía recalcitrante, la órbita del planeta más interno, Mercurio. Las anomalías serían explicables si existiera otro planeta entre Mercurio y el Sol. Leverrier calculó de
68
FLIND.4hIEh'TOS DE RLOSOFí4 DE LA CIENCIA
nuevo la supuesta órbita del nuevo planeta, al que llamó 'Vulcano', pero ni él, ni nadie después de él, lo ha descubierto.
Desde los orígenes de la revolución científica? la naturaleza de la luz ha sido motivo de fuerte controversia. A finales del siglo XVII se establecen dos teorías de la luz rivales. Una, la teoría corpuscular defendida por Newton, sostiene que los haces de luz están formados por "corpúsculos", pequeñas partículas luminosas. Otra, la teoría ondulatoria iniciada por Huygens, considera a la luz un fenómeno ondulatorio análogo al sonido, esto es, perturbaciones en un medio que se transmiten como ondas. Algunos fenómenos eran explicados igual de. bien por ambas (reflexión, refracción), de los restantes, unos los explicaba de forma más natural la teoría corpuscular (polarización) y otros la ondulatoria (superposición, difracción). Durante el siglo X\~III, y bajo la influencia de la estela de Newton, se impuso en general la teoría corpuscular, pero a principios del siglo XIX la teoría ondulatoria recibió nuevo impulso de la mano de Young y Fresnel. Las espadas se mantuvieron.en alto hasta mediados de siglo. Según la teoría corpuscular, la velocidad de la luz debe ser mayor en vidrio o agua que en aire; de acuerdo con la teoría ondulatoria, ocurre justo lo contrario. Cuando en 1850 Foucault realizó la prueba comparando las velocidades e n el aire y en el agua, resultó ser mayor en el aire, y aproximadamente en la cantidad predicha por la teoría ondulatoria. A partir de entonces se impuso casi unánimencnte el modelo ondulatorio de la luz, reforzado por su congmencia con los trabajos postrriores de Maxwell sobre electromagnetismo. Esta dominancia se quiebra a principios del siglo xx, cuando se descubren nuevos fenómenos aparentemente explicables sólo en :Crxinos corpusculares.
Y MORLEY 1.12. EL ÉTER Y LOS EXPERIMEhTOS DE MICHELSON
A finales del siglo x r x , Ia teoría ondulatoria concebía la luz como una vibración transversal en un medio universal, el éter, que tenía dos características fundamentales: debía ser penetrable por la materia y estacionario. De existir, el éter constituye entonces un sistema de referencia absoluto respecto del cual medir el movimiento "real" de los cuerpos. En 188 1, siguiendo una sugerencia teórica de Maxwell (quien no obstante la consideraba irrealizable prácticamente), Michelson diseña y realiza un experimento destinado a medir la velocidad absoluta de la Tierra. El aparato consta (aproximadamente) de un emisor de Iuz hacia dos espejos a igual distancia y que forman con él un ángulo recto. Si el éter es el medio permeable estacionario en el que se propaga la luz con velocidad finita, el tiempo. de ida y regreso de un rayo de luz lanzado en dirección del movimiento de la Tierra debe ser diferente que el del otro perpendicular. La diferencia detiempos debe manifestarse (de un modo que no podemos explicar ahora) en un desplazamiento de las bandas de interferencia al rotar el sistema de espejos, montado sobre un flotador de
mercurio para evitar distorsiones; a partir de este desplazamiento se calcula la velocidad de la fuente de emisión. Éste es el informe de Michelson: "No hay desplazamiento de las bandas de interferencia. La consecuencia de la hipótesis de un éter estacionario se muestra incorrecta, y la conclusión que necesariamente sigue es que la hipótesis es errónea" (Michelson, 1881, p. 128). En colaboración con Morley, Michelson repitió el experimento tres veces en los años siguientes con igual resultado. Algunos, sin embargo, lo interpretaron de otro modo. Incluso si hay éter, puede obtenerse ese resultado si los aparatos se "contraen" en la dirección del movimiento. Ésta es la tesis de la contracción de Lorentz y Fitzgerald.
Hasta los años cincuenta, el ADN se concebía como una cadena de nucleótidos, compuestos cada uno de tres moléculas (azúcar, base y fosfato)..El primer modelo de 1952 que Watson y Crick conjeturaron para la estructura del ADN era de triple hélice. De la estructura y composición, junto con ciertas propiedades y leyes químicas conocidas, se podía inferir la cantidad de agua contenida en determinadas muestras del ácido. Las medidas experimentales daban sin embargo como resultado cantidades diez veces mayores, motivo por el que abandonaron su primer modelo. Cuando propusieron en 1953 el modelo de doble hélice, consideraron una ventaja del mismo que las cantidades de agua predichas con el nuevo modelo coincidieran con las medidas experimentales, pero no la tomaron como definitiva pues sabían que se podían obtener las mismas predicciones introduciendo diversas complicaciones en el modelo de triple hélice simple anterior. Lo que sí consideraron definitivo fue el dato proveniente de las fotografías con rayos X. El modelo de doble hélice predecía unas imágenes en rayos X específicas muy improbables si el ADN fuese otro tipo de cadena. Esa imagen era justamente la que R. Franklin había obtenido en sus fotografías un año antes.
Hay acuerdo generalizado acerca de que los dinosaurios se extinguieron hace 65 millones de años por los efectos de un calentamiento global extremadamente fuerte de la corteza terrestre. Pero hay un considerable desacuerdo sobre el origen de dicho calentamiento. Dos son las hipótesis rivales. Según una de ellas, el calentamiento fue producto del impacto contra la Tierra de un enorme meteorito, o cometa, que liberó una cantidad de energía 6.000 millones de veces la bomba atómica de Hiroshima. Según la otra, fue el resultado de un período de numerosas, intensas y extraordinariamente fuertes erupciones volcánicas. Ambas teorías predicen una presencia generalizada, en los estratos sedimentarios de aquella era en diversos lugares de la corteza terrestre, de partículas de cuarzo fracturadas. En el primer caso, por efecto de la colisión y de la onda expansiva; en el segundo, por el efecto combinado de las erupciones y las altas presiones. Sin embargo, el
tipo de fractura predicho no es exactamente igual, la fractura por impacto tiene unos patrones específicos muy improbables si se ha producido de otro modo. Los datos geológicos más recientes, correspondientes a muy diferentes lugares de la corteza, coinciden en que el tipo de fractura de las partículas de cuarzo presente en los sedimentos es el predicho por la hipótesis del impacto.
-
Hasta los años sesenta, había dos hipótesis rivales en pugna sobre el origen de los continentes. La primera, surgida a finales del siglo pasado y ligeramente dominante entonces, es la teoría contraccionista: la corteza estaba originalmente en estado líquido debido a las altas temperaturas y por efecto del enfriamiento se solidifica, se contrae y se "resquebraja" dando lugar a las formas actuales de los continentes (que por tanto nunca se han "movido"). La explicación alternativa, desarrollada por Wegener hacia 1915, es la teoría de la deriva continental: la primera masa sólida era al principio única (Pangea) y tras la fractura los trozos resultantes se desplazan horizontalmente; los continentes actuales no han tenido siempre la misma forma, y de hecho siguen en movimiento. Los principales indicios favorables a la deriva eran la complementariedad de muchas costas continentales, la presencia de registro fósil común en África y Sudamérica, y la presencia de jóvenes cadenas montañosas a lo largo de la costa oeste americana. Sin embargo, la teoría contraccionista tenía sus propias explicaciones de estos hechos. La principal dificultad con la deriva radicaba en la aparente ausencia de fuerzas horizontales. Esta dificultad queda subsanada por la teoría de las convecciones propuesta por Hess en los sesenta: en el interior del planeta hay corrientes geológicas de convección, como en un líquido hirviendo. Esta nueva versión de la teoría de la deriva predice la presencia de ciertos patrones magnéticos específicos en los sedimentos de los fondos marinos, extremadamente improbables y sorprendentes para los contraccionistas. Los datos sobre el magnetismo recogidos a mediados de los sesenta coinciden plenamente con los anunciados por la teoría de la deriva, que después de ello fue inmediata y generalmente aceptada por la comunidad científica.
Una de las afirmaciones más sorprendentes, para la visión clásica, de la teoría gravitatoria relativista es que la luz no viaja en línea recta en el sentido usual. En las proximidades de una masa, los rayos de luz se curvan por los efectos gravitatorios. Una consecuencia de ello es la siguiente: si entre la Tierra y un emisor puntual de luz se encuentra un cuerpo de gran masa alineado con los anteriores, desde la Tierra el punto emisor se observa en forma de anillo luminoso (e.e. la sección del cono convergente formado por los rayos curvados al pasar cerca de la gran masa). Ésta es una de las predicciones más extrañas de la teoría, y completamente improbable sin ella. Reciente-
mente se ha observado en un telescopio de radio un fenómeno con esa apariencia. Tras sucesivas pruebas, los investigadores han descartado que la imagen sea resultado de interferencia~o producto de una fuente directa de esas características (p.e. los restos de una supernova). Parece una de las confirmaciones más impresionantes de las teorías de Einstein.
2. Elementos de la contrastación Esta larga serie de episodios históricos responden a un patrón de contrastación común. Empezaremos viendo aquí cuáles son los elementos involucrados en este tipo de episodios. El lector debe tratar de identificar estos elementos en los ejemplos históricos que dejemos sin comentar.
2.1. H I P ~ T E S(H) I S Y SUPUESTOS AUXILLARES (SA) La hipótesis es la afirmación que se somete a prueba, postulada para dar cuenta de determinado fenómeno y acerca de la cual buscamos evidencia a favor o en contra. Ya hemos indicado que no vamos a detenemos ahora en la estructura fina de las hipótesis. Como muestran los ejemplos, las hipótesis pueden ser muy variadas: teorías enteras complejas, como en los casos de las fases de Venus, el flogisto, las teorías de la luz o la deriva continental; o partes centrales de teorías, como en el caso del anillo de Einstein o el del éter; o leyes más o menos específicas, como la de la presión atmosférica; o incluso hipótesis concretas relativamente aisladas, como en el episodio de la fiebre puerperal. Es importante señalar que no siempre está claro cuál es la hipótesis que explícitamente se somete a prueba. Por ejemplo. en los casos del cometa Halley y de Neptuno, parece que las hipótesis en juego son, respectivamente, que el cometa tiene órbita elíptica y no parabólica, y que existe un nuevo planeta con determinada órbita. Pero el éxito se extendió a la mecánica celeste en su totalidad, que de algún modo también se consideraba en juego. Esto nos conduce al siguiente elemento de la contrastación. La hipótesis central sometida a prueba no basta en general para derivar una predicción contrastadora. En el caso del paralaje, la observación del mismo no se sigue sólo de la teoría heliocéntrica, hace falta suponer además que la distancia de la Tierra a la esfera de las estrellas fijas no es despreciable, a efectos observacionales, comparada con el diámetro de giro. En su estudio del cometa, Halley supone que las perturbaciones debidas a Júpiter son despreciables. En el caso de la fiebre puerperal, el supuesto adicional es que la sal clorada elimina los agentes infecciosos. En el experimento de Michelson, se suponen ciertos hechos aceptados sobre la relación entre velocidad de transmisión y bandas de interferencia, además de (muy implícitamente) que los materiales no se contraen con el movimiento. Junto con supuestos específicos como éstos, las contrastaciones incluyen frecuentemente otros supuestos auxiliares muy generales del tipo "ningún factor extraño desconocido afecta el proceso". Por ejemplo, en el caso de la fiebre puerperal se supone
que ningún agente extraño anula el poder desinfectante de la sal clorada, o en el del cometa Halley se supone que la trayectoria no es afectada significativamente por otros cuerpos celestes desconocidos. En general, la contrastación suele presuponer cláusulas como "si nada extraño se produce". La suposición de Michelson (si realmente era tan implícita) de que no se produce contracción podría colocarse en este cajón de sastre. Pero hay que tener cuidado con este tipo de cláusulas pues, como veremos, por su vaguedad y generalidad son susceptibles de usos perversos. No siempre es fácil distinguir entre hipótesis y supuestos auxiliares. Éste es el motivo de la relativa indefinición de la hipótesis en algunos casos. En el caso de Halley, una parte clara de la hipótesis es que el cometa es de órbita elíptica, y un supuesto claramente auxiliar es que las perturbaciones debidas a los otros astros conocidos son despreciables. Pero no está claro si el conjunto de las leyes de la mecánica celeste con cuya ayuda se realiza la predicción forma parte de la hipótesis o más bien de los supuestos auxiliares. A juzgar por la lección extraída del nuevo paso del cometa, parece que también estaba en juego la teoría general. Pero no hay límites claros. El caso de Neptuno se parece al del cometa Halley, por lo que tomaríamos la mecánica newtoniana como parte de la hipótesis, pero el episodio de Vulcano muestra que en esos casos no se ponía a prueba la teoría con cuya ayuda se hace la predicción, pues la no observación de Vulcano se consideró evidencia contraria sólo contra su existencia, no contra la teoría newtoniana. En general, la diferencia entre hipótesis y supuestos adicionales específicos (leyes o teorías complementarias) es vaga, contextual y fuertemente pragmática. Qué sea la hipótesis se deriva de las intenciones presentes en el contexto de la contrastación: la hipótesis es aquella afirmación (o conjunto de afirmaciones) para evaluar la cual se ha tenido la intención de realizar la contrastación. Por tanto, lo que son hipótesis y supuestos auxiliares en un contexto pueden invertir su papel en otro. Pero la vaguedad y la dependencia del contexto no elimina la distinción. El lector debe ir acostumbrándose a que va a ser así en la mayoría de distinciones que seguramente considera nítidas, y también a que ello no disminuye un ápice su interés filosófico, simplemente hace las cosas más difíciles.
La predicción constituye la "piedra de toque" de la contrastación. Debe ser una afirmación empírica constatable experimentalmente de modo más o menos "inmediato". Aunque sea una trivialidad, hay que insistir en la necesidad de que se realice una predicción si lo que queremos es contrastar, y no meramente afirmar, una hipótesis; por ejemplo, algunas personas sostienen la hipótesis de las visitas extraterrestres para dar cuenta de ciertos restos arqueológicos, pero no hacen la menor predicción constatable. Por otro lado, la condición de inmediatez de la constatación experimental es, aunque vaga, importante para diferenciar la predicción de la hipótesis, pues en cierto sentido la hipótesis es ya ella misma constatable empíricamente, a saber, ?nediaramente,a través de la predicción. Se puede caracterizar la predicción de dos modos. Uno la presenta en forma de i~?zplicació~z contrastadora (1) (cf. p.ej. Hempel, op. cit.). En esta caracterización, la pre-
dicción es una afirmación condicional del tipo "en tales y cuales circunstancias empíricas específicas se observará tal fenómeno". Por ejemplo: "al lavarse el personal las manos con sal clorada, se producirá antes de seis meses un descenso significativo de la mortandad"; "según losdatos registrados en 1530, 1606 y 1682, el cometa aparecerá en determinada región del cielo a finales de diciembre de 17.58"; "haciendo rotar el sistema d e espejos d e cierto modo, se observarán desplazamientos en las bandas de interferencia"; etc. El otro modo de presentar las cosas consiste en separar el antecedente y el consecuente de la anterior implicación contrastadora distinguiendo a ) la predicción propiamente dicha (P), esto es, el hecho simple que se espera observar, de b) las condiciones iniciales (CI), los hechos-condiciones particulares antecedentes que deben darse para que se dé lo predicho. Ambas caracterizaciones son equivalentes, I equivale a CI-+P. Por ejemplo, en el caso de la fiebre puerperal, las condiciones iniciales (más destacadas) son que el personal se lava las manos ,con sal clorada, y la predicción propiamente dicha es que se producirá un descenso significativo de la mortandad; en el caso del cometa Halley CI son los datos observados en los años 1530, 1606 y 1652, y P es que aparecerá un cometa a finales de diciembre de 1758. Como hemos dicho, estos dos modos de presentar las cosas son equivalentes, su diferencia es sólo cuestión de matiz o énfasis. Al decir que la predicción es una implicación contrastadora estamos enfatizando el hecho de que lo que la hipótesis predice por sí sola (junto con S,4) es un estado de cosas condicional. Aquí, sin embargo, vamos a seguir por lo general la segunda opción puesto que esquematiza de forma más transparente la compiéjidad de la implicación contrastadora; cuanto más atómicamente puedan caracterizarse los elementos de la contrastación, tanto mejor. La predicción se describe casi siempre como un hecho particular, como sucede por ejemplo en los casos del cometa Halley, de Neptuno o de la fiebre puerperal. A veces, sin embargo, en algunos episodios la predicción se describe en términos generales. Por ejemplo, "las imágenes fotográficas de ADN tienen tal patrón" o "los restos más las cenizas de un combustible inflamado pesan menos que la pieza original". Es inmediato ver que estas primeras versiones generales de la predicción implican (un número ilimitado de) otras predicciones particulares que son las que se constatan empíricamente. De todos modos, en ocasiones es relevante que la predicción sea general, en cuyo caso es especialmente necesario repetir la contrastación varias veces, siendo un supuesto auxiliar que nada incontrolado produce la coincidencia de resultados (cf. el caso del anillo de Einstein).
La predicción es un hecho posible, y detectable si efectivamente ocurre. Los datos son los hechos efectivamente detectados en el momento de la contrastación, cuya coincidencia o no con la predicción constituye la evidencia positiva o negativa para la hipótesis. En el caso de Arquímedes, el hecho observado es el movimiento del barco; en el caso del paralaje, la coincidencia en las formas aparentes de las constelaciones observadas con seis meses de diferencia; en el caso de Neptuno, la presencia de un cuerpo en determinado lugar en determinado momento; en el de Vulcano, la ausencia de un cuerpo tal; etc. Una
condición esencial que han de satisfacer los datos es que los procedimientos para su recogida o detección no presupongan la verdad o la falsedad de la hipótesis, en caso contrario estaríamos ante estrategias autoconfirmadoras o autorrefutadoras. Normalmente el proceso de recogida de datos es muy complejo y, si no se va con cuidado, a veces se puede incumplir esta condición. Este riesgo es mayor en los casos de experimentos complicados, pero también está presente en la observación directa. Como veremos en otros lugares (caps. 8 a 1 l), es esencial que el análisis de la estructura de las teorías y de su base de contrastación recoja esta condición. Los datos se detectan mediante la observación. La observación está vinculada casi siempre a la realización de un experimento, en cuyo caso parte al menos de las condiciones iniciales las constituyen las condiciones de realización del experimento. Pero a veces se observa sin experimentar en sentido estricto. En ese caso se espera que las condiciones iniciales se produzcan espontáneamente comprobando luego si se da o no también la predicción. Esto ocurre cuando algunos de los factores intervinientes no son, por diferentes motivos, accesibles o manipulables. El motivo más inmediato es la imposibilidad física o tecnológica. No podemos coger el cometa y moverlo de aquí para allá a discreción para contrastar nuestras predicciones. Halley tuvo que morir sin ver confirmada su hipótesis porque sólo le cabía esperar a 1758 para realizar la observación. Éste es el tipo de limitaciones al que se refiere Hempel cuando habla de contrastaciones no experimentales (cf. 1966a, 33.1). Pero muchas veces la imposibilidad no es tecnológica sino "moral". Esto ocurre cuando la realización de un experimento es técnicamente posible pero involucra la manipulación de personas u otras entidades de modos que se consideran inaceptables según los valores de la comunidad. Los casos paradigm á t i c o ~corresponden a algunas ciencias sociales y a la investigación bioniédica. La contrastación del doctor Semmelweis podía haber tenido fácilmente un carácter experimental más riguroso, por ejemplo si hubiera mantenido como grupo de control a un grupo de pacientes de la División Primera tratadas con personal sin desinfectarse para ver si continuaban muriendo a igual ritmo. Pero es obvio que este tipo de mejora experimental es considerado moralmente inaceptable. La distinción entre "simple observación" y "observación con experimento" es otra de las que no se pueden considerar radicales. Entre los casos de Halley, que aprovecha condiciones que ocurren espontáneamente, y de Michelson, que involucra un complejo experimento, hay ciertamente una gran diferencia, pero entre medio hay muchos otros que no están tan claros. Un ejemplo es el mismo caso del doctor Semmelweis, pues en cierto sentido muchos afirmarían que sí hizo un "experimento" (quizá técnicamente mejorable) en la acepción col.oquia1 del término. O incluso el de Halley, pues aunque no manipulara el cometa mismo la contrastación incluye muchos aspectos experimentales complejos que suponen la manipulación de ciertos aparatos, muestras, etc. La distinción en cuestión es por tanto gradual, y cuanto más experimental es una observación más parecen ser los supuestos teóricos auxiliares que intervienen en la contrastación. Sobre estos temas, la posibilidad o no de observación pura y sus consecuencias epistemológicas, entre ellas el riesgo de caer en estrategias autojustificadoras, volveremos más adelante en los capítulos dedicados a la estructura de las teorías y al problema de la inducción.
3. Condiciones para la contrastación
En la presentación de los diversos elementos involucrados en la contrastación hemos mencionado de pasada algunas relaciones entre ellos. Vamos a explicitar ahora en detalle qué relaciones deben mantener para que se den las condiciones apropiadas para una buena contrastación. Las condiciones en cuestión se refieren a los dos resultados posibles que pueden proporcionar los datos, esto es, que la predicción ocurra o que no ocurra. Como veremos, la relación entre los diversos elementos en ambos casos es de diferente tipo.
i
En este primer ca o la condición es que la predicción debe ser un estado de cosas cuya ocurrencia es implic da por los restantes elementos H, SA y CI: C1 H y SA y CI implican (conjuntamente) P. i l
4
(En la versión de Hem el la condición es "H y SA implican f', pero puesto que la implicación contrastadorq I dz Hempel es en realidad "si CI entonces P",su condición es lógicamente equivalente Cl.) Así, por ejemplo, en el caso del cometa Halley, C l tiene la siguiente forma: "Si el c erpo celeste en cuestión es un cometa de trayectoria elíptica, la Y leyes de la mecánica celepte de Newton son correctas, y las posiciones del cuerpo celeste en 1530, 1606 y 1652 so tales y cuales (y además no hay distorsiones en su trayectoria producidas por motivos d sconocidos), de todo ello se sigue que el cuerpo reaparecerá en nuestro cielo visible a fin les de diciembre de 1758." ¿Qué estatuto lógi o debe tener C1 para que sea una buena condición de contrastación? Es absolutamente qsencial darse cuenta de que la implicación contenida en C1 no puede consistir meramende en una implicación (un condicional) material. La implicación lógicamente verdadero. La en cuestión debe ser material verdadero predicción no debe ser cuyo antecedente es condicional en cuestión debe ser una verdad lógica, de H, SA y CI. En el ejemplo dado, la esto es, P debe indicada se infiere mediante un proceso de los cometas, de las leyes de intervienen factores extraños). para la caracterización de los procesos de contrastación que en la metodología de la contrastación es suficiente que C1 exprese simplemente un dondicional material verdadero. Pero no es así. Si no se precisa este punto, la referencia elrplícita a algunos supuestos auxiliares sería superflua y, con ello, la identificación de los elementos involucrados en la contrastación sería incompleta. Si bastara que C1 expresaralun condicional material verdadero, para que se satisficiera C1 bastaría, por ejemplo, quq fuese verdadera P, o que fuese falsa H, en cuyo caso SA y CI
E
podrían ser cualquier cosa, o simplemente "no estar". Por tanto, enfatizar que C1 no expresa un condicional materialmente verdadero sino lógicamente verdadero es enfatizar la necesidad de recoger en los supuestos auxiliares todas las hipótesis adicionales necesarias para inferir deductivamerzte la predicción, y lo mismo respecto de las condiciones iniciales. Por otro lado, debe notarse que atendiendo a esta caracterización, C1 es extremadamente sencilla de comprobar. Sólo hace falta saber si hemos deducido correctamente la predicción de los restantes elementos. Así es como se procede en los casos históricos. Otra característica que debe tener C1 para ser una condición adecuada de contrastación es que H,SA y CI ocurran esencialnzerzte. Esto significa que P se deduce de todos ellos tomados conjuntamente pero de ninguno de ellos por separado, ni siquiera de dos de ellos. Los tres elementos del antecedente, no sólo la hipótesis principal, han de ser esenciales en la derivación de la predicción. Algunos autores añaden la exigencia de que la hipótesis en juego explique el hecho predicho. No vamos a incluir ni comentar ahora esta exigencia. La relación entre hipótesis, explicación y deducción será estudiada en el capítulo 7.
RELATIVA A LA NO OCURRENCIA DE LA PREDICCI~N 3.2. CONDICI~N
C1 no es suficiente para una contrastación completamente satisfactoria. Si sólo
tenemos en cuenta las condiciones establecidas en ese caso para la ocurrencia de la predicción, los resultados pueden ser muy limitados. La cuestión es la siguiente. Una hipótesis puede por supuesto predecir hechos que también son predichos por otras hipótesis diferentes, nada malo hay en ello, al contrano. Ése no es el problema; el problema no es que una hipótesis prediga hechos que también predicen otras hipótesis alternativas, 'sino usar esa clase de hechos como predicciones para realizar la contrastación. No es adecuado intentar contrastar una hipótesis mediante predicciones que comparte con otras hipótesis diferentes. En esas condiciones la contrastación es (parcialmente) insatisfactoria. Para una contrastación plenamente satisfactoria la predicción debe estar "especialmente ligada" a la hipótesis que se contrasta. La cuestión es cómo precisar esta segunda condición. La condición no puede consistir en que de la falsedad de la hipótesis se deduzca, dados SA y CI, la no ocurrencia de la predicción: (1) " no H y SA y CI implican (deductivamente) no Pt. (1) es equivalente a (2) "si SA entonces: no-H implica que en condiciones CI no ocurre P", esto es, de los supuestos auxiliares se infiere que ninguna otra hipótesis, conocida o desconocida, predice lo mismo que H. Esta afirmación es extremadamente fuerte y difícilmente aceptable; supuestos auxiliares de este calibre no pueden permitirse en el proceso de contrastación. Sin embargo, algo aparentemente próximo, pero en realidad mucho más débil y de naturaleza totalmente distinta, sí parece que estamos dispuestos a aceptar al contrastar una hipótesis (aunque la naturaleza de esa aceptación es extremadamente difícil de precisar). La clave la dan algunos pasajes de los relatos de los episodios históricos. Se trata de afirmaciones del tipo: "pero tales patrones de magnetismo en los sedimentos submarinos serían muy improbables de otro modo"; "no es esperable ese tipo de fracturas en el cuarzo por otros motivos"; "la imagen anular en el ordenador del telescopio de radio era
inesperada". La condición en cuestión. implícita en estos pasajes, e s q u e la predicción es muy improbable o inesperada de no ser por la hipótesis, esto es, que si la hipótesis no fuese correcta la predicción sería muy improbabie o inesperada. Podemos expresar esta condición, exigida explícitamente por diversos autores (cf. p.ej. Popper, 1935-1 955, apéndice *IX y 1963, apéndice $3;Salmon, 1966, p. 265 y Giere, 1979, cap. 6, 3 y 1991, cap. 2, 48). del siguiente modo: C2 Si no-H y SA y CI, entonces muy probablemente no-P.
No hay duda de que algo así se supone en los casos de contrastación, el problema es dar una interpretación satisfactoria de ello, determinar el estatuto exacto de la implicación involucrada en C2. Aquí haremos sólo unos comentarios generales y dejaremos la cuestión como un problema parcialmente abierto que se retomará en el contesto dzl probIema de la inducción (cap. 13). En primer lugar, en este caso no se puede tratar de que la alta probabilidad de no-P se deduce de no-H, SA y CI. Esto supondría que mediantz H, Sil y CI estamos haciendo afirmaciones sobre lo que prediczn o dejan de predecir otras hipótesis, conocidas a desconocidas. Puesto que H claramente no hace eso, y CI tampoco, sólo podría hacerlo Sit. Por tanto, considerar que C2 expresa una inferencia deductiva es tanto como aceptar que entre los supuestos auxiliares se incluyan afirmaciones como "es muy probable que sólo H prediga que dadas CI ocurre P . Pero ello parece excesivo. Una cosa es que entre los supuestos auxiliares incluyamos afirmaciones vagas y extraordinariamente generales como "ningún cuerpo celeste desconocido afectará en estos años la órbita del cometa significativamente", o "ningún agente desconocido contrarrestar5 el efecto desinfectante de la sal clorada". Otra cosa es que aceptemos entre los supuestos la afirmación de que muy probablemente la predicción sólo se sigue de nuestra hipótesis. Eso es efectivamente un "supuesto" en la contrastación, por eso se recoge como segunda condición, pero ello no significa que sea una hipótesis auxiliar comparable al uso de leyes complementarias o incluso a las condiciones extraordinariamznte genrrales sobre la ausencia de perturbaciones desconocidas. Parece una expectativa de otro tipo, no asimilable a los supuestos auxiliares. Por tanto, si la improbabilidad de la predicción en caso de falsedad de la hipótesis no se puede considerar un supuesto auxiliar, la improbabilidad de la predicción no se infiere deductivamente de no-H, SA y CI. Otra posibilidad sería que C2 exprese una inferencia lógico-inductiva. Esto es, que el "probablemente" pertenezca al condicional y que éste exprese entonces una inferencia inductiva: la no ocurrencia de la predicción se infiere inductivamente de la falsedad de la hipótesis, más SA y CI. Pero esto tampoco puede ser. Eso significaría que antes de la contrastación, como condición para someter a prueba la hipótesis, presuponemos la validez del siguiente argumento inductivo:
A pesar de que las intuiciones sobre lósica inductiva son débiles, los episodios históricos no presentan indicios para considerar que antes de que la contréstación tenga lu_oarse haya realizado ya alsún tipo de argumento i~zductivo.Con C1 es diferente, pues en los episodios históricos claramente se nos informa de que se ha calculado, inferido o deducido cieno hecho a partir de la hipótesis, junto con SA y CI; en la "preparación" de la contrastación sí se realizan ciertas inferencias deductivas, recogidas en C1. Pero nada indica que en la preparación de la contrastación se realice tal inferencia inducuva. Así pues, C2 no expresa tampoco una inferencia inductiva. Por otro lado, nótese que, según qué lógica inductiva usemos, si C2 expresara dicho q u m e n t o inductivo, podríamos estar ante una especie de petición de principio. Si en la 16gica inductiva vale la contraposición, entonces ese.argumento equivale a este otro:
Pero, como veremos, éste es justamente (parte de) el argumento para la confirmación de hipótesis, que es inducriva~nenteinválido a menos que incluyamos C2 como premisa adicional. Si la condición C2 para la contrastación no expresa ni una inferencia deductiva ni una inductiva, entcjnces debe tomarse como un enunciado probabilista condicional simplemente verdadero. La dificultad ahora con C2, en tanto que enunciado probabilista que se pretende que es simplemente verdadero, es cómo se comprueba su cumplimiento. Vimos que C1 es muy sencillo de comprobar, pues expresa una inferencia deductiva, y sabemos muy bien cómo comprobar esas cosas. Si C2 expresara una inferencia inductiva, aunque resultaría muy complicado tendríamos al menos una idea de en qué consistiría su comprobación: consistiría en lo que la lógica inductiva (de haberla) dijera. Pero jcómo comprobar C2 en tanto que mera verdad material? En algunos casos es fácil comprobar que es falsa: cuando se conoce al menos otra hipótesis H' incompatible con H y de la cual también se infiere P. Por ejemplo, en el caso de las fases de Venus, la ocurrencia de este fenómeno se deriva tanto del sistema heliocéntrico de Copémico como del sistema mixto de Tycho. Por tanto es fácil saber en algunos casos, como éste, que la condición no se cumple. Pero, jcuándo podemos establecer que se cumple? ¿Es suficiente simplemente que se desconozca la existencia de otras hipótesis incompatibles con H pero con las mismas predicciones para considerar bien fundada C2? La respuesta a esta cuestión depende de elementos pragmáticos muy difíciles de precisar. Pero no hay duda de que en algunos casos la aceptación de C2 es razonable, en especial cuando la predicción es un hecho completamente inesperado hasta entonces, que nadie había pensado que ocurriera. Por ejemplo, el anillo de Einstein, los patrones magnéticos de Hess, o la misma reaparición del cometa Halley. ¿A quién se le podría haber ocumdo que a finales de 1758 aparecería un cometa en determinada región del cielo visible? Y sin embargo, ni siquiera en esos casos parece haber garantías plenas de que se cumple C2. Por ejemplo, se puede predecir la misma aparición conjeturando la existencia
de una serie específica de diferentes cometas parabólicos (resultado quizá de la desinte-
gración de cierto astro). Se dirá que eso no es jugar limpio, a posteriori siempre es posible idear hipótesis diferentes que predigan lo mismo; la gracia es hacerlo "el primero". Bien, en parte es cieno que es un expediente en principio ilegítimo, semejante al de las hipótesis ad hoc que comentaremos más adelante. Pero eso no elimina e1 hecho de que, estrictamente hablando, y si C2 se considera relativa a cualquier hipótesis alternativa posible, entonces C2 es falsa en ese caso, aunque hayamos creído justificadamente en ella. El problema radica en que no es razonable considerar que para determinar el cumplimiento o no de C2 debemos tomar en consideración cualquier hipótesis alternativa posible. C2 se ha de considerar relativa sólo a hipótesis alternativas que están en juego en el conte,rto en el que se reoliza la contrasración. Esto es, hipótesis alternativas presentes (o "fácilmente concebibles") y "aceptables como aIternativas" dados los presupuestos del contexto (esto es, no demasiado extravasantes, ni claramente contradictorias con otras hipótesis muy bien asentadas, etc.). Esto hace que las condiciones de aceptación de C2 sean relativamentz vasas y fuertemente dependientes del contexto y de sus presupuestos teóricos. Esto conduce de lleno a cuestiones filosóficas sustantivas sobre los presupuestos teóricos involucrados en los procedimientos de contrastación; puesto que la finalidad en este capítulo es puramente metodológica, no vamos a ocuparnos aquí de estos problemas epijtemoló,oicos, cuyo estudio queda aplazado a otros capítulos (cf. esp. cap. 12). Por último, la discusión muestra quz C1 y C 2 no son ambas igualmente imprescindibles para la realización de una buena contrastación. Mientras C1 es siempre necesaria, C2 no. De hecho hemos visto algunos episodios, como el de las fases de Venus, en que claramente es incumplida y, como veremos, ello no impide proceder a una buena contrastación con resultados limitados. Si nos limitamos a los casos de evidencia negativa o refutación, C1 es suficiente. Pero si la contrastación ha de ser eficiente sean cuales sean los datos resultantes, incIuida la evidencia positiva, entonces C2 sí es necesaria. Quizá se piense que por razones análogas se podría defender entonces que C 1 no es necesaria en los casos de evidencid positiva. Pero no es así, pues C2 ha de establecer que la falsedad de H implica muy probablemente la falsedad de P, siendo P un hecho predicho por la hipótesis H,esto es, cumpliéndose C 1.
4.
Resultado de la contrastación
Veamos ya qué consecuencias tienzn los datos observados para la contrastación de hipótesis. Reconstruiremos el establecimiento de estas consecuencias en forma de argumentos. Comenzaremos con el caso en que los datos constituyen evidencia en contra de la hipótesis, veremos después el opuesto, la evidencia a favor, y presentaremos una especie de algoritmo a modo de resumen. Concluiremos comentando un tipo de contrastaciones específicas, aquellas en que un mismo dato se utiliza para contrastar hipótesis rivales. Recuérdese que la condición C 1 ha de satisfacerse siempre. Irt
4.1 .
EL-IDESCI.~ NEG.J,TI\:4 (REFLT~CI~S). ESTR~TEGI.-\S .4D HOC
Es difícil resistirse a la fuerza de episodios como los del flogisto: la teoría predice que el material pesará menos después de la combustión. se hace el experimento y se encuentra que pesa m&, por tanto la evidencia empírica es contraria a la teoría. Puede que haya buenos motivos filosóficos para matizar, cuestionar o rechazar algcnas consecuencias epistemológicas que aparentemente se siguen de episodios como éste. pero no hay duda de que la predicción incumplida constituyeprit~zafacie evidencia c o ~ z r r a ~a ala hipótesis en juego. El modo en que se establece que la evidencia es negativa o contraria a la hipótesis tiene la forma de un argumento que concluye que la hipótesis no es correcta. Encontramos este arpmento formulado implícitamente en muchos episodios científicos. Incluso a veces es formuIado explícitamente, como vimos en el caso de Michelson: "90hay desplazamiento de las bandas de interferencia. La consecuencia de la hipótesis de un éter estacionario se muestra incorrecta, y la conclusión que necesariamente se sigue es que la hipótesis es errónea." El argumento contrario a la hipótesis que parece sugerir Michelson es un argumento deductivo muy sencillo que responde a la forma rnodus rollens, que tiene como premisas a ) que la hipótesis tiene como consecuencia cierto hecho, y b) que el hecho no ocurre, y como conclusión c) que la hipótesis es errónea: si H entonces P (*) no P (#)
no H
Éste es efectivamente un argumento deducti\po válido, pero no es exactamente el qUe establece que la evidencia es negativa. Como vimos más arriba, la primera premisa es más complicada, la predicción no se sigue de la hipótesis sola. La primera premisa es en realidad la condición C1. Tendríamos entonces el siguiente argumento: (Cl) si H y Sil y CI entonces P (*) no P
Pero ahora este argumento deductivo es inválido. Lo que se sigue de las dos premisas por inodus roflens no es la falsedad de H sino de todo el antecedente complejo: (Cl) si H y SA y CI entonces P (*) no P
i'iiesto que "no (H y SA y Ci)" es equivaIente a "no H o no SA o no CI",para obtener legítimamente comoconclusjón la negación de la hipótesis, hay que añadir como premisa adicional la ocurrencia de SA y CI:
(Cl) si H y S,4y C/ entonces P (*) no P (**) SA y CI
Así, el argumento [REF] para la refutación de hipótesis es un arjumento deductivo válido complejo que tiene como premisas CI (*) y (**). De las dos primeras establece provisionalmente (+) por rnodrls tollens, y de ésta conclusión intermedia y (**) establece finalmente (#). Éste es el patrón al que respondzn los episodios del flo_oisto y, según propio testimonio de Michelson, del éter. Pero a él también deberían responder otros episodios en los que, ante aparentemente la misma situación. no se concluye (S),no se acepta que la evidencia es contraria a la hipótesis. Contemplemos el caso del paralaje estelar. Del heliocentrismo, decían los geocentristas. se infiere que en determinadas posiciones se debe observar paralaje. pero no se observa, por tanto la hipótesis heliocéntrica es errónea. S o , respondían los copemicanos (y parece que ya Aristarco). La existencia de paralaje en ciertas condiciones iniciales se sigue de la hipótesis sola, pero la observación del mismo no. Que se deba observar paralaje se sigue de la hipótesis heliocéntrica y del supuesto adicional de que el diámetro de la órbita terrestre es significativo observacionalmente en comparación con la distancia a la esfera de las estrellas fijas. Es cierto que no se observa paralaje, pero todo lo que se sisue de ello, suponiendo que las condiciones iniciales estén bien comprobadas, es que o el heliocentrismo o el supuesto adicional sobre las distancias comparativas, al menos uno de ambos, es falso. Para concluir que es la hipótesis heliocéntrica la que es falsa hay que establecer previamente que son verdaderos, además de las CI, los supuestos auxiliares, entrz ellos el referente a las distancias comparativas. Y eso es precisamente lo que rechazaban los copemicanos. Como se ve, los supuestos auxiliares pueden dar mucho juego a la hora de no aceptar la refutación de una hipótesis. En este caso los copemicanos aceptan la validez del argumento [REF], pero rechazan su conclusión al considerar que la tercera premisa es falsa, que uno de los supuestos auxiliares es falso. ¿Es eso una estrategia legítima o una simple estratasema elusiva? Seguramentz hoy nos parece legítimo; después de todo los copernicanos han acabado teniendo razón. La relación entre dichas distancias impedía la observación del paralaje a simple vista, no mediante potentes telescopios (instrumentos que ni Copérnico ni Tycho conocían), y de hecho así se detectó en 1538 (constituyendo una confirmación tardía, y en ese momer:to completamente superflua, del heliocentrismo). Pero en su época se corisideró, P.e. por Tycho, una escapatoria ile,'Oitlma. . Cuando tras una contrastación negativa se apela a este tipo de hipótesis auxiliares para salvar la hipótesis central de la refutación, decimos que se trata de hipótesis ad hoc. e.e. especialmente destinadas a defenderse de la refutación. Entiéndase bien, no se introducen en sentido estricto después de la contrastación. Rzcordemos que entre los SA suele haber uno muy general y vazo del tipo "nada extraño ocurre o interfiere" o "nada más afecta al resultado predicho". Las hipótesis ad hoc explotan este cajón de sastre diciendo
que ?se es el supuesto auxiliar que ha fallado. Pero. claro, esos supuestos no dicen
simplemente de modo indeterminado que algo no contemplado originalmente influye en la predicción. Dan una propuesta específica. En este sentido sí son "post:riores" a la contrastación, son una precisión a posteriori de elementos (supuestamente) determinantes para la predicción cuya influencia se excluía por esa cláusula general en SA. Un caso típico de hipótesis ad hoc ilegítima se produjo en el episodio de1 flogisto. Hubo defensores de la teoría del flogisto que la pretendieron defender de la refutación de La\,oisier diciendo que el flogisto tiene masa negativa. Efectivamente, si el flogisto tuviese masa negativa el experimento daría el mismo resultado aun siendo cierta la hipótesis de que los combustibles se inflaman liberando flogisto. La estrategia es la siguiente. Entre los supuestos auxiliares se puede considerar que, camuflado en la cláusula "nada anormal pasa, de nada más depende la predicción", hay uno que afirma que "el flogisto es normal", esto es, tiene masa positiva. De la contrastación negativa se sigue que o la hipótesis de la combustión liberando flogisto, o el supuesto auxiliar oculto de que el flogisto tiene masa positiva, al menos uno de ambos es falso. Y los partidarios del flogisto mantienen que el supuesto falso es el segundo, con lo que la hipótesis principal podía ser verdadera. Esta estrategia es formalmente semejante (si ignoramos hechos posteriores) a la de los copernicanos con el paralaje, pero suena bastante peor que aquélla. Postular en aquella época masas nezativas parecía claramente una estratagema elusiva, aunque no olvidemos que hoy día hay teorías muy serias que lo hacen. A veces se califica de ad hoc cualquier hipótesis introducida, utilizando los SA más genéricos mencionados, para salvar de la refutación la hipótesis principal. Otras veces se califica así a la hipótesis adicional sólo si su introducción se considera ilegítima. Usemos los nombres que usemos, debe quedar claro tras los ejemplos vistos que la diferencia entre hipótesis ad hoc legítimas e ilegítimas es, una vez más, cuestión de grado. Depende de elementos pragmáticos muy variables y difusos. Hay algunos casos muy claros, como la quiromancia, la astrología y otras paraciencias. En la (escasa) medida en que hacen predicciones concretas, si se les presenta un episodio refutador siempre se sacan una hipótesis ad koc de la manga. Pero usualmente no es tan claro. La defensa de los copemicanos parece hoy bastante aceptable, pero jnos lo parecería en su época?, ¿y en la de Aristarco? La defensa de los partidarios del flogisto parece inaceptable, ¿como la del astrólogo? ¿Qué decir del experimento de Michelson? A él le pareció una refutación clara de las hipótesis centrales en juego, pero a Maxwell le pareció que se podían salvar si se producían ciertos efectos de contracción con la velocidad, semejantes a los que más tarde se seguirían de las teorías de Einstein. No hay una respuesta general sencilla y nítida para este tipo de cuestiones; la posición razonable en cada caso depende de elementos pragmáticos muy variables de cada contexto específico. Por supuesto que esto no quiere decir que "todo vale"; por pragmático no hay que entender dependiente de cuaIquier aspecto contextual sino, principalmente, dependiente del contexto cie!ztljíco, esto es, de las posibilidades de integración teórica con hipótesis bien eitnbl~cidas. Cuestionar el cumplimiento de los supuestos auxiliares es la estrategia más común para eludir la refutación de la hipótesis. Pero no es la única. Hemos dicho que casi siempre las condiciones iniciales de experimentación o simple observación son comproba-
das y aceptadas sin mayores problemas. Pero a veces, cuando la confianza en la hipótesis es extremadamente fuerte y no se ve ningún supuesto auxiliar que pueda ser incorrecto, se puede llegar a replantear la aceptación del cumplimiento de las condiciones iniciales. Es entonces cuando se insiste, una y otra vez, en que algo ha ido mal en el diseño experimental. Cuando Millikan presentó la hipótesis de la unidad de carga eléctrica, Ehrenhaft repitió los experimentos de Millikan, consistentes en fa medición de las velocidades de descenso y ascenso de partículas de aceite cargadas eléctricamente moviéndose entre las placas de un condensador. Ehrenhaft obtuvo resultados que, en su opinión, refutaban la hipótesis de Millikan. Éste, que consideraba su hipótesis bien establecidaexperimentalmente, adujo en algunos de los casos el incumplimiento de las condiciones correctas de experimentación, por ejemplo, que las partículas se habían desviado del foco óptico, o que habían perdido su forma esférica. Los resultados posteriores mostraron que la actitud de Millikan era razonable. Pero también puedz ser a veces una estrategia puramente elusiva. Los creyentes del Tarot dicen que para que la lectura adivinatoria de las cartas sea conecta se deben mantener las piernas sin cmzar para dejar circular la energía vital; una estrategia muy utilizada ante predicciones mínimamente precisas que resultan- incumplidas es que, inadvertidamente, en algún momento se cruzaron las piernas.
Es difícil resistirse a la fuerza de episodios como el del cometa Halley: la teoría predice la aparición de cierto cuerpo celeste en una región precisa del cielo en un período determinado, algo que parece completamente inesperado de otro modo; se realiza la comprobación y efectivamente la predicción es correcta; por tanto la evidencia empírica es favorable a la hipótesis. Puede que haya buenos motivos filosóficos para matizar, cuestionar o rechazar algunas consecuencias epistemológicas que aparentemente se siguen de episodios como éste, pero no hay duda de que la predicción exitosa constituye prima facie evidencia favorable a la hipótesis en juego. El modo en que se establece que la evidencia es positiva o favorable a la hipótesis tiene la forma de un argumento que concluye que la hipótesis es correcta. Pero, a diferencia del caso anterior, el argumento ahora no es deductivo. El argumento no es:
(C 1) si H y SA y CI entonces P (*) P (#)
HOI S A Y CI)
Esto no es un argumento deductivo válido; como vimos en el capítulo precedente, es un caso de falacia de afirmación del consecuente. El argumento utilizado en la confirmación de hipótesis no es deductivo sino inductivo. Quizá se piense que este argumento inductivo consiste simplemente en debilitar la pretensión del anterior, esto es, en la versión inductiva de la afirmación del consecuente:
(C1)
si H y SA y CI entonces P (*) p (#)
H (YSA Y CI)
Pero no es así. Cuando estudiamos los argumentos inductivos vimos que la afirmación del consecuente no es tampoco en general una inferencia inductiva válida. El argumento inductivo que establece que la evidencia es favorable a la hipótesis no usa como premisa C1 sino C2. Es aquí donde entra en juego el que la predicción sea improbable de ser falsa la hipótesis. Ahora bien, el argumento inductivo no concluye directamente H de C2 y P:
(C2) si no H y SA y CI entonces muy probablemente no P (*> p ............................................................. (#)
H
Éste es un argumento inductivo inválido. Lo que se sigue inductivamente de estas premisas es lo siguiente: (C2) si no H y SA y CI entonces muy probablemente no P (*> p (+)
no (no Hy SA y CI)
Puesto que "no (no H y SA y CI)" es equivalente a "H o no SA o no Cl",para obtener legítimamente H como conclusión hay que añadir como premisa adicional la ocurrencia segura de SA y CI:
[CONF] (C2) si no H y SA y CI entonces muy probablemente no P (*> p (**) SA y CI
(#>
H
Así, el argumento [CONF] para la confirmación de hipótesis es un argumento inductivo válido complejo que tiene como premisas C2, (*) y (**). De las dos primeras se establece provisionalmente (+) por una inferencia iitductiva, y de ésta conclusión intermedia y (**) se establece finalmente (#) mediante una inferencia deductiva. [CONF] es por tanto un argumento mixto, con una parte inductiva y otra deductiva. El argumento completo se debe considerar inductivo puesto que al menos una de sus inferencias lo es, el paso inductivo imprime carácter inductivo a todo el argumento. Recuérdese que este argumento depende esencialmente de C2, y será tanto mejor como argumento inductivo cuanto más justificada esté C2, cuanto más improbable sea la predicción caso de ser falsa la hipótesis. Éste es el aspecto más problemático d e la
metodología de la confirmación, pues como vimos más arriba la naturaleza de C2 y de su comprobación es extremadamente problemática. Aparte de las intuiciones, como en el caso de Halley, no está en general claro cómo se establece C2. Lo que sí está claro a veces es que no se cumple. Si ése es el caso, si hay buenos motivos para no aceptar C2, entonces la predicción exitosa no conduce a la conclusión de que la evidencia es favorable a la hipótesis; la contrastación no es concluyente. Éste es el caso de las fases de Venus, cuya observación Tycho no hubiera considerado suficiente para confirmar la hipótesis heliocéntrica pues también se predecían en su sistema mixto. Por último, y al igual que en la refutación, otro modo de eludir la conclusión de que la predicción exitosa constituye evidencia favorable a la hipótesis es objetar a la premisa (**), esto es, sostener que algún supuesto auxiliar es incorrecto o alguna condición inicial ha fallado.
El cuadro de la página siguiente resume a modo de algoritmo la metodología de la contrastación. Las flechas indican que el paso en cuestión es argumentativo; si la flecha es continua, la infzrencia es deductiva; si es discontinua, la inferencia es inductiva (las conclusiones están contenidas en las elipses). Nótese que el diagrama incluye también los diversos modos en que la contrastación puede considerarse insuficiente, esto es, las circunstancias en las que la predicción fallida no se considera evidencia contraria o la predicción exitosa no se considera evidencia favorable.
Cuando presentamos la predicción como uno de los elementos de la contrastación, no mencionamos algiinas condiciones que es razonable exigir. El incumplimiento de estas condiciones constituye un tipo de falacia de contrastación semejante en su carácter "tramposo" al uso ilezítimo de las hipótesis ad hoc. No las mencionamos entonces porque se percibe mejor su necesidad tras haber visto en detalle las condiciones y el mecanismo de la contrastación. La primera de estas condiciones que debe satisfacer la predicción P es la precisión. Si la predicción es imprecisa o vaga la contrastación se presta a todo tipo de recursos ilegítimos. Un caso paradigmático lo constituyen los horóscopos. Es usual leer en las secciones de horóscopos de los periódicos "predicciones" del tipo "este mes le pasará algo importante", o "este mes recibirá apoyo de una persona cercana". Predicciones tan vagas no sirven para la contrastación. Por un lado, por su imprecisión es prácticamente imposible establecer firmemente que no se cumplen. Por otro, de su "cumplimiento" no se puede concluir legítimamente apoyo alguno a la hipótesis, en este caso que las posiciones astrales influyen causalmente en nuestras vidas. Intuitivamente se ve que ello es así, pero después de estudiar las condiciones para una contrastación satisfactoria, podemos establecer este punto con más precisión. Este tipo de predicciones no cumplen C2: no es cierto que la predicción sea
¿Se ded
NO
................. Gont;astación inviable
I
¿Es muy improbable Psi no H, SA y CI?
NO ............... ., Datos inconcluyentes
H o no SAo n o C I
............... Datos inconcluyentes
NO ................. Datos inconcluyentes
FIG,3.1. Continstuciún de la Iripótesis H mediante la predicción P con supueslos uuxiliurrs S A y condiciones iniciufes CI
improbable si la hipótesis es falsa; por su vaguedad, la interpretación mínima les confiere tal amplitud que son altamente probables en cualquier circunstancia. En realidad, en algunos casos no es claro que se satisfaga siquiera C1, pues muchas veces la hipótesis en juego no desempeña un papel efectivo en el establecimiento de la predicción. Un caso semejante al anterior es el de la predicción múltiple disyuntiva P = P, o P2 o ... o P,. En sentido estricto, no es una predicción vaga, pues si cada Pi está bien determinada, también lo está la predicción global P. Cada Pi puede ser precisa, pero su disyunción puede resultar inaceptablemente amplia si las Pi son muchas o parcialmente complementarias. Un caso extremo de esta segunda posibilidad es que entre todas las Pi, o simplemente dos de ellas, cubran todas las alternativas posibles. En ese caso no se ha hecho ninguna predicción empírica propiamente dicha, pues P es una verdad lógica. Lo que hay entonces no es una predicción vaga o inaceptablemente amplia sino, simplemente, ausencia de predicción. Otro caso de ausencia de predicción, presente también a menudo en las paraciencias, consiste en predecir sólo posibilidades: "el año próximo puede hacer un viaje". Si la posibilidad se interpreta en sentido estricto, se predice simplemente una perogrullada, esto es, no se predice nada. Puede ser que la posibilidad se interprete como probabilidad, pero entonces sin más precisiones es un caso de vaguedad, o de amplitud inaceptable. Una última observación sobre recursos ilegítimos que involucran la predicción. En el caso que vamos a exponer, la estratagema no afecta a contrastaciones aisladas sino a series de ellas. La estratagema en cuestión consiste en repetir incansablemente la predicción hasta que sucede. Los seguidores de muchos equipos de fútbol suelen predecir cada año que su equipo ganará el campeonato, y si efectivamente un año el equipo lo gana, no es extraño oír a algunos ufanarse del acierto. Cuentan que un futurólogo proclamó que había predicho el crack económico de 1929, pero resultaba que llevaba diez años prediciendo cada año que el año siguiente iba a haber un desastre financiero. De acuerdo con la metodología vista, en estos casos se trata simplemente de varias contrastaciones sucesivas en las que los resultados refutadores son abrumadoramente más numerosos que los confirmadores.
Para concluir esta sección comentaremos brevemente un tipo especial de contrastación, aquél en el que están en juego dos hipótesis alternativas rivales. A estas contrastaciones se las considera contrastaciones cruciales porque supuestamente deben servir para decidir entre ambas hipótesis; cuando la comprobación de la ocurrencia o no de la predicción se realiza mediante experimentación, se habla entonces de e-cperimentos cruciales. En las contrastaciones cruciales las hipótesis rivales se enfrentan entre sí con respecto a la misma predicción. Una de las hipótesis, H. predice con ayuda de los supuestos auxiliares SA que en las condiciones CI se dará P. La hipótesis rival H' predice, con ayuda de sus propios supuestos SA', que en las mismas condiciones iniciales CI se dará no-P.La ocurrencia o no de P debe eventualmente proporcionar evidencia en favor de una
88
T'L1ND.i51E4;TOS DE F I L O S O F ~DE LA CIENCIA
y en contra de otra. Un ejemplo típico de contrastación crucial es el relativo a las teorías ondulatoria y corpuscular de la Iuz con el experimento crucial realizado por Foucault en 1850 sobre la velocidad de transmisión de la luz en aire y en agua. En este caso el resultado se aceptó en general como una confirmación de la teoría ondulatoria y una refutación de la teoría corpuscular. Técnicamente, una contrastación crucial entre dos hipótesis no es más que la combinación de dos contrastaciones de dos hipótesis que hacen predicciones contradictorias sobre el nlismo fenómeno. Por tanto se aplica punto por punto todo lo que hemos visto en los apartados anteriores. Se aplica en especial lo relativo al cumplimiento de C2. Esta condición se debe cumplir respecto a cada una de las hipótesis para que el resultado, sea cual sea, pueda considerarse la refutación de una y la confirmación de la otra. El incumplimiento de esta condición hace que algunos casos que parecen contrastaciones cruciales en realidad no lo sean, o puedan no ser considerados así por quienes no reconocen que se cumple esta condición. Esto es lo que ocurre en el episodio de las fases de \'enus. En principio se podría considerar una contrastación crucial entre el geocentrismo clásico y el heliocentrismo, siendo el resultado final contrario al primero y favorable al segundo. Pero Tycho no hubiera estado dispuesto a considerarlo así. Estaba de acuerdo en que las fases de Venus refutan el geocentrismo clásico, pero no en que confirman el heliocentrismo, pues el fenómeno observado es predicho también por su propia teoría geocéntrica mixta. Tycho no aceptaría en este caso C2 y defendería que por tanto la contrastación es inconcluyente a efectos confirinatorios. Además de lo relativo a C2, a los experimentos cruciales se aplican también las posibles estrategias elusivas basadas en el rechazo de SA y CI. Éste es el tipo de escapator i a ~en que piensa Hempel cuando niega la existencia de experimentos cruciales stricto sensu: "ni siquiera la más cuidadosa y amplia contrastación puede nunca refutar una de entre dos hipótesis y probar la otra; por tanto, estrictamente interpretados, los experimentos cruciales son imposibles en ciencia" (1966a, cap. 3 53). Pero a continuación matiza: "un experimento como el de Foucault L...] puede ser crucial en un sentido menos estricto, práctico: puede mostrar que una de entre dos teorias rivales es inadecuada en importantes aspectos, y puede proporcionar un fuerte apoyo a la teoría rival; y, en cuanto resultado, puede ejercer una influencia decisiva sobre el sesgo que tome la subsiguiente labor teórica y experimental" (ibid.). 5. Consideraciones finales
Hasta aquí hemos estudiado' la metodología de la contrastación de hipótesis. Otra cosa son las actitudes que se pueden tomar, que los científicos pueden tomar, frente a sus resultados. La aceptación de los resultados de la contrastación depende de muchos factores, entre otros, de la cantidad, la calidad y la variedad de las contrastaciones realizadas. Usualmente una sola contrastación no basta, pues siempre hay lugar para las casualidades. Por ello, como en el caso de Michelson y Morley, se suele considerar necesario repetirlas un número sujciente de veces (de nuevo los límites de esta suficiencia son pragmáticos y
difusos); repetirlas si la contrastación es experimental y se puede reproducir, o realizar otras análogas si no se pueden repetir mediante experimento. A veces, sin embargo, una contrastación se puede considerar suficiente si es de "extraordinaria calidad". La calidad de las contrastaciones depende de muchos factores, especialmente del rigor del diseño experimental y del grado de precisión de la predicción y lo inesperado de la misma. Por último, la variedad de las predicciones es también un valor fundamental. Recientemente unos investigadores de Harvard han afirmado encontrar evidencia empírica contra la hipótesis, hasta ahora generalmente aceptada, según la cual las mutaciones biológicas son procesos azarosos. Los principales resultados empíricos corresponden a unas pruebas realizadas sobre un tipo específico de bacterias. Algunos científicos han aconsejado prudencia hasta que no se comprueben resultados semejantes en otras bacterias o, mejor todavía, en otros organismos. Uno de los principales motivos de la rápida expansión y aceptación de la teoría newtoniana era la inmensa variedad de fenómenos a los que se aplicaba y con los que se podía contrastar. Estos factores que influyen en la aceptación o no de los resultados corresponden a características internas de las contrastaciones. Hay sin embargo otros factores tambiín influyentes que no tienen que ver directamente con el proceso mismo de contrastación sino con algunas cualidades de la hipótesis, principalmente la simplicidad, belleza e iiltegración teórica. La simplicidad parece ser un principio metodológico generalmente aceptado: si en todo lo demás son iguales, prefiérase la hipótesis más sencilla. Entre las ventajas de su sistzma, Copérnico aducía como una de las fundamentales su simplicidad en comparación con el monstruo en el que se había convenido el modelo geocéntrico de epiciclos y deferentes, aunque en este caso concreto se trató de una argucia propagandística, pues para que el sistema copemicano original funcionara había que complicarlo casi de igual modo. En el episodio de las fases de Venus, la evidencia empírica era contraria al geocentrismo tradicional, pero no inmediatamente favorable al heliocentrismo pues el sistema mixto de Tycho predecía lo mismo. Sin embargo casi nadie apostó por el sistema de Tycho por considerarlo innecesariamente más complicado (a pesar de que tenía algunas ventajas claras entonces, como por ejemplo la predicción de la ausencia de paralaje). Una de las cosas que convenció a Kepler de lo correcto de su hipótesis de las órbitas elípticas era la enorme simplificación del sistema heliocéntrico que permitía. La simplicidad está relacionada con otro de los factores que puede influir en la suerte de una hipótesis, su "belleza". La simplicidad es un valor a la vez epistémico y estético, además de ventajas de cálculo confiere a la hipótesis cierta belleza. Pero la simpIicidad no es el único valor estético; hay otros que, aunque más subjetivos y variables, pueden ser en ocasiones determinantes. Por último, otro valor fundamental es la posibilidad de integrar la hipótesis con otras hipótesis o teorías generales de1 mismo o diferente ámbito. A finales del siglo xrs se consideró que 13 integración de la teoría ondulatoria de la luz en el electromagnetismo de hIa't\vell proporcionaba a aquélla nueva fuerza. El principal motivo por el que, a pesar de no h3ber evidencia en favor, algunos físicos actuales defienden la existencia del gravitón (partícula que transmitiría la fuerza gravitatoria) es la posibilidad de unificar el tratamiento de las cuatro fuerzas fundamentales (electromagnética. nuclear débil, nuclear fuerte y gravitatoria).
Otros factores que influ~enen las actitudes que los científicos tonian ante las hipótesis tienen un carácter más social. En este caso, lo que se considera valioso de la hipótesis es su coherencia con determinadas creencias socialmente extendidas o con determinadas ideologías vinculadas con el poder político o económico (como el catolicismo en Europa hasta el siglo xvrr o el materialismo dialéctico en los países comunistas en el siglo XX). Para algunos teóricos de la ciencia actuaIes, los sociologistas radicaIes, estos factores sociales son los únicos realmente determinantes. En algunas ocasiones así lo parece, como en el actual resurgir de las biologías creacionistas en Estados Unidos. Pero en general son sólo elementos que se añaden a los factores anteriores más directamente determinantes. Sobre algunas de estas cuestiones volveremos en el capítulo dedicado a la evaluación de las teorías y el problema de la inducción.
Los conceptos son las unidades más básicas, y por ello mismo imprescindibles, de toda forma de conocimiento humano, y en especial del conocimiento científico. Podemos concordar con Kant en que la experiencia humana, si no pasara a través del tamiz de un sistema conceptual, sería "ciega", es decir, no nos permitiría comprender lo que experimentamos. Cuanto más articulado y complejo sea el sistema de conceptos que utilicemos para dar cuenta de una parcela determinada de nuestra experiencia, tanto más articulado y eficaz será también nuestro conocimiento de la realidad derivado de esa parcela. Esta correlación es especialmente válida para la forma de conocimiento que calificamos de "científica", y es por ello que el estudio de las formas en que se presentan los conceptos científicos tiene una importancia de primer orden para la filosofía de la ciencia. En este capítulo trataremos primero someramente de la cuestión de la naturaleza de los conceptos en general, para luego analizar los tres tipos principales de conceptos que pueden distinguirse en la articulación del conocimiento científíco: conceptos clasificatorios, conceptos comparativos y conceptos métricos. Estos últimos, los conceptos métricos, xracterísticos de las teorías cuantitativas, son sin duda los más útiles para la articulación y desarrollo del conocimiento científico. En este capítulo, sin embargo, nos limitaremos a una primera aproximación muy general a los mismos. En el capítulo dedicado específicamente a la medición (cap. 6) se tratarán con más detalle tanto su estructura como su función.
1. ;Qué es un concepto?
La naturaleza de los conceptos en general es una de las cuestiones más difíciles de la filosofía y de más amplia tradición, que se remonta por lo menos a Platón. Es una cuestión íntimamente ligada al llamado problema de los universales, y sobre la que ha habido, y continúa habiendo, un sinfín de controversias. Esta cuestión atañe a aspectos centrales tanto de la ontología como de la teoría general del conocimiento, estando involucrados prácticamente todos los grandes temas de la filosofía teórica. Puesto que en este
92
FUND.I\íEhTOS DE FILOSOF~ADE LA CIENCIA
libro no podemos entrar en los temas específicos de dichas ramas de la filosofía, soslayaremos en la medida de lo posible los aspectos estrictamente metafísicos y epistemológicos. y nos centraremos fundamentalmente en aspectos estructurales y metodológicos; en filosofía de la ciencia no interesa tanto la temática de los conceptos en general, cuanto el carácter específico de los conceptos científicos y sus diferentes formas. Por esta razón, tampoco pretenderemos aquí defender alguna posición determinada en la ontología y la epistemología de los conceptos, sino que nos limitaremos en este apartado a formular algunos supuestos, a modo de "hipótesis de trabajo", de los que partimos para nuestra tarea de analizar los diversos tipos de conceptos científicos. Las únicas posiciones filosóficas que rechazamos explícitamente son a ) un nominalismo extremo según el cual sencillamente no existen los conceptos o éstos no son sino expresiones verbales de los seres humanos, y b) la idea de que hay conocimiento "no conceptual"; esta última posición, incluso si fuese defendible de algún tipo de conocimiento, es claramente inadmisible en relación con el conocimiento científico.
Printer supuesto: Los conceptos son entidades, en principio identificables, a las que tienen acceso los seres humanos en tanto sujetos epistémicos y que les permiten a éstos conocer el mundo real y orientarse en él. La presencia de conceptos es condición necesaria de todo conocimiento, y en especial del conocimiento científico. Un sistema conceptual es uno de los dos constituyentes esenciales de todo sujeto epistémico, y muy en especial del sujeto de conocimiento científico (el otro es un sistema de órganos o instrumentos sensoriales que canalizan la experiencia). Aunque ya hemos dicho que aquí no podemos entrar en la discusión de qué son exactamente los conceptos como entidades, sí podemos decir que partimos del supuesto de que 120 son objetos elnpíricos, al modo por ejemplo de los objetos físicos o de los fenómenos psíquicos. Tentativamente, podríamos adscribirlos al "reino de los sentidos" del que habla Frege o al "tercer mundo" (junto al mundo físico y al psíquico) del que habla Popper, y que es característico del conocimiento objetivo del ser humano. Sin embargo, estas caracterizaciones deben quedar aquí al nivel de vagas metáforas. Baste señalar que asumimos que los conceptos no son entidades localizadas espaciotemporalmente como lo son los objetos físicos, ni tampoco acotadas temporalmente como lo son las entidades del mundo psíquico. En este sentido, podemos decir que los conceptos son entidades abstractas. Por el momento, 110necesitamos mayor precisión para lo que sigue. Seglrr~dosupuesto: Los sujetos epistémicos contraponemos en cierto modo un sistema de conceptos al "mundo real" que es su objeto. Naturalmente, éste no es el lugar para determinar lo que entendemos por "mundo real", cuestión que excede los presentes límites. Podemos contentamos con asumir que el mundo real ("externo") es todo aquello que no se identifica con el sujeto epistémico, y que este mundo está compuesto de diversas clases de objetos. La naturaleza exacta de estos objetos no es, en este contexto, una cuestión relevante. Nos limitamos a observar que por "mundo real" no ha de entenderse necesariamente s61o la totalidad de los objetos físicos ni mucho menos sólo la totalidad de los objetos detectables por nuestros sentidos. Cuáles
CONCEPTOS CIENT~FICOS
93
sean los "objetos reales" considerados dependerá, entre otras cosas, de convicciones ontológicas fundamentales que tampoco podemos discutir aquí. Si creemos que los puntos espaciales son reales, entonces el mundo real constará no sólo de cosas tales como astros, patos y moléculas, sino también de puntos espaciales; si creemos que los números son reales, entonces contendrá también números; si creemos que las formas geométricas, las estmcturas formales, las propiedades de los objetos físicos y las relaciones entre ellos son reales, entonces el mundo real también contendrá todas estas cosas, y así sucesivamente. Lo único que importa constatar aquí es que, sean cuales sean los objetos reales, si logramos conocerlos y reconocerlos es gracias, entre otras cosas, a los conceptos de que disponemos. Los conceptos nos permiten identificar, diferenciar, comparar, etc., los objetos de los que consta el mundo real. Ello ocurre fundamentalmente a través de una operación intelectual que llamamos subsunción. Por ella, diversos objetos quedan subsumidos bajo un mismo concepto; un concepto srlbsurne uno o varios objetos (en general muchos). Otro modo equivalente de decir que un concepto subsume un objeto es decir que el objeto cae bajo el concepto, o que el concepto se aplica al objeto. Por ejemplo, subsumimos diversos objetos de observación nocturna bajo el concepto astro, diversos objetos de nuestra indagación matemática bajo el concepto nlímero prirno, o diversas relaciones identificables bajo el concepto simetría. Podemos decir entonces, ante un objeto particular, que ese objeto cae bajo el concepto correspondiente: por ejemplo, que la Luna cae bajo el concepto de astro, que el 3 cae bajo el concepto de número primo y que la fraternidad cae bajo el concepto de relación simétrica. También podemos decir quz el concepto de astro se aplica a la Luna, el Sol, Mercurio, Venus, etc.; que el concepto de número primo se aplica a los números 1, 2, 3, 5, 7, 11, etc.; que el concepto de simetría se aplica a las relaciones de fraternidad, igualdad, semejanza, etc. Todo objeto cae bajo algún concepto. Incluso si admitimos la posibilidad de objetos por principio inaccesibles al sujeto epistémico y que por tanto no caen bajo ningún concepto usual, ellos serán subsumibles bajo el concepto objeto inaccesible al conocimiento humano. En cambio, hay muchos conceptos bien constituidos bajo los cuaIes es dudoso o probablemente falso que caiga algún objeto; por ejemplo, el concepto habitante del sol tiene perfecto sentido pero no subsume ningún objeto. A estos conceptos que no se aplican a ningún objeto se les suele denominar 'conceptos vacíos'. Los conceptos vacíos, cuando son usados con la pretensión de aplicarse de hecho a objetos, como el concepto flogisto, suponen un "acto epistémico fallido". Pero también pueden usarse para otros fines no epistémicos, como los artísticos, por ejemplo en la ficción literaria; en estos casos el concepto no tiene valor epistémico pero sí artístico. O también pueden usarse para fines estrictamente filosóficos, como cuando decimos que el concepto habitante del sol es vacío. Desde un punto de vista científico. en cualquier caso, los conceptos que interesan son aquellos que se usan con la pretensión de subsumir objetos realmente existentes, como los ccnceptos Jogisto y oxígeno, aunque el primero es vacío y el segundo no (o eso creemos hoy). Debe quedar claro que si en su día se consideró interesante científicamente el concepto de flogisto fue porque se consideraba (erróneamente) que se aplicaba a algo. Una vez se demuestra que no es ése el caso, el concepto deja de interesar a fines científi-
93
WND.4SlEI\TOS DE FILOSOF~ADE LA CIENCIA
cos. Por tanto, supondremos que los conceptos con los que nos las tenenos que haber aquí, los conceptos científicos, son conceptos (pretendidarnente) no vacíos. Esquemáticamente podemos representar la correlación entre los dos "mundos", el real y el conceptual, como se muestra en la figura 4.1.
SISTEMA CONCEPTUAL
-
de --.. aeirn
R
concepto de número primo
MUNDO REAL 3
17
101
objetos
Tercer supuesto: En el primer supuesto hemos establecido que los conceptos son, en cierto modo, entidades abstractas, no Iocalizables espaciotemporalmente y por tanto no identificable~con objetos físicos. De ello se sigue, entre otras cosas, que los conceptos no deben identificarse con palabras o en general expresiones de un lenguaje dado, las cuales son, a fin de cuentas, entidades físicas. Por ello tampoco debemos identificar la tarea del análisis conceptual con la de un análisis puramente lingüístico (como han querido algunos filósofos). Dicho esto, no obstante, también debemos advertir que hay una íntima conexión entre un sistema de conceptos y un sistema lingüístico, entre conceptos y palabras. La relación que existe entre ambos tipos de entidades es una relación semanticamente muy importante: la expresión. Las palabras, o en general los términos de un lenguaje, expresan conceptos. Y como no tenemos un acceso sensorial directo a los conceptos, pero sí a las palabras, es por ello que el análisis lingüístico a fin de cuentas sí puede resultar relevante para el análisis conceptual, en el sentido de que nos puede dar indicaciones acerca de la estructura conceptual subyacente al lenguaje. Las palabras nos remiten a los conceptos, nos permiten apresarlos y comunicarlos en la mayoría de los casos, aunque quizá no en todos, pues debemos admitir la posibilidad de conceptos inexpresables (o no bien expresables) mediante el repertorio de palabras existente en una lengua dada. Conviene notar que la
95
CONCEPTOS CIENT~FICOS
relación de expresibn es (idealmente) una función, esto es, un mismo término lingüístico (idealmente) sólo expresa un único concepto; en caso contrario estamos ante un fenómeno de ambigüedad lingüística en el que la misma entidad físico-lingüística encubre, por así decir, dos significantes diferentes (como 'banco' o 'gato' en castellano). Por otro lado, la conversa no es cierta: la expresión no es una función biunívoca, pues puede haber palabras diferentes que expresen el mismo concepto; esto es lo que ocurre con las expresiones sinónimas, tanto de diferentes lenguas como de una misma lengua (como 'burro' y 'asno' en castellano). Las expresiones lingüísticas de una lengua, sus términos, palabras o frases, son objetos reales en principio comparables a otros objetos empíricos como astros o gatos. Pertenecen también al mundo real. Pero la relación entre los términos del lenguaje y los conceptos que ellos expresan es muy distinta de la relación entre un objeto real y el concepto que lo subsume. Por ello conviene enriquecer el esquema anterior del siguiente modo. (La fig. 4.2 recoge el hecho de que diferentes términos pueden expresar un mismo concepto. Por otro lado, en tanto que objetos del mundo real, los términos mismos pueden ser subsumidos a su vez por otros conceptos, por ejemplo conceptos como térinino predicativo, término singular, adjetivo, etc. No incluimos este hecho en- el gráfico para no dificultar la visualización de los otros hechos que ahora queremos destacar.)
n conceptos
SISTEMA CONCEPTUAL
.. . .
.
expresión .-.' ./
MUNDO REAL
(
1' ''1
términos
subsunción
'A-
Naturalmente, no todos los componentes de una lengua dada son aptos para expresar conceptos. Por ejemplo, es muy dudoso que lo sean la mayoría de los llamados "términos sincategoremáticos" (artículos, preposiciones, etc.). También puede ocurrir que, aun cuando dos o más palabras expresen conceptos, su combinación (aunque sea gramaticalmente conecta) no exprese ningún concepto. Así, las palabras castellanas 'redondo' y 'triángulo' expresan ciertamente cada una un concepto, pero su combinación gramaticalmente correcta 'triángulo redondo' seguramente no expresa ninguno (de expresarlo sería un concepto necesariamente vacío). También se suele admitir (aunque esto es más discuti-
96
FL'SD.AI\lEI\TOS DE F I L O S O F ~DE ~ LA CIENCIA
ble) que los nombres propios o terminos singulares, como 'Marilyn Monroe' o 'la capital de España' no expresan conceptos. En el contexto de los lenguajes científicos, que es el que a nosotros nos interesa aquí, podemos partir de la observación de que prácticamente todos los términos no-sincategoremáticos introducidos expresan un concepto. Y estos términos tienen casi unánimemente una determinada forma Iógica: son predicados. Con ello pasamos a nuestro siguiente supuesto.
Cuarto supuesto: En los lenguajes científicos, los términos que expresan conceptos tienen (casi) siempre la forma Iógica de predicados n-ádicos, con 11 2 1. Los conceptos más simples serán aquellos expresables mediante predicados monádices (como luego veremos, éste es el caso de los conceptos clasificatorios); los conceptos más complejos se expresarán mediante relatores diádicos, triádicos, o incluso más complicados. En cualquier caso, dado que, en un contexto científico, las expresiones que más interesan son las predicativas, podemos aplicar todo el arsenal simbólico de la Iógica de predicados para formalizar las conexiones entre conceptos en nuestro sistema conceptual. Por ejemplo, la relación entre los conceptos hurnailo y mol-tal quedará fijada en la fórmula predicativa 'dx (Hx -+ hfx), donde ' H ' es la abrei~iacióndel predicado 'es hiclnaiio' y 'M' la de 'es mortal'. O bien podremos expresar la "verdad conceptual" de que, si una persona es progenitora de otra, la segunda no lo será de la primera, mediante la fórmula
vx, y (.x Py -+ 7 y Px), donde 'P' es la abreviación del predicado relaciona1 'es progenitor de'. .E Ahora bien, de las disciplinas formales no es sólo la Iógica de predicados la que contribuye decisivamente al análisis conceptual; otra rama de las ciencias formales muy útil a nuestros fines, sobre todo en un contexto científico, es la teoría de conjuntos. La razón de ello es que, para muchos fines del análisis conceptual, aunque no para todos, conviene sustituir el tratamiento de los conceptos mismos (o de los predicados que los expresan) por el de las exrensiones de los mismos, esto es, por el de los conjuntos de objetos que caen bajo cada concepto. Con eso llegamos a nuestro último supuesto, que es el que fundamenta este recurso a las extensiones en el análisis conceptual.
Qui~ttosupuesto: Existen conjuntos (en el sentido de la teoría estándar de conjuntos) y la extensión de un concepto cualquiera es un conjunto en ese sentido, el conjunto de 10s objetos que caen bajo él (o de los pares de objetos, si es binario; o de los tríos, etc.). Por supuesto, no todo conjunto es la extensión de un concepto; por ejemplo, el conjunto formado por Marilyn Monroe, el número 3 y el planeta Neptuno no es la extensión de ningún concepto, aunque, desde el punto de vista de la teoría de conjuntos,
es un conjunto tan bien formado como cualquier otro. Quizá seria más cauteloso decir sólo que conjuntos como ése no son la extensión de ningún concepto "razonable", pues en cierto sentido se podría defender que s í hay un concepto correspondiente. a saber, el concepto ser Marilyn Monroe o ser el nlí~nero3 o ser el planeta Neptuno. Es seguro que éste no e s un concepto "razonable", y es más que dudoso que se pueda considerar siquiera un concepto legítimo, más bien es algo así como "un conjunto disfrazado de concepto", o incluso "un mero predicado". Aclarar esta cuestión a fondo requiere un análisis del concepto de concepto en el que no podemos entrar aquí. En cualquier caso, consideraremos en general que tales supuestos conceptos son, cuando menos, "perversos". Cuando disponemos de conjuntos que sí son extensiones de conceptos dados, les podemos aplicar a ellos los principios y las operaciones de la teoría de conjuntos, y establecer o revelar así indirectamente determinadas conexiones entre los conceptos que tienen tales extensiones. Denotaremos en general la extensión de un concepto C mediante Así, por ejemplo, podemos reformular conjuntistamente la relación entre el el signo concepto de humano y el de mortal mediante sus extensiones:
'e'.
Y el enunciado sobre la asimetría de la relación de prozenie se convierte en:
Ahora bien, no siempre es adecuado sustituir la consideración directa de los conceptos por la consideración sobre sus extensiones. En general, si vale fi M, entonces una afirmación que incluye el predicado 'H'implica otra consistente en sustituir en la primera el predicado 'II' por el predicado 'M'. Por ejemplo, si es cierto que Luisa tropezó con un hombre, entonces tambiin es cierto que Luisa tropezó con un mortal. Pero no siempre ocurre así. Por ejemplo, si Judas cree que Jesús es hombre entonces, por mucho que siga valiendo de hecho fi c iG,puede no ser cierto que Judas crea que Jesús es mortal (el motivo, obviamente, es que Judas puede no creer que de hecho ocurra 9 c fi, o incluso creer que de hecho no ocurre). Los contextos o formas de discurso en los que no es legítima la, sustitución de las relaciones entre extensiones por las relaciones entre los correspondientes conceptos, son los denominados contestos o discursos irztensionnles, por oposición a los contextos e,rre~zsionales,en los que si vale tal sustitución; así, típicamente los contextos que incluyen operadores epistémicos (como 'creer') o modales (como 'posible' o 'necesario') son intensionales. Aunque muchas de las cuestiones metacientíficas son susceptibles de un andlisis puramente extensional, en algunos casos especialmente importantes, como en el análisis de la explicación o de las leyes, intervienen esencialmente fenómenos intensionales. Éste no es el caso, sin embargo, de nuestra actual finalidad, el anUlisis de la estructura lógica de los diversos tipos de conceptos científicos. Por tanto, en el resto de este capítulo adoptarelnos una perspectiva puramente e.rtensionalista, es decir, consideraremos siempre legítimo sustituir los conceptos por sus extensiones, con lo cual
tendremos siempre a nuestra disposición todo el instrumental de la teoría de conjuntos para llevar a cabo un análisis conceptual lo más sistemático y preciso posible. Desde esta perspectiva e~tensionalista,denominaremos 'representación' a la relación que se da entre un conjunto y el concepto del cual es extensión: si la extensión del concepto C es el conjunto t,diremos que representa a C. Nótese que esta relación no es una función, esto es, un mismo conjunto puede representar conceptos diferentes. El motivo es que puede haber diferentes conceptos con la misma extensión, que se aplican a los mismos objetos, por ejemplo los conceptos aniirml racional y bípedo irnplume. Pues bien, si admitimos la hipótesis ontológica de que los conjuntos son entidades reales (al menos tan reales como los números y las formas geométricas), entonces convendrá enriquecer nuestro esquema de la relación entre los conceptos y el mundo del siguiente modo. (La fig. 4.3 recoge el hecho de que diferentes conjuntos pueden representar un mismo concepto. Por otro lado, en tanto que objetos del mundo real, los conjuntos pueden a su vez ser subsurnidos por otros conceptos, por ejemplo conceptos como conjuntojnito, conjunto con inás de ocho elementos, conjunto infinito, etc. No incluimos este hecho en el gráfico para no dificultar la visualización de los otros hechos que ahora queremos destacar.)
n conceptos
SISTEMA CONCEPTUAL
MUNDO REAL UNIVERSO DE
LENGUAJE
objetos
En 10s apartados que siguen estableceremos una distinción tripartita entre tres grandes clases de conceptos científicos (y los correspondientes términos que los expresan), atendiendo a su estructura lógico-matemática característica, la cual, a su vez, refleja el diverso carácter y valor metodológico de cada una de estas clases de conceptos. La distinción en cuestión está conectada con el tradicional problema de distinguir entre un sistema conceptual cualitativo y uno cuantitativo para las ciencias, si bien, como veremos,
CONCEPTOS CIENT~FICOS
99
permite reformular esta cuestión de manera más exacta y matizada que la formulación tradicional. Es tos tres grandes tipos de conceptos son: los clasflcatorios, los cornpnrativos (o ropológicos) y los métricos. A los conceptos de los dos primeros tipos se les puede considerar "cualitritivos", mientras que 10s del último, los métricos, son "cuantitativos". Se ha discutido mucho sobre sus respectivas ventajas y desventajas, sobre si determinadas disciplinas deberían tender al uso de conceptos cualitativos o bien cuantitativos, etc. Sin pretender negar que en esta discusión se han señalado algunos aspectos que constituyen problemas genuinos de metodología, como veremos más adelante, antes de entrar a fondo en ella es conveniente hacer las siguientes aclaraciones. a) La distinción entre lo cualitativo y lo cuantitativo se ha tomado con frecuencia como una distinción fundamentalmente ontológica, cuando debería en realidad tomarse como una distinción epistemológica, basada ante todo en la estructura conceptual con la que nosotros conceptualizamos la realidad. A veces se afirma que hay propiedades o fenómenos del mundo real que son en sí mismos cualitativos y otros que son en sí mismos cuantitativos; es decir, se supone que la realidad es en ciertas partes cualitativa y en otras cuantitativa, y que nuestro uso de conceptos cualitativos o cuantitativos depende del tipo de realidad que estemos investigando, por lo que no podemos o no debemos aplicar conceptos cuantitativos a una parte cualitativa de la realidad, o a la inversa. TambiSn es frecuente que se haga una división entre disciplinas científicas según que estudien aspectos cuantitativos o bien cualitativos de la realidad; por ejemplo, se suele decir que la física es una ciencia que estudia los aspectos cuantitativos, mientras que las ciencias sociales estudiarían aspectos puramente cualitativos, que por su misma naturaleza no pueden ser tratados cuantitativamente. Todo esto son confusiones derivadas de la confusión básica entre el plano ontológico y el epistemológico. Ni el mundo globalmente considerado, ni ninguna parcela del mismo es en sí misma cualitativa o cuantitativa. Carece de sentido decir que un fenómeno o proceso real es en sí mismo cualitativo o cuantitativo. No es la realidad misma o un fenómeno particular lo que es cualitativo o cuantitativo, sino el modo como lo describimos, es decir, el aparato conceptual que utilizanlos para aprehenderlo. Depende esencialmente del sujeto epistimico, y no de la realidad misma, sea ésta lo que sea, el que usemos conceptos de una u otra clase para subsumirla bajo elIos. A veces es más provechoso, o más sencillo, usar un tipo de conceptos que otro tipo. El dominio de experiencia de que se trate no es lo que decide por sí solo esta cuestión, aunque es cierto que hay aspectos de la realidad que, al menos de momento, "no se dejan" conceptualizar cuantitativamente de modo interesante (sobre esto volveremos en la sección final del capítulo 6 dedicado a la medición). b) A veces se otorga una prioridad absoluta a los conceptos cuantitativos frente a los cualitativos, e incluso se piensa que una disciplina cualquiera no es realmente científica mientras no use conceptos cuantitativos. Y en este contexto se suele seguir, consciente o inconscientemente, la idea kantiana de que en una disciplina hay tanta ciencia como matemáticas hay, con lo cual, además, se suele identificar el nivel de matematización de una disciplina con su nivel de cuantificación. Y, en consecuencia. I
n~uchosinvestigadores de áreas aún poco desarrolladas, especialmente en las ciencias sociales, tratan de introducir conceptos cuantitativos aun cuando ello sea a veces muy forzado. Hay, en esta tendencia o actitud, por lo menos dos confusiones que conviene aclarar. En primer lugar, es cierto que una disciplina científica se desarrollará tanto más rápida y eficientemente cuanto más claros y exactos sean sus conceptos y más rigurosa su construcción, y ello implica en muchos casos la necesidad o la conveniencia de utilizar un lenguaje matemático. Pero matematizar no es equivalente a usar conceptos cuantitativos. Hay muchas ramas de las matemáticas, desde la topología hasta la teoría de grafos pasando por la teoría de grupos, que pueden ser útiles a las ciencias empíricas (y que de hecho ya han sido aplicadas con éxito en algunas áreas) y que sin embargo no presuponen conceptos cuantitativos. Estos últimos son, como veremos, una forma muy especial de construcciones matemáticas. En segundo lugar, la introducción de conceptos cuantitativos no es la panacea que promueve automáticamente el desarrollo de una teoría. Ni siquiera son siempre necesarios. Hay muchos ejemplos de uso de conceptos cuantitativos en las ciencias sociales que no han aportado el desarrollo esperado. Y hay casos, como el de la taxonomía clásica en biología, que han significado grandes avances en el conocimiento científico sin que en ellos se haya hecho uso de conceptos cuantitatison los más útiles vos. En conclusión, si bien es cierto que los conceptos cuantitati~~os para el desarrollo rápido de la ciencia (por razones que veremos más adelante), hay que juzgar con cautela y de modo pragmático en esta cuestión, y no rechazar dogmáticamente una disciplina como no-científica por el simple hecho de que no aparezcan conceptos cuantitativos en ella. Tras estas consideraciones podemos iniciar ya el estudio de cada uno de los diferentes tipos de conceptos. Como se verá, hay relaciones de correspondencia muy estrechas entre ellos. Aunque en sentido estricto no podemos decir que un concepto métrico es también un concepto comparativo, o que uno comparativo es también clasificatorio, sí hay un sentido más lato en que ello es cierto: cada concepto métrico se corresponde con un concepto comparativo, y cada concepto comparativo con uno clasificatorio. Así, un mismo concepto en términos intuitivos, como por ejemplo rttasa, se puede reconstruir metateóricamente como un concepto clasificatorio, como uno comparativo o como uno métrico. En este sentido el concepto de masa es a la i-ez de los tres tipos. Veremos que ello no siempre es posible: aunque a todo concepto métrico le corresponde otro comparativo y a todo comparativo uno clasificatorio, las conversas no son ciertas, hay conceptos comparati\~osa los que no corresponde ninguno métrico, y conceptos clasificatorios a los que no les corresponde ninguno comparativo. Así pues, los conceptos métricos son los más fuertes, después vienen los comparativos y por último los clasificatorios. Empezaremos nuestro análisis por estos últimos, los más débiles, y después iremos progresando en fuerza expresilva (como fuente histórica, el trabajo clásico es Hempel, 1952).
2. Conceptos clasificatorios
Los conceptos clasificatorios son los usados más comúnmente en la vida cotidiana. Son los primeros que se aprenden. La gran mayoría de conceptos que emplea un niño son herramientas para subsurnir los objetos que lo rodean de acuerdo a ciertos criterios vagamente especificados, generalmente basados en ejemplos y relaciones de analogía. Así es como el niño aprende a usar conceptos clasificatorios de color (rojo, azul, etc.), conceptos clasificatorios de f o m a (redondo, cuadrado, etc.), conceptos clasificatorios de temperatura (caliente, tibio, frío), de animales y plantas (perro, águila, pájaro, árbol), de sustancias (oro, agua), de objetos de uso (mesa, plato, martillo) y muchos otros. Este enorme acervo de conceptos sigue siendo usado por el adulto en las situaciones normales de su vida cotidiana, y sólo es en contextos especiales, particularmente los científicos, cuando se nota la insuficiencia de los conceptos clasificatorios y hay que pasar a otro tipo de conceptos. Clasificar es la manera más simple y directa de subsumir múltiples y diversos objetos bajo un mismo concepto y aprehender rasgos interesantes del mundo que nos rodea, y en una amplia variedad de situaciones nos basta con ello para dar cuenta de las cosas y transmitir información. Desde el punto de vista de su forma lógica, los términos que expresan conceptos clasificatorios son muy simples: son predicados monádicos. Desde el punto de vista conjuntista, la extensión de un concepto clasificatorio es un conjunto simple, sin estructura interna. La idea básica que se halla tras estos conceptos es la de clasificación. Clasificar cierto dominio de objetos no es más que a;mparlos en grupos disjuntos, ninguno de ellos vacío, y tales que entre todos los grupos estén todos los objetos del dominio en cuestión. Una clasificación de un dominio es simplemente, en términos conjuntistas, una partición del mismo. Pues bien, si dicha partición se realiza mediante criterios sistemáticos, entonces es preciso recurrir a ciertos conceptos, a una colección de conceptos que den los criterios de agrupación. Estos son los conceptos clasificatorios, elementos de un sistema conceptual que conjuntamente generan una partición del dominio de aplicación. La siguiente definición semiformal expresa esta idea.
-7
-
-
-
-
-
Definición 4.1 : Un concepto C es un concepto clasificatorio para el dominio (no-vacío) de objetos D si y sólo si pertenece a un sistema de conceptos {ei,..., C,),con n 2 2, que cumple las dos siguientes condiciones: (1) Los objetos de D se subsumen bajo cada C, (1 Ii 5 n) de acuerdo a criterios sistemáticos. (2) Las extensiones de cada Ci (1 5 i I n) constituyen, tomadas en su conjunto, una partición de D. Muchas pretendidas clasificaciones violan claramente los dos requisitos mencionados. Un caso extremo y divertido, pero además interesante porque revela de manera insuperable el modo como no debe .hacerse una clasificación, es la supuesta "enciclopedia china"
-
102
~
-
RIND.4SIEh'KlS DE FILOSOF~ADE L.4 CIENCIA
que Jorge Luis Borges nos presenta en su relato El idiorna atzalírico de Johii li'ilkirzs, según la cual "los animales se dividen en: a) pertenecientes al Emperador, b) emkalsamados, c) amaestrados, 4 lechones, e) sirenas, f) fabulosos, g) perros sueltos, h ) incluidos en esta clasificación, i) que se agitan como locos, j) innumerables, k) dibujados con un pincel finísimo de pelo de camello, T ) etcétera, m) que acaban de romper el jarrón, n) que de lejos parecen moscas".' Es obvio que esta pretendida clasificación no cumple con los dos requisitos arriba mencionados ni siquiera de manera aproximada. En efecto, no se puede detectar en absoluto ningún criterio siguiendo el cual se haya construido esta clasificación de los animales de modo sistemático, sino que es patente la absoluta arbitrariedad de la caracterización de los diversos grupos; por otro lado, las condiciones formales de una partición tampoco se cumplen, ya que hay clases vacías (como las categorías e ) y f)), animales que pueden pertenecer a dos clases distintas (por ejemplo, que pertenezcan a a) y b) a la vez) o a ninguna de las mencionadas (en realidad, la mayoría de los animales). Naturalmente, ningún científico en su sano juicio propondría en serio una clasificación como la de la "enciclopedia china" de Borges. Sin embargo, en muchas clasificaciones que se proponen en contextos científicos, si las analizamos con cuidado, encontraremos disonancias como las ejemplificadas jocosamente por Borges, aunque naturalmente mucho menos obvias. Así, es frecuente que haya disputas entre los propios científicos sobre el criterio o los criterios que haya que seguir para construir la clasificación sistemáticamente; y en cuanto a su carácter de partición, suelen admitirse más o menos veladamente y de mala gana algunas "excepciones". No se trata de negar, por supuesto, el valor que puedan tener en un momento dado del desarrollo de una disciplina clasificaciones que no cumplan exactamente con los requisitos mencionados; pero la comunidad científica debe ser consciente del carácter provisional de una clasificación no plenamente satisfactoria y ello debe servir de estímulo para buscar mejores métodos de construcción de clasificaciones. Dado que fijar una partición sobre un dominio es lo mismo que determinar cierta relación de equivalencia que "induzca" la partición, en vez de proceder directamente a definir cada una de las clases que supuestamente van a constituir la clasificación, en muchos casos lo más expedito y controlable es determinar primero en general una relación empírica (atendiendo a criterios empíricamente controlables y sistemáticos) entre los objetos del dominio que queremos clasificar, de la cual suponemos o comprobamos que es una relación de equivalencia. Si logramos identificar una relación con tales características, ya habremos dado el paso esencial, puesto que una relación así nos inducirá automáticamente una partición perfecta sobre el dominio estudiado. Y, además, no sólo obtendremos la partición deseada, sino que ésta habrá sido establecida a través de un criterio sistemático, universal, que es el. determinado por las condiciones empíricas expresadas por la misma relación de equivalencia; Veamos algunos ejemplos. Después de una larga historia de intentos de clasificar los cuerpos en sustancias por sus diversas propiedades químicas, actualmente disponemos de una relación de equivalencia, apoyada en condiciones empíricamente controlables, que determina la partición 1. Cf. J. L. Borges: Obras completas, Emecé, Buenos Aires, 1974. p. 708.
de cierto dominio de cuerpos en verdaderas clases de equivalencia que son lo que llamamos "elementos químicos". La relación de equivalencia en cuestión es la de igualdad en el número de protones en los átomos respectivos; más precisamente, la relación RE que buscamos entre cuerpos puede definirse así: "Dados dos cuerpos, x, y: x R E y de protones que los átomos de y."
SYSS
los átomos de x tienen el mismo número
Obviamente, ésta es una relación de equivalencia. Las condiciones empíricas para establecer esta relación las proporciona la física atómica. Está claro que esta clasificación no agota todos los cuerpos existentes en la Naturaleza; pero dentro del ámbito relativamente restringido de los cuerpos que son sustancias puras no ulteriormente disociables en sustancias químicamente distintas, la división en elementos es una buena partición. Otro ejemplo es el siguiente. Desde los principios de la rama de la lingüística que conocemos como 'fonología', hubo interés en segmentar el discurso hablado en unidades mínimas de significación, es decir sonidos constituyentes de una palabra que no pudieran modificarse sin que un hablante normal de la lengua en cuestión sintiera que se ha cambiado de palabra. De tales sonidos se dice que poseen un "valor distintivo". Así, el sonido castellano "11" tiene el mismo valor distintivo que "y", porque en el discurso hablado no se distingue la palabra "halla" de "haya" (a pesar de que puede haber ciertas diferencias dialectales o hasta individuales en la forma como se pronuncian dichos sonidos). En cambio, "11" tiene diferente valor distintivo que "i", pues si en la palabra "olla" sustituimos la "11" por "I", obtenemos "ola", que todo hispanohablante reconocerá como una palabra de significado distinto. A las clases de equivalencia de sonidos que tienen el mismo valor distintivo se las llama "fonemas". Y la relación de equivalencia RF que da lugar a la partición en fonemas podríamos definirla así: "Para dos sonidos cualesquiera x, y: .u R f y syss el valor distintivo de x es el mismo que el de y para un hablante normal."
i
1
r
Ésta es una relación que se puede determinar y controlar por métodos empíricos de carácter general (fonéticos, estadísticos), y el hecho de que sea o no efectivamente una relación de equivalencia (en particular, de que sea transitiva) es una cuestión empírica, pero que parece bastante bien confirmada. La historia que está detrás de estos dos ejemplos, y de muchos otros que podríamos mencionar, así como los problemas empíricos y teóricos que suscita el establecimiento y control de las relaciones de equivalencia en cuestión, muestran que no es fácil fijar de una vez por todas cuál de varias relaciones de equivalencia que se presentan como posibles en un dominio dado es efectivamente el candidato más adecuado para obtener la clasificación que tenemos en mente. El proceso de selección de la relación de equivalencia adecuada es a veces un proceso muy largo y costoso, para el que ni siquiera está claro que se haya llegado a una conclusión satisfactoria. Este proceso puede incluso llegar a formar parte de los esfuerzos centrales de una disciplina. Un buen ejemplo de ello es el caso de la
-
--
-
-
-
-
-
-
101
FL.SD.\IlE?,"OS
DE F I L O S O F ~DE LZ : CIENCIA
!
taxonomía biológica, en particular de la clasificación de los organismos en especies. En un princjpio, el criterio básico de clasificación de los organismos fueron sus diversas caractensticas morfológicas. Sin embargo, con el progreso de los estudios comparativos y los análisis de detalle, pronto se vio que en muchas ocasiones es difícil decidir cuáles de las características morfológicas deben ser consideradas como las esenciales a una especie, o bien la decisjón se tomaba de manera arbitraria (es decir, no sistemática). Por ello se buscó un mejor método de clasificación, basado en el criterio universal de la capacidad reproductiva. Así, en los Prirtcipios de :oología sistemática de Ernst Mayr encontramos que una especie se define como "un grupo de [organismos de] una población natural que se aparean actual o potencialmente, y que están reproductivamente aislados de otros grupos semejantes". Tratemos de fijar más precisamente la relación de equivalencia que subyace a esta partición de los organismos en especies. La relación podría definirse así en primera instancia: "Dados dos organismos cualesquiera s,y: x pertenece a la misma especie que y syss x puede aparearse reproductivamente con y bajo condiciones normales." En una elucidación más rigurosa hay que tomar en cuenta el hecho banal de que x e y pueden tener el mismo sexo o incluso ser el mismo organismo. Si usamos 'S' como abreviatura notacional de 'pertenece a la misma especie que', y 'A' como abreviatura de 'es apareable reproductivamente con', entonces podremos definir la relación que buscamos de la siguiente manera:
Admitiendo que el aparearse reproductivamente es una relación simétrica, es fácil ver que la relación así definida es una relación de equivalencia (dejamos la prueba de ello al lector como ejercicio). Ahora bien, si pretendemos aplicar esta relación universalmente nos enfrentaremos a problen~asdifíciles de resolver en algunos casos concretos. A veces será difícil decidir cuáles son las "condiciones normales" que deben darse para que se posibilite un apareamiento reproductivo; asimismo, está claro que el criterio no es aplicable a los organismos asexuados, y sin embargo, también queremos clasificar éstos en especies; finalmente, la existencia de híbridos también nos puede provocar algún problema. En consecuencia, si bien la propuesta de una relación de equivalencia para los organismos basada en el criterio de apareamiento reproductivo es muy útil en una gran mayoría de casos, todavía no es perfecta, dado que habrá casos en que su aplicación será dudosa cuando no imposible. En particular, el requisito de partición no siempre quedará satisfecho, ya sea porque no se agota el dominio entero de los organismos (los asexuados quedan fuera), o bien porque algunos organismos (los que son capaces de engendrar híbridos) pertenecerán a dos clases distintas. En el primer caso se viola la condición de exhaustividad y en el segundo la de mutua exclusión. Por todo ello, los biólogos han tratado de desarrollar un criterio de especie que sea más general y confiable que el criterio reproductivo y que no dé lugar a
j1 8
3 {
i
3
1
:
!
? i
CONCEPTOSCIENT~FICOS
: t
1 O5
excepciones y traslapes; ello se ha intentado a través de nociones genéticas. Sin embargo, también aquí han surgido problemas en los ÚItimos años, sobre todo con el auge de la ingeniería genética, que parece haber afectado seriamente la idea misma de especie, al menos a nivel de los microorganismos. Hemos considerado este ejemplo con cierto detenimiento porque es bastante típico de la clase de problemas que puede enfrentar el intento de una clasificación científica, y al mismo tiempo del papel que juega el esfuerzo por aproximarse a las condiciones ideales de una clasificación para el progreso de una disciplina. Ambos requisitos estipulados, y especialmente el de partición, constituyen un ideal hacia el cual tienden o se aproximan las clasificaciones científicas. Su papel es estimular la investigación, a veces a un nivel muy profundo, para dar con clasificaciones mejores que las presentes, cuando éstas no cumplen exactamente los requisitos mencionados. Los principales problemas metodológicos que pueden surgir al intentar una clasificación científica de cierto dominio son los siguientes. En primer lugar, los criterios sistemáticos que haya que seguir para establecer la relación de equivalencia necesaria pueden no estar claramente formulados o ser muy difíciles de aplicar en la práctica; además, puede no haber consenso entre los especialistas acerca de cuál de entre vanos criterios posibles es el más adecuado. En segundo lugar, las dos condiciones necesarias para obtener una verdadera partición pueden encontrar "excepciones", es decir, la relación que subyace a la partición puede no ser exactamente una relación de equivalencia, sino sólo serlo de manera aproximada: pueden encontrarse objetos del dominio que no han sido "cubiertos" por ninsuna clase de la partición, o bien otros objetos que pertenecen a la vez a dos clases distintas. Hay, naturalmente, un cierto margen de tolerancia para tales excepciones. Si no son muy numerosas, o sistemáticas, puede que la clasificación se acepte tal como está ... hasta nuevo aviso. Además de los dos requisitos postulados para toda buena clasificación (el de sistematicidad y ei de generar una partición), pueden tomarse en consideración otras características posibles de las clasificaciones que, si bien no son necesarias, pueden resultar convenientes en un área dada. Entre estas condiciones adicionales que se pueden requerir de una clasificación está, en primer Iugar, la de que el número de clases de equivalencia de que conste la partición no sea demasiado reducido para nuestros propósitos. En general, cuanto mayor sea el número de clases de equivalencia obtenida en la partición, tanto mejor pues tanto mayor será la capacidad de discriminación de la clasificación propuesta; aunque, claro está, este número tampoco debe ser tan grande que haga que la clasificación resulte impracticable. Las clasificaciones más pobres desde el punto de vista de su poder discriminatorio son las dicotómicas, que constan sólo de dos clases de equivalencia. Y, dentro de las dicotomías, las menos útiles son las que resultan simplemente de afirmar o negar una determinada propiedad de los objetos de un dominio. Por ejemplo, si dividimos los habitantes de un país entre los que poseen un título universitario Y los que no lo poseen, aunque ésta es una clasificación que satisface perfectamente los dos requisitos fundamentales, sin embargo no es un tipo de clasificación que nos sirva de gran cosa desde un punto de vista científico. Más interesantes son las dicotomías basadas en dos propiedades lógicamente independientes, pero que empíricamente resulta que ago-
FlJh'D..ZhlEhTOS DE FILOSOF~ADE LA CIENCIA
106
tan entre ambas el dominio que se considera. Piénsese, por ejemplo, en el valor que tiene para la biología la división de los organismos sexuados entre machos y hembras (que no hay que confundir con una posible división, mucho menos interesante, que se hiciera entre hembras y no-hembras, pongamos por caso). Como regla general, sin embargo, las dicotomías son poco interesantes desde un punto de vista científico (si bien son muy frecuentes en nuestra irida cotidiana como un modo "rápido" de enfrentarnos al mundo que nos rodea: divisiones como las que se establecen entre "buenos" y "malos", "amigos" y "enemigos", "ricos" y "pobres", etc.). Cuando sobre un mismo dominio se han establecido dos diferentes clasificaciones, cuyas particiones correspondientes P, y P2 cumplen lo siguiente:
es decir, intuitivamente, que las clases de equivalencia de que consta la partición P ison "subdivisiones" de las de Pz (y por tanto P, tiene un mayor número de clases que P2), entonces diremos que la clasificación correspondiente a Pies másfina que la clasificación correspondiente a P2. Está claro que, dadas dos clasificaciones del mismo dominio, tales que una sea más fina que la otra, preferiremos adoptar la más fina, pues nos proporciona mayor poder de discriminación. Las clasificaciones más útiles son las que forman parte de jerarquías taxonómicas o, como también se las llama, árboles clasificatorios. Se trata de árboles, o "pirámides" resultantes de la sucesiva superposición de clasificaciones de tal manera que en cada nivel de la pirámide tenemos una clasificación más fina que en el nivel anterior. Un ejemplo sencillo de una pirámide taxonómica lo encontramos en la clasificación de los cuerpos desde el punto de vista químico: Cuerpos
homogéneos
soluciones
heterogeneos
sustancias
elementos
compuestos
Ésta es una clasificación muy simple porque procede por sucesivas dicotomías (aunque esto no le quita su valor). Jerarquías taxonómicas mucho más complicadas las encontramos en biología, donde han jugado un enorme papel en la investigación. Un segmento de una de esas jerarquías es el siguiente:
Animales
protozoos
poriferos
celenterados
equinodermos
verrnes
artrópodos
moluscos
vertebrados
mamiferos aves
protocordados
reptiles anfibios peces
Otra jerarquía zoológica mucho más refinada consiste en la siguiente piramide: Animales
protozoos
metazoos
mesozoos
parazoos
eurnetazoos
celenterados
bilateralios
gastroneuralios archicelorados notoneuralios
cordados
tumicados
acranios
vertebrados
agnatos
gnatótornos
peces
tetr8podos
anfibios
reptiles aves
cordados
mamíferos
Cada uno de los rótulos representa una clase de equivalencia de una partición de los animales a cierto nivel. Las clasificaciones son cada vez más finas de arriba abajo. Naturalmente que estos esquemas representan sólo una pequeña parte de la pirámide total de la clasificación de los animales. Cuando las clases de equivalencia de una partición forman parte de una pirámide o jerarquía taxonómica se las suele denominar 'taxones'. En estos ejemplos, cordado, i'ertebrado y tnarnijcero son tres distintos taxones de clasificaciones sucesivamente mas finas en las jerarquías respectivas.
3. Conceptos comparativos Desde un punto de vista metodológico, los conceptos comparativos constituyen una categoría intermedia entre los conceptos clasificatorios y los métricos o cuantitativos. Históricamente, ha ocurrido con frecuencia que los conceptos comparativos han sido la antesala de los conceptos cuantitativos que se han introducido posteriormente. Ello sugiere que, cuando una rama de la ciencia aún no ha alcanzado una fase de su desarrollo que le permita la introducción sistemática y adecuada de conceptos métricos, no por ello hay que creer que está limitada al uso de conceptos clasificatonos, sino que posiblemente se halle en capacidad de hacer uso de conceptos comparativos. Los conceptos comparativos, si se definen adecuadamente, son mucho más potentes que los conceptos clasificatorios que les corresponden, puesto que no sólo nos permiten clasificar un dominio dado, sino que además permiten ordenarlo. A cada concepto comparativo genuino se le asocia invariablemente un conjunto de conceptos clasificatorios, de modo que puede decirse que el primero implica los segundos; pero implica algo más: un ordenamiento de los objetos subsumidos bajo él. Los conceptos comparativos fueron muy usuales en los estadios iniciales de la física; por ejemplo, los conceptos de peso y calor se usaron sistemáticamente como conceptos comparativos antes de que se pudieran manejar apropiadamente como conceptos cuantitativos en sentido genuino. Asimismo, los conceptos comparativos son todavía muy útiles en otras áreas de la ciencia: en psicología (por ejemplo, los conceptos de inteligencia, introversión, neuroticidad), en biología (el concepto de adaptación y otras nociones de la teoría de la evolución), en geología (el concepto de dureza, por ejemplo), en química clásica(e1 concepto de acidez). Desde un punto de vista lógico, los conceptos comparativos son de carácter relacional; o, dicho más rigurosamente, los términos que expresan conceptos comparativos están constituidos lógicamente hablando por dos predicados diádicos estrechamente interconectados: uno 'K' que denota una relación de coincidencia o equivalencia en cierto respecto, y otro 'P'que denota una relación de precedencia. Ambas relaciones deben estar definidas, naturalmente, sobre el mismo dominio de objetos empíricos. La primera relación es 1a.que nos permite clasificar ese dominio y la segunda (junto con la primera) ordenarlo. La idea es que 'XKJJ'significa "x es tan ... como y", o "x es equivalente en ... a y" (p.ej., x es tan duro como y, o x es equivalente en dureza a y); y 'xPy' significa "x es más ... que y", o ''x precede en ... a y" (p.ej., x es más duro que y, o x precede en dureza
a y). Se pueden presentar las cosas de modo equivalente mediante una única relación de orden R. cuya interpretación pretendida es que 'xRy' significa "x es tan o más ... que y" (p.ej. x es tan o más duro que y). Ambas presentaciones son equivalentes: si utilizamos la primera, podemos definir 'xRy' como 'xKy o xPy' (R es "la unión" de K y P);si utilizamos la segunda, podemos definir 'xKy' como 'xRy y y k ' y 'xPy' como 'xRy y no y&'. Aquí vamos a seguir la primera versión pues es más intuitiva, y notacionalmente más cómoda, para introducir los conceptos comparativos; en otros lugares, donde interese especialmente la conexión entre conceptos comparativos y conceptos métricos, será más conveniente utilizar la segunda (cf. próxima sección y el capítulo 6). Para que el concepto que lleva asociadas las relaciones K y P sea un concepto comparativo, estas relaciones deben satisfacer ciertas condiciones específicas, tanto cada una por separado como conjuntamente. La idea es entonces que C es un concepto comparativo -si su extensión es la unión de dichas relaciones. Las condiciones en cuestión son, utilizando de nuevo el instrumental de la teoría de conjuntos, las que establece la siguiente definición. Definición 4.2:
Un concepto relaciona1 C es un concepto comparativo para el dominio (no-vacío) de objetos D si y sólo si existen dos relaciones K y P sobre dicho dominio tales que la extensión de C es K u P y se cumplen además las siguientes condiciones:
(1) (2) (3) (4) (5)
DomK=RecK=DomP=RecP=D. K es reflexiva, simétrica y transitiva, e.e., una relación de equivalencia. P es transitiva. K y P son mutuamente excluyentes: V.r, y E D (.rKy + -I xPy). K y P son conjuntamente conexas: V,x, y E D (xKy v xPy v yPx).
Está claro que, por el carácter que tiene K de relación de equivalencia, induce una partición en clases de equivalencia del dominio D y por lo tanto una clasificación de dicho dominio. Por su parte, la relación P cumple la función de ordenar el dominio, puesto que es una relación d e orden, esto es, es al menos asimétrica y transitiva. Que es transitiva es inmediato por (3). Para ver que es asimétrica supongamos, por reducción al absurdo, que no lo es, e.e., que hay x, y tales que xPy y yPx. Puesto que es transitiva, obtenemos xPx. Por otro lado sabemos que xKx pues K es reflexiva. Pero las dos cosas, xPx y xKx, no pueden ocumr, pues por (4) K y P son excluyentes. Por tanto, si xPy entonces no yPx (QED). Además de las condiciones formales generales establecidas en la definición, el concepto comparativo debe satisfacer determinadas condiciones materiales u operacionales; su extensión no se puede determinar de modo puramente formal, se debe determinar de modo sistemático pero "operacional": las relaciones K y P no pueden ser escogidas de una manera puramente formal, sino que deben ir asociadas a ciertas operaciones o situaciones empíricamente controlables, las cuales permitan decidir si se dan o no dichas
relaciones en un dominio de objetos. A veces, esto se determina a partir de alguna teoría empírica general ya aceptada, pero en otras ocasiones, especialmente en áreas relativamente elementales o en fases iniciales de una disciplina, la validez empírica de tales relaciones puede establecerse a partir de operaciones sencillas de laboratorio junto con ciertas hipótesis bastante elementales, de bajo nivel teórico. Veamos un ejemplo de esta última situación. Consideremas el concepto peso antes de que fuera metrizado, o incluso en situaciones actuales en las que no es necesario presuponer que disponemos del concepto métrico de peso, sino sólo de su correlato comparativo. En realidad, desde el punto de vista de la física teórica, lo que vamos a considerar a continuación es el concepto masa, pero a efectos de la discusión presente podemos asumir que estamos tratando del concepto más cotidiano de peso, tal como se aplica, por ejemplo, en los mercados. Pues bien, para determinar operacionalmente este concepto debemos asociar a operaciones empíricamente controlables la noción comparativa de peso; esto es, debemos dar un sentido operacional a la relación Kp de coincidencia de pesos y a la relación P, de precedencia de pesos. Esto se puede hacer mediante el uso de una balanza de brazos iguales. Compararemos el peso de dos objetos x, y del dominio considerado (objetos macroscópicos no demasiado grandes ni demasiado pequeños) colocándolos cada uno en uno de los dos platillos de la balanza. Entonces, determinaremos operacionalmente las relaciones Kp y Pp de la siguiente manera: a ) si los platillos de la balanza permanecen ambos a la misma altura, diremos que x pesa igual que y, xKy; b) si la balanza desciende del lado del platillo con x, diremos que x pesa más que y, xPy (por otro lado, cuando x = y, convenimos en que en tal caso también xKy). Es fácil comprobar que las relaciones Kp y Ppasí determinadas operacionalmente mediante operaciones con una balanza cumplen las condiciones de un concepto comparatiyo. En efecto, la relación "ser tan pesado como", determinada del modo indicado (nivelación de platillos de la balanza) cumple con los requisitos de reflexividad (por convención), simetría (da igual si cambiamos de platillo los objetos, éstos seguirán estando al mismo nivel si lo estaban antes) y transitividad (si el objeto x permanece al mismo nivel que el objeto y y luego vemos que el objeto y permanece al mismo nivel que el objeto z, podemos comprobar que el objeto x también permanecerá al mismo nivel que el objeto 2). Con ello queda garantizado que la relación Kp, al menos dentro de los límites de este modo de aplicarla empíricamente, es una relación de equivalencia. Análogamente es fácil comprobar que la relación "ser más pesado que", así determinada (diferencia de nivel de los platillos), es transitiva (si el platillo con y está más bajo que el platillo con x, y luego el platillo con z está más bajo que el platillo con y, también el platillo con z estará más bajo que el platillo con x). Igualmente fácil es comprobar que ambas relaciones son mutuamente excluyentes y conjuntamente conexas (dejamos la constatación de estos dos últimos casos al lector). Es ifnportante señalar que el hecho de que podamos asociar (no "definir") las nociones de coincidencia y precedencia de peso a operaciones empíricas con una balanza de la manera indicada, garantizando que se cumplan las condiciones de definición de los conceptos comparativos, es un resultado empírico, apoyado en ciertas hipótesis empíricas
t
l
1
f
1
1
acerca del comportamiento de una balanza, y no un asunto de mera convención. Solamente la reflexividad de K, y la mutua exclusión de Kp y Pp se derivan analíticamente d e convenciones o del uso normal de nuestro lenguaje. La satisfacción de los demás requisitos es, en cambio, un asunto empírico, lo cual se constata en e1 hecho de que podríamos imaginamos situaciones en que no se satisficieran. Por ejemplo, consideremos la transitividad de Kp en la determinación del peso mediante la balanza: podría ocurrir que cuando están sobre los platillos los objetos x e y. permanecieran a igual nivel, y lo mismo cuando estuvieran y y z;pero que, en cambio, al colocar sobre los platillos x y z, se notara una diferencia de nivel. Que esto no ocurra no es una necesidad lógica, sino una hipótesis empírica acerca de las balanzas (de hecho, en balanzas algo "defectuosas" se viola a veces la transitividad). La misma constatación podemos hacer con respecto a la simetría de K, y a la transitividad de PP.Incluso la conexión conjunta de Kp y Pp es una hipótesis empírica, pues podría ocurrir que, en ocasiones, al colocar sobre los platillos dos determinados objetos, la balanza se pusiera a oscilar permanentemente sin alcanzar nunca un equilibrio, por lo que no podríamos determinar si se da coincidencia o precedencia de pesos en algún sentido u otro. En resumen, el hecho de que podamos aseverar que un determinado concepto comparativo va asociado a ciertas operaciones u observaciones empíricas es una cuestión hipotético-empírica (y a veces incluso fuertemente teórica) y no un asunto de mera definición. En general, no podemos decir que los conceptos comparativos vienen definidos por las operaciones u observaciones empíricas asociadas a ellos (como tampoco lo podemos decir en el caso de los criterios empíricos asociados a los conceptos clasificatorios). Con frecuencia, las relaciones empíricamente determinadas que van asociadas a un concepto comparativo que queremos introducir de nueva cuenta en una disciplina científica no cumplen exactamente las condiciones formales de la definición de conceptos comparativos, sino sólo de modo aproximado. Análogamente al caso de los conceptos clasificatorios, las condiciones formales representan un ideal al que hay que tender pero que no siempre se alcanza plenamente. Un buen ejemplo de ello es el concepto comparativo dureza, que se introduce en mineralogía asociándolo a la prueba empírica de la "raya". Las relaciones de precedencia y coincidencia en este caso se determinan operacionalmente del siguiente inodo: x es más duro que y si y sólo si x raya a y; x es tan duro como y si y sólo si x no raya a y ni y a x. También en este caso, las condiciones de reflexividad de la coincidencia y de mutua exclusión de coincidencia y precedencia se desprenden analíticamente de nuestro uso lingüístico, pero no así el resto de condiciones, cuya satisfacibilidad depende de hipótesis empíricas acerca de los minerales. Pero, además, en este caso dichas hipótesis no siempre se cumplen, por lo que algunas de las condiciones postuladas para los conceptos comparativos (especialmente la transitividad) sólo se cumplen de manera aproximada. No obstante estas dificultades, la "pmeba de la raya" se conserva en la mayoría de los casos como determinación operacional del concepto de dureza hasta tanto no se encuentren mejores determinaciones operacionales o hasta tanto las determinaciones altemativas sean demasiado difíciles de aplicar en la práctica. Hemos indicado ya que todo concepto comparativo, a través de la relación P de precedencia, implica un ordenamiento de los objetos del dominio considerado de "más a
menos" (o de "menos a más", sesún se quiera considerar), además de la clasificación de dichos objetos en clases de objetos coincidentes. Este ordenamiento de los objetos se expresa en ocasiones mediante números, mediante lo que se llama una "escala ordinal". El orden de los números refleja así el orden de los objetos a los que se adscriben dichos números. Por ejemplo; en el caso del concepto de dureza introducido en mineralogía, Friednch Mohs estipuló yna escala numérica del 1 al 10, según la cual, al mineral más blando, el talco, se le asigna e1 número'l y al más duro, el diamante, se le asigna el 10, siendo los demás minerales ordenados entre estos dos extremos según su mayor o menor grado de dureza por comparación con los demás. Asimismo, en psicología, al concepto.de inteligencia (que es un conccpto comparativo) se le asigngn números, llamados 'cocientes de inteligencia', que representan el nivel de inteligencia de manera fácilmente comparable y memorizable. Todos estos ejemplos de conceptos comparativos a los que se asignan números, sin embargo, no nos deberían confundir y hacer creer que estamos Watando con conceptos realmente cuantitativos, métricos. Las escalas numéricas introducidas en estos casos son s61o escalas vdinales, no escalas métricas, en un sentido genuino, sobre cuya naturaleza hablaremos en el próximo apartada. La difereicia esencial entre ambos tipos de asignaciones numéricas se comprueba por el hecho de que con los números asignados a los conceptos comparativos no t i e ~ esentido efectuar las consabidas operaciones aritrnéticas y aigebraicas, como sumar, multiplicar, sacar raíces, @c., y mucho menos aplicar las operaciones de ~5lculosuperior (;qué sentido tendría sumar cocientes de inteligencia Q sacar la iaíz cuadrada de un grado de dureza?, sobre ésto, cf. más adefante cap. 6). Los números que se utilizan en el caso de los conceptos comparativos no expresan realmente la medida de ninguna magnitud, sino que son sólo un modo simple y conveniente de expresar un orden; en vez de números, también podríamos usar las letras del alfabeto y estipular, por ejemplo, que en una escala de dureza,,al talco le corresponde la letra 'a' y al diaman$ la letra 'j'. Los números asignados a los conceptos comparativos son en realidad únicamente nu~ierales,no eTpresan cantidades o magnitudes; no presuponen una métrica definida demanera "natural" sobre el dominio en cuestión, es decir, una métrica asociada a operaciones matemáticas que reflejan operaciones o relaciones empíricas.
4. Conceptos métricos: estudio preliminar Los conceptos métricos o cuantitativos son característicos de las ramas más avanzadas de la' ciencia. Casi todos los conceptos fundamentales de la física son métricos, pero ellos también'aparecen en otras disciplinas de naturaleza bastante distinta a. la de la física, como pueden ser la genética de poblacion,es, la teoría del aprendizaje o la microeconomía. El uso sistemático y generalizado de conceptos métricos en una disciplina implica, entre otras cosas, que está a nuestra disposición para esa área de estudios empíricos todo el potencial de la matemática. Al pro'ceso que conduce a tal uso se le llama a veces "mat~matización"de una disciplina dada, proceso que, como sabemos, fue el elemento probablemente más decisivo de la revolución científica del siglo XVII y el que dio lugar a la física moderna. Ahora bien, la frase 'matematizar una disciplina'
,
debe tomarse con un poco de cuidado, ya que, a fin de cuentas, no sólo el uso de conceptos métricos, sino la introducción adecuada de conceptos clasificatorios y comparativos implica ya ciertos supuestos de carácter matemático (conjuntista), si bien de nivel elemental. Si la idea de "matematizar" se asocia generalmente con la introducción sistemática de conceptos métricos es porque sólo estos últimos permiten un uso generalizado de las porciones más "potentes" de la matemática (y al mismo tiempo las más clásicas), como son la aritmética, la geometría, el álgebra y el cálculo. Es sólo a través del puente que constituyen los conceptos métricos entre la realidad empírica y dichas porciones de las matemáticas que un amplio espectro de procesos empíricos puede tratarse como si fueran operaciones matemáticas, y esto a su vez es lo que permite un alto grado de precisión en la explicación y predicción de dichos procesos. Los conceptos métricos están íntimamente conectados, como indica su nombre, con la idea de medir cosas y procesos. Ahora bien, medir no consiste simplemente en asignar números a las cosas, puesto que ello también puede realizarse de manera trivial en el caso de los conceptos clasificatorios y comparativos. Medir es asignar números a objetos empíricos para representar determinadas propiedades específicas de los objetos denominadas ntagnintdes, representación que permite utilizar de modo empíricamente significativo operaciones matemáticas interesantes (adición, multiplicación, potenciación, derivación e integración, etc.) entre los valores numéricos asignados. En otras palabras, la mediciónpermite hacer cálculos con relevancia empírica, y en particular permite hacer predicciones muy precisas. Podemos resumir las ventajas de los conceptos métricos sobre los clasificatorios y comparativos en los siguientes puntos. a ) Las divisiones y diferenciaciones que pueden hacerse empleando conceptos métricos son mucho más finas y precisas que las que pueden hacerse mediante los otros tipos de conceptos. Es decir, los conceptos métricos también permiten clasificar y comparar los objetos de un dominio dado, pero lo hacen de manera mucho más precisa que sus contrapartidas no-métricas. Por ejemplo, en vez de clasificar las diversas velocidades de los cuerpos de acuerdo a los conceptos de 'muy lento', 'lento', 'rápido' y 'muy rápido', o de compararlas según una "mayor o menor rapidez", introducimos el concepto métrico de velocidad y podemos hacer las clasificaciones y comparaciones de manera mucho más fina. b) Los conceptos métricos permiten enunciar leyes empíricas que son más generales y precisas, y por ende mejor controlables, que las leyes formuladas con conceptos no-métricos. c) Como consecuencia de las características a) y b), los conceptos métricos permiten explicaciones y predicciones mucho más exactas y controlables.
Desde un punto de vista formal, la extensión de un concepto métrico es una fiinción numérica,o mejor, como en seguida veremos, un conjunto de tales funciones. Lo esencial de los conceptos clasificatorios es que ellos nos permiten realizar clasificaciones de los objetos del dominio, por eso se caracterizan porque su extensión es (un elemento
114
F U S M S ~ E S ~ SDE FILOSOF~ADE LA CIENCIA
de) una partición. Lo esencial de los conceptos comparativos es que nos periniten realizar comparaciones cualitativas entre los objetos del dominio, por eso se caraccerizan porque su extensión es una relación de orden (KP). Pues bien, lo esencial de los conceptos métricos es que nos realizar asignaciones numéricas a 10s objetos del dominio de rnodo empíricamente significativo, y por eso se van a caracterizar porque sus extensiones .. son (determinados tipos de) funciones numéricas sobre dicho dominio. Así pues, el problema básico en el intento de metrizar un área de conocimiento consiste en encantrar la función o conjunto de funciones métricas apropiadas. Una vez encontrado ello, podemos decir que, en cierto sentido, hemos "identificado" los objetos del dominio estudiado con números reales (o entidades matemáticas derivadas, como vectores, matrices, tensores, etc.). Entonces, en vez de considerar directamente las relaciones y operaciones empíricas que se dan entre los objetos estudiados, podemos concentrar nuestra atención sobre las relaciones y operaciones entre los números que representan las propiedades de los objetos empíricos, y a través de ello, indirectamente, ganamos información sobre los mismos objetos y sus propiedades representadas. Este modo de proceder nos permite un grado mucho más alto de exactitud y potencia predictiva del que obtendríamos operando directamente con los objetos empíricos, puesto que las teorías matemáticas existentes nos informan detallada y exactamente sobre cómo operar con números y sobre las propiedades generales que tienen tales operaciones. Además, los límites prácticos que suelen darse en la manipulación de objetos empíricos no se dan en la manipuIación de números, para lo cual lo único que necesitamos es papel y lápiz, o a lo sumo una computadora. Este proceso de identificar los objetos empíricos con números y las operaciones empíricas con operaciones matemáticas, manejando luego estas últimas para obtener información indirecta sobre los primeros, es a lo que puede denominarse más genuinamente "matematización de la realidad". Al contrario del caso de los conceptos comparativos, la asignación de números a objetos empíricos en este proceso no es arbitraria y no-operacional, sino que con ella se expresan importantes y reales conexiones empíricas entre los mimosobjetos. Operamos con los números "como si" operásemos con los objetos. En la primera sección dijimos que los conceptos comparativos suponen un refinamiento o reforzamiento respecto de los clasificatorios, y que lo mismo ocurre con .los métricas respecto de los comparativos. En la sección anterior hemos visto en qué sentido es así en el primer caso: a todo concepto comparativo "subyace" uno clasificatorio (expresado mediante la relación de coincidencia K). Pues bien, en ese mismo sentido es así en el segundo caso. A. cualquier concepto métrico subyace explícita o implícitamente un concepto comparativo correspondiente (y por tanto otro clasificatorio); medir determinada magnitud en un dominio de objetos implica, entre otras cosas, la posibilidad de (clasificarlos y) compararlos en relación con dicha magnitud. La recíproca, naturalmente, no es cierta, pues no siempre la introducción de un concepto comparativo permite construi; ipso facto un concepto métrico correspondiente (como tampoco la introducción de un concepto clasificatorio permite siempre la introducción de otro comparativo). Entre muchos filósofos y científicos prevalece la idea de que un concepto métrico, para ser adecuado, debe ser 4'construido" a partir de un concepto comparativo previo. .A veces se llega incluso más allá en este requerimiento y se exige que el concepto
CONCEPTOS C~ENT~HCOS
115
métrico sea definible en términos de un concepto comparativo. Y se afirma que, aun cuando en muchos casos ello no se ha llevado a cabo efectivamente, eso se debe al estado conceptualmente defectuoso de los fundamentos de la disciplina, y que la misión del filósofo de la ciencia o del investigador de fundamentos debería consistir justamente en proporcionar tal definición en los casos en que no se ha hecho. Esta visión de la relación entre los conceptos métricos y comparativos es característica del operacionalismo y otras corrientes metodológicas .afines, según las cuales todo concepto científico, métrico o no, debe estar completamente determinado por observaciones u operaciones de laboratorio (cf. Bridgman, 1927, 19.51~y 1951b). La idea básica es que un concepto métrico no es empíricamente adecuado hasta que no se muestre que, "en principio", es reducible a uno comparativo previamente introducido. Esta visión tan restrictiva de los conceptos métricos descansa en el prejuicio de que sólo es posible introducir un concepto métrico a través de su definición o construcción a partir de un concepto comparativo previamente disponible. El hecho de que a todo concepto métrico subyace otro comparativo no quiere decir que la introducción de un concepto métrico sea siempre bbposterior"a la introducción de uno comparativo "previo". En muchos casos así es, y los conceptos métricos introducidos de manera independiente corresponden de modo bastante natural a conceptos comparativos previos, en un sentido o bien histórico (porque ya se aplicaban en la disciplina en cuestión antes de que ésta fuera metrizada), o bien epistemológico (porque nuestro conocimiento del modo de aplicarlo o controlarlo es más directo en el caso del concepto comparativo que en el de su asociado métrico). Así ocurre por ejemplo con los conceptos métricos de masa, longitud o temperatura (termométrica). Pero esta prioridad (histórica o epistemológica) de los conceptos comparativos frente a los métricos no tiene por qué darse siempre. Con frecuencia se introduce un concepto métrico directamente, ya sea a partir de una teoría establecida o como simple recurso de cálculo, sin que se haya pensado previamente en un concepto comparativo correspondiente y sin que éste tenga ningún interés. Esto suele ocurrir en ramas particularmente avanzadas y abstractas de la ciencia. Conceptos métricos como el de intensidad de campo en el electromagnetismo, entropía en termodinámica, lagrangiano en mecánica clásica ofunción de onda en mecánica cuántica, fueron introducidos en su momento, y se manejan en la actualidad, sin tomar en cuenta el concepto comparativo subyacente. En estos, y muchos otros casos, lo que confiere significado empírico a la mayoría de conceptos métricos es su inserción en una teoría empírica determinada a la cual podemos atribuir un significado empírico en su totalidad. De qué manera ocurre esto, lo veremos en capítulos posteriores de este libro (cf. caps. 8, 9 y 10). De momento, baste señalar que en muchos casos (de hecho en la mayoría), la introducción de un concepto métrico, con su significado empírico propio, se realiza en el contexto de una teoría, es decir, en conexión con otros múltiples conceptos (métricos o no), y no por el expediente de reducirlo a un concepto comparativo. Para la mayoría de conceptos métricos no hay razón, pues, para exigir que sean introducidos a partir de conceptos comparativos previos, eso sólo es así de algunos conceptos métricos, como los mencionados más arriba. Volveremos sobre estos dos modos de introducir conceptos métricos en el capítulo 6. Estas consideraciones no suponen negar que en muchos casos sea interesante y
116
FUSD.4hlEh'lDS DE F I L O S O F DE ~ LA CIENCIA
fructífero identificar el concepto comparativo implicito en un concepto métrico dado, y averiguar cuál es la relación formal entre ambos, Ello tiene un doble interés: empíricocientífico, por contribuir a un mejor control empfricu del concepto métrico en casos de duda; y metacientífico o filosófico, porque permite establecer ciertas distinciones entre subtipos de conceptos métricos y su modo de ser aplicados. Esta cuestión, a la que se.ha dedicado mucha atención en la literatura de filosofía de la ciencia, tanto en susrprimeros tiempos como en época reciente, se estudiará en detalle en el capítulo 6. Por el momento, bastarán para esta introducción preliminar las observaciones siguientes. Cuando el concepto métrico es introducido a partir de uno comparativo previo, se debe dar cierta condición de dependencia entre ambos, consistente fundamentalmente en que la función correspondiente al concepto métríco preserva el orden de la relación correspondiente al concepto comparativo. Si K u P es la extensión del concepto comparativo y f . . es una de las funciones de la extensión del concepto métrico, entonces: (Mi) Dom(KuP)=Domf. (M2) Rec f c Re. (M3) V x, y (xKy +-+fix)=&)). (h14) V x, y (xPy +-+Ax) >&)).
.
,
Para que, dado un concepto comparativo, exista una función con estas características, y que podamos por tanto-decir que ,existe un concepto m6trico que corresponde al comparativo, es necesario que la relación cualitativa de comparación K v P satisfaga ciertas condiciones. Por lo general hay varias posibilidades, vanos grupos de condiciones suficientes que gkantizan la existencia de una función tal. En casi todos los casos, tales condiciones invoEucran elementos adicionales a K u P, por ejemplo una operacidn de combinación, o una relación de comparación ewre pares de objetos, u otros más complicados. cuando es así, hay que añadir a MI-M? otras cláusulas adicionales que expliciten el modo en que la función'numérica debe preservar esos elementos erdpíricos cualitativos adicionales. No vamos a ver aquí las diversas posibilidades y los diversos grupos de condiciones para cada una. De ello se ocupa la llamada Teoría de la Metrización Fundamental, que veremos en el capítulo 6 ($3). ~oncluiremosesta presentación preliminar de los conceptos métricos presentando la noción de escala y, en relación con ello, aclarando el sentido en el que conviene identificar la extensión de un concepto métrico, no con una única función métrica, sino con una clase de tales funciones, equivalentes en cuanto a suiapacidad representacional. Las' funcionesf especificas que asignan números reales a cada. objeto dei dominio son lo que tradicionalmente se denomina escalas. Por ejemplo, una función específica asigna a determinado objeto que hay en un museo de Pan's, representando su masa, el número 1 y al objeto que el lector está leyendo el número 0,4; otra función para la masa asigna a los mismos objetos, respectivamente, el 1.O00 y el 400; otra asigna al-primero el número 0,001 y al segundo 0,0001; otra 2,2 y 0,88; etc. Estas funciones numéricas miden la misma propiedad, la masa, pero asignan números diferentes a los mismos objetos. Cada una de estas funciones es una diferente escala para la masa: la primera es la "escala
CONCEPTOS CIE~T~FICOS
117
Kilogramo" (sistema iMKS), cuyo uso hacemos explícito posponiendo al numera1 el signo 'kg.'; la segunda es la "escala gramo" (sistema cegesimal). cuyo uso hacemos explícito posponiendo al numeral el signo 'gr.'; la tercera la "escala Tonelada métrica", que denotamos posponiendo 'Tm.'; la cuarta es la "escala libra" (sistema anglosajón) que denotamos posponiendo 'lb'; etc. Todas estas escalas, y muchas otras, son igualmente válidas para medir la masa, son de hecho escalas equivatentes en un sentido del que diremos algo a continuación y que quedará plenamente clarificado en el capítulo 6. Éste es e1 motivo por el que no es correcto identificar la extensión de un concepto métrico con una única de las funciones numéricas, con una escala particular. Lo correcto es identificarlo con el conjunto de todas las posibles escalas para Ia magnitud que corresponde al concepto, esto es, con la clase de todas las posibles funciones numéricas que representan dicha magnitud. La extensión del concepto masa es pues el conjunto &,L.,fm,f;h, ...l. Y lo mismo en el caso, por ejemplo, de la longitud: tenemos las escalas "centímetro", "metro", "kilómetro", "milla", "yarda", "pulgada", etc., por lo que la extensión del concepto longitud se debe identificar con la clase de todas ellas: If,,fm, f,, fmi,f;, ...}; Igualmente, con algunas diferencias que en seguida comentaremos, en el caso de la temperatura.Una función métrica específica asigna al agua en ebullición el 100 y al agua en congelación el O; otra les asigna, respectivamente, 32 y 212; otra el 273,15 y el 373,15; etc. La primera es la escala Celsius, la segunda es la escala Fahrenheit, la tercera la escala Kelvin, y todavía hay otras, como la escala Rankine o la escala Réaumur. La extensión del concepto temperatura es pues el conjunto C f ~ , f i f , ~...,}. Podemos dar ahora una definición provisional de los conceptos métricos que metrizan un concepto comparativo previo, en la que se haga patente que la extensión del concepto comparativo no es una única función numérica sino una clase de ellas representacionalmente equivalentes. Insistimos en que ella sólo se refiere a los conceptos métricos introducidos a partir de conceptos comparativos previos y, como hemos advertido, no todos los conceptos métricos se introducen así; otros (la mayoría) se introducen a través de su relación con otros conceptos métricos en el contexto de una teoría científica. Por otro lado, la definición es reconocidamente insatisfactoria, no es tanto una definición en sentido estricto cuanto una caracterización provisional que deja numerosos aspectos por elucidar. Estos aspectos serán clarificados con detalle en el capítulo 6 ($3 y $5).
Un concepto funcional C es un concepto métrico para el dominio (no-vacío) de objetos D, que corresponde al concepto comparativo (para ese mismo dominio) cuya extensión es K v P, si y sólo si la extensión de C es un conjunto Cfi,h,... } de funciones tales que cadaf, cumple las condiciones h.11-M4 respecto de K u P. 1
1
Concluiremos con la presentación introductoria de las nociones de tipo de rransformación y tipo de escala, que nos permitirán una primera aclaración del sentido en el que las diferentes escalas para la misma magnitud son equivalentes. Como hemos advertido, en este estudio preliminar esta clarificación sólo puede ser parcial. Para realizarla de
modo plenamente satisfactorio hay que referirse a las condiciones empíricas que, si son satisfechas por la relación de comparación cualitativa K u P, hacen posible la existencia de funciones numéricas que cumplen MI-M4. Esta referencia se introducirá también en el capítulo 6 en el contexto de lo que denominaremos rnerriraciónficndameizral($3). Las diferentes escalas de una misma magnitud son equivalentes en el sentido siguiente: determinados valores numéricos se preservan en todas ellas. Tomemos las escalas para la masa. El valor absolirro asignado a cada objeto no se preserva en Ias diferentes escalas, una asigna a este libro el 0,4, otra el 400, etc. Pero sí se conserva otro valor, a saber, el cociente entre valores absolutos asignados a los objetos. El cociente entre los valores asignados al objeto del mencionado museo de París y a este libro es el mismo en todos los casos, se preserva bajo cambios de escala: 1/0,4 = 1.0001400 = 0,001/0,0004 = 2,210,88. Y lo mismo para cualquier otra escala de masa: si m, y mz son dos escalas cualesquiera para la masa sobre el mismo dominio, entonces para cualesquiera objetos x, y de1 dominio ocurre: rn,(x)/~n,(~) = ~ n ~ ( x ) l r n dLas ~ ) . escalas para la masa preservan las proporciones (razones, cocientes). Hay muchas otras magnitudes que se miden mediante escalas que tienen también estas características, por ejemplo la longitud (metros, centímetros, yardas, ...), o el tiempo-duración (segundos, horas, días, ...). A este tipo de escalas se las denomina 'escalas proporcionales' o 'escalas de razón', para connotar justamente que los cambios de escala preservan las proporciones o razones. Así, en general, si fp y gp son dos funciones numéricas para medir la propiedad P presente en los objetos de cierto dominio, o sea, dos escalas diferentes para la misma magnitud P, decimos que son escalas proporciolzales, o de razóit, si y sólo si para todo x, y se cumple: fp(x)lfp(y) = gp(x)lgp~). Nótese que aunque 'escaia proporcional' se diga de las escalas sueltas, sólo tiene sentido dicho de una escala en su relación con otras, como miembro de un grupo de escalas, pues decimos que una escala es proporcional cuando preserva cierto valor matemático (en este caso el cociente entre asignaciones), es decir, cuando dicho valor es el mismo para todas las escalas del grupo. En sentido estricto, por tanto, sería más adecuado decir, no que una escala es una escala proporcional, sino que ir11 grupo de escalas es un grupo de escalas proporcionales. Esto es, que la extensión de determinado concepto métrico (p.ej. masa) es un grupo de escalas proporcionales. La misma advertencia debe hacerse con respecto a los demás tipos de escala que se introduzcan a continuación. No todas las escalas que miden magnitudes son escalas proporcionales. Las escalas termométricas, por ejemplo, no lo son. No sólo, por ejemplo, las escalas Celsius y Fahrenheit asignan valores absolutos diferentes al agua en ebullición y al agua en congelación, sino que el cociente entre los valores asignados tampoco es el mismo: 0/100 en la escala Celsius, diferente de 321212 en la escala Fahrenheit. Por lo tanto, las escalas termométricas para la temperatura no preservan los cocientes entre valores asignados. Sin embargo también preservan algo, aunque más débil que las escalas proporcionales. En este caso lo que se preserva es el cociente entre irttel-valos o diferencias de valores asignados. Veámoslo. La escala Celsius, además de asignar el O al agua en congelación y el 100 al agua en ebullición, asigna 10 al agua del puerto de Barcelona a medianoche del 3 1 de diciembre de 1996 y 20 al agua de ese mismo lugar a mediodía del 1 de agosto de 1996. La escala Fahrenheit, además de asignar 32 y 212 a los primeros, asigna respectivamente 50 y 68 a los segundos. Pues bien, ahora los
valores asignados por cada escala resultan ser tales que el cociente entre las diferencias de pares de asignaciones es siempre el mismo: en el primer caso, grados CeIsius, la diferencia entre, p.ej., las asignaciones al agua en ebullición y al agua de Barcelona el 1 de agosto es 100-20, y la diferencia entre las otras dos asignaciones es 10-0; en el segundo caso, grados Fahrenheit, la primera diferencia es 212-68 y la segunda 50-32; como se ve (100-20)/(21268) = (10-0)/(50-32). Debe quedar claro que éste es un hecho general, no depende de cuáles sean 10s pares de objetos elegidos para cada diferencia, lo mismo valdría si los intervalos fuesen, por un lado, para el agua en ebullición y congelación y, por otro, para el agua de Barcelona el 1 de agosto y el 31 de diciembre: (100-0)/(212-32) = (20-10)/(68-50). A las escalas de este tipo se las denomina 'escalas de intervalos' o 'escalas de diferencias', para connotar que lo característico de ellas es que los cambios de escala preservan los cocientes entre los intervalos o diferencias de asignaciones. Así, en general, s i 6 y g ~ s o ndos funciones numéricas para medir la propiedad P presente en los objetos de cierto dominio, o sea, dos escalas diferentes para la misma magnitud P, decimos que son escalas de intervalos, o de diferencias, si y sólo si para todo x, y, z, w se cumple: IfP(x)-fPh)] 1 CfP(z)-fP(w)] = [gp(x)gpCY)I 1[gp(z) - gp(w)I. Es sencillo ver que cada tipo de escala se caracteriza por un modo específico de realizar los cambios de escala o, como se dice técnicamente, por un tipo de transformación. Una transformación es una función que nos permite pasar de una escala a otra, esto es, una función tal que al valor de cada objeto en una escala le asigna el valor del objeto en otra escala. Por ejemplo, para pasar en la masa de la escala-kilogramo (sistema MKS) a la escala-gramo (sistema cegesimal) se debe tomar el valor asignado por la primera y multiplicarlo por 1.000, la función transformación F(x) que permite pasar de una escala a otra es F(x) = 1.000.~;para pasar de kilogramos a toneladas se debe multiplicar por 0,001; para pasar de kilogramos a libras se debe multiplicar por 2,2; etc. A este tipo de transformaciones se las denomina 'transformaciones similares'. Una transformación similar es cualquier función F(x) sobre los reales de la forma F(x) = ax, con a E Rec. Así, si tengo una escala f para una maznitud, aplicarle una transformación similar es multiplicar cada valor de f por un mismo número real positivo a. O equivalentemente, si tenemos dos escalas, decimos que una es una transformación similar de la otra, o que están relacionadas mediante una transformación similar, si y sólo si los valores de una resultan de multiplicar los de la otra por una constante. Como hemos visto, las escalas de la masa están relacionadas mediante transformaciones similares, podemos pasar de una a cualquier otra multiplicando por cierto número. Con las escalas de la longitud ocurre lo mismo: para pasar de metros a centímetros multiplicamos por 100, para pasar a kilómetros multiplicamos por 0,001, para pasar a millas multiplicamos por 0,00054, etc. Y no sólo con la masa y la longitud. Como hemos anunciado, los tipos de transformación están asociados a los tipos de escala; por tanto, cualquier escala de un grupo de escalas proporcionales está relacionada con cualquier otra del grupo mediante una transformación similar: si la extensión de un concepto métrico es un grupo de escalas proporcionales, entonces si f y g son dos escalas proporcionales cualesquiera de dicho grupo, hay un real positivo a tal que para todo objeto x del dominio .Y(.Y)= afT.r). El motivo es claro, a saber, que son justamente las transformaciones similares
]as que preseman 10s cocientes de asicpaciones. Si f y g son dos escalas relacionadas mediante una transformación similar, e.e. tales que g(s) = r?f(x-)(a E Re+), entonces es inmediato que son escalas proporcionales, e.e. tales que para todo x, y,fi.x)/f(y) = ~ ( X ) / ~ O : ) , pues g(l-)/gb) = af(x)/afC,.)= fls)/Xy). Así, un tipo de escala, las escalas proporcionales, está asociado a un tipo de transformación, a las transformaciones similares. Las diferentes escalas proporcionales de una misma magnitud están relacionadas mediante transformaciones similares. Esto aclara en qué sentido las diferentes escalas de una misma magnitud, las diferentes funciones numéricas pertenecientes a la extensión de un concepto métrico, son equivalentes. Como el lector puede fácilmente comprobar, la relación "ser una transformación similar de" es una relación de equivalencia entre funciones numéricas, funciones que, por tanto, son "equivalentes" bajo ese tipo de transformación. Análogamente sucede con las escalas de intervalos. También ellas llevan asociado un tipo de transformación, sólo que ahora no se trata de transformaciones similares. El cambio de una escala termométrica a otra no consiste en general sólo en multiplicar las asignaciones de la primera por una constante. Por ejemplo, para pasar de grados Celsius a Fahrenheit hemos de multiplicar por 9/5 y sumar 32. A este tipo de transformaciones que consiste en multiplicar por una constante (positiva) y sumar otra se las denomina 'transformaciones lineales'. Una trurzsfol-inacióiz Ii?lenl es cualquier función F(x) sobre los reales de la forma F(x) = ax + b, con a E Re+y b E Re. Así, si tengo una escala f para una magnitud, aplicarle una transformación lineal es multiplicar cada valor de f por un mismo número real positivo a y sumarle otro real b. O equivalentemente, si tenemos dos escalas, decimos que una es una transformación lineal de otra, o que están relacionadas mediante una transformación lineal, si y sólo si los valores de una resultan de multiplicar los de la otra por un número real positivo y sumar a ese resultado otro número real. A veces a puede ser 1, por ejemplo para pasar de grados Celsius a Kelvin basta sumar 273,5 (e.e. "y multiplicar por 1"). Y por supuesto que, asimismo, a veces b puede ser 0, por ejemplo para pasar de grados Celsius a Réaumur basta multiplicar por 415 (e.e. "y sumar O ) , pero eso no debe hacer pensar que en este caso la escala entonces es proporcional. Recuérdese que las escalas no son proporcionales, o de intervalos, "a solas" sino "en grupost, y lo que importa por tanto es el tipo de transformación que las relaciona a todas ellas. Pues bien, así como las escalas proporcionales están relacionadas mediante transformaciones similares, es igualmente sencillo mostrar que el tipo de transformación que corresponde a las escalas de intervalos es el de las transformaciones lineales. Si f y g son dos escalas relacionadas mediante una transformación lineal, e.e. tales que g(x) = aJqx)+ b (a E Ret, b E Re), entonces es inmediato que son escalas de intervalos, e.e. tales que para todo x, =,w, Hx) -fi>l / Wz)-f(iv91 = [g(x>- gb)I 1 [Q(z) - g(\t9)l,pues [g(x-) - gO1)l/ [g(z) g(i.v)]= [ (afix) + b ) - (a&) + b)]/ [(uJ(z)+ b) - (af(1v)+ b)]= [a&) + b - a f i ) - b] / [aflz) + b - afliv) - b] = aV(x) / aRz) -JTw)l = H.Y)-jQ)/][f(z) -fltt3)I. Así, las diferentes escalas de intervalos de una misma magnitud son equivalentes en este sentido, están relacionadas mediante transfornlaciones lineales, siendo "ser una transformación lineal de" (al igual que "ser una transformación similar de") una relación de equivalencia. Las escalas proporcionales y de intervalos son las más usuales, pero no las únicas. Puesto que cada tipo de escala se define o caracteriza por un tipo de transformación, el -
-
)1
-m)]
CONCEPTOS CIENT~FICOS
12I
lector avisado habrá adivinado que hay tantos tipos de escala como tipos de transfonaciones. Cada tipo de escala se caracteriza por determinado valor que permanece constante tras los cambios de escala,f(x)l') en las proporcionales,f(x) -f(y)/f(z) -fTw) en las de intervalos. Estos valores permanecen constantes en cada caso porque en cada uno el cambio de escala es una transformación de un tipo específico, similar en el primero, lineal en el segundo. Entonces, otros tipos de transformaciones dejarán invariantes otros valores y caracterizarán por tanto otros tipos de escalas. En realidad hay tantos tipos de escalas como tipos posibles de transformaciones. Entre todos los tipos posibles sólo algunos son empíricamente interesantes, se corresponden con la medición en sistemas empíricos conocidos. Los tipos de escalas más interesantes, como hemos dicho, son el de las proporcionales y el de las de intervalos, pero algunos otros más inusuales son de aplicación en algunos ámbitos de las ciencias sociales y de la conducta. La referencia clásica sobre tipos de escalas y sus correspondientes transformaciones son los trabajos de Stevens (cf. especialmente 1946, 1951 y 1959). Presentamos a continuación los diferentes tipos de escalas a que se refiere Stevens, a los que añadimos algún otro que complementa los iniciales dz modo natural. Cada tipo de escala se identifica por su tipo de transformación o, alternativamente, por el valor que permanece invariante tras las transformación. Como dijimos más arriba, las dos primeras, a pesar de que las incluye explícitamente Stevens, no se pueden considerar propiamente escalas de medición, esto es, correspondientes a conceptos genuinamente métricos. Se trata simplemente de "escalas" correspondientes a conceptos sólo clasificatorios o sólo comparativos.
Escalas nominales. Tipo de transformación característica: cualquier función biyectiva. No preserva ningún valor matemáticamente significativo. Ejemplo: cualquier numeración, como la de los canales de televisión o la de los jugadores de un equipo de basket. Estas "escalas" son en realidad meras clasificaciones disfrazadas de asignaciones numéricas; los valores asignados a los objetos hacen 13s veces de meras marcas de las clases de equivalencia de la clasificación. Escalas ordinales. Tipo de transformación característica: cualquier función monótona creciente. No preserva ningún valor matemáticamente significativo. Sólo preserva el orden de las asignaciones: si f(x) entonces cualquier transformada g es tal que g (x) I gb). Ejemplo: escala de Mohs para la dureza, escalas para la inteligencia. Estas "escalas" son en realidad meras relaciones de comparación disfrazadas de asignaciones numéricas; los valores asignados a los objetos no tienen significado cuantitativo, hacen las veces de meras marcas que indican el orden de los objetos.
>m),
Escalas de intervalos o diferencias. Tipo de transformación característica: cualquier función de la forma F(x) = nr + b (a E Re+,b E Re), o sea, transformaciones lineales. Valor que preserva: A.r) -fi)lAz)-fTrt.). Ejemplo: temperatura termométrica. Escala de intervalos logarítrnicos. Tipo de transformación característica: cualquier función de la forma F(.x) = n.r (a, n E Re+), o sea, transformaciones exponencia-
les. Valor que preserva: log f(x) - log fO.)1 logf(z) - logfl~v).No hay ejemplos en las ciencias físicas pero, según Stevens, sí en las humanas y sociales (aunque este autor no es del todo claro en este punto y a veces parece referirse sólo a que hay leyes psicofísicas del tipo 4 = apn,cf. Stevens, 1959).
Escalas de iizrenlalos absolutos. Tipo de transformación característica: cualquier función de la forma F(x) = x + b ( b E Re), o sea, transformaciones lineales de coeficiente l . Valor que preserva: flx) -fb).Ejemplo: tiempo calendario (fechas en los diversos calendarios). Escalas proporcionales o de razón. Tipo de transformación característica: cualquier función de la forma F(x) = ax (a E Re+),o sea, transformaciones similares (esto es, transformaciones lineales de constante O, o transformaciones exponenciales de expoEjemplos: longitud, masa, duración. nente 1). Valor que preserva:f(x) la!). Escalas de proporciones logarítinicas. Tipo de transformación característica: cualquier función de la forma F(x) = x" ( n E Re-), o sea, transformaciones exponenciales de coeficiente 1. Valor que preserva: log flx) / 103 fCy). (Ejemplos: escalas "multiplicativas" de la masa, la longitud, la duración, etc.; cf. más adelante cap. 6, $3.) Escalas absolutas. Tipo de transformación característica: la función identidad F(x) = x. Valor que preserva:flx). Ejemplo: la probabilidad. Esta lista está presentada por orden de "fuerza" en tres niveles. Prescindiendo de las nominales y ordinales, demasiado débiles para ser consideradas propiamente escalas métricas, las escalas menos fuertes son las de intervalos y las de intervalos logarítmicos; después vienen las de intervalos absolutos, las proporcionales y las de proporciones logarítmicas; y por último las absolutas, el tipo más fuerte de todas. La fuerza de una escala depende del valor que preserva la transformación, de lo que permanece invariante tras los cambios de escala. Cuanto menor sea el número de objetos a que refiera el valor preservado, más fuerte es la escala y, como se ve, en las dos primeras se precisan cuatro objetos, en las tres segundas se precisan dos, y en la última sólo uno. Estos hechos son importantes pues la utilidad de una escala, el uso que se puede hacer de ella, depende de cuán fuerte sea. La idea es que si las escalas han de servir para expresar cuantitativamente determinados hechos relativos a los objetos medidos, entonces las afirmaciones que hacemos mediante ellas serán útiles o "significativas" sólo si tales afirmaciones preservan su valor veritativo tras los cambios de escala. Si determinada afirmación sobre las asignaciones no se preserva tras un cambio de escala, es decir, es verdadera en una escala pero falsa en otra, entonces es que no expresa información sólo de los objetos sino que depende de aspectos convencionales involucrados en la determinación de las escalas. Por ejemplo, si digo que en cierta escala el valor de un objeto x es un número r, y la escala en cuestión es proporcional, esa afirmación no se puede considerar significativa pues pasa a ser falsa cuando cambiamos de escala; esa afirmación sólo es
significativa si la escala es una escala absoluta. O si digo que en cierta escala el cociente entre las asignaciones a dos objetos x, y es un número r, y la escala en cuestión es de intervalos, esa afirmación no se puede considerar significativa pues pasa a ser falsa cuando cambiamos de escala; esa afirmación sólo es significativa si la escala es una escala proporcional. Esto es lo que se conoce como el problema de la significatividad, esto es, del uso empíricamente significativo que se puede hacer de los valores asignados por las escalas: ¿qué afirmaciones se pueden hacer con estos valores que expresen hechos objetivos y que por tanto no sean verdaderas en una escala pero falsas en otra escala que mide la misma propiedad? En el capítulo 6 trataremos en detalle esta y otras cuestiones que aquí han sido sólo apuntadas. Como allí se verá, el problema de la significatividad está relacionado con otro que hasta ahora apenas hemos mencionado, a saber, qué es lo que permite decir que diferentes escalas son escalas que miden la misma propiedad. Sabemos que si tenemos las diversas escalas que miden una propiedad, esto es, si tenemos la extensión del concepto métrico correspondiente, entonces podemos determinar de qué tipo de escalas se trata investigando cuál es el tipo de transformación que permite pasar de unas a otras. Pero la cuestión es cómo se determina ese conjunto de escalas, cómo se establece la extensión del concepto métrico. Para ello será imprescindible referirse a las condiciones empíricas que debe satisfacer un orden cualitativo para ser representado numéricamente. Tales condiciones son las que permiten establecer, mediante los llamados teoremas de representación, el conjunto de escalas para la propiedad, la extensión del concepto métrico.
En el capítulo anterior hemos examinado la estructura lógica de los conceptos científicos. Dijimos entonces que los conceptos son las unidades mínimas de significación, y efectivamente así es, pero hay que advertir inmediatamente que ese mínimo es, por así decir, demasiado poco. En la ciencia, como en el discurso ordinario, el lenguaje se usa primariamente para realizar aserciones (aseveraciones), para decir que ciertas cosas son de cierto modo. Para este uso los conceptos son esenciales, pero no bastan considerados aisladamente; los conceptos por sí solos no constituyen unidades asertivas. Las unidades aseverativas deben ser necesariamente complejas o articuladas, no hay aserción sin articulación, y la complejidad no es en general esencial a los conceptos. Es cierto que algunos conceptos son complejos (p.ej. bípedo irnplume), pero esta complejidad no es del tipo requerido para constituir aseveraciones. Las unidades aseverativas mínimas son las proposiciones o, en tirminos lingüísticos, los enzrnciados, entidades que sí son esencialmente complejas o articuladas. En el discurso científico, un tipo especialmente importante de unidades proposicionales son las leyes, que se pueden articular a su vez entre ellas conformando unidades más amplias, las teorías. Nuestro objetivo en este capítulo es analizar la estructura lógica. los tipos y la naturaleza de las leyes científicas. La siguiente relación contiene ejemplos representativos de los diversos tipos de leyes, y los diversos aspectos de las mismas, que vamos a tratar:
(1) Cualesquiera dos cuerpos se atraen con una fuerza directamente proporcional al producto de sus masas e inversamente proporcional al cuadrado de la distancia entre sus centros de masa. (2) Los planetas giran en órbitas elípticas, con el Sol en uno de los focos, barriendo áreas iguales en tiempos iguales. (3) Un grave en caída libre cerca de la superficie terrestre recorre en un intervalo temporal t una distancia d = 4.9t2. (4) En un péndulo en la superficie terrestre, la relación entre el período T y la longitud L es T = ~ n d ( ~ 91).. 8
Todo cuerpo sufre una aceleración igual al cociente entre la sucia de fuerzas a las que está sometido y su masa inercial. La probabilidad de que un electrón disparado contra una barrera de potencial la atraviese es de 0,1 y la de que se refleje es de 0,9. La probabilidad de que un átomo de radio permanezca estable después de 4800 años es 0,125. Para cada cantidad de gas, el cociente de la presión por el volumen entre la temperatura absoluta es constante. En condiciones normales, las piezas de fósforo se inflaman tras la fricción sobre superficies rugosas. Salvo mutaciones genéticas, al cruzar células homocigóticas, una con un par de genes recesivos y la otra con un par de genes dominantes, los individuos de la segunda generación tienen una probabilidad de 0,25 de exhibir los rasgos de los genes recesivos. El consumo continuado de tabaco aumenta la probabilidad de desarrollar cáncer de pulmón. La sensación de peligro produce, salvo factores inhibidores, un repentino incremento de la producción de adrenalina. Si una persona desea p , y cree que realizando cierta acción lo obtendrá, y si además la acción es posible y la persona así lo cree y no cree que hacer p se opone a nada que desee tanto o más que p, entonces (si nada interfiere) realizará la acción. El aumento de la oferta produce, a igualdad de los restantes factores, la disminución en el precio del producto. Las leyes científicas, del tipo de las ejemplificadas en esta lista, son unidades aseverativas mínimas del discurso científico, pero no son las únicas. Hay otras aseveraciones también mínimas (y en cierto sentido, que veremos en el capítulo 12 dedicado a la inducción, más básicas), a saber, los informes sobre acaecimientos particulares, p.ej. "el cometa Halley reapareció el 25 de diciembre de 1758", "0,002 gramos de este pedazo de uranio se desintegrarán antes del año 2025", o "acaba de bajar el precio de la gasolina". Presentar de este modo la contraposición entre los dos tipos de unidades aseverativas mínimas del discurso científico supone dar ya una primera caracterización implícita de las leyes. Las leyes son las unidades aseverativas mínimas que no son informes sobre acaecimientos particulares, esto es, las leyes son (un tipo de) aseveraciones generales, expresan regularidodes.
1.
Tipos de generalizaciones y de leyes
En este capítulo partiremos de esta primera caracterización según la cual las leyes son (o son expresadas por) aseveraciones generales. Esta caracterización, dominante. en la
LEY ES C~ENT~FICAS
127
literatura, presupone dos cosas, ambas cuestionadas por algunos autores. En primer lugar, presupone que las leyes son (o que son expresadas por) aseveraciones. Más adelante (cf. cap. 10) veremos que hay un modo menos enunciativo, más modelista, de entenderlas, pero incluso bajo esa interpretación las leyes mantienen algunos elementos aseverativos que son los que en este capitulo van a centrar nuestra atención. En segundo lugar. presupone que son afirmaciones generales, que expresan regularidades del tipo "todos los tal son cual", o "siempre que ocurre tal cosa ocurre tal otra". Esto excluye eventuaIes leyes e.xistenciales como "hay unidades mínimas de energía" o "hay al menos un agujero negro en el universo". Pero ello no es tan grave como en un primer momento puede parecer. Por un lado, casi todas las leyes aparentemente existenciales del primer tipo son en el fondo generales. Por otro, dista de ser claro que haya leyes genuinamente existenciales interesantes, esto es que no se obtengan como meras existencializaciones sobre hechos particulares. En cualquier caso, los ejemplos paradigmáticos de leyes son indudablemente generales. Así pues, aquí vamos a aceptar, al menos provisionalmente, estos dos supuestos. La mayoría de los aspectos de las leyes que vamos a presentar y discutir en este capítulo son en gran medida independientes de los mismos; cuando no lo sean se comentará explícitamente el sentido en que se ven afectados por estos supuestos. Antes de iniciar nuestro estudio propiamente dicho es necesario hacer algunas aclaraciones. En primer lugar, 10 que hemos aceptado no es que las leyes sean (o expresen) meras generalizaciones. Al decir que son aseveraciones generales queremos indicar que son nl menos eso, no que sean sólo eso. Esto es, la caracterización que hemos aceptado provisionalmente como punto de partida no supone que cualquier generalización sea una ley, lo cual es patentemente erróneo; lo que se ha aceptado es algo mucho más débil, a saber, que toda ley involucra al menos una aseveración general del tipo "todos los As son Bs". Parte de este capítulo va a estar destinado precisamente a elucidar la diferencia entre leyes y meras generalizaciones. La segunda aclaración tiene que ver con las cautelas contenidas en los párrafos anteriores. Hemos dicho que las leyes son, o son expresadas por, aseveraciones generales. La formulación alternativa se debe a la necesidad de distinguir entre las entidades lingüísticas (los enunciados mismos, o los actos aseverativos consistentes en proferir tales enunciados) y lo que las entidades lingüísticas expresan o significan (los hechos mismos o, si se prefiere, las proposiciones). Confundir ambos niveles es confundir uso y mención, esto es, no distinguir entre hablar de expresiones lingüísticas y hablar de lo que ellas expresan. En el caso de las leyes se puede defender tanto que ellas mismas son las aseveraciones o enunciados generales, como que son lo que las entidades lingüísticas expresan, las proposiciones (pero, claro está, no las dos cosas a la vez). Ambas alternativas son posibles, si se formulan con el suficiente cuidado. En el primer caso, cuando queramos hablar de las regularidades naturales deberemos decir que son lo expresado por las leyes, en el segundo caso que son las leyes mismas, aunque aquí son necesarias cautelas adicionales. Si bien es conveniente optar por una de las alternativas y atenerse a ella, aquí no vamos a ser muy estrictos en este punto. En general nos inclinamos por la segunda y, por tanto, tenderemos a usar 'ley' para las regularidades naturales mismas, y 'enunciado legal' (o 'enunciado de ley') para los enunciados generales que las expresan. Sin embargo, y siempre que el
contexto lo permita, en ocasiones mezclaremos ambas prácticas, o usaremos expresiones más indefinidas que refieran indistintamente a ambas entidades (p.ej. 'afirmación', que en sentido laxo puede referir tanto al enunciado como a su contenido, la proposición). Cuando la cuestión que se esté tratando exija una distinción clara, explicitaremos el sentido en que usamos el término y los extremos de la discusión que dependen de ello. La última aclaración se refiere al alcance de nuestro estudio. Hay un aspecto de las leyes que por lo general \'a a quedar al margen del tratamiento que vamos a hacer de ellas en este capítulo. Nos referimos a su carácter aproxintotii.~o idealizador. Las leyes, especialmente ]as cuantitativas, contienen diversas idealizaciones que hacen que sólo quepa esperar su aplicabilidad aproximada. Eso tiene la consecuencia de que, si exigimos una aplicación estricta, muchas (jtodas?) leyes aparecerán como, o bien vacuamente verdaderas, o bien "irremediablemente" falsas. Si, siendo totalmente estrictos, la propiedad A no se aplica a ningún individuo, entonces la afirmación "todos los A son B" es vacuamente verdadera por ser su antecedente siempre falso. Por ejemplo, la primera ley de Newton, o ley de la inercia, afirma que todos los cuerpos para los cuales la suma de fuerzas externas sea nula mantienen constante su velocidad, pero seguramente no hay ningún cuerpo que satisfaga el antecedente, con lo que la ley es vacuamente verdadera. La literatura ha prestado mucha atención a situaciones de este tipo (cf. p.ej. Tooley, 1977 y Armstrong, 1983), pero en ocasiones se le concede una importancia a nuestro juicio excesiva. Lo mismo sucede con la "necesaria" falsedad de las leyes cuando, si exigimos roral precisión, A se aplica pero B no. El fenómeno general de la aproximación en la ciencia, y sus límites de admisibilidad, requiere un tratamiento específico que no podenlos presentar aquí. En el capítulo 6 se hacen algunas consideraciones sobre el mismo en el contexto de la función de la medición, y en el capítulo 10 en relación con las afirmaciones empíricas de las teorías. En el presente capítulo sólo vamos a tratarlo en una versión muy específica del mismo, a saber, cuando está relacionado con las idealizaciones contenidas en las leyes con cláusulas cetel-isparibus (sección 4 ).
Hemos dicho que íbamos a partir de la caracterización usual según la cual las leyes son generalizaciones, aunque no cualesquiera generalizaciones sino generalizaciones de cierto tipo específico, a las que denominaremos gei~eraliracionesitómicas. El adjetivo 'nómico' proviene de la voz griega 'noilios', que se traduce por 'ley' (o 'norma', en contextos jurídicos). Decir que las leyes son generalizaciones nómicas, esto es generalizaciones "legales", no aclara por tanto nada por sí sólo. Lo primero que debemos hacer es establecer las características más generales que distinguen a estas generalizaciones de las oeneralizaciones de otros tipos. En esta sección estableceremos tales características muy superficialmente y de modo intuitivo, por contraposición con varios ejemplos de los otros tipos de generalizaciones. En la sección siguiente presentaremos de un modo más sistemático las peculiaridades de las generalizaciones nómicas, principalmente en relación con las regularidades meramente factuales. b
Hay cuatro tipos bisicos de regularidades: regularidades analíticas o conceptuales, regularidades nómicas o leyes, regularidades factuales o accidentales y regularidades epistémicas. La distinción entre ellas tiene que ver con la modalidad. Y la modalidad tiene a su vez que ver con las nociones de necesidad y posibilidad, se refiere al rnodo en que algo es verdadero o falso; si tomamos las leyes como enunciados, debemos decir que son verdaderas o falsas, si las consideramos como hechos, que ocurren o que no ocurren. Siguiendo también aquí la práctica anunciada más arriba, cuando no produzca confusión utilizaremos a menudo indistintamente 'verdadero' y 'que ocurre'. Pues bien, hay afirmaciones verdaderas que son izecesariarnente verdaderas, mientras que otras son verdaderas pero podrían ser falsas; o en término de hechos, hay hechos que ocurren necesarinmertte y otros que ocurren pero podríarz no haber ocurrido. Esto se aplica también a las generalizaciones, esto es a los "hechos" generales del tipo "Todos los A son B . Hay generalizaciones verdaderas que son necesariamente verdaderas, mientras que otras también verdaderas podría~zser falsas. Necesidad y posibilidad son conceptos duales: algo es posible si y sólo si su negación no es necesaria, y viceversa. Por otro lado, la necesidad implica la posibilidad, todo lo necesario es posible; pero no a la inversa, la mayoría de las cosas posibles no son además necesarias, son sólo posibles. Por último, cuando algo es verdadero pero no es necesariamente verdadero decimos que es contingente. Como diría Aristóteles, la necesidad se dice de muchas maneras. El término 'necesario' tiene varios sentidos y cada uno de ellos determina un tipo de modalidad. La diferencia entre los cuatro tipos de regularidades tiene que ver con las diversas nociones modales, con los diversos sentidos de 'necesario' y 'posible' involucrados. Cada modalidad es relativa a un cierto "sistema" o "marco" que se considera fijado: fijadas tales y cuales cosas, algo es necesario/posible relativamente a ese marco si y sólo si su negación es inconsistente/consistente con las cosas que se han fijado. Así, los diversos marcos que fijemos determinan los diversos tipos de modalidad. En el presente contexto nos interesan especialmente tres tipos de cosas que podemos fijar, las correspondientes a las modalidades conceptual, nómica y epistémica. Aquí atenderemos especialmente a las dos primeras (la modalidad epistémica, que mencionaremos muy brevemente, presenta problemas específicos que no conviene abordar ahora). Como el lector advertirá inmediatamente, la distinción entre necesidad conceptual y necesidad nómica presupone la distinción analíticohintético, esto es, la distinción entre verdades en virtud del significado y verdades ernpíricns. Esta distinción tradicional ha sido cuestionada en el presente siglo por algunos filósofos, principalmente Quine en su famoso artículo "Dos dogmas del empirismo" (1951). No vamos a detenemos aquí en estas objeciones. Nuestra finalidad ahora es puramente introductoria y la exposición que hacemos de ésta y otras distinciones es preteórica, no prejuzga ulteriores análisis filosóficos sustantivos de Ias mismas. La modalidad conceptual, o analítica, se deriva de tomar como fijos nuestros conceptos o, equivalentemente, los significados del lenguaje. Algo verdadero es conceprlrnlrnente necesario (en breve: 'C-necesariamente verdadero') si y sólo si su nesación es inconsistente con nuestros conceptos. esto es, si no hay modo de concebir su falsedad sin contradicción; o en términos de significados: algo es C-necesariamente verdadero si y sólo si, manteniendo fijo el significado que tienen las palabras, no hay modo de describir
coherentemente una situación en que eso sea falso. (Esta caracterización presupone las nociones lógicas de consiste~tcia,no contradicció~lo coherencia, esto es, presupone la noción de necesidad Iógica, que consideramos aproblemática en el presente contexto.) Hay muchas verdades que son C-necesarias, y muchas de ellas sc,n "generales". involucran regularidades. La siguiente lista contiene algunas regularidades que inmediatamente se ve que son C-necesarias, otras que inmediatamente se ve que no lo son, y alguna otra (20) sobre la que no sabríamos quizá qué decir sin una inspección mucho más detenida. Los animales racionales son animales. Los solteros no están casados. Los hermanos tienen los mismos progenitores. Las superficies verdes son coloreadas. Ninguna superficie es a la vez totalmente blanca y totalmente negra. Nadie es su propio ancestro. Todos los metales se expanden al calentarlos. Todos los cuerpos cargados eléctricamente con cargas del mismo signo se repelen con una fuerza proporcional al producto de sus cargas. Nadie puede levantarse tirándose de los cordones de los zapatos. (15)-(19) son claramente C-necesarias, no se puede concebir coherentemente su negación, no podemos describir una situación en la que sean falsas. Quizá se piense que sí. Por ejemplo, si 'verde' significase "caliente", entonces (1 8) no sería C-necesaria, pues podemos describir una situación en la que una superficie caliente es incolora. Pero eso es hacer trampa, pues se están cambiando los significados de las palabras. Como muestra la explicación, lo que es entonces C-posible es que una superficie caliente sea incolora, no que una verde sea incolora. Una cosa es describir coherentemente una situación en la que las palabras significan otras cosas y el enunciado 'las superficies verdes son coloreadas' sea con esos otros signifícados falso, y otra muy diferente describir coherentemente una situación en la que ese enunciado con los sig,zificados usuales sea falso, esto es, en la que no ocurra que las superficies verdes son coloreadas. Lo primero es posible, lo segundo, que es de lo que se trataba, no, Análogamente con (19)' si se cree que es C-posible que sea falsa es porque se da otros significados a 'blanco' y 'negro'; se puede pretender, por ejemplo, que una superficie totalmente gris es a la vez totalmente blanca y totalmente negra, pero ese no es el significado usual. Por otro lado, es claro que (21)-(23), aunque verdaderas, no son C-necesarias. Podemos describir coherentemente una situación en la que un metal no se dilate al calentarse, o en la que dos cuerpos cargados positivamente se repelan con una fuerza proporcional al producto del cuadrado de sus masas. Y lo podemos hacer sin cambiar el significado de nuestras palabras, basta con idear un mundo con otras leyes físicas (la buena literatura de ciencia ficción, e.e. la que no describe situaciones contradjctorias, contiene numerosas descripciones de este tipo). Sin embargo, aunque (21)-(23) no son C-necesarias, son necesarias en algúlz sentido. Aquí es cuando interviene la modalidad física o ~zómica.La
modalidad nómica se deriva de tomar como fijas, además de nuestros conceptos, las leyes naturales. Algo verdadero es nómicamente necesario (en breve: 'N-necesariamente verdadero') si y sólo si su negación contradice las actuales leyes naturales, esto es, si no hay modo de describir (teniendo las palabras sus significados usuales) una situación en la que sea falso y sigan cumpliéndose las leyes naturales que de hecho rigen en la naturaleza. Según esta caracterización (y presuponiendo, por mor de los ejemplos, la validez de las leyes naturales que hoy creemos conocer), es claro que, además de (21)-(23), (24) y (25) son regularidades N-necesarias y que (26)-(30) no lo son. (24) (25) (26) (27) (28) (29) (30)
Ningún varón se queda embarazado. Todas las esferas de uranio tienen menos de 1 km de radio. Todas las esferas de oro tienen menos de 1 km de radio. Todos los bípedos implumes son humanos. Todos los cuervos son negros. Todas las cebras son rayadas. Todas las monedas del bolsillo derecho de los pantalones de Quine en Nochevieja de 1990 son doradas.
Tomando como ejemplos paradigmáticos (25) y (26), es inmediato por qué aunque ambas regularidades son verdaderas, la primera es N-necesaria y la segunda no: (25) es implicada por las leyes físicas, (26) no. La existencia de una esfera de uranio de tal tamaño es incompatible con las leyes físicas sobre la estabilidad límite del uranio, mientras que en el caso del oro, aunque de hecho tampoco haya ninguna esfera así, el que la hubiera no violaría ninguna ley física. Análogamente con (30): que, aunque de hecho no la tuvo, Quine tuviera una moneda no dorada en su bolsillo en dicha fecha no parece violar ninguna ley natural. Con (28) y (29) no es quizá tan inmediato, pero un poco de reflexión muestra que tampoco son N-necesarias. Por lo que hoy sabemos, las leyes naturales son compatibles con la existencia de cuervos no negros. Por ejemplo, tales leyes no parecen excluir que algunos cuervos pudieran haber emjgrado a zonas árticas y, tras un tiempo y como resultado de la selección, haber desarrollado plumaje blanco, sin dejar por ello de ser cuervos. A las regularidades que aun siendo verdaderas no son N-necesarias se las denomina regularidades fácticas o accidentales. La primera expresión, si se interpreta sugiriendo sólo que estas regularidades son "hechos", es engañosa pues las regularidades nómicas también son hechos. Por 'fáctico' se debe entender aquí "meramente ocurrente", esto es, que ocurren como cuestión de hecho pero no de derecho, que ocurren pero N-podrían no ocurrir. Eso es lo que connota 'accidental'. Ambas expresiones son pues sinónimas de 'N-contingente'. Nótese que la distinción entre regularidades accidentales y nómicas sólo discrimina regularidades si no todo hecho general está cargado de necesidad física, esto es, si el mundo no es determinista (en uno de los sentidos de 'determinismo', pues según otro sentido hay regularidades nómicamente necesarias indeterministas, las leyes probahilistas, cf. sobre esto más adelante sección 5). En caso contrario no habría propiamente regularidades N-contingentes, todas las regularidades verdaderas, todos los estados de
cosas generales "que ocurren", serían físicamente necesarios. Hasta el que las monedas del bolsillo de Quine en tal fecha sean doradas sería N-necesario, pues en un mundo deteminista (en esta acepción) todo lo es. Eso no quiere decir que la distinción sea incorrecta, pues ella es independiente de lo que ocurra de heclzo en última instancia con el deteminismo. La distinción distingue dos conceptos realmente diferentes, sólo que si el mundo resulta ser determinista uno de esos conceptos, el de regularidad accidental, n o se aplicaría a nada: las que ahora nos parecen regularidades accidentales serían simplemente aquellas regularidades nómicas acerca de cuyas leyes no tenemos la menor idea ni siquiera de que existan. La modalidad epistémica, de la que no hemos dicho nada hasta ahora, tiene que ver con casos como (28) y (29). En la modalidad epistémica se consideran fijadas las regularidades que constituyen nuestro acceso epistémico usual a cierto ámbito. Así, aunque la esencia de los cuervos no implique la negrura de su plumaje, esa regularidad no Al-necesaria interviene esencialmente en el modo como típicamente reconocemos a los cuervos. En ese sentido, episré~nico,(28) es "necesario". Pero se trata de una "necesidad" claramente antropomórfica, no está "en la naturaleza" (la prueba es que N-puede haber cuervos blancos) sino en nuestro modo de acceder a ella. Sólo está en la naturaleza en el sentido en que nuestro conocimiento es también un fenómeno natural. Hay otras modalidades antropomórficas. Por ejemplo la deóntica, que queda determinada al fijar las regularidades o normas morales. También en ese sentido hay cosas "necesarias", cosas que deben ocurrir en el sentido de que se deben lzacer; por ejemplo, si fuese una norma moral no acumular determinada cantidad de oro, (26) sería deónticamente necesario. Como se apreciará, estas modalidades no implican que la regularidad sea verdadera. por lo q u e para algunos es mejor no hablar en estos casos de ~zecesidad;se trataría s610 de modalidad "aparente", de lo que puede o no puede ocurrir en el sentido sólo de que es compatible con nuestras creencias (modalidad epistérnica), o con nuestras leyes moraIes (modalidad deóntica). Esta cuestión, que afecta a cualquier modalidad antropomórfica, es en parte nominal y no vamos a discutirla aquí; bastará admitir que en la llamada modalidad epistémica el uso de 'necesario' es al menos tan legítimo (o ilegítimo) como su uso en la modalidad deóntica. De momento no vamos a abundar más en la modalidad epistémica. Nos interesaba sobre todo la modalidad nómica, su diferencia con la conceptual y su contraposición con la accidentalidad o mera facticidad. Las leyes son las regularidades verdaderas nó~nicaiíteitre itecesarias. Nótese que esto no constituye un análisis del concepto de ley mediante el de necesidad nómica, pues hemos definido la modalidad nómica en términos de las leyes naturales. No pretendíamos aquí analizar el concepto de ley, sino tan sólo mostrar que dicho concepto involucra cieno tipo de necesidad y contrastar intuitivamente el tipo de modalidad propio de las leyes con otras modalidades, especialmente la conceptual, y con las regularidades nómicamente contingentes, accidentales. Antes de abandonar esta primera aproximación intuitiva conviene mencionar una consecuencia relativamente extraña que se sigue de la caracterización que hemos hecho. Si las regularidades nómicas son aquellas cuya falsedad queda excluida por las leyes naturales, entonces (31) y (32) son regularidades nómicas.
LEYES CIENTIFICAS
( 3 1)
133
Todos los metales negros se expanden al calentarse.
(32) Ningún varón que toma píldoras anticonceptivas se queda embarazado. Estas re~ularidadesson verdaderas y no son en absoluto accidentales. Las leyes de la física son incompatibles con que un metal negro no se expanda a1 calentarse, y las de la biología con que un varón que toma píldoras se quede embarazado. Se trata pues de regularidades con el tipo de necesidad que caracteriza a las regularidades nómicas, y sin embargo parece que en algún sentido no son leyes del todo genuinas. El motivo, en términos intuitivos, es que contienen elementos nómicnmente irrelevnntes, pero es extremadamente difícil dar una caracterización precisa de esa irrelevancia. Parece en principio que estas regularidadzs se caracterizan por ser derivadas o implicadas por otras leyes más simples (en estos casos, (21) y (24) respectivamente). Esas otras leyes son mAs fuertes, pues no vale la implicación inversa, y por tanto las más débiles resultarían prescindibles. Pero esta estrategia para distinguir regularidades nómicas de leyes genuinas no funciona. La ciencia está repleta dz leyes implicadas por otras y que en absoluto contienen elementos irrelevantes. En realidad los casos de irrelevancia parcial no son más que casos particulares de un fenómeno general dzrivado del hecho de que la necesidad nómica se preserva bajo la implicación lógica: si u es N-necesaria y P es consecuencia lógica de a, entonces j3 tambiin es N-necesaria. Por tanto, si "Todos los A son B" es una regulariada nómica, también lo es "Todos los A y C son B", sea lo que sea C. En algunos casos, como (31) y (32), C es nóniicaments irrelevante, pero en otros quizá no. Por ejemplo, "Todos los C son B" puede ser también una ley, en cuyo caso "Todos los A y C son B" no contiene elementos nómicamente irrelevantes sino nótnicanzer~teredundnrztes. Puesto que el origen es el mismo, a saber, la clausura de la nomicidad bajo implicación lógica, no parece que se deban tratar de modo diferente los casos de irrelevancia y los de redundancia. O cualquier otro caso debido al mismo fenómeno, como los disyuntivos: si "Todos los A son B" y "Todos 10s C son D" son leyes, entonces la generalización "Todos los A o C son B o D" es nómicamente necesaria. Esto suscita el problema general de la conveniencia o no de distinzuir entre leyes y generalizaciones nómicac: las leyes serían aquellas generalizaciones nómicas que cumplen además cierta; condiciones adicionales. En tal caso, aunque toda consecuencia general de una ley es por definición una regularidad nómica, no toda consecuencia general de una ley sería otra ley; la legalidcrcl no se preservaría bajo la consecuencia lógica, o como se dice a veces. el operador 'es un ley ...' no es veritativo-funcional, no se preserva bajo relaciones de implicación lógica (cf. p.ej. Fodor, 1974). Esta es una cuestión todavía abierta y que no vamos a tratar aquí en detalle. Algunos aspectos de la misma surgirán más adelante en este mismo capítulo y en otros posteriores, como el dedicado a la explicación. En general, y salvo advertencia en contrario, seguirenios identificando leyes y regularidades nómicas. Mientras que la presunta diferencia entre leyes y resularidades nómicas es discutible, la diferencia entre regularidades nómicas (o leyes) y regularidades accidentales no lo es, no requiere discusión sino elucidación. De ella nos ocuparemos en la próxima sección. Concluiremos ésta presentando 10s principales tipos de leyes que se van a tratar en el resto de este capítulo y en otras partes de la obra.
134
1.3.
R-ND.%SIE\TOS DE R L O S O F DE ~ LA CIENCIA
TIPOSDELEYES
Hay varias tipologías de las leyes, dependiendo de los criterios que se usen para su clasificación. Una posibilidad es distinguirlas por la relación temporal entrz los estados del sistema. Un sistema (p.ej. un gas, un péndulo, unas bolas de billar) es un complejo de entidades que se pueden relacionar de diversos modos. Cada uno de esos modos es un estado posible del sistema y las leyes restringen las relaciones entre los posibles estados (sobre la noción técnica de estado, cf. cap. 10, $4.3). De todas las relaciones conceptualmente posibles, sólo algunas de ellas, las permitidas por las leyes, son nómicamente posibles. Si las restricciones que impone una ley se refieren a estados temporalmente simultáneos, se trata de una ley de coexistencia. si se refieren a la sucesión o transición entre estados, de una ley de sucesión. Son leyes de coexistencia, p.ej., la ley de Boyle "(P x V)/T= cte." o la del péndulo "T = 2xd(~9,81)".Las leyes (cuantitativas) de coexistencia establecen una relación entre los valores siinultáneos de las diversas magnitudes involucradas. Así, la ley de Boyle establece que, de todos los tríos de valores <p. v, t> lógicamente posibles (siendo p, v y t, respectivamente, valores específicos de la presión, el volumen y la temperatura) sólo aquellos en los que O, x v)/t es cierta constante (que depende de la cantidad y naturaleza del gas) son físicamente posibles. Contra lo que en principio podría parecer, también en las leyes de coexistencia tiene sentido hablar de las "condiciones antecedentes" y del "resultado-consecuente": las primeras son los valores en determinado momento de todas las magnitudes menos una, y el segundo es el valor de dicha magnitud. Las leyes (cuantitativas) de sucesión establecen las relaciones que deben darse entre dos estados sucesivos para que uno pueda transformarse en el otro. Son Ieyes típicas de sucesión las diversas leyes que establecen el incremento en una magnitud como efecto de la variación de otras (el de longitud de una vara metálica por variación de la temperatura, el de la temperatura de una sustancia por efecto del calor, el de la velocidad de un móvil por efecto de una fuerza, etc.) o los diversos principios de conservación (del momento lineal, de la energía cinética, etc.). Por ejemplo, en los choques elásticos los estados del sistema se determinan por la masa y la velocidad de cada partícula, esto es, son tétradas cml, m., vi, v2>, y el principio o ley de conservación del momento lineal establece que, para que un estado x = <?ni,inz, vi, v2>N-pueda suceder a otro y = <mif, m*', V I , vl>, ha de ocurrir que m, V I + m 2ví = ?nlfvif + rn4v;. La diferencia entre leyes de coexistencia y leyes de sucesión es parcialmente relativa al modo como describamos las leyes. Por un lado, las leyes de coexistencia pueden verse además como leyes de sucesión. Por ejemplo, la ley de Boyle determina que un estado <p, v, t> N-puede transitar a otro posterior <pf, vf, rl> si y sólo si la cantidad (P x V)/T es la misma en ambos estados. Por otro, algunas leyes de sucesión, típicamente las leyes del movimiento, pueden ser vistas como leyes de coexistencia si introducimos el parámetro temporal como constituyente de los estados del sistema (cf. van Fraassen, 1989, pp. 223-224). En otros casos es menos natural, o incluso muy implausible. Por ejemplo, la ley de dilatación de los metales establece que la longitud final L,es igual a la inicial L; más cierto coeficiente de expansión (propio de cada metal) I
f
por el incremento de temperatura T, - z: . l , = L; + u ( T , - Ti). De ahí se deriva que el cociente (L,-Li)I(T,-ír,) es constante para cada metal, pero es dudoso que esto se pueda presentar como una ley de coexistencia genuina, pues ese valor constante involucra esencialmente estados sucesivos. La segunda distinción es entre leyes probabilistas y leyes no probabilistas, también IIamadas a veces detenninistas. Una ley probabilista es aquella cuya expresión hace referencia explícita a la probabilidad. De nuestra lista inicial, (6), (7), (10) y (1 1) son leyes probabilistas. Algunas de ellas son aplicaciones particulares de leyes probabilistas más así, por ejemplo, (7) es un caso particular de la siguiente ley general sobre desintegración radiactiva:
(33) La probabilidad de que un átomo de cierta sustancia permanezca estable durante el intervalo temporal t es igual a e-A*,siendo A la constante de desintegración radiactiva de la sustancia.
/1 f
1 1 i
1
!i
1
Las leyes probabilistas establecen la coexistencia o transición entre estados sólo con cierta probabilidad p (O c p < 1). Por tanto, y contrariamente a lo que ocurre con las leyes deterministas, es nómicamente posible que aun siendo la ley verdadera se den las condiciones antecedentes y no se den las consecuentes. Ello hace que algunos autores rechacen que en las leyes probabilistas se pueda hablar dz N-necesidad en sentido propio. En tercer lugar, podemos distinguir entre leyes estrictas y leyes no estrictas o interjeribles. Las leyes no estrictas son leyes tales que puede darse la condición antecedente y no la consecuente (y ello independientemente de que sean probabilistas o no). El motivo es que las leyes no estrictas incluyen las llamadas cláusulas ceteris paribcis (CP), que equivalen a condiciones antecedentes adicionales más o mecos indefinidas. Estas cláusulas son del tipo "si todo lo deinás permanece igual", "si nada interfieie", "si no intervienen factores adicionales", etc. Una ley no estricta o CP tiene pues la siguiente forma: "Todos los A son, ceterisparibrts, B"; los ejemplos (9), (lo), (12). (13) y (14) de nuestra lista inicial son claramente leyes no estrictas. Si, como es usual, por condición antecedente entendemos s ó l ~la condición principal A, entonces las leyes no estrictas se pueden calificar de integeribles, pueden tener "excepciones": dándose A se puede interferir la ocurrencia de B si las condiciones CP no se satisfacen. O más precisamente: la relación nómica entre antecedente y consecuente se altera al añadir al antecedente nuevas condiciones. Esta formulación deja claro, como se mostrará más adelante, que puede haber leyes probabilistas tanto estrictas como no estrictas, el carácter estricto o no estricto de una ley es en principio independiente de su carácter probabilista o no probabilista (en principio, pues como veremos en las secciones 4 y 5 , a veces se intenta reducir unas a otras). Normalmente las cláusulas CP se incluyen explícitamente en la formulación de la ley, pero puede ocurrir que leyes que se formulan sin tal cláusula, y que parecen por tanto estrictas, en realidad sean interferibles. Por ejemplo, la ley de Kepler, (2). no contiene cihusula CP explícita y sin embargo es claramente interferiblr (p.ej. por presencia de otros astros). Esto ocurre en general con las leyes aparentemente estrictas que contienen idealizaciones, pues las idealizaciones equivalen a cláusulas CP
implícitas. Veremos que es una cuestión abierta si hay leyes verdaderame~~te estrictas, conlo parecen en principio (1) y ( 5 ) . Por último, se suele distinguir también entre leyes causales y leyes no causales. Las leyes causales son regularidades nómicas que contienen o expresan un vlítculo causal entre condiciones antecedentes y consecuentes. En principio, y dejando de momento de lado la problematización filosófica del concepto de causa, (S), ( l l ) , (12) y (14) son claramente leyes causales, y (2) y (3) claramente no lo son. Las leyes cinernáticas de Galileo no contienen elementos causales; tampoco las de Kepler (al menos en su formulación usual, pues tal como él Ias formuló sí contenían un elemento causal, a saber, el ailirna /liotr-ix que atribuía al Sol). Por otro lado, es inmediato que las leyes causales han de ser leyes de sucesión, pues los efectos suceden temporalmente a sus causas. Por ello, si se considera causal una ley de coexistencia es porque se reformula en términos de sucesión; por ejemplo, la ley de gases ideales se puede considerar causal en su versión como ley de sucesión: determinado incremento de temperatura produce, a volumen constante, determinado aumento de presión. Sobre las leyes de coexistencia y sucesión volveremos brevemente en el capítulo 10 cuando examinemos las versiones de la concepción semántica de las teorías en términos de espacios de estado. Algunas nociones causales básicas, y su relación con las leyes, se introducirán brevemente en la sección 3 y se retomarán en el capítulo 7 dedicado a la explicación científica. De las leyes no estrictas nos ocuparemos en la sección 4, y de las probabilistas en la 5. Antes de ello, como anunciamos, vamos a ver con más detalle la diferencia entre leyes y regularidades accidentales.
2. Leyes y regularidades accidentales Para simplificar la exposición, ignoraremos de momento las complicaciones debidas a la probabilidad y a la interferibilidad, y vamos a restringir las consideraciones de esta sección a leyes estrictas no probabilistas. Tanto las regularidades accidentales como las nómicas (estrictas no probabilistas) son "hechos" generales "que ocurren" del tipo "Todos los A son B" y la cuestión es elucidar su diferencia, determinar qué distingue unas regularidades de otras. Esta elucidación se puede llevar a cabo de dos modos. Se puede intentar dar condiciones necesarias y suficientes para que una reguIaridad sea una ley, esto es, dar un análisis completo del concepto de lq.Esto no es lo que vamos a hacer aquí; parte de ello será el objeto de la última sección, en la que revisaremos las líneas generales de los principales análisis de las leyes, sus méritos y dificultades. Nuestro objetivo ahora es mucho más modesto y propedéutico. Se trata sólo de señalar una serie de propiedades que intuitivamente distinguen a las leyes de las regularidades accidentales. Pero ni individualmente, ni conjuntamente, se pretende que constituyen un análisis del concepto le),, son s61o condiciones a las que todo análisis debe en prirzcipío adecuarse; en principio, pues no todas tienen la misma fuerza inruitiva y quizá las menos fuertes pueden cuestionarse en algunos análisis (mencionaremos también alguna condición que, aunque a veces se ha propuesto, hay buenas razones para desestimar).
En lo que sigue vamos a suponer que las leyes que manejemos como ejemplos, y en general las leyes que hoy aceptamos, son verdaderas. Ese es un supuesto claramente discutible, y casi seguro falso, pero no afecta a nuestra actual tarea. Quizá todas las regularidades que hoy creemos que son leyes no lo sean, por ser falsas, pero eso no afecta en general al concepto de ley. La cuestión es la siguiente: si esas cosas fuesen efectivamente leyes naturales, ¿qué podríamos decir de ellas que no podemos decir de otras regularidades, y en especial de las meramente factuales?
A veces se ha propuesto que las leyes, a diferencia de las generalizaciones accidentales, no pueden contener referencia alguna (ni implícita ni explícita) a objetos particulares, lugares o momentos específicos, esto es, deben ser piiramente generales (nótese que esta generalidad pura excluye también predicados que encubren implícitamente referencia a particulares, como 'barcelonés' o 'venusiano'). La regularidad sobre las monedas del bolsillo de Quine, o la de que todos los barceloneses aman su ciudad, violan esta condición y no son por tanto leyes. Sin embargo esta condición es excesiva, pues excluye leyes claramente aceptadas como tales, p.ej. las de Kepler, que hacen referencia al Sol. La respuesta (cf. Hempel y Oppenheim, 1918) es aceptar algunas de estas generalizaciones no puras como leyes si son derivables de otras puras; a éstas se las considera las leyes jilndatnentales y a aquéllas leyes derivadas. Pero esta estrategia no es viable por dos motivos, uno histórico y otro lógico: primero, las leyes de Kepler eran consideradas leyes genuinas antes de la existencia de las leyes fundamentales de las que se derivan (las leyes de Newton); y segundo, es obvio que de generalizaciones puras solas no se pueden derivar generalizaciones no puras, hacen falta además afirmaciones particulares pues las generalizaciones no puras hablan implícitamente de objetos particulares. Una condición con espíritu semejante, pero más débil, es que la generalización sea irrestricta (cf. p.ej. Nagel, 1961, cap. 4, $1). Tanto las leyes de Kepler como p.ej. la generalización accidental "Todos los tomillos del auto de Srnith, a mediodía del Año Nuevo de 1990, están oxidados" contienen referencia a particulares. La diferencia radica en que el ámbito de aplicación de la segunda está restringido a una región espaciotemporal y e1 de la primera no, pues aunque los planetas estén de hecho en determinada región ello no está presupuesto por la ley. Pero esta condición sigue siendo parcialmente insatisfactoria. En primer lugar, es discutible que no pueda haber leyes genuinas que involucren esencialmente regiones espaciotemporales particulares (p.ej. sobre los tres primeros minutos del universo, o quizá algunas leyes geológicas sobre la Tierra no generalizables a otros planetas). Y en segundo lugar, muchas generalizaciones accidentales satisfacen esa condición; por ejemplo, las generalizaciones sobre la inexistencia de grandes esferas de oro y uranio son ambas irrestrictas, pero sólo la del uranio es nómica.
FL!MD,4\IE\TOS DE F I L O S O F ~DE ~ L.4 CIENCIA
Otra condición propuesta a veces es que las leyes, a diferencia de las generalizaciones accidentales, no pueden ser vacuamente verdaderas. "Todos los minotauros son mamíferos" es vacuamente verdadero, pues su antecedente no se aplica a nada, pero ello no afecta en absoluto a su carácter de mera regularidad; sin embargo, no aceptaríamos ese tipo de regularidades como leyes. Tampoco esta condición es clara. "Todo hilo de cobre a -270 "C es buen conductor" es seguramente vacuamente verdadera y no es evidente que no sea una ley, pues sí lo es "Todo hilo de cobre es buen conductor". Se puede proponer que una generalización vacuamente verdadera es aceptable como ley siempre y cuando se derive de otra ley no vacuamente verdadera. Nótese que esto incluiría (Lcontraintutivamente?) como casos específicos aquellos en los que la no aplicación del antecedente se deriva de una ley, p.ej. "Toda esfera de uranio de más de 1 km de radio es inestable". Pero esta modificación no parece suficiente debido a las idealizaciones. Las leyes genuinas contienen a menudo idealizaciones, p.ej. superficies sin fricción o espacio vacío, que pueden no ser nunca satisfechas. Por otro lado, es poco plausible aceptar como ley cualquier generalización vacuamente verdadera consecuencia de una ley, p.ej. (1) "Todo varón embarazado tiene branquias", que se deriva de la ley (2) "Ningún varón queda embarazado". Éste es un caso particular del problema que hemos comentado más arriba sobre el eventual carácter legal de las consecuencias lógicas de las leyes. Pero es un caso particular muy especial. De (2) se sigue lógicamente tanto (1) como (3) "Todo varón que toma pastillas no se queda embarazado", y mientras es discutible si (3) es una ley, parece claro que (1) no lo es dado que su antecedente es nómicamente imposible.
Las regularidades nómicas se consideran confirmadas por sus instancias, las accidentales no. La constatación de que una moneda del bolsillo de Quine es dorada no confirma por sí sola el que las restantes lo sean. Para confirmar esto hay que haber comprobado todas y cada una de las monedas, y hasta la última moneda no podemos, por así decir, pronunciamos sobre la regularidad. Sin embargo, si la regularidad es una ley, la constatación de instancias particulares se acepta como confirmación de la ley; eso sí, confirmación parcial, y tanto mayor cuanto mayor sea el número de instancias constatadas. Es cierto que es un difícil problema filosófico precisar esta noción de confirmación (que ya usamos en el capítulo 3), pero ahora no necesitamos ocuparnos de él (cf. el capítulo 12 dedicado al problema de la inducción), nos basta una preconcepción intuitiva de la confirmación. Y relativamente a esa preconcepción, la cuestión es que, en la inedida en que una generalización se considere nómica, se estará dispuesto a considerarla confirmada (en cierto grado) a través de sus instancias concretas. Si la generalización es considerada accidental, "hasta la última instancia" no podemos decir nada, ni siquiera de grado (por elIo, si hay generalizaciones accidentales cuyo antecedente se aplica a un número infinito de objetos, tales regularidades son inconfirmables por principio). Es cierto que en
LEYES CIE>T~FICAS
139
cualquier regularidad, incluidas las accidentales, si se examina p.ej. el SO % de los A y resulta que todos ellos son B. podemos decir algo, a saber, que la regularidad probabilista "La probabilidad de que un A sea B es al menos de 0,8" está bien confirmada. Pero esa es una regularidad diferente de "Todos los A son B", que era de la que se trataba. Sobre estas cuestiones volveremos en el capítulo 12.
Tanto las leyes como las meras regularidades accidentales sirven para "predecir" sobre los casos ya conocidos. Si todos los A conocidos son B, desde luego que si este objeto es uno de los A conocidos entonces "será" B. Pero por supuesto a la ciencia no le interesa este tipo de "predicción". La que interesa es la predicción sobre casos desconocidos, y en ella leyes y regularidades accidentales se comportan de modo muy diferente; con las primeras estamos justificados al hacer predicciones sobre nuevos casos, con las segundas no. No está justificado predecir que la próxima moneda que entre en el bolsillo de Quine será dorada, pero sí lo está predecir que el próximo trozo de metal que se caliente se expandirá. Esta diferencia está relacionada con la anterior relativa a la confirmación, pues podemos hacer predicciones sobre nuevos casos en la medida en que la regularidad esté confirmada.
Las leyes son explicativas, las regularidades accidentales no. Si queremos una explicación de por qué esta moneda particular es dorada, no es una buena respuesta decir que es dorada porque estaba en el bolsillo de Quine en cierta ocasión y que en tal ocasión todas las monedas de su bolsillo eran doradas; una buena explicación es, por ejemplo, que la moneda es de oro puro y que todas las piezas de oro puro son doradas. En ambos casos el hecho a explicar se deriva de otro hecho particular y de una regularidad verdadera, pero sólo el segundo proporciona genuina explicación, pues sólo la segunda regularidad es nómica. Sobre esta cuestión tendremos ocasión de extendemos en el capítulo 7 dedicado a la explicación científica.
A veces se ha sugerido que la legalidad-nomicidad descansa en la causalidad. En las regularidades nómicas, contrariamente a lo que ocurre en las accidentales, hay una relación causal entre las condiciones antecedentes y consecuentes. Esta condición tiene un interpretación débil y otra fuerte. La interpretación fuerte es que toda ley contiene explícitamente elementos causales. Así interpretada es claramente incorrecta. Como mencionamos más arriba, hay leyes genuinas, como las de Galileo o Kepler, que no son causales en L
este sentido fuerte. En su interpretación débil, afirma que toda ley que no sea directamente causal se subsume en, o deriva de, otras que sí lo son; p.ej. las mencionadas se derivan de las leyes de hTeulton. Si ello significa que no se consideran leyes sin disponer de tal derivación, sigue siendo incorrecto, pues aunque, p.ej., las leyes de Kepler recibieron un fuerte respaldo al derivarlas Ne\vton de su sistema, fueron consideradas leyes perfectamente legítimas antes de que A'ei{.ton desarrollara su mecánica. Se puede debilitar todavía más y decir que las leyes no causales son "en principio" o "en última instancia" derivables de leyes causales. Pero esto sólo se puede defender proporcionando una teoría sustantiva y muy específica de la causalidad. discutible filosóficamente y, en cualquier caso, no inmediatamente coincidente con nuestras intuiciones preteóricas.
Si bien es dudoso que las leyes son siempre causales (en el sentido intuitivo preteórico), no lo es que siempre suponen cierto tipo de necesidad entre las propiedades involucradas. Como vimos, este elemento de necesidad es sobre el que descansa un tipo específico de modalidad, la nómica. Las leyes son esencialmente modales. Una de las manifestaciones de su naturaleza moda1 es que soportan o apoyan cierto tipo específico de afirmaciones modales, las afirmaciones condicionales contrafácticas. Un condicional contrafáctico, o subjuntivo, es una afirmación del tipo "si hubiera ocurrido a, habría ocurrido P", o "si ocurriera a, ocurriría p.Contra lo qua a veces se sugiere, no toda afirmación de este tipo presupone que el antecedente de hecho no ha ocurrido; eso puede sugerirlo la primera forma, pretérita, pero desde luego no la segunda (y nada realmente esencial de la semántica de los condicionales subjuntivos depende de ello). Pues bien, las leyes dan apoyo a este tipo de expresiones, las regularidades accidentales no. El que todas las monedas que de hecho hay en cierto momento en el bolsillo de Quine sean doradas no nos permite afirmar que si esta moneda estuviera en tal momento en ese bolsillo también sería dorada; de que todos los que vinieron de hecho a cenar fuesen varones no se sigue que si Rosa hubiese \.enido, sería varón. Contrariamente a lo que ocurre con las regularidades accidentales, las leyes sí permiten afirmar sobre su base situaciones contrafácticas. Puesto que es una ley que los metales se dilatan al calentarse, podemos afirmar que si caleríráse~ííoseste trozo de metal se dilataría; puesto que es una ley que la madera flota en el agua, si El Moisés de Miguel Ángelfiese de madera,floraría en el agua. Este hecho es el que está detrás de las diferencias anteriores relativas a la predicción y la explicación. La predicción no es más que la aplicación de un contrafáctico en el que el antecedente puede no haberse dado todavía pero se dará. Si una ley explica es justamente porque contiene el elemento de modalidad expresado en el contrafáctico que apoya. Tal como dijimos en términos informales en la anterior sección, la modalidad, que se manifiesta en su capacidad de apoyar contrafácticos, es esencial a las leyes. Incluso si una ley "Todos los A son B" es tal que la condición antecedente nunca se da de hecho, sigue siendo cierto que si se diera tal condición, se daría también la condición consecuen-
te. Éste es un motivo adicional para matizar la importancia a la discusión sobre la vacuidad. No hay especial problema en que una ley sea vacuamente verdadera contemplada corno generalización condicional material, pues lo que importa es su aspecto modal, que no queda explícito si se la contempla así. En realidad, es inadecuado contemplar las leyes como siendo sólo generalizaciones materiales. Lo correcto es decir que iinplican generalizaciones materiales, pero entonces es claro que el que la generalización materia\ imp\icada sea vacuamente verdadera no tiene por qué afectar a la ley. El núcleo de la cuestión es que si ','Todos los A son B" es una ley, entonces esta generalización contiene esencialmente un elemento modal; es una generalización material "con algo más" y ese algo más es de carácter modal.
1
i
La capacidad de las leyes de apoyar contrafácticos es la expresión más manifiesta de su carácter modal, pero no la única. Ya hemos mencionado que su función explicativa y predictiva se deben en el fondo a lo mismo. Otra manifzstación especialmente clara de la modalidad de las leyes es su intensionalidad. Recordemos (cf. cap. 4, $1) que cierta característica aplicable a afirmaciones es e.rtensiorzal si siempre se preserva al sustituir un atributo por otro coextensional (e.e. que se aplique a los mismos objetos); si alguna de estas sustituciones coextensionales modifica la característica entonces decimos de ella que es intensional. En términos linpüísticos: el operador correspondiente a dicha característica es extensional si el enunciado que contiene dicho operador preserva el valor veritativo tras una sustitución tal; es intensional en caso contrario, esto es, si no vale la sustitutividad salva veritare de expresiones coextensionales. Pues bien, es fácil ver que la nomicidad es una característica intensional. Por ejemplo, 'humano' y 'bípedo implume' son predicados coextensionales (todo bípedo implume es humano y viceversa), "Todo humano es primate" es una ley pero "Todo bípedo implurne es primate" no lo es, pues es biológicamente posible la existencia de bípedos implumes no primates. Por tanto, el operador de nomicidad genera contextos intensionales: en los enunciados del tipo 'es un ley que todos los A son B' no rige la sustitutividad salva veritate de expresiones coextensionales: la sustitución p.ej. de 'A' por otro predicado coextensional 'C' puede modificar su valor veritativo (entiéndase bien, puede variar el valor veritativo del enunciado 'es una ley que todos los A son B', no el del enunciado 'todos los A son B'). Es sencillo ver que el valor veritativo se altera justamente cuando la coextensionalidad de los atributos no es nómica sino accidental, esto es, cuando la regularidad bicondicional "Todo es A si y sólo si es C'es meramente fáctica. Eso es lo que ocurre en nuestro ejemplo, pues "todo bípedo implume es humano y viceversa", aunque verdadero, no es una ley. Si la coextensionalidad es ella misma nómica, .entonces la sustitución preserva la nornicidad. La intensionalidad es una de las características distintivas de cualquier tipo de modalidad, por ejemplo la conceptual. El operador de C-necesidad es intensional: 'es C-necesario que todo animal racional es racional' es verdadero, 'es C-necesario que todo
142
FUND.-~SIE\TOS DE FILOSOFL-~ DE L.\ CIENCIA
bípedo implume es racional' es falso. La intensionalidad de las leyes no es más que consecuencia de que éstas involucran otro tipo de modalidad, la modalidad nómica. Las expresiones 'es una ley que ...' y 'es N-necesario que ...' no son más que \miantes estiiísticas del mismo operador modal. Recuérdese que de momento estamos identificando las leyes con las generalizaciones nómicas. Si por los motivos discutidos más amba (el discutible carácter legal de algunas consecuencias lógicas de las leyes) no los identificamos. entonces el primer operador sería modalmente más restrictivo que el segundo; ambos sen'an intensionales, pero el segundo, a diferencia del primero, se preservaría bajo relaciones lógicas de implicación. En adelante, cuando queramos enfatizar el aspecto moda1 de las regularidades nómicas utilizaremos ocasionalmente como abreviatura de 'es una ley (es una regularidad nómica, es N-necesario) que todos los A son B' la expresión ' A N-implica B'. Por lo dicho hasta aquí, debe quedar claro que. en los casos de leyes estrictas y no probabilistas a los que ahora nos restringimos, de "A ,AT-implicaB" debe seguirse el universal material "Todos los A son B", pero no a la inversa. Éste es un hecho básico al que debe atenerse cualquier análisis filosófico del concepto de ley (cf. la última sección).
Este aspecto está estrechamente relacionado con los relativos a la predicción de nuevos casos y a la confirmación por instancias. Decimos que una regularidad observada es proyecrable si estamos justificados a proyectarla hacia el futuro. Así, por ejemp1o;todas las esmeraldas observadas hasta la fecha son verdes y parece que podemos proyectar esta regularidad: las futuras esmeraldas que se observen serán verdes. Goodman (1955) mostró con un famoso ejemplo que esta cuestión es más complicada de lo que parece. Digamos que algo es 'verdul' syss es observado antes del año 2000 y verde, u observado después del año 2000 y azul. Tenemos entonces otra regularidad observada, a saber, que todas las esmeraldas observadas hasta la fecha son verdules, y sin embargo parece que ésta no se puede proyectar. 0, en otros términos, parece que la experiencia observada permite confirmar la regularidad "Toda esmeralda es verde" pero no "Toda esmeralda es verdul". La cuestión es por qué. En esta cuestión están implicados los problemas centrales de la inducción (el principio de regularidad de la naturaleza, inferencia a la mejor explicación, etc.), que estudiaremos en su momento. De momento sólo nos interesa mencionar su conexión con las leyes. Una posible respuesta a este problema es decir que verde es proyectable y verdul no porque verde interviene en leyes mientras que verdul no. Pero si definimos los atributos proyectables como aquellos que intervienen en leyes, entonces el problema es especificar qué distingue a las leyes. Una posibilidad a la que se suele recumr es distinguir entre clases (géneros, atributos, propiedades) lzaturales y clases no naturales. Podemos agrupar las cosas en las clases que queramos, pero no todas esas agrupaciones corresponden a divisiones eiz la izaturaleza. Podemos formar una clase con los objetos verdules, o quizá otra con objetos que son caballos o pinos, pero estas colecciones no corresponden a
divisiones objetivas en la naturaleza. Contrariamente, y según los defensores de las clases naturales, la clase de los objetos verdes, o la de los caballos, o la de las moléculas de agua, si son clases naturales. Pues bien, la idea es entonces que las leyes sólo deben involucrar clases naturales, con lo que se termina identificando las propiedades proyectables con las naturales. Sin embargo, esta condición parte de nociones, como la de clase natural, que requieren tanta elucidación como la noción misma de ley, por lo que no se puede tomar como condición intuitivamente exigible a las leyes sino como alternativa (debatible) para un análisis filosófico sustantivo de las leyes. Una de sus principales dificultades es afrontar el problema ya mencionado de la implicación lógica: si las consecuencias lógicas de leyes son leyes, entonces dadas dos leyes "Todo A es B y "Todo C es D" también será una ley "Todo A o C es B o D , pero no siempre que A y C (o B y D) son clases naturales su unión también lo es. Nótese que esta cuestión se complica, pues los predicados resultan o no proyectables no aisladamente, sino "en grupos", relativamente unos a otros, y 'A-o-C' y 'B-o-D' son proyectables relativamente entre sí. Por ejemplo, 'verde', 'azul', 'esmeralda', y 'zafiro' son proyectables relativamente entre sí, pero 'verdul', 'azuerde' (azul antes del año 2000 y verde después), 'esmefiro' (esmeralda antes del año 2000 y zafiro después) y 'zaralda' (zafiro antes del año 2000 y esmeralda después) también son proyectables entre sí, pues, p.ej. todo esmefiro es verdul (y por supuesto podríamos haber partido del segundo grupo y definir los del primero a partir de ellos). Por tanto, no se puede identificar sin más proyectabilidad y naturalidad.
La apelación a Ias clases naturales es un modo específico, y particularmente comprometido, de imponer una condición a las leyes que, formulada en términos más generales, parece ineludible. Nos referimos a la objetividad: qué regularidades son nómicas depende del mundo, no de nosotros. Las leyes son objetivas y por eso se pueden desciibrir; las leyes no se "crean", existen independientemente de nosotros y nosotros, en todo caso, las descubrimos. Puede haber leyes que no hayamos descubierto todavía; en realidad, todas las leyes que hemos descubierto eran de ese tipo antes de descubrirlas. Esto se corresponde con la diferencia intuitiva que mencionamos más arriba entre:la necesidad nómica y la epistémica, a saber, que la primera, a diferencia de la segunda, "está en la naturaleza", no depende de los sujetos cognoscentes. Esta exigencia de objetividad es inapelable planteada en términos intuitivos o preteóricos. Otra cosa es si sigue siendo tan obvia cuando se formula con mayor precisión en términos más comprometidos. por ejemplo recurriendo a clases naturales. Ésta es sin duda una de las cuestiones centrales de la familia de problemas que conforman el problema del realismo científico. Éste es un tema recurrente en la filosofía de la ciencia y que, aunque no recibe un tratamiento explícito, recorre gran parte de esta obra, principalmente los capítulos dedicados a la estructura de las teorías, a la explicación y a la inducción.
n'SD.4frlE\TüS DE F l L 0 ~ 0 ~ i DE . 4 L.4 CIENCIA
La última exigencia es la de sistematicidad, y es relativa a la relación de unas regularidades con'otras. Las rezularidades accidentales pueden "vivir aisladas". Más allá de sus relaciones puramente lógicas, las regularidades accidentales no están relacionadas entre sí. A diferencia de ellas, las leyes mantienen relaciones orgánicas de dependencia que no son sólo relaciones lógicas. Dos o más le)-es pueden estar vinculadas de cierto modo que no es reducible a que unas se infieran lógicamente de otras. Y no sólo es una posibilidad; es característico de ellas que se integren conformando sistemas, ello es un hecho constitutivo de su identidad. Es cierto que caracterizar apropiadamente la naturaleza de estos sistemas, y de las relaciones que vinculan a sus constituyentes, es extremadamente difícil, pero ahora no vamos a ocupamos de ello (cf. caps. 8,9 y 10).
3. Acaecimientos, causalidad y leyes causales En esta sección vamos a presentar muy someramente algunas nociones básicas relativas a la causalidad y las leyes, sin entrar en problemas filosóficos sustantivos. En particular, no vamos a decir nada aquí de las principales concepciones filosóficas de la causalidad (humeana, realista, etc.) y muy poco de los problemas con que todo análisis de la causalidad se debe enfrentar (asimetría. prelación, redundancia, etc.). Casi todas las nociones que vamos a introducir son fuente de numerosos problemas filosóficos y, por más neutra que intente ser la presentación. es inevitable comprometerse con algunos supuestos discutibles que aquí no se van a cuestionar, y muchas veces ni siquiera a explicitar. En particular, la referencia en esta sección a la causalidad no pretende sugerir la imprescindibilidad de esta noción en el análisis de la ciencia en general y de las leyes en particular; y tampoco esta advertencia se debe interpretar en sentido contrario, favoreciendo la tesis de su eliminabilidad por otras nociones menos discutibles, como la de con-elacióiz fulzcio~zal.La finalidad es meramente propedéutica, esto es, presentar algunos conceptos causales que se utilizan o presuponen más adelante en este y otros capítulos, y en las discusiones metacientíficas actuales, sin problematizarlos filosóficamente (algunas referencias ya clásicas en el análisis contemporáneo de la causalidad son Mackie, 1974; Beauchamp y Rosenberg. 1981, y Sosa y TooIey (eds.), 1993). Puesto que las relaciones causales se dan entre acaecimientos, es preciso detenerse antes brevemente en ellos.
Los acaecimientos (sucesos, eventos) son determinada especie de entidades particulares. Un objeto particular es cualquier entidad espacial o temporalmente localizada; p.ej. el auto de Adela, esta pantalla de ordenador, el cuerpo calloso del cerebro de Quine, la "imagen" de la estatua de Colón en el córtex de Pedro ayer a las 13,30, etc. Un evento o
acaecimiento es cualquier cosa que ocurre o srtcede en cierto lugar durante cierto intervalo temporal; p.ej. la batalla de Waterloo, el último partido de fútbol Barcelona-Madrid, la salida de Juan de la carretera ayer en la Costa Brava, la caída el martes pasado de un rayo sobre la estatua de Colón de Barcelona, etc. Entre los acaecimientos se distinguen los procesos de los estados. Los procesos son acaecimientos variables (el partido de fútbol, la gripe de Rosa); los estados son eventos constantes (el estar eI Iector sentado este rato, el estado de afonía de Claudia). La distinción entre proceso y estado es parcialmente vaga y depende de cuán finamente identifiquemos los cambios (el acaecimiento-estado de estar sentado, mucho menos el de estar afónico, no son totalmente invariables). Los objetos y acaecimientos son entidades particulares que pueden tener o ejemplificar propiedades. Un mismo objeto particular puede tener muchas propiedades diferentes. Esto que está aquí abajo tiene la propiedad de ser una silla, pero también las de ser azul, ser cómoda, estar aquí debajo, o ser mencionada en este libro. También un mismo acaecimiento particular puede tener diversas propiedades. Eso que ocurrió el martes sobre la estatua de Colón de Barcelona tiene la propiedad de ser la caída de un rayo, pero también las de ocurrir de día, asustar a Rosa, producir un cortocircuito en el funicular, salir en primera página del diario El País del miércoles, ocurrir sobre'la estatua de Colón, o ser mencionado en este escrito. La relación causal es una relación que se da entre eventos particulares. Tanto objetos como acaecimientos particulares pueden estar relacionados de diverso modo; p.ej. el coche de Eduardo es más grande que el de Adela, la batalla de Witerloo es anterior al último partido Barcelona-Madrid. La anterioridad es una relación que se puede dar entre acaecimientos, la causalidad es otra. Podemos preguntar, p.ej., por la causa del accidente de Juan, o de la amnesia de María, y las causas son otros sucesos particulares. Por ejemplo, son causas del accidente de Juan ayer en la Costa Brava: el particular*estado mojado de la calzada, el estado gastado de las ruedas, la velocidad superior a 80 krnh del vehículo, la somnolencia de Juan, etc. Un mismo evento puede tener innumerables causas. Una causa o factor causal de un cierto suceso particular e, el acaecimiento-efecto, es otro suceso particular c, acaecimiento-causa, tal que si no hubiera ocurrido c, permaneciendo todo lo dernús igual, no habría ocurrido e. Por ejemplo, todos y cada uno de los sucesos mencionados son causas del accidente de Juan en este preciso sentido pues (supongamos): si la calzada no hubiera estado mojada, ocurriendo lo demás igual, no se habría salido de la carretera; y si no hubiera estado somnoliento, permaneciendo lo demás igual, tampoco se habría salido de la carretera; si el auto no hubiera ido a más de 80kmíh, etc. Se notará que, entonces, el accidente también tiene otras muchas causas. Por ejemplo, que Juan cogiera esa carretera, pues si hubiera cogido otra, y aunque hubiera tenido un accidente, no sería ese accidente; o que Juan se levantara de la cama ese día; o que Juan se sacara el permiso de conducir; o que sus padres le concibieran; o (presurniblemente) que los primates evolucionaran en cierta dirección determinada; etc. En todos estos casos también es cierto que si no hubiera ocurrido ese acaecimiento (permaneciendo lo demás igual), tampoco habría ocurrido ese accidente. La multiplicidad de causas derivada de esta caracterización contrafáctica de la causa-
lidad requiere dos advertencias. En primer lugar, no se sigue de ella que todo es causa de todo, que cualquier acaecimiento anterior al accidente es causa del accidente. Por ejemplo, que cuando Juan nació, el Sol estaba en Tauro, no lo es, pues simplemente no es cierto que si Juan no hubiera nacido bajo el signo de Tauro, permaneciendo todo lo demás igual, el accidente no habría ocurrido. Este ejemplo es ilustrativo, pues muestra que, como cabe esperar, e1 carácter contrafáctico es e1 núcIeo de la noción de causa también cuando tenemos creencias de hecho erróneas sobre causas. Las presuntas causas en las que erróneamente creen los supersticiosos son consideradas causas precisamente en ese sentido. Los que creen en la astrología creen en la causalidad astral en ese preciso sentido, a saber, creen que nuestra última afirmación contrafáctica "no es cierto que si Juan no hubiera nacido en Tauro, permaneciendo todo lo demás igual, el accidente no habría ocurrido" es falsa. En segundo lugar, no se debe confundir la multiplicidad de las causas con la de las explicaciones. Aunque el hecho de que Juan se sacara el permiso de conducir es una de las causas del accidente, no es una buena explicación decir que Juan se accidentó porque se sacó el permiso de conducir (o, más drásticamente, porque los primates evolucionaran en cierta dirección). Como veremos por extenso más adelante (cf. capítulo 5, $3, la explicación causal de un suceso no tiene por qué referirse a todas sus causas, sino por lo general sólo a aquella o aquellas más destacadas en el particular contexto explicativo. Así pues, y con estas advertencias, cada acaecimiento tiene por lo general múltiples causas o factores causales. "La" causa, o causa total, de un suceso e es la suma o conjunción de todos los eventos c,, c2, ..., c, tales que, de cada ci (1 5 i 5 n), es cierto que de no haber ocurrido c;, y permaneciendo lo demás igual, tampoco habría ocurrido e. La causa total del efecto e es entonces el acaecimiento complejo ci&c2&... & c, y la ausencia (eliminación o bloqueo) de cualquiera de los factores basta para que no se produzca el efecto e. La relación causal se da entre sucesos particulares, entre acaecimientos-ejemplar, pero gracias a que tales sucesos son de cierto tipo, ejemplifican cierta propiedad. Esto es, la causalidad se da entre acaecimientos-ejemplar elz virtud de que corresponden a ciertos acaecimientos-tipo. Tomemos una de las causas del accidente, p.ej. el acaecimiento consistente en que el auto iba a más de 80 k m , , y supongamos que este acaecimiento es una de las causas, en el sentido indicado, del accidente: permaneciendo todo lo demás igual, si él no se hubiera dado, el accidente tampoco. Ese suceso particular tiene la propiedad de ser un movimiento de vehículo a más de 80 kmh, pero también tiene otras, p.ej. ser recogido por un radar policial, ser mencionado en las noticias locales, o ser mencionado en este libro. Si ese suceso causa el accidente, es en virtud de que tiene la primera propiedad, no las otras. Sucesos de ese tiyo, "ser movimiento a más de 80 km/h",causan accidentes como ése en esas circunstancias, no los causan sucesos del tipo "ser recogido por un radar". Así, aunque ese mismo suceso particular que causa el accidente tiene ambas propiedades, causa el accidente en virtud de que ejemplifica una de ellas, no de que ejemplifica la otra. Otro suceso particular que fuese del tipo "ser recogido por el radar" pero no del tipo "ser movimiento a más de 80 M,podría no haber causado, en esas mismas circunstancias, el accidente (no lo causaría si, p.ej., si fuese del tipo "ser movimiento a 20 M').
La finalidad de las presentes consideraciones es sólo mostrar la conexión conceptual entre las nociones de causalickid y depeizdencia contrajúctica; no pretendemos dar un análisis de la primera mediante la segunda. Se puede dar tal análisis (para dos modos diferentes de hacerlo, cf. p.ej. hlackie, 1971 y Lewis, 1973n), para lo cual es preciso complicar considerablemente la caracterización simple que aquí hemos dado. La principal dificultad consiste en dar cuenta de determinadas situaciones en las que parece haber dependencia contrafáctica sin haber relación causal, y de otras en las que parece haber relación causal sin haber dependencia contrafáctica. Lo primero ocurre típicamente en los casos de efectos independientes de una causa común. Consideremos, por ejemplo, un sistema tal que al accionar un único botón (causa comlín c ) dispara dos cohetes, uno de los cuales explota a los seis segundos (efecto el) y el otro a los nueve (efecto e?),y supongamos que siempre funciona bien disparando los dos cohetes, o que cuando funciona mal no dispara ninguno. En este caso es cierto que, todo lo detncís igual, si no ocurriera el no ocurriría e2 (nótese que hemos supuesto que el sistema funciona igual de bien, o igual de mal, para ambos cohetes) y sin ernbarso no diríamos que e l causa e2 (sobre este tipo de ejemplos volveremos cuando estudiemos la relación entre carisalidad y e.rplicación). La segunda situación se da típicamente en los casos de causas independientes confluyentes. Contemplemos un dispositivo con dos botones tal que al accionar cualquiera de los botones, o al accionar ambos simultáneamente, dispara una bala, y que en cierto momento dos personas accionan simultáneamente los botones ( e l y c,) disparando una bala que mata a otra (e). En este caso es falso que. perrnnnecieizdo lo ciembs igual, si la primera persona no hubiera accionado el botón no se hubiera producido esa muerte por bala; y exactamente lo mismo respecto del accionamiento de la segunda persona. Pero entonces, según la caracterización simple dada, iziizgluzo dz los accionamientos causa la muerte, lo cual contradice nuestras intuiciones (quizá no diríamos que cada iuio causa la muerte, pero como mínimo sí que al menos uno lo hace). No podemos detenernos aquí en estos y otros problemas de los análisis contrafácticos de la causalidad (para un buen compendio, cf. Sosa y Tooley (eds.), 1993).
Esta idea de que la causalidad es una relación entre sucesos particulares, pero que lo es en virtud de que éstos ejemplifican ciertas propiedades generales, es la que recogen las leyes causales. Las leyes son generales, y las leyes causales expresan la relación catisal entre propiedades, 'causal' no en el sentido de que unas propiedades causen otras, sino de que sucesos de un tipo causan sucesos del otro. Las leyes causales son acerca de las propiedades o acaecimientos-tipo en virtud de los cuales se dan las relaciones causales entre los acaecimientos-ejemplar. Esto explica la intensionalidad de las leyes, al menos de las causales. Puede ocurrir que ' A N-implica B' sea verdadero y 'C N-implica B' falso, aunque los acaecimientos particulares de tipo A sean de hecho los mismos que los acaecimiento~de tipo C, esto es, aunque las propiedades A y C sean de hecho ejernplificadas por exactamente los mismos acaecimientos particulares. El motivo en las leyes causales es
148
R;NDASfE%TOS DE F I L O S O F DE ~ ~ LA CIENCIA
claro: no vale la sustitución si los acaecimientos particulares de tipo A causan acaecimientos particulares de tipo B. en virtud de tener la propiedad A y no en i'irrud de tener la propiedad C; si, por otro lado, la coextensjvjdad de A y C se debe a alguna relación nómica entre ambas propiedades, entonces sí valdrá la sustitución en contextos nómicos. La intensionalidad de las leyes causales es pues consecuencia de que las relaciones causales se dan enrre acaecilnie~zrosparriculares en vimrd de qrre son eje~nplaresde detenninado ripo. De los diversos elementos vistos hasta aquí parece derivarse una consecuencia extraña relativa a las leyes causales estrictas. Si a ) los sucesos tienen múltjples causas, b) las leyes causales deben recoger en su antecedente los diversos tipos de causas involucrados, y c ) las leyes estrictas deben contener condiciones antecedentes estrictamente suficientes, entonces d) las leyes causales estrictas deben contener en su antecedente la causa total, esto es, deben referirse en su antecedente a todos los tipos de factores causales (o al menos todos los simultáneos). Sin embargo, a la luz de los ejemplos usados hasta ahora, esto parece muy implausible. Bien, en parte es así y en parte no. En parte no es así, pues los ejemplos de generalizaciones nómicas causales ordinarias son en parte desorientadores. Las leyes cie~zt@casse centran muchas veces en tipos de sucesos con relarivameizte pocos factores causales, o incluso a veces tratan de efectos debidos a un únjco tipo de factor causal. Pensemos por ejemplo en la ley de gravitación universal. A los actuales efectos podemos formularla como ley causal del siguiente modo: "Sobre un cuerpo x de masa m, la presencia a una distancia d de otro cuerpo y de masa 172' produce sobre el primero una fuerza atractiva de magnitud Gmln'lE'. Aquí, la causa de que x esté sometido a esa fuerza es un acaecimiento que ejemplifica la condición antecedente. En otras ocasiones las leyes se ocupan de sucesos con muchas causas pero a la ley le interesa el efecto conjunto de todas ellas y, en ese sentido, se trata de una única causa. El ejemplo paradigmático es la segunda ley de Newton: "La suma Cf; de fuerzas incidentes sobre un cuerpo de masa m produce en éste una aceleración a de magnitud 'IfJln". En ambos casos parece en principio que se expresan los factores causales completos. esto es, que se trata de leyes causales estrictas (cf., sin embargo, la próxima sección y, específicamente sobre el peculiar estatuto de la segunda ley de Newton, la sección 5 del capítulo 10). Pero en parte la anterior conclusión d) sí es válida, pues hay fenómenos con múltiples factores causales que son objetos genuinos de investigación científica. Quizá no es éste el caso de los accidentes de automóvil, pues no hay, y quizá no haya nunca, teorías científicas socialmente reconocidas como tales c u ~ objeto o sean los accidentes de automóvil en general (aunque, en un sentido laxo de 'científico', el estudio de este fenómeno que involucra nomicidad causal múltiple es sin duda científico). Pero hay ejemplos parecidos pertenecientes a ámbitos reconocidamente científicos. Por ejemplo, el estudio de la esquizofrenia, y en general de los desajustes psíquicos, cuya multiplicidad causal es pri~nafacie incuestionable. Ejemplos parecidos se pueden encontrar también en las ciencias sociales (economía, sociología, antropología) y también en ciencias naturales (biología, geología). Así, la ciencia, y la ciencia reconocida como tal, también se ocupa de tipos de sucesos causalmente complejos. La consecuencia es la división social del trabajo, la diversidad de la tarea investigadora: la existencia de diversas teorías-leyes cada una de las cuales trata de
I
j
uno o algunos de los factores causales. Cada una proporciona sus explicaciones apelando a causas distintas, pero estas explicaciones no tienen por qué ser inconlpatibles, antes al contrario, cada una es válida en su contexto y, consideradas conjuntamente, cornplementarias. En situaciones de este tipo, relativamente comunes en ciencia, la existencia de leyes estrictas que contemplen la totalidad de factores causales de un fenómeno es efectivamente muy implausible, a no ser que se pruebe la redrtcción de unos factores causales a otros. De cuestiones relacionadas con ésta vamos a tratar en la próxima sección y en la sección 5 del capítulo 1 1. Queda pendiente la discusión sobre la existencia o no de leyes no causales. En un sentido inmediato, es obvio que las hay, por ejemplo las de Kepler, la de Galileo sobre la caída libre o la del péndulo. Otro grupo de casos proviene de los fenómenos de causa común mencionados más arriba. Por ejemplo, la correlación entre el descenso brusco del barómetro y las tormentas es sin ninguna duda nómica, pero no es causal: tanto el descenso del barómetro como la tormenta son efectos independientes de una causa común, el descenso brusco de la presión atmosférica. Eso proporciona una vía de escape a los partidarios de la necesaria intervención de la causalidad en las leyes. Algunas leyes no son direcro)ne~itecausales, pero éstas se derivan siempre de otras que sí lo son; esto es lo que ocurre en el caso del barómetro y la tormenta, en los ejemplos cinemáticos mencionados y, en su opinión, en todas las leyes aparentemente no causales. Sin embargo, es un hecho que regularidades nómicas no causales como las mencionadas se han reconocido y aceptado como leyes antes e independientemente de su derivación de otras causaIes. Hoy mismo, p.ej. en mecánica cuántica, se aceptan muchas leyes sobre cuyo supuesto carácter causal se suspende el juicio, no sólo por parte de los científicos sino también de los metacientíficos. Esto no refuta la tesis procausalista radical, pero la divorcia de la explicación de la práctica científica; o al menos muestra que el uso que de hecho hacen los científicos de la noción de ley no presupone la de car~salidad(aunque el procausalista puede concluir, simplemente, que los científicos no usan siempre correctamente el primer concepto). 4.
CIáusulas ceterisparibrrs y leyes no estrictas
Muchas de las leyes científicas son interferibles, presentan excepciones. En algunas casos ese carácter se hace manifiesto al incluirse explícitamente cláusulas ceteris paribus, cláusulas del tipo "salvo factores extraños", "si nada interfiere", etc.; ése es el caso, por ejemplo, de las leyes (9). (lo), (12), (13) y (14) de nuestra lista inicial. Pero en la mayoría de ocasiones la cláusula CP está sólo implícita, por ejemplo, en el caso mencionado más arriba de la ley de Kepler. O, para tomar un ejemplo claramente causal, como sucede en la siguiente ley biomédica: (34) Una dosis de 10 mg de benzodiacepina produce somnolencia. b
i l
!
Lo característico de estas leyes es que son leyes con excepciones. Puede ocurrir el suceso antecedente y no darse el suceso consecuente, y ello sin que se trate (al menos
150
FUNDAhlEXTOS DE F I L O S O F DE ~ L.4 CIENCIA
aparentemente) de una ley probabilista. Otro modo de expresarlo es diciendo que son leyes inretferibles, pero ha de quedar claro que con ello no se quiere sugerir que son interferibles "por nosotros", esto es, por agentes humanos. Quizá a veces la interferencia pueda producirla una acción humana (p.ej. en (34) ingiriendo alguna sustancia inhibidora), pero eso es irrelevante. Son interferibles en el siguiente sentido: la ocurrencia del suceso particular de tipo A implica nómicamente la ocurrencia del suceso de tipo B sólo si se dan ciertas condiciones adicionales, por lo que en caso de que tales condiciones resulten interferidas por ciertos factores inhibido)-es, se da el suceso antecedente y no el consecuente. En las leyes causales, en las que la relación nómica es la relación causal, el efecto es interferible por la posible no ocurrencia de alguna de las causas coadyuvantes, el factor inhibidor impide que se dé alguna de tales causas complementarias; por ejemplo, en (34) se puede interferir el efecto de la sustancia debido a un estado de extrema excitación, o a la ingestión de otra sustancia, etc.
DE LAS LEYES NO ESTRJCTAS 1.1. AKÁLTSIS
Hay principalmente tres modos de analizar este tipo de leyes. El primero, y más inmediato, es en términos de leyes estrictas. Según este análisis, las leyes no estrictas fon7luladas; en términos causales, son leyes cuya son leyes estrictas i?zco~npletaine~zte formulación no incluye todos los factores causalmente relevantes. La incompletud puede ser, y a menudo es, relativamente indefinida o desconocida. La particularidad de estas leyes no se corresponde con hechos brutos de la naturaleza sino que es consecuencia de nuestra ignorancia. La naturaleza sólo contiene leyes estrictas, la "no estricticidad" es una característica epistémica, no metafísica; no nos informa de algo relativo al mundo sino sólo de algo relativo a nuestro conocimiento, a saber, de su incompletud en cierto ámbito. Según este análisis, "A, cp, N-implica B" tiene en realidad el siguiente contenido: a) no ocurre que A N-implica B y b) A & H N-implica B, para cierta propiedad H total o parcialmente no identificada y tal que ella sola no N-implica B. H es el (desconocido) complemento de la condición antecedente A .y ambas propiedades tomadas conjuntamente constituyen el antecedente de una ley estricta. La ley con cláusula cp es interferible porque la ocurrencia de A no N-implica la de H; es N-posible que se dé A sin darse H y, por tanto, sin darse B. En general H puede ser muy compleja e incluir factores tanto positivos como ?1egativos.Los factores positivos consisten en la ocurrencia de cierto hecho (p.ej. que la sustancia pase a la sangre), los negativos en la no ocurrencia de ciertos otros (p.ej. que no haya una sustancia química inhibidora en el cerebro). Esta diferencia es, metafísicamente considerada, origen de algunas dificultades filosóficas en las que no vamos a detenernos ahora; a los actuales propósitos, los factores positivos y negativos que constituyen H se encuentran al mismo nivel. Eso es así incluso si la cuestión se plantea en términos causales, pues si un factor causal ci es interferible por, digamos, la ocurrencia de un factor interferidor cj, entonces una condición causal antecedente adicional es la no ocurrencia de ci. Y la no ocurrencia de un acaecimiento es otro acaecimiento con perfecta potencia causal
(p.ej. que Juan no viniera :i la fiesta es parte de la causa de que no hubiera vino, pues él era el encargado de traerlo). A esta redi(rrcció11epistétrzicn de las leyes no estrictas a las leyes estrictas se le pueden hacer dos objeciones. Una de ellas, específica sólo de algunos casos de leyes CP, tiene que ver con la relación entre las ciencias especiales y la ciencia básica y la comentaremos después. La otra objeción, más general, se deriva de los aspectos metafísicos debatibles que hemos obviado. Como veremos en la última sección, algunos autores defienden que las leyes expresan cierta relación moda1 primitiva entre universales o propiedades naturales. Desde esta perspectiva, el complemento H representa un problema, pues contiene condiciones negativas y las condiciones negativas no se pueden asimilar plausiblemente con universales, o propiedades naturales. Para simplificar, supongamos que H es sólo "que ahí no ocurra un acaecimiento de tipo C'. La no instanciación de C es ciertamente un acaecimiento ("negativo"), pero es muy implausible defender que ese acaecimiento involucra una propiedad diferente de C, a saber, la propiedad no-C. No es plausible sostener que dicho acaecimiento ejemplifica un supueSto universal no-C, como tampoco es plausible, de un acaecimiento que ejemplificara algunos de los universales D y E, decir que ejemplifica un supuesto universal D-o-E; no toda combinación lógica de universales es otro universal. Ésta es la objeción de Armstrong a la reducción de leyes no estrictas a-las estrictas y el motivo de la alternativa que propone (cf. 1983, cap. 10, 54). La propuesta de Armstrong es seguir el camino opuesto, esto es, tomar como relación nómica primitiva la expresada por las leyes no estrictas y obtener las estrictas como caso especial. Así, la relación nómica básica entre universales es en sí misma interferible. La relación nómica entre A y B es interferida si existe de hecho una propiedad I tal que "Todos los A & I son B" no es una ley. Una relación nómica concreta entre A y B es interferible si es posible la existencia de una propiedad I que la interfiera. Toda relación nómica es C-interferible, esto es, para toda relación nómica concreta es conceptunlinente posible la existencia de una propiedad que la interfiera. Pero de ello no se sigue que toda relación-nómica sea N-interferible, esto es, no se sigue que para toda relación nómica concreta sea nómicnmerzte posible la existencia de una propiedad que la interfiera. Eso depende del mundo. Quizá algunas relaciones nómicas son tales que no es N-posible la existencia de interferencias. Pues bien, caso de haberlas, ésas serían las leyes estrictas. Las leyes estrictas son relaciones nómicas que no tienen, ni N-pueden tener, interferidores. Nótese que esto no puede pretender ser una definición de "relación nómica interferible", pues en tal caso sería circular. Se trata a lo sumo de un intento de elucidación de dicha noción primitiva. Por otro lado, tanto la propuesta como la objeción que la motiva dependen esencialmente de.la concepción de las leyes como relaciones entre universales. La tercera alternativa es interpretar las leyes no estrictas en términos probabilistas (10 que por supuesto exige a su vez no interpretar después, ni abierta ni encubiertamente, las leyes probabilistas en términos de condiciones cp). Según esta alternativa, "Todos los A son. cp, B" sería una variante estilística de "La probabilidad de que los A sean B es (muy) alta". La motivación para usar tal variante consistiría en que, en los casos en que se usa, el valor exacto de la probabilidad es desconocido. Así, en lugar de decir algo pro-
152
FUXD.LIIIE\TOS DE FILOSOFÍ.~DE L.\ CIENCIA
babilísticamente indefinido como que los A son "en general" o "con bastante" probabilidad B. diríamos que ceteris paribus los A son B. La dificultad principal de esta alternativa es proporcionar después una elucidación de las leyes probabilistas que sea coherente con esta reducción de leyes no estrictas a leyes probabilistas. Por otro lado, según cómo se analicen las leyes probabilistas, esta propuesta se puede acabar convirtiendo en alguna de las anteriores. En particular, si la probabilidad de que se habla es subjetiva o epistémica, reducir las leyes no estrictas a leyes probabilistas es otro niodo de reducirlas a leyes estrictas incompletas, esto es, a leyes con condiciones antecedentes desconocidas.
El contexto metacientífico en el que más se debate sobre la naturaleza de las leyes no estrictas es el de la relación entre ciencia especial y ciencia básica y la posibilidad de reducir, total o parcialmente, la primera a la segunda. El debate se ha planteado sobre todo en filosofía de la psicología (cf. p.ej. Schiffer, 1991 y Fodor, 1991), pero afecta igualmente a otras ciencias, como la economía, la sociología, la biología o la geología. La cuestión de la relación entre ciencias especiales y ciencia básica tiene que ver con el viejo anhelo fisicalista de situar a las teorías físicas en la base de todo nuestro conocimiento. Para el fisicalista (o fisicista) la realidad es en última instancia, y primariamente, realidad fisica; lo (micro)físico constiruye todos los demás niveles de realidad. Aunque las demás ciencias, llamadas usualmente en este contexto cieltcias i:o básicas o especiales, proporcionen explicaciones legítimas, tales explicaciones descai~sanen última instancia en las que proporciona la física. La causalidad involucrada en los fenómenos macroscópicos descansa sobre las relaciones causales de los procesos microfísicos que constituyen aquéllos. Las leyes macroscópicas tielle11su base o jimdamer~toen leyes microfísicas. Así, la psicología tendría su base en la neurociencia; la biología, lo mismo que la geología, en la química y en la física; y la química en la física. Análosamente, aunque de modo más insospechado, ocurriría p.ej. con ciencias especiales todavía más alejadas de la física, como la sociología, la economía o la lingüística. La versión más radical de este programa fjsicalista es el reduccionismo. Como veremos (cf. capítulo 11 $5), la posibilidad de redilcciólt en sentido estricto parece inviable a causa de la rnúltiple realizabilidad, pero los fisicalistas pueden defender su viejo anhelo con una versión menos ambiciosa centrada en la noción de sirpen.eniencia, más débil que la de reducción. No podemos detenernos ahora en esta cuestión, que estudiaremos más adelante. Aquí nos interesa tan sólo apuntar el motivo por el que las leyes no estrictas están en el centro de este debate.' 1. Como se ha indicado, el debate se centra inicialmente en el fisicalismo, en la tesis de que la "realidad básica" es del tipo estudiado por las teoríasfl.~ica.s. Sin embargo, la idea de que en la ciencia algunas leyes. 1corls 0 explicaciones "descansan" en o t r x m i s bisicas es general e independiente de si el nivel básico es siempre. o no. el estudiado por las teorías físicas. Par ello, para no prejuzgar la cuestión del fisicalismo, y sipiendo a la ~iie~3tun. para referimos a ambos niveles no usaremos 'ciencia física' y 'ciencias no-físicas' sino 'ciencia bkica' y 'ciencias no-básicas' o, mis brevemente, 'ciencias especiales'.
t
[ L
F
i.
La mayoría de las leyes de las ciencias especiales, si no todas, son no estrictas, contienen implícita o explícitamente cláusulas ceteris paribus (p.ej. las leyes (lo), (12), (13) y (14) de nuestra lista) y uno de los motivos de ello es que son interferibles por procesos más básicos. Tomemos como ejemplo (13): si alguien desea algo, cree que haciendo otra cosa lo logrará, cree que su acción es posible, y no desea más otra cosa que sea contraria a su acción, entonces, ceteris paribus, realiza la acción. En este caso hay factores interferidores claros, y los más inmediatos no son "psicológicos" sino más básicos, neuronales o bioquímicos. Por ejemplo, deseo dejar de sentir dolor en el zapato, creo que se debe a una piedra, creo que sacándome. sacudiendo y volviendo a calzarme el zapato lograré mi deseo, creo que eso es posible y que no se opone a ningún deseo en competencia, y a pesar de todo no realizo la acción pues, por ejemplo, mis facultades motoras se han visto afectadas por efectos de una droga o por un repentino shock neuronal, o endocrino, o lo que sea. Éste es un ejemplo paradigmático de interferibilidad de una ley psicológica. El fisicalista sostiene que este tipo de situación, común en todas las ciencias especiales, proporciona plausibilidad a su tesis. Si la causalidad se da entre acaecimientos particulares en virtud de ejemplificar ciertas propiedades, y el factor interferidor es, digamos, neuro-bioquímico, entonces las propiedades en virtud de las cuales el acaecimiento particular causa determinado efecto cuando no es interferido, deben ser también neuro-bioquímicas, pues de otro modo la causación no sería interferible por sucesos neuro-bioquímicos. La idea que hay detrás es que la causalidad se realiza mediante ciertos mecanisinos y que, por tanto, todas las propiedades causalmente relevantes (tanto las efectivas como las inhibidoras) tienen que estar al mismo nivel, el nivel del mecanismo. Si las propiedades interferidoras son neuro-bioquímicas, las responsables de la causación en ausencia de interferencia también deben serlo. Y así, en opinión del fisicalista, hasta llegar eventualmente al nivel más básico. De lo anterior se deriva la objeción específica a la reducción de las leyes no estrictas a leyes estrictas que anunciamos más arriba. Si las leyes no estrictas se reducen a leyes estrictas incompletas, entonces su eventual formulación completa debe mencionar las propiedades causalmente relevantes. Si todas las propiedades causalmente relevantes deben ser del misnio nivel, entonces todas las propiedades que menciona la eventual ley estricta formulada completamente deben ser del nivel de los factores de interferencia. Pero si es así, puede objetarse, entonces no es ya una ley (no estricta) de la ciencia especial sino una ley (estricta) de la ciencia básica. En el caso de la psicología, las leyes CP psicológicas serían formulaciones incompletas de leyes estrictas de la neurociencia (o lo que sea). Y el caso de la psicología es sólo un ejemplo, lo mismo ocurriría en las restantes ciencias especiales con sus correspondientes bases de factores interferidores. Independientemente del análisis de las leyes no estrictas, la idea misma de los mecanismos causales inspira a los fisicalistas el descenso hacia la microfísica. El funcionamiento de un mecanismo que consta de partes depende del funcionamiento de las partes que lo constituyen y del modo en que se combinan las partes. Puesto que todo fenómeno consta en última instancia de partículas básicas (o lo que la física básica diga) con ciertas Propiedades, "funcionando", combinándose y recombinándose de cierto modo, la explicación en cualquier nivel descansa en última instancia en la explicación en el nivel básico.
Estas consideraciones son independientes del análisis de las leyes no estrictas, pues la idea de los mecanismos sugiere el descenso incluso si las leyes especiales fuesen estrictas. Dejaremos por el momento sólo planteadas estas cuestiones y volveremos sobre la relación entre ciencia especial y ciencia básica cuando nos ocupemos de las relaciones interteóricas (cf. cap. 11 $5). 4.3. LEYESNO ESTRICTAS Y CIENCIA BÁSICA
Aunque la discusión sobre leyes no estrictas se suele encontrar especialmente vinculada a la de la relación entre ciencia especial y ciencia básica, conceptualmente no depende de ella. Los factores interferidores pueden ser todos del mismo nivel que el de las propiedades que se mencionan en la formulación no estricta de la ley, en cuyo caso la eventual formulación completa de la ley no supone ningún descenso ontológico. Es difícil, en principio, encontrar ejemplos claros de ello en las ciencias especiales, aunque quizá algunas leyes económicas como (14) pudieran coi~espondera una situación tal. Quizá los factores que pueden impedir que un aumento de la oferta produzca un descenso del precio del producto sean todos económicos; aunque si somos muy estrictos no, pues siempre parecen ser posibles interferencias "catastróficas", por ejemplo puede caer un meteorito, o sin ir tan lejos, los consumidores pueden volverse todos locos y, siendo todos los demás factores económicos iguales, pagar más cuanto más haya. Sea de ello lo que fuere, el lugar más apropiado para plantear la cuestión de las leyes no estrictas, independientemente de la relación entre ciencia especial y básica, es el de la (supuesta) ciencia básica, pues simplemente ella no tiene otra más básica a la que se pueda apelar para dar cuenta de las interferencias. El problema en este caso es si existe tal cosa, actual o potencialmente. En el presente contexto, y por mor de la exposición. supondremos que así es y tomaremos como ejemplo la ciencia que paradigmáticamente así se ha considerado por los defensores de la ciencia básica, la mecánica (para facilitar la exposición, nos referiremos a una teoría mecánica parcialmente incorrecta, la Mecánica Clásica, y no a las actualmente en vigor, la Mecánica Cuántica y la Mecánica Relativista). Muchas de las leyes de la familia mecánica son claramente leyes no estrictas, aunque no contengan explícitamente cláusulas cetei-isyai-ibus.Los casos más manifiestos, algunos de los cuales ya hemos mencionado, corresponden a las leyes cinemáticas resultado de aplicar las leyes mecánicas a situaciones específicas; por ejemplo, la ley de Kepler sobre el movimiento de los planetas, la ley de Galileo sobre la caída de graves en entomos próximos a la superficie terrestre o la ley del péndulo que correlaciona la velocidad angular (o el período) con la longitud. Todas estas leyes, y muchas otras, son claramente interferibles, y de hecho interferidas. Los planetas no se mueven exactamente como afirma (2) pues están sometidos a fuerzas de otros astros; los cuerpos no caen con la aceleración que afirma (3) pues están sometidos a otras fuerzas además de la gravitatoria, al menos la del rozamiento del medio, y análogamente con (4). En todos estos casos, los factores interferidores no provienen de otros niveles supuestamente más básicos, sino del propio nivel cuyas propiedades (magnitudes) son mencionadas en la formulación de la ley. La
interferibilidad de este tipo de leyes "básicas" no estrictas se debe en general a que en su formulación se realizan ciertas idealizaciones sobre su ámbito de aplicación, p.ej. que no hay fuerzas de rozamiento del medio, que no hay otros astros, etc. Este tipo de leyes no estrictas se pueden completar entonces de dos modos diferentes. El primero, incluir explícitamente una cláusula CP que mencione las idealizaciones. Éste es el caso de algunas formulaciones de la ley de Galileo en las que se explicita que la aceleración es "en el vacío"; o de la del péndulo, cuando se explicita, además de que el movimiento es en el vacío, que el hilo no tiene masa; y quizá fuese posible algo parecido también en la ley de Kepler. El inconveniente principal de este expediente para convertirlas en leyes estrictas es que se trataría de leyes estrictas vacuamente verdaderas, pues una vez explicitadas las idealizaciones e incluidas como condiciones antecedentes adicionales, el antecedente de la ley no se cumpliría en ninguna situación empírica real (aunque recordemos que eso no afecta a su naturaleza contrafáctica). El segundo procedimiento consiste en mantener el antecedente sin idealizaciones y refinar entonces el consecuente para que tome en cuenta los efectos derivados de los factores interferidores. En este caso tenemos una ley de caída de graves, mucho más complicada, que incluye como parámetros adicionales la fricción del medio, etc. Obviamente, la mayor dificultad de este procedimiento es que resulta difícilmente realizable de modo pleno hasta conseguir leyes estrictas. La existencia de leyes físicas básicas no estrictas podría explicarse por su carácter no jiindnmental. Estas leyes serían siempre leyes derivadas,es decir, el resultado de aplicar a situaciones particulares leyes mecánicas más fundamentales que tratan directamente de los elementos dinámicos causalmente responsables de los efectos cinemáticos. No es esencial que las leyes cinemácicas no estrictas se formularan originalmente como aplicación de las dinámicas (p.ej., ello no fue así en los ejemplos mencionados), basta con que acaben siendo derivables cuando se identifiquen las leyes causales. Éste sería un modo de "eliminar" las leyes no estrictas de la ciencia básica, mostrar que las leyes no estrictas son siempre aplicaciones con idealizaciones de leyes más básicas a situaciones específicas. P a n que ello pueda considerarse una cuasi-eliminación de las leyes no estrictas es necesario que las leyes más básicas sean estrictas. La idea es que las leyes fundamentales no contendrían idealizaciones, las idealizaciones sólo se precisarían en aplicaciones particulares. Así, por ejemplo, en dinámica, las leyes fundamentales expresan determinaciones de dos tipos. En unos casos, se determinan efectos cinemáticos globales debidos a factores dinámicos conjuntamente considerados. Un ejemplo sería la Segunda Ley de Newton, a = B l r n , que determina la aceleración total debida a la resultante de las fuerzas incidentes, sean éstas cztales sean. Así considerada esta ley no parece contener idealizaciones y, como sugerimos en la sección 2, sería un caso de ley estricta. Es cierto que por sí sola es de poca utilidad, que sólo tiene contenido empírico aplicada a situaciones específicas y que tal aplicación supone idealizaciones, pero todo ello no la convierte, al menos sin argumentos adicionales, en una ley interferible. En otros casos, se determina el valor de ciertas magnitudes dinámicas dependientes de otras propiedades dinámicamente efectivas. Ejemplos de esto serían la ley de gravitación universal, o la ley de Coulomb que determina la magnitud de la fuerza eléctrica entre cuerpos
156
FUND,ASIE.\TOS DE FILOSOF~ADE LA CIENCIA
cargados, o la ley de Hooke que determina la magnitud de la fuerza de recuperación de un cuerpo elástico. La ley de gravitación, tal como la formulamos anteriormente, establece que sobre un cuerpo x de masa m, la presencia a una distancia d de ctro cuerpo y de masa m' produce sobre'el primero una fuerza atractiva de magnitud Gnun'ld-. En esta versión, esta ley es claramente una ley estricta, y Jo mismo ocurre con las otras dos formuladas análogamente. Si advertimos explícitamente que este segundo tipo de leyes se pueden considerar leyes estrictas únicamente en estas versiones de las mismas, es porque a veces se han formulado de modo que su estricticidad se torna cuestionable. Así, por ejemplo, Cartwright (1983 cap. 3) objeta al presunto c.arácter estricto de la ley de gravitación interpretándola como afirmando que la fuerza (total) con la que se atraen dos cuerpos es Gi~tln'/&.Así interpretada se trataría obviamente de una ley falsa, esto es, con excepciones, pues "la" fuerza con que se atraen puede no ser esa si, por ejemplo, los cuerpos están además cargados eléctricamente. Según esta interpretación, la ley versa sobre la-fuerza atractiva total, y en tal caso es claramente no estricta, contiene la idealización de que no hay otras fuerzas atractivas actuando. Sin embargo, es discutible que ésta sea una interpretación legítima de ley, y en cualquier caso no es la adecuada para dirimir la cuestión que nos ocupa. Si este tipo de interpretaciones estuviera siempre disponible, sería difícil siquiera concebir una ley cuantitativa mínimamente específica que fuese estricta: toda ley que especifique la cantidad de cierto efecto producido por un factor causal específico incluiría, en esa interpretación, una cláusula cp afirmando que no hay otros factores que producen el mismo tipo de efecto.
5. Probabilidad y leyes probabilistas
Las leyes probabilistas son aquellas regularidades nómicas cuya formulación contiene esencialmente expresiones probabilísticas o estadísticas, como las leyes (6), (7) y (1 1) de nuestra lista inicial. Damos en este caso una caracterización en términos intencionadamente lingüísticos puesto que, como veremos, es una cuestión especialmente debatible que haya algo como probabilidades objetivas en la naturaleza. A las regularidades estadístico-probabilistas se aplica también la distinción entre nómicas y accidentales. Nómicas son, por ejemplo, las tres recién mencionadas, mientras que la siguiente regularidad estadística (supongamos que verdadera) es claramente accidental:
(35) El 80 8 de las monedas del bolsillo izquierdo de los pantalones de Quine en el Año Nuevo de 1990 son doradas. Que tal porcentaje de monedas del bolsillo izquierdo sean doradas es tan accidental como que todas las del derecho lo sean. Si se entiende el sentido en que (30) es
¡ I
i
'
1 1
!
i
¡
¡
1
I
accidental, se debe entender igualmente que (35) lo es. Por lo general, las regularidades accidentales de esta clase se suelen formular en términos estadísticos, no en términos probabilistas. Las expresiones probabilistas suelen reservarse sólo para regularidades nómicas, pero nada esencialmente incorrecto hay en decir, sabido que (35) es accidental, que la probabilidad de que una de tales monedas sea dorada es 0,s; aunque menos común, también se expresan a veces regularidades accidentales en términos probabilistas. Un ejemplo más interesante es (36): (36) Los consumidores de café tienen una probabilidad más alta de padecer cáncer de pulmón que los que no lo consumen. Ésta es una regularidad verdadera, pero (seguramente) accidental. Lo que produce cáncer de pulmón no es tomar café sino fumar, y lo que ocurre es que tomar café está nccidentafineilte correlacionado con fumar (al menos a nivel biomédico, quizá la correlación entre tomar café y fumar sea una regularidad estadística nómica de la sociología, en cuyo caso (36) resultaría ser nómica después de todo). Entre las leyes probabilistas también se pueden distinguir las estrictas de las no estrictas. Si bien tanto en las leyes probabilistas como en las no estrictas ocurre que, aunque la regularidad nómica sea verdadera, pueden satisfacerse las condiciones antecedentes y no las consecuentes, el carácter probabilista o no es en principio independiente del carácter estricto o no. Al igual que hay leyes no probabilistas estrictas y no estrictas, también las leyes probabilistas pueden ser estrictas o no estrictas. Otra cosa es que, si se defiende una determinada concepción epistémica de la probabilidad, toda ley probabilista resulte ser en el fondo una ley (no probabilista) no estricta. Pero en principio, y antes o independientemente de dicho análisis, es claro que puede haber leyes probabilistas tanto estrictas como no estrictas. Por ejemplo, la ley (7) sobre la desintegración de los átomos de radio es seguramente estricta, mientras que (37) y (35) son claramente no estrictas:
(37) La probabilidad de que te interrogue la policía en Barcelona paseando por la calle es muy baja. (35) La probabilidad de curarse de una infeccióii tomando antibióticos es muy alta. Ambas regularidades nómicas son verdaderas, pero claramente interferibles: si además de pasear por Barcelona se tiene aspecto norteafncano, la probabilidad de que te interroguen pasa a ser alta; si se toma alcohol después de los antibióticos, la probabilidad de cura disminuye considerablemente. Nótese que la interferibilidad no consiste ahora en que se pueda dar el antecedente sin el consecuente, eso es siempre así en las leyes probabilistas. La interferibilidad consiste en que, al añadir nuevos factores (interferidores) al antecedente, puede alterarse la probabilidad aseverada. La diferencia entre leyes probabilistas estrictas y no estrictas tiene pues que ver con la relevancia estadística de las nuevas condiciones que se pueden añadir al antecedente: si tales nuevas condiciones son estadísticamente relevantes para la ocurrencia del consecuente, entonces la probabilidad
varía y la ley resulta interferida. Las leyes probabilistas estrictas se caracterizan por la Ito~nogeneidadde la propiedad o clase de referencia antecedente. La clase de referencia antecedente A es homogénea respecto de la propiedad (clase de referencia) consec~centeB si en todas las subclases de A la probabilidad de ser B es la misma, esto es, si para cualquier propiedad C,la probabilidad de ser B es la misma siendo A q u e siendo A & C. Así, si A es B-homogénea no hay posibilidad de interferencia probabilista y la ley es estricta. Cuando en el capítulo 7 nos ocupemos de las explicaciones estadísticas, volveremos sobre esta noción. Las leyes probabilistas se suelen denominar también Nzderennirzistas. Pero aquí hay que ir con cuidado para no confundirse por cuestiones terminológicas. Si por 'indeterminista' se entiende una ley tal que aunque se satisfaga el antecedente no está rotalinerlre deter~ni~zodo o asegurado que ocurra el consecuente, entonces las leyes no estrictas, probabilistas o no, también serían indeterministas. En ese sentido son indeterministas todas las probabilistas y las no probabilistas interferibles, y son deterministas sólo las no probabilistas estrictas. Si por 'indeterminista' se entiende simplemente probabilista, entonces las interferibles no probabilistas serían deterministas. Por último, se puede quizá pensar en un sentido débil de 'determinista' que incluya a las probabilistas estrictas. En este sentido débil, una ley es determinista si está dererrnirzado qué es lo gire Iza de pasar. En una interpretación amplia, en las leyes probabilistas estrictas está determinado qué es lo que ha de pasar, a saber, que se dé determinada probabilidad; si la ley probabilista es estricta, pasa lo que ha de pasar, la probabilidad está determinada. En este sentido débil, 'indeterminista' es simplemente sinónimo de 'no estricta'. Así pues, hay tres interpretaciones posibles de 'ley determinista': a) ley estricta no probabilista, 6) ley no probabilista (estricta o no) y c) ley estricta (probabilista o no). Puesto que los otros casos tienen ya sus propias denominaciones, aquí usaremos la expresión, salvo advertencia en contrario, en el primer sentido (este uso coincide además en general con el de la literatura, pues casi siempre se distingue entre leyes deterministas e indeterministas sin tomar en consideración las leyes no estrictas). Antes de presentar brevemente las diferentes concepciones sobre la probabilidad, y con ello sobre la naturaleza de las leyes probabilistas, vamos a explicitar el modo en que se van a transcribir estas leyes en el resto de esta obra y a comentar lo que se dirime en otras alternativas que no vamos a seguir. Las leyes estadístico-probabilistasmás sencillas tienen una de las siguientes formas: (i) "La probabilidad de que los A sean B (o la pro-habilidad de ser B condicionada a ser A) es r", "El r % de los A son B"; (ii) "La probabilidad de ser B siendo A es mayor que siendo C', "El porcentaje de Bs que son As es mayor que el de Bs que son Cs"; (iii) "Ser A aumenta la probabilidad de ser E'. Para estas afirmaciones itómicas estadístico-probabilísticas vamos a usar, respectivamente, las siguientes transcripciones: 'p(B/A) = r', 'p(B1A) > p(B/C)' y 'p(B1A) > p(Blno-A)' (es inmediato que con la primera bastaría, pues ' ~ ( c x>) p(B)' equivale a 'hay r, s tales que p(a) = r, p(P) = S y r > S ' ) . Aquí tomaremos la expresión 'p(B/A) = r-' como abreviatura de "v'.~(p(Ax -+ Bx) = r)'. En principio podrían imaginarse dos interpretaciones alternativas, pero es fácil ver que no son viables. Una primera posibilidad es analizar 'p(B/A) = r' mediante 'V.x (A.x
+ p(Bx) = r ) ' . Pero esta opción no es aconsejable, principalmente por dos motivos. El primero es que este análisis es inconsistente si hay leyes probabilistas no estrictas y si el predicado 'probable' se puede usar en lógica de primer orden estándar. Como mencionamos en el capítulo 2 (S3), entre proposiciones probabilistas no vale en general la inferencia (*) de "p(B/A) = r" a "p(B/A&C) = r". Esta inferencia sólo es válida si A es B-homogénea, esto es, si p(B/A) = r es una ley estricta. Por otro lado, en Iógica de primer orden estándar siempre es válida la inferencia (**) de " V x (Ax +y(x))" a " V x (Ax A Cx 4 y(x))". De ambos hechos se sigue que la opción considerada conduciría a inconsistencias. Puesto que no es razonable sostener que todas las leyes probabilistas son estrictas, el único modo de defender esta opción es rechazar que el operador 'p' se pueda usar en lógica de primer orden (quizá por ser intensional), de modo que si este operador aparece en 'y', entonces la inferencia (**) no se puede considerar de primer orden. Pero esta respuesta es poco plausible pues, primero, (**) es válida incluso si 'y' contiene predicados claramente intensionales, p.ej. modales o epistémicos, y segundo, la teoría matemática de la probabilidad se formula usualmente en lógica de primer orden. El otro motivo para no seguir esta opción, independiente del anterior, es que, según algunas concepciones de la probabilidad, no tiene sentido hablar de probabilidad absoluta; sólo tiene sentido hablar de probabilidad condicionada, por lo que 'p(Bx)', si no tiene implícita una paráfrasis condicionada, no siznifica nada. Por tanto, si se usa este análisis se está prejuzgando la falsedad de dicha concepción. La segunda posibilidad es aplicar 'p' a implicaciones materiales generales, esto es, analizar 'BIA' mediante 'V,r (A.r -+ B.r)' y, con ello, 'p(B1A) = r' mediante ' p ( V x (Ar -+ Bx)) = r' (esta opción presupone aceptar que tiene sentido aplicar la probabilidad a proposiciones generales). La principal dificultad de este análisis es que, si aceptamos que 'p' se aplique a generalizaciones, hay casos de generalizaciones materiales falsas cuya probabilidad es razonable considerar nula, o al menos muy baja, y sin embargo la generalización nómica probabilista asigna una probabilidad relativamente alta (análogamente con generalizaciones verdaderas). Supongamos que es una regularidad nómica que la probabilidad de que un átomo de radio permanezca estable durante 1.600 años es 0,5. Ello no quiere decir que la probabilidad de que todos los átomos de radio permanezcan estables durante 1.600 arios es 0,5. Se diría que esta segunda probabilidad es O, aunque quizá eso sea discutible según la concepción de la probabilidad que se defienda. Pero en cualquier caso no es obvio que esta segunda probabilidad sea también 0,5, y así sería si se aceptara este segundo análisis.
LÓGICA,PROBABIL1D.A.D 5.2. PROBABILIDAD
SUBJETIVA Y PROBABILIDAD OBJETIVA
Para concluir, vamos a ver muy brevemente las principales concepciones sobre la naturaleza de la probabilidad y su aplicación a las leyes probabilistas. Estas concepciones no son siempre incompatibles, pues en alsunos casos se defiende que el término 'probabilidad', como 'banco' (o 'necesario') es equívoco, esto es, que tiene diferentes significados y que por tanto no se trata de un único término sino de varios. Así, por ejemplo,
160
FCND.\S1E>TOS DE FlLOSOFI.4 DE LA CIENCIA
Camap sostiene que hay que distinguir entre probabilidadi o probabilidad lógico-inductiva y probabilidad: o probabilidad estadística. Por otro lado, no todos los análisis pretenden dar una definición de 'probabilidad' en función de otros térniinos no probabilistas supuestamente más claros. En muchos casos el análisii se detiene en algún concepto probabilista que se considera primitivo y del que se derivan el resto de conceptos probabilistas, y presenta sus conexiones no definicionales con otros conceptos. Por último, todos los análisis deben satisfacer al menos dos condiciones de adecuación: en primer lugar, deben ser coherentes con los principios fundamentales de la teoría matemática de la probabilidad (cf. p.ej. Kolmogorov, 1950); y en segundo lugar, deben mostrar cómo se evalúan las proposiciones probabilistas, o cómo se determinan los valores probabilistas, a partir de frecuencias observadas. Éstas son exigencias que todo análisis debe satisfacer en principio; para rechazar alguna de ellas hay que ofrecer motivos muy fuertes. El tema de la probabilidad es especialmente complejo, tanto técnica como conceprualmente. Ninguna de las concepciones en liza ha mostrado por ahora ser plenamente satisfactoria, el debate sigue abierto y dista mucho de resolverse pronto. Por la coniplejidad del tema y las lin~itacionesde espacio vamos a presentar sólo las líneas generales de las principales alternativas y cómo afectan a la naturaleza de las leyes probabilistas. Sobre algunas de ellas ~~olveremos más adelante cuando nos ocupemos de la explicación (cap. 7) y, especialmente, de la inducción (cap. 12). Se pueden distinguir en general tres familias de concepciones sobre la probabilidad: la lógica, la subjetivista y la objetivista. Según la primera, los enunciados de probabilidad son acerca de relaciones lógicas (inductivas) entre proposiciones. Según la segunda, los enunciados de probabilidad son acerca de las creencias que tiene el sujeto sobre cieno ámbito; el contenido de tales enunciados, en tanto que probabilistas, no tiene que ver con estados del inundo objetivo sino con estados epistémicos de los sujetos, esto es, con el estado de conocimiento o ignorancia, por parte del sujeto, de regularidades no probabilistas, las únicas que hay objeti\.amente. Según la tercera, los enunciados de probabilidad son acerca de propiedades empíricas objetivas independientes del sujeto de conocin~iento.Esta caracterización es extremadamente superficial y parcialmeiite inadecuada, pero la tomaremos como punto de partida para presentar las diferentes alternativas. Probabilidad Iógica. La interpretación lógica de la probabilidad se inicia con Keynes (1921), Ramsey (1926) y Reichenbach (1935) y es desarrollada por Jeffreys (1957) y, sobre todo, Carnap (cf. especialmente 1950), cuyos trabajos continúa Hintikka (1966). En esta interpretación, las afirmaciones de probabilidad condicionada (al menos en una de las nociones de 'probabilidad') expresan relaciones de inferencia lógica, no deductiva sino inductiva; las afirmaciones probabilistas son por tanto, como todas las afirmaciories lógicas, a yriori. La afirmación "P es consecuencia deductiva de U" expresa una relación Iógica objetiva, a saber, que la verdad de P está implicada por la de a. Cuando la probabilidad es Iógica, 'p(P/a) = r' significa "P es consecuencia inductiva de u en grado J', y esto expresa una relación Iógica tan objetiva como la anterior que, igual que aquélla, depende sólo del contenido de cr y de P . El problema, claro está, es precisar en qué consiste esa relación. En el caso de la inferencia deductiva es sencillo precisar cuál es
LEYES C I E ~ T ~ F I C A S
161
esa relación y los patrones inferenciales correctos a que da lugar. No ocurre así con la inferencia inductiva y todavía hoy se sigue trabajando en el desarrollo de un sistema de lógica inductiva satisfactorio (tarea que para los críticos, como Popper, está condenada al fracaso, pues según ellos simplemente no existe una Iópica inductiva). En e l capítulo 12 ($3) volveremos sobre esta cuestión. Como veremos, una posibilidad es subjetivizar la Iópica inductiva y sostener que sus leyes no son sobre relaciones 'objetivas que mantienen las proposiciones independientemente de los sujetos cognoscentes, sino sólo sobre las creencias de los sujetos. En este caso, la noción lógica de la probabilidad acabaría reduciéndose a alguna de las versiones de la probabilidad subjetiva. Incluso si se acepta este sentido lógico 0. inductivo de la probabilidad. es poco plausible aplicarlo a las leyes científicas probabilistas. Ello supondría interpretar las leyes concretas de tipo p(BIA) = r como afirmaciones lógicas que expresan casos concretos del esquema argumentativo inductivo (1), y las leyes concretas de tipo p(B/A) > p(B1C) como afirmaciones en que se establece que un caso concreto de (110) es una inferencia inductiva mejor que el correspondiente caso concreto de (IIb).
Nótese que los argumentos inductivos involucrados no tienen por qué ser "buenos" o "fuertes". En el primer caso r puede ser bajo, y ello no debería afectar en absoluto a su legitimidad en tanto que ley probabilista (cf. p.ej. la lzy según la cual la probabilidad de que un electrón atraviese una barrera de potencial es 0,I). Las leyes probabilistas del primer tipo serían pues reglas de inferencia inductiva para pasar de unas afirmaciones a otras, con mayor o menor garantía inductiva según sea la probabilidad aseverada en la ley. Análopamente en el segundo caso, tanto (IIa) corno (IIb) pueden ser muy débiles mientras (IIa) sea menos débil que (IIb). Las leyes del segundo tipo establecerían comparaciones entre pares de tales reglas de inferencia. Esta interpretación de las leyes es, además de poco natural, implausible prinin fncie pucs convierte a las leyes de la ciencia empírica en afirmaciones lógicas (de la lógica inductiva) y por tanto a priori. Defender que las leyes naturales (probabilistas) son verdades lógicas (inductivas) es identificar la necesidad nómica con la necesidad Iógica. Esta consecuencia es prirnn fncie inaceptable, es un precio demasiado elevado a pagar por el esclarecimiento de la noción de ley, probabilista o no. Independientemente de la implausibilidad de esta eventual aplicación de la probabilidad lógica a las leyes probabilistas. y suponiendo, como pretenden los inductivistas, que es una noción aceptable, la noción lógico-inductiva de la probabilidad no puede ser la única. Al menos por uri motivo, a saber, los argumentos inductivos usan en muchos casos en las premisas afirmaciones probabilistas o estadísticas. Es cierto que hay argumentos inductivos, p.ej. los de inducción por enumeración, cuyas premisas no usan expresiones probabilistas o estadísticas, pero otros sí. Y quien pretendiera que esta noción de probabilidad es la única debería mostrar que todos los casos de argumentos inductivos con premisas probabilistas se pueden reconstruir sin hacer intervenir afirmaciones probabilistas. Como hemos mencionado. Carnap mismo no pretendía (y p.ej. Ramsey tampoco)
162
FUSDA)IE>TOSDE FILOSOF~A DE LA CIENCIA
que la noción lógica fuese la única y aceptaba además una noción estadística o frecuencialista de la probabilidad.
Probabilidad sitbjetii-a. Veamos ahora el núcleo de otra de las interpretaciones, la subjetivista. Para las interpretaciones s~bjetivistas~ la probabilidad no se refiere al muitdo sino a nuestro corlocilniento. El lema de estas concepciones es: la probabilidad es una medida de nuestra ignorancia. La diferencia entre una afirmación probabilista y una no probabilista no tiene que ver con el mundo objetivo sino con el estado de conocimiento o ignorancia del sujeto. La idea es que, cuando el sujeto no tiene toda la evidencia relevante para a, le asigna un valor entre O y 1 (y distinto de ambos) que expresa la "intensidad" de su creencia en a dada la evidencia de que dispone. La probabilidad, así entendida, es grado de creencia ( o cor?fiartza) racional (la exigencia de racionalidad es esencial para que esta probabilidad satisfaga los principios de la teoría matemática). Entre los defensores de esta noción, en alguna de sus diversas versiones, se cuentan Bemoulli (1 7 13), Bayes (1763), Laplace (1795), Ramsey (1928), de Finetti (1937) y Savage (1954) (para una buena antología, cf. Kyburg y Smokler (eds.), 1961). Las creencias son susceptibles de gradación o, cuando menos, de ser sostenidas con mayor o menor intensidad, y la probabilidad subjetiva es una medida de dicho grado, mide la confianza del sujeto en la ocurrencia del hecho en cuestión. Puesto que la creencia, y sus grados, son relativos a la evidencia disponible, desde una perspectiva subjetivista lo natural es considerar la probabilidad siempre condicionada. Así, p(ple) n i d e el grado o fuerza de la creencia de cierto sujeto s en cierta proposición p a la luz de la evidencia e de que dispone el sujeto. Es cierto que el cálculo de probabilidades contiene también probabilidades absolutas o incondicionadas p(u), pero en esta concepción las probabilidades incondicionadas se deben interpretar como probabilidades condicionadas encubiertas relativizadas todas ellas a cierta evidencia-base e. común tijada en cada contexto. De este modo se debe entender la forma en que se determinan experimentalmente las probabilidades subjetivas mediante experimentos de apuestas o preferencias. Se puede determinar la probabilidad subjetiva de un individuo sobre varias opciones haciendo que apueste por cada una de ellas o que las ordene aisladamente y en combinación. En estos procedimientos, el sujeto parte de cierta evidencia-base en relación a la cual establece sus apuestas o preferencias. En algunos casos no tiene evidencia positiva discriminatoria y entonces considera todas las alternativas equiprobables (éste es el fundamento del principio de indiferencia laplaciano, al que corresponde el dicruin "probabilidad igual a casos favorables entre casos posibles"); en estos casos es razonable considerar que se acepta como evidencia de fondo la no existencia de factores que discriminarían unas opciones frente a otras. La diferencia entre las nociones lógica y subjetiva es sutil y se puede prestar a confusión. Lo que puede motivar su confusión es que en ambos casos se caracteriza la probabilidad como el grado de apoyo que una información proporciona a cierta proposición. Lo esencial para mantener la diferencia es que dicho grado de apoyo es objetivo en el primer caso y subjetivo en el segundo. Así, si se identifica probabilidad con grado de creencia, pero se caracteriza éste en términos objetivos o ideales, se está pasando de la
i
noción subjetiva a la lógica. Por ejemplo, si se apela al grado en que la creencia resulta ot>jetivameníeju~tificndn,esto es, si por grado de creencia raciona1 en p sobre la base de la evidencia e se entiende grado de justificación que objetivamente e confiere a p en virtud del contenido de ambas, entonces estamos ante la probabilidad lógica o inductiva. Y 10 mismo si identificamos probabilidad con grado de creencia racional ideal, si con ello se sugiere que todos los sujetos racionales deben coincidir idealmente en los grados de creencia en una proposición p dada cierta evidencia e . El hecho distintivo de la probabilidad subjetiva frente a la lógica es, entonces, que diferentes individuos o comunidades, siendo todos ellos racionales, puedan diferir en sus probabilidades subjetivas básicas aun disponiendo de la misma evidencia. Esto es, si todos los sujetos deben idealmente coincidir en la probabilidad de p dada la misma evidencia e, entonces es que ese valor de apoyo de e a p depende sólo del contenido de e y de p, que es justamente lo que caracteriza la probabilidad lógica. Nótese que lo distintivo de la interpretación subjetivista es que diferentes individuos pueden diferir en las probabilidades básicas, no en el modo de combinar las básicas para obtener valores derivados. Esos valores derivados se obtienen operando con los básicos mediante los principios de la teoría matemática de la probabilidad y, recordemos, todas las interpretaciones, y tambiin por tanto la subjetivista, aceptan la validez de tales principios. Así, si dos individuos difieren en los valores que asignan a p(ple), será porque difieren en los valores que asignan a pr\e o a e , pues ambos aceptan el principio del cálculo de probabilidades según el cual p(ple) = p(p A e)/p(e). Si la probabilidad subjetiva se distingue de la probabilidad lógica por la posible discrepancia ante la misma evidencia, de la probabilidad objetiva se diferencia por desclparecer en situaciones epistémicamente ideales, esto es, en situaciones en las que se dispone de roda la evidencia relevante. iSo puede ocurrir que tengamos a nuestra disposición toda la evidencia relevante de que idealmente se puede disponer y que a pesar de ello la probabilidad se mantenga por debajo de 1 y por encima de O'?, ¿que sigamos siendo incapaces de garantizar plerlarrterlre qué va a pasar? Si se trata de probabilidad epistémica, no. Si la probabilidad es epistémica, entonces tiende a decrecer con la disminución de ignorancia, es decir, con el aumento de evidencia relevante, e idealmente desaparece si la evidencia disponible es toda la relevante. Si se cree que a pesar de disponer de toda la evidencia relevante tiene sentido que la probabilidad esté entre O y 1, sólo puede ser porque se cree que hay probabilidades objetivas, incertidumbres objetivas debidas a la naturaleza del mundo y no a nuestro estado de carencia de información. Por ello, según esta concepción subjetivista, las leyes probabilistas dejarían de ser probabilistas, serían sustituidas por otras deterministas, si dispusiéramos de todo el conocimiento posible. Las leyes probabilistas son, en realidad, sernsjantes a las lejes ceteris paribus, o mejor, una forma más precisa de las mismas. Las leyes probabilistas son sustitutos provisionales de leyes no probabilistas estrictas más complicadas de las que se desconocen algunos componentes. "p(BIA) = r" (O c r < 1) es una regularidad estadística que sustituye provisionalmente a la verdadera ley "A & C N-iniplica B", donde C es una propiedad complementaria que todavía desconocemos. Según la interpretación subjetivista de las leyes probabilistas, la probabilidad (no lógica) no está en la naturaleza, no informa del mundo sino que sólo es
1 64
Fv.iD.i\3lE\TOS DE ~ 1 ~ 0 ~ 0DE F íLA . l CIENCIA
indicio de nuestra falta de evidencia. Como desconocemos todos los factores nómicamente relevantes. debemos contentarnos pro\lisionalmente con regularidades estadísticas sobre frecuencias obsenadas. Pero estas regularidades no son verdaderas leyes; en una situación epistémica ideal sen'an reemplazadas por regularidades no probabilistas, las Gnicas a las que cabe considerar propiamente leyes de la naturaleza. En sentido estricto, no se plantea entonces la cuestión de la relación entre frecuencias obsen~adasy leyes probabilistas. No hay. propiamente hablando, tales leyes, y las generalizaciones sobre frecuencias observadas son simples sustitutos provisionales, en situaciones de incertidumbre epistémica, de las verdaderas leyes (deterministas). Esta interpretación subjetivista de las leyes probabilistas se puede aplicar con cierta plausibilidad a algunas de ellas, como la que correlaciona el fumar con el cáncer de pulmón. Cuando sepamos todo lo que hay que saber sobre el origen del cáncer de pulmón podremos sustituir la actual ley estadística por otra estricta y no probabilista (suponiendo que haya leyes biofisiológicas estrictas, dejamos de momento de lado esta cuestión). Quizá se puede proponer lo mismo de las leyes sobre los mecanismos de azar, p.ej. que la probabilidad de que salga número primo al lanzar un dado cúbico regular y homogéneo es 213. Si pudiéramos computar toda la información física sobre el dado y el lanzamiento, lo que actualmente no podemos hacer por motivos tanto teóricos como técnicos, tendríamos leyes mecánicas (estrictas) no probabilistas que predecirían los resultados de cada lanzamiento sin incertidumbre. Las leyes de algunas teorías científicas estadísticas, como la mecánica estadística o la genética de poblaciones, se interpretan'an de la misma manera. Pero incluso si esta interpretación es aplicable a algunas leyes probabilistas, ello no supone que se pueda aplicar a todas. De hecho, actualmente se acepta de modo prácticamente general que esta interpretación es inaplicable al menos a las leyes probabilistas de la mecánica cuántica. Las probabilidades de las leyes cuánticas. como (6),(7) o (33), tienen que ver con el 1nu~id0,no con nuestro conocimiento de él y, por tanto, no se eliniinarían al cuIminar idealmente nuestro conocimiento. En los inicios de la teoría cuántica hubo quien defendió una interpretación subjetivista de sus leyes probabilistas. Einstein, entre otros, sostuvo la llamada iltrerpreració~z de las i.ariables ocultas: hay ciertos parámetros que provisionalmente desconocemos y que son los responsables del carácter indetemlinista de las leyes cuánticas, y cuando se conozca la naturaleza y comportamiento de dichos parámeuos la mecánica cuántica se podrá formular con leyes perfectamente detem~inistas.A pesar de la autoridad de algunos defensores de esta interpretación, se acabó imponiendo la interpreracióiz de Copenhague, según la cual las probabilidades de estas leyes son objetivas, son propiedades de la naturaleza independientes del estado de nuestro conocimiento.
Probabilidad 0bjerii.a. La opción más inmediata para caracterizar las probabilidades en~píricasobjetivas es identificarlas con, o a partir de, frecuencias relativas. Las frecuencia relativa de As que son Bs es un hecho objetivo del mundo (A es la clase o ~~ropiedad de referencia), y en relación a él se pueden caracterizar las probabilidades. Algunos defensores de esta interpretaciónj-ecue)~cialistade la probabilidad objetiva son, en diferentes versiones, Venn (1886), Peirce (1931-1958), Russell (1948), Reichenbach (1949), Braithwaite (1953) y \.on Mises (1957). La idea es analizar la noción de pro-
LEY
CIE~T¡FICI\S
165
babilidad objetiva en términos de la de freciiencia. Este análisis se encuentra con diversas dificultades que originan diferentes versiones del mismo hasta conducir a la teoría de las propensiones, que supone abandonar de hecho la posibilidad de tal aniílisis y aceptar las probabilidades objetivas como conceptualmente primitivas. Si la clase de referencia es finita, la probabilidad no se puede identificar con la frecuencia relativa pues una probabilidad dada p(BlA) es lógicninente compatible con cualquier frecuencia correspondiente a un número finito de casos (pasados o futuros). El caso más manifiesto es aquel en el que sólo hay un '4, pero en el fondo ocurre igual con cualquier número finito. Que p(A1B) sea p.ej. 0,5 es compatible con que todos los 10'OOOAs (pasados y futuros) que hay sean B; o para ponerlo (sólo aparentemente) menos drástico, con que lo sean el 99 % de los As; por ejemplo, que la probabilidad de sacar par al lanzar un dado no cargado sea 0,5 es conceptualmente compatible con que todas Ias veces que se tire salga impar. Esta posibilidad de desajuste entre las probabilidades y las frecuencias observadas es also que debe aceptar también el frecuencialista y por tanto no puede identificar directamente probabilidad con frecuencia en estos casos, a no ser al precio de negar dicha posibilidad. Se podría defcnder que la probabilidad sólo tiene sentido con clases de referencia efectivamente infinitas, identificándola con el límite de la secuencia infinita d e frecuencias. Pero esta opción es n) empíricamente arriesgada, pues es vacía si resultara que de hecho todas las clases de referencia de nuestro universo físico fuesen finitas, y b) conceptualmente problemática, pues tales límites varían con el modo en que se ordene la clase B (cf. von Mises, 1957 y Pollock, 1990, S 1.4). Una alternativa, puede pensarse, es identificar la probabilidad con el límite de la frecuencia de una secuencia potencialrnente infinita, esto es, de secuencias infinitas virtuales, hipotéticas o posibles. Pero ahora el análisis se toma circular, pues obviamente 'posible' significa aquífísicarnente posible, esto es, permitido por las leyes físicas, y en el caso que nos ocupa por las leyes físicas probabilistrrs. Si, como defiende el objetivista, hay leyes físicas objetivamente probabilistas, entonces de elIas depende qué secuencias son físicamente posibles. Por este motivo, y otros que no podemos examinar ahora, los objetivistas han acabado en general por renunciar a analizar o reducir la noción de probabilidad objetiva en términos de otras nociones previas, como la de frecuencia. La única salida es aceptar las probabilidades objetivas como entidades conceptualmente primitivas. Estas entidades, denominadas 'tendencias' o 'propensiones', son propiedades objetivas independientes de nuestro conocimiento, son propiedades que poseen las cosas. Así, igual que el electrón tiene la propiedad de tener carga eléctrica -1, tiene también la propiedad de tener la propensión 0,l de atravesar la barrera de potencial contra la que se dispara. Las leyes probabilistas tratan de estas propensiones al igual que las no probabilistas tratan de las propiedades que no son propensiones. Algunos representantes de esta versión del objetivismo probabilista son Popper (1935-1958, 1956), Hacking (1965), Mellor (1971), Fetzer (198 l), Suppes (1984) y Pollock (1990). Para muchos críticos, Ia principal dificultad de las teorías de las tendencias o propensiones objetivas es que estas entidades parecen metafísicamente misteriosas. La idea de una metafísica probabilista les parece inaceptablemente oscura o, simplemente. contradictoria. Pero estas objeciones son en parte retóricas, pues en cierto sentido todas
las entidades teóricas son metafísicamente oscuras y de lo que aquí se trata es de si éstas tienen una oscuridad especljSca. La verdadera dificultad, todavía no superada, es explicar satisfactoriamente cómo se determinan empíricamente estas propensiones, cómo se evalúan las hipótesis sobre ellas a partir de datos sobre frecuencias observadas dado que cualquier frecuencia sobre un número finito de casos es lógicamente compatible con cualquier propensión.
6. L a naturaleza de las leyes Concluiremos este capítulo con una breve presentación de las principales concepciones sobre la naturaleza de las leyes. Ahora nos centraremos exclusivamente en las leyes deterministas, en el sentido precisado más arriba. esto es leyes estrictas no probabilistas. En las dos secciones anteriores hemos visto las peculiaridades de las leyes no estrictas y de las leyes probabilistas, así como las principales concepciones sobre las mismas. Las diferentes alternativas presentan su concepción de la naturaleza de esos tipos de leyes por contraste con la de las leyes deterministas, considerada en esos contextos aproblemática. Sin embargo, dista mucho de haber un acuerdo sobre el modo de considerar las leyes deterministas. En esta sección vamos a examinar brevemente las principales posiciones al respecto. En la discusión sobre la naturaleza de las leyes se dirimen cuestiones filosóficas globales sustantivas muy probleináticas, como las del realismo, la modalidad, los universales, la relación entre epistemología y metafísica, etc., y por ello la simplificación resulta especialmente insatisfactoria. La riqueza e interés filosófico de cada posición concreta radica en el modo específico en que ella desarrolla la idea general y aquí no vamos a poder detenemos en estos desarrollos específicos. Lo que sigue debe considerarse sólo una caracterización muy general de las principales alternativas, insuficiente para evaluarlas en su justa medida; para un estudio más detenido se puede consultar, p.ej. Armstrong, 1983 y van Fraassen, 1989 (cf. también este último y Cartwright, 1983, para dos escepticismos acerca de cualquier noción de ley). En lo que sigue, y salvo advertencia en contrario, por 'ley' deberá leerse 'ley determinista'. Todo análisis satisfactorio de las leyes (deterministas) debe satisfacer dos requisitos. En primer lugar, la condición de iinplicación de r-egula~idadesfactuales ( I R F ) : el análisis debe mostrar cómo las leyes i~nplicanregularidades factuales; esto es, el análisis debe tener como consecuencia que de "A N-implica B" se derive ''Vx(Ar + Bx)". En segundo lugar, la condición de disriiición respecto de las regularidades factuales (DRF): el análisis debe mostrar cómo las leyes se distinguen de las meras regularidades factuales; esto es, el análisis debe tener como consecuencia que las leyes, y no cualquier generalización verdadera, tienen las propiedades que vimos en la sección 2 que distinguían las regularidades nómicas de las accidentales. En breve: todo análisis ha de mostrar que no toda regularidad factual es una ley, pero toda ley implica una regularidad factual. En general se pueden distinsuir tres tipos de análisis de las leyes: los I-egulai-itivisras hrrnieanos, los regulariririsras 1-ealistas, y los necesitativistas (o también unii~e~-salis-
tas). Debe quedar claro que ninguno niega, en principio, la diferencia entre regularidades accidentales y nómicas, todos pretenden dar cuenta de esa diferencia; la cuestión es los términos en los que lo hacen. Las concepciones regularitivistas analizan las leyes como regularidades de cierto tipo. Una ley es una regularidad verdadera que satisface ciertas condiciones adicionales:
y expresa la condición adicional que debe satisfacer la regularidad para ser ley (condición que a veces se formula como condición sobre el enunciado 'Vx(A.r -, Bx)'). La idea es sencilla: el análisis satisface (IRF) pues según él toda ley es una generalización material verdadera. y además puede satisfacer (DRF) pues no toda generalización material verdadera es una ley, sólo lo son las que satisfacen y. Que se satisfaga o no efectivamente (DRF) dependerá de que de se deriven o no las propiedades en cuestión (explicatividad, apoyo a contrafácticos, intensionalidad, etc.). 6.1. R E G U L . A R ~ ~ [HUMEASO V~S&~O Es común caracterizar los análisis regularitivistas de hurneanos, pues Hume fue el primer defensor explicito de esta concepción. Pero eso es parcialmente confundente pues la teoría de Hume se caracteriza además, yfitndcrmentalrnente, por otra tesis, a saber, la tesis según la cual no hay necesidades en la natura1e:a. Dentro d e los regularitivistas distinguiremos, entonces, los que están de acuerdo con esa tesis y los que no. La diferencia tiene que ver con la condición y. Si la condición y supone la aceptación de algún tipo de necesidad o modalidad en la naturaleza independiente de nuestro conocimiento, calificaremos dicho análisis regularitivista de realista. Si, contrariamente, la condición se da en términos que suponen la tesis antirrealista de Hume, si la única necesidad a que se apela es una necesidad proyectada por nosotros (nuestro conocimiento, la ciencia, etc.), lo calificaremos de humecno. Como es de esperar, Hume mismo es el primer regularitivista humeano. En su caso y es una condición "epistémico-psicoIó,oica", grosso modo: que los casos pasados observados están de acuerdo con la regularidad y que tengamos la tendencia de proyectarlos hacia el futuro. Una ley es una regularidad observada que, por hábito y otros mecanismos psicológicos, proyectamos hacia el futuro, esperainos que continúe igual. En cierto modo, todas las versiones posteriores del regularitivismo humeano son refinamientos de esta idea. Un intento de defender esta posición sin apelar tan inmediatamente a elementos psicológicos o epistémicos es el de Hempel (1965). Hempel pretende dar una caracterización de las leyes como cierto tipo de resularidades sin recurrir a una supuesta necesidad en la naturaleza, pero sin recurrir tampoco explícitamente a condiciones epistémicas. Este autor considera leyes los enunciados generales mismos y no lo que ellos expresan, pero podemos ignorar esto de momento considzrando que la condición y es relativa al enuncia-
do general 'Vx(As -+ Bs)' que expresa la ley. La idea de Hempel es que y imponga sólo constricciones sintácticas y semánticas, aproximadamente las siguientes: que el enunciado ceneral no contenga esencialmente réninos singulares y que los predicados sean predicados cualitativos puros (p.ej. 'oro'. 'agua'), esto es. que no encubran referencias implícitas a particulares (como 'barcelonés' o 'venusiano'). Pero esta estrategia no es viable pues no da cuenta de la diferencia entre pares de regularidades como las ejemplificadas por (25) y (26) relativas a las esferas de oro y de uranio. Estas dos resularidades no se diferencian por ningún hecho sintáctico ni semántica y sin embargo una es accidental y la otra nómica. Por tanto, nin~unacaracterización de y en términos exclusivamente sintácticos y semántjcos sirve para la distinción. En la línea humeana, si no se quiere apelar a necesidades naturales parece que no hay más alternativa que recurrir a condiciones epistémicas de aceptación e integración teórica. En este caso, y contiene sólo referencias al uso que hace la comunidad científica; es dicho uso el que constituye la regularidad en ley. Defensores de esta propuesta, en alguna de sus versiones, son Goodman (1955), Ayer (1956) y Mackie (1966). La idea básica es que la diferencia entre generalizaciones nómicas y accidentales no reside en los hechos sino en la actitud de quienes las exponen (Ayer), en el modo en que se utilizan (Mackie); no es que usemos una regularidad para esplicar y predecir porque es una ley, sino que la regularidad es una ley porque la usamos para explicar y predecir (Goodman). Una ley es, pues, una regularidad (presuntamente verdadera) que forma parte del Corpus científico, que pertenece a alguna de las teorías con las que explicamos y predecimos. En opinión de los hun-ieanos esto basta para dar cuenta de las propiedades de las leyes que vimos en la sección 2. Las propiedades relativas a su uso en la predicción y la explicación, y a su confirn~ación,son inmediatas dado este análisis. Su intensionalidad también, pues se deriva de que se usan en las explicaciones y de que Ias explicaciones son intensionales (cf. capítulo 7). En cuanto a la capacidad de apoyar contrafácticos, también se obtiene si, como es usual en esta concepción, los contrafácticos se analizan en términos de leyes. Con lo que tienen más dificultad los humeanos es con la objetividad. Si por objetividad se entiende que la diferencia entre leyes y regularidades meramente fácticas es independiente de nuestro sistema de conocin-iiento. obviamente no pueden explicar la objetividad de las leyes. Su tesis central es justamente que no son objetivas en ese sentido, y acusarles de ello es, en su opinión. viciar la cuestión pues es precisamente eso lo q u e está en juego. Pero esto no quiere decir que las leyes sean "inventadas" o que no se "descubran". E12 tanto que regulal-idades, son verdaderas o falsas dependiendo del mundo, independientemente de nuestro conocimiento. En este sentido son descubribles y objeti\'as. Lo que no es objetivo, lo que depende de nuestro conocimiento, es qué regularidades \'erdaderas son leyes, esto es, cuáles cumplen las condiciones vistas en la sección 2. Para el humeano la no objetividad en ese sentido no es objetable, pues según él tales condiciones, incluidas la intensionalidad y el apoyar contrafácticos, son en el fondo relativas eXclusi\'al?teizreal uso en la práctica científica. Esta concepción tiene una consecuencia que parece en principio inaceptable, pero que 10s humeanos están prestos a aceptar pues es justamente su bandera, a saber, la reducción de la modalidad nón-iica a la modalidad epistémica. No hay necesidad en la
-
LEYES CIE,W~FICAS
i 1
169
naturaleza, toda necesidad (no meramente lógica) es proyección de nuestro conocimiento. Y rechazan que esto contradiga flagrantemente nuestras intuicioneq pues éstas se limitan a las propiedades sobre explicación. contrafácticos, etc. Se trata de proponer un análisis que satisfaga esas intuiciones y el suyo lo hace, salvo en lo referente a una noción de objetividad que, para los humeanos, no es un dato de nuestras intuiciones sino teoría filosófica, parte de un análisis alternativo (y según ellos erróneo). En su versión más simple, sin embargo, esta concepción sí tiene una consecuencia que parece claramente contraintuitiva. Si (i) las leyes son las regularidades articuladas entre sí dentro del sistema teórico y (ii) el sistema teórico es el conjunto de teorías actzialmente aceptadas por la comunidad científica, entonces (iii) la diferencia entre leyes y regularidades puede variar de una comunidad a otra o, dentro de una misma comunidad, variar con el tiempo. Dicho crudamente, las leyes naturales serían mutables. No se trata de nuestras creencias sobre ellas, que son indudablemente cambiantes, sino que las leyes rnisrnas serían cambiantes. Hoy la naturaleza estaría regida por una ley y quizá mañana no. Los humeanos que no están dispuestos a aceptar esta consecuencia rechazan (ii). El sistema teórico en relación al cual algunas regularidades se constituyen en leyes no es el actual, sino "el" sistema teórico ideal, el correspondiente al estado de la ciencia en condiciones epistémicas ideales o, como se suele decir, a "la ciencia del Séptimo Día". Las leyes son las regularidades que pertenecen al mejor conjunto de teorías, al sistema epistémicamente ideal, y por tanto no cambian con el tiempo, siempre han sido, son y serán las mismas. Posiciones de este tipo se pueden atribuir a Sellars (1967) y al Putnam del realismo interno (1981) (aunque seguramente se resistirían a aceptar ser calificados directamente de humeanos; éste es quizá también el caso de Kitcher, cf. 1993 y más adelante cap. 7, $6). La principal dificultad con este humeanismo sofisticado es dar sentido a la noción de el mejor sistema te91.ico-e,~plicativode modo preciso, y hacerlo sin recurrir a necesidades o divisiones en la naturaleza objetivas independientes de nuestro conocimiento. Casi todos los que apelan al sistema teórico ideal coinciden en entender por tal "el" sistema que mejor combina sir~iplicidad y jilerza (adecztativn) ('strength'). Para hacer precisa esta idea, y que sirva la función para la que se recurre a ella, se requieren dos condiciones. En primer lugar, fijado urz lenguaje, dar criterios de simplicidad y fuerza que sean aplicables y que no varíen de una comunidad a otra o, en una misma comunidad, de un momento a otro. En segundo lugar, dar un criterio para sopesar simplicidad y fuerza que permita, en la comparación de cualesquiera dos sistemas por su "simplicidad+fuerza", determinar cuál es el mejor; un criterio que además no varíe, etc. Sólo así tiene sentido hablar de el sistema que mejor combina simplicidad y fuerza. Para 10s críticos la tarea es inviable pues consideran estas condiciones insatisfacibles. Los partidarios de esta idea reconocen que se está lejos de desarrollarla en sus detalles pero defienden su corrección conceptual y la legitimidad de su uso en la discusión filosófica general.
Aun aceptando su i~iabilidaden principio. el anterior programa se encuentra con una dificultad aparentemente insalvable si permanece fiel al principio humeano de no recumr a constricciones externas al conocimiento. La dificultad se deriva de la relatividad de los mencionados criterios a l i n lenguaje dado. pues afecta esencialmente la evaluación de la simplicidad comparada. Si en lugar de usar unos predicados (p.ej. 'verde' y 'azul') usamos otros (p.ej. 'verdul' y 'acerde'), un sistema muy simple se puede convertir en muy complejo y viceversa. Supuesto que se dé con un criterio universal de simplicidad, al comparar dos sistemas, el criterio puede dar resultados opuestos según formulemos los sistemas en un lenguaje u otro. Por tanto, caso de que existan tales criterios, sólo se garantiza que seleccionan un único sistema si se fija un lenguaje. Un modo de solventar esta dificultad es abandonar el humeanismo y aceptar constricciones externas al conoci~nienro,esto es aceptar algún tipo de necesidad o distinciones objetivas en la rzaturaleza en relación a las cuales fijar el lenguaje. Esto es lo que hace D. Lewis (cf. p.ej. 19733 y 1983, con anterioridad había defendido posturas con consecuencias semejantes a las de Sellars). Lewis analiza la causalidad en términos de contrafácticos, éstos en términos de leyes (y d e historias parciales de mundos posibles) y define las leyes como las regularidades verdaderas que pertenecen al sistema que mejor maximiza simplicidad y fuerza. Pero para resolver la crítica mencionada termina aceptando una constricción externa: la comparación d e sistemas es relativa "al " le~lguajecujlospredicados son "naturales ", esto es, predicados que denotan propiedades (clases, géneros) rzarurales; y acepta la distinción entre propiedades naturales y no naturales como una distinción primitiva y objetiva por completo independiente de nuestro conocimiento, es una distinción que radica exclusivamente en la ~zaturaleza.En este sentido, Lewis ya no es humeano pues acepta que la distinción entre regularidades nómicas y meramente fácticas descansa en última instancia, a través de las clases naturales objetivas, en la naturaleza; la necesidad natural no es algo proyecrado por nuestro conocimiento. A esta posición la denominamos regularitii*ismorealista, por adoptar una posición realista, o antinominalista, sobre los universales o géneros naturales. Aparentemente Kitcher defiende a veces una posición parecida, pues sostiene también que el lenguaje de la mejor teoría refiere a clases naturales, pero cae en el humeanismo en la medida en que aparentemente simpatiza con la idea de que "las divisiones de cosas en clases [...] son genel-adas por nuestros esfuerzos de organización" (1993, p. 172, cursivas nuestras). Éstos son los diferentes tipos de regularitivismo. Para el humeano radical, ycontiene condiciones de aceptabilidad epistémico-teórica variables. Para el humeano sofisticado, y contiene condiciones de aceptabilidad ideal invariables, pero que no recurren ni explícita ni implícitamente a distinciones objetivas independientes del conocimiento. Para el realista, la identidad del sistema ideal cuya pertenencia al mismo constituye algunas regularidades en leyes presupone la existencia de distinciones objetivas en la naturaleza. Pero para todos ellos las leyes son cierto tipo de regularidades, regularidades verdaderas que cumplen ciertas condiciones.
2 . 49
+ . , 2
*5' 3 % .
, i
$
> 2
P
;-%
Concluiremos este repaso con otra forma de realismo nómico, aparentemente más fuerte, el necesitativisrno. Esta concepción comparte con el regularitivismo realista su antihumeanismo: la necesidad nómica descansa en algún tipo de distinción objetiva que no es proyectada, que "está en la naturaIezaW.Pero se diferencia de éI por rechazar la idea de que las leyes son generalizaciones. Las leyes no son generalizaciones, las leyes consisten en relaciones singulares entre universales o propiedades naturales. Defensores de alguna versión de esta concepción son, p.ej., Dretske (1977). Armstrong (1983) y Tooley (1977). Los particulares son susceptibles de estar en ciertas relaciones, unas independientes de nosotros y otras no. Por ejemplo, entre las primeras, "ser más pesado que" o "haber comenzado a existir antes que"; y entre las segundas, "haber sido percibido antes que". Según esta concepción, los universales, que existen independientemente de nosotros, también pueden estar en ciertas relaciones. Un ejemplo del primer tipo, relaciones que mantienen independientemente de nosotros, es "ejemplificarse en más individuos que"; un ejemplo del segundo, "aparecer nombrado en el mismo escrito científico que". Pues bien, para el necesitativista, cada ley natural es un caso concreto de una determinada relación del primer tipo, de cierta relación objetiva que se da entre algunos universales independiente de nuestro conocimiento. Esta relación ha recibido diversos nombres, 'necesitación', 'conexión nómica' o 'conexión causal', pero la idea general es aproximadamente la misma. Si usamos para denotar esta relación, podemos expresar este análisis del siguiente modo.
,e g
.*g:.,. +2. es la principal objeción, pues se toma como primitivo lo que requiere explicación. A veces ..
Como el lector observará, esto no proporciona mucho análisis. Para algunos, ésta
,
- 3 el análisis se hace un poco más sofisticado, pero siempre se acaba en algún tipo de
':
1 .$ o":S
relación nómica o causal primitiva entre universales que se considera forma parte, como los universales, del mobiliario último del mundo. Pero ésta no es su principal dificultad. , . S a Todo análisis ha de partir de algunos primitivos y la cuestión es si su articulación con el u .. resto de nociones logra la finalidad pretendida. En este caso, la cuestión es si este análisis -. . ... satisface. al menos,.^ y cuanto a DRF, es sencillo ver que efectivamente se -. H :.< obtienen ... . las propiedades deseadas de las leyes. La relación 3 es, tal como se ha presentado, objetiva e intensional: se da o no entre ciertos universales independientemente de u nuestro conocimiento; y si se da entre dos universales concretos A y B no tiene por qué m 2-.; darse también entre otros coextensivos con ellos. El resto de propiedades se obtienen inmediatamente pues contrafácticos, explicación, confirmación y predicción se suelen caracterizar en esta concepción en términos de leyes. La dificultad mayor radica en IRF, en explicar por qué el que se dé la relación entre el universal A y el universal B tiene como consecuencia que todo particular que ejemplifica A también ejemplifica B. No podemos ver aquí los detalles de las diferentes versiones, pero casi siempre se toma ese hecho como coilstitrltivo de q,estrategia que los críticos consideran inaceptablemente oscura. Y
.,
DWE~ ,
%~
,
'-5
La acusación de oscurantismo no constituye una objeción en sí misma; después de todo, qué entidades nos parezcan oscuras o claras depende de qué filosofía profesemos. Pero tras ella sí se encuentra una verdadera objeción. Se trata de la vieja crítica de Hume según la cual este tipo de entidades (supuestas causas o necesitaciones "en la naturaleza") son empíricamente incontrastables y, con ello, inútiles para explicar el desarrollo de nuestro conocimiento y en ese sentido superfluas. La idea es que los enunciados 'Vx(RU + B-Y)'y 'A B' (suponiendo ahora que se satisface IRF y por tanto que el segundo implica el primero) son empírjca o contrastacionalmente equivalentes. Toda experiencia que confirma uno confirma el otro y viceversa. Por tanto. lo que de más contiene el segundo, a saber, referencias a supuestas necesidades en la naturaleza, es empíricamente incontrastable; la supuesta necesitación no se manifiesta en la experiencia más que como regularidad funcional. Apelar a cosas del segundo tipo no ayuda en absoluto a la hora de dar cuenta de la práctica científica. Por tanto, por lo menos desde el punto de vista del análisis de la práctica científica, esas supuestas entidades son para el humeano perfectamente prescindibles. Éste es en esencia el núcleo del argumento del humeano, y por ello defiende que las leyes son cosas del primer tipo, regularidades factuales, que se usan de cierto modo específico en nuestra práctica científica. Para ello debe sacrificar cierta intuición preteórica que el realista cree que el análisis debe salvar, a saber, que la diferencia entre regularidades nómjcas y accidentales es independiente del conocimiento. De otro modo, piensa el realista, el progreso científico resultaría inexpIicable. La respuesta del humeano es que la aceptación de supuestas necesidades en la naturaleza tampoco le sinle después de todo al realista para explicar el progreso cizntífíco, pues el progreso científico es progreso empírico y tales entidades son empíricamente incontrastables. Para el humeano, el realista no puede dar cuenta de lo que pretendía y su realismo se reduce por tanto a un realismo puramente testimonial. Éste es el núcleo del debate sobre el realisno científico, que recorre implícitamente diversas panes de esta obra.
CAPITULO 6 LA MEDICIÓN EN LA CIENCIA
En el capítulo 4 presentamos los conceptos métricos como uno de los tipos, el más elaborado, de conceptos científicos. En este capítulo vamos a profundizar en algunas cuestiones que entonces abordamos sólo parcialmente y a ver otras nüevas relativas a algunos aspectos de la medición que en aquel contexto no se examinaron. El presente capítulo también complementa el estudio de las leyes científicas que hemos realizado en el capítulo 5; en el capítulo anterior nos hemos ocupado básicamente de los aspectos cualitativos de las leyes, en éste nos centraremos en su dimensión cuantitativa. Como advertimos en el prólogo, gran parte de este capitulo (secciones 3 a 6) es un poco más técnico y específico que el resto de esta obra y puede saltarse sin grave perjuicio para el seguimiento de los capítulos posteriores. En primer lugar haremos algunas observaciones generales sobre la noción de magnitud y algunas distinciones previas importantes, en especial la distinción entre medición y metrización. A continuación, y tras un breve repaso a la función de la medición en la ciencia, examinaremos con detenimiento los tipos de metrización, fundamental y derivada, y los procedimientos de medición, directos e indirectos.
1 . Magnitudes. Medición y metrización
La medición constituye una práctica especialmente destacada de la actividad científica, aunque no de toda actividad científica, sino sólo de aquella asociada a teorías cuantitativas o matematizadas. La matematización de una disciplina, o parte de ella, es un logro fundamental que posibilita alcanzar niveles de rigor y desarrollo teórico muy superiores por lo general a los de la investigación cualitativa. Gran parte del progreso de una disciplina científica está asociado al desarrollo y perfeccionamiento de los métodos cuantitativos. El progreso que la ciencia en su conjunto ha experimentado en los últimos cuatro siglos se debe en gran parte a la generalización de tales métodos en las diversas discipli-
174
FUND.+4hlE\TOS DE FILOSOFL~ DE LA CIENCIA
nas. Las ciencias físicas, pioneras y paradigmas de ciencia cuantitativa, están desde hace tiempo totalmente matematizadas. Gran parte de las ciencias biológicas también, e incluso en otras partes fundamentalmente cualitativas, como la taxonon~ía,se usan algunos procedimientos cuantitativos. Las más avanzadas de las ciencias humanas, la economía y (partes de) la psicología, se distinguen por su alto grado de matematización, presente también en menor medida en otras como la sociología, la lingüística, la arqueología o, incluso, los estudios literarios. Aunque la matematización de una disciplina no supone necesariamente el uso de métodos cuantitativos, esto es, el uso del análisis matemático (a veces se pueden usar recursos provenientes del álgebra, o de la geometría, o de la topología), por lo general, y casi invariablemente en las teorías matematizadas más usuales, así es. Éste es el motivo de que la medición tenga un papel tan destacado en la actividad científica. Los métodos cuantitativos son cuaittitatii!os porque trabajan con cailridades, y a éstas se accede, o se las determina, en la práctica científica mediante la medición. La medición está pues indisolublemente ligada al uso de métodos cuantitativos en las teorías de la ciencia natural matematizada y desempeña por tanto un papel fundamental en los beneficios que se derivan de la matematización de la ciencia. Por ello, sobre la medición recae también uno de los aspectos más intrigantes de la ciencia cuantitativa, a saber, la aplicabilidad de las matemáticas (del análisis) al mundo físico: ¿cómo es que la naturaleza se deja tratar cuantitativamente?, ¿cómo es que los números se aplican a las cosas? Parte al menos de la respuesta a esta cuestión debe surgir del análisis de la medición, pues es mediante ella que primariamente aplicamos, o atribuimos, "números" a las cosas. Medir es asignar números a las cosas de modo que aquéllos expresen ciertas propiedades que Cstas exhiben. Pero no toda propiedad de un objeto se puede medir, expresar numéricamente. A las propiedades que son susceptibles de medición las llamamos nzagnitudes; son ejemplos de magnitudes la masa y la longitud de los cuerpos, la duración de los sucesos, la temperatura y la densidad de las sustancias, etc. El resultado de la medición es el valor de la magnitud para el objeto, o la cantidad de magnitud en el objeto. El valor o cantidad se expresa mediante escalas numéricas y se indica con un número seguido de la indicación de la escala; son ejemplos de cantidades los 8.848 metros (o 884.800 centímetros) de altura que tiene el Everest. o los 15 grados Celsius (o 59 grados Fahrenheit) de temperatura en Barcelona el día de Navidad de 1995 (sobre las escalas, cf. capítulo 4, $4 y también il?fi.a,secciones 3 y 5). Las magnitudes se caracterizan por ser propiedades o atributos que "se dan según un más y un menos", que se ejemplifican en diverso grado. Un objeto puede ser humano o no serlo, pero no puede ser más (o menos) humano que otro que también lo es; y lo mismo ocurre con ser varón, ser cangrejo, ser español, ser roble, etc. En cambio, de dos objetos másicos uno puede ser más másico que el otro, o una sustancia puede ser más densa que otra, o un suceso ser más duradero que otro, etc. Esto podría sugerir que las magnitudes son cualesquiera propiedades binarias o relacionales. Mientras que "humano" es una propiedad monaria, "ser más másico que" es una propiedad binaria o relación ("ser másicoi' O "tener masa" sería simplemente estar en el dominio de la relación). Aquí hay dos consideraciones a hacer, la primera sencilla y la segunda complicada. La primera es que
X I E D I C I ~EN N LA CIENCIA
175
simplemente no es cierto que tras toda relación se encuentre una magnitud. En la mayoría de los casos no es así: "ser padre de7',"ser múlti$o de", "ser del mismo país que" son relaciones que no expresan magnitudes. Las magnitudes son, o se expresan en, un tipo específico de relaciones binarias, las relaciones comparativas, relaciones del tipo "x es (tanto o) más ... que y" (transitivas, reflexivas y conexas, e.e, de orden débil ). Puesto que las magnitudes son propiedades que se dan según un más y un menos, las relaciones comparativas relacionan pares de objetos que poseen (en diversos grados) la misma magnitud estableciendo que uno la posee en mayor (o igual) grado que otro. Por tanto, toda propiedad relacional comparativa expresa prima facie una magnitud (esta afirmación se matizará más adelante, cf. especialmente las secciones 3 y 7). La segunda cuestión, que ahora sólo podemos mencionar, es mucho más compIicada. Tiene que ver con la "naturaleza última" de las magnitudes. Hemos dicho que, en principio, tras toda propiedad relacional comparativa se encuentra una magnitud. ¿Cómo hay que entender eso? Hay dos interpretaciones posibles. (1) Concepción relacional: la magnitud es ella misma la propiedad relacional cualitativa, no hay además una propiedad absoluta cuantitativa. (2) Concepción absoluta: la propiedad relacional es meramente un síntoma de 1s magnitud, acompaña a la magnitud, que es una entidad existente en el mundo además de la propiedad relacional. Según la primera concepción, "ser másico" no es más que pertenecer al campo de la relación comparativa "ser (tan o) más másico que"; y "tener una masa de 0,5 kg" no es más que la propiedad que tiene un objeto cuando dos objetos tan másicos como él son, conjuntamente, tan n~ásicoscomo cierto objeto específico que hay en un museo de París. Las "magnitudes" son sólo modos de representar cuantitativamente ciertas propiedades relacionales cualitativas; no existen "en el mundo" independientemente de nuestro sistema de representación. Lo único necesario para comprender el uso de las magnitudes y escalas en la medición es la existencia de tales relaciones comparativas cualitativas (que esto es así se mostrará en el curso de este capítulo); no hay por tanto por qué postular la existencia de otras entidades misteriosas, las propiedades cuantitativas mismas. Podenios, si queremos, denominar cuantitativas a esas propiedades relacionales comparativas que son de tipo tal que se dejan representar numéricamente (y, como veremos, no toda relación comparativa se deja, al menos no de modo interesante), pero lo esencial para esta concepción es, por decirlo así, que eso es todo lo que hay, no hay además propiedades cuantitativas. Según la segunda concepción, las magnitudes existen en sí mismas: existe una propiedad cuantitativa monaria que es "tener de masa 0,5 kg", y otra que es "tener de masa 3,4 kg", y así sucesivamente. Estas propiedades se ejemplifican igual que otras propiedades monatias; la pantalla de mi ordenador ejemplifica la segunda y no la primera, del mismo modo que la bandera rusa ejemplifica "ser roja" pero no "ser verde". Las propiedades relacionales comparativas son en realidad derivadas de éstas absolutas; un objeto será o no más másico que otro en virtud de las magnitudvs que ejemplifique cada uno. Esta concepción sigue el camino inverso de la anterior: aquélla "reduce" las cantidades a determinado tipo de cualidades, ésta considera primitivos los hechos cuantitativos absolutos e interpreta a partir de ellos los juicios comparativos. No vamos a discutir aquí
esta difícil cuestión, cuyo examen detallado excede los límites de esta obra; nos limitaremos a hacer en la sección final algunos comentarios muy generales tras completar el análisis de la medición. Antes de presentar los elementos en cuyo estudio nos vamos a centrar, concluiren~os esta introducción con una distinción clásica relativa a las ma+pitudes. Se trata de la distine i~íte~ísii~as. Esta distinción se ción entre mapitudes (atributos. propiedades) e~re~rsii.as presenta casi siempre referida a las escalas, pero ello es inadecuado pues, aunque, como veremos más adelante, guarda cierta relación con los diferentes tipos de escalas, ella tiene que ver primariamente con los efectos para las magnitudes de ciertas operaciones empíricas que se realizan entre los objetos que las exhiben. A veces, los objetos que exhiben cierta magnitud son susceptibles de agregarse, concatenarse o, más generalmente, combinarse de algún modo, y alguno de esos modos de combinación se puede considerar asociado a una magnitud específica. Por ejemplo, puedo combinar masas juntando dos cuerpos másicos; puedo combinar temperaturas mezclando dos líquidos; puedo combinar longitudes empalmando linealmente los extremos de dos varas, o lo puedo hacer ortogonalmente (en ángulo recto); puedo combinar duraciones haciendo que un suceso (tan duradero como el primero) suceda inmediatamente al otro; etc. El resultado de la combinación de dos objetos que tienen cierto grado de magnitud es un nuevo objeto que también tendrá la magnitud en cierto grado. ilzrensii~astiene que ver con el efecto La distinción entre magnitudes esre~tsivasy rnag~~intdes que la combinación produce en la magnitud. A menudo se caracterizan las magnitudes exte~uivascomo aquellas para las cuales existe un modo de combinación representable mediante la suma aritmética; por ejemplo, la agregación de masas (la masa del compuesto es la suma de masas de los componentes) o la combinación lineal de longitudes. A las magnitudes que carecen de un procedimiento de combinación representable mediante la suma se las por ejemplo, la temperatura, o la densidad (cuya mezcla da lugar a califica de i~zte~zsivas; cantidades intermedias, esto es, mayores que el menor de los componentes y menores que el mayor). Aunque a veces se afirma que las magnitudes extensivas dan lugar a escalas proporcionales y las intensivas sólo a escalas de intervalos, no siempre es así, puede haber atributos intensivos representables mediante escalas proporcionales (p.ej. las escalas derivadas para Ja densidad). La relación entre esta distinción y los tipos de escalas es más complicada y se aclarará más adelante. La distinción entre propiedades extensivas e intensivas está relacionada con otra más general y fundamental, relativa también a los efectos de la combinación en la magnitud. En general, tras cierto modo específico de combinación entre objetos que exhiben una magnitud en cierto grado, puede ocumr una de tres cosas: que el objeto resultante de la combinación tenga la magnitud en un grado (1) mayor que el de ambos componentes, (2) menor que el de ambos componentes, o (3) mayor que uno de los componentes y menor que el otro. Ejemplos de lo primero son la combinación de masas por agregación, las combinaciones tanto lineal como ortogonal de longitudes, la combinación de duraciones mediante consecución, o la combinación de resistencias en serie; un caso del segundo tipo es la combinación de resistencias en paralelo; ejemplos del tercer caso son la combinación de temperaturas y la de densidades mediante mezcla. Nótese que esta distinción es relativa a los atributos y a un ?nodode combi~zacióizespecijSco. Estas peculiaridades o comportamientos no las tienen las
magnitudes sin más, sino en relación a cierto tipo de combinación. Aunque en la mayoría de casos sólo hay un modo de combinación naturalmente asociado a cada magnitud, algunas pueden combinarse de diferentes modos (como la longitud o la resistencia), y puede ocurrir que una magnitud se comporte de diferente modo con diferentes combinaciones (como la resistencia, que se comporta de un modo con la combinación en serie y de otro con la combinación en paralelo). Si ocurre (1) diremos que una magnitud M es creciente respecto del modo de combinación C, si ocurre ( 2 ) diremos que es decrecienre y si ocurre (3) que es interna. En parte, la idea original de la distinción entre magnitudes extensivas e intensivas era capturar la diferencia intuitiva entre lo que aquí hemos llamado magnitudes crecientes e internas (con sus modos de combinación típicos). Pero en los términos en que se suele presentar, vistos más arriba, no lo hace exactamente. Las magnitudes extensivas (respecto de un modo de combinación) son sólo un tipo de magnitudes crecientes, las aditivas, aquellas en las que la combinación se puedz representar matemáticamente mediante la suma, habiendo magnitudes crecientes que no se pueden representar así. Pero entonces, tal como se habían definido, los casos intensivos no coinciden, contra lo que se pretendía, con los internos, pues hay magnitudes intensivas (e.e. no extensivas) crecientes (y también decrecientes). Dejaremos esta cuestión por el momento y volveremos sobre ella más adelante. Veamos ya cuáles van a ser las principales cuestiones a examinar en el estudio de la representación numérica de magnitudes. Son varios los aspectos relativos a la medición susceptibles de investigación. Los principales son los siguientes: a ) la función de la medición en la actividad científica; b) las condiciones empíricas que hacen posible la medición; c ) la naturaleza y tipos de los procedimientos de medición; d) el problema del error; e) problemas específicos de la medición en ámbitos científicos particulares, como la mecánica cuántica, y j) la ontología de las magnitudes. En este capítulo vamos a ocupamos principalmente de b) y c). Acerca de la función de la medición en la actividad científica nos limitaremos a algunas consideraciones muy generales en la próxima sección (el lector interesado puede encontrar un excelente tratamiento de esta cuestión en Kuhn, 1961, y una buena discusión de algunos puntos en Hackin;, 1983, capítulo 14). Sobre el problema del error haremos tan sólo una breve referencia al tratar de la función de la medición; en particular, no diremos nada de la llamada teoría dt!l error. Los problemas específicos de las diversas ciencias, y en especial el llamado "problema de la medición en la mecánica cuántica", quedan fuera del ámbito de una obra de filosofía general de la ciencia (para esta cuestión se puede consultar Cartwright, 1983, cap. 9). Sobre las diferentes concepciones ontológicas sobre las magnitudes, además de la breve presentación que hemos hecho, ya hemos anunciado que nos limitaremos a unas consideraciones finales muy generales (para una discusión detallada, cf. p.ej. Forge (ed.), 1987).
1.2. ESTRUC~URA DE LA MEDICIÓN: ?VIEDICIÓNDIRECTA E INDIRECTA; MEDIR Y METRIWR En el resto de este capítulo no vamos a ocupamos de lafilnción de la medición sino de su estructrrrn, entendiendo por ello sus elementos, condiciones, procedimientos y
178
JWND.~.IIE.WOS DE FILOSOF~.ADE LA CIENCIA
tipos. Vamos a presentar ahora las principales distinciones que articularán nuestro estudio de la estructura de la medición, principalmente las distinciones entre ntedición directa y iítedición i~tdirecray entre 17zedicióil y nterrizacióiz. Caracterizamos más arriba la medición como la asignación de números a las cosas de modo que aquéllos representen propiedades que éstas tienen, no cualquier propiedad sino aquellas que se pueden dar en los objetos en diverso grado, las magnitudes. Esta asignación, la medición, puede hacerse de modo directo o indirecto. En la medición indirecra asignamos valores a los objetos haciendo uso de valores previos, bien de la misma magnitud para otros objetos, bien de otras magnitudes para el mismo objeto, bien de ambas cosas a la vez. A partir de los valores-asignaciones previamente conocidos, se obtiene el valor buscado calculándolo a partir de aquéllos mediante ciertas leyes, o en general fórmulas, que correlacionan los valores conocidos con el desconocido. Puedo medir la longitud final de una barra que se ha calentado a partir de su longitud inicial, su temperatura original y final (junto con el coeficiente de dilatación para el material) y la ley de dilatación. O puedo medir la masa de un cuerpo celeste a partir de la masa de un cohete, de su trayectoria y de ciertas leyes mecánicas. Éste es el tipo de medición más común en Irt ciencia. Aunque la medición indirecta sea la más usual en la ciencia, es obvio que no puede ser la única. En la medición indirecta usamos valores previamente conocidos, esto es, medidos con anterioridad. Si la medición de estos valores se ha realizado también indirectamente, usa ciertas otras cantidades que se han debido medir con anterioridad, y así sucesivamente. Es claro, por tanto, que, en algún momento debemos poder asignar valores a los objetos sin usar otros previamente asignados, esto es, que no toda medición es indirecta. En algún lugar hentos de eazpezar. La medición directa es ese lugar donde comienza la asignación de cantidades a las cosas. En la medición directa asignamos, para una magnitud, valores a 10s objetos sin hacer uso de mediciones-asignaciones previas, sin hacer uso de datos cuantitativos anteriores, direcran~entea partir de datos puramente cualitativos (por ejemplo, que un brazo de una balanza desciende respecto del otro). Esto hay que entenderlo en un sentido amplio que dé cabida a la medición por comparación directa con un estándar; en sentido estricto, la única medición directa sería la que se realiza para el estándar, pues para asignar un valor a los otros objetos comparándolos directamente con él se usa el valor asignado al estándar. Aquí entenderemos la idea de medición directa en sentido amplio, pues es este sentido el que queremos contraponer a lo que hemos considerado medición indirecta. Son ejemplos de medición directa, mediante comparación con un estándar, la medición de la masa de un objeto de tamaño medio mediante una balanza de brazos, o la de la temperatura de una sustancia mediante un termómetro, o la de la longitud de un cuerpo mediante una cinta métrica. La diferencia entre medición directa e indirecta es relativa a los procedilnierttos de asiglzacióiz, no a las ~nagnirudes.Una misma masnitud se puede medir unas veces directamente y otras indirectamente. Pero, salvo que se trate de una magnitud que se introduce a partir de otras, al menos en algunos casos se ha de medir directamente. Así, aunque las mediciones indirectas son las más comunes en la ciencia, y prácticamente las únicas "cuando la cosa ya está en marcha", desde un punto de vista conceptual las mediciones
/ ,
directas son más fundamentales. Ello no quiere decir que las mediciones indirectas no sean importantes, o que sean prescindibles. Las mediciones indirectas son igual de esenciales para la ciencia pues, aunque al menos en algunos casos la medición ha de ser directa, no es posible en general hacerlo en todos los casos, para todo el rango de objetos que exhiben la magnitud. Mido directamente la masa poniendo objetos en una balanza, pero no todo objeto con esta propiedad se puede medir mediante este procedimiento, o mediante otro también directo; el único modo de medir la masa de algunos objetos (p.ej. estelares) es utilizar procedimientos indirectos. En estos casos, la medición directa entra en la ??zagnituda través de unos pocos objetos y se expande al resto mediante cadenas de medición indirecta a partir de aquéllos. En la medición, tanto directa como indirecta, es posible realizar la asignación de un valor a un objeto gracias a que ciertos hechos ocurren en la naturaleza, esto es, gracias a que se dan determinadas condiciones empíricas. Estos hechos empíricos constituyen las condiciones de posibilidad de la medición, las condiciones de mensurabilidad. La medición, en sentido amplio, incluye o presupone la determinación de dichas condiciones de mensurabilidad. Por tanto, en la medición se deben distinguir, de un lado, la asignación efectiva de valores a los objetos, y de otro, las condiciones que hacen posible tal asignación, condiciones que a la vez determinan el uso que podemos hacer de ella. Las asignaciones se realizan siguiendo ciertos procedimientos. Las condiciones que las hacen posibles y determinan su uso, se estudian. La realización de las asignaciones y el estudio de sus condiciones de posibilidad son ambas tareas o actividades que corresponden a la ciencia, pero son actividades de naturaleza diferente. La primera, para la que usaremos 'medir' (con su derivado 'medición') en sentido estricto, es básicamente una actividad práctica, cuyo resultado es la asignación de una entidad a otra mediante ciertos procedimientos. La segunda, para la que usaremos 'metrizar' (con su derivado 'metrización'), es una actividad eminentemente reórica, cuyo resultado es la afirmación de que ciertas cosas son de cierto modo. Puesto que en la metrización se investigan las condiciones empíricas que hacen posible la medición, y la medición es parte de la práctica científica, a veces tiende a presentarse la metrización como una tarea, no propiamente científica, sino rnetacierztl;fica.Pero aunque ciertamente (a diferencia de otras investigaciones empíricas) tiene algo de metacientífico, es propiamente un estudio de ciertos hechos que ocurren en la naturaleza, y por lo tanto una investigación empírica. Que tales hechos sean las condiciones para la práctica de la medición no elimina. el carácter empírico de su estudio. Esta distinción entre medición y metrización, presentada de forma abstracta en estos comentanos preliminares, deberá quedar clara en el transcurso de la exposición de las secciones 3 a 6. El análisis metacientífico de la medición, por tanto, debe tener dos partes: a ) el análisis de los procedimientos efectivos de medición o asignación y 6 ) el estudio metateórico de la investigación sobre las condiciones empíricas que hacen posible dichos procedimientos. Realizaremos ambas tareas en las secciones 3 a 6, distinguiendo en cada ámbito entre la medición directa e indirecta. A la investigación sobre las condiciones de posibilidad de la medición directa la denominaremos 'metrización fundamental', y se estudiará en la sección 3, y a la investigación sobre las condiciones de posibilidad de la medición indirecta, 'metrización derivada', y se tratará en la sección 4. De los procedimientos de
medición directa nos ocuparemos en la sección 5 y de los procedimientos de medición indirecta en la 6. Precedemos el estudio de la metrización al de los procedimientos de medición pues, como se ha indicado, éstos dependen de las condiciones que in~~estiga aquélla, por lo que en el análisis de los procediniientos haremos mención de tales condiciones. Como se trata de una presentación introductoria, en el estudio de la metrización fundamental haremos más énfasis en las condiciones mismas que en la naturaleza de su estudio. Para concluir estos comentarios introductorios, hagamos una breve aclaración terminológica referente al uso que hacemos del término 'metrizar' (y de su derivado 'metrización'). Cuando se usa este término en la literatura (y se usa muy escasamente) se suele querer significar "la introducción de un nuevo concepto cuantitativo o concepto métrico" (cf. Stegmüller, 1970, esp. cap. 1; otros lugares en que se usa son Hempel, 1952, $12; Berka, 1983, esp. cap. 6, $3, y Mosterín, 1978, p. 36)' entendiendo por ello, en el caso de la metrización fundamental, la especificación de un criterio que permita representar numéricamente un orden cualitativo. Esta tarea se considera en general que tiene dos partes. La primera, investigar las condiciones que debe satisfacer un sistema cualitativo cualquiera para que sea posible la representación, probar que ellas son efectivamente suficientes y estudiar qué uso es legítimo hacer de una tal representación. La segunda, determinar el procedimiento de comparación cualitativo y el estándar con el que arbitrariamente se comienza a efectuar la asignación. Estas tareas son esencialmente diferentes. El uso que nosotros hacemos del término 'metrizar (fundamentalmente)' corresponde sólo a la primera, pues la segunda es parte de lo que hemos llamado 'procedimientos de medición'. Es esencial distinguir ambas cosas. Una vez lo hagamos, qué palabras usemos para cada una es lo de menos. Aquí usaremos las expresiones mencionadas en el sentido indicado. Como anunciamos, antes de emprender el estudio detenido de los diversos tipos de medición y metrización, haremos unos breves comentarios sobre la función de la medición en la ciencia.
2. Función de la medición Sin duda, el lugar donde Ia medición tiene una mayor presencia no es la investigación científica teórica sino su aplicación práctica, la técnica. La medición, y los instrumentos para realizarla, se hallan omnipresentes en cualquier proceso de aplicación tecnológica mínimamente sofisticado. Desde los antiguos agrimensores mesopotámicos que parcelaban la tierra hasta las más modernas empresas de telecomunicaciones que ponen satélites en órbita, la historia de la humanidad está indisolublemente ligada a un sinnúmero de prácticas y técnicas que dependen de una forma u otra de la medición, prácticas o técnicas en relación a las cuales se han introducido la mayoría de los instrumentos de medición: balanza, reloj, sextante, astrolabio, bníjula, termómetro, barómetro, etc. Sin embargo, ahora nos interesa la función de la medición no tanto en la aplicación tecnológica cuanto en la investigación teórica, en el establecimiento y desarrollo de constructos teóricos. Y aunque en menor medida que en la técnica, la medición desempeña también
una función fundamental en el trabajo teórico, especialmente, aunque no exclusivamente, desde In(s) revolución(es) científica(s) de los siglos xvrr y xvrrr. La función de la medición en el desarrollo teórico tiene dos vertientes principales: su papel en la búsqueda y formulación de nuevas leyes y teorías. y su uso para contrastar otras ya existentes. La forma en que la medición opera en cada uno de estos ámbitos no es en modo alguno sencillo ni uniforme y depende casi siempre del particular estadio en que se encuentre la teoría o disciplina en cuestión. En estas consideraciones introductorias nos vamos a limitar a mencionar tan sólo los fenómenos más destacados. La recolección de datos cuantitativos es una de las tareas características de lo que Kuhn llama cierlcia nonnal (sobre esta noción, cf. capítulo, 9, $2), del trabajo cotidiano vinculado al desarrollo de una teoría. Parte del progreso científico en estos períodos consiste justamente en aumentar el caudal y precisión de los datos cuantitativos existentts. Ésa fue, por ejemplo, la principal contribución de los astrónomos geocéntricos árabes y tardomedievales (por ejemplo, las Tablas de Toledo del siglo XI) y también de personajes como Regiomontano y, sobre todo, Tycho Brahe, quien ocupa un lugar en la historia de la astronomía más por la increíble precisión de las mediciones astronómicas que realizó a simple vista que por su sistema geocéntrico mixto. La función que se da a esos datos es sin embargo muy variable. Casi siempre, su función en los períodos de ciencia normal consiste simplemente en ir aumentando la precisión en la aplicación de la teoría a la experiencia. Otras veces parecen desempeñar un papel más importante, sirviendo de guías para el descubrimiento. Aunque nunca propician directamente la generación de grandes constructos teóricos, sí parece que a veces desempeñan una función de p í a bastante inmediata en la formulación de leyes específicas. Tal es el caso, por ejemplo, de las dos primeras leyes de Kepler. La precisión de los datos obtenidos por Brahe acabó por convencer a Kepler de que los desajustes cuantitati~.os de1 sistema heliocéntrico copemicano no eran debidos a errores de observación, y tras arduos esfuerzos por mantener el dogma pitagórico de las órbitas circulares sostenido por todos los astrónomos durante dos mil años, acabó por abandonar y postular órbitas elípticas. También parece que hubo una dependencia muy directa de los datos en la formulación por Galileo de la ley de caída de los cuerpos, en el establecimiento por Boyle de la ley que relaciona presión y volumen en los gases, o en el descubrimiento de Hooke de la ley de expansión elástica. Sin embargo, no debe pensarse por ello que hay, siquiera en al_ounos casos, una especie de "camino directo de las mediciones a 12 ley cuantitativa". Un resultado formal elemental establece que cualquier secuencia finita de números es igualmente subsumible bajo infinitas ecuaciones numéricas diferentes, por lo que no hay algo así como una única ecuación implícitamente contenida en los datos numericos (sobre esto volveremos en el capítulo 12 dedicado al problema de la inducción). El viejo mito baconiano de un método que conduzca de los datos a la ley es eso. un mito que no se corresponde con la realidad. En el proceso de formulación de leyes intervienen esencialmente consideraciones de simplicidad, belleza, coherencia con otras hipótesis y, por supuesto, el genio creativo del científico. Se trata simplemente de que en ocasiones los datos cuantitativos parecen representar una guía particularmente importante en el proceso creador; el modo preciso en que desempeñan esta función queda
182
FCSD;55fEI\TOS DE FILOSOF~ADE L4 CIESCIX
fuera del ámbito de estudio de la filosofía de la ciencia. compete niás bien a otras disciplinas, principalmente la psicología de la ciencia. Otra función destacada de la medición es su papel como piedra de toque en los procesos de contrastación de leyes o teorías ya disponibles. En el capítulo 3 vimos que una de las virtudes de una buena contrastación era el p i d o de precisión, tanto de la predicción como de los datos. Que la predicción sea cuantitativa y que los datos no se recojan por simple observación sino por medición, es en principio una garantía de rigor de la contrastación, tanto más elevada cuanto más precisos cuantitativamente sean la predicción y los datos medidos. De todas formas, también aquí hay muchas salvedades que hacer. No se trata simplemente de que la deteminación de los datos mediante medición tenga un papel de criba inmediata en caso de desajustes cuantitativos con la predicción. Ya vimos en ese capítulo que la cosa es compleja, que casi siempre se dispone de salidas apelando a los supuestos auxiliares o incluso a las condiciones iniciales, las cuales en los casos cuantitativos también se establecen por niedición y son susceptibles por tanto de mayor o menor precisión en su determinación. Cuando la contrastación involucra medición, cobran especial importancia tres tipos de supuestos auxiliares relacionados: los que tienen que ver con la idealización de las leyes, los relativos a la fiabilidad de los instrumentos de medición y los que establecen más o menos implícitamente el margen de error admisible. Los datos cuantitativos nunca encajan perfectamente con la predicción y no siempre se considera eso un problenia. Sólo se considera así en caso de que el desajuste supere ciertos límites más o menos difusos de concordancia, el grado de error ad111isible.El margen de error que se considera admisible depende básicamente de la idealización de las condiciones empíricas reales contenida en las leyes involucradas en la contrastación y del grado de fiabilidad o sensibilidad de los instrumentos de medición empleados. La aplicación de las leyes siempre idealiza ciertas "condiciories de entorno", y en algunos casos esta idealización puede tener consecuencias cuantitati~amenteimportantes. Un caso típico es el del péndulo. donde se desprecia el peso del hilo de suspensión y la fricción del aire, que conjuntamente pueden tener efectos cuantitativos considerables. Otro caso es el de la aplicación de las leyes de Neiston a las predicciones astronómicas. Según dichas leyes, todos los cuerpos celestes se atraen entre sí. Sin contar ahora con la presencia de asteroides, polvo espacial, estrellas lejanas, etc., y suponiendo que en el sistema solar sólo están presentes el sol, los satélites y sus lunas, para el cálculo de una órbita deberían tomarse en cuenta los efectos simultáneos de dichos cuerpos. Pero, simplemente, ése es un problema matemático que no se ha resuelto (ni siquiera de modo totalmente satisfactorio para el caso de tres cuerpos a la vez). Lo que se hace es calcular la órbita de las lunas como si estuvieran atraídas sólo por sus planetas, o la de cada planeta como si estuviera atraído sólo por el Sol. Eso supone un margen de error que se suele considerar despreciable pero que a veces puede ser considerable, como vimos en el caso de la órbita anómala de Urano y el descubrimiento de Neptuno. A veces, establecer el límite de error es un trabajo teórico muy complejo. Durante mucho tiempo se pensó que los desajustes de las mediciones de la órbita de Mercurio estaban dentro de los límites de concordancia razonable; fue preciso el trabajo de los mejores matemáticos de los siglos xviri y XIX para mostrar que no era así; el movimiento anómalo de Mercurio no podía ser explicado en el
!
1 1
sistema newtoniano ni siquiera teniendo en cuenta el grado de error admisible; el fenómeno sería posteriormente explicado por la relatividad general de Einstein. Otra fuente típica de error cuantitativo tiene su origen en los límites de sensibilidad de los instrumentos y métodos de medición. Todos hemos experimentado que los velocímetros de nuestros vehículos son insensibles a pequeiias variaciones de velocidad, las balanzas no discriminan por debajo de ciertos umbrales, los galvanómetros no manifiestan pequeñas o muy rápidas variaciones de corriente, etc. La historia de la astronomía contiene ejemplos sencillos de los efectos de esta otra fuente de error. Durante la Antigüedad y la Edad Media se consideró que muchos desajustes del sistema tolemaico con los datos se debían a la imperfección de los sistemas de medición. A finales de la Edad Media y en el Renacimiento se fueron perfeccionando los métodos e instrumentos de medición a simple vista, mejora que culminó en la figura de Tycho Brahe, quien perfeccionó los antiguos instrumentos y diseñó otros nuevos. Después del trabajo experimental de Tycho, Kepler consideró que los desajustes cuantitativos del nuevo sistema heliocéntrico de órbitas circulares no podían ya ser explicados apelando a la escasa fiabilidad de los procedimientos y optó por proponer órbitas elípticas. Éste no es más que un ejemplo sencillo de un fenómeno común: el perfeccionamiento de los instrumentos de medición reduce el grado de error considerado admisible y pasan a ser problemáticos desajustes cuantitativos que hasta entonces se consideraban aceptables. No se piense por ello que la mejora de las técnicas de medición tiene siempre como consecuencia la puesta en cuestión de ciertas hipótesis. Con frecuencia ocurre lo contrario, simplemente porque la mejora observacional reduce el error cuantitativo por debajo de los nuevos límites admisibles. Durante el siglo xviii se observaba un persistente desajuste de aproximadamente el 20 % entre los valores predichos y los realmente medidos de la velocidad del sonido en el aire. A principios del siglo xrx, Laplace realizó una medición indirecta a partir de las propiedades térmicas de los gases, medidas mediante un procedimiento experimental que superaba las capacidades de otros métodos disponibles hasta entonces. El resultado de esa medición indirecta perfeccionada redujo el desajuste a menos del 3 %. Hemos dicho que el desajuste entre los valores predichos y los medidos se considera problemático sólo si supera los límites (más o menos difusos) de lo que se considera error admisible debido a ciertas idealizaciones o a las limitaciones de los procedimientos de medición. En ese caso tenemos lo que Kuhn ha llamado anomalías empíricas. Conviene advertir que las anomalías no se consideran siempre fatales, más bien ello ocurre pocas veces. A menudo se espera a que el progreso teórico o empírico las resuelva, o incluso algunas terminan simplemente por ignorarse aunque no se resuelvan si la teoría está bien asentada. Es más, como indica Kuhn, en ocasiones cuestionan únicamente al científico que ha realizado las mediciones, no a la teoría (recuérdese el caso de Millikan y las mediciones de Ehrenhaft presuntamente anómalas). Las anomalías tienen una función importante en los episodios de cambio teórico, donde un número elevado de desajustes, o la persistencia de algunos considerados especialmente importantes, puede propiciar la propuesta de hipótesis alternativas. En estos casos es particularmente interesante el hecho de que desde las nuevas hipótesis sea posible realizar nuevas predicciones y diseños experimentales, incluidos nuevos o mejores instrumentos de medición, que arrojan nueva
evidencia contraria a la antigua hipótesis (sobre estas cuestiones vol~eremosen los capítulos sobre la inducción y sobre el cambio teórico). Hasta aquí la revisión, muy supeficiai, de la función de la medición como guía de la in\.estigación y como piedra de toque en las contrastaciones. Antes de concluir, conviene insistir en que éstas son las funciones de la medición metodológicamente más interesantes, pero ni mucho menos las más usuales. Como dijimos, la finalidad más común, y por lo general anónima, de la medición en la práctica científica consiste simplemente en ir aumentando la precisión de la aplicación de la teoría a la experiencia dentro siempre de los límites de error admisible. Aunque en cieno sentido ello supone un refueno para la teoría, no se pueden considerar, en sentido estricto, ni intentos de descubrimiento ni de confirmación. No se trata de pretender poner la teoría en juego, de contrastarla con la experiencia, sino de una tarea mucho menos ambiciosa; se trata simplemente de ir mejorando su (incuestionada) aplicabiljdad empírica (sobre esto, cf. especialmente Kuhn, 1961, $2).
3. hletrización fundamental (*) Supongamos que tenemos un diamante frente a nosotros. Es pequeño, brillante, liviano, duro, bonito y caro. Si nos piden que precisemos un poco más, podremos decir que es muy pequeño, bastante liviano, muy, muy duro y extremadamente caro. Podemos seguir precisando nuestros adjetivos pero, por más que los refinemos, parece que siempre podremos hacerlo un poco más. Sin embargo, si respondiésemos dando las medidas del diamante para las propiedades que exhibe, no se nos exigiría ya mayor precisión. Pero ello no es posible para todas sus propiedades: puedo decir que su volumen es s, su masa y, incluso que su dureza es z, pero no que su belleza es v. ¿Por qué? Supongamos que tenemos también un trozo de yeso ante nosotros. Es pequeño, mate, liviano, blando, feo y barato. Ambos, el yeso y el diamante, son pequeños y livianos, aunque el yeso no lo es tanto. También ahora podemos precisar más hasta dar (cuando sea posible) sus medidas, y quizá nos interese además compararlas con las del diamante. Podemos decir entonces que la masa del yeso es cien veces la del diamante mientras que su dureza es sólo la décima parte. Pero mientras lo primero significa algo, lo segundo no. O, mejor dicho, ambas cosas significan algo, pero sólo lo significado por la primera depende de los dos objetos exclusivamente. Ambas expresan un hecho numérico (el cociente de las masas es 100, el de las durezas 0,l) pero sólo el expresado por la primera representa un hecho relativo exclusivamente a los objetos. ¿Por qué? 3.1. METRIZACI~N FUh'D.4MEhTAL
Y MAGNITUDES
La empresa teórica que hemos denominado nterrizacióii. fuf~nda~itenral responde a los interrogantes anteriores investigando los hechos o condiciones que hacen posible la medición de una propiedad y el modo en que es posible usar la medida obtenida para hacer afirmaciones sobre los objetos. Investigando tales condiciones, la metrización fun-
damental determina a su vez el uso que se puede hacer de las asignaciones para dar información de los objetos relativa exclusi~amentea la propiedad en cuestión, esto es, el uso que se puede dar a las escalas para expresar hechos matemáticos que dependan sólo de la magnitud en cuestión. Como vimos en el capítulo 4 (Sil), no tiene un sentido absoluto decir que Ia masa de un objeto es 6, se ha de especificar la escala que usamos (kilogramos, gramos, toneladas, etc.) pues ese valor matemático cambia de una escala a otra. Lo mismo ocurre con la temperatura termométrica. Pero en relación a la masa sí tiene sentido absoluto decir que el cociente de las masas de dos objetos es 2 (e.e. que la masa de un objeto es doble que la de otro), pues ese hecho se preserva en cualquier escala que usemos para medir la masa; si las medidas originales eran en kilogramos (p.ej. 6 y 3 respectivamente), el cociente se preserva aunque las transformemos a gramos (6.000 y 3.000) o a toneladas (0,006 y 0,003) o a cualquier otra escala. El cociente de masas es absoluto, independiente de la escala. Pero eso no es así con cualquier magnitud. Con la temperatura (termométrica) no pasa eso. No tiene sentido decir que la temperatura a medianoche de hoy es doble que la de ayer, pues dada la rnisrnn temperatura esa afirmación puede ser verdadera en una escala y falsa en otra; si las medidas originales eran en prados Celsius (p.ej. 10 y 5 respectivamente), el cociente no se preserva si las transformamos a grados Fahrenheit (50 y 41). El cociente de temperaturas no es absoluto sino que depende de la escala usada. Sin embargo, para la temperatura tiene sentido absoluto otra relación más débil, a saber, el cociente entre intervalos de temperatura. Si el cociente entre la diferencia de temperaturas al mediodía y a medianoche de hoy y la diferencia de temperaturas al mediodía y a medianoche de ayer es 112, medidas en grados Celjius (p.ej. 10 y 5, y 20 y 10 respectivamente), dicho cociente de intervalos (5110 = 112) se mantiene aunque las transformemos a grados Fahrenheit (50 y 41, y 68 y 50; el cociente de intervalos es 9/18 = 112) o a cualquier otra escala.' Como adelantamos en el capítulo 1,las escalas de masa son escalas proporcionales, los cambios de escala preservan los cocientes o proporciones de cantidades; las escalas de temperatura (termométrica) son escalas de intervalos o diferencias, los cambios de escala preservan los cocientes de intervaloj o diferencias de cantidades. Y todavía hay otros tipos de escalas. Puesto que las escalas no son más que las asignaciones numéricas que representan las magnitudes, esta diferencia en las escalas debe derivarse de las condiciones que hacen posible la representación numérica; si las condiciones fuesen las mismas, el tipo de asignación también sería el mismo (el otro sentido no es válido, puede ocurrir que diferentes tipos de condiciones posibiliten un mismo tipo de escala). Así, la metrización fundamental investiga los diferentes tipos de condiciones que hacen posible la representación ciiantitativa de magnitudes (sin usar otras mediciones previas) 5: haciendo eso, da cuenta de los diferentes tipos de asignaciones o escalas. Antes de ver algunos de los diferentes tipos de condiciones y las escalas a que dan lugar, es conveniente hacer algunas consideraciones generales. 1. Éste es el motivo dc que en las leyes fíjicris en que interviene la temperatura ternométrica, p.ej. las de dilatación de metales, no aparezca nunca la magnitud absoluta sino sus intrrvalos. En o t r x leyes, como la de los grises y, en general, en la Termodinimica, 3pxece la magnitud absoluta, pero no se tran entonces de la temperatura termométrica sino d e 13 trr>iprizrtlrrurrhsolr<tcr,para la que no hay metrización fundamental.
186
F L ; S D . A S I E \ ~ SDE FILOSOFU DE LA CIENCIA
En pimer lugar, hablar de metrizar fundamentalmente (en el resto de este pará~rafo omitiremos, dándolos por sobreentendidos, 'fundamental' y sus derivados) una propie-
dad específica es un tanto extraño. Las propiedades se miden y al metrizar investigamos cómo ello es Ahora bien, las condiciones que se investigan en la metrización no se refieren esencialmente a ninguna propiedad concreta, son condiciones generales a satisfacer por una propiedad cualquiera para ser susceptible de medición. Si en algún sentido se puede hablar de metnzar rina propiedad concreta, por ello habría que entender, en todo caso, la investigación (empírica) sobre si tal propiedad satisface o no determinado grupo de condiciones. En segundo lugar, si la metrización consistiese simplemente en el análisis de las condiciones que hacen posible la asignación de números a objetos que exhiben una propiedad, no habn'a obviamente nada que analizar, pues bajo cualesquiera condiciones es posible asignar números a cualquier dominio de objetos. Es esencial añadir que se trata de condiciones que hacen posible una asignación numérica que exprese ~natelnáricalítentelos hccllos qrte se dan elttre los objetos por eje1ílplífica1-la propiedad. No toda asignación se considera una medición y la metrización debe hacer precisa esa restricción adicional. Los objetos conforman ciertos hechos, algunos de los cuales se deberá11a la propiedad que se desea medir. La asignación numérica debe represelztai-esos hechos, expresarlos numéricamente. Y además lo debe hacer de modo "interesante", esto es, sistelnático. No se trata meramente de asociar un número a cada objeto y después "reescribir numéricamente" los hechos conocidos entre objetos. Eso siempre se puede hacer con tal de que haya tantos números como objetos, pero no es medición genuina sino mera "renominalización"; por eso las "escalas" meramente ordinales, que en el fondo no hacen más que esto, no son realmente escalas de medición genuinas (cf. cap. 4, $4). En tercer lugar, y relacionado con lo anterior, los diferentes grupos de condiciones de mensurabilidad son los que deteminan qué propiedades son nmgnirudes. Más amba caracterizamos las magnitudes como aquellas propiedades que se dan en los objetos en diverso grado, según un más y un menos, y dijimos que las magnitudes no eran expresadas por cualesquiera relaciones, sino sólo por relaciones comparativas. Ahora conviene expiicitar un matiz que entonces dejamos implícito al afirmar que "toda propiedad relaciona1 comparativa expresa pri~ízafacie una magnitud". Sólo priina facie, pues, aunque toda magnitud es (o es expresada por) una relación cualitativa comparativa, quizá no toda relación comparativa sea (o exprese) una magnitud. Las magnitudes serán las propiedades relacionales comparativas que sarisfaceiz (algún grupo u otro de) coltdiciolles de l7teirsurabilidad. Qué relaciones comparativas constituyen magnitudes se descubre mediante la metrización, que es la que establece los diversos grupos de condiciones de mensurabilidad. Por último, hemos dicho que la representación numérica no lo es de todos los hechos conformados por los objetos, sino de aquellos hechos que involucran la propiedad a medir, de los estados de cosas que se dan entre los objetos por ejemplificar la magnitud. Dada la naturaleza relaciona1 y comparativa de las magnitudes, los hechos a representar que se dan entre los objetos por ejen~plificarla magnitud serán heclzos con~l~ara~ii>os. Por otro lado, estos hechos comparativos a representar deben ser pilranlente cualitativos, no pueden contener ninguna referencia implícita ni explícita a cantidades ya medidas pues la
M E D I C I ~ NEN LA CIENCIA
187
metrización fundamentai investiga las condiciones de posibilidad de la medición directa y ésta asigna cantidades a los objetos sin usar mediciones previas.
Hasta aquí la caracterización introductoria de esa actividad teórica que hemos Ilamado nietrización fiindamental. El resultado de esta actividad es, en un sentido amplio del término, una teoría, la teoría de la metrización Cfrrndamental),en adelante 'TM'. TM es, aunque peculiar, una teoría empírica en el sentido de que las condiciones de mensurabilidad que estudia son condiciones empíricas (algunas de ellas, como tanbién ocurre en las teorías usuales, con ciertas idealizaciones); esto es, son condiciones cualitativas que satisfacen sistemas cualitativos físicamente reniizados, como balanzas, varas, líquidos, etc. TM, por tanto, hace aserciones empíricas, dice o prerertde que tales y cuales sistemas concretos físicamente realizados satisfacen tales y cuales condiciones. Sin embargo es cierto que TM es peculiar pues, a diferencia de las teorías empíricas usuales, no parece ser explicativa sino meramente descriptiva. No podemos ver aquí en detalle esta peculiaridad, pero ella no elimina su carácter empírico en el sentido rníniino indicado. Este carácter queda patente en su desarrollo histórico, donde las modificaciones del formalismo, la determinación de condiciones alternativas de mensurabilidad, han respondido siempre al deseo de capturar situaciones empíricas nuevas que no satisfacían las condiciones estudiadas hasta entonces (cf. Díez, 1997a y 1997b para una historia actualizada de TM). Puesto que éste es un estudio introductono, y el contenido de Thl no es por lo común conocido. vamos a presentar los rasgos generales de TM haciendo énfasis más en el contenido mismo que en su estructura u otras peculiaridades metateóricas. Esta estructura se puede especificar, de acuerdo con el enfoque semántica que veremos en el capítulo 10, en términos de los modelos que la teoría define o caracteriza. Como aqui no nos interesa sino dar un esquema del contenido de TM, nos limitaremos a presentar informalmente el tipo de sistemas o estructuras de que se ocupa, el tipo de condiciones o leyes que definen tales estructuras y un tipo especialmente importante de consecuencias o teoremas que formula. Completaremos esta aproximación seneral abstracta con algunos ejemplos de modelos específicos. Acabamos de indicar que las condiciones de mensurabilidad que investiga TM, en tanto que teoría sobre las condiciones de representación numérica de magnitudes, son relativas a hechos comparativos y puramente cualitativos. Esto determina ya parcialmente la naturaleza de los sistemas de que se ocupa. Como los sistemas de que se ocupa expresan magnitudes, tales sistemas han de contener neccsnriarnerzte una relación cualitativa de comparación que exprese el orden o posición en que se encuentran los objetos que exhiben la magnitud de que se trate en cada caso. Estas relaciones comparativas cualitativas son generadas o determinadas por diversos procedimientos empíricos, por ejemplo la comparación mediante balanzas para la masa, o la comparación de varas rígidas para la longitud, etc. Así, 10s sistemas empíricos que investiga ThI han ser sistemas comparativos, han de estar formados, al menos, por un dominio A de objetos y una re1ació)t empírica cl~nlitarivnde comparación entre los elementos de A.
sauo!xpoo3 sc!.rcsassu uos 'sci!iei!iucns aiusrucu!nua8 'saluesaraiu! s ~ u o ! ~ c ~ r i a s a sour ~dal -a~atib!S .so,i!iereduros soida3rroa sa[dru!s so[ ap oi3adsa~[ea1 a ~ e upSu!u ~ e iiauo!~rodo~d ou (cza~npe[ crrrd s q o ap ~ e[ 0 ~ ~ 1 0 saleu!pJo 3) se[vDsa se[ !eu!nua5 cA!ici!iuen2 c[e3sa cun aslclap!suos apand seuade anb [r?u!p~oaiuaurelaur e ~ a x eun a sa '[!]y osod Á [!q?p ajuaur -cperuallxa sa u p e i u a s a ~ d a lvisa oJad 'soiafqo so[ ap up!:,m![eu!uroua~ elaur ap ope3y![e3 souiaq saiuc anb o[ sa !u?!3eiuasalda~ [el eun aa!xa a~dura!s(a[qe~aurnucas p. anb .@d) se)3!~1sari!aiuarue3u!dura Á sai!q?p Ánu sa[cuuoj sauop!puos obq ' s ~ u rcpcn sow!S!xa ou !S 'o:,od un ue3![druos as SESO3 se[ opucn3 sa eloye olad '(,Q,fz (SUSSÁS rCs,ta:a~durnz~ anb JH ua p. ap j uqpunj eun 'sa oisa 'S uaplo la eIuasard anb [el o!u!urop [ap soiafqo so[ c saleal solarunu ap u?!seuS!se eun sa e3y?iunu up!seiuasa~dal eun .eD!qrunu u?!~ciuas -aldar cun ap e!~uais!xa e [ uei![!q!sod anb 1C seurais!s soisa ua:,ejspes anb sel\!iei![en3 sm!~!dura sa,Ca[-sauo!3!prio~so[ reS!isaiiu! saDuolua sa k y ap ~ eamre] e? -ug!xxeduro3 ap o,\ -!iei![en3 03!qdnra oiua!w!pa3o~d upS1e ~ o epelaua0 d S [!q?p uaplo ap u?!xla~ cun 1C soialqo ap y onr!iuop un souaui le sand uaua!luos MJ, edn:,o as anb ap se~ni3n11sas q .o!u!rrrop Iap soia[qo so[ aliua [!q?p uaplo un e~aua8anb e~!iei![en3 eyjdura u?!:,eledruo3 ap oiua!ui!pa2o~d ope!do.~de [a aiuri!paw aiuaure3o~~uc ejrapasold as pni!u9e~u eun ap ci3ar!p u p p a r u clCcr[ anb ua sosc3 so[ sopo] u 3 .pni!Duo[ el epas epcrsn[o.iu! pni!uScur c[ osc3 alsa ua :.i ap orrraliua la 'eladns o 'u02 ap!su!os x ap ouralixa Ia 'aseq e1 ~ o d X a s l!p!:,u!o:, o p u a i ~ qssICs :Csw :o110 aisa alric!paur 'sep!S!r sclc,i ap o!u!ruop un sa v !S 'O - ~ e i rEIi (sa[vu0!3e[a~sapepa!do~duos o p s sapnl!uSew se[ anb sourapuajap !S 'sa anb o) esa~dxaanb [euo!De[al pepa!dold c[ c ope!2osc [a ejlas u?!2e~cdruo3ap oiria!ur!pa3old aisa !,C ap oic[d [ap obqap ~ o od clni[c curs!iir e[ e a3aueru~ad.Y ap oield [3 'sa[cns'! sozc~q ap cziir?leq cun ap soic[d sol ap oun ua oun epe3 soisand ssAs t C ~ :olua!ru!pa3o~d s aiua!nS!s [a alue!paur -13rraiqo apand as S 'o!paur oFe1ut.i ap sohan3 ap op~!uropopcu!urraiap un sa v !S 'o[duiab lod .a1qcz![ea1 aiuarue3!sg ai!iei!Ien3 up!~e~ediuo:,ap olua!ur!pa:,old rr?Sle ~ I U C ! P ~ L Lcu!rrrlaiap I as anb ~~IJ!uS!Seli!ici![en:, e~!~jdura u?!ae[a~eun eas S a n o '(2.p 'jap 'p .de3 y ) p. ua sexauo3 aiuauieiun[uo3 Á saiuaIín[:,xa aiuaur -eninru uos Á eli!i!sucll sa d 'e!~ua[e,\!nba ap uq!sclaJ eun sa )I :sepc!doldc sapcpa!dold se[ uaua!] ( 6 , ~ ~"'0 UCI 3 as,,) y , Á (,,anb seur aluaur~i3!.1isalas,,) d sepei\!rap sauo!sc[al se[ 'Y alqoq!q?p uaplo irn sa S oprien3 'jsv .p. sa odruea oÁn3 'exauo2 ñ ai!i!sucli 'c.i!xau3.1 'sa oisa 'l!q?p 113~-10ap u g ! ~ [ a reun sa anb 'aiuarue3!u:,?i 'esy!uS!s v ap soiakqo SO[ aJiua u?!~e~cdiuo3 ap u?!Dc[al cun cas S a n b ..q.C Á ,CS.Y ssLs L(yxt q . C ou ñ IC~.rssSs .i&-:e!~1ap!~u!o3ap Á (e13!ssa) e p u a p a ~ a ~ap d sauo!3c[a.1 se[ aiuaurelc!pauru! lauaiqo uapand as S ap ~!i.rede sand '~o!Jaiuc o[ e aiua[c,i!nba sa oisg '('2ia ',C anb aiua![e3 s ~ r u o oluei sa r 6.ianb oz~!sgiuSFLU O OIUCI sa x '-@.d) ,',C anb .-.-SFLU o oiuei sa .Y,, ~eq!uS!s e e,\ 'Xs.t-,'!sv .,S, alue!paur souraniouap anb e[ e 'up!un e q x p ap l!ued aiua!ua,\uo~scur sa ' ( s a l ~ u o ~ 3 ~A)~soli!l!sodxa ou soisaja e u?!qurei 1C 'oixaiuo:, aiuasald [a u2 -yn d upun e1 u03 o,i!ie~cduio2 oidaz11.103[ap ug!suaisa e1 sorueqpyyuap! a 'y epuappu!o3 ap ello A d c!suapariald ap u p c ~ a Eun l aiue!paru o,\!icleduo3 curais!s [e sotuc.aja1 sou 'so,i!i -!sodxa sopaja c 'oixaluos asa U-J .(u?!~saseur!x?~de[ ua c1e~apcas o w o ~ 'oporu alsa ap usDnpoJiu! as ou anb so3!~1?rusoidasu03 deq anb asapran3al sand 'oses [a sa (ci o p u c n ~ ) o3!li?ur oidz3uo3 opcu!iiuaiap E aiua3e,Cqns o1i!icrcduro~oida:,uoa [ap u?!suaisa e[ e usp - u o d s a u o ~anb sour!(!p t. o[ni!dc3 [a ua anb se[ uos sc,\!iclr?duros sc~nisnl~s:, seis2
efectivamente restrictivas. Y aquí es donde aparece la complicación, pues no hay un único grupo de condiciones que garanticen la representación. Diferentes sistemas empíricos pueden satisfacer diferentes condiciones y todas ellas garantizar la existencia de cierto tipo de representación (interesante). Y lo que es más, esos grupos de condiciones requieren por lo general algún elemento adicional además de A y S. La representación se obtiene entonces con ayuda de alguna otra relación u operación sobre A, por ejemplo una operación de combinación asociada, que denotaremos mediante 'o', o exigiendo que A tenga algunas propiedades estructurales específicas, por ejemplo que esté formado por pares. Ahora la representación numérica no sólo debe preservar el orden S sino además determinados hechos relativos a esos nuevos elementos y, si ha de ser una representación interesante, si da Iugar a una escala no meramente ordinal, son necesarias condiciones efectivamente restrictivas. Vamos a ver a continuación cómo procede en general TM, es decir, en qué consiste en general la metrización fundamental. En primer lugar expondremos de modo abstracto este tipo de tarea y después ilustraremos la exposición con ejemplos concretos de la misma, esenciales para hacerse una idea precisa de la naturaleza de la metrización fundamental. En esta exposición volveremos sobre algunos de los aspectos que quedaron pendientes en el capítulo 4, que ahora deben quedar totalmente elucidados, en especial el relativo al motivo por el que podemos decir que determinadas asignaciones numéricas son escalas diferentes que midzn la nlisnzn propiedad-magnitud. Los sistemas de que se ocupa la metrización fundamental son pues, según las S, ...>, donde puede haber constituyenconsideraciones anteriores, estructuras dzl tipo 4, tes adicionales o A puede tener ciertas propiedades estructurales. Diversos grupos de condiciones o leyes sobre los constituyentes de los sistemas caracterizan diversos tipos de estructuras comparativas cualitativas efectivamente representables mediante escalas no meramente ordinales. Las leyes caracterizan o definen los diversos tipos de sistemas empíricos, y que tales sistemas son efectivamente representables numéricamente lo establece la teoría probando un teorerna de represerztaciórz (TR). Vamos ha llamar a partir de ahora 'métricas' a las estructuras cualitativas de que se ocupa TIVI.' TM define (caracteriza, determina) los diversos tipos de métrica mediante instancias particulares del siguiente esquema:
MET 4,S, ...> es una métrica - - - syssJcfCCi(A, S, ...), ..., C,(A, S,...). siendo Ci condiciones o leyes referentes al comportamiento de los componentes de la métrica. El teorema de representación establece entonces lo siguiente: TR Si 4, S, ...> es una métrica - - -,entonces existe f de A en Re tai que: para todo x, y de A: xSy syssfi) >AY); y ........ . 2. Este uso d e 'mítrica' no debe confundirse con lo que en matemáticas, y en especial en geometría. se denomina así. Mediante este nombre abreviamos la expresión 'sistema representable numéricamente' o 'sistema mensurable'. Puesto que el contexto evin confusiones, nos parece adecuado usar este nombre para connotar que aun siendo sistemas puramente cualit3tivos, es en ellos donde desccinsci en última instancia toda medición.
Los últimos puntos suspensivos indican el modo en que la representación presenra, además del orden, otros hechos cualitativos que involucran los demás elenientos de la niélrica. TR no recoge sin embargo todo lo que se debe probar. TR no indica cuán fuerte, estricta o, como se dice técnicamente, rriiíi!oca es la representación; esto es, no indica de qué tipo es la escala-representación. Usualmente hay níás de una representación posible, más de una función f de la que es verdadero TR, y es crucial saber cuán diferentes son las posibles representaciones para determinar el uso que podenios hacer de las mismas (recuérdese los casos de las escalas para la masa y la temperatura terniométrica mencionados más arriba p en el capítulo 4). Puede ocurrir que las representaciones se diferencien sólo en que unas son múltiples de otras, esto es, que se obtengan unas de otras multiplicando por un número; o puede que sean más diferentes, por ejenlplo que unas se obtengan a partir de otras multiplicando por un número y sumando otro. O todavía hay más posibilidades. Estos modos de pasar de unas representaciones a otras, y que deterníinan cuán diferentes son las diferentes funciones que satisfacen TR, son lo que en el capítulo 3 denoniinanios tra?rsfor-~liacioi~es entre escalas. El lector recordará que las más importantes son las siguientes(cf. cap. 4, 94):
Transformaciones si~i~ilarrs: una funcióii se obtiene a partir de otra n~ultiplicaiido por una constailte, e.e. g(.x) = a f i ) (a E Re-). Transformaciones lilieales: la nueva función se obtiene inultiplicando por una constante y sumando otra, e.e. g(s) = a&) + b (a E Re+,b E Re). Transformaciones lilreales silriyles: la nueva función se obtiene sólo sumando una constante, e.e. g ( s ) =fl-x) + b !O E Re). Transformaciones espoi~eiicialcs:la nueva fuilción se obtiene elevando a cierta potencia y multiplicando por una constante, e.e. g(.f) = a(f(x))"(ci, 11 E Re'). Transformaciones c.~~~otie~tciaIcs shnples: la nueva función se obtiene sólo elevando a cierta potencia, e.e. g(.x) = (fCr))"( 1 1 E Re'). Adeniás de TR es preciso kntonces probar un reol.cnla de ~~nicidad (TU) que establece cuán unívoca es la representación, esto es, el tipo de transfoniiación que relaciona las diferentes representaciones cuya existericia establece TR. Al tipo dado de transforniacióii se adrliisible, admisible en el sentido de que si tenemos una la denomina ~~~nri.~or~~iocióri funció~~-represeimción del sisteiiia, todas las funciones que se obtienen a partir de la primera n~edianteese tipo d e transforn~ación,y sólo ellas. son tanlbién una representación del siste1113, satisfacen también TR. El teorema de unicidad tiene siempre la siguiente foriiia:
TU Si <A, S, ...> es una métrica - - -,entonces cualesquieraf, g que satisfagan TR son tales que 8 es una transformación def. Conjuntamente toiilados, TR y T U (TRU) tienen la siguiente forma característica de los ieoremas de existencia u n í v ~ c a : ~ 3. Los tcorcin;is de cxisicncia unívoca son de la forma: "3.r (~,?(.r)A V y (qb)syss .rRy))" (o m5s
TRU Si uf,S,...> es una métrica - - -,entonces hay f de A en Re tal que: (1) Para todo x, y de A: xSy syssflx) 2 f i ) ;y ... . (2) Toda g que satisfaga (1) es una transformación d e $ O simplemente, de forma abreviada: "Hay f de A en Re tal que (l), y es única bajo transformaciones -". TRU determina el uso que podemos hacer de las representaciones, esto es, da cuenta de la naturaleza de los diferentes tipos de escalas (para los siguientes hechos, cf. cap. 4, 94): si las transformaciones admisibles para determinado sistema son las trctnsformaciones similares, la representación es una escala proporcional, el cociente de valores permanece constante al pasar de una función a otra; si las transformaciones admisibles son las transfor?naciones lineales, la representación es una escala de intervalos (o de diferencias), el cociente de valores no permanece necesariamente constante pero el cociente de intervalos o diferencias de valores sí; si las transformaciones admisibles son las transfonnaciones lineales simples, la representación es una escala de intervalos absolutos, permanece constante la diferencia de valores; si las transformaciones admisibles son las transformaciones exponenciales, tenemos escalas de irztenralos logarítmicos, permanece constante el cociente de diferencias de los logaritmos de los valores; para traizsformaciones e.uporrenciales simples obtenemos escalas de proporciones logarítmicas, caracterizadas por permanecer constante el cociente de los logaritmos de los valores; y así sucesivamente. Ésta es la explicación de los hechos aparentemente misteriosos relativos a los usos que se puede dar a las escalas de las diferentes magnitudes, como los que mencionamos para los casos de la masa y la temperatura. En el capítulo 4 vimos que las escalas para la masa y la temperatura eran de diferente tipo y que, por tanto, determinados cocientes que se preservaban en una no se preservan en otra. Eso estaba relacionado con el tipo de transformación mediante el que pasamos de unas escalas a otras de la misma magnitud, pero quedó abierta 13 cuestión de qué determina cuáles son las escalas de una maznitud, qué determina la extensión del concepto métrico (el conjunto de todas las escalas para dicha magnitud). Ahora podemos saber cómo se establece eso, se establece mediante el teorema de representación. Todas las funciones f de las que, dado un sistema comparativo cualitativo 4, S, ...>, sea verdadero TR, son escalas que miden la magnitud expresada por (o "contenida en") dicho sistema. Todas ellas representan numéricamente la magnitud y, por tanto, son escalas diferentes que miden (representan numéricamente) la misma magnitud. Y TU prueba cuál es tipo de transformación que las relaciona. Todó ello, cuáles sean las funciones y cómo se relacionan entre sí, depende, como se ve, de las condiciones C,, ..., C, que satisface el sistema empírico. Aquello en virtud de lo cual podemos considerar que diferentes asignaciones numéricas a los mismos objetos son asignaciones que representan la misma propiedad es el hecho de que todas ellas representan el sistema comparativo como TRU establece. abreviado "3 .r VJ ( y b ) syss .rRj)"), siendo R una relación de equivalencia (si R es la identidad, la existencia es estrictamente única, sólo hay una entidad que satisfaga y).
Éste es, muy resumidaiilente. el modo como TM investiga los diversos grupos de condiciones de mensurabilidad para sistemas enipíricos cualitati\~os,prueba después el tipo de representación que corresponde a cada uno y determina con ello el uso q u e se puede hacer de las escalas. Conviene señalar que, aunque se investigan y establecen diferentes grupos de condiciones. éstos no están totalrnente desconectados. Si se estudian con detenimiento los diferentes grupos de condiciones se observa que se pueden "estraiificar" de fornia natural, que hay algunas muy generales exigidas a todos los sistemas. otras más específicas exigidas sólo a un grupo de sistemas, hasta llegar a otras \válidas para un único tipo de sistemas. Es decir, se pueden agrupar 10s diversos grupos de condiciones en "ramas" de ii~odoque los modelos formen una típica estructura de red teórica, en el sentido estructuralista que veremos en el capítulo 10 ( $ 5 ) . Lo caracierístico de TM en tanto que teoría sobre las condiciones e~ttj~íi-icas que posibilitan la niedición fundamental es que cn cada una de las ramas de la red es posible probar al menos un teorenia de representación y unicidad: la existencia d e representación única bajo ciertas transforniaciones; las posibilidades representacionales de las diferentes nlétricas de la red serán niis o inenos fuertes según lo sea el tipo de transforníación, esto es, el grado de unicidad de la representación. No vamos aquí a resumir siquiera la estructura dc la rcd (cr. Alouliiics y Dicz, 1994, para la subrcd de las in6tricas combinatorias, y Díez, 1992, para una presentación esquemá~icade la red completa). En lugar de ello Presentaremos, para fijar, ideas dos inétricas específicas, las más comunes, junto con su correspondiente TRU.
3.3. Tiros DE MÉTRICAS Se pueden distinguir en general cuatro grandes tipos de estructuras métricas: las inétricas combinatorias, las n-iétricas de intervalos, las métricas conjugadas y las rnétricas algebraicas (llaiiíndas a veces 'probabilistas'). \'amos a ver aquí las dos primeras (en realidad algunos subtipos de ellas); de las dos últimas nos limitaremos a dar una idea general. A4ftl-icos co~~tbiiloto~.ias. Históricamente, los primeros sistemas que se estudiaron disponían, además del doniinio A y de la relación comparativa S, de una operación enipírica de concatenación o, en general, de cortzbiización, a la que denotaren~osmediante 'o', asociable de algún modo al procedin~ientode comparación; ejemplos de coinbinaciones, como mencionamos al presentar la diferencia entre magnitudes extensivas e intensivas, son la agregación de objetos, la rnezcla de sustancias, la concatenación de varas, la sucesión de espirales eléctricas, etc. Llamaremos a estos sistemas, que tienen la forma 4, S. métricas cor~zbiiza~orias. Hay muchos tipos de métricas conibinatorias dependiendo del coii~portaniientorelativo de S y El itiás conocido, y con el que se inició TAj, es el que corresponde a las nzérricas con~binafor-iase.~te~rsii~os positii~as.En realidad hay también varios subtipos de estos sistemas, y aquí vanios a presentar sólo el más sencillo (en adelante, P y K son, respectivamente, las relacioncs O>,
O.
de precedencia estricta ("estrictamente más ... que") y de coincidencia ("tan derivadas a partir de S del modo establecido más arriba).
... como")
'Definición6.1 : <A. S, o> es una métrica cornbinatoria extensiva positiva syss (1) S es reflexiva, transitiva y conexa en A . (2) O es una operación binaria cerrada en A . (3) Para todo x, y de A: xoyPx y xoyP-v. (4) Para todo x, y, z de A: x ~ ( y ~ z ) K ( - ~ y ) ~ z . (5) Para todo x, y, z de A: (.rSy syss xozSyoz) y (xSy syss zo.rSzoy). (6) Para todo x, y de A: si xPy entonces hay n E N tal que nyPx. (donde 'ny' significa que concatenamos y consigo mismo, o con equivalentes a él, n veces).
La condición (2) exige que exista la combinación de cualesquiera dos individuos; esta exigencia es muy fuerte y se puede debilitar sin perder capacidades representacionales complicando el resto de condiciones, pero no lo vamos a ver aquí. (3) expresa la P-positividad de O,esto es, el objeto resultante de la combinación es estrictamente mayor que cualquiera de sus componentes. (4) expresa la K-asocinrividad de o. (5) es la S-monotorzía: el orden se przserva tras combinaciones con el mismo objeto (o en general con equivalentes). (6) es la condición de nrqliit?iedianidad, que afirma que ningún objeto es "infinitamente" mayor que otro, esto es, si uno es mayor que otro podemos superar el primero combinando el segundo consigo mismo (o en general con equivalentes de él) un número finito de veces. Éstas son las condiciones que definen este tipo de métricas y, simplemente, hay sistemas empíricos que las satisfacen y otros que no. Las satisfacen, por ejemplo, cuerpos de tamaño n?edio con la comparación mediante balanza y la agregación; sucesos con la comparación mediante coincidencia de inicios y la consecución; varas rígidas con la comparación mediante coincidencia de bases y la concatenación lineal; varas rígidas con la misma comparación y la concatenación ortogonal; espirales elkctricas con la comparación mediante galvanómetro cualitativo y la consecución en serie. No las satisfacen, por ejemplo, las espirales con la misma comparación y combinación en paralelo; los líquidos con la comparación cualitativa de temperatura y la mezcla; las sustancias con la comparación cualitativa de densidades y la agregación; los ángulos con comparación mediante coincidencia dz bases y la consecución; los bienes de consumo con la comparación según preferencias subjetivas y la conjunción. Todos estos sistemas violan, al menos, 1s condición de positividad (y con ella, otras): la resistencia resultante de la combinación en paralelo no es mayor sino menor que ambos componentes, esa combinación es negatiiv; la temperatura del líquido resultante de mezclar otros dos está entre la de ambos, dicha combinación es itzterna; igualmente ocurre con la combinación de densidades; la combinación de ángulos es a veces mayor a veces menor que los componentes, es periódica en cierto entorno. Nótese, como advertimos más
arriba, que una misma nin_cniiud.coiilo la resistencia. puede tener unas propiedades con una operación de cotubinacióii y otras diferentes con otra operación. Esto son, siitlpleriicnte, hecfios del mundo. La realidad es de modo tal que algunos fenómenos empíricos tienen estas características y otros no. Si un sistema empírico cualitativo las tiene, entonces es nun-iérican-ienterepresentable de cierto modo específico. se pueden asignar números a los ohjetos de n-ianera que representen sus propiedades cualitaiivas debidas a la masnitud exhibida mediante la relación de comparación. En este caso específico existe una representación numérica que preserva el orden, que representa mediante la suma y que es única bajo transformaciones similares. Estos sistemas son representables, medibles, mediante escala~proporcionales,y lo que hace posible que sean medibles, y lo sean de ese modo específico, es que ocurren para ellos los hechos empíricos expresados en Def. 6.1. Esto es lo que dice el siguiente TRU (que presentamos sin prueba pues excede los límites de este testo): 0
Si ul, S, es una ~nétriracan~binatoriae.rrer~sii~a positii.~,entonces hay f de A en Re tal que: (1) a ) Para todos, y de A: xSy syss f(x) 2fO,); 6 ) Para todo s,y de A : f(.ro?) =f(.r-) +AY). (2) Para toda que satisfaga (1) hay a E Re' ial que, para todo s de A , ~ ( x = ) nf(.s). O>
Algunas veces se expresa la parte (1) diciendo sin-iplemente que f es un lioinon-iorfisino de 4, S, o> en <Re, 2, +>. No hay nada que objetar a esta versión como inera abreviatura de la que hemos usado, pero no conviene concederle deinasiada importancia. En ocasiones se caracteriza la tarea de Th4 conio la de investigar las condiciones para la existencia de representaciones homornórficas, e.e., se caracterizan los teoremas TR como asegurando la existencia de un hon-ion-iorfisn~o entre un sistema empírico y otro nuinérico. Pero, aunque en casos específicos como e1 visto (que además fue el inicial de la teoría), la "versión homoinorfisino" es natural, en general no tiene por qué ser así. Hay muchos tipos de métricas y muchos tipos de representaciones y no siempre se dejan expresar en la versión "homoniorfisnío" de forma natural. Es cierto que siempre podren-ios dcjittir operaciones matemáticas complejas con cuya ayuda definir un sistenia numérico apropiado para expresar TR como la existencia de un homomorfismo entre dos sistemas, pero en general el sistema inatemático resultante será n-iuy poco natural. A las representaciones de los sistemas combinatorios que expresan nun-iéricamei~te la operación cualitativa de combinación mediante la suma o adición matemática se las denomina representaciones adirii.as. Las métricas cornbinatorias presentadas tienen pues representaciones aditivas únicas bajo transformaciones similares. Ahora se puede comprender con iilayor propiedad la diferencia que se pretendía recoger inediante la distincióii tradicional entre magnitudes extensivas e intensivas, que es propiainente rclaiiva a inagnitudes y procediinientos dc coinbinación. Una n~agnitudes extensiva relativainente a un
MEDICI~N EN LA CIENCW
1 9.5
procedimiento de combinación si el orden cualitativo constituye junto con ese modo de combinación un sistema que tiene representaciones aditivas. Una magnitud es intensiva relativamente a un modo de combinación si la combinación es interna respecto del orden, esto es, si el objeto resultante está en el orden en una posición intermedia entre los constituyentes. Así precisada, la distinción no es exhaustiva ni excluyente. No es exhaustiva pues puede haber magnitudes que relativamente a cierto modo de combinación no sean extensivas ni intensivas (p.ej. la combinación de ángulos). No es excluyente, referida a las magnitztdes solas, pues podría ocurrir que una magnitud fuese extensiva respecto de un modo de combinación e intensiva respecto de otro; por supuesto que sí es excluyente referida a los sistemas enteros, incluyendo pues si una magnitud es intensiva respecto de un modo de combinación, seguro que no existen representaciones aditivas de dicho modo, y viceversa. Hemos visto que algunos sistemas combinatorios, como los de Def. 6.1, tienen representaciones aditivas, en las que 0 se expresa mediante Ia suma. Pero eso no quiere decir que sólo tengan representaciones aditivas. En realidad, es un hecho matemático simple que si una métrica combinatoria tiene representaciones aditivas, entonces sietnpre tiene también representaciones no aditivas. Por ejemplo, multiplicativas, que son aquellas representaciones en las que 0 se expresa matemáticamente mediante el producto: simplemente se aplica e' a la representación aditiva y se obtiene otra multiplicativa. Por tanto se puede probar otro teorema para estos mismos sistemas que sustituya en (1) la suma por el producto; en ese caso hay que modificar también (2): estas representaciones multiplicativas son Únicas, no bajo transformaciones similares, sino bajo transformaciones exponenciales simples, esto es, son escalas de proporciones logarítmicas. Es muy importante enfatizar que, en ese caso, la parte (2) de Teor. 6.1, la unicidad, cambia. TU no establece la unicidad de ccralqllier representación, sino de las representaciones de cierto tipo, aditivas, o multiplicativas, u otras. Esto no es una limitación, no quiere decir que después de todo la unicidad no sea tal. Lo que sucede es que simplemente no tiene sentido preguntarse por la unicidad de las representaciones si no sabemos cómo se representa O , dejar la representación matemática de abierta supone dejar sin precisar la representación: no podemos preguntar qué otras funciones hacen "eso" porque no sabemos del todo qué es "eso". Por tanto la unicidad expresada en (2) depende esencialmente de la representación de 0 que especifique (1). Es cierto que este hecho introduce un elemento de indeterminación, pero ésta no se refiere a Ia metrización sino a la medición. Ciertamente hay que eIegir entre las representaciones aditivas o las multiplicativas u otras, y en función de ello los valores asignados cambian. Esa elección corresponderá a los procedimientos de medición directa. Determinados procedimientos de medición directa (p.ej. los que efectivamente se usan en la física para la masa, la longitud y la duración), eligen una representación frente a las otras (p.ej. la-aditiva). Pero, como algunos autores han señalado (cf. p.ej. Ellis, 1966, pp. 79 SS.), toda la física se podría reescribir en principio usando representaciones multiplicativas, nada hay en el mundo de lo que ello dependa. Sobre las consecuencias de este elemento de arbitrariedad volveremos en la última sección. Las métricas combinatorias extensivas positivas son sólo un tipo de métricas combinatorias para las que existe representación numérica. Hay muchos otros tipos, negativas, O,
O
periódicas, internas, con sus correspondientes subtipos. Cada uno satisface determinadas condiciones empíricas que posibilitan su representación. esto es, que posibilita la prueba de un reorema análogo a Teor. 6. l . Algunos de ellos tienen también, como los de Def. 6.1, representaciones aditivas; otros no, su representación es esencialmente no aditiva (esencialmente, porque, como acabamos de ser, los que tienen representaciones aditivas tienen también otras no aditivas). No vamos a exponer ninguno de estos sistemas. La relación de comparación entre los objetos que exhiben una magnitud permite por sí sola, al ser un orden débil. escalas meramente ordinales, pero ya hemos visto que éstas apenas se pueden considerar genuinamente escalas cuantitativas (cf. cap. 4, 94). En las métricas combinatorias, con Iri ayuda de una operación empírica de conibinación con ciertas propiedades es posible encontrar representaciones más fuertes, con un grado mayor de unicidad. Eso no ocurre siempre que hay un procedimiento natural de combinación. Algunas magnitudes llevan naiuralmente asociado algún procedimiento de combinación, pero éste no satisface ningún conjunto de condiciones que permitan probar la existencia de una representación más fuerte que la meramente ordinal. Éste es el caso, por ejemplo, de la combinación.de temperaturas mediante mezcla. Esta operación empírica tiene algunas propiedades, p.ej. es intensiva en el sentido que heriios precisado (interna), pero no se complementa con la satisfacción de otras propiedades que conjuntamente constituyeran una métrica combinatoria interesante, e.e. con representación más fuerte que la meramente ordinal. No se piense que ello ocurre con todo sistema combinatorio intensivo, hay sistemas intensivos, como los sistemas de bjsección (cf. Krantz ct al., 1971. cap. 6, 56), con representaciones interesantes.
Afé~ricasde interi~alos. En algunos sistemas empíricos, aun cuando la magnitud no disponga de urí procedinliento de combinación útil a efectos métricos, es posible sin embargo establecer representaciones numéricas interesantes explotando otros hechos. El caso inás interesante, del que \.amos a ver un ejemplo, es el que explota ciertos hechos relativos a los pares de objetos que exhiben la magnitud. Hasta ahora sólo hemos mencionado casos en los que los procediniientos empíricos de comparación comparan un objeto con otro. Por ejemplo en la comparación de masas mediante una balanza. O la comparación de temperaturas de líquidos: un líquido está tanto o niás caliente que otro si al pasar un tubo con niercurio del primero al segundo la columna de inercurio desciende o se queda igual. Pero también se pueden comparar pares de objetos que expresen el inre~valo o diferrrlcin de magnitud entre ellos. Por ejemplo, podemos comparar pares de líquidos del siguiente 111odo: syS:iv syss el descenso de la columna de niercurio al pasar de x a es igual o menor que el descenso al pasar de z a 11: (con algunas coniplicaciones adicionales si incluiinos casos en que la columna asciende; intente el lector formularlo precisaniente para estos casos). O pares de bienes de consumo: ~-yS:io syss la preferencia de x a cambio de y es igual o tnayor que la de z a cambio de i v (también con algunas con.iplicaciones adicionales que aquí obviarnos). En estos casos la relación cualitativa de comparación compara, no las cantidades en las que los objetos tienen la magnitud, sino sus diferencias o intervalos. Pues bien, si esa relación cualitativa de comparación entre pares d e objetos satisface determinadas condiciones, son posibles también representaciones interesantes,
h l E ~ l C 1 EN 6 ~ LA CIENCIA
197
que por lo general son escalas de intervalos, esto es, únicas bajo transformaciones lineales. De nuevo, aquí no hay un único grupo de tales condiciones sino varios, cada uno con su propia especificidad pero todos suficientes para garantizar Ia existencia de una representación. Los sistemas ahora están constituidos por una relación comparativa sobre pares de objetos del universo, esto es, S ordena débilmente A A. Vamos a denominar a estos sistemas mérricas de intervalos. Presentaremos aquí, a modo de ejemplo, el tipo más sencillo de estos sistemas, las métricas de intervalos algebraicos: Definición 6.2: 4,S> es una métrica de intervalos algebrnicos syss
( 1 ) S reflexiva, trsnsitiva y conexa en A A. ( 2 ) Para todo ,Y, y, z, w de A: si q S z , v , entonces )vzSy.r. (3) Para todo x , x', y, y', z, z' de A: si ,rySx'yf y y:Sjtz', entonces xzSx'zt. ( 4 ) Para todo x, y, z, rv de A: si xyS_71v,entonces hay t, v tales que xtKz,vKvy. (5) Para todo .Y, y, z, rv dv A: si g P z w , entonces hay una serie finita de n intervalos (n E N) tit2,t2b,..., t , . , ~equivalentes a zbv y tales que tit, Pxy. (1) ya se ha explicado. ( 2 ) dice que el orden se invierte con los intervalos opuestos; esto es lo que hace a estos intervalos algebraicos, la diferencia en magnitud no sólo depende de la
"distancia" sino también, como en la temperatura, del "orden" de los objetos (otras métricas de intervalos, las de intervalos absolrlros, se caracterizan por el hecho de que la diferencia en magnitud es "absoluta", no depende del orden de los extremos). (3) es e1 análogo a la monotonía, el orden se preserva al "conectar" intervalos. (4) dice que es posible "reproducir" un intervalo en otro mayor, esto es, encontrar intervalos equivalentes al pequeño empezando por cada extremo del grande. Por último, ( 5 ) es la versión para intervalos de la arquimedianidad: ningún intervalo es infinitamente mayor que otro, podemos superar el mayor a partir del menor conectando un número finito de intervalos equivalentes al mencr. De nuevo, algunos sistemas empíricos satisfacen estas condiciones y otros no. Las satisfacen, por ejemplo, la temperatura y la utilidad. Cuando son satisfechas, existe entonces una representación numérica única bajo transformaciones lineales; por tanto estos sistemas son representables mediante escalas de intervalos. Eso es lo que dice el siguiente teorema: Teorema 6.2:
Si <A, S> es una n~étricade intervalos algebraicos, entonces hay f de A en Re tal que: (1) Para todo x , y, z, w de A: .rySrw syss f(.r) -fb)2 A z ) -f(w). (2) Para toda g que satisfaga (1) hay a E Re+y b E Re tales que, para todo x de A, g(x) = a&) + b.
Hay otras métricas de inter\.alos diferentes a las algebraicas con propiedades representacionales interesantes (entre ellas las de intervalos absoluios mencionadas más arriba). No las vamos a exponer aquí. Concluirenlos mencionando brevemente otros tipos de métricas diferentes de las combinatorias y de las de inien.alos. A4éíi-icas coiijirgadns. En estos casos los sistenlas einpíricos "coniienen" dos nlagnitudes que, aunque son claramente distintas. se dun cor~unrame~~re, es decir. es la acción conjunta de ambas la que se refleja en el procedimiento empírico de comparación cualitativa. Un ejemplo paradigmático de magnitudes conjugadas lo constituyen la urilidad y el grado de creerlcia (probabilidad subjetiva) cuando se comparan mediante juicios de preferencia de una muestra de sujetos frente a un dominio de opciones. Se pide al sujeto que diga si prefiere una opción a otra, o si le es indiferente. Así, por ejemplo, si tenernos que decidirnos por o bien comprar una entrada para un concierto al aire libre, que 110sintcrcsa inucl~o,pcro cn u n día nublado en el que puede Ilo\lcr, o bien una entrada para una obra dramática en un local cerrado, que nos interesa algo menos, nuestra decisión resultará de una ponderación simultánea entre, por un lado, la mayor "utilidad" que representa para nosotros el concierto frente a la obra dramática y, por otro, la mayor o inenor "probabilidad" (subjetiva) que asignemos a la creencia de que va a llover. Otro cjcinplo lo constituycii pares dc valores (utilidades) ccoii6n~icos,como el i,alor iilo~retorio y el valor de uso. En este caso se pide al sujeto que diga si prefiere pagar determinada cantidad w por el objeto y a pagar otra cantidad z por otro objeto \v. En estos ejemplos, como en todos los dein3s casos dc sistenlas conjugados, combinamos dos don-iinios distintos de objetos. En el primer caso. un doitiinio A constituido por acciones (ir al concierto, ir al teatro, quedarse en casa, etc.) p un donlinio B constituido por acontecimientos (que llueva, que haga frío, que haga sol, etc.). En el segundo caso, un dominio A de cantidades de dinero y otro dominio B de bienes de consurilo. O por ejemplo, en otro caso, un dominio de destinos vacacionales y otro de medios de transporte. En general, pues, las métricas conjugadas se caracterizan por ser sisteiilas comparativos en los que la relación de comparación S se establece entre dos pares de objetos de diferentes dominios (a diferencia de las métricas de intervalos en las que los dos dominios son necesariante~tteel misino): hay A , B tales que S ordena débilmente A B. Por supuesto la condición de orden débil no basta para tener representaciones interesantes, y hay diferentes tipos de sistemas conjugados según cuáles sean los diferentes grupos de condiciones adicionales suficientes para la representación. Una de estas condiciones es la resolubilidad, que expresa la idea de que cada componente es "propectable" en el otro: dados un par ap de A B y un objeto b de A, existe un objeto q de B tal que apKbq (y análogamente con el otro coníponente). No vamos a detenemos aquí en esta ni en otras propiedades de los sistemas conjugados. Basta saber que cuando el sistema satisface determinado grupo de ellas, entonces se pueden representar niiméricamente las dos magnitudes involucradas, y lo esencial de esta representación es que se hace para ambas "a la vez". Esto es, el teorema de representación prueba que, si el sistema satisface ciertas condiciones, entonces hay$ de A en Re y f2d e B en Re tales que: apKbq syss F(fi(a),f:@))2 F(f,(b),ft(q)),donde F
9
4
j "r ,=
es una operación matemática binaria específica, como la suma, o la resta, u otra más complicada (p.ej. el producto del primero por el logaritmo del segundo). Las funciones f; y f2 son las escalas de cada magnitud, y Ja función F es la particular combinación matemática que "sopesa" las dos magnitudes. Los sistemas más sencillos son aquellos en los que F es la suma, a los que se denomina sistetnas conjugados aditivos. Como en los casos anteriores, también aquí se debe probar además un teorema T U que establece el grado de unicidad de las escalas, en este caso de cada uno de los dos grupos de escalas.
Métricas algebraico-conjwzristas. Este último tipo de sistemas corresponde a los que la literatura denomina 'sistemas de probabilidad' (cf. p.ej. Krantz er al., 1971, cap. 5). Preferimos darles una denominación más genérica porque, en principio, ningún tipo de métrica tiene por qué estar vinculado a un único tipo de interpretación empírica. Es una cuestión empírica abierta si las condiciones que caracterizan estos sistemas son satisfechas por magnitudes diferentes de la probabilidad (o de las probabilidades, si es que hay varias magnitudes probabilistas). Este tipo de sistemas se caracterizan por el hecho de que el dominio sobre el que se establece la relación cualitativa de comparación S es en este caso un álgebra de conjuntos, esto es, una colección de conjuntos cerrada bajo el complemento y la unión. En la interpretación probabilista, el universo A es un universo de sucesos, y la relación cualitativa S determina de entre la totalidad de los sucesos, mediante procedimientos empíricos (p.ej. frecuencias, para la probabilidad objetiva; o juicios de sujetos, para la subjetiva), cuáles son "tanto o más probables" que otros. Cuando estos sistemas algebraico-conjuntistas satisfacen determinadas condiciones, se puede probar un teorema TR que establece la existencia de una función numérica de A en [0,1] que cumple los axiomas de Kolmogorov. En este caso (TU) la representación es zitzica, cualesquiera dos funciones tales son iguales. La escala es por tanto una escala nbsolutn, su tipo de transformación es la función identidad.
1
4. Metrización derivada (*)
En la medición indirecta asignarnos números, o mejor cantidades, a las cosas utilizando otras cantidades ya conocidas (medidas) con anterioridad y ciertas fórmulas que relacionan las cantidades involucradas. Estz tipo de medición, como la directa, también es posible gracias a que se dan ciertas condiciones. La investigación de las condiciones que hacen posible la medición directa corresponde a la metrización fundamental; la investigación de las condiciones que hacen posible la medición indirecta es tarea de la metrizació~z derivada. La metrización derivada tiene sin embargo un carácter completamente diferente al de la metrización fundamental; no realiza una investigación empírica especíjca pues su tarea, o es meramente definicional, o es realizada ya por las teorías empíricas cuantitativas usuales.
DERIVADA Y TEOR~AS Cti.Ah'TITATI\'.4S 4.1. MFIRIZACI~N
Lo que hace posible la medición indirecta es, por un lado, la existencia de mediciones previas conocidas, tanto de la misma magnitud para otros objetos, como de otras magnitudes para el mismo objeto; y. por otro, la existencia de ciertas fórmulas que expresan correlaciones entre los valores conocidos y el que se desea medir. El estudio de las condiciones que hacen posibIe la medición indirecta se divide pues en a) el estudio de las condiciones que hacen posible las mediciones previas que en ella se usan, y b) el estudio de las correlaciones con cuya ayuda se obtiene el valor buscado. El primero nos retrotrae entonces a las condiciones de posibilidad de los procedimientos de medición con los que hemos realizado las mediciones previas. Si son procedimientos de medición indirectos, volvemos a empezar. Si son directos, el estudio de sus condiciones de posibilidad exige otro tratamiento, el que hemos visto en la metrización fundamental. La tarea de la metrización derivada se reduce pues al estudio y determinación de las correlaciones entre magnitudes que se usan en el "cálculo" de una cantidad a partir de otras. Pero en la medida en que esas correlaciones expresen Izechos del 1nund0, se tratará simplemente de leyes científicas investigadas y establecidas por las teorías científicas cuantitativas usuales. Así es en la mayoría de los casos. Por ejemplo, en la medición de la masa de un cuerpo celeste a partir de la variación de trayectoria de un cohete de masa conocida, la correlación cuantitativa consiste en una combinación de leyes dináinicas generales con la ley de gravitación universal; las condiciones empíricas que hacen posible esa medición son pues las estudiadas por la dinámica y expresadas por sus leyes. Análogamente ocurre con la medición de una masa mediante un dinamómetro. O con la medición de distancias inaccesibles mediante triangulación, que involucra determinadas leyes d e la geometría física. Así pues, en la medida en que las correlaciones usadas en la medición indirecta son del tipo indicado, su estudio no es tarea especijSca de cierta disciplina. El estudio y establecimiento de dichas correlaciones. las leyes naturales, corresponde simplemente a las diversas teorías empíricas cuantitativas. La metrización derivada es entonces una tarea realizada (parcialmente) por las teorías usuales, no tiene contenido en tanto que disciplina empírica específica diferente de las teorías cuantitativas usuales. Entiéndase bien, estas teorías, obviamente, no estudian tales correlaciones empíricas con el$n de establecer las condiciones que hacen posible la medición indirecta; lo que ocurre es que en esa medición empleamos las leyes que de hecho han investigado y descubierto previamente las diversas teorías. No hay pues un estudio específico de las leyes eit tanro que son aquello que posibilita la rnediciórz indirecra; simplemente, en la medición indirecta se usa el hecho de que ciertas cosas se comportan de cieno modo, cosas y modos de los que se ocupan las teorías empíricas usuales. La matización contenida en el párrafo anterior es fundamental. La metrización derivada es una tarea realizada de hecho por las teorías cuantitativas usuales, pero sólo pal-cialrnente, esto es, sólo en la ~í~edicla en que las correlaciones usadas en las medicioleyes empíricas. Puede ocurrir que algunas de las correlaciones nes indirectas expresen usadas para calcular el valor desconocido a partir de otros conocidos no expresen leyes naturales en sentido estricto. ¿Qué expresan entonces? ¿Qué estatuto les corresponde a
esas correlaciones? El de definiciones. A veces las correlaciones usadas en la medición indirecta son definiciones mediante las que se introduce una nueva magnitud a partir de otras, considerando entonces aquélla una magnitud derivada a partir de éstas, calificadas como primitivas en ese contexto (aunque alguna de ellas pueda haber sido introducida con anterioridad como derivada a partir de sus propias primitivas). Concluiremos el examen de la metización derivada con algunas observaciones sobre este tipo de introducción de magnitudes derivadas mediante definición; en algunos casos, sólo plantearemos la cuestión, que dejaremos abierta.
Definiciones que no presriponen leyes. El tipo de definición más sencillo es aquel que claramente no involucra ni presupone ninguna ley o hecho empírico, más allá de la mera existencia de las magnitudes primitivas usadas. De éstos, los casos más simples son los que usan sólo una magnitud primitiva, como en la introducción de la superficie o del volumen a partir de la longitud (aunque están limitados a superfícies y volúmenes regulares de formas específicas). Antes de continuar conviene dejar claro desde el principio que el que la magnitud sea.derivada no quiere decir que siempre que se mide indirectamente se use como correlación su definición. Por ejemplo, hay mediciones indirectas de volumen que usan su definición, en el casc; de la medición del volumen de un cubo a partir de la longitud de sus aristas; pero hay otras mediciones indirectas del volumen que usan leyes físicas, como la medición del volumen de un cuerpo irregular a partir del empuje sufrido en la inmersión en un fluido, o la del de un cuerpo celeste a partir de ciertos efectos dinámicos. Los casos de magnitudes introducidas mediante definiciones que involucran una única magnitud primitiva son muy escasos, por lo general la definición involucrará varias magnitudes. El ejemplo paradigmático es el de la velocidnd media. Esta magnitud, que es una propiedad de los cuerpos en movimiento (o de los movimientos mismos, si se prefiere), se define como el cociente entre la longitud o distancia recomda y la duración del movimiento. Aquí, como en la definición de superficie, no hay ninguna ley física involucrada. Podemos definir después un movimiento como uniforme si, dividiendo idealmente la duración en partes tan pequeiias como queramos, la velocidad media en cada parte es la misma (e.e. si el cociente no depende de la duración). Es un hecho físico que cierto movimiento será uniforme o no lo será, pero la definición de la veIocidad media no depende de la existencia o no de movimientos uniformes. Por otro lado, nótese que el que en un movimiento uniforme la velocidad media sea constante tampoco es una ley física, simplemente hemos definido así los movimientos que llamaremos uniformes; esto es obvio en este caso, pero se iznora a veces en otros casos análogos (como en el caso de la densidad). Prácticamente lo mismo se aplica a la aceleración media (con alguna complicación adicional). O a la intensidad media de corriente, que se define como el cociente entre la cantidad de carga eléctrica que atraviesa la sección de un conductor y la duración del proceso.
No todos estos casos involucran el tiempo. Un caso estrictamente análogo que no lo involucra es el de la densidad definida a partir de la masa y el volumen. La derzsidad (media), que es una magnitud de los cuerpos físicos (sóIidos o no), se define como e1 cociente entre la masa del cuerpo y su volumen. Podemos después llamar, esto es mediante definición, homogéneo a un cuerpo si la densidad de todas sus partes es la misma. Es un hecho físico que unos cuerpos son homogéneos g otros no, pero no es una lqlfísica que "en los cuerpos homogéneos el cociente entre masa y volumen es independiente del volumen" (cf. Krantz er al., 1971, p. 456, donde se afirma, erróneamente, lo contrario); esta afirmación es verdadera exclusivamente en virtud de nuestras definiciones. No es verdad, por tanto, que "la noción de densidad de un material es una medida derivada cuya existencia depende de la validez de una ley" (ibid.). Es importante no confundir este punto para no complicar más de lo necesario la relación entre definición de magnitudes derivadas y hechos físicos. Dimensiones. Hay muchas otras magnitudes introducidas de este modo: el. 1710inelzro liizeal como producto de la masa por la velocidad, el trabajo como producto de la fuerza por la distancia, y tantas otras. Cuando definimos una magnitud a partir de otras, éstas confieren cierta diinensiórt a la definida. En física, por ejemplo, hay seis magnitudes básicas: masa (M), longitud (L), tiempo-duración (7). ángulo plano (A), temperatura absoluta (R) y carga eléctrica (Q). Las dimensiones de las magnitudes básicas (simbolizadas entre paréntesis) son las dirne~tsio~~es básicas, y el resto de magnitudes tiene por dimensión una combinación de ellas. Así, por ejemplo. el volumen tiene dimensiones L3, la la densidad i\l'L-3, el trabajo M'L'T2, la entropía velocidad L'T', la intensidad QIT-', R'h4'L2T2, etc. El estudio de las relaciones entre las magnitudes y sus dimensiones es el objeto de una disciplina específica, el Análisis Di~nensioiral.Aunque determinar las dimensiones de cierta magnitud es en general sencillo, a veces hay problemas específicos difíciles e interesantes relativos a la coherencia dimensional de las leyes y al papel de ciertas constantes en las mismas. El análisis dimensional tiene también aplicaciones interesantes en la resolución de algunos problemas empíricos. Por ejemplo, si se sabe que cierta magnitud está vinculada legalmente a otras, pero se desconoce la forma matemática específica de la relación, a partir de las dimensiones de las magnitudes in\~olucradases posible determinar dicha forma específica (salvo por lo que se refiere a la posible presencia de coeficientes numéricos puros adimensionales). No podemos exponer aquí, ni siquiera brevemente, los principales elementos de esta disciplina; el lector interesado puede consultar con provecho Palacios, 1956 (cf. también, como texto pionero en el tema, Bridgman, 1931). Escalas. Las magnitudes introducidas a partir de otras se expresan en escalas que se derivan o componen de las escalas básicas. El tipo de escala de la magnitud derivada dependerá del tipo de escala de las originales y del modo de derivación. Por ejemplo, es fácil probar que si las escalas de las magnitudes originales son proporcionales y, como en los ejemplos vistos, la derivación involucra sólo productos y cocientes de las magnitudes primitivas, entonces la escala de la magnitud resultante también es proporcional (puede demostrar-
E
lo el lector como ejercicio). Hemos visto que las escalas de la longitud son proporcionales (metros, centímetros, etc.), ello hace que las escalas para el volumen (metros cúbicos, centímetros cúbicos. etc.) también lo sean. Eso, unido a que las de la masa (kilogramos, gramos, etc.) son también proporcionales, hace que las escalas para la densidad, en tanto que tnagnitrtd detivada, sean también escalas proporcionales. Éste es pues un caso en que una magnitud intensiva es representable derivadamente mediante escalas proporcionales. Introducción sin eliminabilidad. Las anteriores consideraciones sobre las dimensiones de las magnitudes no deben llevar a conclusiones reduccionistas erróneas. Hemos dicho que las definiciones confieren dimensiones a las magnitudes derivadas, y también que toda magnitud tiene dimensiones que son combinación de las dimensiones básicas. Pero eso no quiere decir que todas las masnitudes (p.ej. de la física), sean dejnibles como magnitudes derivadas a partir de las consideradas básicas. Hemos calificado las seis magnitudes mencionadas de bdsicas, no hemos dicho que eran prir?iitivas justamente para no sugerir que todas las demás son definidas a partir de ellas. Algunas lo son, pero no todas. Por ejemplo, la fuerza, o la entropía, tienen también por dimensión cierta combinación de las básicas, pero no son definibles a partir de ellas (ni de otras, cf. las observaciones de los capítulos 6 y 8 sobre la no eliminabilidad de los términos teóricos). Las magnitudes no básicas y no definidas adquieren sus dimensiones a través de las leyes que las vinculan con otras magnitudes y, aunque las leyes son coherentes con las dimensiones, no son definiciones. Éste es uno de los temas de que se ocupa el análisis dimensional y que no podemos tratar en detalle aquí. Definiciones que presriponetz leyes. Contrariamente a los ejemplos vistos hasta ahora, a veces la introducción de una magnitud derivada mediante definición parece involucrar algún tipo de ley física. Se trata de leyes de.proporcionalidad o de constancia del tipo "el cociente entre tales cantidades y tales otras es constante", e.e. mlrn' = K o, equivalentemente, m = Km'. Pero no son realmente leyes de constancia absoluta pues l a proporción o constante depende del objeto, matcrial o sustancia. Los siguientes son algunos ejemplos.
"La dilatación de un metal es proporcional al incremento de temperatura, el factor de proporción es el coeficiente de dilatación del metal." "El cociente entre la cantidad de calor suministrada y el producto de la masa por el incremento de temperatura es constante para cada sustancia, es su calor específico." "En un hilo conductor, el cociente entre el producto de la intensidad por'la sección y el producto de la diferencia de potencial por la longitud es constante para cada material (a una temperatura dada), es su conductividad eléctrica." "El cociente entre la fuerza externa incidente sobre un cuerpo y la aceleración que adquiere es constante, es su masa inercial." "La elongación de un material elástico es proporcional a la fuerza, el factor de proporcionaIidad es el coeficiente de elasticidad del material."
201
FUND.4hIESTOS DE FILOSOFL~ DE LA CIENCIA
De modo análogo ocurre en los casos de los coeficientes de conductividsd térmica, de conductividad caIórica, de permisividad eléctrica del medio, de refractancia, de compresibilidad, y otros. Estos coeficientes o factores de proporcionalidad no son constantes absolutas (como la de gravitación o la de Planck), dependen de las entidades involucradas y pueden tener diferentes valores. Son pues propiedades de los cuerpos que se pueden dar en diferentes individuos en diversos grados, o incluso pueden variar para un mismo individuo en momentos diferentes (pues algunas dependen, p.ej. de la temperatura). Esto es, son magnitudes. La cuestión es si se pueden o no considerar introducidas por definición mediante estas leyes. La respuesta puede variar de unos casos a otros y depende de la función que desempeñe la magnitud en otras leyes y teorías. Hay casos en los que claramente no se puede considerar que las leyes definen la magnitud, como el de la masa (al menos si ha de ser la misma que la gravitatoria). En otros casos claramente sí, como el del índice de refracción de una sustancia, que es como convenimos en llamar al cociente entre la velocidad de la luz en ella y en el vacío; quizá se pueden considerar igual, p.ej., las conductividades. En otros casos puede no estar tan claro. ¿Es la ley de Ohm, "diferencia de potencial entre intensidad es igual a resistencia", una definición de 'resistencia' o una regularidad entre magnitudes independientemente determinadas? Como hemos dicho, la respuesta depende de la función de la resistencia en el resto de la disciplina. Sea cual sea en cada caso la respuesta a esta cuestión, lo que debe quedar claro es que en los casos en que es correcto considerar que la magnitud se define propiamente mediante una ley, ello no implica en absoluto un elemento de convencionalidad en la ley, resultado que sería catastrófico para la empiricidad de la disciplina. Es cierto que la definición, y sus variantes, serán verdaderas por convención, en virtud del significado fijado; pero no lo es que todo es convencional, pues la definición presupone una regularidad natural verdadera o falsa no convencionalmente. Supongan~osque la ley de Ohm, AAZ = R, no define la resistencia sino que es una correlación entre magnitudes determinadas independientemente. No hay ningún riesgo, ni siquiera aparente, de convencionalidad. Pero supongamos que no es así y que se debe considerar una definición, en sentido estricto, de la resistencia. Es cierto entonces que la afirmación "la diferencia de potencial es igual al producto de la intensidad por la resistencia" es convencionalmente verdadera en virtud de nuestras reglas del significado. Pero eso no elimina el hecho de que la afirmación "el cociente entre la diferencia de potencial y la intensidad es constante" sea una afirmación 110 coizi~ei~cional, empírica y no analítica, verdadera o falsa (en este caso verdadera) en virtud de cómo es el mundo físico, no en virtud del significado. Quizá algunas de las llamadas leyes se pueden considerar definiciones, pero esas definiciones son posibles porque se dan determinadas regularidades e~npíricasde constancia o proporcionalidad. Es una regularidad empírica que cierto cociente de magnitudes es constante (para un material, objeto o sustancia), y gracias a ello podemos después convenir en llainar de cierto modo a ese cociente.
Iinplicacioites ontológicas. Por último, ¿existen las magnitudes derivadas?, ¿están en el mundo como propiedades que se ejemplifican en los objetos según un más y un menos? ¿Sor; las definiciones de magnitudes meras abreviaturas notacionales? ¿Son por el contrario
XIEDICION EN LA CIENCIA
I t
#
; !
5
!j
L
I
i
1
enunciados que expresan la reducción de una propiedad a otras? En principio parecería que en un sentido inmediato si existen, pero, sin necesidad de entrar en profundidad en la cuestión ontológica, hay casos en los que tenderíamos a dar una respuesta negativa. No podemos definir lo que queramos; o mejor, sí podemos, pero parece que no todo lo que definamos tendrá sentido enzpírico. Por ejemplo. podemos definir la masura, S, de un cuerpo como el producto de su masa rri por su temperatura T, pero no parece que eso sea una propiedad. El motivo es que de eso no hablan las leyes, éstas no incluyen un producto así. Quizá este ejemplo no es el mejor. Hay una ley que afirma que la cantidad de calor surninistrada a un cuerpo es igual a su calor específico por su masa y por el incremento de temperatura, Q = cm(T2 - Ti); pero como eso es equivalente a Q = c,(rnTz - mTi), se podría reformular entonces diciendo que el calor suministrado es igual al producto del calor específico por el incremento de masuras, Q = cs(S2- S , ) . ¿Existe entonces la masura, propiedad de la que nadie había hnblndo hasta ahora? ¿Qué decir de la cantidad de movi}rziento (o momento lineal) p, dz la que hablaban los físicos antiguos, y que ahora se dejne como el producto de la masa por la velocidad? Claramente hay leyes que "manejan" ese producto, en las que parece que eso está opertl~zdo.Si existe la cantidad de movimiento, ¿existe la masura? Quizá sólo se pueden descartar las "combinaciones" no presentes en leyes. Por ejemplo, el producto de la acelzración de un cuerpo por su volumen V no interviene (explícitamente) en ninguna Icy. Pero ése es un criterio difuso, pues siempre es posible reformular artificialmente las leyes para que incluyan las combinaciones que queramos. Por ejemplo, si d es la densidad, podemos reescribir la ley F = nla como F = dVa, con lo cual la fuerza resulta ser igual al producto de la densidad por esa cosa. Se pueden imponer constricciones adicionales, como que la ley sea simple, esto es, que no se pueda simplificar más. Pero qué simplificaciones son posibles depende en parte de qué combinaciones se acepten como magnitudes. Llamemos volución, C, al producto Va. Si la volución es una propiedad, ¿es más simple F = rna que F = dC? En el sentido en que lo es, también habría entonces expresiones más simples de las leyes que se refieren al momento lineal. Podemos optar por descargamos de todas, pero ¿no parece que, por ejemplo, el volumen o la velocidad son efectivamente propiedades? La respuesta a todas estas cuestiones ontológicas dependerá de cuál sea nuestra teoría para individualizar o identificar propiedades, uno de los temas actualmente más debatidos en metafísica, y en el que no podemos entrar aquí. Con la presentación informal de estas cuestiones concluimos el análisis de la metrización derivada y pasamos al de los procedimientos de medición.
5. Procedimientos de medición directa (*) i
i
S:
i
$ 3
f:
En la medición directa asignamos un valor a un objeto sin disponer de otros valores numéricos previos, directcr~nenrea partir de la experiencia cualitativa. Ya advertimos que esto se ha de entender en un sentido amplio, que incluya la medición por comparación directa con un estándar. El estándar es el primer objeto al que se le asigna el valor numérico y por comparación con él se asigna un valor a los demás. En este.sentido,
la asignación a los demás supone el uso de una asiznación previa, la del estándar. Ello es así en sentido estricto, y poco interesante puesto que la asignación numérica del estándar es arbitraria; en ese sentido estricto sólo habn'a medición directa para el estándar mismo. La medición directa se debe entender por tanto en el sentido amplio indicado, que es el interesante.
5.1.
EJEMPLOS DE PROCEDlhlIE3TOS DE ~.IEDICIÓN DIRECTA
Ejemplos paradigmáticos de medición directa son la medición de masas mediante una balanza, la d e longitudes mediante varas y la de la temperatura (termométrica) mediante termómetros. Las asignaciones resultantes en los primeros casos son escalas proporcionales, la del último es una escala de intervalos. El examen detenido de estos procedimientos debe aclarar el sentido preciso en que la metrización fundamental está presupuesta en los procedimientos de medición directa. Veámoslo. La medición directa de masas mediante una balanza procede, como el lector sabrá, más o menos d e la siguiente manera. Tenemos una serie de cuerpos de tamaño medio que se comparan cualitativamente mediante una balanza del modo indicado en la sección 2, cuerpos que podemos componer o combinar mediante agregación poniéndolos juntos en el mismo plato de la balanza. Este orden cualitativo y esta operación de agregación se comportan conjuntamente de cierto modo. Se elize un objeto cualquiera del dominio, por ejemplo un determinado objeto que está ahora en cierto lugar de cierta sala de un museo de París, y se le asigna un número real 12 arbitrario, p.ej. 1, o 1.000, 0,001 o el que se prefiera (14, 137, d2, x o lo que sea). Ese objeto es el estándar. Una vez asignado un valor arbitrario al estándar, los demás objetos del dominio tienen determiiiada su asignación. Los objetos equivalentes al estándar reciben el mismo número. Con los no equivalentes, mayores o menores, se procede como sigue. Por ejemplo, si el objeto es equivalente a la agregación de dos equivalentes al estándar, se le asigna 211; si es equivalente a la agregación de tres equivalentes al estándar, 312; y así sucesivamente. Si, en cambio, el objeto es menor, se procede de la siguiente forma: si su agresación con otro equivalente a él es equivalente al estándar, se le asigna 1212; si su agregación con otros dos equivalentes es equivalente al estándar, id3; y así sucesivamente. L o esencial de este procedimiento está, como habrá adivinado el lector, en el "y así sucesivamente". ¿Qué nos garantiza que poden-ios proceder así sucesivamente coi7 todos los objetos de ese dominio específico? Aquí es donde entra la metrización fundamental. Ese "y así sucesivamente" es posible, queda garantizado, porque el comportamiento de la relación comparativa y la agregación en ese sistema empírico cualitativo específico salisfaceil de lzeclzo ciertas condiciones empíricas. Que esas condiciones son suficientes para asegurar que mediante ese procedimiento podemos dar asignaciones a todos los objetos del dominio es lo que prueba TRU que, como vimos, establece además la relación entre las diversas series de asignaciones posibles. En este caso, las diversas series o escalas dependerán del número rz que se le asigne al estándar; para pasar de los valores asignados por una escala f a los asignados por otra f multiplicamos los primeros por el cociente de
[os números asignados al estándar porf yf, e.e. por n'ln. Por ejemplo, cierta escala asigna al mencionado objeto de París el 1, otra el 1.000 y otra el 0,001. Para distinguir entre estas asignaciones ponemos al lado del signo numérico un signo arbitrario, p.ej. 'kiIogramo' en e[ primer caso (escala MKS), 'gramo' en el segundo (escala cegesimal) y 'tonelada' en el tercero. Así, un objeto al que, por comparación con el estándar, la segunda escala le asigna 3.000, la tercera le asigna 0,003, esto es 3.000 x (0,00111.000). Por supuesto que se podría elegir cualquier otro número para ese objeto, como 14, 137, d2, K (escala "pitagórica") o 6,023 x lo2' (escala "avogadriana"), y nada cambiaría. Bueno, cambiarían desde luego los números asignados a los demás objetos, pero no el cociente entre cclalesquiera dos de ellos, pues pasamos siempre de una escala a otra multiplicando por cierto real. Y exactamente lo mismo daría coger como estándar cualquier otro objeto, como el zapato que Kruchev exhibió en la ONU. La medición directa de la longitud procede de un modo estrictamente análogo, y lo mismo ocurre en general con toda magnitud que satisfaga las condiciones de las métricas combinatorias positivas extensivas. Con la temperatura, cuyos sistemas empíricos cualitativos tienen propiedades diferentes, las cosas son un poco más complicadas. En este caso no se selecciona un objeto arbitrario que hace de estándar sino dos, por ejemplo, el agua cuando se congela y el agua cuando se hierve. A esos objetos se les asignan dos números n, m arbitrarios, por ejemplo O al primero y 100 al segundo, o O y 1, o 32 y 212, o los que sea. Lo que se elige no es pues una ejemplificación de la magnitud a la que se da un valor arbitrario, sino dos ejemplificaciones, esto es, un intervalo o diferencia de magnitud, al que se le da un valor arbitrario, a saber, m - n (100 en el primer caso, 1 en el segundo y 180 en el tercero). Para poder manipular ese intervalo se usa cierto instrumento. En este caso es un tubo con mercurio en el que la diferencia en temperatura de las dos ejemplificaciones se plasma en una diferencia entre las alturas del mercurio. Así, podemos decir que los dos objetos elegidos son el mercurio cuando, tras sumergirlo en agua, a ) está a la altura correspondiente al instante en el que el agua se congela, y b) está a la altura correspondiente al instante en el que el agua se evapora; a la primera altura le asigno n y a la segunda m. De este modo, coniparando intervalos o alturas, es posible asignar valores a todos los demás objetos de ese dominio. Si la columna correspondiente a otro objeto está justo en la mitad de las dos columnas estándar, al nuevo objeto le asigno n + [(m- rt)/2];si está a la tercera parte, n + [(rn- n)/3]:y así sucesivamente. Si supera el primer estándar el doble de lo que el segundo estándar supera el primero, le asigno n + [2(m- n ) ] ;si supera el primero el triple de lo que el segundo supera el primero, n + [3(m - n ) ] ;si supera el primero una vez y media lo que el segundo estándar supera el primero, n + [(3/2)(m- tz)]; y así sucesivamente. Como antes, el "así sucesivamente" es efectivamente posible para todos los objetos del dornittio si el sistema cualitativo de comparación de intervalos cumple ciertas condiciones empíricas, en este caso las de las métricas de intervalos algebraicos. El modo más sencillo de hacer 1s asignación es dividir la distancia entre las alturas de los estándares en jn - 11 intervalos iguales y extender la división por arriba y por abajo. Los límites de esos intervalos son los grados de temperatura. Las diversas series de asignaciones o escalas dependerán de los números n, m que se asigne a los estándares. Si los
dos estándares son los mencionados, con 11 = O y 171 = 100, tenemos grados Celsius; si con esos estándares I r = 32 y 112 = 212, grados Fahrenheit; etc. Si la escala f les asigna 11 y 111. y la escala f' les asigna 11' y in', es fácil ver que para pasar de los \lalores asignados por f a los asignados por f hay que n~ultiplicarlos primeros por (ríz' - n')/(1?1- n ) y sumarles (17112' - i ~ ~ ~ t ' ) l-( l nn): por ejemplo, para pasar de grados Celsius a grados Fahrenheit, multiplicamos por 91.5 y sumamos 32. Por supuesto que se podrían elegir cualesquiera otros números para ese par de objetos y nada cambiaría. Bueno, cambiarían desde luego los números asignados a los demás objetos, y también el cociente entre los valores, yero 110 cantbiaría el cociente enri-e pares o difereiícias de ilalot-es, pues pasamos siempre de una escala a otra multiplicando por cierto real y sumándole otro. Y exactamente lo mismo daría cocer como estándares cualquier otro par de objetos, como el vino congelándose y comenzando a hervir. GENERAL DE LOS PROCEDIh.IIENTOS DE L I E D I C I ~ NDIRECTA 5.2. FORMA
Hemos dicho que en los casos examinados, y en cualquier otro caso de medición directa, el procedimiento de asignación se puede con-ipletar para todos los objetos del dominio gracias a que los sistemas empíricos satisfacen ciertas condiciones cualitativas. algún grupo de las estudiadas por la teoría de la metrización fundamental. Éste es el orden de dependencia lógica de la medición directa respecto de la metrización fundamental. Pero no se piense por ello que es también el orden de dependencia práctica o de realización, esto es, que la medición directa no se realiza hasta que se ha determinado que el sistema satisface tales condiciones. Esto tiene una lectura fuerte, en la que es falso, y otra débil, en la que se puede considerar correcto. En la primera interpretación, fuerte, significa que las mediciones directas no se pueden realizar, y por tanto no se realizan, hasta que la investigación teórica desarrollada por TM establece los grupos de condiciones, los teoremas TRU con el tipo de transformación admisible, y comprueba que cierto sistema concreto satisface uno de esos grupos. Esto es claramente falso. Masa, longitud, temperatura y otras magnitudes se medían directamente con este tipo de procedimientos mucho antes de que se iniciara la investigación en metrización fundamental, que se remonta como mucho a finales del siglo xrx con Helmholtz. TM proporciona losfirildan~entosde esos procedimientos, e.e. investiga sus condiciones de posibilidad. Se procedía así pero, en cierto sentido, sin fufuiidanze~zto,sin estar teóricamente bien fundamentada la diferencia entre escalas proporcionales, de intenalos, logarítmicas, etc., que generaban los procedimientos. Ahora bien, es claro que se podía proceder de hecho así antes de esa investigación teórica pues, obviamente, esos sistemas cumplían de hecho esas condiciones antes de que nadie se pusiera a investigarlas y a probar teoremas de representación y unicidad a partir de ellas. Ésta es la interpretación débil, correcta. de aquella afirmación. La medición directa no es posible si no se cumplen ciertas condiciones; pero, si de hecho se cumplen, la realización efectiva del procedin~iento se puede considerar una determinación implícita de que así es, pues el procedimiento "usa" tales propiedades. Esto es así "antes" (e.e. independientemente) del desarrollo de TM, a no ser que se quiera
LIEDICIÓ'I EN LA CIENCIA
209
considerar que la realización de los procedimientos constituye un adelanto, implícito y parcial, de TM. Es mejor no considerarlo así pero, una vez aclarado el punto importante, lo demás es una cuestión terminológica. Esta aclaración tampoco debe hacer creer que TM no es de ninguna ayuda para la práctica de Ia medición directa. TM fundamenta Ias prácticas que ya existían con anterioridad, pero también ayuda a establecer otras nuevas para magnitudes para las que no existían procedimientos de medición directa con anterioridad. Gran parte de la investigación actual en TM está vinculada al intento d e dar con procedimientos de medición directa para magnitudes, principalmente psicológicas y económicas, tratadas hasta entonces de forma puramente cualitativa. Para concluir, y a modo de resumen esquembtico, representaremos formalmente la forma general o estructura de los procedimientos de medición directa y haremos algunas observaciones al respecto. La representación formal de la estructura de estos procedimientos ha de expresar los elementos o constituyentes que intervienen y el modo en que están relacionados. Hemos visto que la representación cuantitativa directa de un sistema cualitativo es posible porque éste satisface de hecho ciertas condiciones o leyes, que estudia y descubre TM. Los procedimientos de medición directa deben estar pues parcialmente constituidos por sistemas cualitativos que satisfacen algún grupo de condiciones de mensurabilidad, esto es, por métricas. Pero ello es así sólo parcialmente, esto es, no están constituidos sólo por estos sistemas pues éstos expresan sólo la mera posibilidad de medición, no la asignación efectiva. En tanto que asignación efectiva, el procedimiento elige o destaca iinn de las funciones-representaciones cuya existencia garantiza el (o mejor, uno de los) TRU de la métrica. Para ello se destacan iin número finito de objetos del dominio, los estándares del procedimiento (si la métrica es cornbinatoria, uno, si es de intervalos, dos, etc.), y la misma cantidad de números reales. los valores arbitrariamente asignados a los estándares y que determinan la función-representación f específica. Podemos representar entonces un procedimiento de medición directa del sizuiente modo: PIMD Un procediinietlto de medición directa es una estructura del tipo <A, S, ...,'71, ..., al-,ni, ..., ni,f> tal que: (1) <4, S, ...> es una métrica, e.e. un tipo de estructura caracterizado por TM. (2) a i A~y n i € Re(1 5 i I k ) . (3) Cierto TRU especij7co es verdadero para f respecto de <A, S, ...>. (4) Ani) = i z i ( 1 < i < k). La condición (1) expresa que un constituyente del procedimiento es un sistema cualitativo que satisface condiciones apropiadas de mensurabilidad. (2) indica que hay tantos estándares como números destacados. (3) requiere especial atención. Por ser 4, S, ...> una métrica tendrá algún teorema TRU asociado. Pero vimos que no sólo tiene uno sino muchos, p.ej. en el caso de las métricas combinatorias extensivas positivas había un teorema TRU que establecía la existencia de representaciones adirivas y su grado de unicidad, y otro análogo para representaciones milltiplicntivas; y hay muchos otros que no mencionamos. gijimos entonces que nado en el sistema crralitatirpo obliga a elegir un tipo de representación frente a
otro, que eso es una elección arbitraria que se realiza en los procedimientos de medición directa. (3) expresa este hecho. Al decir que de f es verdadero, entre los varios posibles. un teorema TRU espec$co, se está expresando el hecho de que cada procedimiento deteníziiía corn~e~tcio~~al~~le~zte u11 único tipo de representacióll de entre los dii~ersosposibles (aditivas, multiplicativas, etc.). (3) deternlina por tanto el tipo de representación, ahora bien, no la función f concreta. Aun satisfaciéndose (3), f puede ser todavía una de varias funciones posibles, aunque, eso sí, todas del mismo tipo (una de entre las aditivas, o una de entre las multiplicati~as,etc.), y el procedimiento debe elegir una de ellas. Eso es lo que expresa (4): de entre todas las funciones del rnisnlo tipo (que cumplen (3)), el procedimiento elige arbitrariamente aquella que asigna ciertos números a los estándares. Una vez se ha asignado arbitrariamente un número a cada estándar, entonces el valor de la asignaciCn para los otros objetos de A queda determinado, esto es, queda determinada in7a asignación f específica, la escala a que da lugar el procedimiento. Esta caracterización resume los elementos esenciales, y sus relaciones, de todo procedimiento de medición directa; el lector puede aplicar el esquema a los casos paradigináticos de la masa y la temperatura esbozados más arriba. Nótese que la medición directa contiene dos elementos de arbitrariedad o convencionalidad: qué tipo de representación elegimos (3), y qué valores elegimos para los estándares (4). Los ejemplos vistos mostraban explícitamente sólo el segundo, pero contenían también inzplícitaiízente el primero, más fundamental como veremos en las consideraciones finales. Además de la noción de procedimiento de ~ízedicióizdirecta, es conveniente disponer de otra más general, la de iírétodo de ~nedicióndirecta. Los procedimientos de medición que hemos caracterizado son específicos o singulares, cada procedimieilto es un caso concreto de asignación. Un procedimiento con ciertos objetos específicos de tamaño medio comparados mediante una balanza, combinación por agregación, ciertos estándares, etc., es un PMD; otro con otros objetos también comparados mediante una balanza, agregados, etc., es otro PMD; y lo mismo otro con varas rígidas, comparación por superposición, combinación lineal, etc. Sin embargo, aunque los tres mencionados son procedimientos particulares diferentes, los dos primeros comparten algo que no comparte el tercero. En un sentido más general de 'procedimiento', los dos primeros usan el mismo procedimiento, diferente al del tercero; en tanto que placedi~~rielitos particirlares son casos de un mismo procediittie~ztogeizeral. Llamaremos 'métodos' a estos procedin~ientosgenerales. Un método de medición directa (MMD) es entonces simplemente un conjunto de procedimientos de medición directa que comparten algo, vinculados o relacionados de cierto modo. Puesto que los métodos de medición son prácticas operacionales, diremos que lo que hace que dos procedimientos correspondan al mismo método es que estén en cierta relación de equi\~ale~tcia oyeracio~zal.En función de qué incluya dicha relación, de qué sea lo que consideremos que deben compartir, tendremos una noción inás o menos estrecha de MMD. Intuitivamente, lo mínimo que han de compartir dos procedimientos para corresponder al mismo método ha de ser el modo de comparación. Debemos exigir esto si querenios distinguir los dos primeros ejemplos del tercero. También debemos exigir que compartan las otras operaciones o demás elementos constituyentes de las métricas, para
1 !
i i
i 1
distinguir p.ej. los métodos para resistencias mediante combinación en serie y en paralelo. Ahora bien, han de compartir estas cosas intensionalmente, esto es, han de compartir el procedimiento de comparación, el de combinación, etc., intensionalmente considerados, la "idea" de los mismos. Exigir que los compartan (sólo) extensionalmente sería en parte demasiado y en parte demasiado poco. Sería demasiado, pues entonces dos PMD del mismo método deberían tener siempre los mismos individuos en el dominio, y eso da una noción de método demasiado estrecha; no queremos excluir que los dos primeros ejernplos sean del mismo método sólo porque se distingan en algunos objetos. Y sería a la vez demasiado poco, pues dos PMD intuitivamente diferentes podrían coincidir. Por ejemplo, para un determinado conjunto de varas rígidas de igual sección y material (homogéneo), 10s órdenes extensionales establecidos mediante una balanza y mediante superposición coinciden, y la combinación lineal es una forma de agregación, pero no por eso queremos decir que son el mismo método. Esto por lo que respecta a las exigencias relativas a los constituyentes de la métrica. Estas exigencias son las mínimas, y según ellas, los dos primeros ejemplos corresponden al mismo método. Pero se pueden hacer otras exigencias más fuertes, según alguna de las cuales esos dos procedimientos dejen de corresponder al mismo método. Se puede exigir a) que f satisfaga el mismo TRU, o ú) que los estándares sean los mismos, o c) que además se les asigne los mismos valores. Así se obtienen diferentes nociones más fuertes que la acepción mínima. La elección depende de qué consideramos que es esencial a los métodos. Si sólo los aspectos cualitativos, exigiremos lo mínimo; si también el tipo de representación, exigiremos además a); si además los estándares elegidos, incluiremos b); y si incluso se considera esencial los números asignados, también exigiremos c). Lo único claro es que estas exigencias deben ser acumulativas. S o tiene mucho sentido exigir que los valores de los estándares sean los mismos si el tipo de representación (aditiva, multiplicativa. etc.) es diferente. Un conservadurismo metodo1ó;ico general hace quizá preferible la exigencia mínima. Además, es ella la que está especialmente vinculada con la idea de magnitud, pues diferentes procedimientos de medición de un mismo método deben medir la misma magnitud (aunque quizá pudiera haber en algunos casos métodos, en este sentido mínimo. diferentes y que midieran directamente la misma magnitud). Sin embargo, aunque en general sea preferible la noción mínima, para ciertos fines puede ser útil alguna de las otras nociones más fuertes. Nótese que la última es extremadamente fuerte pues acaba identificando métodos con escalas, las mediciones directas de la masa en gramos y en kilos serían métodos diferentes. Eso parece excesivo, pero quizá haya un sentido de 'método' en que es así; si lo hay, esta caracterización hace preciso cuál es. En las consideraciones finales volveremos sobre estas cuestiones.
6 . Procedimientos de medición indirecta (*)
En la medición directa hemos visto que, una vez fijado arbitrariamente el tipo de representación y los valores para los estándares, los valores para los demás objetos quedan unívocamente determinados. Para el análisis general de la medición es fundamental insis-
212
FUND.43IE3TOS DE FILOSOFL~
DE LA CIENCIA
tir en un hecho cnicial, aunque obvio, a saber, que en la medición directa sólo quedan determinados los valores de los objetos del dol?tiltio del sisre~?la,de los que entran en la relación empírica cualitativa de comparación del sistema; o si se quiere, puesto que para una misma magnitud puede haber varios sistemas cualitativos con diferentes dominios, sólo queda determinado el valor de los objetos que están en el dominio de algzmo de esos sistenías comparativos. Ahora bien, es claro que no todos los objetos que exhiben una magnitud pueden pertenecer al dominio de algún sistema de comparación cualitativa; por tanto, como avanzamos al comienzo del capítulo, no todos los objetos que exhiben la magnitud se pueden medir directamente por comparación cualitativa con un estándar. Aquí es donde entra la medición indirecta. En la medición indirecta asignamos cantidades a los objetos utilizando otras cantidades ya conocidas con anterioridad (mediante medición directa o indirecta) y ciertas fórmulas que relacionan las cantidades involucradas. Ahora vamos a ver sólo los casos de medición indirecta en los que las fórn-iulas que correlacionan los valores expresan leyes naturales, no definiciones de una magnitud introducida a partir de otras. Sobre este segundo tipo de casos ya nos extendimos en la sección dedicada a la metrización derivada; los elementos estructuraIes de los procedimientos de medición indirecta para estos casos se puede colegir fácilmente de lo dicho entonces. La idea central para la caracterización de los procedimientos y métodos de medición indirecta (mediante leyes) es sencilla. Como en la medición indirecta obtenemos el valor deseado mediante otros valores ya conocidos y relacionados con el ignorado de cierto modo, este modo en que están vinculados los valores conocidos y el desconocido es lo que caracteriza el método de medición. Los procedimientos serán casos o aplicaciones concretas de esos métodos: una medición indjrecta concreta, un yroceJi17ziento de niedicióiz ilidirec~a,utiliza cierto modo de obtener el valor desconocido a partir de los conocidos, modo en el que puede coincidir con otras mediciones concretas conformando así un procedimiento general, un inétodo de inedición iildirecta. Por ejemplo, los diferentes casos concretos de medición de distancia mediante triangulación, independientemente de los diferentes datos que se manejen en cada caso, coinciden en que obtienen la distancia desconocida entre dos puntos con la ayuda de un tercer punto, con las nuevas distancias y ángulo conocidos, y de cierta Iey geométrica que relaciona todos estos valores y que proporciona, por tanto, el modo de obtener mediante cálculo el valor deseado a partir de los otros ya conocidos. Lo mismo ocurre con las diferentes mediciones de la masa de cuerpos celestes mediante desviación de la trayectoria de un proyectil controlado. O con las mediciones de la masa de cuerpos de tamaño medio mediante un dinamómetro. Y análogamente en los restantes casos de medición indirecta. Si ésta es la idea intuitiva, la caracterizricjón formal de los procedimientos y métodos de medición indirecta es senc~lla.¿Qué entidades van a representar los procedimientos concretos de medición indirecta? La respuesta está implícita en la caracterización intuitiva. Lo que hace a esos sistemas apropiados a fines de inedición es que "contienen" cierto vínculo entre el valor a medir y otros valores ya conocidos. Puesto que no nos ocupamos ahora de relaciones definicionales, ese vínculo es irit hecho físico, una relació~~ real entre los diferentes valores involucrados, esto es, una ley de la naturaleza. El mejor
modo de representar estos sistemas, de acuerdo con el enfoque semántica que veremos en el capítulo 10, es en términos de modelos. De momento nos basta una noción intuitiva de modelo de una teoría T como aquellos sistemas reales, formados por objetos y propiedades estudiados por T. en los que rigen las leyes de T(p.ej., en la mecánica, el sistema solar, o el sistema Tierra-Luna, o un cohete acercándose a la Luna, o un cuerpo suspendido de un muelle, etc.). Así, puesto que los modelos de las teorías cuantitativas contienen o expresan las leyes de la naturaleza usadas en los procedimientos de medición indirecta, estos procedimientos se pueden identificar por tanto con modelos de cierta teoría que satisfacen ciertas constricciones adicionales. No vamos a ver aquí en detalle las constricciones adicionales que han de cumplir los modelos de una teoría T para ser modelos de medición indirecta. En general, las constncciones se expresarán mediante cierta fórmula J3que deberin satisfacer los modelos de T y que permite determinar (con cierto grado de unicidad) el valor desconocido. La caracterización es en realidad un poco más complicada puesto que es posible que en la medición del valor sino leyes-puente buscado se usen leyes que no son estrictamente leyes de T (sólo de 0, entre T y otras teorías; esto es, es posible que en la medición entren indirectamente en juego modelos de otras teorías. A veces se puede reducir el caso complejo a una combinación de casos simples cada uno de los citales involucra sólo modelos de una teoría, pero la existencia de leyes-puente genuinas hace que no siempre se pueda proceder así (cf. la noción estructuralista de vírzclrlo itltei-teórico introducida en la sección 5 dzl capítulo 10). Ignoraremos provisionalmente estas complicaciones adicionales y presentamos la caracterización gzneral de procedimiento de medición indirecta sólo para los casos más simples, esto es, relativizada a una única teoría T. Así simplificada, la caracterización es, en líneas generales, la siguiente. Un procedimiento de medición directa determina el valor de una niagnitud 1b1 para un objeto a , M(a), usando valores conocidos de otras magnitudes Mi, ..., M, para a , o de LCI y M,, ..., M, para otros objetos a , , ..., al (o ambas cosas a la vez). En el caso más sencillo, en el que se usa una ley de una teoría, el procedimiento es un modelo de la teoría, que contiene entre sus funciones ICI y M I , .... Al,, y que es ampliado de cierto modo mediante R,, ..., R,>, los procedimienvalores destacados. Así, si los modelos dz T son del tipo a, tos de medición indirecta se pueden representar del siguiente modo:
PMI Un procediinienro de medicióiz indirecta. relativamente a T, de M(a) mediante !Mi, ...,M,,, ni, ..., ak,es una estructura del tipo <D,R,, ...,R,, a , ni, ..., aa> (f71 L n) tal que: (1) a, RI, ..., R,,> es un modelo de (al menos algunas leyes de) T. (2) a, a l , ..., nkson objetos de D. (3) hf,M , , ..., M,, se encuentran entre R,, ..., R,. (4) h,l(a,), ..., M ( d , M,(a), MI(a1).,., I\li(fli), ..., Mn(a), l\f"(Cz,)..., lbI"(0k) determinan unívocamente M(a) en d. R i , ..., R,>. Un procedimiento de medición indirecta es pues un modelo de cierta teoría, un sistema que satisface determinadas leyes de la teoría, ampliado con ciertos valores desta-
213
FLSD.451ESTOS DE FILoSOF~.L\ DE LA CIESCIA
cados que determinan el valor a medir; estos valores pueden ser, tanto de la misma magnitud para otros objetos, como de otras magnitudes para el objeto en cuestión además de para esos otros objetos. En realidad, en la determinación de M(a) no intervendrán todos los valores de todas las magnitudes destacadas para todos los objetos destacados, pero expresarlo así de modo preciso supone una complejidad notacional adicional considerable. Por ejemplo, en la medición indirecta de la masa de la Luna (1) mediante su acción mecánica sobre un cohete (c) enviado a sus proximidades, el valor a medir 111(I) se obtiene a partir de la masa conocida del cohete ni(c) y de las trayectorias conocidas de la Luna y del cohete, esto es, de los valores para ambos objetos de la función posición S durante cierto intervalo de tiempo t 2 - r,. A partir de m(c) y de los valores S , ( / ) y s,(c) (las trayectorias de ambos objetos durante t2 - r,) se puede obtener 1í1(1) suponiendo que cl sistema Luna-cohete satisface ciertas leyes mecánicas, al menos los principios de Newton y ]a ley de gravitación universal, esto es, que el sistema es modelo de (al menos algunas leyes de) la mecánica clásica. Éste es pues el esquema general de los procedimientos de medición indirecta. Así dice muy poco, y el análisis es filosóficamente interesante cuando se desarrollan sus detalles, pero no podemos hacerlo aquí (un análisis detallado en esta línea puede encontrarse en Balzer, 1985). Concluiremos con tres comentarios adicionales. En primer lugar, el análisis de la medición indirecta hace explícito el sentido principal en que los datos empíricos están cargados de teoría. Puesto que la medición indirecta no sólo es la más común en la ciencia, sino la única en procedimientos sofisticados de contrastación que involucran predicciones cuantitativas, los datos de estas contrastaciones dependen esencialmente de la validez de las leyes que se usan para su determinación. Pero veremos más adelante que, aunque a \.eces se ha sostenido lo contrario, esta carga teórica de los datos no socava la legitimidad empírica de las teorías. Sobre esta cuestión nos extenderemos en los capítulos 8, 9, 10 y 12. En segundo lugar, desaparece ahora cierta extrañeza que podía haber suscitado el análisis de la medición directa. El lector atento habrá advertido entonces que la medición directa sólo genera fracciones de los valores asignados a los estándares. Eso no quiere decir que sólo genere como valores número racionales, pues los valores asignados a los estándares pueden ser irracionales. Pero sí que, si a los estándares se les asigna racionales, o enteros como de hecho se hace en las escalas usuales, la medición directa sólo generaría valores racionales. Y sin embargo, aun usando en la práctica científica valores enteros para los estándares, la ciencia maneja usualmente valores irracionales. Nada hay de extraño en ello pues la medición directa es sólo uno de los modos de realizar asignaciones. Aunque ella genere sólo valores racionales, a través de la medjción indirecta obtenemos valores irracionales por efecto de las relaciones cuantitativas contenidas en las leyes (cf. Hempel, 1952). Por último, mencionaremos un fenómeno común en la medición que, aunque no suele tener consecuencias prácticas importantes, es conceptualmente interesante. Se trata de lo que a veces se ha llamado fallos sistentáticos (cf. p.ej. Balzer, op. cit.,cap. 5). Este fenómeno consiste, descrito en general, en que algunas veces los procedimientos para medir la magnitud de un objeto modifican dicha magnitud. Por ejemplo, al medir median-
te u n dinamómetro la fuerza de atracción gravitatoria de un objeto a una distancia d del centro de la Tierra, el valor finalmente obtenido en el punto de equilibrio no es el correspondiente a esa magnitud para la distancia d sino para otra distancia d' menor (debido a la elongación del muelle), siendo ambos valores diferentes. O al medir la temperatura de un líquido mediante un termómetro el valor obtenido no es la temperatura antes de introducir el termómetro sino después, una vez se han equilibrado la temperatura del liquido y fa del tert;tórnetro; ambos valores pueden no coincidir, de hecho no coinciden salvo que el termómetro estuviera ya a la temperatura del líquido. Como hemos indicado, las consecuencias prácticas de este fenómeno son casi siempre (pero sólo casi siempre) despreciables, pues ambos valores apenas difieren. Pero aunque a la mayoría de efectos prácticos se puedan identificar, eso no elimina el hecho de que son valores diferentes. Se trata pues dz fallos de medición, en el sentido de que el valor medido no coincide con el realmente buscado. Pero son también fallos sistemáticos, esto es, responden a una regularidad natural y son por tanto corregibles. Haciendo la medición un poco más larga, siempre podemos ir de los valores obtenidos a los realmente buscados mediante leyes físicas adicionales.
7. Consideraciones finales
1. A lo largo de este capítulo nos hemos ocupado de la medición como representación cuantitativa de magnitudes, propiedades que las cosas ejemplifican según un m6s y un rnenos. Pero en la ciencia parece haber otra clase de deter~nirtaciónttionérica. Se trata de la "medición" de las constantes universales. Antes que nada conviene aclarar lo que las constantes universales no son. Ko son valores de ciertas magnitudes destacadas para ciertos objetos destacados. Contrariamente a lo que a veces se sugiere (cf. Krantz et al., 1971, tabla de la página 457), valores como la masa de la Tierra, la masa o la carga del electrón, etc., no son constantes universales. Obviamente lo son en un sentido trivial, la masa del electrón es constanre, la masa de la Tierra es (más o menos) constante; pero en ese sentido la masa de la corona de la reina de Inglaterra también es una constante universal, pues también es (más o menos) constante. Las verdaderas constantes universales, como la gravitacional (G = 6,67 x cm3/gr . S'), la de los gases (R = 8,3143 x 1 0 ' er,o/mol-gr . O K j o la de Planck (h = 6,626 x lo-'' erg . S ) , no son de este tipo. Estas constantes son valores numéricos que intervienen en ciertas leyes naturales pero, a diferencia de otras mal llamadas también constantes que vimos en la sección 4 (coeficientes de dilatación, conductancias, etc.), no dependen de ningún cuerpo o material. No son pues valores que correspondan a ninguna magnitud y por tanto. aunque se determina su valor numérico, no se lnidetz en el sentido estricto del término. Es cierto que tienen dimensiones, y por ello, en función de qué escalas usemos para las magnitudes de las dimensiones, el coeficiente numérico de estas constantes puede variar (p.ej. h = 6,626 x lo-" jou1.s; por supuesto que eso no las hace menos constantes ni menos universales). Pero esas dimensiones no corresponden a ninguna magnitud. son simplemente producto de exigir la coherencia dimensional a las leyes en que aparecen. 2. Hemos dicho que la medición indirecta "completa" a la directa asignando
2 16
F L N D ~ I I E ~ T ODE S FILOSOFIA DE LA CIENCIA
valores a objetos que exhiben la magnitud pero a los que no se les puede asignar valores mediante comparación directa con estándares. Ahora bien, esta afirmación supone un hecho adicional no explicjtado hasta el momento, a saber, que "lo" medido indirectamente, mediante las leyes, es lo mismo que "lo" medido directamente a partir de sistemas puramente cualitativos. Brevemente: ;por qué lo medido directamente mediante una balanza es la masa, es esa cosa de la que habla la Mecánica Clásica? Análogamente con la temperatura. Desde luego que en la medición directa medimos alguna magnitud, pero ¿por qué es la misma magnitud que aparece como función numérica en los modelos de cierta teoría cuantitativa? Eso indica que nuestro análisis de la medición directa es incompleto. Hemos caracterizado los procedimientos y métodos de medición directa en general, pero no los procedimientos y métodos de "medición directa de la magnitud M". Para ello es necesario hacer explícito el vínculo entre ciertos procedimientos de medición directa y la teoría cuantitativa que incluye la función métrica M. El vínculo consiste, básicamente, en que el sistema cualitativo que constituye el procedimiento de medición directa satisface las leyes de esa teoría, es uno de sus modelos. Intuitivamente: lo que medimos con la balanza es la masa de la Mecánica porque la balanza satisface las leyes mecánicas, es un. modelo de esa teoría. La cosa no es tan simple pues ios modelos de la teoría son cuantitativos y 10s sistemas comparativos de los PMD son cualitativos. Expresar que el PMD satisface las leyes de la teoría requiere algunas complicaciones que no podemos discutir aquí (cf. Díez, 1994a), pero la idea es exigir determinados requisitos de coherencia entre 10s órdenes cualitativos y los valores numéricos que tienen los objetos del dominio de comparación en los inodelos cuantitativos de la teoría en cuestión. En el capítulo 10 ( $ 5 ) veremos que éste es el motivo por el que la masa, a pesar de poder medirse mediante procedimientos de medición directos, debe considerarse lo que allí llamareinos "mecánico-dependiente", esto es, la masa es tal que su determinación o medición presupone siempre la aplicación de alguna ley de la mecánica. 3. Por último, y después de este largo recorrido, ¿qué hay de la ontología de las magnitudes? ¿Son meras propiedades relacionales con condiciones específicas que permiten hablar de ellas cuantitativamente? ¿O existen efectivan-iente"las cantidades"? Aunque la cuestión es muy compleja y requiere una discusión detenida, tendemos a considerar que la posición más natural es la primera. Nada en todo este recorrido parece requerir la existencia objetiva de esas entidades cuantitativas; podemos dar cuenta de todo lo referente a la medición partiendo exclusi~amentede propiedades relacionales cualitativas. Esta tesis se ve reforzada por el elemento de arbitrariedad contenido en la cláusula (3) del esquema PMD, a saber, nada hay en el mundo que exija elegir entre diferentes tipos de representación cuantitativa (aditiva. multiplicati~~a, etc.), eso sólo depende de nuestras prácticas convencionales. Si reescribiéramos toda la física con, por ejemplo, representaciones multiplicativas de las métricas combinatorias (masa, longitud, duración, etc.) la forma cuantitativa de todas las leyes físicas cambiaría, pero el "contenido" sería el mismo. La interpretación más natural de ello es que ese contenido, lo que se dice realinente del niundo, es puramente cualitativo. Dicho esto, por supuesto, no hay ningún reparo en Ilainar cuanritatii!as a esas relaciones que satisfacen las condiciones empíricas suficientes para dejarse representar numéricamente. La cuestión permanece la misma: desde esta
perspectiva "relncionril", las relaciones dc comparación son lo básico y las "cantidades7' lo derivado. El partidario de la perspectiva no relaciona1 ve las cosas al revés, lo básico son las cantidades, y ellas expIican que se den ciertas relaciones de comparación. Nuestra posición es que IL? prinlera postura es metafísicamente más conservadora y que nada exige optar por la segiinda. Por tanto, el conservadurismo ontológico general deseable en filosofía hace preferible la perspectiva relacional.
1. Explicación y explicación científica
En el capítulo 3, donde estudiamos la metodología de la contrastación de hipótesis, vimos en los diferentes episodios históricos que las hipótesis sometidas a contrastación se introducían siempre para dar cuenta de determinados hechos; por ejemplo, un extremado crecimiento de mortandad infantil en una división de un hospital, una determinada distribución y forma de las placas de la corteza terrestre, el movimiento aparente de los astros, etc. Este "dar cuenta" es lo que en contextos metacientíficos queremos significar con el término 'explicar'. La ciencia, como se dice usualmente, no sólo describe sino que también explica,no se preocupa sólo del qué sino también del porqué. Esta dimensión explicativa, sin embargo, no es exclusiva de la ciencia. Gran parte de nuestro conocimiento del mundo es explicativo y la ciencia es simplemente el lugar donde dicho conocimiento encuentra su máxima expresión. Considerar el carácter explicativo como algo específico del conocimiento científico convertiría en científicas afirmaciones que usualmente no tomamos por tales, p.ej. "el auto se salió de la carretera porque había hielo en la calzada" o "Juan no vino a la fiesta porque se confundió de día". Esta cuestión es en parte sólo nominal, pues hay un continuo entre el conocimiento ordinario y el científico; podría considerarse que las explicaciones ordinarias corresponden a determinadas protociencias, en los ejemplos mencionados, a cierta protofisica la primera, o a cierta protopsicología la segunda. El límite es difuso, y hasta cierto punto arbitrario, pero todos reconocenios casos claros en que no calificamos una explicación de científica y casos claros en que sí. En este sentido mínimo de la distinción, el carácter explicativo no es exclusivo de la ciencia, también proporcionamos explicaciones en contextos ordinarios no científicos. Por otro lado, no sólo el carácter explicativo no es exclusivo de la ciencia, sino que tampoco es propio de toda ella. Ni sólo la ciencia es explicativa, ni toda la ciencia lo es. Ciertas disciplinas científicas, o partes de ellas, no son explicativas, al menos no lo son pritna facie. Ello es así típicamente en las disciplinas clasificatorias, por ejemplo en las taxonomías zoológicas o botánicas, aunque es cierto que las taxonomías se pueden integrar posteriormente en Corpus disciplinarios más amplios que sí son explicativos.
220
'
iTSD.L\31E\TUS DE FILOSOF~L\ DE LA CIENCIA
En estas consideraciones sobre la naturaleza explicativa de la actividad científica estamos entendiendo el término 'explicar' en un sentido específico. Las palabras castellanas 'explicar' y 'explicación' son parcialmente polisémicas y no todas SUS acepciones tienen que Yer con la noción de esplicaciórl que aquí nos interesa. Estas expresiones unas veces significan simplemente la narración de cierto suceso ("Pedro le explicó a Laura su viaje a la India", "explícale al policía lo que sucedió"). Otras el adiestramiento en ciertos procedimientos para alcanzar un fin ("Juan le explicó el funcionamiento de la cámara fotográfica", "el mecánico me ha explicado cómo reparar un pinchazo"). 0, relacionado con el anterior, la presentación de las reglas que rigen una determinada actividad colectiva ("Ana quiere que le expliques el reglamento del basket", "aquel invitado estúpido necesita que le expliquen cómo comportarse en una boda"). A veces se usan en el sentido de comunicar o explicitar el significado de una palabra ("mi primo físico me ha explicado el significado de 'espín"', "tuve que explicarle lo que quería decir 'insidioso"'). Este último uso da lugar a otro que tiende a ser específicamente filosófico, en el que 'explicar' tiene el sentido de elucidar un concepto o una distinción conceptual. Así lo usamos cuando decimos, por e.jemplo, que Frege dio una explicación del concepto de número, que Carnap la dio del de probabilidad, o que Kant explicó la diferencia entre alzalítico y siizlético. Este uso es un caso del anterior en el sentido de que elucidar ciertos conceptos no es sino establecer los aspectos fundamentales del significado de las palabras que los expresan. Este uso se puede generalizar y aplicarse a la presentación o elucidación de un problema o cuestión conceptual ("en el examen teníamos que explicar la paradoja de Russell", "hoy toca explicar el problema de los universales"). Para el sentido de 'explicar' como elucidación de un concepto, la jerga filosófica inglesa dispone de un término específico, 'explicariorz' (que a veces se aplica en general a la explicación de cualquier significado), mientras que para los restantes usa la misma expresión, 'explanatiorz'; la voz castellana 'explicación' traduce pues ambas expresiones inglesas. Éstos son los principales sentidos de 'explicación' en los que no nos vamos a detener. Además de ellos, hay otro sentido de 'explicar' que es el que aquí nos interesa, aquel que, aunque presente también en ciertos contextos ordinarios, es particularmente importante en los contextos científicos. Casos paradigmáticos de este uso son los siguientes: "el extremado descenso de las temperaturas explica que las cañerías de casa se ron~pieran","la fuga radiactiva explica las malformaciones genéticas en las poblaciones próximas a Chernobil", "que consumiera cuatro paquetes de cigarrillos diarios explica que Luis muriera de cáncer de pulmón", "la mecánica gravitatoria celeste explica las órbitas elípticas de los planetas", "la polarización de la luz se explica por su naturaleza corpuscular". Aunque haya diferencias importantes entre ellos, todos estos casos comparten algo. Qué es lo que comparten, y también en qué difieren, es lo que vamos a ver en este capítulo. El objetivo es pues dar una "explicación" (en el sentido del inglés 'explicatio~z') del concepto de explicaciór~ejemplificado en estos casos paradigmáticos; en realidad, más que proponer una, presentaremos y comentaremos las principales elucidaciones que se han propuesto. A partir de ahora, mientras no se indique lo contrario el término 'explicar' y sus derivados se entenderán siempre en el sentido ejemplificado por estos casos. Aunque no podemos presentar ahora un análisis preciso del concepto de explica-
ción, pues ésa es la tarea de las próximas secciones, sí es posible una primera aproximación intuitiva o preteórica al mismo. Según esta primera aproximación, lo que comparten estos ejemplos es que todos ellos podrían constituir respuestas a cierto tipo específico de preguntas, a preguntas del tipo ''¿por qut? ...?". ";Por qué se rompieron las cañerías de casa?" "Por el extremo descenso de las temperaturas." Análogamente en los demás casos. Si llamamos 'P-preguntas' a las preguntas de ese tipo, las explicaciones de las que estamos hablando parecen caracterizarse por ser susceptibles de constituir respuestas a P-preguntas. Insistimos en que no queremos con ello dar un análisis preciso y sustantivo de la noción. Como veremos, uno de los análisis propuestos explota esta idea desarrollándola en una dirección específica, esto es, propone que toda explicación es una respuesta a una P-pregunta en un sentido muy específico de 'respuesta' y de 'P-pregunta'. No queremos hacer eso aquí, ni prejuzgar la adecuación o no de tal análisis. Caracterizar preteóricamente el tipo de explicación contenida en estos ejemplos como respuestas a P-preguntas es únicamente un modo de expresar las intuiciones mínimas sobre el contraste entre este concepto de explicación y los restantes. En una primera aproximación, las explicaciones son pues respuestas a preguntas ''¿por qué?". Esto se debe entender por el momento en un sentido amplio. En primer lugar porque, como se ha indicado, no se pretende de momento ningún desarrollo específico filosóficamente preciso de esta idea. Pero, en segundo lusar, porque la idea genérica no se corresponde tampoco siempre con la forma gramatical específica de ese tipo de enunciados. Ni todos los enunciados interrogativos con la forma gramatical ''¿por qué ...?" requieren como respuesta una explicación del tipo indicado, ni sólo ellos las requieren. Muchas veces estas preguntas tienen un sentido retórico (''¿por qué tengo que seguir aguantando tus impertinencias?"), o desiderativo ("¿por qué no somos todos más tolerantes?"), o exclamativo (''¿por qué has tenido que estornudar justo cuando estaba grabando?"), u otro. En casos como éstos, aunque la oración tiene la forma interrogativa, el acto de habla no consiste propiamente en la formulación de una pregunta, sino la expresión de una afirmación ("no pienso seguir aguantándote"). un deseo ("ojalá todos fuéramos más tolerantes"), una queja u otras cosas, órdenes, solicitudes, propuestas, etc. En otro tipo de casos, mediante la oración se expresa propiamente una pregunta, pero la cláusula 'por qué (no)' es superflua, no añade nada (''¿por qué no venís a cenar el sábado?"; estos casos se parecen mucho a aquellos de los anteriores en los que se expresa una propuesta). Por último, en otros casos la oración interrogativa expresa una pregunta y la cláusula 'por qué' no es superflua, pero la respuesta que requiere no es una explicación en nuestro sentido sino una "explication", esto es, una elucidación o análisis (''¿por qué los contextos de creencia son intensionales?", ''¿por qué las leyes científicas no son meras generalizaciones?"). Éstas son las principales excepciones, aunque la pragmática de las preguntas ''¿por qué?", y de sus respuestas, es muy compleja y puede haber otras excepciones en contextos específicos. Así, en general, no todo enunciado interrogativo que incluye la cláusula 'por qué' expresa propiamente una pregunta que requiera explicación; pero si tal enunciado expresa una pregunta y la cláusula no es superflua, la pregunta en cuestión requiere por lo general como respuesta una explicación. Por otro lado, algunas preguntas que requieren una explicación como respuesta
no se expresan mediante enunciados interrogativos que incluyen cláusulas 'por qué'. El caso más destacado es el de las preguntas "¿cómo?", p.ej.: "¿cómo cogió Pedro el cólera?", "¿cómo te saliste de la carretera?", "icorno aparecieron los primeros seres vivos no acuáticos?", "¿cómo pueden volar los aviones?". Aunque estos enunciados interrogativos no incluyan cláusulas 'por qué', las preguntas que expresan se pueden considerar P-preguntas en el sentido amplio, pues las respuestas que requieren sí incluyen la cláusula 'porque' u otras análogas. Es cierto que también se pueden responder sin estas cláusuIas, p.ej. a la primera pregunta se puede responder "porque comió fruta sin pelar en la India", pero también simplemente "comió fruta sin pelar en la India". Lo que las hace P-preguntas en sentido amplio es que, aunque a veces se suprima dicha cláusula, sus respuestas apropiadas típicamente se expresan de la forma "porque ...". Esto es lo que hay detrás de la idea de que las explicaciones son respuestas a P-preguntas: son respuestas que se pueden expresar adecuadamente incluyendo cláusulas del tipo 'porque'. Por supuesto que todas estas características semiformales no son las deterrninantes, simplemente son el trasunto gramatical de hechos más profundos. Si las respuestas incluyen esas cláusulas es porque mediante ellas se da t-acón o sept-opol-ciona con~prerisión de algo. Ésos son los hechos más profundos, que ahora sólo mencionamos en un sentido muy genérico e impreciso. Especificar la naturaleza última de esos hechos, determinar el sentido exacto en que las explicaciones dan razón de ciertas cosas, es justamente la tarea de los análisis del concepto de explicacióiz que vamos a ver. El análisis de la explicación se remonta prácticamente a los inicios mismos de la filosofía. En la Antigüedad el precedente más notorio es Aristóteles, aunque ya en Platón se encuentran consideraciones de interés. La famosa teoría aristctélica de las cuatro causas o aitíai (material, formal, eficiente y final) es a la vez, o incluso primariamente, una teoría de la explicación (cf. p.ej. Ruben, 1990, cap. 3, y más abajo $4 los comentarios de van Fraassen al respecto). La palabra griega 'aitía' suele traducirse por 'causa', pero en Aristóteles parece significar primariamente una respuesta a una pregunta ''¿por qué?", hay tantas airíai como maneras de responder a esas preguntas (cf. Física, 11, 198 a 15). A la hora de explicar un cambio, su "por qué", podemos apelar a la materia constituyente, a la forma que se actualiza, al agente productor o a la finalidad del cambio (coincidiendo las tres últimas respuestas en los cambios naturales). No vamos a detenemos aquí en los detalles de la teoría aristotélica, íntimamente vinculada al resto de su física y de su metafísica. Aunque esta teoría ha sido muy influyente a lo largo de la historia de la filosofía, y partes de la misma lo continúan siendo en la actualidad, los análisis contemporáneos de la noción de esplicación se plantean en términos más afines a la investigación metacientífica general. Dentro de la filosofía de la ciencia, el punto d e partida de los estudios sobre la explicación científica se sitúa a finales de los años cuarenta con el trabajo fundacional d e Hempel y Oppenheim (1948). Aunque anteriormente autores como Mil1 y Popper habían realizado algunas contribuciones de interés, es en ese artículo, y en otros trabajos posteriores de Hempel que le siguen, donde por primera vez se aborda el tema de modo específico y se realiza un análisis detallado del concepto de explicación. En estos trabajos se establecen los términos en los que se va a desarrollar el debate posterior y se presenta una
propuesta en relación a la cual se van a posicionar las diferentes alternativas. La obra de Hempel es pues fundamental, proporciona los fundamentos tanto metodoló,'~ I C O Scomo conceptuales. Comenzaremos por tanto nuestro estudio con la presentación del análisis hempeliano del concepto de explicación (cient$ca) y veremos después las principales modificaciones y alternativas al mismo. En la presentación de los diversos análisis vamos a seguir aproximadamente el orden cronológico de aparición de los mismos. La función de esta revisión no es simplemente ir yuxtaponiendo diferentes teorías de la explicación conforme van apareciendo. Como en otros lugares de esta obra, en la medida en que la revisión conceptual de un tema sigue el desarrollo de las propuestas que históricamente se han dado, es porque la historia tiene algo que enseñamos. Como señalamos en el prólogo, en estos ámbitos Ias propuestas históricamente primeras no lo son en vano. Son las primeras, en cierto sentido, casi necesariamente, pues recogen las intuiciones más inmediatas y las expresan de la forma en principio más sencilla o natural, y las alternativas posteriores se encargan de corregir las eventuales deficiencias, poner de manifiesto aspectos más profundos y, si es necesario, reformar algunas de nuestras intuiciones. Pero casi siempre esos aspectos más profundos del problema sólo se pueden apreciar una vez las propuestas originales han comenzado a limpiar el terreno. Estas consideraciones son particularmente apropiadas en el caso de la explicación científica. Para poder apreciar cabalmente la naturaleza de los análisis más recientes es necesario comprender antes el núcleo de la propuesta hempeliana, y ver entonces en qué medida las modificaciones posteriores conservan o no dicho núcleo conceptual. En la próxima sección examinaremos el modelo de cobertura legal de Hempel y en las próximas, sucesivamente, el de relevancia estadística, el pragmático, el causal y el de unificación y subsunción teórica. Puesto que el espacio no permite una revisión exhaustiva, tras la exposición detenida del modelo de Hempel y de las principales cuestiones que abre, nos limitaremos en los siguientes a presentar los principales puntos de contraste (para un estudio detallado, cf. especialmente Salrnon, 1989; cf. también Kitcher, 1989; Ruben, 1990 y Sintonen, 1989). Los diferentes análisis son parcialmente contrapuestos y parcialmente complementarios. No son acumulables sin más, tampoco son alternativas que simplemente se aplican a diferentes casos. Cada uno surge como corrección conceptual, al menos parcial, a otros y con vocación de exclusividad. En la actualidad las espadas siguen en alto entre las dos principaIes alternativas, el modelo causal y el de unificación, y es una cuestión abierta si son integrables de algún modo. En la última sección nos ocuparemos brevemente de las explicaciones funcionales y teleológicas, que durante mucho tiempo han sido motivo de perplejidad; veremos un análisis de las mismas, el de L. Wright, que resuelve tal perplejidad. Antes de iniciar el análisis es preciso destacar un hecho general relativo a la explicación que conviene tener presente, incluso aunque en muchos de los análisis que vamos a ver no desempeñe un papel principal. Se trata del carácter irtrensiorlal de la explicación. Recuérdese (cf. cap. 3 S 1) que un contexto es intensional si no esta garantizada la sustitutividad salva verirare, esto es. si en él la sustitución de una expresión lingüística por otra que denote la misma entidad puede alterar el valor veritativo. Pues bien, el contexto '... explica - - -' es intensional. Por ejemplo, supongamos que el lechero del
224
FUNDA\~E'\TOS DE FILOSOF~ADE M CIENCIA
barrio es el amante de la mujer de Pepe, y que Pepe lo sabe. Y supongamos también que alguien, que no sabe que el lechero es el amante de la mujer de Pepe, nos pregunta por qué Pepe se pasó todo el día de mal humor. En ese caso, "porque Pepe se ha cruzado en la puerta de casa con el amante de su mujer" puede ser (en ciertas circunstanciac) una buena expIicación, mientras que "porque Pepe se ha cruzado esta mañana en la puerta de casa con el lechero" puede (en esas mismas circunstancias) no serlo. O supongamos que queremos explicar por qué un beduino, que ignora que el agua es H 2 0 , modifica su ruta para pasar por un oasis. Una buena explicación puede ser "porque tiene sed y en el oasis hay agua", mientras que "porque tiene sed y en el oasis hay H20" no lo es. No vamos a detenemos ahora en esta cuestión, en las secciones 4 y 5 haremos algunas consideraciones al respecto. Para concluir esta sección introductoria introduzcamos algo de terminología específica. En una explicación llamamos 'explanandum' a aquello que requiere de una explicación, y 'explanans' a aquello que proporciona la explicación del explanandum. Todo análisis del concepto de explicación debe dar pues una caracterización precisa del explanandum y del explanans. Pero no sólo de ellos. También debe caracterizar la relación que se da entre ambos. Llamaremos 'relación explicativa' a aquella relación que, por darse entre el explanans y el explanandum, hace que podamos considerar que el primero explica al segundo. Todo análisis debe caracterizar estos tres elementos: explanandum, explanans y relación explicativa; como veremos, los diferentes modelos alternativos se diferencian en su análisis de alguno de estos elementos. Aunque el objeto principal es la explicación científica, por los motivos indicados más arriba la discusión hará referencia a veces a explicaciones ordinarias pre- o protocientíficas, especialmente cuando sean fuente de intuiciones muy firmes.
2. Cobertura legal inferencia1
En Hempel y Oppenheim, 1948, se presenta el núcleo del análisis de la explicación que Hempel va a desarrollar posteriormente, principalmente en los años sesenta (Hempel, 1962, 1965, 1966a, cap. 5, y 1967). La idea básica es que las explicaciones son argumetzros en los que el expla1zar7dunise ilifiel-e del explanans. Hempel insiste en que esta idea no es original, y efectivamente sugerencias en este sentido se pueden encontrar al menos en Aristóteles, Mill, Campbell y Popper. Lo que sí es original es el desarrollo específico de la misma, que como dijimos constituye el primer análisis completo y preciso de la noción de explicacióiz. Antes de detenerse en los detalles es conveniente exponer el esquema general y las intuiciones que lo inspiran.
GENERAL DE LA EXPLIC.ACI~NMEDIANTE COBERTURA LEGAL INFERENCIAL 2.1. FORMA
Una explicación constituye una respuesta o solución a cierta situación de perplejidad. Lo que reclama explicación son hechos que en algún sentido nos causan perplejidad o
sorpresa. por ello preguntainos el porqui de los mismos: nos preguntamos por 13 explicación dc cosas cti cicrto setitirlo inesperada.. Por supuesto que podemos buscar explicación de hechos perfectaniente cotidianos que en ese sentido no son inesperados sino todo lo contrririo. Por ejemplo, queremos explicar por qué el Sol aparece todos los días en el horizonte. o por qué la Luna carnbia su apariencia. En un sentido, estos hechos no son inesperables, no nos causan sorpresa; mis bien lo sorprendente sería que el Sol no apareciera una mañana en el horizonte o que la Luna mostrase el mismo perfil una semana se_c~~ida. Pero hay otro sentido en el que jí son "sorprendentes" o "inesperados", a saber, mientras no tenemos explicación de los mismos, sabemos que pasan y creemos que seguirlín pasando, pero no tenemos moti~.opara justificar nuestra creencia: "¿,por qué pasan n15s bien que dejan de pasar?". "segiiro que el sol saldrá mañrinii, o eso creo, pero por todo lo que s i no hay n1otit.o para ello, es sorprendznte que de hecho niañana salga otra vez". Ésta es la idea que inspira el anilisis de Hsn~pel.Si una explicación es una respuesta 3 iin;l situación de este tipo, entonces la esplicaciGn de cierto hecho, "inesperado", consiste en nlostrar que se dan otros hechos que hacen rsperclble' la ocurrencia del primero. Así. In intiiición que quiere recoser Hempel es que en una explicación el explanans hace esperable el explananduni. Par:! hacer precisa esta intuición se debe especificar el sentido exacto en que el espl:innns ha:: esperable el esplanandum y el candidato mLís inmediato para la relación de "esperabilidad", el que toma Hempel, es la reltición de inferencia lógica: ciertos estados de cosas hacen espernb!? otro si el sesundo "esta contenido" en los prin~erossonsiderndos conjunr~inieiitz.E s ~ i i ~ ela rsegundo consiste en niostrar que efectivamente estii contenido en 10s priiiieros. .Así, el esplanans hace esperable el esplaniinduni en el sentido przciso de qu: del espliirians 5 2 infiere el esplanandum. Las esplicucio~iesson argiinientos en los que infiere el hecho a esplicar de los otros hechos que lo explican. Éste es el núslro del nnilisis hen~psliano.O nisjor. la parte 1115s bisica del mismo, pues Heiiipel añade i!n;i condición general para poder considerar iin argumento como esplicación. No toda inferencia constit~iytuna explicación. La condición adicional es que en el esplanrins in:erveriga al menos un hecho general de cierto tipo. Consideremos uno de los ejemplos iuencionados: "el extremo descenso de las temperaturas explica que las cañerías de casa se rompieran". Aquí, aparcntementc el esplanandum, la rotura de las cañerí~isde c ~ ~ s ano. se infiere del exp1an:ins (explícito:). el extremo descenso de las temperaturas. Si a pesar de eso Iri consideramos una explicación legítima es porque consideramos que el esplanaris incluye elíptica o implícitamente hechos adicionales, e s unii forniiilrición incompleta dz la a~itinticaexplicación. La esplicación completamenie formulada sería aproximadamente la siguiente: "111 rotura de las caíierírts de casa se esplica por cr) el dzscenso extremo de 111 temperatura, b ) las cañerías ds casa estaban llenas de agua, c) el extremo descenso dc la teniperatilra consela el agua y ciiando se congela el agua de las cañerías éstas se rompen". Ésa es la esplicación completa y, ahora sí, el explananduni ! . < . r , ~ ~ ~ r ( l l ~ ipor l i ~ \'espernble' .. y 'tspt1. Traducircinos. a frilt:i dc inrljor 31ter112:iia. .t,.r/~~(.r(ll~l~,. r.lbi!id;!d'. Sc'rí~flltllo: forzado usar 'prc'\.isiblt'. Fe;.) no c's a~onstj2blcpor su connotación temporal.
se infiere (deductivamente) del esplanans a) - d?. Y el explanans contiene al menos un hecho general, exactamente dos en este caso, c) y d). Se objetará que para que el explanandum se infiera del explanans no es preciso q u e el conjunto de las premisas, el explanans, contenga un hecho general. En efecto, supongamos que si viene Juan a la fiesta entonces no viene Rosa, y supongamos además que de hecho viene Juan. De estos hechos, ambos particulares, se infiere la no asistencia de Rosa a la fiesta. Hempel reconoce por supuesto la validez de la inferencia, pero rechaza que en tal caso el argumento constituya una explicación. De la premisa de que las pompas de jabón primero crecieron y después disminuyeron se infiere que las pompas de jabón primero crecieron, pero "es evidente que [esta inferencia] no puede considerarse una explicación de por qué las pompas de jabón primero crecieron, []]a misma observación se aplica a todos los otros casos de esre tipo" (1965. 52.1; cursivas nuestras). Hempel no da un argumento general al respecto y simplemente presenta como obvio que en todos esos casos, incluido por tanto el de nuestra fiesta, no se puede hablar de explicación. Aunque la cosa no es quizá tan obvia, la idea que hay detrás es que los casos en los que aparentemeiite todas las premisas son particulares y aun así parecen constituir propiamente una explicación, son argumentos que esconden en realidad subrepticiamente algún hecho general. Por ejemplo, si el caso de nuestra fiesta nos parece propiamente una explicación, es seguramente porque se interpreta de uno de los tres modos siguientes. A) La primera premisa no se interpreta meramente como el condicional material "si va Juan no va Rosa", sino como un condicional general? a saber, "siempre que va Juan nunca va Rosa". B) La primera premisa se interpreta como un hecho particular pero causal, e.e. "que vaya Juan hace que no vaya Rosa"; en este caso también hay generalidad, aunque ahora encubierta, pues las implicaciones causales particulares se fundamentan en hechos generales (nómiCOS).C) La primera premisa se interpreta como el siguiente condicioi~almaterial particular: "si Juan va entonces Rosa no piensa (no tiene la intención de) ir"; pero en este caso para que la inferencia sea válida hace falta como premisa adicional cierto hecho general sobre la relación entre las intenciones de Rosa y SUS acciones. Si no pensamos en ninguna de estas tres interpretaciones es difícil ver el sentido en que la ausencia de Rosa queda explicada, parecería entonces una situación semejante a la de las pompas de jabón. La esperabilidad del explanandum dado el explanans no es por tanto mera inferencia, sino inferencia de cierto tipo: el explanans debe incluir al menos un hecho general. Pero además, añade Hempel, tampoco vale cualquier hecho general, los hechos generales relevantes para las explicaciones han de ser de cierto tipo'. Supongamos que queremos una explicación de que cierta moneda determinada sea dorada. Y supon,uamos que e) esa moneda estaba la Nochevieja de 1990 en el bolsillo derecho de los pantalones de Quine y j ) que en esa noche todas las monedas del bolsillo derecho de los pantalones de Quine eran doradas. De e) y f) se infiere que la moneda en cuestión es dorada, y además f) es un hecho general, pero a pesar de ello no parece que estemos ante una genuina explicación del color de la moneda, esos dos hechos no lo explican. Los hechos generales que incluye el explanans no pueden ser cualquier regularidad, han de ser regularidades izólílicas, ¡ejes naturales. Esta inferencia no constituye una explicación porquefi es una mera regularidad accidental, no es una ley. En el capítulo 5 discutimos
a
i!
2
v
,i f&
la diferencia entre regularidades accidentales y regularidades nórnicas o leyes, y vimos que elucidar y fundamentar dicha diferencia es ciertamente difícil. El propio Hempel discute ampliamente el problema y propone su particular concepción de las leyes (cf. p.ej. Hempel y Oppenheim, 1948, $111, y Hempel, 1965, 752.3). Ahora no vamos a insistir más en este problema (para las referencias que en este capítulo se hagan al concepto de ley bastará remitirse a aquél). Supuesto pues que disponemos de la diferencia entre regularidades accidentales y leyes, la condición adicional que exige Hempel para que una inferencia constituya una explicación es que el explanans contenga al menos un enunciado general que sea una ley. Por supuesto que la exigencia es que el explanans contenga esencialrnenre al menos una ley, esto es, la ley ha de ser necesaria para la inferencia, el explanandum no se puede seguir del resto de las premisas solas. Eso es lo que ocurre en la formulación completa de la explicación de la rotura de las cañerías, los enunciados generales del explanans son leyes. La idea central es que la esperabilidad siempre ha de ser nómica. Las regularidades meramente accidentales no hacen esperable nada pues son justamente eso, accia'entales. Por eso toda regularidad que intervenga esencialmente en el explanans ha de ser nómica; si en la inferencia interviene esencialmente una regularidad accidental, eso "contamina" de accidentalidad toda la inferencia y la deslegitima como explicación. E.rplicatividad y accidentalidad son conceptos excluyentes. Estamos dispuestos a considerar una inferencia como explicativa, esto es, como "haciendo al explanandum esperable", en la medida en que consideremos que las generalidades quz intervienen son nórnicas. El patrón general del análisis de Hempel es pues el siguiente:
(1) El explanans contiene esencialmente al menos una ley, y todos los hechos generales que contenga esencialmente deben ser leyes. (2) Si el explanandum es un hecho particular, el explanans contiene también esencialmente al menos un hecho particular. Los hechos particulares que contiene el explanans son las condiciorzes antecedentes. (3) La relación de explicación es una relación de inferencia lógica, el explanandum se infiere del expldnans. Éste es el núcleo de lo que se conoce como modelo de cobertura legal ('covering law model'j. La idea que lo articula es la de la explicación como esperabilidad nómica ('nomic expectability'), entendiendo 'esperabilidad' en sentido inferencial. El nombre que hemos dado a este análisis, 'cobertura legal inferencial', resume pues sus rasgos característicos generales. Este patrón general se desarrolla despuSs de modo específico en los diversos tipos de explicación. Los tipos de explicación específicos se caracterizarán por determinadas condiciones adicionales refuentes a cada uno de los tres elementos de la explicación: que el explanandum sea particular o general: que el explanans incluya o no hechos estadístico-probabilistas; y que la relación explicativa inferencia1 sea deductiva o inductiva. Las diversas combinaciones posibles dan lugar a cuatro tipos de explicación: el nomológico deductivo particular, el nomológico deductivo general, el deductivo estadístico y el inductivo estadístico (como veremos, se excluyen las combinaciones con (i) infe-
228
FüSD.43fElTOS DE FILoSOFL\ DE LA CIENCIA
rencia inductiva sin premisas generales probabilistas y (ii) inferencia deductiva con conclusión particular y alguna premisa general probabilista). Antes de pasar a discutir cada uno de estos tipos es preciso hacer dos obsenraciones. En primer lugar, aquí hemos presentado las condiciones generales (1)-(3) en términos de hechos pero. según Hempel, dada la naturaleza argumentativa de la explicación lo apropiado es presentarlas referidas a eitiu?ciados:explanandum y explanans son enunciados o conjuntos de enunciados. Aunque Hempel sigue casi siempre esta práctica, a veces también habla como si la relación explicativa se diera directamente entre lo que los enunciados expresan, los hechos o, para ser precisos, las proposiciones. Hempel prefiere hablar de enunciados porque le resulta más conveniente para su caracterización de las leyes, pero lo mismo podría hacerse, si se formula con cuidado, hablando de hechos. Esta cuestión no es de momento demasiado importante mientras no tomemos en consideración los aspectos intensionales de la explicación que mencionamos más arriba. Aquí usaremos indistintamente ambas versiones, privilegiando ligeramente la primera por ser quizá más intuitiva; intuitivamente, lo que explicamos son "cosas que pasan" mediante "otras cosas que pasan", no enunciados mediante enunciados. La segunda observación se refiere a las condiciones generales adicionales que impone Hempel para considerar que una explicación es fácricameitte col-recra. Las condiciones (1)-(3) caracterizan sólo lo que es una explicacióli porel~cialo posible. En las explicaciones correctas ha de ocurrir además que el explanandum sea verdadero, que lo que explicamos sea algo que efectivamente ocurre. Eso hace a la explicación real, esto es, que no sea un mero ejercicio conceptual. Pero para que, además de ser real, sea fácricmnente correcta es preciso algo más, a saber, que el explanans sea también verdadero. Para tener una explicación correcta, el hecho que ocurre y que queremos explicar debe explicarse mediante hechos que también ocurren. Explicamos que pasa cierta cosa porque ciertas otras cosas también yasall. Como reconoce HempeJ, esta exigencia tiene algo de extraño pues descalifica como incorrectas explicaciones intuitivamente inuy buenas en cuanto se ha comprobado que parte del explanans, por ejemplo alguna ley, es falsa. Esta cuestión es en parte nominal, pero tiene también un elemento que no lo es y que se hará explícito cuando nos ocupemos más adelante de la explicación conlo unificación teórica.
2.2. EXPLICACI~N N O M O L ~ G I C ADEDUCTIVA PARTICCLAR (NDP) Éste es seguramente el tipo de explicación más usual. A él dedicaron Hempel y Oppenheim su primer trabajo y es el que ha guiado el análisis posterior. Se caracteriza por satisfacer, además de (1)-(3), estas tres condiciones adicionales: (4) El explanandum es un hecho particular. ( 5 ) Las leyes del explanans son estrictamente penerales, e.e. no son estadísticoprobabilistas. Por (2) y (4), el explanans incluye también como condiciones antecedentes determinados hechos particulares, las condiciones antecedentes. (6) La relación de explicación es la de inferencia lógica deductiva.
Se puede esquematizar este tipo de explicación del siguiente modo. El uso de minúsculas connota que el hecho (o enunciado) correspondiente es particular, la línea continua que la inferencia es deductiva (cf. cap. 2), y la letra 'L'que se trata de una ley no probabilista:
NDP
Las leyes no probabilistas L, y las condiciones antecedentes c, constituyen conjuntamente el explanans; el explanandunl e se deduce lógicamente de esas leyes y de esas condiciones antecedentes. A este esquema se ajusta nuestro ejemplo de la rotura de las cañerías: las condiciones antecedentes son el descenso extremo de la temperatura y que las cañerías de casa están llenas de agua; las leyes establecen que las bajas temperaturas congelan el agua y que, cuando se congela el agua de las cañerías, éstas se rompen; de todo ello se infiere deductivamente la rotura de las cañerías de casa, hecho que queda así explicado. Explicar un hecho particular es subsumirlo bajo una regularidad nómica, que por ser nómica lo hace, junto con las condiciones antecedentes, esperable. El esquema NDP es, según Hempel, aquél al que se ajustan todas las explicaciones de hechos particulares mediante teorías no estadístico-probabilistas. Es el modo típico en que estas teorías explican los fenómenos empíricos particulares, por ejemplo, la explicación por la mecánica newtoniana de la reaparición de determinado cometa en un lugar y momento específicos, la explicación heliocentrica de las fases de Venus, o la explicación por la mecánica relativista de la órbita anómala de Mercurio. El lector recordará que en el capítuIo 3 vimos los dos primeros ejemplos como casos de predicciones en episodios de contrastación. Esto ilustra la tesis hempeliana de la sirnetrín entre explicación y predicción. Según Hempel, la explicación de hechos particulares y la predicción tienen la misma estructura lógica, la única diferencia entre ambas es prasmática y tiene que ver con la relación temporal entre la ocurrencia del hecho particular y la construcción del argumento: "En un caso, se sabe que ya se ha producido el suceso descrito en la conclusión, y se buscan enunciados adecuados que expresen leyes generales y hechos particulares para explicarlo; en el otro, se dispone ya de estos enunciados y de ellos se deduce el correspondiente al suceso en cuestión antes del momento de su presunta aparición. [... Ésta es] la tesis de la identidad estructural (o simetría) de la explicación y de la predicción" (Hempel, 1965, $2.4). Las explicaciones son pues retrodicciones, "predicciones" de hechos conocidos; las predicciones, si llegan a confirmarse, son explicaciones "avanzadas". Ésta es la tesis de la simetría entre explicación y predicción: si abstraemos la relación temporal entre el hecho inferido y el argumento, no hay ninguna diferencia entre ambas. El modelo de explicación NDP ha sido objeto de numerosas observaciones, críticas y comentarios. Vamos a presentar ahora las principales objeciones que se le han planteado. La revisión de estas dificultades nos servirá además para hacer algunas observaciones adicionales. La mayoría de las objeciones que presentaremos ahora tienen que
ver con diversos motivos que, según los críticosl hacen que la caracterización de Hempel no se ajuste a las jntujcjones pues incluye como explicaciones inferencias que intuitivamente n o consideraríamos tales, y excluye otras que sí consideramos expiicaciones. Así, se objeta, las condiciones (1)-(3) más (4)-(6) no son ni necesarias ni suficientes. En ambos casos se i l u s ~ a]a situación con pretendidos contraejemplos. Ahora nos vamos a limitar en reneral tan sólo a presentar las objeciones; las propuestas de soluciones las examinaremos más adelante al presentar los análisis alternativos que estos problemas motivan. También dejaremos para más adelante las críticas a la idea de que las explicaciones son inferencias.
-
PI: Gerleralioaciones "esei~ciales"inesertciales. El primer problema es de naturaleza serniformal. Tal como se ha expresado, NDP tiene una consecuencia claramente indeseable: se puede explicar cualquier hecho particular mediante una ley completamente independiente del hecho, esto es, una ley sin relación alguna con las entidades involucradas en el hecho. En efecto, sea el explanandum p.ej. Pa y una ley cualquiera Vx(Ax + Bx) en la que no intervienen ni el individuo a ni la propiedad P. El siguiente argumento satisface NDP:
k ( A x + Bs) (Ac + Bc) + Pa
Es deductivamente válido, la ley ocurre esencialmente, etc. No sólo eso, sino que también es materialmente adecuado, pues si el explanandum es verdadero también lo es la segunda premisa. Pero es obvio que no se puede considerar una explicación de que a es P, pues la ley no tiene nada que ver con esas entidades. Hempel ya había advertido esta dificultad en su primer trabajo y había introducido una condición adicional que establece, aproximadamente, que las condiciones antecedentes no se deriven de la ley y del explanandum. En realidad es un poco más complicada para evitar otros casos semejantes, pero no la vamos a exponer aquí (cf. Hempel y Oppenheim, 1948, 56). Sin embargo, Eberle, Kaplan y Montague (1 961) mostraron que dicha condición no era suficiente para bloquear otros casos más sofisticados. Kaplan (1961) y Kim (1963) propusieron otras condiciones alternativas que, como Hempel reconoce, sí logran el efecto deseado (cf. su postscripruií~ de 1964 a Hempel y Oppenheim, 1948). P2: Precedencia teinporal de las condiciones unrecedentes. Explicamos la ocurrencia de un eclipse de Luna deduciéndolo de leyes mecánicas celestes y de determinadas posiciones del Sol, Ia Luna y la Tierra atztes del eclipse. Pero el eclipse se deduce igualmente de las mismas leyes y de posiciones de esos cuerpos después del eclipse, y no consideraríamos que eso constituiría una buena explicación. Para que la inferencia sea explicativa parece que las condiciones antecedentes han de ser anteriores en el tiempo al hecho a explicar.
t
l l
\
P3: Simetría. Explicamos la longitud de la sombra de un mástil en un momento dado deduciéndola de leyes de la óptica física y de la posición del Sol y la altura del mástil. Pero también podemos proceder a la inversa en la deducción, inferir la altura del mdstil de esas leyes, la posición del Sol y la longitud de la sombra, y no parece que en ese caso estemos dando una explicación de la altura del mástil. Explicamos el espectro Iumínico característico de un elemento químico por su estructura atómica, y no ésta por aquél. Hay pares simétricos de argumentos en los que lo que en uno hace de conclusión en otro hace de premisa, y viceversa, y ambos satisfacen NDP,pero sólo uno, y no el otro, se puede considerar explicativo. P4: Efectos de causa cornrín. Es una regularidad no accidental, nómica, que poco tiempo después de que un barómetro registre una caída extremadamente brusca, se sucede una tormenta en las proximidadrs. Podemos entonces infzrir la tormenta de la brusca caída del barómetro, junto con esa regularidad, pero ello no se puede considerar una explicación de la ocurrencia de la tormenta. Esta regularidad correlaciona dos efectos diferentes de una causa común, a saber, el brusco descenso de la presión atmosférica. Lo que proporciona la explicación de cierta tormenta particular es cierto descenso particular de la presión, no la bajada del barómetro. Otro caso parecido es el de las mareas. Existe una regularidad nómica (conocida desde la antigüedad) entre la intensidad de las mareas y las fases de la Luna: la intensidad es cíclica, máxima en luna llena y nueva, mínima en cuarto creciente y menguante. De esta regularidad, y de cierta fase específica de la Luna, se puede inferir (aproximadamente) la intensidad de la marea. Pero ello no es una explicación genuina, la particular intensidad de la marea no se explica por la particular forma aparente de la Luna. Ambos fenómenos están correlacionados por ser efectos de una causa común, las posiciones relativas de la Luna. la Tierra y el Sol: la variación de esas posiciones tiene como efectos ópticos las fases de Id Luna y como efectos dinámicos los cambios de intensidad de las mareas. Este tipo de casos se suelen presentar además como contraejemplos a la tesis de Hempel sobre la simetría entre explicación y predicción; podemos predecir la tormenta mediante el barómetro. o la rnarea mediante la fase lunar, pero se trata de predicción sin explicación.
P5: Irrelevancia. Supongamos que embrujamos terrones de azúcar profiriendo ciertas palabras mágicas en su presencia. Es un hecho general que los terrones embrujados se disuelven cuando se sumergen en agua, por tanto podemos inferir la disolución de cierto terrón embrujado particular a partir de su inmersión en agua y de ese hecho general. Pero esta inferencia no explica la disolución del terrón. Podemos inferir que Juan no se quedará embarazado del hecho particular de que toma pastillas anticonceptivas más el hecho general de que ningún varón que tomas pastillas anticonceptivas se queda embarazado. Pero ello no es aceptable como explicación de que Juan no se quede embarazado (en este caso el explanandum es un hecho negativo, pero ello no afecta a lo que ahora se discute). En estos casos la inferencia no es explicativa pues parte de las condiciones antecedentes, y con ello "parte" del hecho general, son intuitivamente irrelevantes para la ocurrencia del explanandum. Nótese que satisfacen plenamente NDP. Se dirá que hay algo
extraño en esos hechos generales. que no son regularidades nómicas. Pero, al menos desde la perspectiva de Hempel, no es así. Estos hechos son regularidades nómicas, no es en absoluto accidental que los terrones embrujados se disuelvan, ni que los varones que toman pastillas no se queden embarazados. Lo que de raro tienen estas "leyes" es que son en cierto sentido si~nplificables,alguna propiedad contenida en el antecedente es innecesaria, irrelevante a efectos explicativos, pues el resultado de "suprimirla" es un hecho general que también es una ley. Sin embargo, articular esta idea de modo preciso no es una tarea fácil (cf. cap. 5 $2). Nótese que estos casos también representan un contraejemplo a la identidad entre explicación y predicción, tenemos predicción pero no explicación.
P6: Explicaciones releológicas y fincioltales. Los casos anteriores son casos que se ajustan a NDP pero, por diversos motivos, no parecen poder considerarse explicaciones. Ahora ocurre lo contrario, las explicaciones teleológicas y funcionales parece que son explicaciones genuinas y que (en la medida en que explican hechos particulares) no satisfacen NDP. No lo satisfacen pues, aparentemente al menos, no se infiere el explanandum del explanans, sino que (parte de) el explanans se infiere del explanandum (y .del. resto del explanans). Explicamos el latido del corazón por su función en la circulación de la sangre; o las largas orejas de los conejos por su función en el control de la temperatura corporal; o el viaje de Rosa a Salzburgo por su finalidad de asistir a un determinado concierto. En estos casos parece que, si es que se pueden considerar inferencias, no sucede que el hecho explicado se infiere de las condiciones antecedentes, sino más bien lo contrario: del tamaño de las orejas de este conejo (y de otras cosas) se infiere determinado fenómeno particular de equilibrio térmico corporal; del viaje de Rosa (y de otras cosas) se infiere su asistencia al concierto; etc. Explicamos un hecho mediante otro que es su función o finalidad, pero parece que es éste el que se sigue de aquél y no al revés. En la última sección volveremos sobre esta cuestión que, como veremos, tiene cierta relación con la de la prioridad temporal planteada en P2. El lector habrá percibido que casi todos estos casos están relacionados de una forma u otra con la causalidad. Ello vale no sólo para P4, en cuya presentación hemos hecho ya referencia explícita a la causalidad. En P2, si se rechaza como explicativa la inferencia con condiciones antecedentes posteriores en el tiempo al explanandum es porque se considera que tales condiciones tienen que ser causalmente responsables del explanandum y que las causas siempre preceden temporalmente a los efectos. De modo parecido, en P3 se acepta como explicación sólo una de las inferencias simétricas porque la altura es causalmente responsable de la longitud de la sombra, no viceversa. En P5, determinada propiedad contenida en el antecedente de la ley se considera explicativamente irrelevante por ser causalmerzre irrelevante. Otro modo de apuntar en la misma dirección es distinguir entre regularidades nómicas y leyes, siendo éstas sólo un subgrupo de aquéllas. No toda regularidad nómica sería una ley y mientras que la nolízicidad se preserva bajo relaciones de inferencia y simetría, la legalidad no (cf. cap. 5 , $1 y $2). Estos contraejemplos dejarían de serlo si en NDP exigiéramos, dada esa diferencia, no sólo que las regularidades que intervienen esencialmente sean "no acci-
dentales", nómicas, sino que sean leyes. Los presuntos contraejemplos no serían tales
pues las regularidades involucradas (entre los descensos de barómetros y las tormentas, entre las sombras y las alturas, entre los terrones embrujados y la solubilidad, etc.) serían nómicas pero no leyes. Esta estrategia, por lo general, no es sino otro modo de apelar a la causalidad pues, en general, quien defiende la diferencia entre regularidades nómicas y leyes lo hace en términos de causalidad: las Ieyes serían aquellas generalizaciones nómicas en las que se dan las apropiadas relaciones causales entre (las ejemplificaciones de) las propiedades involucradas. Hempel, por supuesto, percibió desde el comienzo que hay.una estrecha relación entre explicación y causalidad, pero considera que el análisis de la explicación no debe hacer referencia explícita a la causalidad. Reconoce el carácter causal de muchas explicaciones y defiende que, cuando tal es el caso, eso queda incluido en su modelo mediante la referencia a las leyes, pues en tales explicaciones causales las leyes que intervengan serán de hecho causales (como típicamente ocurre con las leyes de sucesión). Pero sostiene que hay también explicaciones NDP no causales. Ello ocurre típicamente cuando se usan leyes de coexistencia, como la ley de Ohm ("en cada material, el cociente entre la diferencia de potencial y la intensidad de un conductor es constante") o la del péndulo (T = Z K ~ ( L / ~ ) ) . Respecto de esta última, por ejemplo, Hempel sostiene que nadie diría que el período de un péndulo es causado por su longitud (cf. 1965, cap; XII, 92.2). Pero ello no sólo ocurre con las leyes de coexistencia, también es dudoso el carácter causal de algunas leyes de sucesión, como la ley de caída de los cuerpos de Galileo. Ahora vamos a dejar de momento el problema tan sólo planteado, volveremos sobre él más adelante.
2.3. EXPLICACI~N NOMOL~GICADEDUCTIVA
GESERAL
(NDG)
A veces aquello de lo que se da explicación no es un hecho particular sino uno general. Explicamos determinadas leyes derivándolas de otras, en cierto sentido que hay que precisar, más generales. Por ejemplo, las Ieyes de Kepler sobre la forma y período relativo de los planetas se explican por las leyes de la mecánica gravitatoria newtoniana; la misma teoría ~ewtonianaexplica también otros regularidades nómicas, como la ley de caída libre de Galileo, o la ley que correlaciona la intensidad de las mareas con las fases de la Luna; la ley de Boyle queda explicada en la teoría cinética de los gases; etc. Cuando, como en estos ejemplos, la ley explicada es una generalización estri'ctá, no estadísticoprobabilista, Hempel denomina también estas explicaciones nomolúgico-deductivas. Aunque Hempel utiliza la misma denominación para ambas, hay que diferenciar estas explicaciones de las anteriores; las diferencias entre ellas se derivan del hecho de que en aquéllas el explanandum es particular y en éstas general (no probabilista). Es inmediato constatar entonces que las explicaciones nomológico-deductivas generales se caracterizan, además de por (1)-(3), por las siguientes condiciones adicionales: (7) El explanandum es un hecho general nómico, una ley, no estadístico-probabilista.
(8) El explanans contiene esencialmente sólo leyes no estadístico-probabilistas.
Ninguna de las leyes del explanans es el explanandum mismo. (9) La relación de explicación es la de inferencia lógica dedz4crii.a.
Se puede esquematizar este tipo de explicación, siguiendo las convenciones establecidas anteriormente, del siguiente modo:
NDG
E es la ley (no probabilista) que se deriva de las leyes explicativas L;. h'ótese que (7) excluye la posibilidad de explicar hechos generales que no sean leyes. ¿No pueden explicarse regularidades accidentales? No, pues por ser accidentales no son "esperables", esto es, explicables. Si se aceptaran como explanandum regularidades accidentales entonces podrían aceptarse también en el explanans; por tanto, en la medida en que, como vimos, haya buenas razones para exigir que todos los hechos generales que intervienen esencialmente en el explanans de una explicación sean regularidades nómicas, en esa misma medida se excluyen como explanandum hechos generales accidentales. Otra cosa es que se sostenga que no hay en última instancia regularidades accidentales, que todas las regularidades son nómicas y que el que algunas parezcan accidentales se deriva sólo de nuestro actual desconocimiento. Ésta es otra cuestión que ya tratanlos en el capítulo 5 y sobre la que no vamos a volver ahora. Pero si hay regularidades meramente accidentales, no pueden ser explicadas. Como dijimos anteriormente, accidellralidad y e-~plicarividad son conceptos excluyentes. E1 principal problema para un análisis satisfactorio de las explicaciones NDG es, como reconoce Hempel, el de ofrecer una noción precisa y adecuada de i~zclusividadque excluya los casos de autoexplicación:
P7: Autoe.~plicacióiz. En ( 8 ) se exige, además del carácter nómico del explanans, que el explanandum mismo no sea una de las leyes del explanans. De otro modo contarían como explicaciones inferencias de una ley a partir de sí misma, 10 que evidentemente es inaceptable; por supuesto que es una iizferencia válida deducir cierta ley L de ella misma, pero eso no es una explicacióiz de la ley. Ahora bien, esa exigencia resuelve el problema sólo en su versión más burda, pero esencialmente el mismo problema reaparece inmediatamente. En efecto, si el explanans contiene una ley que es la conyunción del explanandum con cualquier otra, se da también el tipo de autoderivación que no se puede considerar inferencia explicativa; por ejemplo, de la ley K A B que es la conyunción de las leyes de Kepler, K, con la de Boyle, B, se infiere deductivamente K, pero ello no explica las leyes de Kepler (cf. Hempel y Oppenheim, 1948, 56, nota 33). Ésta es según Hempel la principal dificultad para llevar a cabo un análisis satisfactorio de las expljcaciones NDG. Las explicaciones de leyes no pueden ser autoinferencias de ese ripo, y sin embargo en cierto sentido toda deducción es una autoinferencia pues la ley que se infiere "ya está" en
las premisas. Claro que no está en "esa" forma, pero determinar cuáles son las formas admisibles como explicaciones y cuáles no, no es sencillo. De hecho Hempel lo considera un problema irresuelto. El criterio debe tener que ver, afirma, con la mayor inclusividad de las leyes explicativas, como las de Newton respecto de las de Kepler, pero el problema surge de la dificultad de "establecer criterios bien definidos para la distinción de niveles de explicación o para comparar oraciones generalizadas en cuanto a su inclusividad; [la] formulación de criterios adecuados para este propósito es un problema aún no resuelto" (ibid.). Más adelante, cuando veamos el modelo de unificación teórica, vo\veremos sobre esta cuestión.
2.4. EXPLICACI~N DEDUCTIVO ESTAD~S~C,\ (DE) En la explicación NDG el explanandum es una ley que es una regularidad estrictamente general, en el sentido de no ser una ley estadístico-probabilicta. Cuando el explanandum es una regularidad nómica, pero no estrictamente general sino una ley estadística, tenemos una explicación que Hempel denomina explicación deductivo estadística. Por ejemplo, a partir de las leyes estadísticas que afirman que la probabilidad de que un varón occidental desarrolle alguna modalidad de cáncer es de 0,2 y que la probabilidad de que sea soltero es de 0,1, y del hecho, supongamos, de que ambos sucesos son independientes, se explica que la probabilidad de que un varón occidental sea soltero y desarrolle cáncer es de 0,02. Hempel afirma que estas explicaciones se caracterizan porque en ellas se deduce una ley estadística a partir de un explanans que contiene indispensablemente al menos una ley tambiín estadística, realizándose la deducción mediante la teoría matemática de la probabilidad (cf. p.ej. 1965, $3.2). Ello hay que entenderlo en el sentido de que en la deducción, y por tanto en la explicación, se usan como premisas ocultas adicionales determinados principios del cálculo de probabilidades, por ejemplo en nuestro caso el principio que afirma que la probabilidad del suceso compuesto de otros dos independientes entre sí es el producto de sus probabilidades. Hay que considerarlos incluidos en el expIanans, pues (salvo que se considere, implausiblemente, que son parte del cálculo deductivo) de lo contrario no se puede completar la deducción y la inferencia sería deductivamente inválida. Esta última observación plantea una cuestión que hemos obviado hasta ahora. Este ejemplo muestra que a veces el explanans puede incluir (quizá elípticamente) leyes matemáticas, como el principio probabilista mencionado acerca de la probabilidad de la conyunción de sucesos independientes. Pero algunas de esas leyes no pueden ser calificadas de regularidades nótnicns. Quizá la del ejemplo sí sea una regularidad nómica, si es que la teoría de probabilidades es empírica. Pero podría ser que la inferencia explicativa use como premisas p.ej. principios matemáticos del análisis, que parece difícil calificar de nómicos. En ese caso se estaría incumpliendo la condición que venimos imponiendo de que todos los hechos generales que intenienen esencialmente en el explanans sean regularidades nómicas. Hay que matizar pues esa exigencia y limitarla a los hechos empíricos; esto es razonable, pues las leyes matemáticas no se pueden calificar de regularidades
236
F U N D A L I E A ~DE S FILOSOF~.+DE LA CIENCIA
nómicas, pero tampoco de accidentales. La condición es pues que todo hecho general empírico que intervenga esencialmente en el explanans debe ser nómico. La idea es que el explanans no puede contener esencialmente ninguna regularidad e~npiricaaccidei~ral, pues ella contaminaría, por así decir, de accidentalidad el resto y m i n a r í a su pretendido carácter explicativo. De lo dicho se desprende que las explicaciones deductivo-estadísticas se caracterizan por satisfacer, además de (1)-(3), las siguientes condiciones adicionales: (10) El explanandum es una ley estadística. (1 1) El explanans contiene esencialmente sólo hechos generales. Estas regularidades (cuando no sean puramente matemáticas) son todas nómicas, y al menos una de ellas es una ley estadística (diferente del explanandum mismo). (12) La relación de explicación es la de inferencia lógica deductiva. Que el explanans contenga esencialmente al menos una ley estadística es necesario si el explanandum es estadístico y la inferencia deductiva, pues de regularidades no probabilistas no se deducen regularidades probabilistas. Como habrá percibido el lector, el esquema que corresponde a este caso es muy parecido a NDG. En realidad las explicaciones DE y las NDG son esencialmente del mismo tipo, a saber, explicaciones en las que se explica determinada regularidad nómica mediante otras deduciendo aquélla de éstas. Si usamos la letra 'P' para connotar que la correspondiente ley del explanans es probabilista, entonces podemos esquematizar este tipo de explicación del siguiente modo (nótese que, aunque no lo connotemos explícitamente en el esquema, el explanandum es ahora un hecho general probabilista):
L,, L" P,, Pk ,.s
e..,
En la explicación NDP explicamos un hecho particular subsurniéndolo bajo ciertas leyes, donde por subsunción se entiende la derivación deductiva del hecho a partir de las leyes y de determinadas condiciones antecedentes. En ese sentido la ocurrencia del hecho particular se muestra (nó~nicamente)esperable o predecible: el explanandum se predice (si todavía no ha ocurrido), o se hubiera podido predecir (si ya se ha producido), a partir del explanans. Ésta es la razón de la identificación que (salvo a efectos pragmáticos) hace Hempel entre explicación y predicción. En las explicaciones NDP la esperabilidad es total, pero el núcleo de esta idea, la explicación de hechos particulares como esperabilidad nórnica, se puede aplicar también según Hempel a casos en los que la esperabilidad no es
meramente accidentales no. Que esta moneda sea dorada no se explica porqce estuviera en hTocheviejade 1990 en el bolsillo derecho de los pantalones de Quine y que en tal ocasión el 95 % de las monedas en ese bolsillo fuesen doradas (aunque c.í se infiere inductivamente de ambas premisas). Las explicaciones IE se pueden esquematizar, siguiendo Ias convenciones anteriores, del siguiente modo:
Li, ..., L. ..., Pt
Pl,
Cl.
cm
--------- [J-1 , .e
e
Aquí '[I-1' denota el grado de soporte inductivo que el explanans confiere al explanandum. Nótese que en estos casos rz puede ser 0, esto es, el explanans puede contener quizá sólo leyes estadístico-probabilistas. Y en el caso más simple el explanans tiene una única ley. estadística; así, en el ejemplo del cáncer de Luis, si A es la propiedad de desarrollar cáncer de pulmón y B la de haber fumado tres paquetes diarios durante cuarenta años, tenemos el siguiente esquema: p(A/B) es próxima a 1 Ba ........................ Aa
[próximo a 11
Otro ejemplo que se ajusta a este patrón simple es la explicación de la cura de Juan de una infección por estreptococos a partir del hecho de que la inmensa mayoría de tales infecciones remite al tratarse con penicilina y de que Juan se ha infectado y se ha tratado con penicilina (cf. Hempel, 1965, $3.3). Un ejemplo de explicación IE un poco más compleja es el siguiente (ibid.). El hecho a explicar es la reducción, en 7,64 días, de una muestra particular de radón de 10 a 2,5 miligramos por desintegración radiactiva. Este hecho se explica porque: a ) la muestra es de radón, b) la probabilidad de que un átomo de radón se desintegre en 3,82 días es 0,5, c) las desintegraciones de diferentes átomos de radón son sucesos estadísticamente independientes, y 6) 10 miligramos de radón contienen un cantidad muy elevada de átomos (y, habría que añadir en el explanans, tales y cuales principios de la teoría de la probabilidad que se usan en la inferencia inductiva). Éste es el núcleo del análisis que hace Hempel de las explicaciones inductivas. Este análisis se enfrenta a muchas de las dificultades que vimos en las explicaciones NDP, o las versiones inductivas de las mismas, y además a otras específicas. Concluiremos con tres problemas principales. El primero cuestiona que la alta probabilidad sea un condición suficiente para la explicación. El segundo, que sea una condición necesaria. El tercero, la ambigüedad inductiva, lo presenta el propio Hempel y para resolverlo introduce una modificación sustancial.
1
i
i
P8: Irrelecntzcin itzd~lctiva. Es la versión inductiva del problema de la irrelevancia que vimos en las explicaciones NDP. Es una regularidad nómica que la mayoría de resfriados tratados con vitamina C remiten a la semana. De ella, junto con el hecho de que Ana tome vitamina C la primera semana de su resfriado, se infiere con alta probabilidad que su resfriado remitirá a la semana. Sin ernbarso, no se puede considerar una explicación de la cura de Ana pues la mayoría de resfriados remiten a l a semana también sin tomar vitamina C. Otro ejemplo típico es el de las neurosis. Que Pedro siguiera una terapia durante un año y que la mayoría de las neurosis tratadas con psicoterapia remiten al año implica inductivamente que la neurosis de Pedro remitiera al año, pero no lo explica, pues la mayoría de las neurosis remiten al año también sin psicoterapia. Así pues, la alta probabilidad de la inferencia inductiva no e s suficiente para obtener una explicación estadística genuina.
P9: E.rplicaciones indrtcriras con baja probabilidad. Un famoso ejemplo que ya mencionamos en el capítulo 2 (S3), y que se debe originalmente a Scriven (1959), pone en cuestión que la explicación requiera alta probabilidad. El ejemplo pretendía en principio cuestionar la tesis de la simetría entre explicación y predicción, presentando un caso de buena explicación que, dada la baja probabilidad, no se puede considerar buena predicción. Pero también presenta un problema para el análisis de la explicación inductiva que Hempel ofrecería poco después. Supongamos que el alcalde ha enfermado de paresis. Una buena esplicación de ese hecho parece la siguiente: la paresis es una forma de sífilis terciaria que se da sólo entre los individuos que no se han tratado con penicilina y han llegado al estadio latente de la enfermedad, aunque no se da en todos sino aproximadamenre en sólo un 23 % de ellos; el alcalde contrajo sífilis, no se trató con penicilina y ha llegado al esradio latente de la enfermedad. En opinión de Scriven, Salmon y otros, esto es una buena explicación, pero claramente es un mal argumento inductivo pues el soporte inductivo que confiere el explanans al explanandum es muy bajo. Hay explicación sin alta probabilidad, sin alta esperabilidad. Así pues, la alta probabilidad no parece tampoco una condición necesaria para la explicación estadística.
PlO: Ainbigiieliad inductivn. Hempel mismo menciona una dificultad del esquema básico IE que obliga a una modificación sustancial del mismo. Es el problema de la ainbigiiedad esplicativn de las explicaciones IE. El problema se deriva de ün hecho que ya comentamos en el capítulo 2 ($3). En esencia, consiste en que podemos tener dos explanans ambos verdaderos de los que se infieren con alta probabilidad inductiva dos explananda contradictorios. Supongamos que la probabilidad r de tener la propiedad A si se tiene la propiedad B, p(A/B) = r , es muy alta, próxima a 1; que la probabilidad s de ser A si se es C, p(AIC) = s, e s muy baja, próxima a O, de donde la probabilidad p(no-A/C) de no ser A si se es C es 1-S, por tanto muy próxima a 1; y que cierto individuo a tiene a la vez las propiedades B y C. Consideremos entonces los siguientes argumentos:
FL'ND;\b!E3TOS DE FILOSOF~ADE LA CIENCIA
Estos argumentos son inferencias inductivas válidas, y satisfacen además las condiciones para ser explicaciones IE. Parece entonces que puede haber explicaciones adecuadas con explanantes ambos verdaderos y explananda contradictorios. Volvamos a] ejemplo de Hempel de la infección con estreptococos. Si la infección es de una cepa especial resistente al medicamento entonces la inmensa mayona no se cura. Aquí, A es curarse, B es "infectarse (0 y tomar penicilina (P)" y C es "infectarse con la cepa especial (E) y tomar penicilina (P)". Supongamos que Juan tiene una infección por estreptococos y que toma penicilina, pero que los estreptococos son de la cepa especial. Entonces podemos explicar tanto que se cure como que no se cure. Así es como lo reconstruye Hempel (cf. 1965, §3.4.1), aunque sería más apropiado, como hace Salmon (1989, 92.4.2), considerar que B es infectarse y tratarse con penicilina y que C es B & H, siendo H que los estreptococos son de la cepa especial, pues eso parece una especificación a añadir a B. Este tipo de casos, en los que condiciones adicionales van invirtiendo la probabilidad, es muy común. La probabilidad de que no te moleste la policía en Barcelona es alta; pero si eres norteafricano, pasa a ser baja; si, aunque seas norteafricano, vas elegantemente vestido y con un acompañante europeo, vuelve a ser alta; pero si el acompañante tiene aspecto de drogadicto, se vuelve a invertir; etc. Conviene señalar, sin embargo, que el problema de la ambigüedad no se limita a estos casos, puede darse con condiciones no acumulativas; por ejemplo: la probabilidad de que un fumador de más de tres paquetes diarios muera antes de los ochenta años es alta; la probabilidad de que alguien con dieta equilibrada y que practica deporte asidua y moderadamente muera antes de esa edad es baja; Juan fuma esa cantidad, y también lleva una dieta equilibrada y practica deporte; tenemos dos explicaciones E con premisas compatibles de hechos contradictorios. Nótese que el problema no es que puede haber argumentos inductivos válidos con conclusiones contradictorias. Eso también pasa con los deductivos. El problema es que puede haber argumentos inducti\ios válidos con conclusiones contradictorias y tales que laspreinisas de ar?zbosson verdaderas. Eso no puede suceder con los deductivos, pues dos grupos de premisas de las que se deducen conclusiones contradictorias no pueden ser verdaderas a la vez, son también contradictorias. Esto no es un problema para las i~zfelmzcias inductivas en cuanto tales, pues es previsible que ello ocurra dado su carácter inductivo. En cambio es un problema si queremos considerar tales inferencias explicaciones inductivas, pues la noción de explicación excluye, a juicio de Hempel, que dos grupos de hechos puedan ser simultáneamente verdaderos y explicar cosas contradictorias. Podría argüirse que el supuesto problema no es realmente tal, pues de las dos explicaciones sólo una puede ser una explicación real en el sentido precisado más arriba, a saber, sólo en una el explanandum es verdadero, ocurre efectivamente. Pero esta escapatoria no es muy satisfactoria. El problema no es que haya de hecho explicaciones compatibles de hechos "que ocurren" incompatibles; ése no sería un problema pues no hay tales pares de hechos. El problema es que podría haber explicaciones compatibles de hechos "posibles" que L
fuesen incompatibles. Y eso parece un problema genuino independientemente de que por supuesto sólo pueda ser verdadero uno de los dos explananda. La solución de Hempel consiste en imponer un requisito adicional para poder considerar explicativa una inferencia inductiva. Como la ambigüedad se debe a que una explicación introduce información relevarrtr nueva respecto de la otra, la idea es imponer alguna constricción al respecto. La alternativa más radical es imponer el requisito de evidetzcia total (o de los eleinetttos de juicio rotales) a saber, que la inferencia sea tal q u e no haya evidencia disponible adicional que cambie el grado de apoyo inductivo. Aunque inicialmente Hempel pensó en esta alternativa (cf. Hempel, 1962), en seguida se dio cuenta de que es excesiva (1965, n. 73). Si se exige que el explanans contenga toda la evidencia relevante disponible, y puesto que a menudo el explanandum no sólo es verdadero sino que se sabe que lo es, entonces el explanandum mismo formará parte de la evidencia en el momento de la explicación y debería por tanto incluirse también en el explanans. Esto sería fatal pues convertiría la inferencia en deductiva, y ni siquiera en el modelo recogido en NDP (puesto que no se usaría esencialmente ninguna ley), se inferiría el explanandum trivialmente de sí mismo. Esta alternativa tendría pues como consecuencia el incumplimiento de una condición básica de toda explicación, tanto deductiva como inductiva, a saber, que en el explanans intervenga esencialmente alguna ley; por tanto, de exigirse, implicaría que no hay explicaciones IE. Hempel impone una condición más débil sobre la información disponible en el momento de la explicación, el reqciisito de mrí-cima especificidad (RLME).Sea K el conjunto de hechos aceptados (incluyendo sus consecuencias lógicas) en el momento de la explicación. El problema de la ambigüedad se da cuando K tiene subconjuntos que dan alto apoyo inductivo a conclusiones contrarias, lo que sucede básicamente cuando hay leyes p(A1B) = r, p(AIC) = s tales que r es cercano a 1, s es cercano a O, y la evidencia contiene tanto Ba como Cn. La idea es entonces no considerar explicativas estas inferencias inductivas en esa situación cognoscitiva. El RblE establece aproximadamente lo siguiente (cf. 1965, $3.4.2). RME Sea S el explanans, que incluye la ley p(A1B) = r y el hecho Ba: Si S A K implica que a pertenece también a alguna otra clase (tiene también alguna otra propiedad) D que es subclase de B (e.e. D = B & E, para alguna propiedad E), entonces S A K implica p(A1D) = p(A1B). Esto es, la clase de referencia B es, relativamente a K, (episté~nicamente)homogélzea; según el conocimiento expresado en K, B no contiene subclases en las que la probabilidad de ser A varíe respecto de la que se da en B. De otro modo: B no tiene, según K, particiones o especificaciones relevantes, todas las particiones que podamos hacer añadiendo otras propiedades a B son, según la evidencia disponible, estadísticamente inelevantes a efectos de qué sucede con A. Es en ese sentido que el explanans contiene toda la información relevante, el resto de información disponible es irrelevante a efectos explicativos, añadirla no cambia las cosai por lo que al hecho a e.rplicar se refiere. Ésta es la condición que va a exigir Hempel. Una inferencia inductiva se considera
232
FCNDARIEXTOS DE FILOSOFL~ DE LA CIENCIA
racionalinente aceptable coino explicación en la siriración cognosciti\~a represenrada por K si (además de las condiciones anteriores) satisface Rh4E. Es sencillo ver que esre requisito bloquea los casos de ambigüedad, que descarta las explicaciones intuitivamente insatisfactorias y preserva, en principio (cf. iitfra), las intuitivamente aceptables. El nuevo requisito es claramente violado en esos casos especiales en los que la sucesiva inclusión de nuevas propiedades en el antecedente de la ley probabiljsta provoca inversiones sucesivas de Ia probabilidad. Pero no sólo eso, es fácil ver que RME también bloquea los casos más generales. Supongamos que queremos explicar Aa a partir de Ba y de la ley p(A1B) = r. Relativamente a cierto K,tenemos que p(A/B) = r es cercana a 1, y además que para cierta propiedad C, p(AIC) = s es cercana a O, y que conjuntamente con Bu ocurre también Ca. Si se cumpliera RME, y puesto que de K se sigue Ba A Ca, tendríamos entonces tanto p(A/B) = p(AIB & C)como p(AIC) = p(AIB & C), de donde se sjgue p(A1B) = p(AIC), lo que es imposible en la situación supuesta. Así pues, ese tipo de situaciones, las que provocan los problemas de ambigüedad, no pueden satisfacer M E . Conviene notar que RME elimina la ambigüedad en un sentido todavía más general, no explicitado por Hempel. En efecto, la prueba anterior muestra que dos inferencias inductivas válidas que utilicen, respectivamente, las leyes p(A1B) = r y p(AIC) = S, siendo tanto r como S cercanos a 1, no pueden satisfacer RME si r y S son diferentes. Esto es, si hay dos inferencias inductivas alternativas del mismo hecho, ambas con elevada pero diferente probabilidad, ninguna de ellas puede considerarse racionalmente aceptable como explicación. En efecto, ninguna puede satisfacer RME pues éste exige (ya que a partir de K tenemos Bu A Ca) tanto p(A1B) = p(A/B & C)como p(AIC) = p(A/B & C), lo que es imposible si p(A1B) y p(AIC) son diferentes. Eso deja todavía cierto problema de ambigüedad a nivel más profundo, a saber, qué hacer en caso de que haya dos buenas alternativas inductivas que apelen a diferentes leyes (y por tanto a diferentes condiciones antecedentes) que asignan el mismo alto grado de probabilidad. Estos casos satisfarían RME, por tanto alízbas inferencias contarían como explicaciones racionalmente aceptables, por lo que se daría una situación de indeterminación explicativa. Aunque entonces no lo mencionamos, lo mismo ocurre con las explicaciones deductivas NDP. La cuestión de fondo aquí es en qué medida se da verdadera indeterminación. Se dará verdadera indeterminación en la medida en que los dos explanantes a que se apela sean verdaderamente diferentes, esto es, no estén nómicamente conectados. Las dos alternativas pueden ser sólo apareilfelneitre diferentes si una ley se sigue de la otra o ambas se siguen de una tercera. Esto vuelve a plantear las relaciones entre explicación y causalidad y, con ello, Ja adecuación del análisis de la explicación como mera esperabilidad nómica. Por último, y como señala el propio Hempel, RME introduce una asimetría fundamental entre las explicaciones 1E y las NDP pues tiene el efecto de relativizar epistérnicamente las primeras. Una inferencia inductiva es o no una explicación inductiva, no sin más, sino sólo relativame~ztea cierta situacióiz cogiloscitiva K. Por tanto, en estas explicaciones no interviene sólo e1 explanandum, el explanans y la relación explicativa, interviene además un cuerpo de evidencia disponible K: S explica e relativamente a K. Hempel episténzica de la eqlicación estadenomina esta característica la esencial relati~~izació)~ dística. Sobre esta cuestión volveremos más adelante.
I
I
1 j
1
ir z
+ i
3
I 1
1I
3. ReIevancia estadística El ejemplo de la paresis cuestiona que la elevada probabilidad sea una condición necesaria de las explicaciones estadísticas. Además de Scriven, otros autores como Jeffrey, Greeno, Salmon y Railton plantzaron críticas parecidas y desarrollaron sus propias propuestas. Jeffrey (1969) defiende que cuando un mecanismo estocástico da lugar a resultados con diferente probabilidad, unos muy probables y otros muy poco, comprendemos ig~talla ocurrencia de los probables que la de los improbables. Greeno (1970) desarrolla una teoría informacional de la explicación estadística centrada en el concepto de transmisión de información, analizado en términos de relevancia estadística. Según estos autores, las explicaciones estadísticas de sucesos particulares no son inferencias inductivas. Quien ha desarrollado una alternativa más elaborada en esta línea ha sido W. Salmon en una serie de trabajos iniciados en los años setenta (1970, 1971, 1977, 1978). Otra línea alternativa es la de Railton (1978, 1980), quien defiende que hay explicaciones de sucesos con baja probabilidad, pero a la vez que esas explicaciones sí son en parte inferenciales. Una explicación de un hecho probabilista particular consta de a ) una inferencia dedttcriva de que el hecho tiene cierta probabilidad, y b) un addendum que establece que el suceso ha ocurrido. La explicación contiene por tanto una inferencia, aunque no una inferencia inductiva que concluye con alta probabilidad el hecho, sino una inferencia deductiva que concluye que el hecho tiene determinada probabilidad, para lo cual no importa que ésta sea alta o baja. No vamos a examinar aquí los detalles de esta alternativa. Vamos a centramos en el análisis que más influencia ha tenido, el de Salmon, conocido como modelo de la relevancia estadística ('statisrical relevance'). La idea básica de este nuevo análisis es que, para tener una explicación estadística satisfactoria, las condiciones antecedentes no deben, con ayuda de una ley, hacer altamente probable el explanandum, sino que simplemente deben ser un factor estadísticamente releva~ztepara el explanandum. Por factor estadísticamente relevante se entiende un factor que modifica la probabilidad del suceso, e.e. tal que las probabilidades del suceso tomando en cuenta el factor y sin tomarlo en cuenta son diferentes. Si llamamos probabilidad anterior a la probabilidad sin tomar en cuenta el factor, y probabilidad posterior a la probabilidad tomándolo en cuenta, un factor es estadísticamente relevante si marca rtrza diferencia entre las probabilidades anteriores y las posteriores. Así, por ejemplo, explicamos la paresis del alcalde apelando a su sífilis latente no tratada pues ese factor es estadísticamente relevante, aunque no haga muy probable el suceso. Veamos las principales nociones con cuya ayuda se articula esta idea (cf. p.ej. 1984, cap. 2, y 1989, $3. l). El explanandum, según Salmon, no es simplemente del tipo "a es A", p.ej. que Peter es delincuente. La pregunta no es "¿por qué a es A?" sino "¿por qué a, que es B, es también A?", ''¿por qué Peter, un joven californiano, es delincuente?". La clase (o propiedad) B es la clase de referencia, y la explicación consiste en identificar un factor C que, en esa clase de referencia, es estadísticamente relevante para ser A, p.ej. "Peter, además de ser joven californiano, es un inmigrante ilegal", donde ser inmigrante ilegal es, entre los jóvenes californianos, estadísticamente relevante para ser delincuente (ahora identificaremos propiedades, clases, atributos y factores).
+
244
FUSDAMEXTOS DE FILOSOF~A DE LA CIESCIA
En la explicación se usa una cierta partición de la clase de referencia. Una partición es una subdivisión de esa clase en subclases no vacías excluyentes y que conjuntamente agotan la clase de referencia. El ejemplo dado es incompleto porque no se ha especificado la pmición. Puede ser que la clase de los jóvenes californianos se haya partido en dos, inmigrantes ilegales (BI) y no inmigrantes ilegales (B:); o en tres, inrnigrantes ilegales (B,), inrnigrantes legales (Bz) y no inmigrantes (B3). Otra partición, con otros atributos, seda: drogadicto de clase alta (8,). drogadicto no de clase alta (B-), no drogadicto y de clase alta (B3),y ni drosadicto ni de clase alta (BJ; otra estaría formada por las seis subclases resultado de combinar ser varón o ser mujer con ser de clase alta o ser de clase media o ser de clase baja. A las subclases ( B & B;) de una partición se las denomina celdas. Una partición de B es relevante respecto de cierto atributo A (A-releila~zte)si la probabilidad p(A1B & B,) es diferente en cada celda. Una partición de B es homogénea respecto de cierto atributo A (A-hoimgéitea) si sus celdas no tienen particiones A-relevantes, esto es, si no es posible subdividir Ias celdas A-relevantemente. La idea es que una partición de B es A-homogénea si no podemos refinarla introduciendo nuevos factores relevantes para A. La homogeneidad es epistéinica si no cortoceinos tales nuevos factores, es objetiva si no Izay tales factores. Así, la partición de jóvenes califomianos en inrnigrantes ilegales y no inmigrantes ilegaIes es delincuencia-relevante, pero no es ni objetiva ni epistémicamente delincuencia-homogénea. pues hay factores, y los conocemos, que la refinarían delincuencia-relevantemente(p.ej. renta anual, drogadicción, situación laboral, etc.). Con estos conceptos, Salmon puede formular su análisis de modo preciso. Por lo dicho hasta aquí, y por los ejemplos, cabría esperar que la propuesta consistiera en sustituir la elevada probabilidad por la relevancia estadística positiija, esto es, el explanans no tiene por qué hacer inuy probable el explanandum, basta con que lo haga más probable. La sífilis latente no tratada no hace miqi probable la paresis, pero sí la hace nzás probable que su ausencia; conocer ese factor positivamente relevante basta para comprender el hecho. Aunque al principio Salmon pensó su alternativa en estos términos, al desarrollarla llegó a la conclusión de que "no se requiere relevancia positiva, la relevancia negativa puede tener también alcance explicativo ('explanafoly ilnpol-t')" (Salmon, 1989, p. 67; como comentaremos más adelante, esto es parcialmente confundente). Las explicaciones estadísticas se caracterizan pues por las siguientes condiciones. (16) El explanandum es un hecho singular que establece que cierto individuo que
(P
pertenece a cierta clase de referencia B tiene cierto atributo A: "a, que es B, es también A". (17) El explanans consta de: (i) la probabilidad anterior p(AI3) = r; (ii) una partición B & Bi, B & Bz, ... de B, junto con las probabilidades posteriores p(AIB & BI) = ri,p(A1B & B:) = rz, ...; (iii) el supuesto de que la partición es A-relevante y A-homogénea; (iv) la condición antecedente de que a tiene además determinada propiedad Bk,e.e. que pertenece a una determinada celda B & Bi de la partición. Los hechos estadísticos relativos a las probabilidades anteriores y posteriores son generalizaciones nómicas, leyes naturales.
(18)
La relación explicativa es la de relevancia estadística: el explanas explica el explanandum syss p(AIB & Bk)# p(A/B).
Como se ve, éste es también un modelo de cobertrtra legal, se explica un hecho particular apelando a otros hechos particuIares y a ciertas hechos generales que son leyes naturales. Además, se impone un requisito equivalente al R i i E de Hempel, a saber, que el atributo Bk que usa el explanans no se pueda especificar más de modo relevante para la ocurrencia del explanandum. Puesto que la homogeneidad de la partición puede ser epistémica u objetiva, una explicación se considerará adecuada objetiva o epistémicamente en función del tipo de homogeneidad que satisfaga la partición del explanans. Aunque no podemos realizar explicaciones más que apelando a lo que conocemos, lajfinaliclod de la ciencia es proporcionar explicaciones objetivamente adecuadas. Por último, aunque de cobertura legal, éste no es un modelo inferencial. Las explicaciones no son argumentos. Propiamente, no son argumentos ni las explicaciones estadísticas, ni tampoco las que usan leyes no estadísticas y que Hempel reconstruía como inferencias deductivas. Cuando se usan leyes no estadísticas, lo que ocurre simplemente es, en términos de Salmon, que la partición relevante y homogénea contiene únicamente dos celdas y que la probabilidad posterior de la celda destacada es 1 y la de su complementaria es O (esto se deriva de que, por un lado, Vx(Bx 4 Ax) implica p(A/B) = 1 y p(no-AIB) = O; y por otro lado también implica Vx(Bx A ... +Ax), haya lo que haya en '...', y por tanto que p(AIB & ...) = 1, haya lo que haya en '...', de donde la partición homogénea contiene sólo las celdas de B y de no-B). En este caso, a diferencia de las explicaciones inductivas, no hay mucha diferencia en considerarIas así o "a lo Hempel". Salmon reconoce que la objeción más inmediata a que se enfrenta su análisis es la de que las meras relaciones estadísticas no explican nada, como sugerían los ejemplos del resfriado (irrelevancia) o el barómetro (causa común). Pero, en su opinión, justamente aquí se manifiestan los beneficios de su análisis, pues no sólo acomoda las explicaciones con baja probabilidad del explanandum sino que excluye casos como esos con alta correlación estadística pero no explicativos. Los casos de irrelevancia quedan claramente excluidos pues en ellos no se da la relación explicativa de relevancia: la probabilidad anterior p(AI3) (curarse, si se ha estado resfriado una semana) y posterior p(AIB & C) (curarse, si se ha estado resfriado una semana y se ha tomado vitamina C) son la misma. Pero también quedan excluidos los casos de causa común, como el del barómetro. Veámoslo. Sea la clase de referencia B los acaecimientos que ocurren en el entorno de casa, y las propiedades A "ser una tormenta", C "ser una bajada brusca del barómetro" y D "ser una bajada brusca de la presión atmosfgrica". La partición no puede ser sólo B & C y B & no-C; ésta no es una partición homogénea pues no contempla el factor adicional D. la bajada de la presión, q u e permite refinarla A-relevantemente. Pero si introducimos D, entonces C se toma irrelevante pues la probabilidad de la tormenta dada la b ~ j a d ade presión no varía porque el barómetro baje o no. Tenemos pues que p(AIB & C & D) = p(AIB & D) = p(AIB & no-C & D), y por tanto, si la partición incluye C (y no-C) entonces no es A-relevante pues hay dos celdas (la de C y la de no-C) con las mismas probabilidades posteriores. Así, C no puede entrar en la explicación dada Ia presencia de D.
246
FL'SDiiblEhTOS DE FILOSOFLXDE LA CIENCIA
Éste es el núcleo de la idea que Salmon reconstruye técnicamente de modo preciso mediante la noción de desplacai~iieiito('screeitiiig ofJJ, literalmente "tapar"). NO vamos a ver los detalles, pero la idea es la apuntada: D desplaza C en relación con A ea el sentido de que lo convierte en irrelevante. Se podría objetar que entonces tambiég se puede presentar la situación a la inversa, como si la bajada del barómetro desplazara la de la presión en relación con la tormenta. Salmon rechaza esta posibilidad aduciendo que, al menos en casos como éste, la correlación entre el barómetro y la tormenta no es exactamente igual que entre la presión y la tormenta. Por ejemplo, es posible que el barómetro a veces funcione mal, esto es, que a veces baje sin que baje la presión o no baje aunque baje la presión, sin que ello afecte para nada a la ocurrencia de la tormenta. Salmon tiene razón que en ese caso C no desplaza D respecto de A, pero hay que advertir que esa salida no vale en casos en los que las correlaciones estadísticas entre la causa y cada uno de sus efectos sean exacfa~nerzfelas rnismas (p.ej. que los barómetros siempre funcionaran bien, o que las "tormentas funcionaran mal" en las mismas ocasiones que los barómetros). Ésa es al menos parte de la motivación de este tipo de ejemplos, y esa parte queda sin resolver. Durante un tiempo, Salmon pensó que podía articular su concepción sin usar explícitamente conceptos causales, que podía capturar los conceptos causales mediante los estadísticos (cf. 1971). Ya hemos visto cómo aborda algunos contraejemplos "causales" a la teoría de Hempel mediante su aparato de particiones. relevancias estadísticas y desplazamientos. Sin embargo, como consecuencia de dificultades como la apuntada al final del párrafo anterior (cf. 1984, caps. 2 y 6), acaba desistiendo de esa idea y se convierte en uno de los principales defensores de los análisis directamente causales. Las relaciones de relevancia estadística seguirán siendo de interés, pero sólo como indicios o síntomas de las relaciones causales. Esta evolución es coherente con uno de los aspectos más controvertidos de su análisis, la caracterización de la relación explicativa como mera relevancia estadística, sin exigir que la relevancia sea positiva. ¿Podemos explicar que M. Thatcher, que es inglesa, haya sido Primera Ministra apelando a que es mujer? Quizá SaImon proteste y diga que la partición involucrada no es homogénea, pero ésa no es la cuestión. ¿Podemos explicar que John sea presidente de una multinacional apelando a que es hispano, inmigró ilegalmente, sus padres eran alcohólicos, sus hermanos drogadictos, vivió en el peor barrio de Los Ángeles, no fue a la escuela, estuvo en la cárcel, y añadiendo tantos factores negativamente relevantes como haga falta hasta que la celda resultante lo sea de una partición homogénea? Salmon insiste en que los factores negativos contribuyen a la comprensión tanto como los positivos. Cuando precisa algo esta idea, recurre a las sugerencias de Jeffrey sobre los mecanismos causales estocásticos (Salmon, 1989, p. 67). o a las de Humphreys sobre causas propiciariisas y resistivas ('contributing a ~ t dcounteracring causes', Salmon, 1984, p. 46; cf. más adelante sec. 5). Si se puede articular esta idea, será seguro en términos causales, no meramente estadísticos. Pero aun así no parece claro que se pueda explicar un hecho recurriendo como condiciones antecedentes sólo a causas resistivas, y eso es lo que permitiría la versión causal de la condición (17) de Salmon si, como él hace, exige sólo que la probabilidad posterior sea diferente a la anterior, no que sea mayor. Quizá la idea de Hempel de que el explanans hace total o altamente esperable el explanan-
dum es discutible, pero de ello no se sigue que explicación y esperabilidad no tengan nada
que ver entre sí. La presencia del explanans debe hacer al menos más esperable al explanandum que su ausencia.
4.
Pragmática de la explicación
En los análisis vistos hasta aquí, la explicación es independiente del contexto pragmático, es algo que se da o no en virtud de que entre ciertos hechos se dé o no una relación objetiva. Una posible excepción es el análisis que hace Hempel de la explicación estadística particular, pues las explicaciones IE están, debido al principio RME, esencialmente relativizadas al contexto cognoscitivo. Sin embargo, esta relativización al contexto es en cierto sentido débil pues el contexto cognoscitivo es demasiado "rígido" en cada momento, el conjunto de creencias aceptadas se puedz considerar (aunque vago) aproximadamente estable en los diversos contextos científicos en un momento dado. Vamos a considerar ahora un análisis de la explicación según el cual ésta es dependiente del contexto en un sentido mucho más radical, depende de elementos pragmáticos, como deseos e intenciones, que varían mucho más fuertemente de contexto a contexto. Sólo así, según los proponentes, se puede dar cuenta de los problemas que hemos venido discutiendo. Los principales autores que defienden este enfoque pragmático son Bromberger, Achinstein y van Fraassen. Bromberger (cf. 1962, 1966) realiza un análisis lingüístico del término 'explicar' como verbo de logro (frente a verbos de estado, p.ej. 'conocer', y de acción, p.ej. 'pasear'). A partir del estudio de la lógica de las preguntas "¿por qué?", establece las características que debe tener una respuesta para ser considerada una explicación adecuada. Achinstein (cf. 1983, 1984) desarrolla una teoría ilociiciorznria de la explicación. Explicar, como prometer o mentir, es un acto ilocucionario (en el sentido de J. L. Austin), un acto de habla cuyo logro depende de las intenciones del hablante. La misma proferencia con el mismo contenido proposicional, p.ej. 'anoche John bebió mucho', puede ser una explicación, proferida por el médico con la intención de explicar la enfermedad de John, o no ser una explicación, proferida por su mujer sin esa intención, p.ej. con la intención alternativa de recriminarle. No vamos a presentar ni siquiera superficialmente estos análisis, nos limitaremos a examinar las Iíneas generales del que más influencia ha tenido, el de van Fraassen (cf. 1977, 1980, cap. 5). Van Fraassen elabora su análisis pragmAtico de la explicación en conexión con los trabajos de Bromberger, la propuesta de B. Hansson (1974) sobre los elementos de contraste y la lógica erotética de Belnap (cf. Belnap y Steel, 1976), junto con una lectura particular de la teoría aristotélica de las cuatro aitíni. Un elemento central de su análisis, que atribuye a B. Hansson, es la idea de clase de contraste. Las explicaciones son respciesrns a P-pregcinras (recuerde el lector que una P-pregunta es una pregunta ''¿por qué?') y toda pregunta de ese tipo lleva asociada. explícita o implícitamente, una clase de contraste sin la cual no se pregunta propiamente nada. La oración interrogativa '¿por qué fue Juan a la fiesta?' puede expresar preguntas
248
FLi\\'D,4'\1E>TOS DE FILOSOFL~ DE LA CIENCIA
diferentes, p.ej. a ) "¿por qué fue Jzran a la fiesta?', o b) "¿por qué fue Juan a la fiesta?". En el primer caso se pide una razón de que fuera Juan, y no otra persona, a la fiesta; en el segundo, se pide una razón de que Juan fuera a la fiesta y no a otro lugar. Ambas son presuntas diferentes y requieren respuestas diferentes. Una P-pregunta. por tanto, debe incluir (aunque usualmente quizá sólo de modo implícito determinado por el contexto), una clase de alternativas frente a las que se contrapone el hecho por cuya razón se inquiere. La forma explícita de una P-pregunta es entonces la siguiente: ''¿por qué a, contrariamente a pl, p2, ...?". Van Fraassen denomina a a el reina de la presunta, y a la clase X = { a ,Di, P?, ...) de todas las alternativas, incluido el tema, clase de contraste. El tema y la clase de contraste no bastan, sin embargo, para identificar completamente una P-pregunta. El motivo es que incluso fijada X, puede haber vanos tipos de respuesta dependiendo de qué relación se considere en ese contexto que es la relevante para que la respuesta se considere una explicación. Por ejemplo, supongamos que pedimos razón de que Juan viniera a la fiesta contrariamente a que se quedara en casa o se fuese al cine. Una respuesta, de un tipo determinado, puede ser que Juan salió de su casa un rato antes, caminó en cierta dirección por cierta ruta, se detuvo en un portal, subió a un piso y el piso es donde tiene lugar la fiesta. Pero en muchos contextos eso, que es una respuesta, no se aceptaría como explicación. No se aceptaría porque se pedían razones de otro tiyo. Esa respuesta no es del tipo que el contexto considera relevante, mientras que sí lo sería, por ejemplo, que Juan quería ver a Luisa y sabía que Luisa iba a ir a la fiesta. Por tanto, hasta que no esté determinado el tipo de respuesta que se considera explicativa en el contexto, la pregunta está indeterminada, en cierto sentido no se sabe qué se pregunta. Van Fraassen denomina relaciólz de relevaizcia explicativa, R, a este elemento adicional necesario para identificar la P-pregunta. R es una relación que relaciona proposiciones (o hechos) y con temas junto con la clase de contraste: yR < o ~X> syss y es (considerada en el contexto) explicativamente relevante para que ocurriera a en lugar de p,, P:, ... Nótese que R sólo determina el tipo de respuesta considerada relevante, no la respuesta misma, pues hay varias respuestas que pueden ser relevantes en el contexto; p.ej. en el caso mencionado podría quizá considerase también relevante como respuesta el que Juan quiere ir al menos a una fiesta cada mes, que ese día es fin de mes y que ese mes todavía no ha ido a ninguna. Ésta es la enseñanza que van Fraassen atribuye a la teoría aristotélica de las cuatro aitiai. La teoría establece cuatro tipos característicos de relación de relevancia explicativa dependiente del contexto; en cierto contexto nos pueden interesar causas eficientes, en otro causas finales, etc. En realidad, las posibilidades son mayores pues p.ej. dentro de las causas eficientes, en un contexto se pueden considerar relevantes causas muy lejanas (p.ej. el Big-Bang) y en otro no pues sólo se aceptan como relevantes antecedentes cercanos. Así, una P-pregunta se identifica mediante el tema a, la clase de contraste X y la relación de relevancia explicati\.a R. Podemos representar entonces una pregunta Q mediante la tema Q = <a, X, R>. X y R dependen del contexto, y aunque en algunos contextos, como los contextos científicos en períodos de ciencia normal, están fijados con bastante rigidez, en otros pueden ser muy variables. Hasta aquí los elementos que Constituyen las P-preguntas. Quedan por precisar las condiciones en que en el contexto se acepta la pregunta.
Toda pregunta Q supone ciertos presupuestos, y Q se aceptará en el contexto si tales presupuestos encajan en el cuerpo de información fáctica aceptada en el contexto. Una pregunta Q presupone tres cosas; a ) a es verdadera, b) las restantes alternativas Pi son todas falsas, y c ) existe al menos una proposición y tal que ;lR<u,X>. Si K es el cuerpo de información aceptado en e[ contexto, la pregunta Q se prodrlce ('arises') en el contexto si K implica a ) y b) y no implica la negación de c). Esto es, para que una pregunta se acepte en un contexto como pregunta que requiere respuesta, la información aceptada en el contexto debe incluir que, de todas las alternativas de X , el tema y sólo él es verdadero, y además no debe excluir que exista respuesta. En caso contrario la pregunta simplemente no se produce, se rechaza. Si Q se produce en el contexto, entonces es posible, si se encuentra, darle una respuesta-explicación. Estas respuestas tienen la forma estándar "u, contrariamente a Bl, p2 ..., porque -i', que muchas veces se expresa en la forma abreviada "porque y" (y es el nzícleo de Ia e~plicación).En términos del análisis visto, estas respuestas dicen dos cosas: a ) u es verdadera, y b) yRcu. X>,e.e. y es relevante (en el contexto) para que ocurra cr en lugar de P1,P2 ... . Éste es el núcleo del análisis de van Fraassen. Nótese que aunque ios ejemplos de terna que usa son de hechos-proposiciones particulares, nada impide que los temas sean proposiciones generales, p.ej. "¿por qué las soluciones ácidas colorean el papel tornasol de rojo?", donde diferentes clases de contraste pueden contener colores alternativos, o papeles alternativos, o soluciones alternativas. Podemos esquematizar el modelo pragmático de van Fraassen del siguiente modo. (19) El explanandum es una proposición cr (singular o general). El explanandum lleva asociada una clase de contraste que incluye otras proposiciones alternativas pl, p:, ... (20) El explanans es una proposición y. (21) La relación explicativa es la de relevancia e'íplicativa R determinada por el contexto: el explanans explica el explanandum syss y es explicativamente relevante, según el contexto, para que ocurra u en vez de pi, J32, ... .
Con este análisis van Fraassen reconsidera algunos de los problemas que hemos visto en las secciones anteriores. Uno de ellos es el relativo a la expIicación de hechos poco probables, como la famosa paresis del alcalde. Para unos, tales sucesos no son explicables, para otros sí. La disputa se disuelve si tenemos en cuenta la clase de contraste: la pregunta de por qué el alcalde, en contraste con otro ciudadano general, contrajo paresis tiene una respuesta correcta verdadera: por su sífilis latente; pero la pregunta diferente de por qué la contrajo, en contrastz con otros miembros de su club de campo también sifilíticos, no la tiene (al menos de momento, cf. 1977, 311.6). Acabamos de ver que este análisis explica también los casos de rechazo de algunas P-preguntas. En cuanto a las irrelevancias, el cuerpo de información K aceptada en el contexto excluye simplemente que la vitamina C sea relevante para la cura del resfriado, o que tomar pastillas lo sea para el no embarazo de los varones, o someterse a una psicoterapia lo sea para la remisión de la neurosis. Por último, el supuesto problema de la simetría no es en realidad, según van
Fraassen, tal problema. Aunque en la mayoría de contextos es la altura del mástil la relevante para la longitud,de la sombra y no viceversa. puede haber contextos en los que la relevancia se invierta, por ejemplo si lo que se pretende construir es un enorme reloj de sol visible desde cierto lugar (1977, 8111.4; cf. también 1980, cap. 5, 93.2). Lo mismo se aplica a los restantes casos. Algunos elementos de la relativización pragmática propuesta por van Fraassen han sido generalmente aceptados. especialmente los relativos a la clase de contraste. El mayor problema lo representa la no restricción de la relación de relevancia. En un detenido estudio, Kitcher y SaJmon (1987) muestran las consecuencias a su juicio inaceptables d e esta liberalidad. Si no se impone ninguna constricción a R, podría haber un contexto en el que esa relación fuese cualquiera, con lo que clialquier proposición podría explicar cualquier <a,X>. bastaría estipular R = {<y, c a, X>>}. No se objeta que eso se pueda proponer en el sentido de que se le ocurra a alguien proponerlo, sino en el sentido de-que no es conceptualmente imposible según el análisis de van Fraassen, y en su opinión eso es una posibilidad que el análisis del concepto de explicación debe excluir. Quizá este ejemplo no sea el mejor, pues van Fraassen sí parece imponer alguna constricción que quizá lo bloquea. La condición es la de cierztiJicidad, los factores relevantes deben ser al menos científicamente relevantes, "y entre los factores científicamente relevantes el contexto determina los explicativamente relevantes" (1980, p. 126). Pero la caracterización que hace después de relevancia científica es extremadamente débil: "Calificar una explicación de científica no es decir nada de su forma o del * tipo de información aducido, sólo que la explicación recurre a la ciencia (al menos en alguna medida) para obtener la información y, más importante, que los criterios de evaluación de cuán buena es una explicación se aplican usando teorías científicas" (ibid. p. 155-156). Esta caracterización excluye quizá los casos ad hoc radicales, como el mencionado de la estipulación extensional de R, pero difícilmente otros menos artificiales. Como señala Salmon, ;es un factor científicamente relevante de la muerte de Kennedy cierto día, por contraste a otros días, que el Sol estuviera en Acuario?, Les científicamente relevante la relación de influencia astral? Para que la anterior caracterización la excluyese, la teoría astrológica debe ser excluida de la ciencia, pero van Fraassen no dice nada al respecto. Y en realidad le sería difícil decir algo pues, en ausencia de constricciones a las que no quiere recurrir, la cientificidad es un atributo con una gran carga pragmática y extremadamente sociodependiente. Así pues, sin ulteriores precisiones la cientificidad no puede soportar el peso de excluir conceptualmente algunas relaciones como irrelevantes en lodo contexto. Esta situación quizá no es tan indeseable para alguien como van Fraassen, cuya extrema liberalidad en este punto se compadece bien con el empirismo constructivista que defiende (cf. irgra capítulo 10, $4). Para muchos, sin embargo, es inaceptable. Según éstos, aunque indudablemente el contexto desempeña un papel importante en la determinación de la relación de relevancia explicativa, esta relación debe estar conceptualmente restringida a límites más estrictos. Los análisis de las anteriores secciones se pueden ver como propuestas en este sentido. Hempel exige que la relación sea de inferencia lógica (deducti~~a o inductiva) mediante leyes naturales. Salmon exige que sea de relevancia estadística, tam-
bién mediante leyes naturales. Vamos a ver ahora dos nuevas propuestas, la que exipe que la relación sea causal y la que exipe que sea de subsunción o unificación teórica.
5. Esplicación y causalidsid j
i
t
f
5
$;
F*
.L
E a
'&
g $ ; i
. ;;
:I$ ,
1% íj i:
'
1 ,
'
; ft
5
En la sección 2 vimos que muchos de los problemas con los que se enfrentaba el análisis d e Hempel tenían que ver intuitivamente con la causalidad. Según muchos críticos, dicho análisis presenta como explicativas determinadas inferencia que intuitivaniente no se pueden considerar así por no incluir los elementos causales apropiados. En las dos secciones anteriores hemos visto dos intentos de afrontar esos problemas sin recurrir explícitamente a nociones causales, y las dificultades a que se enfrentaban. Para muchos, el único modo d e responder satisfactoriamente a estas dificultades es apelando directamente a nociones causales. Los principales autores.que defienden esta tesis son Brody (1972, 1974), Humphreys (1981, 1983, 1989). D. Lewis (1956) y Salmon en su segunda época (1980, 1984, 1989). Estos autores difieren sobre todo en su peculiar elucidación del concepto de cansa, pero comparten un núcleo común en su uso de este concepto para el análisis de la noción de explicación. La idea central es que en la explicación de un hecho el explanans no tiene por qué asegurar la ocurrencia del explanandum, tampoco hacerlo altamente probable, ni siquiera (en opinión de Salmon) incrementar su probabilidad. Todo ello est5 vinculado a la idea hempeliana de esperabilidad, pero la noción de explicación no tiene que ver,,al menos no directamente, con esa idea. Explicar un hecho no es mostrar que es (totalmente, mucho, o tan sólo más) esperable, es proporcionar información causal sobre su ocurrencia: "explicar un acontecimiento es proporcionar información acerca de su historia causal" (Lewis, 1986, p. 217). Quizá a veces, o incluso en muchas ocasiones, la explicación confiere cierta esperabilidad al explanandum, pero ello es así sólo derivativamente, consecuencia de que a veces la información sobre la historia causal, que es el objeto básico de la explicación, tiene ese efecto. Los hechos tienen una larga historia causal y una explicación no requiere informar acerca de toda ella. Cada hecho tiene muchos otros hechos antecedentes como causas; en cada momento del pasado de un hecho (p.ej. este accidente de automóvil) hay una multiplicidad de hechos (la carretera mojada, el cansancio del conductor, el estado de las ruedas, ...) que son causas parciales del mismo y que conjuntamente constituyen su causa totnl en ese momento (cf. cap. 5, 53). Además, en general dicha multiplicidad causal varía en cada momento del pasado de un suceso. Así, la historia causal completa de un hecho recoge el conjunto de todas las causas parciales antecedentes. Pues bien, una explicación no requiere informar sobre toda la historia causal, ni siquiera, generalmente, sobre la causa total en un momento antecedente dado. En general se exipe sólo información sobre akurzos factores causales. Cuáles son esos factores es algo que depende de cada contexto explicativo, el contexto determina qué antecedentes causales se consideran relevantes o destacados a efectos explicativos en esa ocasión. La relación de exp-licaciónes la relación de relei~anciacartsal; que es causal lo establece el análisis, pero cuáles de los innumerables antecedentes causales son los relevantes a efectos expliccttivos lo establece el contex-
252
FüND.4SlEhTOS DE FILOSOF~.~ DE LA CIENCIA
to. Éste es el núcleo de los análisis causalistas de la explicación, que podemos resumir del siguiente modo:
(22) El explanandum es un hecho particular e. (23) El explanans es un hecho particular c que pertenece a la historia causal antecedente de e. (24) La relación explicativa es la de relei)a~zciacausal, determinada por el contexto: el explanans explica el explanandum e syss c es, relativamente a ese contexto, un factor causal explicativamente relevante para e. Nótese que aparentemente este esquema no hace referencia a leyes, pero sólo aparentemente. No hay referencia explícita a las leyes pero sí irnplícita. El explanans está causalmente relacionado con el explanandum y, como vimos en el capítulo 5, las relaciones causales entre hechos particulares se dan ert virtud de que los hechos eje~nplifica~t ciertas propiedades (p.ej. "ser un accidente", "ser un pinchazo") y de que hay urta relación nómica entre esas propiedades, esto es, ciertas leyes que las conectan. Por tanto, la referencia a las leyes está implícita en (23). Ahora podemos ver que este análisis resuelve los problemas tradicionales. Prioridad temporal: las explicaciones en las que el explanans es posterior al explanandum (eclipse actual explicado por posiciones futuras) no son válidas, pues el explanans debe ser causa del explanandum y las causas preceden a sus efectos. Simetría: la sombra no explica la altura del mástil, ni el espectro lumínico la estructura atómica de un elemento determinado, pues las relaciones causales son de heclzo las inversas, el mástil causa la sombra y la estructura atómica el espectro, y la causalidad es una relación asimétrica (si x causa y, y no puede a su vez causar x). Efectos de causa común: el descenso del barómetro no explica la tormenta pues, aunque está correlacionado con ella, no es parte de su historia causal, la causa antecedente es el descenso de presión. Irrelevancia: que Juan tome pastillas anticonceptivas no explica que no se haya quedado embarazado, que el terrón esté embmjado no explica que se disuelva, que Luisa tome vitamina C no explica la remisión de su resfriado. El suceso que pretende ser explanans no está causalmente vinculado con el explanandum. Quizá se piense que el que Juan tome pastillas anticonceptivas sí forma parte de la historia causal de su no embarazo, pues ese mismo Juan, rnienrras se torna las pastillas es varórz, y ese su ser varón es causa de su no embarazo. Aquí hace falta hacer una observación sobre la metafísica de los hechos o acaecimientos. Los hechos, como otros particulares, se idem.$caiz al menos en pane por las propiedades que ejemplifican, de modo que puede haber hechos copresentes diferentes. El hecho consistente en que Juan toma (este mes) pastillas es diferente del consistente en que Juan es (este mes) varón, aunque ambos son copresentes, ocurren en la misma región espaciotemporal. Pues bien, de estos hechos particulares diferentes, el segundo y no el primero está causalmente relacionado con su no embarazo; por supuesto que con una mujer pasaría al revés, pero nada raro hay en eso, simplemente las relaciones causales que de hecho se dan en el mundo son en cada caso ésas. Este esquema básico es perfilado de modo parcialmente diferente por los diversos
i 1
1
1
autores. Algunos (Humphreys, Salmon) distinguen causas propiciarisas ('contrib~itirig') y resistivas ('counteracting'). Las primeras contribuyen positivamente a la ocurrencia del efecto, las segundas negativamente, e.e. contribuyen a su no ocurrencia; p.ej. fumar es una causa propiciativa del cáncer de pulmón, hacer ejercicio es una causa resistiva. Este carácter no es absoluto, puede alterarse por [a presencia de otras causas, p.ej. la arena es causa propiciativa de accidentes, pero en presencia de hielo es causa resistiva. Las explicaciones apelan a ambos tipos de causa, tienen la forma general "e porque X a pesar de Y', donde X es un conjunto de causas propiciativas e Y uno de causas resistivas. Humphreys permite que Y pueda a veces ser vacío. Por lo que comentamos en la sección 3 sobre la relevancia estadística negativa, Salmon parece comprometerse además con que también puede ocurrir lo contrario, que el explanans sólo contemple causas resistivas, pero eso parece más implausible. Otra variación afecta el tipo de elementos sobre los que actúa el contexto. Según algunos autores, los factores causrtles quz en el contexto se consideran explicativamente relevantes no dependen sólo de cuál sea el hecho antecedente sino además de cómo se describa éste. Un mismo hecho, antecedente causal, puede considerarse explicativamente relevante bajo una descripción y no bajo otra. Un mismo hecho puede tener más de una propiedad, no toda propiedad determina un hecho diferente.= Por ejemplo, eso que está sucediendo a mil metros sobre la estatua de Colón de Barcelona tiene la propiedad de ser un huracán, pero también, p.ej., la de ser comentado en primera página de la edición de mañana del diario El País, y también por cierto la de estar ocurriendo a mil metros sobre la estatua de Colón, y la de ser usado como ejemplo en este libro. Pues bien, esas diferentes propiedades que ejemplifica un mismo acaecimiento permiten dar descripciones diferentes de él, y puede ser que bajo una descripción sea explicativamente relevante y bajo otra no. Por ejemplo, el huracán y lo descrito mañana en primera página de El País son el mismo acontecimiento, pero mientras que "el accidente se produjo porque el avión intentó atravesar el huracán" sería explicativo, "el accidente se produjo porque el avión intentó atravesar lo qi:e describió al día siguiente en primera página El País" no lo sería. O, suponiendo que creencias y deseos sean acontecimientos particulares idénticos a acaecimientos particulares microfísicos, "Juan se compró el último libro de García Márquez porque d e s e a b ~leer un buen reportaje sobre el narcotráfico en Colombia" sería una explicación, pero "lo compró porque tales y cuales átomos estaban así y asá", no lo sería. Aunque los eventos particulares son el mismo, y por tanto de ambos modos se nombra un mismo hecho particulx que es causa del explanandum, en un caso se describe mediante la propiedad que está causalmente conectada con la propiedad con la que se describe el explanandum, y en el otro no. Así, entre los muchos modos en que se puede nombrar el suceso que es causa antecedente, el contexto determinaría cuál de ellos es el explicativo. Se puede exigir que sea siempre el que describe el suceso antecedente mediante una propiedad causalmente vinculada a aquella con la que se describe el explanandum; o, como Lewis, se puede dejar totalmente abierto considerando que el contexto puede privilegiar como explicativa cual2. Aunque algunos filósofos lo niegan (cf. p.ej. Kim. 1996, cap. 3, $7).
254
FCSD.AI\~E\TOS DE FILOSOF~ADE LA CIENCIA
quier descripción. Es importante notar que si la relevancia explicativa depende del modo en que se describe el antecedente causal, entonces no se puede hablar, corno venimos haciendo, del explanans y del explanandum como hechos; habría que presentarlos como enunciados o, alternativamente, como hechos más modos de presentación. Éste es el motivo último, según los causalistas, de los aspectos intensionales de la explicación que mencionamos al final de la primera sección. Concluiremos mencionando tres retos a los que deben enfrentarse los modelos de la explicación causales. Se trata de tres tipos de explicaciones que, en principio, parecen difíciles de analizar en los términos propuestos por el causalista. (A) Explicación de sucesos particulares probabilistas. Por ejemplo, que Juan tenga cáncer de pulmón (contrariamente a Rosa) o que un electrón disparado contra una barrera de potencial la atraviese (contrariamente a que se refleje). Aquí suelen distinguirse dos casos. Que el suceso sea sólo episrbnica~nertteprobabilista, como (quizá) el cáncer de Juan. En estos casos el suceso no está propiamente indeterminado, tiene causas tales que si se dan entonces se da necesariamente el efecto, pero no las conocemos cornpletainente; sólo conocemos "partes" de la causa total, p.ej. el hábito de fumar, y nos falta conocer los otros factores que, conjuntamente con los conocidos, determinan plenamente el suceso. Este caso se reduce pues al no probabilista, aunque con limitaciones epistémicas (quizá todas las explicaciones en las ciencias especiales son así, cf. cap. 5, $4 sobre leyes probabilistas y cláusulas cerer-is paribus). La segunda posibilidad es que el suceso sea objerivamente probabilista, como (quizá) el del electrón, que según la mecánica cuántica tiene una probabilidad de 0,9 de reflejarse y de 0,1 de atravesar la barrera. Se suelen' dar tres tipos de respuesta a esta situación. La primera es negar que existan sucesos objetivamente probabilistas, todos son como el del cáncer (la mecánica cuántica es pues una teoría incompleta). La segunda es aceptar que tales sucesos irreductiblemente aleatorios existen, pero rechazar que haya causalidad indeterminista, con lo que carecen de explicación. La tercera es aceptar que hay relaciones causales objetivamente probabilistas; estos sucesos se explican, como los deterministas, dando información sobre sus causas. Nótese que en este último caso, aun si hay causalidad probabilista, la información causal proporcionada en la explicación de su ocurrencia sería la rnisltza que en la de su no ocurrencia, consecuencia para muchos inaceptable. (B) Explicación de hechos generales (nómicos, esto es, de leyes). Aquí cabe distinguir tres casos. Primero: el explanandum es una regularidad nómica no causal, como la ley de caída libre de Galileo o las leyes de Kepler. En este caso la explicación consiste en su derivación a partir de leyes propiamente causales, como las de la mecánica newtoniana, leyes que introducen las entidades-propiedades teóricas causalmente responsables de la regularidad empírica (cf. caps. 8 y 10). Este tipo de explicación involucra siempre alguna forma de reorizaciórz (cf. cap. 11, 92). Segundo: el explanandum es una ley causal y se explica derivándola de otras leyes más básicas y de relaciones de constitución entre las propiedades que aparecen en el explanandum y las de las leyes más básicas. Por ejemplo, explicamos la ley causal "a volumen constante, el aumento de temperatura de un gas produce un aumento de presión", a partir de leyes causales de la teoría cinética de los
gases y la ley de constitución que dice que la temperatura de un gas es o consiste en la energía cinética media de sus moléculas. Análogamente se explican algunas leyes (causales) de la genética mendeliana a partir de las leyes de la genética cromosómica y de la relación de constitución entre genotipos y cromosomas. Este tipo de explicación involucra siempre alguna forma de reducción explicativa (cf. cap. 11, $5). Tercer caso: el explanandum es una ley causal y se explica derivándola de otras leyes más básicas que explican también otras leyes diferentes. En este caso se da cierta forma de un$cación causal, varias leyes causales se deben a una causa común, a una misma ley causal más básica. Por ejemplo, diversas leyes sociológicas sobre la influencia causal de factores religiosos, políticos, familiares, etc., serían explicadas, según el marxismo ortodoxo, por otras económicas más básicas; o las leyes en las que intervienen las cuatro fuerzas de la naturaleza serán explicadas, según los físicos que creen en la Teoría Unificada, por las leyes de una única fuerza, más básica. También puede haber casos en los que se mezclen los dos últimos tipos de explicación. (C) Explicaciones aparentemente no causales. La estrategia aquí es, o negar que tales casos constituyan explicaciones genuinas, o negar que no son causales. Vimos que Hempel ponía como ejemplos la explicación del período de un péndulo apelando a su longitud y a la ley del péndulo, o la de la posición y velocidad de un grave en cierto instante apelando a una posición y velocidad anteriores y a la ley de Galileo. Estos casos, se replica, así descritos no son explicaciones, y bien descritos son explicaciones causales. Ciertamente la posición y velocidad de un cuerpo en cierto momento explica su posición y velocidad en otro momento posterior, pero no por su conzxión, aunque nómica, no causal expresada en la ley puramente cinemática de Galileo, sino por su conexión causal a través de leyes dinámicas que involucran propiedades causales como fuerzas y masas; en este punto se aplica lo relativo a la explicación de leyes no causales a partir de otras causales que hemos visto en el apartado anterior. Análogamente para el péndulo. Railton (1980) ha presentado otros casos más complejos, especialmente algunos de los que denomina explicaciones estructurales, que apelan a leyes de coexistencia (como el principio de exclusión de Pauli) o de conservación (como el de la energía). La respuesta es similar a los casos más simples anteriores: en la medida en que sean propiamente explicaciones se aducen hechos causales antecedentes (cf. p.ej. Lewis, 1986, $111). Independientemente de estos retos. que siguen parcialmente abiertos, la principal dificultad de este tipo de análisis es que.depende de que se ofrezca previamente una elucidación satisfactoria de la noción de causa, que al menos desde ~ u m ha e resultado sospechosa a los filósofos de orientación empirista. Hemos visto que el análisis causalista resuelve los problemas tradicionales, pero ello no les confiere mucho mérito en sí mismo pues la solución es inmediata si aceptamos hacer uso del concepto de causa, asimétrico, unidireccional, etc. La cuestión es entonces analizar este último concepto, salvo que se quiera tomar como primitivo, algo para muchos inaceptable. Lewis lo analiza mediante contrafácticos y, en última instancia. leyes naturales. Salmon mediante las nociones de interacción, transmisión de información y la diferencia entre proceso y pseudoproceso. Humphreys mediante las nociones de estructura, de preservación y de contenido experi-
mental. Cada uno de estos análisis tiene sus propias dificultades y sigue siendo de momenuna cuestión debatida la posibilidad de elucidar las nociones causales de modo aceptable desde un punto de vista (moderadamente) empirista.
to
6. Unificación teórica La idea básica que hay detrás de los análisis de la explicación como unificación es que la comprensión del mundo que proporcionan las explicaciones consiste en la reducción de la cantidad de supuestos básicos independientes de nuestro cuerpo de creencias. La unificación consiste en mostrar dependencias, reduce pues la cantidad de supuestos independientes y es lo que proporciona verdadera comprensión. Aunque hay ciertas sugerencias anteriores en este sentido (cf. p.ej. Mill, 1904, pp. 229-30 y Feigl, 1970, p. 12), el primero en presentar un modelo elaborado de explicación como unificación fue Friedman (1 974). La idea central de Friedman es que la explicación científica consiste esencialmente en la reducción de la cantidad de leyes indepei~dienreineitreaceptables. Friedn-ian, que considera que los fenómenos a explicar son primariamente fenómenos generales, desarrolla esta idea en conexión con el problema de Hempel de distinguir, en las explicaciones de leyes, los casos espurios de los genuinos (cf. más arriba P7 de la sección 2). El núcleo de su propuesta para resolver el problema es que una regularidad es explicada por otras si se aceptasigue de ellas y además éstas reducen la ca~itidadde Izechos ilideyeiidieiire/?ze~zte bles. Las leyes de Newton explican las de Kepler porque, además de implicarlas, reducen la cantidad de regularidades que se aceptan independientemente unas de otras: antes de la explicación, las leyes de Kepler y, p.ej., la de Galileo eran aceptadas independientemente unas de otras, después no; la conjunción de las le1.e~de Kepler con la de Boyle no es una explicación de las primeras porque no produce ese efecto. Nótese que esta noción de explicación está esencialmente relativizada a un cuerpo K de creencias aceptadas en un momento dado, y exige una elucidación precisa de la relación de ilidepelidieiite acepfabilidad entre las creencias de K. Con ayuda de estas nociones, Friedman define a) una regularidad K-atóiizica como aquella que no equivale a una conyunción de otras independienremente aceptables entre sí, y 6 ) una K-parricióit de un conjunto Y de regularidades aceptadas como un conjunto de regularidades K-atómicas cuya conjunción equivale a la conjunción de los miembros de Y. Con este instrumental expresa su idea central aproximadamente del siguiente modo (esta versión omitz alzunas complicaciones importantes que no podenlos tratar ahora): el explanans, S, K-explica el explanandum, E, syss E se sigue de S y la cardinalidad de la K-partición más pequeña de K es menor que la de la K-partición más pequeña de K-{S}. La explicación es una iiferencia uitificadora, el explanans reduce la cantidad dz creencias independientemente aceptadas. El análisis de Friedman presenta algunas dificultades importantes. La principal, puesta de manifiesto por Kitcher, es que excluye explicaciones intuitivamente satisfactorias cuyo explanans está formado por leyes independientemente aceptadas, como la explicación de la ley de la expansión adiabática de los gases a partir de la ley de Boyle y el
primer principio de la termodinámica (Kitcher, 1976, p. 209 SS.).A pesar d e ello, Kitcher considera que el núcleo del análisis de la explicación como inferencia unificadora es esencialmente correcto y desarrolla su propio modelo del mismo (cf. 198 1, 1989), siendo en la actualidad el principal exponente de esta concepción. La idea central de Kitcher es que hay varios modos de sistematizar mediante inferencias un cuerpo de creencias aceptadas K, que sistematizaciones alternativas son comparables según la mayor o menor unificación que producen en K, y que una inferencia es explicativa si pertenece a la mejor sistematización de K (las creencias de K son sobre hechos generales, sobre regularidades). No podemos exponer aquí la elaboración que hace de esta idea en todos sus detalles; nos limitaremos a presentar someramente sus líneas generales. El concepto central es el de patrón argurnentntivo. Según Kitcher, para evaluar el carácter explicativo de una inferencia no cuenta sólo cuáles son las premisas y la conclusión, se debe tomar en consideración también "cómo las premisas conducen a la conclusión" (1989, p. 431). Kitcher denomina arg~itnentaciones,o también derivaciones, a las inferencias en este sentido, premisas más conclusión más el camino de aquéllas a ésta. Cada argumentación concreta está constituida por una secuencia de sentencias. Si en una sentencia sustituimos por variables algunas de (no necesariamente todas) sus expresiones no lógicas obtenemos un esqiiema sentencinl; por ejemplo en la Teoría de la Herencia: (*) "P es estable en el linaje que conduce de S a G" (nótese que este esquema sentencia1 contiene todavía algunas constantes no lógicas, p.ej. "linaje"). Un esquema nrguineiztal es una secuencia de esquemas sentenciales. Los esquemas argumentales se acompañan de iizstrrrcciottes de relleno que especifican las expresiones por las que se puede sustituir cada variable, p.ej. "P se debe sustituir por nombres de rasgos, G por nombres de grupos de organismos o poblaciones y S por nombres de especies". Los esquemas argumentales, secuencias de esquemas sentenciales, también van acompafiados de una clasificación, que especifica las características inferenciales de los elementos de la secuencia, esto es, cuáles son premisas, cuáles se infieren de cuáles otros, mediante que reglas, etc. Un esquema argumental, junto con un conjunto de instrucciones de relleno y una clasificación, constituyen un patrón argurnentntivo. Un patrón argurnentativo es más rigrrroso ('stringent') que otro si "las condiciones de sustitución [del primero] son más difíciles de satisfacer [que las del segundo]'' (1989, p. 433). La idea es que las sistematizaciones alternativas de K consisten en conjuntos alternativos de argumentaciones concretas que se pueden comparar en términos de los patrones argumentativos que tales argumentaciones concretas ejemplifican. Una sistematización de K, S(K), es cualquier conjunto de derivaciones concretas que obtienen como conclusión unos miembros de K a partir de los otros; una sistematización es aceptable, relativamente a K, si sus argumentos. que contienen como premisas miembros de K, son dedzrctivos (1989, p. 434; sobre la exigencia de deductividad vol~eremosdespués). Decimos que un conjunto P de patrones argumentativos geríern una sistematización S(K) si cada derivación concreta de S(K) es una instancia de algún patrón de P. Es obvio que puede haber diferentes conjuntos generadores para una misma sistematización. Un conjunto generador de S(K) no es más que un modo de esquematizar las derivaciones concretas de S(K) y hay por lo general más de un modo de hacerlo, Lo importante es que se
puede establecer un criterio para comparar el poder wzificador de los diversos conjuntos seneradores. El poder unificador de un conjunto de patrones que _genera un conjunto de derivaciones concretas depende directamente de a) la cantidad de conclusiones de las derivaciones y b) el rigor de sus patrones, e inversamente de c) el número de sus patrones. Esto es, un conjunto generador es tanto más unificador cuanto más conclusiones pueda generar, cuanto más rigurosos sean los patrones y cuantos menos patrones use. Pues bien, entre los diversos conjuntos generadores de S(K), denonlinamos base de la sistematiracióil S(K), B(S(K)), al conjunto generador con mayor poder unificador (nótese que si comparamos conjuntos generadores de la inisina sistematización, el criterio a) no tiene efecto, pues se refiere a la cantidad de conclusiones del conjunto generado). B(S(K)) da la medida del máximo grado de unificación asociable a la sistematización S del cuerpo de creencias aceptadas K, expresa la esquematización de S(K) máximamente unificadora. Ahora podemos comparar sistematizaciones alternativas de K. Simplemente, la mejor sistematización de K es aquella que tiene la mejor base. Sean Si(K), S2(K),... diferentes conjuntos de inferencias que sistematizan K, y sean B(S,(K)), B(S2(K)), ... sus bases: Si(K) es la sistematización más unificadora syss B(S;(K)) es la base más unificadora según los criterios a)-c). A la mejor sistematización la denomina Kitcher el alinacéiz esplicativo de K, E(K) ('explarzatoly store'). Intuitivamente, E(K) es el conjunto de derivaciones que sistematizan K que maximiza el número de conclusiones y el rigor de los patrones inferenciales y que minimiza el número de patrones (y por tanto también el número de premisas). Pues bien, una explicación no es más que una inferencia que pertenece al almacén explicativo, a la mejor sistematización de K. El lector habrá adivinado quizá que las diferentes sistematizaciones del mismo cuerpo K son en cierto sentido diferentes teorías sobre K. Efectivamente, las teorías científicas no son para Kitcher sino conjuntos de derivaciones que constituyen sistematizaciones en el sentido preciso indicado; con esta noción de teoría afronta las cuestiones principales de la dinámica científica (cf. 1989, $7, y especialmente 1993; para algunas dificultades de este programa cf. Díez, 1994b). Por tanto, una explicación no es más que una inferencia que pertenece a la teoría más unificadora. Nótese que de esta concepción se sigue que el carácter explicativo o no de una inferencia puede cambiar con el tiempo, la aparición de teorías más unificadoras puede desacreditar explicaciones anteriores. Pero esto es una consecuencia que Kitcher no considera un defecto de su modelo sino todo lo contrario. Éste es en líneas generales el núcleo del análisis de Kitcher. Se trata de un programa todavía en desarrollo y, por tanto, parcialmente abierto. Algunas de las principales cuestiones que requieren ulterior tratamiento son las siguientes.
(A) Explicaciones de hechos particulares. Mencionamos más arriba que para Friedman la explicación es básicamente de fenómenos generales. Como muestra implícitamente la presentación anterior, para Kitcher también. Lo que hay que explicar primariamente son regularidades empíricas, y se explican subsumiéndolas bajo (derivándolas de) sistemas teóricos unificadores. En cierto sentido también se pueden explicar hechos particulares, pero, por así decir, ello no constituye una tarea especialmente interesante además de la anterior. La idea es que explicar un hecho particular consiste en explicar el fenómeno general y en
constatar que el hecho particular es de ese tipo; la explicación básica es la de regularidades, y la de hechos particulares se obtiene inmediatamente al añadir que el hecho particular es del tipo especificado en la ley. "La pregunta '¿por qué este objeto particular se comporta de este particular modo?' es transformada en la pregunta 'jpor qué objetos ideales de este tipo general exhiben esas propiedades?"' (1989, p. 453). (B) Simetrías e irrelevancias. Kitcher acepta que toda teoría de la explicación debe dar cuenta de estos problemas, y en su opinión la suya lo hace de modo satisfactorio. La estrategia es mostrar que, dadas dos inferencias alternativas, será explicativa la que pertenezca a la sistematización más unificadora, y que esta comparación arroja en los casos en consideración los resultados intuitivamente esperados. La altura del mástil explica la longitud de la sombra y no al revés. Pensemos en las dos sistematizaciones, la que contiene inferencias que parten de la altura del mástil y conducen hasta la longitud de la sombra, y la que contiene inferencias que proceden al revés. La primera es más unificadora que la segunda. Si la segunda no tiene otro tipo de inferencias, pierde algunas conclusiones pues no puede establecer p.ej. la altura de mástiles de noche, o en días nubosos, etc. Y si recupera esas conclusiones es al precio de introducir nuevos patrones argumentativos. En cualquiera de los dos casos es menos unificadora según los criterios a)-c). Análogamente ocurre con la irrelevancia. Una sistematización que contiene derivaciones del no embarazo de Juan usando como premisa que Juan toma pastillas anticonceptivas no puede ser la mejor. Si también quiere explicar que otros varones que no toman pastillas tampoco se quedan embarazados, estas nuevas inferencias también se aplicarán a Juan, con lo que podremos prescindir de las inferencias anteriores, obteniendo una sistematización con menos patrones. sin perder conclusiones. Como reconoce Kitcher (1989, $7.2-3), estos argumentos presuponen que las sistematizaciones no usan predicados no proyectables, como 'verdul' (cf. cap. 5, $2). (C) Explicaciones estadísticas. Kitcher sostiene que las explicaciones son cierto tipo de inferencias y además que son inferencias deductivas, pero eso parece dejar de lado las explicaciones estadísticas de hechos particulares. Nótese que no se dejan de lado las explicaciones de hechos estadísticos generales pues, como ya vimos al tratar del enfoque de Hempel, también son deductivas. Y en cierto sentido, puede decir Kitcher, con eso basta, pues como hemos visto en (A) esa explicación de hechos generales es la básica. Se podría decir que hay explicaciones de hechos estadísticos particulares en el sentido de que hay explicaciones deductivas de regularidades estadísticas a las que se puede añadir la constatación de que se ha dado el hecho particular (esta línea de respuesta se parecería a la de Railton, cf. szcpra, sección 3). Pero en otro sentido más profundo no hay explicaciones de estos hechos. Kitcher es un abogado del deductivismo, piensa que no hay explicaciones inductivas, que seguramente los llamados hechos particulares probabilistas son todos probabilistas sólo epistémicamente, y que caso de haber hechos particulares objetivamente probabilistas carecerían de explicación (cf. 1989, $5). Éstas son en parte cuestiones todavía abiertas. Independientemente de ellas, la mayor dificultad del análisis de Kitcher es que la noción de poder unificador sobre la que descansa es de momento problemática. En primer lugar, en espera de mayores precisiones,
260
FUSD.4HEh"OS DE F I L O S O F DE ~ ~ L.4 CIENCIA
es extremadamente vaga. No se especifica cómo contrapesar de modo preciso los criterios a)-c) co~~jirrttamen~e. La situación es clara en los casos en que dos sistematizaciones coinciden en dos de los criterios y sólo se diferencian en el restante. Pero nada se dice del peso relativo de ellos, sin lo cual no se pueden resolver los otros casos, que son seguramente los históricamente interesantes. ¿Qué ocurre si una sistematización logra más conclusiones que otra pero mediante más patrones o patrones menos rigurosos? Por otro Iado, caso de que se precise el peso relativo de los diferentes criterios, nada garantiza que no pueda haber casos de genuina indeterminación, en los que después de contputar su poder unificador, dos sistematizaciones resulten equi~alentes.Eso confiere una notable indeterminación a la noción de explicació~tcomo inferencia perteneciente a la sistematización más unificadora. Esta cuestión se relaciona con otra. No está claro si ante varias inferencias lo que se pretende decir es que una es explicativa y las otras no, o sólo que unas son más explicativas que otras. Parece que la intención es distinguir entre inferencias explicativas y no explicativas, pero a la vez el aparato sólo parece poder aseverar que una inferencia es más o menos explicativa que otra. Si eso es así, ello conferirfa un carácter esencialmente cornpararivo a la noción de explicación, la eqdicatii.idad no sería una propiedad de ciertas inferencias sino una relación coinpal-arivaentre pares de ellas. Queda por último el tema de la causalidad. El análisis unificacionista podría en principio ser complementario del causalista. Quizá pudiera darse una síntesis entre ambos, o se podría quizá defender que el primero es aplicable a las explicaciones en unos ámbitos y el segundo a las explicaciones en otros. Ésta puede ser otra cuestión abierta. Pero claramente no es así para Kitcher. En primer lugar, piensa que hay explicaciones claramente no causales (aunque sus ejemplos preferidos son de la matembtica, y por tanto controvertidos, cf. 1989, $3.2). Pero aun cuando se pueden calificar muchas explicaciones de causales, la única síntesis que acepta es la del reductor: sí hay causalidad, pero las relaciones causales son derivativas de las relaciones de explicación y, en último término, de la unificación teórica. En diversos pasajes Kitcher insiste una y otra vez sobre ello: ''[E]] concepto de dependencia causal es derivativo del de dependencia explicativa"
(1989, p. 436). "El punto crucial es que el 'por qué' ['becairse']de la causación es siempre derivativo del 'por qué' ['because'] de Ia explicación" (ibid.,p. 477). "Los mecanismos básicos [causales] deben ser aquellos indicados en nuestra mejor unificación de nuestras mejores creencias. [...] Recomiendo rechazar la idea de que hay verdades causales independientes de nuestra búsqueda de orden en los fenómenos" (ibid., p. 497). "La noción de relevancia causal no tiene sentido independientemente de la noción de relevancia explicativa y no hay otro sentido de la noción de relevancia explicativa que el de figurar en la sistematización de la creencia en el límite de la investigación científica guiada por la búsqueda de unificación" (ibid.,p. 499). "[Lla estructura causal del mundo, las divisiones de cosas en clases, las dependencias objetivas entre fenómenos son todos generados por nuestros esfuerzos de organización" (1 993, p. 172). Desde la perspectiva causalista, la comprensión del mundo consiste en el conocimiento de los mecanismos causales, y la ciencia explica los fenómenos, los hace compren-
sibles, proporcionando información (contextualmente relevante) sobre su historia causal. Según el modelo rrnificacionista, la comprensión del mundo consiste en reducir el cuerpo de supuestos básicos independientes que es necesario aceptar, y la ciencia explica los fenómenos, los hace comprensibles, unificándolos. Para el causalista la explicación descansa primariamente en una relación ontológica, la de causalidad (aunque la cantidad y tipo de información requerida sobre ella dependa en cada contexto de elementos pragmáticos). Para el unificacionista, la explicación descansa primariamente en una relación epistemológica, la de unificación teórica. El causalista ontologiza la explicación, el unificacionista tiende, al menos así es explícitamente en el caso de Kitcher, a epistemologizar la causalidad. Las espadas siguen en alto y está por ver si es posible o no una síntesis entre ambas aproximaciones. Kitcher desarrolla su modelo desde una concepción claramente enunciativista dz las teorías. Recientemente se han propuesto análisis de la explicación como unificación en el marco de las concepciones semánticas de las teorías, en concreto partiendo de la noción modeloteórica y reticular de teoría que propone el estructuralismo (cf. Bartelborth, 1996). Como aquí aún no se ha expuesto con detalle esta concepción metateórica, enunciamos esquemáticamente sólo el núcleo de la propuesta (el lector puede volver sobre ella una vez familiarizado con los conceptos básicos de dicha concepción, cf. cap. 10, $5). La idea es que la noción estructuralista de red teórica, que estudiaremos más adelante, contiene los elementos necesarios para elucidar las relaciones explicativas como unificación o subsunción en términos modeloteóricos. Los fenómenos empíricos a explicar son los modelos de datos (aplicaciones intencionales). Estas regularidades empíricas se explican mediantz leyes teóricas, subsumiéndolos bajo modelos ampliados teóricamente. Esta subsunción por extensión teórica captura el elemento causal de la explicación de los fenómenos empíricos, pues las entidades teóricas introducidas (p.ej. dinámicas) "dan cuenta" del comportamiento de los sistemas de datos (p.ej. cinemáticos). Por otro lado, las leyes teóricas mismas están orgánicamente estructuradas y unificadas en una red, red en la que las leyes más específicas se derivan de, y en ese sentido se explican mediante, otras más generales; en este caso la regularidad explicada es ella misma causal, aunque de bajo nivel. Por último, sistemas completos orgAnicos de leyes se pueden explicar mediante otros más Unificados, en el sentido preciso que proporciona el concepto de reducción estructural (cf. cap. 11, $3), y que captura algunos de los elementos de la comparación de poder unificador de Kitcher.
7. Apéndice: Explicación teleológica y funcional (*)
En la sección 2 mencionamos las explicaciones teleológicas y funcionales entre los problemas a que debía enfrentarse el modelo de cobertura 1egal.inferencial de Hempel. El problemafundamental era que, contrariamente a lo que parece usual en el resto de explicaciones, en las explicaciones teleológicas y funcionales parece que no se deriva el explanandum del explanans sino éste de aquél. Explicamos las largas orejas de los conejós por Su función en el control de la temperatura corporal, y parece que lo que se infiere es
dereminado fenómeno de equilibrio térmico corporal a partir del tamaño de las orejas (y de otras cosas), y no al revés. Explicamos el viaje de Rosa a Salzburgo por la finalidad de asistir a un determinado concierto, y parece que lo que se infiere es su asistencia al concierto a partir del viaje (y de otras cosas). A pesar de este aparente carácter paradójico, en la discusión general sobre la naturaleza de la explicación científica estos casos no han tenido un papel destacado entre los problemas con los que se iban enfrentando los diferentes análisis. El motivo es que su propia naturaleza espec$ca era suficientemente problemática como para considerarlos piedra de toque en la discusión general. Era preciso elucidar antes su peculiar naturaleza. Una vez realizada esta elucidación, gracias principalmente a L. Wright (1976), no presentan características por las que merezcan una referencia específica en la discusión general. Hempel se ocupa de la explicación funcional inmediatamente después (cf. Hempel, 1959) de su primer trabajo, en colaboración con Oppenheim, sobre la explicación. Tomemos el caso de la explicación del latido del corazón en los vertebrados mediante su función de hacer circular la sangre. La idea es que lo que consideramos el explanans, la circulación de la sangre, es una función de un sistema, el cuerpo del venebrado, que requiere de la presencia del explanandum, el latido del corazón, para seguir desempeñando correctamente su función, dadas ciertas condiciones del entorno. El rasgo a explicar, I, es un rasgo o disposición relativamente persistente. La explicación funcional consiste en mostrar que, dadas ciertas condiciones internas Ci del sistema S, y ciertas condiciones externas C, de su entorno, el rasgo I produce en las condiciones C, y C, la satisfacción de una condición N necesaria para el correcto funcionamiento de S. A este modelo se ajusta, también, según Hempel, p.ej. la explicación freudiana de algunas conductas patológicas para evitar ataques de ansiedad; o la explicación anuopológica de algunos ritos, no por sus finalidades declaradas (p.ej. producir lluvia), sino por su función en la cohesión grupal. Hempel señala que esta explicación no se ajusta al modelo inferencial. Su estructura lógica es según él la siguiente: a ) En el momento t, S funciona correctamente en condiciones C; y C,. b) Si S funciona correctamente en condiciones Ci y C, entonces se cumple N. C) Si I está presente en S en condiciones C; y C, entonces se cumple N. d) [Por tanto] I está presente en S en el momento t.
Pero esto es obviamente una inferencia inválida, un caso de falacia de afirmación le consecuente que, como vimos (cap. 2), es inválida tanto deductiva como inductivamenr. Lo único que se infiere válidamente es que en r se cumple N, pero no que se da l. Para ue se infiriese eso, c ) debería decir no sólo que I es suficiente para la satisfacción de N no (además) que es necesaria. Pero eso parece enipíricanienre inaceptable, puede haber i general otros modos de producir N. A esos rasgos alternativos que también pueden oducir N los denomina HempeI equivalei~resfincionafes. Podríamos formular c ) como bicondícional si sustituimos el rasgo específico Z por la disyunción I v P v I" v... . de los los equivalentes funcionales que producen N, pero entonces lo único que podemos icluir de que se cumple N es que se da algicno de ellos, no específicamente el que nos
,,
interesaba explicar. Así, puesto que las explicaciones son al menos inferencias válidas, Hempel concluye que los anblisis funcionales no tienen valor explicativo sino sólo heurístico. Otros concluirán, al contrario, que puesto que sí son explicaciones, éstas no son siempre inferencias. Nagel (1961, cap. 12 $1.1) defiende que las explicaciones funcionales son inferenciaIes aduciendo que e1 rasso a expIicar no s61o es suficiente sino también necesario pala el cumplimiento de la función. El análisis de Napel es el siguiente (sustituimos su propia terminología por la de Hempel, incluyendo ahora entre las condiciones internas lo que Nagel denomina organización del sistema, nada esencial depende de esta adaptación terminológica): "La función de I en el sistema S con organización C; es permitir a S realizar en el entorno C, el proceso N' significa: e) El sistema S está en C;y C, y realiza N. j) Si, dadas Ci y C,, I no está presente en S, entonces S no -realizaN. Ahora, ciertamente, de ambas cosas se infiere válidamente que I está presente en S. Por tanto el explanandum, I, se infiere del explanans, la función N. Pero nótese que a q u í 8 es la conversa de c). Dejando de lado por el momento a Ci y C,, c) dice que I es condición suficiente de N, j ) dice que es condición necesaria. Eso equivale a negar que I tenga equivalentes funcionales, a sostener que sólo I puede producir N. Ésta es una salida para salvar el carácter inferencia1 de las explicaciones funcionales que hemos visto que Hempel desestima. Nagel es consciente de esta objeción, pero en su opinión no está justificada. Es cierto, dice Nagel, que en cierto sentido puede haber otros rasgos que produzcan N, pero ese sentido no es relevante aquí. Es el sentido meramente lógico de 'puede' y aquí importa su sentido físico. Es lógicamente posible que otro factor produzca N, pero, dado el mundo como de hecho es, ello no esfisicamente posible. Así pues,f) no es una verdad conceptual, pero sí una verdad nómica, una ley natural, que es de lo que aquí se trata. Nagel pone como ejemplo el caso de la explicación de la presencia de clorofila en las plantas por su función en la fotosíntesis. Es lógicamente posible que otras sustancias capaciten la fotosíntesis, pero dado el mundo como de hecho es, no es físicamente posible: siendo las leyes biológicas las que son, la clorofila es una condición necesaria para la fotosíntesis, de modo que de la existencia de fotosíntesis se deriva la presencia de clorofila. Esta línea de respuesta no convencería a Hempel, pues su objeción era que la inexistencia de equivalentes funcionales es empíricamente (no sólo lógicamente) inaceptable. Nagel se ocupa básicamente de la explicación funcional en biología, y ahí su tesis es quizá defendible, esto es, los medios mediante los que los organismos desempeñan sus funciones vitales son seguramente necesarios, dadas las leyes de la química, la biología y la evolución. Pero en otros terrenos es más discutible: por ejemplo, en las explicaciones funcionales en la antropología. ¿No es antropológicarnente posibIe desarrollar la cohesión grupa1 mediante otros procedimientos que los rituales, o mediante unos ritos en vez de otros? Esto conecta con las explicaciones teleológicas, pues las explicaciones funcionales en ciencias humanas (sociología, economía, antropología) son muchas veces teleolópicas,
dependen defines con los que se desarrollan ciertas acciones, en estos casos colectivas. Y en las explicaciones teleológicas es más difícil, si no patentemente inverosímil, sostener la tesis de Nagel pues usualmente hay varios modos alternati\ros de alcanzar una misma finalidad. La dificultad principal de las explicaciones teleológicas y funcionales, más allá de su carácter inferencia1o no, se deriva de que están olinttadas hacia e1fUnr1-0 (Ifilticre oriented'). En estas explicaciones el explanans es posterior en el tiempo al explanandum. Pero si la relación de explicación ha de ser en algún sentido causal, parecería que la causalidad ha de tener la misma dirección que la explicatividad, esto es, del futuro al pasado, lo cual contraviene una característica esencial de las relaciones causales, a saber, que la causa es anterior en el tiempo a su efecto. En la medida en que las relaciones causales involucradas sean "normales", esto es del pasado hacia el futuro, parecería que es el explanandum el que produce el explanans y no al revés. En conclusión, si las relaciones explicativas y causales van en la misma dirección, parece que debemos aceptar causalidad hacia atrás ('bachjard causation'); pero si la causalidad no puede ser hacia atrás, entonces en estos casos, explicatividad y causalidad parecen tener direcciones contrarias. El problema que presentan las explicaciones teleológicas y funcionales es pues el de congeniar la dirección futuro-pasado de estas explicaciones con la dirección pasado-futuro de la causación. El primero en dar un análisis satisfactorio de las explicaciones teleológicas y funcionales fue L. Wright (1973 y 1976). El análisis de Wright da cuenta de la orientación hacia el futuro de estas explicaciones en términos causales que no requieren causalidad hacia el pasado. Aunque la idea es la misma en ambos casos, Wright distingue las explicaciones teleológicas de las funcionales. Las explicaciones teleoiógicas explican acciorzes o en general conductas mediante cierta finalidad a las que están dirigidas. Son susceptibles de explicación teleológica tanto la conducta deliberada de los agentes intencionales (p.ej. el viaje de Rosa a Salzburgo), como el "con~portamiento"de artefactos diseñados con un fin específico (p.ej. el movimiento de un torpedo), como la conducta no intencional de los organismos vivos (p.ej. elandar cauteloso de los felinos). En el primer caso la finalidad es el contenido de un deseo o intención del sujeto de la acción, en el segundo el contenido de la intención con que se ha diseñado el artefacto, en el tercero la satisfacción de cierta condición necesaria para la supervivencia del organismo. La idea de Wright es que en todos los casos de conducta dirigida a un fin, la conducta no sólo produce-causa el fin, sino que además la conducta ocurre porque, esto es, a causa de que, produce el fin. La conducta se produce porque conductas como ésa halt producido en el pasado Itecl?os del inismo tipo que elfiiz. Tal como lo formula Wright:
S realiza I con la finalidad N syss: 12) I produce N i) I ocurre porque produce N. (En realidad, Wright no exige que I produzca N invariablemente, sino que tienda a producirlo, o que lo produzca generalmente. Pero este aspecto aproximativo del análisis podemos obviarlo en el presente contexto.)
Aquí I y N son conductas y sucesos particulares, pero se hace referencia implícita a tipos de conductas y sucesos. h ) dice que la conducta particular I causa el suceso particular N,pero ya sabemos que tras una afirmación causa1 particular hay u n a relación causal general, a saber, conductas del tipo de 1 causan sucesos del tipo de N. La referencia implícita a los tipos de conductas y sucesos en i) es más fundamental. i) se ha de leer del siguiente modo: es parte de la historia causal de la acción concreta / e l que acciones del tipo de 1 causen sucesos del tipo de N. Así, la condición h) sólo da cuenta de (parte de) la dimensión causal de la explicación, no de su orientación hacia el futuro. Esto es, h ) no da cuenta de en qué sentido apelamos a N, que pertenece al futuro de 1, para explicar la ocurrencia de I. Eso lo hace i). La explicación de una ocurrencia concreta de la conducta I está dirigida hacia ("se encuentra en") el futuro en el sentido precisado por i): sucesos que son del mismo tipo del que tendrá lugar en el futuro, N, pero que ocurrieron en el pasado, son causalmente responsables de la ocurrencia actual de I; esto es, que en el pasado sucesos del tipo de I causaran sucesos del tipo de il', causa la actual ocurrencia de I. De este modo conjuga Wright causalidad hacia adelante y orientación hacia el futuro en las explicaciones teleológicas. La referencia a los casos pasados sólo es esencial en las explicaciones de conductas que, como las de los animales, no resultan de actos de deliberación. En el caso de los artefactos, diseñados para desempeñar cierta función, se puede tener la finalidad "desde la primera vez", por así decir. Pero incluso la primera vez, Iri causa de que ocurra un ejemplar dri I es que I carisn N: el acontecimiento I ocurre porque el diseñador hace que ocurra, y el diseñador hace que ocurra I porque sabe que I causa N y quiere quz ocurra N, por tanto (*) "que (acontecimientos de tipo) I causa(n) (acontecimientos de tipo) M'pertenece a la historia causal del acaecimiento particular dz tipo I. Pero nótese que (*) pertenece a esa historia en un sentido especial, pues es un hecho general, una regularidad, y por tanto co "causa" las ocurrencias particulares de I ya que los acaecimientos particulares tienen como causas otros acaecimientos particulares (p.ej. las intenciones de los diseñadores de los instrumentos). Análogamente sucede en los casos de conducta deliberada consciente de un sujeto cuando la conducta es resultado de una acción deliberada que se realiza por primera vez. Eso plantea el problema de las primeras ocurrencias de conductas finalistas no deliberadas (todas las de los animales no conscientes y la mayoría de las nuestras). En estos casos, o bien al principio se da cierta indeterniinación sobre su carácter finalista, o bien se supone que opera cierto tipo dz agente diseñndor (la selección natural, o quizá un deus arrifex). El análisis que Wripht hace de las explicaciones, o adscripciones, funcionales es esencialmente el mismo. La diferencia es que ahora lo que se explica no es una acción o conducta sino la presencia de una entidad en cierto sistema, p.ej. un trozo de papel bajo una puerta, un pico curvado en la cabeza de un ave o una señal de tráfico en una curva. El anilisis es análogo al de las acciones:
I tiene la función N syss: j) la presencia-ahí de I produce N k) I está-ahí porque produce N.
Estas condiciones se deben leer en términos exactamente análogos a las anteriores: j ) la presencia-ahí de I causa N, y k) la causa de que I esté-ahí es que 1 causa N. La literatura sobre explicaciones teleológicas y funcionales posterior a los trabajos de Wright es extensa y variada, pero no modifica los aspectos esenciales de su análisis aquí expuestos. Hay contribuciones importantes sobre algunos elementos disposicionales, o sobre la aplicación de este análisis a problemas de filosofía del lenguaje y de la mente, pero escapan de los límites de esta obra.
ANÁLISIS SINCRÓNICO DE TEORÍAS 1. LA CONCEPCI~NAXIOMÁTICA: LAS TEORÍAS COMO CÁLCULOS INTERPRETADOS
Con este capítulo iniciamos la presentación de los diversos análisis de la noción de teoría empírica con que se pretende elucidar la naturaleza y estructura de las teorías científicas. Como mencionamos brevemente en el capítulo 1, las teorías científicas son entidades que se extienden o perduran en el tiempo, que permanecen a través del cambio. Ello supone que el estudio puramente sincrónico que las considera como entidades estáticas, "congeladas", constituye sólo una primera aproximación que se debe completar con un análisis diacrónico que dé cuenta del carácter persistente de estas entidades, esto es, con una cinemática de teorías. En este capítulo y en los dos siguientes vamos a realizar la primera parte de la tarea, el estudio sincrónico, que se completará en el capítulo 12 con el análisis diacrónico. En las dos primeras secciones de este capítulo se presentan en detalle, y se ilustran con ejemplos puramente formales, las nociones de teoría ariomática y dz inodelo (o realización); en la primera se presenta además una primera idea de otras nociones que se estudiarán en otros capítulos, especialmente las de contenido, redclcción y equivalencia. En la tercera sección se aplica la primera noción a las teorías empíricas y se introduce el análisis clásico de las teorías empíricas como cálculos axiomáticos empíricamente interpretados. En las dos secciones siguientes se discuten dos cuestiones especialmente importantes de este análisis, (i) la naturaleza y función de las reglas de correspondencia y (ii) la distinción teórico/observaciona1 y el problema de la base empírica.
1. Teorías axiomáticas Se,oún cierta noción de teoría, una teoría es un conjunto de afirmaciones sobre un determinado áinbito de la realidad. Así, según esta concepción, la Mecánica Clásica (MC) consiste en una serie de afirmaciones sobre el movimiento de los cuerpos de tamaño medio; la Termodinámica (TM), sobre sistemas que interaccionan intercambiando energía; la Genética Mendeliana (GM), sobre la transmisión de rasgos en la generación de seres vivos; la Economía del Intercambio (EI), sobre procesos de transferencia de bienes de consumo; la Aritmética de Peano (AP), sobre los números naturaIes y sus propiedades; la
Teoría de Conjuntos (TC), sobre las clases, conjuntos o colecciones; o una supuesta Teoría
del Parentesco (TP) sobre los hechos que se derivan de las relaciones familiares. Concebidas como conjuntos de afirmaciones sobre un determinado ámbito, las teorías se analizan o reconstruyen como teniendo cierta estructura que expresa las relaciones que mantienen entre sí las diversas afirmaciones y los diversos términos o conceptos con los que se realizan tales afirmaciones. La noción formal que expresa esa estructura es la de cálcrtlo asionrático o, simplemente, teoría asiontárica, y se aplica por igual a teorías empíricas y a teorías puramente formales; la diferencia radica en que esta noción agota el análisis de las segundas pero no el de las primeras, que se debe completar con elementos adicionales. Ahora vamos a contemplar exclusivamente este elemento común. Y TEOR~ASAXIOSIÁTICAS: TÉRMINOSPRIMITI\'OS. 1.1. CÁLCULOS
AXIOMAS Y
TEOREMAS;
DEFlNIClONES Y TÉRMINOS DERI\!ADOS
La idea básica es que una teoría o conjunto de afirmaciones se puede "resumir" "concentrar" en algunas de sus afirmaciones, de las que se derivan todas las restantes mediante un proceso de inferencia deductiva. A las afirmaciones que forman parte de ese "conjunto-resumen", consideradas primitii~as,se las denomina 'axiomas', y a las afirmaciones que se deducen de los axiomas, consideradas derivadas, se las denomina 'teoremas'. Si llamamos contenido de una teoría al conjunto de todas sus afirmaciones, entonces tal contenido se encuentra ya co~npleto,aunque inlplícito, en los axiomas (cf. cap. 2, 92). El contenido de la teoría, la información que da, es por tanto el conjunto de consecuencias lógicas de los axiomas. Toda afirmación se encuentra ya en los axiomas: explícitamente, si es un axioma, o implícitamente, si no lo es, en cuyo caso se puede hacer explícita deduciéndola lógicamente, esto es, obteniéndola como teorema a partir de los axiomas. Los teoremas, por tanto, no contienen información nueva, sólo hacen explícita información contenida implícitamente en los axiomas. Por supuesto, para que esto sea así es preciso que de los axiomas en cuestión se sigan efectivamente todas las afirmaciones de la teoría o sea, que el conjunto de axiomas sea sztficiente, o como se dic'e a veces, comnpleto. Al axiomatizar una teoría se pretende dar con un conjunto completo de axiomas para ella. Ésta es pues una condición necesaria para una buena axiomatización. Es fundamental ver que la anterior condición, aunque necesaria, no es suficiente. Que de los axiomas se obtengan todas las afirmaciones no basta para una buena axiomatización, pues de lo contrario el simple conjunto de todas las afirmaciones sería ya un buen conjunto de axiomas. De tal conjunto se obtienen efectivamente, cómo no, todas las afirmaciones; es, si se quiere, un conjunto de axiomas, pero no es un buen conjunto de axiomas pues viola el espíritu que inspira la axiomatización, a saber, dar una versión lo más "resumida" o "concentrada" posible de la teoría. Así pues, es un principio metodológico general que los axiomas han de constituir un conjunto i?zNlitno de afirmaciones primitivas, ningún axioma debe ser deducible de los restantes; o, como se dice técnicamente, los axiomas deben ser indepeltdieiltes entre sí (para una ejemplificación de esa y O
otras nociones, cf. más abajo el ejemplo de las teorías del parentesco). Un buen conjunto de axiomas para una teoría es por tanto un subconjunto de sus afirmaciones que sea comp[eto y cuyos miembros sean independientes entre sí. Es importante señalar q u e estas condiciones no determinan un único subconjunto de tales afirmaciones. Dada una teoría (en sentido intuitivo), siempre hay más de un subconjunto completo e independiente de afirmaciones, siempre hay axiomatizaciones alternativas. Hasta aquí hemos hablado sólo de las afirmaciones de la teoría. Debemos hablar ahora de los constituyentes de estas afirmaciones, los términos o conceptos de la teoría.' Como veremos, la referencia a los tirminos introducirá una complicación adicional en las relaciones entre las afirmaciones, pues además de axiomas y teoremas intervienen entonces las definiciones. Los términos de una teoría, los constituyentes de sus afirmaciones, expresan el aparato conceptualizador de la teoría, esto es, el aparato con el que se pretenden capturar las entidades de diverso tipo (objetos individuales y sus propiedades y relaciones) que conforman el ámbito de la realidad del que se ocupa la teoría. Así, por ejemplo, MC habla de partículas, masas, velocidades, etc.; AP habla de la propiedad de ser número natural, del cero, de la función siguiente, etc.; TP habla de padres, hermanos, abuelos, etc. Los términos d é las teorías, contempladas éstas en su estadio intuitivo, son susceptibles también en general de cierta simplificación. Por ejemplo, si en MC disponemos ya de 'posición' y 'tiempo' podemos prescindir como término primitivo de 'velocidad', pues se puede introducir o definir a partir de los anteriores; o si en TP disponemos ya de 'progenitor' y 'hermano', podemos prescindir como término primitivo de 'tío', pues se puede introducir o definir a partir de los anteriores. Esta introducción de nuevos términos a partir de otros anteriores supone la entrada en juego de otro tipo de "afirmaciones" o enunciados, las definiciones, pues sólo mediante enunciados (o esquemas de tales) es posible explicitar el modo en que se introduce un término nuevo a partir de otros anteriores. Las definiciones siempre tienen la forma de una equivalencia del tipo:
Aquí t es el nuevo término y ti, ..., tk, son términos ya disponibles, esto es, términos pri~iiitivoso ya definidos con anterioridad a r ; n indica el número de variables a las que se aplica el término, esto es, su ariedad; a y P son funciones proposicionales. Ésta es la forma estándar que claramente presentan las definiciones de los relatores (n-ádicos), que nombran propiedades o relaciones entre individuos; por ejemplo, 'ser impar': ".r es impar syss~,fxdividido entre 2 da de resto 1" (análogamente, p.ej., con 'ser múltiplo de'). Pero los términos de un lenguaje no siempre son relatores, puede haber también términos singulares (p.ej. ' 1') y functores (p.ej. 'el siguiente de ...', 'la intersección de ... y ...' que nombran, respectivamente, a individuos y a funciones-operaciones entre individuos. En 1. Términos o conceptos, respectivan~ente,según se entienda por 'afirmación' el enunciado mismo o su contenido. De acuerdo con la prcíctica dominante en filosofía de la ciencia. seguiremos ahora en general la primera interpretación, y diremos por tanto que los constituyentes de las afirmaciones son t6miinos.
270
FüND.4hlEhXlS DE FILOSO^^^ DE LA CIENCIA
principio parece que las definiciones de términos singulares y de functores no se ajustan a la forma (1) sino a estas otras: (2) (3)
"t = drjy(t1,..., tk)" para términos singulares, y "t(xI, ...,x,,) = dcf%t1. ..., ti, XI,...,xn)" para functores (n-ádicos),
donde en ambos casos la parte derecha, "y(...)" es una descripcin'ií que usa otros términos ya disponibles; por ejemplo: "1 =dg el siguiente de O"; "x n y =dd el conjunto cuyos elementos son los elementos comunes a x e y". Sin embargo, es fácil ver que estas definiciones se pueden expresar también mediante una equivalencia de la forma (l), esto es, respectivamente, mediante: (2') (3')
"para todo z: z = t syssdcr: = ~ t l..., , t~)", "para todo z: z = t(xt, ...,x,) s ~ s s = ~ y(?], ~ ~ ..., : tk,XI, ...,S,)"
Por tanto, la forma general de la definición queda bien expresada mediante (1) (ligeramente modificada pues, como el lector habrá advertido, (2') y (3') contienen cuantificadores y (1) no). Ahora bien, una vez señalado esto, lo usual es introducir los términos singulares y los functores mediante (2) y (3) respectivamente, y así lo haremos también aquí. Las definiciones no son afirmaciones del mismo tipo que los axiomas y los teoremas, no son afirmaciones sustanevas de la teoría sino que expresan meras abreviaturas notacionales. Esto se expresa diciendo que las definiciones deben cumplir dos requisitos: han de ser a) elNni?zablesy b) no creativas o inocuas. Lo primero significa que cualquier afirmación que contenga un término definido ha de poder eliminarse usando la definición que introduce dicho signo; esto es, con ayuda de la definición se debe poder probar que tal afirmación es equivalente a otra que no contenga dicho signo, y en última instancia, si eliminamos los otros signos definidos previamente, equivalente a otra afirmación que contenga sólo signos primitivos. Lo segundo significa que si tenemos una afirmación que involucra el término definido t cuya prueba recurre, además de a los axiomas y otras definiciones previas, a la definición de t , su afirmación equivalente resultante de eliminar t ha de poder probarse sin recumr a la definición de t, y si se han eliminado todos los términos definidos, ha de probarse a partir de los axiomas solos. Nótese que en caso contrario la presunta definición contendría subrepticiamente información sustantiva, no sería una mera abreviatura terminológica. En este sentido las definiciones son inocuas, no añaden nada al contenido de la teoría; por ello son teóricamente prescindibles, lo que se dice con su ayuda se puede decir igualmente sin ellas. Por supuesto que si un teorema contiene un término definido, para probarlo no nos bastan los axiomas, necesitamos además al menos una definición, la que ha introducido dicho término (y sólo esa definición si es el único término no primitivo del teorema). Pero si el término se ha introducido correctamente, mediante una definición eliminable y no creativa, ese teorema es equivalente a otro cuya prueba no requiere dicha definición, y en última instancia equivalente a otro que contiene sólo términos primitivos cuya prueba recurre exclusivamente a los axiomas. Las definiciones son pues prescindibles, todo lo que se dice con su ayuda se
puede decir sin ella; no se puede decir exactamente de la misma forma, si dicha forma usa términos no primitivos, pero sí de otra equivalente que sólo use términos primitivos. Ahora bien, aunque las definiciones son teóricamente superfluas, no lo son en la práctica de la construcción y aplicación de una teoría; en efecto, para teorías de un mínimo de complejidad conceptual y fuerza expresiva, el prescindir totalmente de definiciones haría a éstas inmanejables y prácticamente incomprensibles. Las definiciones poseen un gran valor de "economía intelectuai" en la construcción de las teorías. En general al axiomatizar una teoría se pretende reducir al mínimo no sólo las afirmaciones primitivas o básicas, los axiomas, sino también los términos primitivos. Es cierto que en esto último la práctica es un poco más laxa y a veces se ofrecen axiomatizaciones en las que algunos términos básicos son definibles a partir de otros, pero ello casi siempre responde a motivaciones pedagógicas (y por los mismos motivos, aunque es menos usual, se dan a veces axiomas no independientes del resto); el ideal estrictamente científico es siempre el mismo: no presentar como primitivo lo que pueda ser derivado, ya sean afirmaciones o conceptos. A veces las simplificaciones de axiomas y términos van de la mano, pues un axioma puede ser eliminado si determinado término, considerado primitivo hasta entonces, se define apropiadamente. Por ejemplo, en TC se puede dar una axiomatización que contenga como término primitivo el signo functor de par ordenado '< , >' y un axioma que regule su comportamiento, a saber "-,y> = <z,tt> syss x = z y y = v"; pero esta axiomatización se puede simplificar, se puede eliminar dicho término como primitivo mediante la definición '-<Y,J> =JeJ{.r,{x,y}}", de modo que el mencionado axioma se convierte en un teorema que se prueba a partir de los restantes axiomas y de dicha definición. Hasta ahora hemos presentado las cosas como si una teoría axiomática fuese el resultado de axiomatizar, reconstruir axiomáticamente, una teoría "en estadio intuitivo" consistente en una serie de afirmaciones sobre un ámbito. afirmaciones que usan una serie de conceptos. Entonces la teoría axiomática resulta de seleccionar apropiadamente algunos de los conceptos como primitivos, seleccionar algunas de las afirmaciones que contienen sólo dichos conceptos como verdades primitivas o axiomas, definir el resto de conceptos que ya usa la tzoría, y probar como teoremas el resto de afirmaciones, usando en las pruebas sólo los axiomas cuando las afirmaciones contengan sólo términos primitivos, o usando además las definiciones cuando contengan términos no primitivos. Ésta es la presentación que más naturalmente se corresponde con lo que de hecho ocurre históricamente, pues casi siempre la formulación de una teoría axiomática es el resultado de axiomatizar, en este sentido, una teoría en estadio intuitivo. Según este modo de presentarlo, de los términos no primitivos "ya se dispone" en la teoría. La distinción entre axiomas y teoremas, y entre términos primitivos y definidos, expresa la "dependencia" de unas afirmaciones respecto de otras y de unos conceptos respecto de otros. Esta dependencia tiene claro sentido en una teoría ya axiomatizada ("regimentada"), pero en una teoría intuitiva (en el estadio intuitivo de una teoría) es dudoso que se puedan identificar relaciones de dependencia o prioridad en este sentido. Desde una perspectiva preaxiomática, todas las afirmaciones y todos los conceptos están, por así decir, "al mismo nivel". Otra cosa son las relaciones de prioridad de otro tipo, por
ejemplo epistémico, esto es, qué afirmaciones se consideran mejor fundamentsdas, o más fácilmente cognoscibles. De eso no vamos a decir nada squí, sólo que esta dependencia epistémica es en principio independiente de la que se introduce al axiomatizar y que, por tanto, la axiomatización no tiene por qué seguir criterios de prioridad epistémica. En la presentación axiomática de una teoría se ofrece simplemente una serie de términos primitivos y una serie de afirmaciones primitivas que usan dichos términos, y los términos definidos se introducen. si se quiere, después para abreviar los teoremas que resultarían de escritura excesivamente larga si se usaran sólo los términos originales. .4sí vista, una teoría parece "que parte de cero", pero no hemos de olvidar que en la mayoría de 10s casos 10 que se pretende es "poner orden" en un cuerpo de afirmaciones previamente existentes. Es importante señalar, además, que este proceso no siempre consiste en una mera ordenación, pues a veces la versión intuitiva incluye afirmaciones incompatibles entre sí y al axiomatizar se debe tomar partido por alguna de las alternativas. De hecho. algunas de las axiomatizaciones han surgido precisamente como respuesta a determinadas inconsistencias, o en general dificultades, descubiertas en la versión intuitiva; tal es el caso de las teorías axiomáticas de conjuntos, motivadas principalmente por la paradoja de Russell, o de las axiomatizaciones de las geometrías no euclídeas, que surgieron del intento de probar la independencia en la geometría euclídea del axioma de las paralelas respecto de los restantes. Antes de ver algunos ejemplos es conveniente señalar que este análisis de las teorías, o en general cuerpos de conocimiento, plantea inmediatamente cuestiones fundamentales relativas al significado de los términos teóricos y a la justificación de las afirmaciones de la teoría. El significado de los términos definidos se retrctrae al de los términos primitivos a través de las definiciones. La justificación de los teoremas se retrotrae a la de los axiomas a través de las pruebas de aquéllos a partir de éstos. Como aprendemos pronto de niños, no toda afirmación se puede derivar de otras, ni todo término se puede definir eliminativamente a partir de otros. Los términos primitivos y 10s axiomas son los primitivos en los que nos detenemos; pero entonces el significado de los términos de la teoría pende en última instancia del significado de términos para los que no hay definición explícita, y la justificación de todas las afirmaciones de la teoría pende en última instancia de la justificación de afirmaciones para las que no hay demostración que parta de otras. ¿Cómo adquieren aquéllos significado y éstas justificación? Nótese que, por más que dispongamos de cierta "preconcepción" del significado de los términos primitivos, ello corresponde al estadio intuitivo o preaxiomático de la teoría. Desde una perspectiva axiomática, lo único que especifica explícitamente la teoría al fijar los términos primitivos es su categoría lógica, esto es, si se trata de relatores, functores o términos singulares, categoría que nos permite combinarlos correctamente de acuerdo con la gramática del lenguaje lógico que se utilice. En cuanto a las afirmaciones primitivas, lo único que hace la teoría desde un punto de vista formal es elegir, de entre las infinitas combinaciones bien formadas de términos primitivos y signos complementarios (lógico-matemáticos, según la teoría formal que se presuponga), algunas de ellas para fijarlas como axiomas. La pregunta por el significado de los términos primitivos y por la justificación de los axiomas de la teoría surge pues inme-
diatamente al contemplar las teorías como sistemas axiomiticos. De esta cuestión nos ocuparemos por extenso más adelante en este y en los dos próximos capítulos, de momento nos interesa tan sólo la estructura formal de los sistemas axiomáticos. Para fijar las ideas anteriores vamos a dar el esbozo de algunas teorías axiomáticas, principalmente de las ciencias formales que es donde mis claramente, al menos hasta mediados del siglo XX, ha sido aplicada esta noción; lo peculiar de cierto modo de entender las teorías empíricas es que considera que la naturaleza y estructura de las teorías empíricas también se expresa adecuadamente mediante la noción de teoría axiomática, adecuadamente completada para dar cuenta de las peculiaridades del conocimiento empírico frente al lógico-matemático. Antes de ver los ejemplos reales provenientes.de las ciencias formales, y puesto que no cabe suponer en general el conocimiento del contenido intuitivo de dichas teorías, comenzaremos con una pseudoteoría cuyo contenido nos es familiar a todos, la "Teoría" del Parentesco. Vamos a ver cómo se puede expresar este cuerpo de afirmaciones como teoría axiomática en el sentido elucidado, de modo que capte "las verdades sobre el parentesco" que conocemos. El esquema es siempre el mismo: n términos primitivos ti, ..., r,, tn axioma s.^^,, ..., A,; teoremas T , , Tz, .., con términos primitivos; p definiciones-abreviaturas Di, ..., D,, que introducen p tCrminos derivados t,,,, ..., t,,, y finalmente nuevos teoremas que contienen también términos derivados. Toda afirmación de la teoría ha dz estar constituida exclusivamente por términos propios de la teoría, primitivos o definidos, más vocabulario lógico ('todo', 'y', 'no', etc).
Vamos a presentar aquí, como ejercicio, algunas "teorías del parentesco" de entre las varias que es posible construir. Estas teorías expresan, mejor o peor, las afirmaciones básicas relativas a ese ámbito de la realidad constituido por las relaciones de parentesco sanguíneo o biológico. Además de fijar las ideas anteriores, estos ejemplos servirán para introducir algunas ideas nuevas concernientes a las posibles relaciones que pueden darse entre diversas teorías. Para una mayor precisión, la presentación de las teorías debería utilizar el lenguaje formal de primer orden, pero de momento, y para facilitar la lectura, escribiremos aquí en general los diversos enunciados de las teorías en lenguaje informal; sólo daremos como muestra la versión formal de los axiomas en el primer ejemplo. El lector debe notar que, como señalamos más amba, los enunciados contienen exclusivamente términos introducidos explícitamente por la teoría o términos puramente lógicos. Teoría del Parentesco 1(TPI): Términos (o conceptos) primitivos: C 1. Progenitor (relator diádico): P C2. Varón (relator monádico): V C3. Hembra (relator monrídico): H
Axiomas: A l . Todo individuo es varón o hembra, y sólo una de las dos cosas. V x (Vx H 1 Hx) A2. Todo individuo tiene al menos un progenitor varón. V x 3 y ( v y A PJX) A3. Todo individuo tiene al menos un progenitor hembra. Vx3y (Hy A Pyx) A4. Todo individuo tiene como máximo dos progenitores. Vx,y,z,r (Pxt A P j t A Pzt + z = x v z = y v x =y) Si un individuo es progenitor de otro, éste no lo es de aquél. A5. v x . y (Pxy 4 1 Pyx) Con estos axiomas ya se pueden probar algunos teoremas: TI.
T2. T3.
Todo individuo tiene exactamente dos progenitores. (Prueba: De A2, A3 y A l se sigue que tiene al menos dos progenitores diferentes, de ello y de A4, se sigue que tiene exactamente dos. QED) Nadie es su propio progenitor. Para todo individuo existen como mínimo dos hembras que son progenitoras de progenitores de dicho individuo.
Como muestra T3, algunos teoremas pueden ser muy largos, por lo que es conveniente introducir algunas abreviaturas o definiciones (las incompletas las puede completar el lector; nótese que según la noción de hermano que se va a definir, todo individuo es hermano de sí mismo): Padre: x es padre de y syssdcfxes progenitor de y y x es varón. Madre: .u es madre de y syssddxes progenitor de y y x es hembra. Her: x es her de y sy ssutlx e y tienen los mismos progenitores. Hermano: x es hermano de y syssd4x es her de y y x es varón. Hermana: x es hermana de y syssd,, ................ Hij: x es hij de y SySSr,jy es progenitor de x. Hijo: x es hijo de y syssdcf.............. Abu: x es abu de y syssdrfxes progenitor de algún progenitor de y. Ti: x es ti de y syssdt,............... El lector puede dar las definiciones restantes (sob, sobrino, sobrina, prim, primo, etc.). Con estas definiciones podemos abreviar, p.ej., T3 como T4 y, en general, expresar muchas de las afirmaciones de la teoría intuitiva mediante términos no primitivos:
T4. Todo individuo tiene como mínimo dos abuelas. T5. Todo individuo tiene exactamente un padre y una madre. T6. Todo individuo es her de sí mismo.
T7. Los her de her son her entre sí. T8. Nadie es su propio padre. T9. Si uno es hij de otro, éste no lo es de aquél. TPl es un ejemplo sencillo de teoría axiomática pero que contiene ya todo lo esencial; toda teoría axiomática, por muy complicada que sea, tiene exactamente esta estnrctura. TPI sólo contiene relatores y, como hemos visto antes, Ias teorías pueden contener también como términos, primitivos o derivados, functores y términos singulares (p.ej. podríamos haber dado una teoría "bíblica" del parentesco con los términos singulares primitivos 'Adán' y 'Eva', en cuyo caso deberíamos modificar algunos axiomas pues A2 y A3 no valen para Adán y Eva). El número y variedad categorial de los términos de una teoría aumenta considerablemente su complejidad, pero la estructura es esencialmente la misma en todos los casos, esto es, como la que TP1 ejemplifica. Por otro lado, como teoría del parentesco TP1 no es muy buena, pues no permite obtener como teoremas afirmaciones de la teoría intuitiva como "nadie es bisabu de -sí mismo". La siguiente teoría, que amplía TP1 añadiendo el término nuevo 'ancestro' y sus correspondientes axiomas, es un poco mejor.
Teoría del Parentesco 2 (TP2): Términos primitivos: C 1. Ancestro (relator diádico) C2. Progenitor (relator diádico) C3. Varón (relator monádico) C4. Hembra (relator monádico) Axiomas: A l . Si uno es ancestro de otro, éste no lo es de aquél. A2. Si uno es ancestro de otro y éste lo es de un tercero, entonces el primero lo es del último. A3. Si un individuo es progenitor de otro, también es su ancestro. A4. Si un individuo es ancestro de otro, entonces le conecta con éste una secuencia finita de progenitores. A5. Todo individuo es varón o hembra, y sólo una de las dos cosas. A6. Todo individuo tiene al menos un progenitor varón. A7. Todo individuo tiene al menos un progenitor hembra. AS. Todo individuo tiene como máximo dos progenitores. A9. Si un individuo es progenitor de otro, éste no lo es de aquél. Hemos dado los axiomas de TP2 añadiendo simplemente los cuatro primeros a los de TP1, extendiendo o aumentando TP1 con un nuevo ténnino primitivo y nuevos axiomas. El resultado no es muy feliz, pues ahora A9 es redundante, no es independiente del resto pues se sigue de A l y A3. Construyamos ahora una nueva teoría del parentesco
276
FCNDA~~E\TOSDE FILOSOFL~ DE LA CIENCIA
Teoría del Parentesco 3 (TP3): Los mismos términos primitivos y derivados que TP2 y los mismos axiomas salvo
Ag. TP3 está un poco mejor que TPl pues se obtienen como teoremas todos los de TP1 más algunas afirmaciones que se le escapaban a TPI, como "nadie es bisabu de sí mismo", y además otras afirmaciones deseables sobre el nuevo concepto, tales como "todo individuo tiene tantos ancestros varones como hembras" y "dos individuos tienen los mismos progenitores si y sólo si tienen los mismos ancestros". TP3 presenta además una característica novedosa respecto de TPI. TP1 contiene, además de sus términos primitivos, sólo términos lógicos, términos de la lógica de primer orden (LPO) que es por tanto la teoría presupuesta por TPl y "dentro de la cual" realizarnos nuestras demostraciones. Pero TP3, en su A4, contiene un término extralógico, el término 'secuencia finita'. Este término no pertenece a LPO sino a otra teoná formal específica más rica que LPO, la aritmética o, alternativamente, la teoría de conjuntos. Algunas teorías pueden por tanto utilizar como recursos formales adicionales (ténninos y principios), no sólo los de la lógica que utilice sino también los de alguna teoría matemático-formal. En TP3 esos recursos teóricos formales adicionales son muy sencillos, pero en teorías físicas altamente matematizadas pueden incluir partes muy elevadas de la matemáticas (cálculo diferencial, teoría de tensores, etc.). TP3 ilustra además otro hecho. Diremos que una teoría es inmediatalne~ztesimnplifzcable si sus axiomas no son independientes. Vimos que TP2 era una extensión de TP1 inmediatamente simplificable y eliminando el axioma redundante obteníamos TP3, que ya no es inmediatamente simplificable. Pero aunque TP3 es mejor que TP2, no es todo lo buena que podría ser pues es simplificable en otro sentido menos inmediato pero igualmente importante, sentido en el que desempeñan un papel fundamental los términos primitivos. El sentido es el siguiente: podemos definir alguno de sus términos primitivos en función de los restantes de modo que alguno de los axiomas pase a ser deducible del resto, esto es, de modo que la nueva teoría sea inmediatamente simplificable. Eso es lo que pasa con TP3, pues puedo definir 'progenitor' en función de 'ancestro' (un progenitor es un "ancestro de primera generación") obteniendo una teoría inmediatamente simplificable. Teoría del Pareittesco 4 (TP4): Los mismos términos primitivos que TP3 salvo 'progenitor', que se introduce ahora como término definido del siguiente modo: x. es progenitor de y s y s ~ es ~ ~ ancestro ~ x de y y no hay ningún individuo z tal que x es ancestro de z y z es ancestro de y. Los mismos axiomas que TP3. Se dirá que ahora los axiomas de TP4 no pueden ser directamente los de TP3 pues contienen un término, 'progenitor', que ahora no es primitivo. Pero nada impide que una
teoría contenga axiomas con términos definidos; estos términos son meras abreviaturas y, si se prefiere, podemos escribir los axiomas sin ellos, pero también podemos hacerlo con su ayuda si usando sólo términos primitivos resultan muy engorrosos, como ocurriría con los axiomas 3, 6, 7, 8 y, en especial, 4 de TP4 (que ahora diría que no hay secuencias infinitas de "ancestros consecutivos"). Pues bien, los escribamos como los escribamos, en su actual forma o "deshaciendo" la definición de 'progenitor', el resultado es que ahora A3 se puede probar como teorema, es decir, TP3 es inmediatamente simplificable. Esta situación nos permite una primera aproximación intuitiva a dos conceptos de los que nos ocuparemos por extenso más adelante, los de redllcción y eqrrivalencia (cf. cap. 11). Obtengamos ahora una nueva teoría eliminando de la teoría inmediatamente simplificable TP4 el axioma redundante A3.
Teoría del Parentesco 5 (TP.7): Los mismos conceptos primitivos y derivados que TP.4 y los mismos axiomas menos A3. Olvidemos por el momento TP2 y TP4, que no son buenas teorías asiomiticas al ser inmediatamente simplificables, y centrémonos en TPl, TP3 y TP5, buenos sistemas axiomáticos con todos sus axiomas independientes. Tal como hemos dado con ellas, deberían estar claros ahora los siguientes hechos: a ) TP3 y TP5 "dicen lo mismo", tienen el mismo contenido; 6 ) TP3 y TP5 "dicen al menos tanto como" TP1, todo el contenido de TP1 es también contenido de éstas. En el primer caso decimos que TP3 y TP5 son equivalentes, en el segundo que ambas reduceil TP1. Intuitivamente: una teoría T reduce otra T' si el contenido de T' es parte (quizá no estricta) del contenido de T; una teoría T es equivalente a otra T' cuando tienen el mismo contenido, es decir, cuando se reducen mutuamente. Tal como hemos obtenido nuestras teorías, quizá estas relaciones no parezcan muy interesantes. TP3 es una simplificación de TP2, que es una simple ampliación (inmediatamente simplificable) de TP1, por lo que poco tiene de sorprendente que TP2, y con ella TP3, reduzcan TP1; en realidad TP3 tiene incluso todos los conceptos primitivos de TP1, y algunos más, nada muy sorprendente pues que diga lo mismo que ella y quizá algo más. Pero es esencial destacar que la reducción no exige que la teoría reductora contenga como primitivos 10s términos primitivos de la reducida; TP5 reduce TP1 y entre sus términos primitivos ('ancestro', 'varón', 'hembrat) no están todos los primitivos de TP1 ('progenitor', 'varón', 'hembra'). Y lo mismo ocurre respecto de la equivalencia o reducción recíproca. TP3 y TP5 son equivalentes y sin embargo no tienen exactamente los mismos términos primitivos. En este caso particular, los términos primitivos de una de las teorías, TP3 ('ancestro', 'progenitor', 'varón', 'hembra'), incluyen los primitivos de su equivalente TP5. Pero no es necesario ni que tengan los mismos tirminos primitivos ni siquiera que los de una lo sean también de la otra. Como ejemplo tómese la siguiente teoría del parentesco.
27 8
FüSDA51EhT3S DE FILOSOFLA DE LA CIENCIA
Teoría del Parentesco 6 (TP6):
.
Términos primitivos: C 1. Padre (relator diádico) C2. Madre (relator diádico) C3. Varón (relator monádico) C4. Hembra (relator monádico) Axiomas: A l . Todo individuo es varón o hembra, y sólo una de las dos cosas. A2. Todo individuo tiene exactamente un padre. A3. Todo individuo tiene exactamente una madre. A4. Los padres de alguien son varones y las madres hembras. A5. Si un individuo es padre de otro, éste no lo es de aquél. A6. Si un individuo es madre de otro, éste no lo es de aquél. Definiciones: D1. Progenitor: x es progenitor de y syssddxes padre o madre de y. El resto de definiciones como en TP1.
Pues bien, es fácil ver que TP6 es equivalente a TP1 (y como TPI, por tanto, reducida por TP3 y TP5) y sin embargo ninguna incluye como primitivos todos los conceptos primitivos de la otra. Lo que sí ocurre, y este es el punto esencial, es que los términos primitivos de una pueden ser defiilidos mediante los de la otra (en los términos comunes la definición es inmediata, la gracia está en los no comunes) de modo que los axiomas de una se convierten en afirmaciones (axiomas o teoremas) de la otra. Éste es el concepto un poco más refinado de reducción: Treduce T' 'si los términos primitivos de T' pueden ser definidos en T de modo que los axiomas de T' se obtienen como axiomas o teoremas de T (s610 como teoremas, si no tienen ningún término en común); T y T' son equivalentes si se reducen mutuamente. Cuando las teorías tienen términos comunes, como en nuestras teorías del parentesco, estas relaciones no suelen ser extremadamente interesantes, después de todo "parecen hablar (al menos parcialmente) de lo mismo". Más interesantes son los casos, que discutiremos por extenso más adelante (cf. en el próximo apartado de esta sección el ejemplo de la teoría de conjuntos y la aritmética, y para ejemplos empíricos el capítulo 11), en los que las teorías involucradas no compmen ni siquiera parcialmente el material conceptual, esto es, cuando las teorías parecen en principio estar hablando de cosas diferentes y se descubre que una teoría reduce otra. Este tipo de situaciones tienen el máximo interés desde el punto de vista metacientífico, como veremos, por su relevancia en los fenómenos de cambio teórico y sus implicaciones epistemológicas y ontológicas (cap. 13).
Acabaremos dando algunos ejemplos de teorías axiomáticas pertenecientes al campo de las ciencias formales, más interesantes a efectos ilustrativos que nuestra
inventada teoría del parentesco pues corresponden a casos reales d e teorías axiomati-
zadas. Aritinética de Peano (AP):
AP, axiomatizada por Peano (y Dedekind) a finales del siglo xrx, pretende sistematizar axiomáticamente las verdades conocidas y utiIizadas informalmente desde antiguo sobre los números naturales y sus propiedades, relaciones y operaciones básicas. Términos primitivos. C1. Número natural (relator monádico) C2. Cero (término singular) C3. El siguiente de (functor monádico) Axiomas: A l . Si un objeto es número natural, su siguiente también lo es. A2. El cero es un número natural. A3. El cero no es el siguiente de ningún número natural. A4. Dos objetos con el mismo sizuiente son el mismo. A5. Si el cero tiene una propiedad cp y el que un número natural sea cp implica que su siguiente también es cp, entonces todo número natural tiene la propiedad 9. (Nótese que A5 no es exactamente un único axioma sino lo que se denomina un esquema axiomático, un axioma con una (meta)variable libre cp, en este caso una variable para propiedades, que da lugar a axiomas específicos para cada ejemplificación concreta de la variable.) Teoremas: T1. El siguiente del siguiente del cero es un número natural. T2. El siguiente del siguiente del cero no es el siguiente del cero. T3. Cero no es el siguiente del siguiente de cero. Definiciones: D 1. Uno = d,f el siguiente de cero. D2. Dos = defelsiguiente de uno. D3. T r e ~ =......... ~~f D4. Suma (functor binario: la suma de ... y ...): a ) x más cero = dcfir b) x más el siguiente de y = J,rel siguiente de (x más y). D5. Producto(functor binario): a ) x por cero = dsfcero b) x por el siguiente de y = 2tf.u más (.u por y). D6. x I:y syssJ4existe un número natural z tal que x más z = y . D7. x es par syssd4existe un natural z tal que .r = dos por z.
(D4 y D5 son lo que se denomina defiiziciones recztrsii~as;intuitivamente: el resultado de la operación de un número con otro diferente de cero se da en función del resu:tado con el anterior del segundo -cláusula b)-; como además se da el resultado de operar cualquier número con el cero -cláusula a)-, queda bien definida la operación para cualesquiera números, pues todos los números surgen del cero mediante la función siguiente.) Teoremas: T3. Dos es número natural y par. T4. Dos no es el siguiente del cero. T5. Cero no es el siguiente de uno. T6. Uno más dos = tres. T7. Para todo .Y, y: x más J = y más x. T8. Para todo x: x por uno = x. T9. Para todo x, y: s I s más y.
Teoría de Conjlcntos (TC): TC es una teoría desarrollada en su práctica totalidad por el matemático alemán G. Cantor a finales del siglo XIX. TC trata de los "agregados", conjuntos, colecciones o clases, de las propiedades, relaciones y operaciones entre estas entidades. TC se axiomatizó a principios del siglo xx como parte de algunas estrategias para resolver los problemas de fundamentos derivados de la inconsistencia de la teoría en su versión intuitiva inicial. Hay varias axiomatizaciones alternativas, y la que damos aquí es parcial pues recoge sólo algunos de los axiomas más comunes; es por tanto insuficiente y no contiene los elementos que hacen propiamente interesantes Iris diversas axiomatizaciones existentes. Términos primitivos: C 1 . Conjunto (relator monádico). C2. Pertenencia (relator diádico: ... es elemento de ...). Axiomas: A l . Dos conjuntos a los que pertenecen los mismos objetos son el mismo. A2. Dado un conjunto y una propiedad 9,hay un conjunto cuyos elementos son los elementos del primero que tienen la propiedad cp. A3. Existe un conjunto que no tiene elementos. A4. Dados dos conjuntos, existe otro formado por los elementos de los anteriores. A5. Dados dos objetos, existe un conjunto formado por ambos. (El lector habrá notado que A2 es un esquema axiomático.) Teoremas: T I . Existe un y sólo un conjunto sin elementos. T2. Dados dos conjuntos, existe un y sólo un conjunto cuyos miembros son los elementos de los anteriores.
Dados dos conjuntos, existe otro formado por los elementos comunes de ambos, y es único. T3. Dados dos conjuntos, existe otro formado por los elementos del primero que no pertenecen al segundo, y es único. Definiciones: D I . 0 = dcf el conjunto sin elementos. D2. x cy syssdeflos elementos de .u son también elementos de y. D3. x u y = def el conjunto formado por los elementos de .u o de y. D4. x ny = J,f el conjunto formado por los elementos comunes de x e y. D5. x - y = def el conjunto formado por los elementos de x que no pertenecen a J . Teoremas: T5. Para todo x: 0 c.u. T6. Para todo x: x u 0 = s. T7. Para todo .u, y: .u nJ = J n.u. TS. Para todo x, y, z: .Y - C\' u z)=(s - J ) n ( x - z). T9. Para todo x, y: si .Y cy entonces s n y = .Y. T3.
AP y TC proporcionan una ilustración interesante de uno de los conceptos que introdujimos más arriba con ocasión de las diversas teorías del parentesco, la relación de reducción. Vimos entonces que TP5 reducía TP1, hecho que no parecía muy interesante dada la inmediata proximidad temática de ambas teorías. Pues bien, uno de los logros más importantes de la historia de las ciencias formales (debido fundamentalmente a Frege) consiste en haber mostrado que AP se reduce a TC (no a esta TC, sino a la teoría dz conjuntos en su versión completa). Éste es un hecho en principio sorprendente pues ambas teorías parecen hablar "de cosas diferentes". Pues bien, Frege mostró que hay una manera de definir los números como determinados conjuntos (o estensiones, como él decía) de modo que las verdades básicas sobre números se derivan de las verdades básicas sobre conjuntos: es posible definir los términos aritméticos primitivos en términos conjuntistas de modo tal que los axiomas de la aritmética se convierten en teoremas que se derivan de los axiomas de la teoría de conjuntos. La rzducción se da pues exactamente en el mismo sentido que m5s arriba vimos respecto de TP1 y TP5, pero ahora es realmente interesante pues las teorías involucradas no comparten. en principio, aparato conceptual. A modo de ejemplificación de la idea abstracta de reducción, vamos a presentar tan sólo las líneas generales de la reducción de AP a TC (ahora nos expresaremos incorrectamente y mezclaremos definición de términos con identificación de entidades). El cero se define identificándolo con el conjunto vacío. Para la función siguiente haj varias posibilidades. Una es definir el siguiente de un conjunto .r como su unitario { x } (cuya existencia unívoca queda garantizada: si esiste s,existe por A5 {.Y, .Y] que es identico a {.Y} por Al). Otra posibilidad es definir el siguiente de un conjunto r como su unión con su unitario, e.e. como .u u {.Y} (cuya existencia unívoca también queda garantizada. por la existencia de {s]más A4). La definición de 'número natural' requiere algunas complicaciones que no hemos incluido en la \.ersión simplificada de TC que hemos presentado. En especial se requiere el siguiente axioma que habíamos omitido: "existe al menos iin
conjunto tal que a ) tiene como elemento 0 y b) si tiene como elemento un conjunto, entonces tiene también el siguiente de dicho conjunto". Este axioma asegura que existe al menos un conjunto con el vacío y con todos los que le siguen (que son infinitos, por eso se le denomina a veces Axioma de Infinitud). A los conjuntos así se les denomina inductivos, y es posible que haya varios tales conjuntos "inductivos", si además de tener esos objetos tienen otros. Pues bien, el menor de todos esos conjuntos inductivos, e.e. la intersección de todos ellos, tiene como elementos sólo el vacío y sus siguientes, es decir, los números naturales "definidos" en términos conjuntistas. La propiedad de ser un número natural se define entonces como "pertenecer al menor conjunto inductivo", definición con la que concluye la reducción de la aritmética a la teoría de conjuntos, pues ahora los cinco axiomas de Peano son teoremas de TC (con algunas complicaciones que hemos obviado, sobre todo relacionadas con A5 de AP, pero que no son esenciales para la idea general). Lógica Proposicional (LO): Concluimos con la presentación del propio cálculo lógico de la lógica proposicional (lo mismo se podría hacer con la Iógica de primer orden). Aunque hoy es usual presentar los cálculos lógicos como cálculos de deducción natural, históricamente se formularon originariamente como cálculos axiomáticos; eso fue (parte de) lo que hicieron, p.ej., Frege en su Begr~ffsschrij?y Russell y Whitehead en Principia Marheilzatica para la Lógica d e Primer Orden. En lo que sigue referimos sólo los axiomas de una de las diversas versiones posibles para la lógica de enunciados (no referimos las reglas de inferencia, Modus Ponens y Sustitución; las variables están por proposiciones. y los axiomas y teoremas se han de leer, como en las teorías anteriores, clausurados uni\lersalmente). Términos primitivos: C 1. Negador: 7 (functor monario). C2. Implicador: + (functor binario). Axiomas: A l . x+(y-+x). A2. ( i x + l y ) + ( y + . x ) . A3. (x -+ 0> 4 2 ) ) ((x 4 y) -+ (x -+ z)j. Teoremas: TI. x + x . T2. -i (x-+ 7x). T3. x + ( l x + y). Definiciones: 91. X V Y = ~ ~ J ~ X + ~ . D2. x r \ y = d r f 7 ( x - + - i y ) . D3. ~ t j y = ~ ~ ( x + y ) ~ O > + x ) . Teoremas: T4. ~ ( x A - x ) . T5. x v - i x .
Con LO como última ilustración concluimos la presentación del concepto de cálculo o teoría axiornática y de otras nociones relacionadas, como las de reducción y equivalencia. Para fijar estos conceptos hemos utilizado intencionadamente como ejemplos (además de nuestras inventadas teorías del parentesco) teorías pertenecientes al campo de las ciencias formales. El motivo es que el análisis de las teorías de las ciencias empíricas como cálculos axiomáticos presenta problemas específicos que no tienen que ver con el concepto abstracto de teoría axiomática. Una vez fijado el instrumental conceptual, en las secciones subsiguientes nos ocuparemos por extenso de su eventual aplicación a las ciencias empíricas y los problemas específicos que tal aplicación comporta. Finalizaremos esta introducción del aparato conceptual presentando el concepto formal de modelo o realización de una teoría axiomática.
2. Teorías y modelos En el lenguaje común el término 'modelo' es un término extremadamente polisémico, y dentro mismo de la filosofía de la ciencia se usa con toda una variedad de significados diferentes (para un análisis de los mismos, cf. Falguera, 1993). Una familia de tales significados tiene que ver con la idea de caso o realización de una afirmación o conjunto de ellas. Así, por ejemplo, podemos decir que Romeo y Julieta, o mejor ellos "junto con su amor", son un modelo, caso o realización de la afirmación "los amantes prefieren la muerte a la separación"; o que España y Bélgica, "con todo lo que llevan dentro", son en la actualidad modelos o casos de monarquía constitucional, esto es, de una serie de principios o reglas políticas, y que Francia, Italia y Portugal lo son de estados republicanos (aunque España y Bilgica no realizan exactamente los mismos principios monárquicos, sólo comparten parte de ellos, y lo mismo Francia, Italia y Portugal respecto de los principios republicanos). Parte del sentido de este uso es explicitado y precisado por una teoría lógico-matemática altamente abstracta, la Teoría de Modelos. No vamos a ver aquí siquiera los rudimentos de tal teoría, nos limitaremos a presentar informalmente el concepto de modelo del que ella se ocupa, pues desempeña un papel importante en algunos análisis metateóricos que veremos en este y próximos capítulos. Un modelo en el sentido de la Teoría de Modelos (en adelante escribiremos simplemente 'modelo') es un sistema o estructura, un "trozo de la realidad constituido por entidades de diverso tipo, que realiza una teoría o conjunto de axiomas en el sentido de que en dicho sistema "pasa lo que la teoría dice" o, más precisamente, la teoría es verdadera en dicho sistema. Si tomamos los principios monárquicos generales comunes a las constituciones española y belga. y los bautizarnos como Teoría Mínima de la Monarquía Constitucional, entonces España y Bélgica, y p.ej. también Suecia, como sistemas o "partes de la realidad,
284
FL'XDAhlE\TOS
DE FILOSOFL~DE L.4 CIENCIA
son modelos de dicha teoría, y Francia, Italia y Portugal no lo son. Esta idea intuitiva se puede hacer precisa mediante la noción formal de sistema o estructura que presentamos en el Apéndice. Recordemos que un sistema es simplemente una tupla o secuencia de entidades conjuntistas construidas a partir de un universo o dominio básico de objetos. A veces puede haber varios dominios básicos, pero eso no es una diferencia esencial, pues siempre se puede tomar su unión como el universo y después destacar de él los subconjuntos principales. Lo importante es que un sistema es o representa "un pedazo de la realidad, entidad lingüística, salvo quizá, en algunas ocasiones. en un sentido d objetos del universo son ellos niismos entidades lingüísticas. El dominio tar de personas, números, proposiciones, partículas o cualesquiera otras e plo enunciados. En el primer caso tenemos un sistema "humano", en el s rico", y en e1 último caso tenemos un sistema "lingüístico", constituid ~üísticas.Pero incluso si en este caso queremos decir que el sistema es + ca en el sentido de estar construido por entidades lingüísticas, ello sólo pues estos sistemas "lingüísticos" no son ellos mismos entidades ling estiucticradas de la realidad, y como sistemas son simplementepa~~es lingüísticas susceptibles de ser verdaderas o falsas o de tener signifi realidad respecto de la cual ciertas entidades lingüísticas, enunciado las teorías entendidas en el sentido axiomático visto. son verdaderas contemplada la relación en la dirección opuesta, son panes de la reali no como afirma la teoría, que satisfacen o no las afirmaciones de la t teoría axiomática todas sus afirmaciones, su contenido, está expres implícitamente, por los axiomas, para ver si un sistema .es- o no --.-.-ver si satisface o no sus axiomas. Para que un sistema pueda siquiera ser modelo de tenga eloapropiado, es decir, que esté constituido por entida lógico que los t é n i n o s primitivos de la teoría. pues las entidades significado en el sistema", esto es la inrerpl-eración, de los término teoría contiene relatores diádicos y en el sistema no hay relaciones b ni siquiera podemos ponemos a ver si la teoría es verdadera o falsa e una teoría T cuyos términos primitivos son j relatores R!, ..., Rj (cad especificada), k functoresfi, ...,fr (con sus ariedades especificadas) res o constantes individuales cl, ..., cm.Diremos entonces que un sistema ción osible de.odT- i s Vamos a utilizar la h a r las entidades que interpretan en el sistema los t es una realización posible de T si S consta de un universo U y, relaciones R i , ..., Rj.,k funciones f,, ..., fi.y 112 individuos destacado ..., Rj, fi, ..., fL,ci, ..., cm>,tales que cada relación y función es de 1 relator o functor que interpreta. Estos sistemas son las entidades preguntarse si son o no modelos de la teoría, si en ellas la teoría ello s e x e s ' . Por supuesto que (salvo q e sea una tearía tautológica) no todas las posibles realizaciones serán realizaciones efecti as o modelos d e la teoría. Las realizaciones efectivas, o inodelos de la teoría, son aque las realizaciones __-m
C
- - - - - 1
1 1
posibles en las que ocurre lo que la teoría afirma, las que de hecho se comportan como la teoría dice, o técnicamente, en las que los axiomas (y con ellos todo el resto de afirmaciones) de la teoría son verdaderos. Para fijar ideas concluiremos dando una serie de axiomas y diversos sistemas, algunos de los cuales satisfacen todos los axiomas y otros sólo parte de ellos. Términos primitivos: C1. M (relator diádico).
C2. * (functor diádico). C3. 0 (functor diádico). C4. (functor monádico). C.5. e (constante individual). Axiomas (léanse clausurados universalmente): A l . xMx A2. x M y ~ y M z - + x M z A3. x*y =y*x A4. xoy =yox A.5. (x*y)*z = x*(y*z) A6. xOx= x A7. - - x = x A8. xhL~*y Ag. x0yM.r A 10. xob*z) = (xoy)*(.xoz) A l l . -(.vy)=-x* - Y A12. x * e = x A13. x o e = e A14. x* - . r = e
-
Contemplemos ahora los siguientes sistemas, en los que el primer constituyente, después del universo, interpreta 'M', el segundo '*', el tercero 'o', el cuarto '-' y el quinto 'e'. S, = <N, 5, +, ., S, O> (los naturales con "menor o igual que", la suma, el producto, la función "siguiente de" y el cero). S?= cZ, S, +, -,-, O> (los enteros con "menor o igual que", la suma, el producto, el opuesto y el cero). S3 = <I, 5, +, -,-, O> (los enteros impares con "menor o igual que", la suma, el producto, el opuesto y el cero). S4 = cQ. 2, :, -', l > (los racionales con "menor o igual que", el producto, el cociente, el inverso y el uno). Ss = <C, G, u, n,-,0>(los conjuntos con la inclusión, la unión, la intersección, el complemento y el conjunto vacío). S6 = (P, e,V, A, 1,C> (las proposiciones con la relación de consecuencia lógica, la disyunción, la conyunción. la negación y la (o una) contradicción). a,
El lector puede comprobar que todos ellos son realizaciones posibles, tienen el tipo lógico apropiado para poder satisfacer los axiomas, pero que sólo S5 y S6 son modelos de todos los axiomas, satisfacen de hecho todos los axiomas a la vez. En S , fallan los axiomas 6, 7, 9, 11 y 14; S: y S3satisfacen los mismos, a saber, todos menos 6, 8, 9 y 11; por último, SI sólo satisface 1,2,3.5,7, 12 y 14. Como se ve, una misma teoría, un mismo conjunto de axiomas, puede tener modej los muy diferentes. De hecho no hay ninguna teoría que tenga un único modelo o realización, al menos si estamos dispuestos a aceptar siempre modelos matemáticos. Ahora bien, aunque las teorías no determinan unívocamente sus modelos en este sentido tan estricto, lo pueden hacer en otro sentido todavía interesante. un poco más débil que el anterior y de hecho más razonable. En la interpretación que venimos usando, una teoría pretende "describir (un trozo de) la realidad". Pues bien, si los diversos modelos son "extremadamente semejantes" entre sí, aunque no se describa un ú*co modelo se tratará de una buena descripción en el sentido de suficientet~tenteuníi,oca. Dicho técnicamente: si los diversos modelos son isomorfos entre sí (para la noción de isomorfía, cf. Apéndice), la teoría determina la realidad del modo más fuerte que es razonable exigir; a una teoría así se le denomina categórica. Dar con una teoría categórica no es fácil. Por ejemplo, la teoría consistente en todos los axiomas que acabamos de presentar tiene modelos no isomorfos, S5 y S,. La teoría consistente en los axiomas 1, 2, 3,4,5,7, 10, 12, 13 y 14, tiene modelos isomorfos, S2 y SI, pero otros no isomorfos, pues S5 y S6 son también modelos de esa teoría y no son isomorfos entre sí ni respecto de S: y SI. En realidad no siempre es bueno pretender que la teoría sea categórica. Quizá eso sea deseable en las teorías formales, pero desde luego no lo es en las teorías empíricas. En las teorías empíricas es natural pretender que una teoría tenga modelos que sean partes de otros modelos o, como se dice técnicamente, q r e entre sus modelos algunos puedan ser extensiones de otros, esto es, partes más grandes de la realidad, por así decir. Eso no siempre impide la isomorfía, por ejemplo SI es una extensión de Sj y son isomorfos; pero la impide cuando los modelos, como parece razonable no descartar en las teorías empíricas, tienen un universo finito. Sobre este tipo de cuestiones trataremos más adelante. De momento es conveniente insistir ahora tan sólo en el siguiente hecho, trivial pero interesante: todos los modelos de una teoría, sean o no isomorfos, se parecen mucho en cierto sentido, a saber, todos se comportan como la teoría dice. Y eso por supuesto es un parecido digno de tener en cuenta, de hecho es el tipo de parecido a tener en cuenta cuando se trata de teorías empíricas.
1; ->
3. Caracterización general de las teorías empíricas como cáIculos interpretados Examinemos ahora los primeros análisis que se hicieron del concepto de teoría empírica. Según la concepción a que dichos análisis dieron lugar, una teoría empírica es un cálculo interpretado, donde por 'cálculo' se entiende un cálculo o teoría axiomática en el sentido presentado en la sec. 1. Allí vimos unos ejemplos puramente formales, y la ilustración era intencionada, pues de hecho los primeros filósofos de la ciencia tomaron la idea de las axiomatizaciones que entonces se hacían de algunas teorías lógicas y matemáticas (axio-
matizaciones en matemáticas que hasta mediados de siglo seguirían invariablemente el esquema de la sección 1). Es más, el primer análisis detallado de las teorías empíricas como cálculos interpretados se presenta explícitamente en relación con una teoría axiomática puramente matemática. Se trata del estudio que hace Reichenbach en los años veinte de las semejanzas y diferencias en naturaleza y estructura de la Geometría Pura (GP) y la Geometría Física (GF) (cf. 1928). La semejanzas consistían básicamente en la estmctura axiomática de ambas; las diferencias se derivaban de la naturaleza empírica de la segunda. A diferencia de GP, cuyo análisis se agota al dar su estructura axiomática puramente formal, el carácter empírico de GF obliga a completar la parte puramente axiomático-formal con elementos adicionales que den cuenta de su carácter "físico"; estos elementos deben hacer explícitos los modos en que el formalismo abstracto se pone en contacto con la experiencia, esto es, el modo en que recibe una interpreraciónflsica determinada. Éste es el origen y núcleo del análisis de las teorías empíricas como cálculos interpretados. La idea básica es desarrollada, en los años veinte y treinta del siglo xx, de modo parcialmente coincidente por Reichenbach, Ramsey, Bridgman, Campbell y Camap, que sería su principal impulsor. Esta idea se conforma como el núcleo central de lo que se denominará más tarde Concepción Heredada y encuentra su expresión más elaborada en las principales monografías que en los años cincuenta y sesenta escriben sus principales representantes (cf. especialmente Braithwaite, 1959; Camap, 1966; Nagel, 1961 y Hempel; 1965 y 1966) y será prácticamente dominante en filosofía de la ciencia hasta casi los años setenta. Veremos primero en esta sección cuáles son sus aspectos más generales y discutiremos en las sisuientes con algo de detalle algunos de sus elementos, la evolución que sufrieron y las últimas revisiones críticas, principalmente por parte de Hempel.
Según la posición dominante en filosofía de las ciencias formales, al menos durante la primera mitad del siglo xx, los axiomas del formalismo abstracto son lo único que interviene en la caracterización de las entidades "de las que habla" una teoría matemática; qué cosas son esas de las que pretendemos hablar al usar los términos de la teoría es algo que depende únicamente de los axiomas, las entidades en cuestión son cualesquiera de las que los axiomas sean verdaderos. Así, por ejemplo, los números naturales, es decir, la propiedad de ser número natural, el número cero y la función siguiente, serán cualesquiera entidades de las que resulten ser verdaderos los axiomas de Peano. A veces se expresa esto diciendo que los axiomas caracterizan las entidades de la teoría o, también, que definen iinplícitamente los términos primitivos. Debe quedar claro que no se trata de una definición en el sentido introducido en la sección 1. De los términos primitivos no puede haber definición e-rplícira, pues entonces no serían primitivos (las definiciones explícitas son justamente el modo en que se introducen los términos derivados a partir de los primitivos). Los axiomas "definen" implícitamente los términos primitivos en el sentido apuntado, a saber, ellos son los únicos elementos constitutivos del significado de los términos; cualquier estructura que sea modelo de los axiomas es una interpretación admisible de los
mismos; esto es, los constituyentes de cualquiera de tales estructuras son interpretaciones admisibles de los términos con que se formulan los axiomas. Algunos autores, como Carnap, han dado una interpretación coi~vencio~íalista de las definiciones implícitas, según la cual los axiomas estipulan el significado de los términos y por tanto son "\lerdades por convención". Otros, como Hilbert inicialmente, han defendido una interpretación fori7talisra, de acuerdo con la cual los axiomas son simplemente reglas para el manejo de los signos involucrados, y por tanto en sentido estricto ni siquiera es razonable considerarlos susceptibles de ser verdaderos o falsos. En tal caso es discutible que tenga incluso sentido hablar propiamente del si,pificado o interpretación de los términos involucrados. Convencionalismo y formalismo son dos modos específicos de entender la idea general de que en un sistema axiomático los axiomas definen implícitamente los términos, que los axiomas solos caracterizan plel~amenteel "uso correcto" de los términos. Pero se puede defender esta idea sin defender ninguna de esas interpretaciones específicas de la misma, defendiendo que existen "realmente" las entidades matemáticas significadas por los tenninos primitivos; los números naturales son cualquier cosa (tomando ahora 'cosa' en serio en un sentido no lingüístico) que satisfaga los axiomas de Peano. Independientemente de cuál sea su interpretación específica (salvo en el caso quizá del formalismo radical) hay algo de plausible en la idea general de que las cosas de las que una teoría matemática habla son cualesquiera entidades que satisfagan los axiomas. Ese elemento de plausibilidad es el que justifica que aceptemos que Frege redujera la aritmética a teoría de conjuntos. Como hemos visto en la sección 1, Frege demostró que los axiomas de Peano que usan los términos 'cero', 'el siguiente de' y 'número natural' son verdaderos de "el conjunto vacío", "la unión con el propio unitario" y "pertenecer al menor conjunto inductivo". Entonces eso son (los) naturales, pues de esas cosas son verdaderos los axiomas de la aritmética. Quien proteste y diga que a pesar de ello no se trata de la aritmética, pues está claro que "esas cosas" son conjuntos y no números, está rechazando de plano dicha idea general; y en la medida en que tal protesta se considere injustificada se considerará plausible la idea en cuestión. Y efectivamente la protesta parece algo injustificada, lo que son las cosas depende de sus propiedades, de su "comportamiento", que es lo que establecen los axiomas, no depende de las expresiones lingüísticas con las que la teoría las nombre. De todas formas las intuiciones no son del todo claras pues, ¿qué diríamos si de hecho AP fuese verdadera también de (supongamos por un momento que efectivamente existen tales entidades) el individuo Lucifer, la función "el corruptor de" y la propiedad "ser demonio"?, ¿aceptaríamos también sin protestar que estamos ante números naturales? Esta cuestión es extremadamente compleja y no vamos a ocupamos aquí de ella, pues eso es tarea de la filosofía de la matemática. Si nos hemos extendido algo sobre este punto es para presentar la intuición central del análisis de las teorías empíricas. La idea que queremos destacar es la siguiente: mientras que en las ciencias formales parece razonable, o al menos defendible, la tesis de que las entidades a las que la teoría se refiere son cualesquiera de las que sean verdaderas los axiomas, ella es totalmente inaceptable aplicada a las ciencias empíricas. Por ejemplo, si los principios de la mecánica newtoniana, formulados con términos como 'partícula', 'masa' y 'fuerza', fuesen por casualidad
verdaderos de los ángeles, su "cantidad de espiritualidad" y sus "afinidades", no por ello diríamos que ésas son cosas de las que habla la teoría mecánica, no diríamos que son sistemas mecánicos. 0, con un ejemplo menos absurdo, tales principios son de hecho verdaderos de ciertos dominios puramente numéricos y de ciertas funciones puramente numéricas entre los números de los dominios, pero eso no hace que la mecánica hable (quizá entre otras cosas) de puros números, no por ello los números son partículas mecánicas. Eso es indiscutible en este caso; la idea de que los términos de la mecánica refieren a cualesquiera entidades que satisfagan el formalismo abstracto es claramente inaceptable. El motivo es que, a diferencia de las ciencias formales donde esa idea es cuando menos discutible, las teorías empíricas tienen, además de las constricciones derivadas del sistema axiomático abstracto, otras constricciones derivadas de su vinculación con el mrrndofísico-natural, o mejor dicho, con algún aspecto específico del mismo del que pretenden dar cuenta. Por supuesto que esta diferencia depende de que se considere que hay a su vez una diferencia entre teorias formales y teorias empíricas, y efectivamente la mayoría de los autores de este período (y también posteriormente) consideran que dicha diferencia es un dato firme de nuestras intuiciones. Aceptando esta peculiaridad de las teorías empíricas, jcómo se debe recoser este hecho específico en el análisis de las mismas? La respuesta parece inmediata: incluyendo, junto con el sistema axiomático abstracto, otro elemento que exprese la conexión de dicho formalismo con "situaciones de la experiencia" en las que interactuamos o "contactamos" con el mundo físico. La articulación específica de esta respuesta que se impondrá en la Concepción Heredada es que esas situaciones de experiencia en las que se da el contacto básico con el mundo físico son situaciones de observación directa de fenómenos físicos. En la formulación y expansión de esta idea influyó sin duda el neoempirismo (a veces radical) dominante en los círculos filosóficos donde se planrearon estas cuestiones, pero independientemente de ello la idea tiene cierta plausibilidad en sí misma. La interacción básica con nuestro entorno físico inmediato la realizamos a través de los órganos sensoriales, interacción que se plasma en forma de obsetvaciótt, en un sentido amplio. no estrictamente visual, del término. Pero hay que distinzuir esta idea general difícilmente recusable de otras dos más fuertes: a ) El "estar basado en la observación" característico dz nuestro sistema cognitivo global, caracteriza también sus diversas partes, y en particular es característico en exactamente el mismo sentido de cada teoría científica concreta. b) Por observación directa se ha de entender observación independiente de esquemas cognitivos elaborados. Aunque hemos formulado estas tesis muy vagamente, debe notarse que no son ya indiscutibles, que son mucho más fuertes que la idea general claramente defendible. En la penúltima sección volveremos sobre ellas para discutirlas en detalle; por el momento basta saber que eran defendidas por muchos de los iniciadores de la Concepción Heredada y que se acabarían imponiendo en la versión oficial de la misma (aunque. como veremos, la particular versión que cada autor ofrece de ellas incluye importantes matizaciones y cualificaciones para evitar algunas de las conseciiencias más patentemente inaceptables).
3.2.
~ Á L C U L O S ISTERPRFTADOS: VOCABULPIRIO; AXIOSl.4S Y REGLAS DE CORRESPONDENCIA
Según el análisis que estamos presentando, por tanto, cada teoná científica está conformada por un cálculo axiomático abstracto y otro componente que conecta las expresiones de dicho cálculo abstracto con situaciones de la experiencia entendidas como situaciones de obsen~acióndirecta. Este segundo elemento está conformado por enunciados que vinculan los términos del sistema axiomático con términos obse~-racioiilalesque refieren a objetos, propiedades o relaciones directamente obsenfables. A esos "enunciados conectores" se les ha denominado de varios modos: reglas de correspoltdelzcia (Camap, Nagel, Margenau), defiiziciones coordi~~ativas (Reichenbach), elzunciados ilzterpretariilos (Hempel), postulados de siglzificación (Camap, Hempel) diccioizario (Campbell, Rarnsey) o defniciones opemcioiiuzles (Bridgman). Pero, a pesar de que hay algunas diferencias de concepción (especialmente notables en el último caso), su función es en términos generales la misma, proporcionar interpretación empírica al cálculo axiomático que por sí mismo está sacío de contenido empírico. Las teorías empíricas son pues cálculos axiomáticos inrerpi-etadosempíricamente a través de esos enunciados que conectan los términos del formalismo con situaciones de obsen~acióndirecta. En este punto, y antes de esquematizar los elementos centrales de esta concepción, es necesario hacer una observación. Hemos dicho que el cálculo axiomático por sí solo carece de contenido empírico y que, para dar cuenta de su interpretación empírica, el análisis añade junto a los axiomas del cálculo un conjunto de reglas de correspondencia. Pero podría pensarse, quizá, que las cosas no tienen por qué ser así. Aunque lo distintivo de las teorías empíricas sea que tienen contenido empírico, e incluso si tal contenido se adquiere a partir de ciertas situaciones de observación, no es necesario introducir las reglas de correspondencia, puede bastar con el cálculo axiomático si algunos de sus términos fuesen términos de obsentación, en cuyo caso algunos de los axiomas estarían ya cargados de contenido empírico. Bien, esta cuestión es en parte puramente nominal, derivada de cómo hemos presentado las cosas. Tomemos todas las afirmaciones (primitivas) de la teoría y seleccionemos entre ellas las que no contienen términos observacionales: direinos que estas afirmaciones constituyen el cálculo axiomático abstracto. Tomemos las afirmaciones que incluyen términos tanto obsernacionales como no observacionales, éstas son las reslas de correspondencia. Se trata, si se quiere ver así, de que el análisis "divide" el sistema de afirmaciones completo en dos partes, o en realidad en tres partes, pues hay que añadir las afirmaciones que sólo contienen términos observacionales, esto es, las afirmaciones puramente observacionales. Esta estrategia de análisis sería insatisfactoria si toda afirmación contuviera términos obsenracionales, pues en tal caso lo que hemos venido llamando cálculo axiomático abstracto no existiría. Pero ello no es así, toda teoría mínimamente compleja y sistematizada, que no sea un mero informe de afirmaciones obsenlacionales, contiene afirmaciones sin términos observacionales. Y no sólo eso, sino que la mayoría de sus afirmaciones son de ese tipo, al menos tal y como aparecen las teorías formuladas en los libros de texto avanzados. Esas afirmaciones, aisladas, están desconectadas de la experiencia, de modo que lo que nos presenta una formulación estándar de una teoría empírica conlpleja altamente elaborada se parece mucho a lo que hemos caracterizado como un cálculo axiomático abstracto no interpretado (o al menos
así lo pensaban los autores mencionados). Eso representa un serio reto para los filósofos de orientación empirista que, como parte de un proyecto que arranca de la Ilustración, quieren descartar como carentes de sentido las afirmaciones (no puramente analíticas) desconectadas de la experiencia, típicamente las de la metafísica especulativa y las de pseudociencias como la astrología. Es un reto, pues las afirmaciones que aparecen en los textos avanzados de muchas teorías científicas parecen en principio de ese tipo. La solución radica e n que, aparezcan o no en las exposiciones usuales de la teoría, forman parte esencial de la teoría otras afirmaciones que ponen en conexión expresiones que aparecen en las primeras con situaciones observacionales; y si no existen afirmaciones de ese tipo, no se trata de una teoría empírica. Ésa es la diferencia entre la ciencia empírica y la metafísica; la diferencia con las pseudociencias consistiría en que, o carecen (como la metafísica) de reglas de correspondencia, o si tienen tales conexiones con la experiencia, entonces son patentemente falsas. Pasemos ahora a esquematizar sumariamente los principales elementos del análisis presentado. Las teorías empíricas dan cuenta de fenómenos empíricos postulando ciertas entidades o procesos gobernados por ciertas leyes; esas entidades postuladas no están directamente dadas en la observación, están "alejadas" de la experiencia observable, contrariamente a los fenómenos de los que pretenden dar cuenta, directamente accesibles a la observación. La teoría introduce nuevos términos para referirse a esas entidades y procesos no observables. Diremos de esas entidades que son entidades teóricas'y de los términos introducidos para referirnos a ellas que son ténnirzos teóricos. Vocabulario. Podemos dividir el conjunto de expresiones o vocabulario V de una teoría en tres partes (nos limitamos aquí a los términos primitivos, los términos derivados se introducen mediante definiciones explícitas del modo indicado en la sección 1):
(1) Términos puramente lógico-matemáticos. Éste es el vocabulario formal 'C; de la teoría, esto es, el vocabulario de apoyo que proporciona el lenguaje o instrumental formal y que en algunos casos puede incluir partes muy eleva‘aiken~r-I. das d t la matemática. " (2) Términos observacionales. Éste es el vocabulario observacional Vo de la teoría, esto es, el vocabulario que se refiere a entidades directamente obser\ vables y a propiedades y relaciones entre ellas directamente observables. Son I términos observables, por ejemplo, 'rojo', 'caliente', 'vara', 'más largo que', \r 'más voluminoso que', 'más liviano que', etc. ! ' (3) Términos teóricos. Éste es el vocabulario teórico VT de la teoría, esto es, el vocabulario que se refiere a entidades, propiedades y relaciones no directamente i observables postuladas para dar cuenta de los fenómenos. Son términos teóricos, por ejemplo, 'electrón', 'masa', 'campo eléctrico', 'gen', 'entropía', etc. Si llamamos vocabulario descriptivo VD al vocabulario no meramente formal d e a p o y o , t e n e m o s V = V ~ u V ~ , V ~ = V 0 ~ V ~ , V ~ n V ~ = 0 y V ~ n7 V O = 0 .
/
i . . i i I z -
h
Afinnnciorzes. La anterior partición del vocabulario de una teoría genera otra a nivel de los enunciados o afirmaciones. Toda afirmación de la teoría contiene vocabulario
formal, pero no sólo vocabulario formal, también contiene términos descriptivos. Eso nos deja las siguientes tres posibilidades: (1) Enunciados (puramente) teóricos. Contienen como vocabulario descriptivo únicamente términos teóricos. De entre ellos se seleccionan algunos como axiomas o postulados primitivos: A l , ..., A.; el resto se deriva de ellos como teoremas. Son los enunciados que expresan el comportamiento de las entidades teóricas. Son enunciados teóricos, por ejemplo, 'la fuerza eléctrjca es directamente proporcional al producto de las cargas', 'los genes tienen dos pares de alelos', etc. (2) Enunciados (puramente) observacionales. Contienen como \~ocabulariodescnptivo únicamente términos observacionales. Algunos describen situaciones observables particulares y otros son afmaciones generaIes, esto es, expresan generalizaciones o leyes puramente empíricas-obsen.acionales. Son enunciados observacionales, por ejemplo, 'Juan Pérez tiene los ojos verdes', 'esta porción de agua se ha solidificado', 'los líquidos se solidifican al enfriarse', etc. (3) Reglas de correspondencia. Contienen tanto términos teóricos como términos observacionales. En la medida en que unas se puedan derivar de otras, también se pueden escoger de entre ellas unas que hagan de primitivas: R I ,...,R,. Son los enunciados que conectan los términos teóricos con la experiencia observable cargando así de interpretación empírica los axiomas puramente teóricos. Son ejemplos de reglas de correspondencia, por ejemplo, 'a presión constante, el volumen aumenta con la temperatura', 'diferencias en el e-color --@ -S van acompañadas de diferencias en los -genes', 'al solidificarse un -___ líquido disminuye su entropía', etc. Estos enunciados son el puente que permite pasar de lo observacional a lo teórico y v;ceversa. Esta clasificación de los términos y los enunciados permite expresar de un modo simple la estructura de las teorías en tanto que cálculos interpretados: una teoría T es un par T = <A, R>, donde A es el conjunto (o la conjunción) de todos los axiomas y R es el conjunto (o la conjunción) de todas las reglas de correspondencia. Las teorías empíricas son cálculos interpretados: A es el cálculo axiomático, R proporciona la interpretación empírica. Se dirá que faltan los enunciados puramente observacionales, pero no es así, pues se derivan de A y R y, por tanto, ya están incluidos en T. Se comienza por una serie de observaciones particulares, que quizá den lugar a generalizaciones empíricas de las que queremos dar cuenta. Para ello se postulan una serie de entidades teóricas regidas por ciertas leyes expresadas por A . Una vez determinadas las reglas R que expresan los efectos observacionales de las entidades teóricas, se derivan, si se tiene éxito, de A y R las generalizaciones o fenómenos de los que queríamos dar cuenta (explicación), u otros nuevos que servirán para contrastar la teoría (predicción).? 2.
Algunos representantes de esta concepción, como Xagel (cf. 1961, cap. 5, 511.3, también Hesse, tiiodelos. Pero la referencia a
1966) incluyen, como "elemento adicionai", además de axiomas y reglas,
.
Esta estructura es plásticamente expresada por Hempel mediante su famosa metáfora de la red: "Una teoría científica puede entonces ser comparada con una red espacial compleja: sus términos est6n representados por los nudos, mientras que los hilos que unen éstos corresponden en parte a las definiciones y en parte a las hipótesis fundamentales y derivadas incluidas en la teoría. Todo el sistema flota, por así decir, sobre el plano de la observación y está anclado en él mediante reglas de interpretación. A éstas se las puede considerar conlo cuerdas que no forman parte de la red pero que conectan ciertas partes de ella con lugares específicos de la observación. En virtud de estas conexiones interpretativas, la red puede funcionar como teoría científica: a partir de ciertos datos observacionales podemos ascender a través de una cuerda interpretativa hasta algún punto de la red teórica, de aquí pasar a través de definiciones e hipótesis a otros puntos, desde los cuales otras cuerdas interpretativas permiten descender al plano de la observación" (1952, $7). Hasta aquí las líneas generales del análisis de las teorías empíricas, de sus constituyentes, naturaleza y funcionamiento, propio de la Concepción Heredada. Para concluir con este enfoque comentaremos en las próximas secciones dos cuestiones que fueron objeto de especial atención: a) la naturaleza de las reglas de correspondencia y sus consecuencias para la supuesta eliminabilidad de los términos teóricos: y b) la distinción teórico/observacional y la naturaleza de la base empírica. En esta última cuestión presentaremos las críticas internas de Popper y el último Hempel, que sugieren modificaciones fundamentales.
4. Las reglas de correspondencia y la cuestión de la elirninabili'dad de los términos teóricos Hasta ahora hemos presentado las reglas de correspondencia de una forma extremadamente general, sin especificar su estructura, tan sólo hemos dicho de ellas que contienen términos tanto teóricos como observacionales. Ésta es una caracterización muy Pero eso no fue siempre débil compatible con prácticamente cualquier forma ~intáctica.~ así y en los inicios se pretendió imponer consuicciones más fuertes sobre la forma de las reglas, constricciones derivadas de la finalidad que se les atribuía.
modelos en esta concepción es excepcional y, cuando se hace, está poco desmollada, mal estructurada con el resto de elementos y, en general, es muy confusa. Al no pasar a formar parte de la versión oficial, no vamos a detenemos aquí en ella. 3. Aunque no con cualquiera, al menos no si se entiende la inclusión de términos de ambos tipos en sentido esencial, e.e., que las reglas contienen esenciulmenre términos tanto teóricos como observncionales. Si eso es así y, supuesto que t es el único timiino de uno de los tipos, la regla no puede tener la forma, P.e., "a A ( X t ) v -. y(t)) + p', pues ahí r no ocurre esencialmente (a no ser que ocurra esencialmente en a o en p); es sólo este tipo de formas el que queda excluido por la caracterización general anterior.
791
FUND.r\hlE\TOS DE FILOSOF~.-\ DE LA CIENCIA
Las reglas expresan la conexión de los términos teóricos con la experiencia observable, cargan de contenido o significación empírica tales términos. Como hemos indicado más arriba, una de las preocupaciones de estos filósofos, de orientación general neoempirista. era dejar clara la legitimidad-ca de las expresiones científicas, por contraposición a otras según ellos carentes de sentido. Esa legitimidad la da el anclaje en la experiencia obsenable, y es tanto mayor cuanto m%s fuerte sea dicho anclaje obsenlaciohal. Si eso es así, entonces la alternativa más fuerte a considerar es que los términos teóricos sean completamente definibles mediante términos obsenlacionales, esto es, que haya'de$ziciones explícitas de los términos teóricos mediante vocabulario observacional. Más arriba hemos indicado que no puede haber definiciones explícitas de los términos primitivos del cálculo axiomático, pero en ese contexto estaba claro que teníamos en cuenta únicamente la intervención de términos teóricos. La opción ahora es definir explícitamente los términos primitivos teóricos del formalismo abstracto, no mediante otros términos teóricos sino mediante términos observacionaies; puesto que con los términos teóricos prin~itivosse definen los restantes términos teóricos, la alternativa implica la eliminabilidad total de los términos teóricos, los convierte en meras abreviaturas de expresiones más complejas cuyos componentes se refieran sólo a entidades observables. Esta alternativa determina la forma que deben tener las reglas de correspondencia, a saber, la de las definiciones explícitas: para cada término r de Vi-hay una regla de correspondencia que tiene la forma "$1) cp(o,, ..., o&)".donde t es el único término teórico que ocurre en y y cp sólo contiene como términos descriptivos k términos observacionales o,, ..., oi. Si esta propuesta fuese viable, entonces la teoría estaría utilizando siempre un vocabulario en realidad exclusivamente obsemacionai, sólo que usando a menudo abreviaturas notacionales. No es difícil ver que ello conferiría la máxima legitimidad observacional al lenguaje de la teoría: las entidades teóricas "desaparecen" o, más suavemente, se reducen a, o se consuuyen como, complejos de observables. El principal defensor de dicha propuesta, Carnap, reconoció pronto su inviabilidad. El problema principal lo ejemplificaban los términos de propjedades disposicionales, como 'frágil', 'elástico' o 'soluble'. Estos términos se refieren a propiedades que se caracterizan por cierta reacción ante ciertas circunstancias; por ejemplo, un cuerpo es soluble si, al sumergirse en agua, se disuelve (las propiedades no disposicionales se denominan categóricas, p.ej. ser molécula de ácido sulfúrico o ser vertebrado). Aunque no 10 parezcan en primera instancia, muchas de las propiedades teóricas de la ciencia son disposicionales, lo que representa un serio problema para el programa eliminativista. Las únicas definiciones explícitas para estas propiedades deben tener la forma
donde D es la propiedad disposicional que queremos definir, C son las condiciones observables en las que se actualiza la disposición y R es la respuesta observable que la disposición produce en las condiciones C; por ejemplo, "x es soluble syss, si x se sumerge
1 fpc
i
jiLk21 1"
1 j
f
1 I
iI
i
I
, I
en agua, entonces x se disuelve". El problema es que, por la lógica del condicional material, estas definiciones atribuyen la propiedad disposicional a todo individuo que no sea sometido a las condiciones C,por ejemplo a toda sustancia que no se sumerja nunca en agua, lo cual es inaceptable. La solución de Carnap (cf. 1936-1937, 57) es abandonar la propuesta reduccionista radical, optar por otra que no tenga consecuencias inaceptables aunque no permita la eliminación vía definición explícita de los términos teóricos. La nueva propuesta consiste en modificar la forma de las reglas para términos disposicionales del siguiente modo:
Es claro que (2) no tiene los problemas de (l), pero también que no permite eliminar el término disposicional al no ser una definición explícita, sino una definición "parcial" o, en expresión de Camap, un enunciado de reducción parcial. Una reducción (definición, eliminación). eliminación) earcial es, Simplemente, una no reducción (de&ión. ahora, cuando las condiciones de prueba C no se satisfacen, la posesión o no de la propiedad dhosicional D queaa simplemente indeterminada; por ejemplo, de una sustancia que nunca se sumerja en agua queda indeterminado, según (2), si es o no soluble. Eso sería una consecuencia inaceptable si pretendiéramos que (2) es una definición, esto es, si pretendiéramos que determina las condiciones necesarias y suficientes de que algo sea o no soluble. Pero ahora ya no se pretende tal cosa.' Los términos disposicionales no son los únicos que sugieren estas modificaciones, aunque son los que mejor las ilustran, al menos en primera instancia. Se reconoce que lo mismo ocurre con términos en principio no disposicionales, como 'temperatura'. También en estos casos las reglas sólo proporcionan interpretaciones empíricas parciales. Por ejemplo, la regla "si al introducir un tubo de vidrio con mercurio en una sustancia y después introducirlo en otra, la columna de mercurio asciende, entonces la segunda sustancia está a mayor temperatura que la primera" interpreta sólo parcialmente el término 'temperatura', pues no se aplica a sólidos, o a temperaturas muy altas, o muy bajas, etc. (cf. p.ej. Camrip 1966, cap. XXVIII). Y lo mismo ocurre con las demás reglas para el término. Podría pensarse que la situación se rzsuelve conyuntando todas las reglas de correspondencia para cada término, pero, y esto es verdaderamente importante, no es así. La conyunción proporciona la total interpretación empírica, pero no constituye una definición o eliminación del término, pues no incluye situaciones en las que, según los axiomas teóricos, también se aplica: por ejemplo, no hay ninguna regla de correspondencia directa para la situación consistente en que el centro del Sol está a mayor temperatura que su superficie. Una vez abandonada la propuesta eliminativista radical y abierta la puerta a reglas de correspondencia no definicionales, no hay especial razón para imponer constricciones
m
4. Es cierto que ésta no es la única alternativa al problema, hay otns que mantienen Ia vocación drfinicional. La mis inmediata es sustituir en (1) el condicional material por un condicional contrafictico o de necesidad física (cf. cap. 5), pero para la mayoría de nuestros filósofos neoempinstas (especialmente Cxnap. pero no sólo él) las soluciones en esta línea son inaceptabks por apelar ir conceptos modales, como el dr necesidad. que prefieren evitar en una reconstrucción lógica de la ciencia.
muy específicas a la forma de las reglas. De este modo se acaba admitiendo como regla cualquier tipo de enunciado mientras contenga esencialmente términos teóricos y obsenracionales. O para ser más precisos, de los tres tipos de enunciados que puede contener una teoría científica, a saber, enunciados sólo con términos teóricos, enunciados sólo con términos observacionales y enunciados con términos tanto teóricos como obsen7acionales, j se se'_eccioaan esto~~últimos (o una subclase-representante de los mismos) como ,_---- las reglas (incluso a 1 de ;orre9a&xxi.a de%_-teoría sin importar la forma -- -sintáctica -que- tengan veces, como señalaron Ramsex-Camap yTráithi+yáite,las reglas p e d e n tener la forma de definiciones explícitas de términos observacionales mediante términos teóricos). El propio Camap acaba poniendo como ejemplo de regla de correspondencia enunciados que simplemente conectan mediante un condicional material un término teórico con otro observacional, por ejemplo "si u es más caliente que v, entonces la temperatura de u es mayor que la de v" (cf. Carnap, 1956, QV). Esta liberalización en la forma Iógica de las reglas va acompañada de otra en apariencia más radical, a saber, ni siquiera es necesario que todo término teórico intervenga esencialmente en al menos una reglz de correspondencia. Pero esta liberalización es más radical sólo en apariencia. En efecto, si no se trata de definir observacionalmente los términos teóricos, si basta con que estén conectados con términos obsen~acionalesmediante las reglas, entonces no es necesario que esa conexión deba ser directa para todos y cada uno de los términos teóricos; esto es, puede que algunos se conecten sólo Ntdirectarnenre con la base observacional a través de su conexión axiomática con términos teóricos conectados directamente con la base observacional. Algunos términos teóricos*fendrán varias reglas (p.ej. varios enunciados de la forma (2) con diferentes Cs y Rs), pero otros pueden no tener ninguna y no por eso carecen de contenido empírico (y con ello de legitimidad semántica) pues adquieren tal contenido (legitimidad) indirectamente por su conexión a-través de los axiomas con otros términos para los que sí hay reglas de correspondencia. Resumiendo, los términos teóricos (primitivos), por tanto, no son eliminables mediante definiciones explícitas a partir de términos observacionales. Son términos con "vida propia" que fijan su contenido o significado por dos vías, cada una de las cuales los "define" sólo parcialmente: a ) su conexión con otros términos teóricos a través del cálculo axiomático, y b) su conexión, directa o indirecta, con términos observacionales a través de las reglas de correspondencia. Así pues, el significado de los términos teóricos no es puramente observacional, las conexiones axiomáticas contribuyen esencial e ineliminable3 mente al mismo. Nótese que tampoco es viable la alternativa opuesta, a saber, que el significado fuese puramente teórico, que los axiomas diesen el significado (implícito) completo de los términos teóricos y que las reglas fuesen hipótesis empíricas que no contribuyeran al significado de tales términos. Si eso fuera así, los axiomas teóricos, las leyes, serían (como en las ciencias formales) verdades analíticas, verdades en virtud del significado de los términos que involucran, carentes por tanto de todo contenido empírico; sólo tendrían contenido empírico las reglas de correspondencia, la mayoría de las afirmaciones de las teorías consideradas enipíricas serían, contra toda apariencia, analíticas. Puesto que ésta parece una conclusión claramente rechazable, el significado de los términos teóricos no
\
L.-
puede depender de los axiomas solos, como tampoco depende de las reglas solas, sino de ambos a la vez. Aquí, sin embargo, se abre uno de los problemas más profundos de la filosofía de la ciencia, relativo al significado de los términos teóricos y al estatuto epistémico de las afirmaciones científicas. El lector avisado habrá advertido que, si el significado de 10s términos teóricos no es constituido por los axiomas solos, ni por las reglas solas, sino por ambos a la vez, entonces parece que se puede decir de "los axiomas más las reglas" lo mismo que se dice en las ciencias formales de los axiomas, a saber, que puesto que constituyen el significado de los términos, entonces axiomas y reglas son analíticamente verdaderos, verdaderos en virtud de definiciones. Ésta es en parte la brecha por la que Quine ataca la distinción analítico/sintético (cf. 1951) al poner de manifiesto toda una serie de problemas en la distinción tradicional que obligarán a revisar la relación entre analítico y etnpíricamente revisable. No podemos detenemos aquí en esta cuestión. Para concluir con las reglas de correspondencia mencionaremos brevemente dos modos en los que, en este enfoque, se acepta que los términos teóricos son eliminables en cierto sentido en favor de los observacionales, aunque no mediante definiciones explícitas.
El primero de los procedimientos se debe a F. P. qamsey. Ramsey mostró (cf.
1929) que, dada una teoría T = 4, R>, siempre es posiblz da' con otra que tenga el mismo contenido empírico, es decir las mismas consecuencias observacionales, y que no use tirrninos teóricos. El expediente es sencillo: sustituimos cada enunciado "y(t)" de A o de R que contenga un término teórico t por otro de la forma "3y(x)"; por ejemplo, sustituimos "si u es más caliente que v entonces Temp(1c) > Temp(v)" por "3P (si u es más caliente que v entonces P(u) > P(v)". En realidad no se realiza la existencialización en cada enunciado suelto, pues cuando un mismo término teórico aparece en varios enunciados, la variable para su existencialización debe ser la misma. Una teoría T = 4, R> (con p términos teóricos y q términos observacionales) se puede identificar con la conyunción "AxlA Ax2 A ...Rc, A Rez A ...", de los axiomas de A y las reglas de R, que abreviaremos mediante "AR ( t i ,..., r,, O,,..., O,)". Si T es una teoría, la versión-Ramsey de T es:
Pues bien, se puede demostrar entonces que todo enunciado (puramente) observacional que se sigue de T se sigue también de TR, enunciado éste que, como hemos visto, no contiene términos teóricos. En este sentido los términos teóricos son ciertamente eliminables. Sin embargo, este resultado tiene poca trascendencia filosófica si lo que se pretende es prescindir de las entidades teóricas (lo que no era la pretensión de Ramsey). En primer lugar, la versiónRamsey de la teoría requiere lógica de segundo orden, pues algunas constantes descriptivas teóricas serán predicados, con lo que la versión-Rarnsey de enunciados con predicados cuantificará sobre variables predicativas (como en nuestro ejemplo, que cuantifica sobre
298
FUNDAMEATOS DE FILOSOFÍ-~DE LA CIENCIA
una variable de función, un tipo de variable predicativa). Segundo, relacionado con lo anterior, y verdaderamente importante, la versión-Ramsey TR prescinde de, o elimina, los rénninos teóricos, cierto, pero no las e~itidadesteóricas. TR presupone la existencia de entidades teóricas tanto como T, pues las \wiables introducidas en TR deben trner algún valor. En T, las entidades teóricas son los referentes de las constantes descriptivas teóricas, en P son 10s valores de las nuevas variables introducidas. Por tanto, mediante este expediente, al desaparecer los rértnitíos teóricos, nos libramos quizá nominalmente de la formulación del problema semántico acerca de la legitimidad de estos términos bajo sospecha para el empirista, pero no nos libramos en absoluto (ni siquiera nominalmente) de la cuestión ontológica relativa a las entidades teóricas pues la nueva versión sigue apelando a ellas, aunque mediante otro recurso expresivo, las variables. Lewis (1970) utiliza el método de Ramsey para mostrar cómo se puede dar una definición "funcional" de los términos teóricos, esto es, cómo se puede denotar una entidad teórica mediante una expresión que no contenga términos teóricos, a saber, mediante una descripción que describa su función en la teoría; por ejemplo, la masa es la denotación de la descripción "la función xj tal que ...", donde los puntos suspensii~oscontienen la versión-Ramsey de la Mecánica Clásica (y j es un subíndice concreto). Queda claro por tanto que el método de Ramsey no permite eliminar las entidades teóricas sino tan sólo el modo usual de referimos a ellas mediante constantes predicativas (o funcionales).
La alternativa de Ramsey no depende de que los dos grupos de términos sobre los que se realiza la eliminabilidad relativa sean los teóricos y los observacionales en el sentido pretendido, se aplica a cualquier teoría en la que dividamos el vocabulario en dos conjuntos disjuntos. Lo mismo sucede con el segundo expediente de eliminación, debido a Craig y que es consecuencia de un teorema de lógica formal del mismo autor. Craig mostró (cf. 1953 y 1956) que si el vocabulario V de una teoría T se divide en dos conjuntos disjuntos de términos VI y Vz, y la teoría satisface ciertos requisitos formales (no especialmente estrictos), entonces siempre existe otra teoría P que usa términos sólo de un tipo, digamos Vi,y de la cual se derivan los mismos V,-enunciados (e.e. enunciados que involucran sólo términos de V , )que se derivaban de T; T y T; son por tanto Vl-equivalentes. Además TX no contiene, contrariamente a la versión de Ramsey, recursos expresivos nuevos, nuevas variables. Aplicado a la distinción entre los vocabularios teórico y observacional, este resultado implica que las mismas consecuencias observacionales que se derivan de una teoría con términos teóricos, se derivan también de otra teoría que no contiene términos teóricos ni variables que los sustituyan. En este sentido parece que los términos teóricos son eliminables o prescindibles, y ahora no se trata sólo de los ténninos sino también de las entidades teóricas mismas. Pero, como antes, esta vía no es tan prometedora para el eliminativista como a primera vista parece. Aunque ahora parecen ser eliminables las entidades teóricas mismas, ello es sólo "en principio". En primer lugar, la eliminabilidad es sólo a posteriori, esto es,
i
1
1 I
una vez tenemos previamente la teoría original con sus tkrminos teóricos, por lo que la teoría puramente observacional "sustituta" no puede desempeñar ninguna función heurística o metodológica efectiva. Pero además el expediente es tal que la teoría puramente observacional T: consiste siempre en un conjunto infinito de axiomas no simplificable de manera significativa (ni siquiera mediante esquemas axiomáticos). Las consecuencias filosóficas de la eliminabilidad a lo Craig son prácticamente nulas, a lo sumo satisfacer la mala conciencia de las mentes empiristas radicales con una eliminabilidad en principio completamente irrelevante para la práctica científica. Pero si nos contentamos con eso, ni siquiera se precisa de complejos resultados formales, pues es trivial construir una teoría T' puramente observacional y observacionalmente equivalente a otra T que use sólo términos observacionales: simplemente seleccionamos como axiomas para T' todas las (infinitas) consecuencias puramente observacionales de T (dado T = AR, T' = { a/aes consecuencia de AR y contiene sólo términos observacionales).
5. L a distinción teórico1observaciona1 y la naturaleza de labase empírica Hasta aquí hemos procedido como si estuviera clara la naturaleza de los términos, y las entidades, observacionales. Pero eso dista mucho de ser así y en la Concepción Heredada se plantearon, casi desde los inicios, diversos problemas relativos a la naturaleza dz estos términos. Comentaremos aquí muy brevemente tres que están íntimamente conectados, dos de los cuales hemos mencionado anteriormente: a ) el problema ontológico de la naturaleza de las entidades teóricas, la fundamentación a partir de ella de la distinción teórico/observaciona1 y el carácter rígido o fluido de tal distinción; b) el problema semántico de la supuesta neutralidad teórica de los términos observacionales; c) el problema metodológico de la supuesta naturaleza observacional de la base empírica de contrastación, no sólo del conjunto de nuestro conocimiento, sino para cada teoría científica particular. Estas cuestiones motivaron multitud de debates, han sido tratadas por casi todos los filósofos de la ciencia y en relación con ellas surgieron algunas de las posiciones que dieron lugar a concepciones alternativas a la Concepción Heredada. En el primer parágrafo nos limitaremos a los aspectos más generales, y en los dos siguientes desarrollaremos algunos problemas específicos.
5.1. ENTIDADES OBSERVABLES Y DISTINCIÓNTEÓRICO/OBSERVACIONXL
Para muchos empiristas y positivistas lógicos del período de entreguerras, y especialmente para aquellos en tomo a los cuales se gestan las primeras versiones de la concepción estándar, la fundamentación del conocimiento en la experiencia se entendía en términos fenomenalistas: los primeros datos sobre los que se construye todo conocimiento, que justifican nuestras creencias, son datos de la experiencia fenoménica. Esta posición extrema plantea múltiples dificultades en las que no podemos detenemos aquí, y el fenomenalismo termina por ser abandonado, al menos como base de experiencia para las
300
FUNDAhfEhTlS DE RLOSOFL~ DE LA CIENCIA
teorías científicas. Las entidades fenoménicas (qualia,datos sensoriales) son entonces sustituidas por entidades que se caracterizan simplemente como "directamente presentes a la obsenración". Sin embargo, esta nueva versión, que se convertirá en estándar, tiene sus propios problemas, el principal de ellos su vaguedad. Las entidades fenoménicas son claramente distinguibles de las no fenoménicas, pero por su "privacidad" o subjetividad son poco plausibles coino constituyentes de la base de experiencia para la ciencia. Las entidades observables, públicas, parecen en primera instancia poder desempeñar más plausiblemente tal función, pero ahora el problema es la dificultad para distinguir nítidamente entre entidades obsenrablesy no obsenpables (teóricas). Inicialmente, Carnap intentó una caracterización precisa de los términos observacionales como aquellas expresiones del lenguaje tales que, en condiciones normales, un obsenlador puede determinar a través de una serie de observaciones, y con un alto grado de confirmación, si el término se aplica o no en una situación dada (cf. Carnap, 19361937). Esta caracterización es inadecuada, pues, sin más precisiones, se aplica también a predicados pretendidamente no obsen~acionales.En escritos posteriores, Camap se lin-iitó a caracterizar el vocabulario obsenracional como aquel que se refiere a eitridades obserisables (cf. 1956, $11): los términos obsen~acionalesson predicados que denotan propiedades observables de acontecimientos o cosas, o relaciones observables entre ellos. Pero es claro que si no se especifica lo que caracteriza las elztidades observables, simplemente se desplaza el problema. Hempel presentó las cosas de modo parecido al hablar de entidades o fenómenos "que podemos observar directamente" (1958, $11). La cuestión es: ¿qué cuenta como observación directa? Aunque no se da una respuesta a esta cuestión, parece que en este primer momento se sigue pretendiendo que la distinción que hoy tras ella es relativamente rígida y no dependiente del contexto. Después de una serie de críticas, especialmente de Putnam (cf. 1962, y también Hanson, 1958), el primer exponente de la doctrina oficial en reconocer el carácter fluido de la distinción fue Nagel, quien en su monografía de 1961 afirma: "es dudoso que haya un sentido riguroso que pueda ser asignado con utilidad a la palabra 'observable'; y en la medida en que la distinción [entre leyes empíricas y axiomas teóricos] se base en el contraste entre lo que es obsenrable y lo que no, la distinción patentemente no es nítida" (cap. 5, $1). Carnap, en su monografía de 1966, acabó también aceptando explícitamente que la distinción es gradual. Por ejemplo, si la percepción visual directa cuenta como obsenlación, ¿qué ocurre con la asistida de lentes?, de prismáticos o catalejos?, ¿y de telescopio óptico?, de telescopio de radio? 0, para ir en la dirección contraria, ¿cuenta como observación la realizada con lupa?, i y con microscopio óptico?, ¿y con microscopio electrónico? ¿Observa directamente el físico la trayectoria de una partícula cuando ve el rastro en una cámara de niebla?; jse observa la comente eléctrica al ver moverse la aguja de un amperímetro? Presuntas como éstas son las que le hacen concluir que "hay un continuo que comienza con obsenlaciones sensoriales directas y pasa a métodos de observación enormemente complejos e indirectos, [...] el físico habla de observables en un sentido muy amplio, comparado con el estricto sentido que da el filósofo a la palabra, pero en ambos casos la línea de separación entre lo observable y lo inobservable zs muy arbitraria" (cap. XXIII).
A pesar de la fluidez o vaguedad de la distinción, tanto Nagel como Camap insisten en su utilidad para la caracterización de la naturaleza y estructura de las teorías. Así, por ejemplo, Camap insiste en que las leyes empíricas son las que contienen términos que refieren a entidades "directamente observables por los sentidos o medibles mediante técnicas relativamente simples" (ibid.).Pero sorprendentemente menciona ahora como ejemplos, además de regularidades cualitativas simples (como la típica "todos los cuervos son negros") también leyes cuantitativas (como las de los gases, que relacionan presión, volumen y temperatura para los gases. o la ley de Ohm, que relaciona potencial, resistencia e intensidad de corriente) que involucran términos que había considerado tradicionalmente teóricos (como 'temperatura' o 'intensidad de corriente eléctrica'). El cambio se debe sin duda a la aceptación de la fluidez de la distinción. La cuestión que surge ahora es si en estos nuevos términos la distinción teórico/observacional puede desempeñar la función para la que fue originalmente introducida. Numerosos críticos, como Putnam (1962), Shapere (196.5). Maxwell (1961), Achinstein (1965) o el propio Hempel posteriormente (1973), argumentaron en contra de ello. Veamos algunas de las principales dificultades.
5.2.
NEUTRALID.AD TEÓRICADE LOS T E R ~ ~ I S OOBSERVACION.4LES S Y CARGA TEÓRICADE LOS HECHOS
El principal motivo de la introducción de la distinción teórico/observaciona1 era proporcionar legitimidad semántica, según los criterios empiristas, a los términos "sin conexión empírica inmediata" que las teorías científicas introducen a través de sus leyes para dar cuenta de los fenómenos. Esta finalidad semántica va acompañada de otra metodológica, pues se pretende que la base observacional es la que proporciona la experiencia "neutra" con la cual contrastar las afirmaciones de la teoría. Esta neutralidad teórica de la base de contrastación parece en primera instancia fundamental, pues de lo contrario parecería que la teoría resulta autojustificativa. Si la experiencia observacional que se usa para contrastar la validez de una teoría fuese dependiente de la teoría en cuestión, esto es, si la elaboración de los informes observacionales que sirven de base de contrastación presupusiera la validez de la teoría, entonces tendríamos un círculo autojustificativo. Por tanto, la base observacional, si ha de servir para la contrastación, debe ser teóricamente neutral. Esta cuestión está íntimamente ligada a la anterior, pues la distincizn T/O parcce problemática en la medida que lo que consideramos usualmente observaciones requieran adiestramiento o conceptualización teórica. Ya antes de la formulación explícita de la Concepción Heredada, Duhem (1914) objetó a lo que iba a ser este elemento de la misma. Duhem rechazó que la observación esté libre de conceptualización teórica, aunque usualmente sí lo está respecto de algunas teorías, esto es, puede ser que las observaciones no presupongan una teoría que usa de ellas en su contrastación. Debe recordarse que orisinalmente la observabilidad no se pretende relativizada a una teoría, los estados de cosas son observables o no sin más, y los que supuestamente lo son se usan para contrastar unas teorías u otras. Lo que constató Duhem es que toda observación, o mejor dicho todo informe observacional, supone una
interpretación de los datos de los sentidos, y una interpretación no es más que una conceptualización teórica, sea explícita o implícita. Quizá el aparato conceptual i n t e ~ r e t a d o que r genera la base obsenfacional no corresponde a cierta teoría que usa djchz base en la contrastación, pero en cualquier caso corresponderá a otro "constructo teórico"; este constructo presupondrá a su vez otro en la descripción de sus propios fenómenos empíricos y así sucesivamente. No hay (en general) una autojustificación inmediata de cada teoría. pero sí un círculo global autojustificativo en el conjunto de la ciencia. Duhem ejemplifica esta tesis con múltiples casos históricos y con referencias a la práctica experimental usual en laboratorios (cf. p.ej. su ejemplo de la oscilación de una barra de hierro en cierto mecanismo y la medición de la resistencia, 1914 p. 218). Ésta es la base del conocido holis~node Duhem, de gran influencia en el siglo xx, y sobre,el qhe vblveremos brevemente más adelante (cap. 11). En el Círculo de Viena fue Neurath quien más radicalmente se distanció de la tesis oficial inicial de la neutralidad de los "informes protocolares de experiencia" y a él, y a Duhem, apelará después Quine como inspiradores de sus propias tesis holistas. Pero en el campo específico de la filosofía de la ciencia, en el contexto neopositivista de entreguerras, fue Popper quien primero expresó de forma explícita el componente teórico de la base empírica de contrastación, lo que después se denominará carga teórica de los heclms. Popper es uno de los mayores críticos de las tesis centrales del Círculo de Viena (al que, como insiste en declarar, no pertenecía), pero comparte en general la caracterización de las teorías como cálculos interpretados. El principal punto de desacuerdo tiene que ver con la epistemología de la contrastación; como veremos en detalle en el capítulo 12, frente al confirmacionismo y la lógica inductiva de Carnap, de los que Popper fue el primer y más severo crítico, él defiende una lógica de la falsación. Pero otro de los puntos de disensión tiene que ver con nuestra actual cuestión. Aunque no sacara todas las consecuencias (consecuencias que acaban cuestionando sus tesis falsacionistas más radicales, cf. cap. 12, $4 y §5), declaró abiertamente que en la determinación de la base de contrastación, de "los hechos", interviene un conocimiento de fondo necesitado de aceptación previa. Al someter a prueba una teoría, señala, no sólo intervienen en ella las condiciones iniciales y los supuestos auxiliares (según el esquema comúnmente admitido) sino también cierto conoci~nientode fondo sobre los hechos singulares. Este conocimiento de fondo, que "contiene" lo que se acepta como hechos, se puede considerar constituido por teorías de bajo nivel que se aceptan como altamente corroboradas y que no entran en el juego de la contrastación. Y no entran en el juego por decisión (no necesariamente consciente): "Siempre que una teoría se somete a contrastación [...] hay que detenerse en algún enunciado básico que decidimos aceptar: si no llegamos a decisión alguna a este respecto, [...] la contrastación no lleva a ninguna parteW(1935-58,$29). Esta idea pone de manifiesto lo que se denomina, siguiendo a Hanson, la carga teól-ica de los Izecl~os.Hanson fue el primero en hacer de este fenómeno algo esencial para el anáIisis de la ciencia y en defender la opinión de que ello modifica dramáticamente la visión tradicional de la misma. Apoyándose en los casos de ambigüedad perceptiva estudiados por la psicología de la Gestalt, destacó la importancia del contexto y los elementos organizativos ya en la percepción. Ilustró esta tesis con el siguiente ejemplo (cf. 1958, cap. 1).
-
Al contemplar las figuras 1 y 3, se ven en los extremos inferiores derechos dos animales diferentes a pesar de que son "la misma cosa" (figura 2); además, cuando contemplamos el dibujo aislado podemos ver una cosa u otra, pero no las dos a la vez. En parte se ve lo mismo (hay una excitación similar del córtex) y en parte no, y el sentido interesante de 'ver' relevante para la ciencia es el segundo. No se trata de interpretaciones diferentes a partir de una misma visión; eso, afirma, no tiene sentido, pues "interpretar", si se quiere llamar así, es parte constitutiva de "ver". Además, el contexto puede no darse explícitamente, no es esencial al hecho que el ejemplo pretende mostrar que en él el contexto esté manifiesto; piénsese, afirma Hanson, en lo que ven un físico y un profano ante los rastros de una cámara de niebla. Este fenómeno, que salvo radicales diferencias culturales tiene en la vida cotidiana escasa trascendencia, es determinante en la ciencia, donde la dependencia del contexto es altamente teórica y. en momentos de cambio conceptual en los que se contraponen diferentes contextos de fondo, deviene crucial. Cuando Tycho y Kepler ven el Sol al amanecer, dice Hanson, en parte ven lo mismo y en parte no: Tycho ve un astro móvil, Kepler uno estático, "y es el sentido en que no ven la misma cosa el que debe tomarse en cuenta para entender los desacuerdos que existen dentro de la física" (ibid.B). Consideraciones parecidas a éstas se encuentran en otros autores. Toulmin afirma que los fenómenos no sólo son seleccionados por la actividad teórica sino que incluso están definidos por la misma: hay una "continua interacción entre teoría y hecho L.. ], las teorías se construyen sobre la base de hechos, a la vez que les dan significación y aun determinan lo que son "hechos" para nosotros" (1 961, p. 95). Feyerabend, defendiendo su pluralismo metodológico (cf. 1964, 1965, 1981). sostiene que la descripción de los hechos depende siempre de una teoría (aunque en general no de la que se contrasta) y que hay hechos que sólo pueden salir a la luz con ayuda de teorías alternativas incompatibles. Rechaza por tanto la tesis de que "los hechos existen y están disponibles independientemente de la consideración de alternativas a la teoría que se contrasta" (1981, $5) La consecuencia de ello es lo que él caracteriza como la inversión de la relación tradicional entre teoría y observación. El significado de las oraciones de observación e s t j determinado por las teorías con las que están relacionadas, no son significativas a menos que se hayan relacionado con las teorías: "la interpretación de un lenguaje de observación está determinada por las teorías que usamos para explicar lo que observamos, y cambia tan pronto como estas teorías cambian" (1981, $6). En su monografía de 1975 ilustró esta tesis con innumerables ejemplos extraídos de la historia de la ciencia que, en su opinión, la confirman; muestra, por ejemplo (cap. lo), cómo, en la controversia entre Galileo y los aristotélicos sobre las consecuencias de la observación telescópica de diverscs fenómenos
astronómicos, el primero se apoyaba, entre otros supuestos que los aristotélicos tenían buenas razones para rechazar, en una teoría óptica inaceptable. Kuhn, c o r o veremos, sostuvo por su parte que las teorías contienen elementos que determinan el contenido de la experiencia y que defensores de teorías diferentes viven en mundos experienciales diferentes. También Lakatos apuntaba en la misma dirección cuando, siguiendo a su maestro Popper, afirmaba que en la contrastación no comparamos la teoría con hechos neutros sino con otras teorías más básicas presupuestas por los hechos. El fenómeno de la carga teórica de 10s hechos, y el ofrecer una imagen de las teorías y de la actividad científica adecuada a este fenómeno y a los casos históricos del mismo, es una de las principales motivaciones de las nuevas concepciones que surgen en tomo a estos ~zuevosfilósofosde la ciencia (así denominados, en su día, por contraposición a la Concepción Heredada). Nosotros dejamos provisionalmente la cuestión aquí sólo apuntada y volveremos sobre ella en los dos próximos capítulos. Es esencial darse cuenta de que toda esta discusión presupone una identificación casi siempre aceptada implícitamente. Se comienza cuestionando la neutralidad teórica de los informes observacionales y se concluye que los datos, fenómenos o hechos que constituyen la base de experiencia en la contrastación están teóricamente cargados. Ello supone la identificación entre a) Nlformes de experiencia o datos de contrastaciórz y b ) irtforrnes obse~vacionales.Parte de las críticas expuestas se deben entender como cuestionando esta identificación. Para concluir nos detendremos brevemente en este aspecto de fa cuestión.
Las teorías empíricas se generan a partir de una serie de fenómenos de los que, tras la elaboración teórica, se pretende dar cuenta; esos mismos fenómenos, u otros nuevos del mismo tipo, constituyen el ámbito de experiencia sobre el que la teoría hace predicciones y se somete a contrastación. Llamemos a esos datos, fenómenos o hechos que constituyen el ámbito de experiencia y contrastación de una teoría, la base e~npíricao base de contrasración de la teoría en cuestión. Hemos visto que en la versión oficial de la Concepción Heredada se entiende la base empírica en términos obsen~acionales. Por otro lado, aceptemos, como demuestran múltiples estudios tanto empíricos como teóricos, que la observación "directa" incluye conceptualización. A pesar de ello, cabe suponer que algunos aspectos de esa conceptualización, los cognitivamente más básicos, serán generales, comunes a todo sistema cognitivo (o al menos, en su dimensión biológica-evolutiva, comunes a todos los seres humanos). Si eso es así, del hecho de que la observación presuponga cierta conceptualización no se sigue que dicha conceptualización dependa siempre esencialmente de las teorías científicas. Por tanto, si la base de contrastación &ese observacional, ello no implicaría que lo que cuenta como base empírica depende esencialmente de las teorías cienrljTcas. En realidad, pues, lo que hay implícitamente detrás de las co~sjderaciones.críticas sobre la carga teórica (cientrjTcainerzte teórica) de todo dato de contrastación es una puesta en cuestión del squesto de la ConcepCión Heredada de que la base de contrastación es en general de naturaleza observacional. Tras muchas de las críticas a
f!
ii 1 :
la supuesta neutralidad de las observaciones, lo que hay en realidad es un rechazo a la identificación entre base empírica de contrastación y experiencia directamente observable. El principal motivo para identificar la base empírica con la experiencia observable directa es el viejo anhelo empirista de fundamentar y justificar todo nuestro conocimiento e n la expenencia sensorial. Todo conocimiento (empírico) empieza con las afecciones de nuesrro entorno sobre nuestro aparato sensorial y toda justificación del mismo debe apelar en última instancia a esa "observación directa" del entorno. Pero, como dijimos más arriba (seccibn 3), de este supuesto razonable no se sigue que la justificación de cada pieza de nuestro conocimiento deba proceder del mismo modo, que esta tesis global sea también válida localmente. Puede ocumr que, como organismos vivos, la interacción más básica con nuestro entorno la realicemos en términos globales perceptualmente mediante observación directa, pero que en algunas partes de nuestro sistema cognitivo. especiaImente en las muy complejas que dan lugar a las teorías científicas (muy escasas 4 raras en términos evolutivos globales), la base de experiencia no se dé a través de observación directa inmediata. Puede que todo empiece por la observación pero, si el sistema cognitivo es modular y jerárquico, no en todas partes. Si eso es así, la base de contrastación de muchas, o (casi) todas, las teorías científicas puede estar constituida por datos o fenómenos que no sean de observación directa; y por tanto, alternativamente, lo distintivo de los términos teóricos no será que denotan entidades inobservabIes. Ya en 1962, Putnam se opuso a identificar la distinción "inobservable/observable" con "teórico/no teórico". Afirmaba, por un lado, que hay teorías cuyo aparato teórico se refiere a entidades observables, y, por otro, que casi nunca los fenómenos a explicar son accesibles mediante observación directa. Se trata de dos dicotomías diferentes. Un término teórico es un término que proviene de una teoría científica y "el problema apenas tocado en treinta años que se lleva escribiendo acerca de 'términos teóricos' es qué es lo realmente distintivo de dichos términos" (1962, $1). Poco antes, Ryle había distinguido entre expresiones de una teoría que están cargadas con el peso de esa teoría particular y expresiones que no lo están; así, p.ej., "los términos técnicos de la genética están impregnados de teoría, l...] no sólo con equipaje teórico de alguna clase, sino con el de la teoría genética" (1956, p. 90). Estas consideraciones apuntan a la idea de que un término es teórico o no en relación con una teoría en función de si depende O no, de un modo que hay que especificar, de la teoría en cuestión. Achinstein (1968, cap. 6) hace explícita esta caracterización y discute varios sentidos en que un término puede depender de una teoría. Como veremos en el próximo capítulo, durante los años sesenta, Kuhn y Lakatos hicieron también consideraciones que apuntan en la misma dirección. El primero en dar una caracterización mínimamente articulada y elaborada de la nueva distinción que se está gestando fue Hernpel en una sene de trabajos de finales de los años sesenta y principios de 10s setenta (1966, cap. 6, 1970, 1973). En estos trabajos, Hempel divide ahora el vocabulario básico de cada teoría en dos clases que se pretenden nítidamente separadas y relativjzadas a una teoría específica. Una clase está formada por los términos con los que se describen los fenómenos a explicar, la base empírica. Estos términos constituyen el vocabu!ario preteórico o, como también dice, "previamente disponible". Estos términos preteóricos no corresponden en general a situaciones observables
306
FUXD.;\SíE\TOS DE F I L O S O F ~DE . ~ L.4 CIENCIA
en sentido estricto, sino que a menudo se introducen en la ciencia en el contexto de una teoría anterior. Los otros términos descriptivos usados en la teoría son los que ella introduce para llevar a cabo la elaboración teórica que da cuenta de los fenómenos preteóricamente descritos; ellos constituyen el vocabulario teórico de dicha teoría. Es imponante enfatizar dos puntos de esta nueva distinción: a ) es una distinción relativizada a las teorías, un término no es teórico o preteónco sin más, sino respecto de una teoría especifica, y por tanto un término puede ser preteórico en una teoría y teórico en otra; aunque no lo afirma explícitamente, de su caracterización informal parece seguirse que un término puede ser preteórico en varias teorías, aunque normalmente será teórico sólo en una; b ) el criterio para la distinción es el uso o no del término en la descripción de los fenómenos empíricos a explicar; por tanto, la distinción será precisa en la medida en que se dé un criterio preciso para determinar qué enunciados son los que describen los fenómenos a explicar, pero Hempel no lo da. Junto con esta nueva caracterización del vocabulario básico de una teoría, Hempel introduce otra para los enunciados. Además de enunciados puramente empíricos, la teoría contiene: (i) principios inren7os, que son los que especifican "el escenario teórico", los que sistematizan el nuevo aparato conceptual introducido por la teoría; (ii) principiospuente, que indican la forma en que "se relaciona lo que ocurre a nivel del escenario teórico con los fenómenos que la teoría debe explicar" (1973, $1). Esta clasificación de los enunciados parece una nueva versión de la anterior, axiomas teóricos y reglas de correspondencia, pero no es así. Aunque hay enunciados cuyos únicos términos descriptivos son preteóricos (a saber, los informes empíricos particulares y sus generalizaciones), no hay ahora enunciados que contengan sólo términos teóricos; tanto los principios internos como los principios-puente contienen esencialmente tanto términos teóricos coino preteóricos. En cuanto a la presunta función de los enunciados en la fijación del significado de los términos, Hempel sostiene ahora que el significado de los términos teóricos no está totalmente detelminado por los principios internos más los principios-puente. Ambos tipos de enunciados ofrecen al aprendiz de la teoría el acceso principal a la compresión de las expresiones, pero no determinan completamente su significado. La idea clásica de que el significado de los términos se fija completamente ~nediallteelzunciados que los conectan con otros términos es errónea; y, como ya había sugerido Putnam (1962), el problema del significado de los términos teóricos planteado en ese esquema no existe, es un pseudoproblema. El motivo es que los términos científicos adquieren su significado por vías diversas, quizá en algunos casos (parcialmente) mediante enunciados, pero usualmente de otros modos; especialmente, como los términos del lenguaje ordinario, vinculándolos a aplicaciones específicas, "mediante instancias de uso en contextos particulares" (Hempel, 1973, $7, donde menciona además a Kuhn como referencia explícita para estas ideas; cf. también al respecto las teorías causales de la referencia, p.ej. Putnam, 1975). Por último, Hernpel considera ahora que la pretensión de la Concepción Heredada de caracterizar una teoría empírica a través de su reconstrucción axiomática es inadecuada, pues siempre hay varias axiomatizaciones posibles, ninguna de las cuales expresa mejor que las otras la naturaleza de la teoría; una teoría no se puede identificar pues con un sistema espec$co de enunciados dotados de cierta estructura o sistematización.
Todas estas innovaciones del último Hempel son importantes y apuntan a elementos esenciales en la caracterización de las teorías que se desarrollarán en otras concepciones, pero en esta particular versión son sumamente insatisfactorios. Sus principales contribuciones son: a) la relativización de la distinción teóricolpreteórico a las teorías y b) la caracterización de la base empírica en términos preteóricos, con lo cual los datos se consideran cargados de teoria pero no de la misma teoría para la que constituyen su base empírica. Las principales dificultades radican en: (i) la imposibilidad de distinguir entre principios internos y principios-puente, y (ii) la inexistencia de un criterio preciso para poner en obra la distinción entre términos teóricos y preteóricos. I
a (
6. Consideraciones finaIes En este capítulo hemos examinado los primeros análisis que, en el contexto de la llamada Concepción Heredada, se dieron de la naturaleza y estructura sincrónica de las teorías empíricas. La idea básica que inspira este análisis es que una teoría empírica es un conjunto de afirmaciones que a ) son susceptibles de ser estructuradas mediante relaciones de dependencia lógica y b) versan sobre la realidad física, algunas directamente y otras indirectamente a través de las primeras. El núcleo de este análisis lo constituye la noción de cálculo axiomático empíricamente interprerodo. La articulación de esta noción supone la distinción entre vocabulario teórico y observacionai, y entre afirmaciones puramente teóricas (axiomas del cálculo abstracto). afirmaciones puramente observacionales (enunciados fácticos particulares y generalizaciones empíricas) y afirmaciones "mixtas" (reglas de correspondencia). La intuición que hay tras la idea básica es esencialmente correcta, pero el modo específico en que la Concepción Heredada la desarrolla presenta diversas dificultades. Estas dificultades son básicamente de tres tipos. De ellas, sólo la última ha recibido atención en las secciones anteriores, pues sólo ella fue tematizada por los representantes de esta concepción, las otras serán examinadas en detalle en los dos próximos capítulos. 1. La primera dificultad tiene que ver con la excesiva "rigidez" del uso que se hace de la noción de cálculo axiomático. Tal como se presenta aquí, todos los axiomas (y reglas) de una teoría están al mismo nivel, no hay unos más esenciales, básicos, y otros menos, complementarios. Nótese que estamos hablando sólo de los axiomas, no se piense por tanto que la distinción entre axiomas y teoremas tiene que ver con ésta que ahora estamos apuntando. Por lo que a los axiomas se refiere, si todos están al mismo nivel, si todos son igualmente esenciales, entonces es difícil que esta noción tan rígida, "monolítica", de teoría sincrónica permita una elucidación adecuada de las teorías en sentido diacrónico. Si todo está al mismo nivel, si no se distingue entre afirmaciones esenciales y otras sólo complementarias ("no esenciales"), entonces el más mínimo cambio implica un cambio de toda la teoría, la sustitución de una teoría por otra teoría diferente. Esto es intuitivamente insatisfactorio. Una de las principales contribuciones de los nuevos filósofos de la ciencia que estudiaremos en el próximo capítulo consistz
precisamente en llamar la atención sobre esta inridecuación y proponer un concepto de teoría mucho más rico y dúctil. 2, La segunda dificultad tiene que ver con la noción misma de sistema axiomático. Tal como se presenta la identidad de una teoría, ésta parece depender de los axiomas que se elijan en su axiomatización, lo cual es inruitivamente insatisfactorio. Parece que una teoría puede decir "lo mismo" mediante recursos expresivos diferentes. Esto no lo niegan los representantes de la Concepción Heredada pero, simplemente, la articulación "enunciativista" que hacen de la idea básica no les permite recoger plenamente las intuiciones. Como veremos en el capítulo 10, para ello es necesario hacer jugar un papel más central en la caracterización de las teorías a la noción de modelo que presentamos en la sección 2. Ésta será la principal contribución de las concepciones semanticistas que estudiaremos en ese capítulo. 3. Por último, en la discusión sobre la naturaleza de la base de contrastación, su supuesta carga teórica y su eventual naturaleza observacional, se deben distinguir dos niveles, el local y el global. Por lo que se refiere al supuesto carácter observable de la base de contrastación, una cosa es a) que las teorías científicas, globalmente consideradas como partes del sistema total de nuestro conocimiento, descansen en última instancia, por lo que a su justificación se refiere, en los modos más básicos de experiencia "observable" ("observabilismo" global), y otra b) que cada teoría científica sea tal que los enunciados que expresan los hechos con los que se contrasta involucren sólo expresiones que se refieren a situaciones observacionales básicas ("obsen~abilismo" local). Lo primero es seguramente cierto, lo segundo es, a la luz de las teorías reconstruidas, muy poco plausible. En cuanto a la carga teórica de la base de contrastación, una cosa es c) que la determinación de los datos de contrastación presuponga "directamente" la teoría que se quiere contrastar mediante dichos datos (autojustificacionismo local), y otra 4 que tal determinación presuponga otra u otras teorías vinculadas a nivel global de una disciplina, o incluso la ciencia entera, con la teoría original (holismo de contrastación). Lo primero es claramente inaceptable, lo segundo merece un juicio filosófico más detenido. Sobre estas cuestiones volveremos en los próximos capítulos.
ANÁLISIS SINCRÓNICODE TEORÍAS 11. LAS CONCEPCIONES HISTORICISTAS: LAS TEOR~ASCOMO PROYECTOS DE INVESTIGACI~N
l . L a revztelta Itistoricista y la naturaleza sincrónica de las teorías Durante los años sesenta, y en parte como consecuencia de los debates sobre algunas de las cuestiones que hemos expuesto en el capítulo anterior, se gestan y desarrollan concepciones alternativas a la Concepción Heredada que cuestionan sus supuestos fundamentales. De ellas, la que más pronto cristaliza como alternativa es la que entonces se denominó niteva filosofía de la ciertcin, vinculada a autores como Hanson, Toulmin, Kuhn, Feyerabend y Lakatos, y mucho más tarde y sin pertenecer oficialmente al grupo, pero con orientaciones parecidas, Laudan. Una de las características de estcs pensadores es su mayor preocupación por, y su mejor conocimiento de, la historia de la ciencia (el más representativo e influyente de ellos, T. Kuhn, se había dado a conocer años antes como un extraordinario y renovador historiador de la ciencia). En su opinión, la atención a la ciencia real que la historia nos presenta obliga a modificar la práctica totalidad de la imagen de la misma que se ofrece en la Concepción Heredada. Esta rev~ieltahistoricista propicia una revisión drástica en prácticamente todos los ámbitos metacientíficos. Aunque, como siempre, también en esta concepción las tesis centrales en los diversos ámbitos están extremadamente interrelacionadas, vamos a ocupamos aquí, en la medida d e lo posible, exclusivamente de las tesis relativas a la naturaleza y estructura de las teorías científicas en su dimensión estática o sincrónica (en el capítulo 13 nos detendremos en los aspectos diacrónicos). Conviene advertir que, contrariamente a la Concepción Heredada, ésta no es una cuestión que reconozcan como central los nuevos filósofos, ni siquiera hacen de ella un tema de estudio explícitamente declarado (salvo quizá Kuhn en una segunda etapa). En la medida en que se ocupan de las teorías o constructos teóricos, lo hacen siempre, consecuentemente con su orientación general historicista, desde una perspectiva diacrónica, centrándose en los aspectos dinámicos de las teorías como entidades que se extienden en el tiempo, esto es, que nacen, se desarrollan y "mueren" (se desalojan mutuamente). Sin embarso, debe quedar claro que, independientemente de que se reconozca o no explícitamente, el estudio diacrónico presupone una concepción de la naturaleza
310
FUND.A~IE\TOSDE FILOSOFLADE L.4 CIESCIA
sincrónica de las teorías. Cualquier análisis de la dimensión diacrónica de las teorías científicas debe partir de que las teorías diacrónicamenre consideradas, en tanto que entidades que perduran en el cambio a través del tiempo, consisten en dzterminadas secuencias de "teorias en sentido sincrónico". La "historia" de una teoría consiste en la sucesión de las diversas "etapas" o versiones por las que pasa. Estas etapas, en tanto que imágenes "congeladas" de la teoría en cierto momento, se deben considerar aproximadamente estables o "estáticas". La cinemática de la teoría, su "historia7', consiste en la sucesión de sus diversas versiones estáticas, en la sucesión de "etapas" por las que la teoría pasa. Esta intuición básica, en la que descansa cualquier análisis de la estructura diacrónica de la ciencia, implica entonces que los análisis diacrónicos presuponen alguna noción de la estructura sincrónica de las teorías, de las etapas cuya sucesión constituye la teoríaen-el-tiempo. El análisis y discusión de la evolución de los constructos teóricos contiene pues, cuando menos implícitamente, cierta preconcepción de la naturaleza de los diversos estadios por los que atraviesa ese constructo teórico, de sus elementos constituyentes y su estructuración. Esta preconcepción de la naturaleza sincrónica de las teorías que subyace a los estudios diacrónicos puede estar mejor o peor articulada y en algunos de estos autores está, aunque no siempre explícita, altamente estructurada y elaborada. Éste es el caso particularmente de Kuhn y también, aunque en menor medida, de Lakatos (su temprana muerte le impidió concluir la reelaboración de sus ideas que estaba preparando). Revisaremos aquí las contribuciones de estos dos autores, con especial detenimiento en Kuhn, y concluiremos comentando brevemente las de Laudan quien, aunque posterior, desarrolla una posición parcialmente parecida en abierta polémica con los anteriores. Como veremos al final, estos autores realizaron contribuciones fundamentales a la caracterización sincrónica de las teorías. Ahora bien, en su opinión, esos nuevos elementos que señalan, al estar esencialmente vinculados a la actividad científica como actividad práctica con componentes históricos y sociales inelirninables, son inaccesibles al análisis formal. Todo el proyecto original de desarrollar una lógica de la ciencia, incluida en ella la reconstrucción formal de las teorías, está según ellos abocado al fracaso. Uno de los mayores retos de la filosofía de la ciencia posterior será dar cuenta en términos formales, o semiformales, de las principales contribuciones de estos autores. En general, estos nuevos elementos van a conformar una noción de teoría mucho más dúctiI que la extremadamente rígida de la Concepción Heredada. Ahora, el análisis de las teorías ha de ser tal que éstas resulten entidades susceptibles de evolución, que puedan sufrir modificaciones extendiéndose en el'tlempo sin perder su identidad. Para ello es imprescindible que sus estadios, las teorías en su dimensión estática o sincrónica, sean dúctiles, tengan partes más accidentales que puedan cambiar manteniendo su identidad, esto es, preservando sus coniponentes más esenciales. h7eamoscómo se concreta esta idea básica en las nociones de paradigma o matriz disciplilzar, de Kuhn, de programa de i~zvestigación,de Lakatos, y de tradición de ir7vesrigació~~, de Laudan.
2. Los paradigrnas-matrices disciplinares de Kuhn En 1962, Kuhn presenta en La Estrrrct~trade las Revolrlciones Cientificas una visión de la ciencia, de los constmctos teóricos, de las comunidades científicas y de su actividad, radicalmente novedosa y contraria a la dominante hasta entonces. Se ha señalado que esa nueva perspectiva tiene muchos puntos en común con la que esbozara el científico y filósofo polaco L. Fleck treinta años antes (cf. Fleck, 1935). El propio Kuhn reconoce en la introducción a su obra no sólo la semejanza, sino la influencia de las ideas de Fleck:Pero, reconocidos sus méritos corno precursor adelantado, es indudable que por la articulación y desarrollo de las tesis, por la elaboración y precisión posterior de las mismas y, sobre todo, por la enorme influencia que ejercieron, corresponde sin duda a Kuhn el mayor protagonismo en el surgimiento de esta nueva concepción. En esta obra se tratan prácticamente todos los temas fundamentales de la filosofía de la ciencia y todos elIos bajo una perspectiva nueva. Nos ceñiremos aquí a los relativos a la estructura de los constnictos teóricos o, como Kuhn los denomina inicialmente, paradigmas.
2.1. CIENCIA NORMAL Y CIENCM REVOLUCIOS.ARIA
En las ciencias maduras, Kuhn distingue dos modos de "hacer ciencia" que además, en su opinión, se suceden históricamente. Al primero lo llama norr~ialpues es el modo usual en que opera la ciencia. la manera en que ésta se desarrolla la mayor parte del tiempo. Al segundo lo denomina, por oposición, no-rzor-mal o e,rtraordinario y, a veces, revolucionario. Es importante insistir en que éste es el modo en que, según Kuhn, procede la ciencia madura, pues el panorama que vamos a trazar no se aplica a los períodos de formación o asentamiento de una disciplina. Los períodos de ciencia normal se caracterizan por el hecho de que la comunidad de científicos que trabaja en un determinado ámbito comparten ciertos presupuestos de muy diverso tipo (tejricos, experimentales. metodológicos y otros) que son los que les permiten ir haciendo ciencia. Estos elementos compartidos se encuentran, implícitamente unos, explícitamente otros, en los canales usuales de enseñanza y transmisión de una disciplina (principalmente los libros de texto) y el futuro científico los adquiere por regla general en su período de aprendizaje. En ciencia normal la tarea casi exclusiva consiste en lo que Kuhn llama trabajo de resollrción de enigmas o rorrrpecabezas. Esta tarea consiste, grosso modo, en ir ampliando y perfeccionando la aplicación del aparato teórico-conceptual a la experiencia, y a la vez y como consecuencia de ello, en ir ajustando y puliendo la base teórico-conceptual. Algunas de 1 arcas típicas de la investigación normal son la precisión de constantes ya conocidas, la determinación de otras nuevas, encontrar formas específicas de leyes generales y aplicar las ya disponibles a nuevos fenómenos. Para llevar a cabo este trabajo es esencial que el científico no cuestione los supuestos compartidos, pues son precisamente ellos los que guían su investigación y le permiten abrigar esperanzas de éxito. La ciencia normal no discute sobre fundamentos ni "tiende hacia novedades fácticas o teóricas y, cuando tiene éxito, no descubre ninguna" (1962- 1970, p. 43). Z
Ahora bien, la ciencia normal es sólo rcjt modo en que se desarrolla la empresa científica. La cjencia (madura) no discurre siempre de este modo. Un tipo importante de enigmas tiene que ver con la presencia de monwlías, experiencias que "no erioajan" en el aparato teórico. Aunque a menudo se resuelven con éxito, a veces a l ~ u n a sanomalías (o, más raramente, algún otro tipo de enigma) se muestran recalcitrantes. Si ello ocurre con varias, o con alguna considerada especialmente importante, puede ocurrir que, tras cierto tiempo, algunos miembros de la comunidad desesperen de encontrar una solución, o que, aunque la encuentren, consideren excesivas las modificaciones r?onnales a que obliga. Cuando este sentimiento se generaliza en la comunidad científica sobreviene lo que Kuhn llama una crisis: se comienzan a cuestionar los supuestos que guiaban la investigación, se pierde la confianza en ellos y se empiezan a revisar y a discutir los fundamentos. En estos períodos de crisis se suceden propuestas alternativas hasta que en tomo a alguna de ellas se comienza a organizar un nuevo cuerpo de supuestos desde los que mirar las viejas cosas de un modo nuevo y más prometedor. Con el tiempo, y si el trabajo basado en los nuevos supuestos permite abrigar esperanzas de éxito, reciben la confianza de los especialistas de la comunidad y acaban suplantando a los antiguos como guía para la investigación. Los viejos supuestos son desplazados por los nuevos consumándose lo que Kuhn llama una .~~oSuciÓ cieiztljTca, l~ tras la cual se inicia un nuevo período de ciencia normal. Éste es el tipo de actividad que caracteriza la ciencia i1o-i1017nalo extraordinaria, la que se desarrolla en los períodos revolucionarios. A ella están asociados los "grandes nombres" de la historia de la ciencia, como CopSmico, Sewton, Darwin o Einstein. Pero es importante señalar que no sólo ellos pues. si bien la ciencia extracrdinaria es un fenómeno mucho más extraño que la ciencia normal, según Kuhn se da con más frecuencia de la que la referencia a estas grandes revoluciones puede sugerir (cf. 1969, p. 149; el "tamaño" de las revoluciones es una de las cuestiones que Kuhn nunca ha precisado suficientemente). Es importante señalar que el paso de un período normal a otro no viene obligado por necesidad lógica. Se trata de un desplazamiento de confianza y, en ausencia de un nuevo programa, el antiguo puede mantenerse largo tiempo aunque haya entrado en crisis. Recuérdese que ésta es la situación en disciplinas científicas ya asentadas. En los períodos de gestación no hay un paradigma dominante y lo que sucede es algo muy parecido a lo que sucede en los períodos de crisis en la ciencia madura, a saber, una extraordinaria proliferación de alternativas rivales que compiten por imponerse en la comunidad.
El concepto básico que articula esta nueva concepción de la ciencia es el de paradigma. Un napa6aypa (del griego 'napa':cercano, aproximado; y '6eiwa':muestra, mostración) es un ejemplo o caso de algo que hace de modelo para otros casos de lo mismo, es un ejemplo-tipo o típico. Así decimos, por ejemplo, que María Callas es un paradigma de cantante de ópera, que es una cantante de ópera paradigmática; o que Romeo y Julieta son un paradigma de amantes apasionados; o, el ejemplo preferido del
propio Kuhn, que amo-amas-amat-amamus-atrtatis-amant es un paradigma de la conjugación del verbo latino. Este significado original del término 'paradigma' se desplaza en La Estructlcra en varias direcciones hasta llegar a tener sentidos muy diferentes (cf. p.ej. hlasterman, 1970, para un análisis de los mismos). De entre ellos, e1 dominante, e1 que sustenta esta concepción, es desafortunadamente el más impreciso de la obra. En este sentido un paradigma es el conjunto de supuestos compartidos por una comunidad que guían su investigación normal. La ciencia normal es ciencia-basada-en-(un-)paradigma y la ciencia extraordinaria o revolucionaria es el paso de un paradigma a otro. En esta última, al igual que en la fase inmadura o preparadigmática de una disciplina, se trabaja sin (el dominio de un) paradigma, hay una proliferación de hipótesis diferentes. Las disciplinas maduras, aquellas en que ha surgido ya un primer paradigma, se desarrollan de pnradigma en paradigma a través de revolrrciones. En este primer trabajo, Kuhn no es lo suficientemente explícito acerca de estos supuestos compartidos como para extraer una idea clara de los mismos. Muchas de las críticas que se le dirigieron inicialmente no sólo se dirigían contra la equivocidad del término sino también, y principalmente, contra la vaguedad de éste su sentido preponderante. Parecía que hablar de paradigmas no era sino otro modo, poco afortunado, de referirse en términos muy generales a teorías. En trabajos posteriores (cf. especialmente 1962-1970, "Postscriptum", y 1970c), Kuhn intenta distinguir y precisar los diferentes sentidos con que introdujo el término. Los diversos usos que de él hacía en su primera obra los reagrupa ahora en dos sentidos principales. El primero es global y comprende todos los compromisos compartidos por un grupo científico, la completa constelación de creencias, valores, técnicas y demás elementos compartidos por los miembros de una comunidad científica dada. Como veremos, el segundo es concreto y denota un componente específico de lo anterior, un tipo especialmente importante de tales compromisos. Aunque entre los estudiosos de la ciencia el término ha acabado por usarse en el sentido global, fue el segundo el que motivó originalmente su introducción y el que se adecua a su significado etimológico. Para no confundirlos, Kuhn denomina en estos trabajos 'matriz disciplinar' ('disciylinary rnatrix') a lo primero y 'ejemplar' a lo segundo. Un paradigma qua matriz disciplinar es por tanto lo compartido por una comunidad científica, lo que guía en un momento dado su investigación normal. Sus principales componentes son los siguientes:
Genera1i:aciones simbólicns Éste es el componente formal o fácilmente formalizable de la matriz disciplinar y comprende, aproximadamente, las tradicionales lqes. A menudo se encuentran ya en forma simbólica, como f = ma, I = VIR o V'Y + Src'~n/h=(E - V)Y = O; pero también pueden venir expresadas en palabras, como "la acción es igual a la reacción" o "la combinación química se produce según proporciones constantes de peso". Estas generalizaciones simbólicas, consideradas aisladamente, funcionan como expresiones de un sistema matemático puro de uso compartido por los miembros de una comunidad científica; como mero formalismo abstracto, son expresiones vacías de significado o aplicación empírica.
FL'NDPlhlEhTOS DE FILoSOFL~DE LA CIENCIA
No todas las generalizaciones simbólicas son paradigmáticas, esto es, :)O todas se consideran incuestionables. Es típico que así ocurra con las que tienen cierto carácter fundacional o programático. De entre ellas, son especialmente importantes las "más generales", cuasi-vacías o cuasi-tautológicas, como f = ina o la ecuación de onda de Schrodinger, que más que generalizaciones son esquemas de tales: "no son tanto generalizaciones como esquemas de generalizaciones, formas esquemáticas cuya expresión simbólica detallada cambia de una aplicación a la siguiente" (1970c, SIII). Una de las tareas de la ciencia normal consiste precisamente en intentar aplicarlas a situaciones empíricas concretas encontrando formas especiales de las mismas: "En el problema de la caída libre, f = I?UI pasa a ser 17lg = ~nd'sldr'. Para el péndulo simple se convierte en mg seno = - ~ítd'sldt~.Para osciladores armónicos acoplados, la mencionada fórmula se convierte en dos ecuaciones, la primera de las cuales puede escribirse mid2sildt?+ kisi= k2(d+ s2- S,). Problemas mecánicos de mayor interés, por ejemplo el movimiento de un giroscopio, mostrarían aún mayor disparidad entre f = ma y la generalización simbólica a la que efectivamente se aplica la lógica y la matemática" (ibid.). Es en este sentido que f = riza no es tanto una generalización específica cuanto un esquema que va adquiriendo formas específicas para casos de aplicación específicos. Y por eso es, cortsiderada en sí mis~na,cuasi-vacía o cuasi-tautológica y, por tanto, difícilmente refutable, difícilmente puede entrar en conflicto con la experiencia. Por sí sola apenas tiene "contenido", son sus versiones específicas las que lo tienen y las que entran en conflicto con la experiencia. Pero si ello ocurre, siempre es posible mantener la ley más general y retocar sólo sus desmollos específicos. La idea es que tales leyes generales son "programáticas", son algo así como "guías para la investigación": si tienes un feiiómeno cinemático a explicar, busca fuerzas responsables del mismo de modo que la suma de todas ellas sea igual al producto de la masa por la aceleración; si la suma de fuerzas no coincide con dicho valor, la conclusión no es que 1a.segunda ley es falsa, sino que debes seguir buscando nuevas fuerzas o precisar mejor la naturaleza y magnitud de las ya detectadas. En este sentido, este tipo de generalizaciones son "irrefutables" y sólo sus versiones específicas entran en conflicto con la Durante los períodos de ciencia experiencia. Su abandono es un fenómeno re~~oluciottar.io. normal no se cuestionan, s61o se cuestionan en los momentos de crisis y si se terminan abandonando es porque han perdido la confianza de la comunidad como principios que guían la investigación. Las revoluciones entrañan, entre otras cosas, el abandono de estos pnncipios, de estas leyes paradig~ízáricas,pero como parte del proceso general de pérdida de confianza en el paradigma-matriz en crisis (sobre la forma lógica de estos pri~icipiosguía, cf. Moulines, 1982, cap. 2.3). Modelos Kuhn usa aquí 'modelo' en el sentido de imagen, algo a lo que se puede asimilar otra cosa, por ejemplo cuando decimos que un computador es un modelo de la mente. Los modelos proporcionan al grupo las analogías preferidas o? si se les sostiene a fondo, una ontología. En un primer sentido, los modelos son simples analogías, son sólo heurísricos, por ejemplo la asimilación del con~portamientode un gas con el de un conjunto de pequeñas bolas en movimiento, o del funcionamiento de la mente con el de un computa-
dor. En un segundo sentido, más fuerte, los modelos son objeto de compromiso metafísico, son ontológicos, por ejemplo la creencia de que todo fenómeno perceptible es debido al movimiento e interacción de átomos en el vacío. Kuhn admite que ambos tipos de modelos son conceptualmente diferentes, pero los subsume en un mismo grupo de compromisos porque su función metodológica y epistémica es muy parecida (cf. 1962-1979, "Postscriptum", n. 9). Además de proporcionar a la comunidad científica sus analogías preferidas, muchas veces determinan qué puede ser aceptado como solución a un problema. Por otro lado, a veces modelos heurísticos pueden pasar a convertirse en ontológicos, como ocurrió en la reducción de la termodinámica a la mecánica estadística con la asimilación del calor con la energía cinética media de las moléculas. Kuhn enfatiza que, aunque usualmente los miembros de una comunidad comparten los modelos, ello no es esencial, pueden no compartirlos, ni siquiera los heurísticos. En este punto, sin embargo, no está claro qué grado de "esencialidad" tienen estos componentes de las matrices (cf. 19621970, pp. 15 1-152).
Valores Los valores son el conjunto de criterios axiológicos que emplea la comunidad al evaluar su propia actividad. Los más destacados son los relativos a la no vaguedad de las predicciones, el margen de error admisible de las observaciones respecto de las predicciones, la fecundidad, coherencia y simplicidad del aparato teórico y la compatibilidad con otras teorías aceptadas. A veces también se contemplan otros más externos relacionados, por ejemplo, con la utilidad de la ciencia o su función social. Los valores operan tambi6n en la ciencia normal, pero juegan su principal papel en el surgimiento de las crisis y en su resolución, en la elección de paradigmas alternativos. Generalmente estos valores son compartidos por varias comunidades dentro de una misma disciplina, pero no por ello tienen siempre el mismo efecto. Puesto que su aplicación conjunta produce conflictos al no ser plenamente compatibles entre sí, es forzoso a veces conceder más importancia a unos que a otros, y diferentes comunidadzs, o la misma en momentos diferentes, pueden hacerlo de diferente modo. Ésta es una de las razones por las que no hay un procedimiento mecánico que nos diga cuándo un paradigma debe ser abandonado, se le debe retirar la confianza, o qué elección hacer entre paradigmas alternativos. Nótese que, en las revoluciones, una opción, el viejo paradigma, está muy desarrollada y otra, el nuevo, poco, por lo que no está claro cómo contrapesar los resultados de las exigencias que impone el mismo grupo de valores. Si concedemos mucha importancia a la fecundidad, el nuevo paradigma incipiente sale de momento perdiendo, pero si se la concedemos a la resolución de problemas recalcitrantes, saldrá ganando. El proceso de decisión de acuerdo con esos valores no es pues automático o mecanizable, y a veces puede depender esencialmente de otros elementos externos a la actividad científica, elementos de carácter social, o económico, o incluso político o ideológico.
316
FUn'D.4blEh'TOSDE FILOsOFi4 DE M CIENCIA
Ejemplares Éste es el componente más importante, junto con las generalizaciones simbólicas, de la matriz. A él se refiere el otro sentido de 'paradigma' anunciado, sentido que motiva originalmente la introducción del término. Los ahora llamados 'ejemplares' son paradigmas en sentido etimológico: casos que hacen de modelo, ejemplos modélicos. Los ejemplares son aplicaciones empíricas específicas del aparato formal que sirven de modelo o guía para el trabajo de resolución de rompecabezas, para otras aplicaciones; son las "partes de la realidad" a las que típicamente se aplica el formalismo. Pueden ser logros especialmente importantes de la teoría, como la aplicación al sistema solar de la mecánica newtoniana, o la aplicación al cometa Halley de esa misma teoría, o la aplicación al perihelio de Mercurio de la mecánica relativista, etc. Otros son ejemplos-tipo, típicos, para su aplicación, como una experiencia de laboratorio con un plano inclinado, o un problema-resuelto de un libro de texto. A ellos se refiere Kuhn en La Esrnictirra cuando afirma que los paradigmas son "realizaciones científicas universalmente reconocidas que, durante cierto tiempo, proporcionan modelos de problemas y soluciones a una comunidad científica" (p. ix). Mediante los ejemplares se ven situaciones nuevas como semejantes a otras anteriores bien establecidas. Se ven fenómenos diferentes de modo similar, como casos de aplicación de una misma ley; por ejemplo se puede ver el movimiento de un péndulo como semejante, con ciertas idealizaciones, al de una bola moviéndose en un doble plano inclinado, o puede verse, como propusieron los copemicanos tras el descubrimiento de las lunas de Venus, el sistema Sol-planetas como semejante al sistema Júpiter-lunas. También aquí no todos estos elementos son considerados igualmente esenciales, no todos los casos de aplicación son igualmente importantes, de entre ellos sólo algunos son considerados paradigmáticos. Al hacer de modelos-paradigmas para la resolución de enigmas, los ejemplares guían, junto con las leyes paradigmáticas, la investigación nornlal, el desarrollo de la matriz disciplinar. En gran medida, la ciencia normal consiste en ir ampliando con éxito el ámbito de situaciones semejantes a los ejemplares, intento que obliga generalmente a alguna modificación de las leyes más específicas (no paradigmáticas). Al presentar el primer elemento de las matrices, las generalizaciones simbólicas, vimos que Kuhn enfatiza que por sí solas son simples componentes de un formalismo abstracto vacío de contenido empírico. Pues bien, según Kuhn es justamente a través de los ejemplares como, al menos en parte, se cargan de contenido empírico los términos de las generalizaciones que constituyen el formalismo abstracto. Con los ejemplares se aprende cómo el aparato conceptual se aplica a la naturaleza y, en consecuencia, parte de su significado. Los ejemplares desempeñan ahora (al menos parte de) el papel de las antiguas reglas de correspondencia. En la sección en que se ocupa de la conexión de la teoría con la experiencia, Kuhn afirma explícitamente que la "habilidad adquirida para ver semejanzas entre problemas aparentemente dispares desempeña en las ciencias una parte importante del papel atribuido corrientemente a las reglas de correspondencia" (1970c, SIV); a esta idea se refería Hempel cuando, como mencionamos en el capítulo anterior, señala a Kuhn como una de las fuentes de sus nuevas tesis sobre el modo en que los
términos teóricos se cargan de contenido empírico. Por otro lado, los ejemplares no son experiencias puras, descripciones neutras de la naturaleza. Son ejemplares dentro de un paradigma y están en parte ya conceptualizados. Ello hace que, al cambiar el paradigma, con todos sus componentes, cambie, según Kuhn, al menos parte del significado de los términos y a su vez el modo-de-ver-guiado-por-ejemplares las cosas. Las "mismas" situaciones se ven de modo diferente y quienes mantienen paradipmas diferentes viven, en cierto sentido, en mundos diferentes. Éste es el origen del fenómeno de la inconrnensurabiliclad que en opinión de Kuhn acompaña los cambios revolucionarios. Esta nueva concepción de los constmctos teóricos tiene importantes consecuencias para las más importantes cuestiones epistemológicas y semánticas de la filosofía de la ciencia, como el ya mencionado de la inconmesurabilidad, o los del relativismo, la racionalidad, el significado de los tCrminos científicos, la confirmación y la falsación, etc. Por ahora nos limitamos a los elementos fundamentales de las matrices disciplinares y más adelante, cuando tratemos algunas de estas cuestiones, volveremos sobre el resto de las tesis kuhnianas (cf. especialmente cap. 12, $5, sobre sus consecuencias para el problema de la inmunidad y cap. 13, 94, 95 para las relativas a la inconmensurabilidad). Para concluir comentaremos brevemente un problema de ambigüedad relativo al término 'matriz disciplinar'. Kuhn afirma que introduce dicho término en sustitución del equívoco Cient@cas, y que mediante él se 'paradigma' usado en La Estr~icrurade 10s Re~~oluciones quiere referir al conjunto de supuestos compartidos por los miembros de una comunidad científica. Estos supuestos son los supuestos de los cuatro tipos que acabamos de examinar, pero lo que no está claro es si la matriz disciplinar incluye todos los supuestos de cada tipo o sólo los paradigmdticos; o limitándonos a los dos que más centrarán nuestra atención, no está claro si las matrices incluyen todas las leyes y todos los ejemplares o sólo las leyes programáticas generales y los ejemplares paradigmáticos. Esta cuestión es en parte sólo nominal. Kuhn afirma que su intención era captar lo que tradicionalmznte se ha denominado 'teoría', pero que no usa este término porque tal como de hecho lo emplean los científicos "comiota estructuras mucho más limitadas en naturaleza y alcance que las requeridas [...]; para los presentes propósitos sugiero 'matriz disciplinar': 'disciplinar' porque se refiere a la posesión común de los practicantes de una disciplina; 'matriz' porque está compuesta de elementos ordenados de varios tipos" (19621970, p. 150). No aclara sin embargo si la matriz incluye todos los elementos de cada tipo o sólo algunos, y cuando usa el término unas veces parece referirse a todos y otras sólo a los paradigmáticos. En principio, sus numerosas referencias al "conjunto total de supuestos compartidos" parecen sugerir que incluye todos, pero en realidad ello no es inmediato pues depende de qué se entienda por 'comunidad científica'. Si la comunidad científica es el conjunto de científicos que trabajan en una teoría en un momento dado, entonces la matriz incluye todos los sriplrestos compartidos eri ese estadio de la teoría. Pero si la comunidad es el conjunto de los científicos que trabajan en la teoría en toda s u historia, entonces la matriz incluye todos los siipiiestos compartidos a lo largo de toda la historia de la teoría, que serán solo los paradigmáticos pues, como veremos (cf. cap. 13), éstos son los que se preservan a lo largo de la historia de la teoría. La presente ambigüedad no es, pues, sino consecuencia de la
ambigüedad entre los sentidos sincrónico y diacrónico de 'teoría' o 'n~atrizdisciplinar'. Desde una perspectiva sincrónica, la matriz disciplinar incluye todos los elementos compartidos en un momento dado; desde la perspectiva diacrónica, incluye sólo los que perduran durante la historia de la teoría. Una vez esto quzda claro, qué palabras usemos es lo de menos. Cuando en adelante usemos esta expresión, el contexto aclarará el sentido en que se hace, en caso contrario lo aclararemos explícitamente.
3. Los programas de investigación d e Lakatos Lakatos, inicialmente discípulo de Popper, reacciona contra él llegando a puntos de vista similares a los de Kuhn y Feyerabend aunque sin caer, al menos eso pretende, en algunas tesis extremas de éstos, sobre todo las relativas a la racionalidad científica, que considera inaceptables, desde una perspectiva popperiana general que comparte. Lakatos lleva a cabo la revisión del falsacionismo de Popper en una serie de estudios sobre lo que denomina la metodología de los programas de ini*estigacióncieittijka. Estos trabajos iban a concluir con una extensa monografía titulada, en referencia directa a la obra de Popper, The Clzaizging Logic of Scientij?~Discovery, proyecto que quedó truncado al morir su autor. Una de las finalidades de esta obra era desarrollar la estructura final de los progralnas de investigación, noción con la que Lakatos pretendía recoger lo que consideraba fundamental de los constructos teóricos. Al quedar el proyecto sin conclusión, sólo disponemos, como fuente de sus ideas sobre la estructura de los programas de investigación, de sus primeros trabajos (especialmente 19686 y 1970). El propio Lakatos los considera muy insuficientes y provisionales, pero contienen ya algunos elementos de interés para nuestro actual tema. Veremos aquí muy brevemente las principales contribuciones, que casi siempre están sólo esbozadas. Lakatos parte de las observaciones de Popper sobre el coitocirnie~ztode fondo y la contrastación y las lleva a sus últimas consecuencias. Lo que se evalúa en la contrastación, dice, no es una teoría comparada con los hechos sino un conjunto de (mini)teorías, de diferente estatus metodológico, comparadas entre sí: "el conflicto no es entre 'teorías y hechos', sino entre una teoría ii~rerpretarivaque provee de hechos y una teoría explicativa que los explica [...], no se trata de que nosotros propongamos una teoría y la Naturaleza pueda gritar NO, sino que nosotros proponemos una red de teorías y la Naturaleza puede (1970, p. 130). Este conflicto se intenta resolver modificando algugritar INCONSISTE~~ES" nos elementos de la red y se genera así una sucesión de teorías-redes ligadas por "una notable continuidad". Esta serie o sucesión de teorías es lo que Lakatos llama un 'programa de investigación' que, como reconoce explícitamente, tiene fuertes reminiscencias de la ciencia normal de Kuhn. Lakatos presenta los elementos constituyentes de los programas de investigación en el contexto de Ias heurísticas que caracterizan la metodología de los programas. Todos los programas tienen un núcleo que los vertebra y les confiere unidad. Este núcleo lleva asociada una heurística que determina dos tipos de reglas metodológicas: unas nos dicen qué senderos de investigación hemos de evitar, Iieurística negativa, y otras qué senderos hemos de seguir, heurística positiva. La heurística negativa prohibe, por decisión, aplicar
1t
1! :
i
1
la refutación al núcleo, para lo cual se debe articular un cinturón protector de hipótesis auxiliares o complementarias que sí se consideran modificables. La heurística positiva sugiere cómo modificar y desarrollar esta parte "refutable" del programa. Éstas son las líneas maestras de la nueva metodología de Lakatos, contenida sucintamente en el siguiente pasaje: "Todos los programas de investigación científica se pueden caracterizar por su 'núcleo'. La heurística negativa del programa nos prohíbe dirigir el modus tollens a este 'núcleo'. En lugar de ello debemos emplear nuestro ingenio en articular o incluso inventar 'hipótesis auxiliares7 que conformen un cinturón protector en tomo a ese núcleo, y es a éstas a quienes debemos dirigir el mod~rstollens. Es ese cinturón protector de hipótesis auxiliares quien tiene que resistir el peso de las contrastaciones e irse ajustando y reajustando, o incluso ser sustituido por completo, para defender al núcleo, que de ese modo se hace más sólido. [...] Este núcleo es 'irrefutable' por decisión metodológica de sus protagonistas: las anomalías sólo deben llevar a cambios en el cinturón protector. [...] La heurística negativa especifica el núcleo del programa que es 'irrefutable7 por decisión metodológica; la heurística positiva consiste en un conjunto parcialmente articulado de sugerencias o indicaciones sobre cómo cambiar y desarrollar las 'variantes refutables' del programa de investigación, cómo modificar, sofisticar, el cinturón 'refutable' de proteccii5n" (1970, $ 3 ~ - b ) . El resultado de aplicar esta metodología constituye la evolución de una teoría científica; en términos de Lakatos, se trata de una sucesión de diferentes versiones del mismo programa, esto es, en tomo a un mismo núcleo. Como se habrá advertido, esta imagen es similar a la evolución de un paradigma kuhniano. Lakatos ofrece además una tipología de los programas de investigación en función de su mayor o menor "éxito". Un programa es progresivo si (entre otras cosas en las que no podemos detenemos ahora) predice hechos que se constatan después, y es, o está, estancado si sólo "postdice", esto es, si sólo ofrece explicaciones ad hoc de hechos (para él) inesperados. Esto exige dos cualificaciones. En primer lugar, el juicio requiere cierta perspectiva histórica, esto es, a los programas incipientes es racional "concederles cieno tiempo". Por otro lado, e incluso garantizada la perspectiva histórica, las cosas no siempre están tan claras, los casos mencionados son más bien idealizaciones y hay numerosos casos intermedios. Como es usual en los filósofos de esta orientación, Lakatos ilustra su nueva concepción con un detallado estudio histórico, en este caso del programa de investigación de Prout centrado en la idea de que todos los átomos están compuestos de átomos de hidrógeno, y del programa de investigación de Bohr centrado en la tesis de que la emisión de luz se debe al salto de órbita de los electrones en el interior del átomo. Es importante señalar que esta tipología idealizada de programas no debe tomarse como un criterio cuasiformal de sustitución: nada obliga, y por supuesto la lógica más "los hechos" tampoco, a abandonar un programa estancado, aunque sólo sea porque siempre es posible su "resurrección", esto es, de todo programa estancado siempre es en principio posible que se convierta de nuevo en uno progresivo. Esta perspectiva, bastante kuhniana en general, se distancia de la del autor de La Estructilra en algunos puntos, especialmente los que tienen que ver con los problemas de
la inconmensurabilidad y la racionalidad de la ciencia y en los que no podemos detenemos ahora. Por lo que respecta a la estructura de las teorías, la diferencia más señalada, aparte de la extrema imprecisión de las nociones de ~irícleoy cintrtrón protector, tiene que ver con el "alcance" o "dimensión" de los programas de investigación. En Kuhn está (aproximadamente) claro que los paradigmas-matrices se identifican, diacrónicamente, con teorías a lo largo de la historia. La astronomía geocéntrica constituye un paradigma, la heliocéntrica otro diferente; la mecánica desde Newton a Lagrange constituye un paradigma, la mecánica relativista otro diferente; la química del flogisto constituye un paradigma, la química del oxígeno otro diferente; etc. Sin embargo, y quizá como consecuencia de la mencionada imprecisión, no está claro en Lakatos cuáles son los límites de los programas de investigación. En general parece que engloban, como en Kuhn, sólo teorías extendidas en el tiempo; así se refiere, por ejemplo, "al programa de Newton". Pero en ocasiones habla como si varias de esas teorías pudieran constituir una única tradición, que se identificaría entonces con toda una disciplina. En ausencia de mayores precisiones, no es posible entonces distinguir claramente entre a ) el paso de una versión a otra de la misma teoría, y b) el paso de una teoría a otra. Estos dos fenómenos diacrónicos son prima facie esencialmente diferentes (como veremos con detznimiento en el capítulo 13) y poder dar cuenta de esta diferencia depende de cómo se caractericen los constructos teóricos en su dimensión sincrónica. Probablemente Lakatos no consideraba que la diferencia de la que se debe dar cuenta sea nítida, pues incluso llega a afinnar que "la ciencia como un todo puede considerarse un inmenso programa de investigación" (ibid., $3). Pero entonces la imprecisión de sus nociones centrales, programa de invesrigacióiz, ~iúcleoy ciizturón protector, es deliberada y no se ve claramente cómo es coherente con la aplicación histórica que realiza sobre casos concretos. Seguramente esta cuestión era una de las que quería clarificar en la monografía que preparaba y que no pudo concluir.
4. Las tradiciones de investigación de Laudan Laudan no pertenece generacionalmente al grupo de los nuevos filósofos de la ciencia, pero su obra, bastante posterior, presenta grandes afinidades, tanto en intereses como en contenidos, con la de aquéllos. Desde finales de los años setenta, Laudan publica una serie de estudios donde revisa las principales tesis acerca de la naturaleza de los constructos teóricos, los valores que rigen la actividad científica y la noción de progreso adecuada a ellos. Como en el caso de Kuhn, el ámbito de estudio es extraordinariamente amplio, somete a revisión crítica prácticamente todas las cuestiones centrales de la filosofía de la ciencia. En relación a nuestro actual tema, el concepto básico que articula su concepción de los constructos teóricos es el de ri-adición de iitvestigaciólz, presentado por primera vez de forma sistemática en su monografía de 1977. Aunque, como los paradigmas de Kuhn, estas entidades se caracterizan diacrónicamente, nos centraremos ahora en los aspectos sincrónicos que tal caracterización diacrónica presupone. Laudan presenta la noción de tl-adiciói~de irrvestigació?~en relación explícita con
los paradigmas de Kuhn y los programas de investigación de Lakatos, intentando preservar lo que considera adecuado de ellos y modificando los aspectos que considera insatisfactorios (cf. Laudan, 1977, cap. 3). Laudan comienza distinguiendo dos sentidos del término 'teoría científica', dos tipos de "redes proposicionales". En primer lugar, el término puede denotar un conjunto relativamente específico de doctrinas, leyes, hipótesis o principios relacionados, que se usan para hacer predicciones experimentales y ofrecer explicaciones de fenómenos naturales. Ejemplos de ello son la teoría newtoniana de la luz, el electromagnetismo de Maxwell, la teoría de la estructura atómica de Bohr, la del efecto fotoeléctrico de Einstein o la de la plusvalía de Marx. Además de este sentido, el término se usa también para referirse a conjuntos de doctrinas o supuestos "mucho más generales y mucho menos fácilmente corroborables empíricamente" (p. 71). Ejemplos de ello son la teoría de la evolución, la teoría atómica o la teoría cinética de los gases. Aunque no siempre es claro al respecto, parece que las teorías en este segundo sentido consisten, al menos, en familias enteras de teorías en el primer sentido vinculadas por principios metodoló~icosu ontológicos muy generales. Kuhn y Lakatos, afirma, han mostrado que son las teorías en el segundo sentido las unidades en que se debe centrar el estudio de la actividad científica, la "herramienta primaria para la comprensión y valoración del progreso científico [. ... yo] comparto esa opinión, pero encuentro que las explicaciones dadas hasta ahora de lo que son estas teorías más amplias y de cómo evolucionan, no son completamente satisfactorias" (p. 72). De estas teorías generales, en el segundo sentido del término, es de lo que pretende dar cuenta su noción de tradición de investigacióiz. Veamos, sin detenemos en las críticas específicas que hace a Kuhn y Lakatos, cuáles son los principales elementos que caracterizan a estas tradiciones de investigación.
Sirp~iestoscornpnrridos Las tradiciones constan de dos tipos de supuestos generales, que individualizan una tradición dada y la distingue de otras: (i) Cornprornisos metafísicos. Conjunto de. creencias acerca de qué tipos de entidades y procesos constituyen el dominio de investigación; por ejemplo, en física, las creencias asociadas a las teorías atomistas, o contrariamente, las asociadas a las teorías de campos. (ii) Nonnas epistéjnicas y metodológicas. Normas acerca de cómo tiene que investizarse el dominio, cuál es el conocimiento de fondo intocable, cómo han de someterse a prueba las hipótesis, cómo han de recogerse los datos, cómo han de evaluarse la solución a los problemas, etc. Conjuntamente, los compromisos metafísicos y las normas epistémicas y metodológicas proporcionan a la tradición una heírrística, orientaciones para la investigación, y una rrriologín, normas de evaluación.
322
FL1ND,4hfEXTOSDE RLosoF~PI DE L4 CIENCIA
Arriculación teórica Las tradiciones poseen un cierto número de teorías especljScas asociadas que las ejemplifican y las constituyen parcialmente. Son los elementos empíricamente contrastables de la tradición, el "lugar" donde se contrasta la tradición con la experiencia.
Resolución de problemtlas La finalidad principal de las tradiciones, en relación a la cual se evalúan globalmente, es la resolución de probleinas. Los problemas son de dos tipos:
(i) Problemas empíricos. Derivados de la aplicación de las teorías específicas al dominio empírico de investigación. Estos problemas pueden ser (estar): resueltos, los casos de aplicación al dominio empírico exitosos según los estándares de la tradición; potenciales, los casos de aplicación que la tradición considera que deben resolverse, pero todavía no resueltos por la tradición en cuestión ni por ninguna otra; anóiízalos, los casos de aplicación que la tradición considera que deben resolverse, que ella todavía no ha resuelto y que han sido resueltos en otra tradición alternativa. (ii) Problemas concepruales. Relativos a la estmcturación conceptual de alguna teoría específica. Se dan en los siguientes casos: cuando la teoría es inconsistente; cuando contiene supuestos inaceptablemente ambiguos; cuando algunas de sus hipótesis contravienen otras teorías específicas, o los supuestos metafísicos predominantes; cuando sus afirmaciones no proceden según las doctrinas metodológicas y epistemológicas; cuando no acierta a integrar conceptos y principios de teorías más generales a las que está subordinada. Desarrollo histórico Las tradiciones discurren en el tiempo a través de un cierto número de formulaciones. Estas formulaciones son la respuesta en un momento específico a la evaluación negativa sobre la solución dada a alguno o varios de los problemas. El modo más usual en que cambia una tradición es modificando sus teorías específicas, pero ocasionalmente puede cambiar alguno de sus elementos nucleares más básicos.
Coexistencia Las tradiciones no son "dominantes", no se imponen por períodos. En cierto momento dado, en contra de lo que sugiere Kuhn, la coexistencia de tradiciones de investigación rivales es la regla, y no la excepción. Éstos son los rasgos más generales de las tradiciones de investigación según Laudan, que como se habrá apreciado tienen mucho en común con los paradigmas kuhnianos y los programas de investigación de Lakatos. Como hemos indicado, sin embargo, aunque esté de acuerdo con la idea general, Laudan discrepa en aspectos que considera centrales.
Esto se pone de manifiesto en el desarrollo específico de algunos de estos rasgos generales. Concluiremos comentando brevemente algunos de los elementos más problemáticos en el desarrollo de su programa. En primer lugar, no está muy definido el "tamaño" de las entidades involucradas, tradiciones de investigación y teorías específicas. Los ejemplos que da de tradiciones, como la teoría de la evolución o la teoría cinética de los gases, sugieren entidades como las matrices kuhnianas, esto es, teorías científicas a lo largo de su historia. Pero la caracterización general que da parece más bien sugerir grandes orientaciones científicas de una época (quizá coexistiendo y rivalizando), como el mecanicismo o el vitalismo, que pueden incluir varias matrices disciplinares en una época. Esta fluctuación es pareja a la que se da en las teorías específicas. Algunas veces parece que se trata de leyes bastante especificas, del tipo de la ley de caída libre de Galileo, la de gravitación de Newton, o la de gases ideales. Otras veces parece que se refiere a agregados de tales leyes, como el electromagnetismo de Maxwell o la teoría atómica de Bohr. Seguramente la vaguedad es intencionada y se pretende que puede haber diversas dimensiones en ambos tipos de entidades. El problema es cómo caracterizarlas para que la diferencia entre las más grandes de las teorías específicas y las más pequeñas de las tradiciones de investigación, no sea sólo de grado; ello representa un problema en la medida en que Laudan parece requerir que la diferencia entre teorías y tradiciones sea nítida. En segundo lugar, y relacionado con lo anterior, no está claro si hay alguna relación formal, y si la hay cuál es, entre tradiciones y teorías específicas. Por un lado, no se clarifica si, como decía Kuhn, de los supuestos generales puede formar parte alguna expresión legaliforme, alguna ley especialmente general que funciona cuasi-definicionalmente y de la cual las leyes específicas son concreciones. Quizá se pudieran incluir cosas de este tipo en los compromisos metafísicos generales, pero Laudan no dice si es así ni, caso de que lo sea, cómo se diferenciarían estos compromisos de los otros. Por otro lado, afirma que la relación entre tradiciones y teorías específicas no es de implicación, las tradiciones no implican sus teorías constitutivas. Al argumentar este punto, enfatiza el hecho de que las tradiciones pueden contener, y usualmente contienen, teorías específicas incompatibles (si teorías incompatibles fuesen implicadas por la tradición a la que pertenecen, las tradiciones serían simplemente inconsistentes). El caso más claro es el de teorías específicas sucesivas en la misma tradición, que se contradicen mutuamente; recuérdese que las teorías específicas hacen afirmaciones empíricas específicas, y por tanto si una da cuenta de un problema del que su versión anterior en la tradición no podía dar cuenta (anomalía), ambas versiones espec$cas sucesivas son inconsistentes. Pero también abundan, según Laudan, los casos en que teorías incompatibles coexisten en la tradición en el mismo período, como las teorías ópticas rivales de la tradición cartesiana que defendían, respectivamente, el aumento o disminución de la velocidad de la luz en función de la densidad del medio. Se supone que entonces tenemos uno de los problemas conceptuales a que antes nos referíamos, pero una cosa es que se den a veces problemas de este tipo, y otra que se den tan usualmente y tan drásticamente como Laudan parece sugerir. Por último, como hemos mencionado más arriba, a veces en la evolución de la tradición pueden modificarse algunos de los supuestos básicos. Eso es en principio
324
FUh'D.4hlEXTOSDE RLOSOF~ADE LA CIENCIA
sorprendente dentro de su propio enfoque, pues Laudan sostiene a la vez que tales supuestos básicos identifican la tradición, por lo que parece que pueden perder (al menos parte de) su identidad y seguir siendo ellas mismas (!). Una vez más, este efecto es querido por Laudan, que discrepa en este punto de Kuhn y Lakatos sobre la persistencia de la esencia o núcleo a lo largo de la tradición. La esencia, afirma, está relativizada respecto al tiempo. El núcleo muy raramente permanece constante a lo largo de toda la evolución de la tradición: "difícilmente hay un conjunto interesante de doctrinas que caracterice las tradiciones de investigación a lo largo de roda su historia" (op. cir., cap. 3, 46). Es cierto que existe una continuidad, pero se trata de una "continuidad relativa entre etapas sucesii~asdel proceso evolutivo" (ibid.).Es importante enfatizar que, aun restringida a estadios sucesivos, la continuidad debe ser sólo aproximada, no absoluta, en cada paso se pueden modificar parte de los supuestos básicos; si en cada paso se debieran conservar todos los supuestos básicos, entonces en el conjunto del proceso se seguirían conservando. Pero si parte de la esencia se puede abandonar, la pregunta que surge inmediatamente es, ¿qué y cuanto se puede cambiar del núcleo sin abandonar la tradición?, ¿qué distingue a ) el paso de un estadio a otro de la misma tradición de b) el paso del estadio terminal de una tradición al inicial de otra tradición nueva diferente?: "Una respuesta parcial a esta pregunta proviene del reconocimiento de que, en cualquier nzotítento dado, determinados elementos de una tradición de investigación son más medulares y están más alojados en la tradición de investigación que otros. [...] Ciertos elementos son sagrados y no pueden rechazarse sin repudiar la tradición misma. Pero, a diferencia de Lakatos, quiero insistir en que el coigurzro de eleinentos de esta clase (los irreclznzables) cainbia con el rieinpo" (ibid.).Pero esto no parece ser una respuesta ni siquiera parcial, pues si el conjunto de elementos irrechazables cambia con el tiempo, ¿en virtud de qué dos conjuntos diferentes sucesivos se consideran correspondientes a la misma tradición o tradiciones sucesivas diferentes? S610 hay dos modos en que, como pretende Laudan, pueda no conservarse nada en el transcurso de una tradición. Uno es que en cada paso no haya un conjunto bien definido de elementos irrechazables, pudiendo ser rechazado cualquiera de ellos mientras se preserve la inmensa mayoría; así, tras una serie de pasos puede que no permanezca ninguno de los originales. Otro es que sí haya un conjunto bien definido de elementos irrechazables, pero que ese conjunto cambie parcialmente en cada estadio; también así puede que tras varios pasos no permanezca ninguno de los elementos originales. Pero si no se dice nada más, en ambos casos no está clara la diferencia entre el cambio etz una tradición y el cambio de tradición. Quizá sea sólo una cuestión de grado, o de convención en la reconstrucción histórica. Pero si no se aceptan estas consecuencias, la única posibilidad es que haya algo que se mantenga a lo largo de toda la tradición y cuyo cambio sea precisamente el indicio de un cambio de tradición. Esto es, que las teorías científicas, aun cuando cambien en el tiempo, tengan un núcleo persistente.
5. Consideraciones finales La incidencia de los nuevos flósofos de la ciencia, y otros afines, en nuestra disciplina fue decisiva. La irrupción de la perspectiva historicista que en general los caracteriza marca definitivamente el desarrollo de la reflexión metacientífica posterior. La influencia más determinante afecta quizá a cuestiones como la importancia de los estudios históricos y de los determinantes sociales, la cuestión de la carga teórica de los hechos y el problema de la inconmensurabilidad, los problemas del progreso y la racionalidad en la ciencia, o del relativismo. Sin embargo, a la mayoría de sus tesis subyace, sin implicarlas estrictamente, una nueva visión de la naturaleza y estructura de las teorías científicas, más ajustada a la realidad y más fiel a las teorías tal como la historia nos las presenta. En nuestra opinión, y sin desmerecer sus otras aportaciones, es en esta nueva noción, aunque muy imprecisa, de teoría empírica donde radica su mayor contribución a la disciplina. Desde la perspectiva actual, los principales rasgos de esta nueva noción de teoría que está emergiendo son los siguientes. Las teorías en sentido sincrónico:. 1. Son entidades sumamente complejas y dúctiles, susceptibles de evolucionar en el tiempo sin perder su identidad. Aunque la idea de que las teorías son entidades que se extienden en el tiempo a través de diferentes estadios no es un descubrimiento de estos filósofos, sí fueron los primeros en dar a ese hecho todo su valor. 2. No son enunciados o secuencias de enunciados y en un sentido propio no pueden calificarse de verdaderas o falsas, aunque con ellas sí se realizan afirmaciones empíricas verdaderas o falsas. 3. Tienen, al menos, un componente formal, las leyes o hipótesis, y otro empírico o aplicativo, los sistemas a que se pretenden aplicar. 4. Cierta parte de cada uno de estos componentes se considera intocable por decisión metodológica (núcleo). Las teorías tienen pues partes "esenciales" y partes "accidentales", en ello radica su ductilidad. El aparato formal se articula en niveles progresivamente cada vez más específicos, que dan cuenta de situaciones empíricas también específicas. A veces se denomina 'teoría', en un sentido más restrictivo, a estos desarrollos concretos del formalismo (p.ej., la teoría de la gravitación). 5 . Tienen diversos niveles de empiricidad. Parte de la teoría conceptualiza los hechos y parte explica, y se contrasta con, lo así conceptualizado. 6. Es la parte específica, "accidental", del formalismo la que recibe el peso de la contrastación. Ante una contrastación negativa, el núcleo siempre se puede salvaguardar modificando los elementos no nucleares. 7. Llevan asociadas normas, valores, o simplemente indicaciones metodológicas y evaIuativas, algunas de ellas fuertemente dependientes del contexto socio-histórico.
La principal deficiencia de esta nueva caracterización es su imprecisión, en ocasiones tan extrema que termina por difuminar casi totalmente lo que parecen intuiciones correctas. El principal motivo de los positivistas para desarrollar una filosofía formal de la ciencia era justamente eludir el discurso metacientífico vago e impreciso. Y gran parte de
las polémicas que surgen tras la irrupción de los nuevos filósofos son generadas por la imprecisión y equivocidad de algunas de sus nociones centrales. La mayoría de los filósofos de la ciencia sensibles a esta nueva perspectiva concluyeron que la complejidad y riqueza de los elementos involucrados en ella escapa a cualquier intento de formalización. No sólo las forrnalizaciones al estilo de la Concepción Heredada son totalmente inadecuadas para expresar estas entidades en toda su complejidad, sino que no parece razonable esperar que cualquier otro procedimiento de análisis formal pueda capturar los elementos mínimos de esta nueva caracterización. Ésta es la moraleja antiformalista que se extendió en muchos ambientes metacientíficos tras la revuelta historicista. Como vamos a ver en el próximo capítulo, no en todos. Tras la digestión de los primeros efectos antiformalistas, algunas de las corrientes más recientes en filosofía de la ciencia muestran que al menos parte de los nuevos elementos señalados, los más estructurales, son susceptibIes de un razonable análisis y reconstrucción formales.
i 1
I
El efecto de la irrupción historicista durante los años sesenta y principios de los setenta fue doble. Por un lado, a su estela se desarrolla toda una rama de los science studies (con importantes, aunque puntuales, antecedentes antes de los años sesenta) que se centra en el estudio de los determinantes sociales de la ciencia apoyándose en una considerable investigación empírica. Esta línea de investigación culmina con el asentamiento durante 10s años ochenta de la sociología de la ciencia como disciplina. Aunque desde este ámbito se han hecho numerosas incursiones en la filosofía de la ciencia, su importancia para el tema actual, la estructura de las teorías, es escasa, pues sus propuestas son sólo negativas, más bien nihilistas: en la práctica científica no existen en realidad entidades identificables que quepa caracterizar, en ningún sentido del término mínimamente preciso y útil para la comprensión de la actividad científica, como "teorías científicas". No vamos a detenemos aquí en estas tesis. Por otro lado, asimiladas las contribuciones incuestionables de los historicistas y expurgados sus principales excesos, se recupera durante los años setenta la confianza en la viabilidad de los análisis formales o serniformales de la ciencia, al menos en algunos de sus ámbitos, entre ellos el relativo a la naturaleza de las teorías. A finales de los años setenta y en los ochenta, aunque algunas versiones venían desarrollándose desde bastante antes, se extiende y acaba imponiéndose en general una nueva caracterización de las teorías científicas que se ha denominado Concepción Semántica de las Teorías. En realidad no se trata de una única concepción sino de una familia de ellas que comparten algunos elementos generales relativamente unitarios en comparación con las caracterizaciones de la Concepción Heredada. A esta familia pertenecen Suppes, su pionero en Ios años cincuenta, y su escuela de Stanford; van Fraassen, Giere y Suppe en EEUU; Dalla Chiara y Toraldo di Francia en Italia; Przelecki y Wójcicki en Polonia; y la concepción estructt~ralistade las teorías, iniciada en EEUU por Sneed y desarrollada en Europa, principalmente, por Stegmüller, Moulines y Balzer. En este capítulo vamos a presentar, en primer lugar, la motivación principal que, en relación con el proyecto de la Concepción Heredada, acompaña a este nuevo enfoque, así como los rasgos más generales comunes a las diferentes versiones del mismo. A continua-
328
FUND;\hlE%TOS DE FILOSOFLADE LA CIENCIA
ción veremos los orígenes de la concepción modeloteórica en los trabajos fundacionales de Suppes y la contribución esencial de un miembro de su escuela, E. Adams. Después repasaremos brevemente las principales peculiaridades de cada uno de los enfoques vinculados a la familia semántica. En relación con el tema que nos ocupa, la naturaleza y esuuctura de las teorías, la concepción estructuralista es la que ha desarrollado un aparato metateórico más rico para el análisis y reconstrucción de las teorías científicas. La última sección está destinada a presentar con cierto detalle los elementos principales del análisis estructuralista.
1. Teorías, enunciados y modelos
El lema de las concepciones semánticas es: "presentar una teoría no es presentar una clase de axiomas, las teorías no se identifican metateóricamente con conjuntos de enunciados; presentar una teoría es presentar una clase de modelos, las teorías se identifican metateóricamente como conjuntos de modelos". Puesto que la noción de modelo es una noción fundamentalmente semántica, se denomina concepciólí seináizrica a este nuevo enfoque que enfatiza la importancia de los modelos en el análisis de la ciencia; contrariamente, la concepción clásica es calificada de sintáctica por su caracterización de las teorías como conjuntos de enunciados y por su énfasis general en los aspectos lingüísticosintácticos. Este lema expresa por tanto el carácter distintivo frente a la concepción clásica. Pero apreciar en su justa medida cuál es ese carácter distintivo es difícil. Para ello comenzaremos revisando un aspecto de la concepción sintáctica que es claramente insatisfactorio. El enfoque semántico es en parte un intento de mejorar la concepción clásica en ese punto.
1.1. AXIOMAS Y MODELOS Para apreciar el elemento insatisfactorio más manifiesto de la concepción sintáctico-axiomática es imprescindible tomársela en serio, tomarse en serio la i8e;zti~icaciórzde una teoría con una serie de enunciados, los axiomas (ahora no distinguimos entre axiomas y reglas de correspondencia, pues esa distinción no afecta a la cuestión que aquí se trata). Según esta concepción, una teoría es una clase de axiomas, y si nos tomamos eso en serio ello implica-que toda diferencia en axiomas supone una diferencia de teorías. Puesto que dos axiomatizaciones diferentes son dos diferentes clases de enunciados, tenemos dos teorías diferentes. Ésta es una consecuencia intuitivamente insatisfactoria, pues podemos tener dos axiomatizaciones diferentes de, intuitivamente, "la misma teoría". Debe quedar claro que nos estamos refiriendo a casos en los que el aparato conceptual en ambos conjuntos de axiomas es el mismo; en caso contrario las intuiciones no están tan claras. Por ejemplo, en casos como el de la equivalencia entre las versiones ondulatoria y matricial de la mecánica cuántica sí cabe decir en un sentido interesante que se trata de teorías diferentes entre las que se da determinada relación interteórica específica, la de equivale~z-
cia (cf. cap. 1 1, $4). Pero en los casos a que nos referíamos, cuando ambos conjuntos de axiomas utilizan el mismo aparato conceptual, parece intuitivamenfe razonable considerar que se trata de axiomatizaciones diferentes de una misma teoría, esto es, que no hay ningún sentido interesante en que quepa hablar de dos teorías. Si eso es así entonces una teoría no puede ser un conjunto de axiomas, no se representa metateóricamente de forma satisfactoria identificándola con un conjunto tal. Se dirá que eso es ser demasiado rigurosos, poco caritativos con la concepción clásica. Después de todo, ya se reconocía que si dos axiomatizaciones diferentes coinciden en el conjunto de sus teoremas, se trata en cierto sentido, no de dos teorías diferentes equivalentes sino de dos axiomatizaciones equivalentes de la misma teoría. El problema es que la caracterización de las teorías que hace esa concepción no es el mejor modo de expresar ese cierto sentido, no puede expresarlo satisfactoriamente. Quizá se piense que sí, pues en muchas presentaciones de la concepción clásica se dice que una teoría es el conjunto de afirmaciones primitivas más todas sus consecitencias. Pero, si se mantiene un papel esencial para los axiomas, eso no resuelve el problema. Incluso si incluimos la referencia explícita a las consecuencias. dos conjuntos diferentes de axiomas-junto-consus-consecuenqias (e.e. <A, Con@)> y o l f , Con(Af)>)siguen siendo entidades diferentes aunque las consecuencias sean las mismas, pues simplemente los conjuntos de axiomas son diferentes. La única posibilidad es prescindir totalmente, en la individualización de las teorías, de la referencia a los axiomas, identificando la teoría simplemente con el conjunto de las consecuencias. Las teorías serían nombradas por expresiones del tipo 'el conjunto de enunciados consecuencias de A,, ..., A,', y dos nombres diferentes, que mencionan distintos axiomas, pueden ser nombres de la misma teoría. En este caso la referencia a los axiomas sólo se incluye entonces en el nombre de la teoría, pero en la teoría misma, esto es en la identidad del conjunto infinito de enunciados, no desempeñan ningún papel. Sin embargo, así planteada, esta opción se compadece mal, como veremos, con el nriomaticismo que inspiraba a la Concepción Heredada. En parte, la concepción semántica consiste en expresar el núcleo de esta idea de un modo adecuado, un modo que no hace desempeñar a los enunciados un papel esencial en la identidad de las teorías. Nótese que el problema con la Concepción Heredada no es que quiera sostener una idea que nos parece inadecuada, no es que pretenda que dos teorías con el mismo vocabulario que "digan lo mismo" sean diferentes; el problema es que en su versión sintáctico-axiomática expresa inadecuadamente una intuición correcta, a saber: que en tales casos se trata de una única teoría. El modo en que la concepción semántica va expresar las intuiciones contenidas ya en la Concepción Heredada surge de tomarse en serio el hecho de que dos axiomatizaciones diferentes p e d i n serlo de la misma teoría,¿Por qué lo son de la misma teoría? Porque el conjunto total de las cosas que dicen de cierta parcela del mundo es el mismo, porque la manera en que según ambas dicha parcela se comporta es la misma. Lo que importa de una teoría, lo que la identifica, es lo que dice sobre el comportamiento de determinada parcela de la realidad, no cómo lo dice. Lo esencial es que caracteriza ciertos trozos de la realidad como comportándose de cierto modo. Esto es, que determina ciertos modelos. Si dos axiomatízaciones lo son de lo mismo, lo son porque ambas detemiinan la misma clase
330
RINDAbIESiOS DE FILOSOF~ADE LA CIENCIA
-
de modelos o realizaciones. Lo importante es pues qué modelos determina una teoría, no '+ los recursos lingüísti,cos que empl6a para ello. *B+B~T ePIema de la concepcyón selma&: *presentaruna teoría es presentar una clase de m68&03, no de axiomas. ' Se dirá que no es necesario recurrir a los modelos, que apelando sólo al conjunto total de las consecuencias de los axiomas tenemos una vía "sintáctica" equivalente; en lugar de 'la clase de modelos que satisfacen A,, ..., A,' podemos usar igualmente 'el conjunto de enuncjados consecuencias de Al, ..., A,' pues nombran entidades biunívocamente relacionadas, a cada conjunto de modelos tales le corresponde un conjunto de enunciados tales, y viceversa. Pero usar la versión de las consecuencias nos mantiene en el plano sintáctico sólo aparentemente; ésta es la razón por la que hemos indicado que esta opción se compadece mal con el espíritu sintacticista propio de la Concepción Heredada. La clave es que apelar a las consecuencias es apelar implícitamente a los modelos, la noción de consecuencia introduce subrepticiamente la de modelo: un enunciado es consecuencia de otros si todos los modelos de éstos son modelos de aquél. Por tanto, si queremos expresar la idea de que mediante axiomas diferentes podemos capturar la misma teoría, debemos hacer necesariamente referencia, explícita o implícitamente, a los modelos. Si es así, lo mejor y más clarificador es hacerlo desde el comienzo: una teoría se caracteriza por determinar una clase de modelos, y su identidad está vinculada a tal clase. Es importante comprender que esta opción no supone, ni pretende, prescindir de los enunciados o, en general, de las formulaciones lingüísticas; no pretende que los recursos lingüísticos son superfluos para la caracterización metateórica de las teorías. Por supuesto que para determinar o definir una clase de modelos hace falta un Ienguaje. Los modelos, en la medida en que en el análisis metateórico se determinen explícita y precisamente, se determinan dando una serie de axiomas, principios o leyes, esto es, mediante enunciados. Nadie pretende negar tal cosa. Lo único que se pretende es que los conceptos relativos a modelos son más provechosos para el análisis filosófico de las teorías científicas, de su naturaleza y funcionamiento, que los relativos a enunciados. Que la naturaleza, función y estructura de las teorías se comprende mejor cuando su caracterización, análisis o reconst~cciónmetateórica se centra en los modelos que determina, no en un particular conjunto de axiomas o recursos lingüísticos mediante los que lo hace. Efectivamente la determinación de los modelos se realiza mediante una serie de axiomas, pero la identidad de la teona no depende de esa formulación lingüística específica. Si se quiere, las formulaciones lingüísticas son esenciales en el sentido (trivial) de ser el medio necesario para la determinación de los modelos, pero en un sentido verdaderamente importante no lo son, pues nada en la identidad de una teoría depende de que la formulación lingüística sea una u otra. Resumiendo: "De acuerdo con la concepción semántica, presentar una teoría es presentar una familia de modelos. Esta familia puede ser descrita de varios modos, mediante enunciados diferentes en lenguajes diferentes, y ninguna formulación lingüística tiene ningún estatuto privilegiado. Específicamente, no se atribuye ninguna importancia a la axiomatización como tal, e incluso la teoría puede no ser axiomatizable en ningún gentido no trivial" (van Fraassen, 1989, p. 188). El enfoque semántico, que enfatiza la referencia explícita a los modelos, más que a 10s enunciados, puede parecer una mera revisión del enfoque sintáctico propio de la S,,
Concepción Heredada. Es efectivamente una revisión, pues pretende expresar más adecuadamente una idea ya contenida en la concepción anterior, aunque insatisfactoriamente expresada. Pero no es una mera revisión si con ello se quiere sugerir que se trata de una revisión sin importancia. En cuanto conceptualización más satisfactoria de una idea esencialmente correcta pero insatisfactoriamente conceptualizada con anterioridad, ejempIifica el tipo d e progreso al que se puede aspirar en filosofía. Esta reconceptua\ización genera inmediatamente otras subsidiarias vinculadas a la idea central, lo que permite reorientar algunos problemas que más dificultades habían planteado a la Concepción Heredada. Uno de ellos será el relativo a la vinculación de los conceptos teóricos con la experiencia. Como se recordará, la Concepción Heredada sostiene que ese vínculo se establece a través de enunciados, las reglas de correspondencia, que conectan términos teóricos con términos que, pretendidamente, refieren a entidades directamente observables. Esta cuestión había suscitado todo tipo de problemas y, como vimos, el propio Hempel acaba rechazando la idea de que el vehículo de conexión empírica sea lingüístico. En la perspectiva sintacticista clásica pocas alternativas quedan. Veremos que la referencia a los modelos, característica de la concepción semántica, va a permitir dar una nueva orientación a esta cuestión.
En el parágrafo anterior hemos visto la motivación y justificación del cambio de estrategia que caracteriza a las concepciones semánticas. En cuanto al desarrollo de esta estrategia, cada miembro de la familia lo hace de un modo específico, no sólo técnicamente sino que también difieren en cuestiones filosóficas fundamentales. No comparten pues una serie de tesis filosóficas sus tan ti va^^ sino un modo y un marco en el que plantear los problemas filosóficos. Lo mismo ocurre en el seno de la Concepción Heredada, donde el acuerdo general sobre el enfoque axiomático es compatible con diferencias radicales en temas filosóficos sustantivos, como el del realismo, la explicación o la causalidad. A pesar de sus diferencias, las diversas caracterizaciones de la noción de teoría que se hacen dentro de la familia semántica tienen algunos elementos comunes: 1. Una teoría se caracteriza en primer lugar, como hemos visto, por determinar un conjunto de modelos; presentar-identificar una teoría es presentar-identificar la familia de sus modeIos. La determinación de los modelos se realiza mediante una serie de principios o leyes. Las leyes se deben entender, por tanto, como definiendo una clase de modelos: "x es un sistema ... [un modelo de la teoría - ] s y s s q(.r)", ~ ~ ~ donde <p expresa las leyes en cuestión. Que esto sea una definición, que las leyes definan los modelos, no significa por supuesto que una teoría sea una definición, o que vaya a ser verdadera por definición, o cosas parecidas. Que las leyes definen una serie de modelos significa sólo que las leyes determinan qué entidades son las que se comportan de acuerdo con la teoría; por ejemplo, cierta entidad, cierto pedazo del mundo, es "por definición" un sistema mecánico si y sólo si cumple tales y cuales principios.
2. Una teona no sólo determina, a través de sus leyes, una clase de niodelos. Si sólo hiciera eso, poco tendríamos. Ya sabemos. por ejemplo, qué es en abstracto un sistema mecánico. ¿Qué hacemos sólo con ello? Nada. Definimos los sistemas mecánicos para algo más,quizá p.ej. para explicar el comportamiento del par de objetos Tierra-Luna. Una teoría determina una clase de modelos para algo, para dar cuenta de ciertos datos, fenómenos o experiencias correspondientes a determinado ámbito de la realidad. Parte de la identificación de la teoría consiste entonces en la identificación de esos fenómenos empíricos de los que pretende dar cuenta. 3. Una vez identificados los modelos teóricos abstractos y los fenómenos empíricos de los que se pretende dar cuenta, tenemos lo esencial de la teoría. Lo que hace la teoría es definir los modelos con la pretensión de que representan adecuadamente los fenómenos, esto es, con la pretensión de que los sistemas que constituyen los fenómenos de que queremos dar cuenta están entre los modelos de la teoría; en términos tradicionales, que tales fenómenos concretos satisfacen las leyes de la teoría, que ellos se comportan como las leyes dicen. Esta pretensión se hace explícita mediante un acto lingüístico o proposicional, mediante una afin?zación,la afirmación o aserción "empírica" de la teoría. La aserción empírica afirma que entre los sistemas empíncos reales de que queremos dar cuenta y los modelos determinados por las leyes se da cierta relación. Esta relación puede ser de diversos tipos, más fuertes o más débiles, según las diferentes versiones. Puede ser la identidad, e.e. que los sistemas empíncos son literalmente algunos de los modelos; o la aproximación, e.e., que los sistemas empíncos se aproximan (en un sentido que hay que precisar) a los modelos; o de subsunción, e.e., que los sistemas empíricos son subsumibles (en un sentido que hay que precisar) bajo los modelos. Pero más allá de los detalles, importantes como veremos, lo esencial es que expresa la pretensión de que nuestra teoría representa adecuadamente la realidad, esto es, que nuestros modelos se "aplican bien" a los sistemas a explicar. Así es cómo la teoría dice cómo es el mundo, esos pedazos del mundo de que quiere dar cuenta en su ámbito de aplicación específico. Dice que el mundo es de cierto modo al afirmar que ciertos sistemas empíricos específicos son (o se aproximan a, o se subsumen bajo) modelos de los que ella ha definido; "el mundo", los sistemas empíricos, se comporta de "ese" modo. Es importante enfatizar el hecho de que esta afirmación simplemente hace explícita una pretensión ya contenida implícitamente en el par "<modelos definidos, fenómenos>". Es importante para no confundirse en cuestiones importantes, como la contrastación. Algunos representantes de la concepción semántica tienden a identificar las teorías con la aserción empírica (o a incluir la aserción en la identidad de la teoría).' Pero, como se verá, hay buenos motivos para no identificar una teoría con su aserción empírica. Hacer eso oscurece la naturaleza estructuralmente muy compleja d e las teorías, complejidad que es preciso que se refleje claramente en la noción de teoría para dar cuenta de algunos hechos fundamentales, entre otros los enfatizados por los historicistas. Es más adecuado, 1. No se piense que por eso se destierran de la familia semántica, pues siguen pensando que el mejor modo de describir esa entidad es en iérrninos de modelos y sus relaciones.
t
i
1 F
por tanto, identificar las teorías con esos pares de conjuntos de modelos (en realidad, como veremos, con secuencias un poco más complejas de conjuntos de modelos). Así identificadas, es obvio entonces que, en un sentido estricto, las teorías no son entidades susceptibles de ser verdaderas o falsas, pues un par (una secuencia) no es una entidad a la que quepa atribuir con sentido ~&*~redicados verdadero y falso. Es cieno pues que, si las identificamos de ese modo, estrictamente las teorías no son verdaderas ni falsas. Pero nada filosóficamente sustantivo se deriva sólo de ello. Las teorías, esos pares, llevan biunívocamente asociadas entidades que sí son susceptibles de ser verdaderas o falsas, a saber, sus aserciones empíricas. Por tanto, aunque no cabe atribuir primariamente valores veritativos a las teorías, sí cabe atribuírselos deifvativarnente: una teoría es "derivativamente verdadera" si y sólo si su aserción empírica es verdadera. Y este sentido derivativo es suficientemente importante desde el punto de vista filosófico. Insistir en que las teorías deben ser, o incluir esencialmente, aserciones puesto que decimos que son verdaderas o falsas, no es un argumento suficiente si hay buenas razones para no identificarlas de ese modo. Pero del hecho de que no se identifiquen con entidades proposicionales no se pueden extraer conclusiones apresuradas sobre problemas filosóficos sustantivos relativos a la "verdad" de las teorías. Por ejemplo (como veremos más adelante en detalle, cap. 12, 5 3 , si hay cierto sentido interesante en el que las teorías no son falsables, no es porque no sean entidades a las que no cabe atribuir los predicados verdadero o falso. No cabe atribuírselo primariamente, pero sí derivativamente y con ello es suficiente para el sentido importante de falsar: si la aserción es falsa la teoría queda "falsada" en el sentido de que no todo puede permanecer igual. Si no son falsables será, como veremos, porque entendemos entonces por teoría sólo la parte esencial, el núcleo lakatosiano que siempre se puede mantener indemne a costa de suficientes reformas en la parte accidental, el cinturón protector de hipótesis específicas. Una última advertencia antes de ver algunas de lds versiones de la familia semántica. Al caracterizar los elementos generales compartidos de esta familia hemos hecho constante y central referencia a los modelos. En la sección 2 del capítulo 8 presentamos la noción intuitiva informal de modelo y una de sus posibles precisiones, la que se establece en la teoría formal de modelos. Debe quedar claro que cuando hemos hablado aquí de modelos nos referíamos a la noción informal. Las diversas versiones de la concepción semántica discrepan, entre otras cosas, en la naturaleza precisa de esas entidades a las que denominan modelos y cuya determinación identifica una teoría. Para Suppes y la concepción estructuralista, se trata de modelos en el sentido genirico de la teoría de modelos, para van Fraassen y Suppe son lo que se denomina espacios de estado, para Giere son modelos en cualquier sentido informal aceptable del término.
2. La noción de teoría de Suppes Patrick Suppes es el primero en criticar la práctica general de la Concepción Heredada de identificar las teorías con determinadas formulaciones lingüísticas. En pleno
apogeo de la Concepción Heredada y de su enfoque sintáctico-axiomático, Suppes plantea ya en los años cincuenta las principales objeciones que, como acabamos de ver, se ]e pueden hacer. Como alternativa a la axiomatización clásica desarrolla un programa alternativo de axiomatización de teorías científicas con el que se inaugura el enfoque semántico. Su propuesta es desarrollada por él mismo y algunos de sus discípulos de Stanford (cf. McKinsey, Sugar y Suppes 1953, Suppes 1954, 1957, cap. 12, 1960, 1967 y 1970b y Adams 1959); en este desarrollo E. Adams tiene, como veremos, una posición especialmente destacada al contribuir con una modificación esencial a la propuesta original de Suppes. Durante cierto tiempo, sin embargo, ese nuevo enfoque no recibe general atención y queda reducido a la llamada escirela de Stanford. Es a finales de los sesenta y principalmente durante los setenta, una vez superados los momentos más radicales de la revuelta historicista de los años sesenta, cuando la propuesta modelista iniciada por Suppes se extiende entre la comunidad metacientífica y es aceptada en sus aspectos más generales. El nuevo procedimiento de axiomatización consiste en la introducción de lo que Suppes llama un predicado cotljirtzrista: "axiomatizar una teoría es definir un predicado conjuntista" (1970b, p. 2/25). En esencia, un predicado tal es una manera específica de definir una clase de modelos. En este caso, tal manera se caracteriza básicamente por entender los modelos en el sentido técnico de la teoría de modelos, como sistemas o estructuras constituidas por una serie de dominios básicos y relaciones y funciones construidos sobre ellos. El recurso formal que se utiliza para definir la clase de modelos es entonces el lenguaje semiformal de la teoría intuitiva de conjuntos, completado con todos los recursos matemáticos necesarios propios de la teoría que se está axiomatizando; por ejemplo, para la mecánica clásica se usan en la axiomatización conceptos del análisis. El lema de Suppes es: el instrumento para axiomatizar las teorías científicas no es la metamatemática sino la matemática. En esta propuesta hay que distinguir dos contribuciones, ambas importantes pero diferentes. Una es la propuesta de caracterizar una teoría definiendo una clase de modelos. Otra es la precisión de la noción de modelo en términos de secuencias de entidades conjuntistas de cierto tipo y la estrategia vinculada de determinar los modelos mediante el lenguaje conjuntista adecuadamente enriquecido. La primera es más general que la segunda, se puede concordar con Suppes en el enfoque modelista general pero discrepar en el desarrollo específico del mismo; de hecho eso es lo que hacen algunos miembros de la familia semántica. Eso no quiere decir que la segunda contribución no sea importante. Para Suppes, y para los que le siguen también en esto, la técnica conjuntista es mucho más dúctil y manejable que la clásica, permitiendo reconstruir efectivamente teorías interesantes de la ciencia real. En la perspectiva clásica, el recurso formal para la axiomatización es exclusivamente la lógica de primer orden, por lo que, si observamos estrictamente tal constricción, la axiomatización de una teoría física matematizada contiene como parte la axiomatización de toda la matemática que presupone, algo que distaba mucho de estar realizado, incluso de ser prácticamente realizable. Por ello, los ejemplos de axiomatizaciones que se manejan casi siempre en la Concepción Heredada son maquetas muy simples y poco interesantes, que no se corresponden con teorías científicas usadas realmente por los científicos.
Un predicado teórico conjuntista es un predicado del tipo "x es un sistema syssdef<P(x)>'donde <p especifica:
a ) Las entidades que componen .Y, esto es, que x es una estructura o secuencia de conjuntos y relaciones y funciones sobre ellos. b) (i) Los tipos lógicos de las entidades componentes de x, esto es, si se trata de dominios de objetos, de relaciones o de funciones; (ii) su constitución relativa, esto es, los dominios y contradominios de relaciones y funciones; y (iii) sus propiedades matemáticas más generales, como que ciertos conjuntos son finitos, o infinitos numerables, o que cierta función es continua, etc. Los axiomas mediante los que se hacen estas caracterizaciones son meras tipificaciones, son por tanto axiomas su¿ generis, o como diremos después, axiomas impropios. Los axiomas impropios no imponen constricciones efectivas a las estructuras, simplemente nos dicen de qui tipo de entidades están constituidas, qué propiedades matemáticas tienen y cuáles son las relaciones lógicas de constitución entre ellas. c) Condiciones restrictivas no puramente constitutivas o lógicas. Esto es, se trata de axiomas en sentido propio que tienen un efecto constrictivo. A las estructuras que satisfacen las condiciones definicionales de b) se les impone ahora como condiciones adicionales las leyes, en sentido tradicional, de la teoría. Son efectivamente restrictivas porque las cumplirán sólo algunas de las estructuras especificadas en b), otras no. Muchas veces tendrán la forma de relaciones entre varias de las entidades; por ejemplo, si en la estructura hay dos operaciones, uno de estos axiomas propios puede exigir que una sea distributiva respecto de la otra. Pero a veces pueden afectar a un solo componente; por ejemplo, se puede exigir que cierta operación sea asociativa. Para fijar las ideas, reproducimos como ejemplo la definición del predicado "x es un sistema de mecánica de partículas" (cf. Suppes, 1957, cap. 12, parcialmente modificado en Adams, 1959; Iri presente es una versión mixta, con algunas simplificaciones notacionales que suponen algunas deficiencias técnicas, sobre todo en (8), pero es suficiente para los actuales fines ilustrativos). Definición 1O. 1:
x es un sistema de mecánica (neit.toniana) de partículas syssd,f existen P. T, S, m, f tales que: (1) x = < P , T,s,m,f> (2) P es un conjunto finito no vacío. (3) T es un intervalo de números reales. (4) S es una función de P x T e n el conjunto de vectores tridimensionales (tríos ordenados) de números reales, y es dos veces diferenciable sobre T. (5) m es una función de P en el conjunto de números reales tal que para todo p E P: m@) > 0. (6) f es una función de P x T x N en el conjunto de vectores tridimensionales (tríos ordenados) de números reales.
FUND.4XIE5TOS DE FILOSOF~A DE LA CIENCIA
(N es el conjunto-ayuda de números naturales, que marca con U i i índice ]af para cada p y t ; podríamos escribir '$(p. 1)' en lugar de t, i)'). f(P,t, i). (7) Para todo p e P y r E T: r 7 t @ ) - &/dr2[s@,r)] = (8) Para todo p E P, q E P y t E T: (9 fl;p, t . i,) = -Aq. t. j,) (ii) S@, r) @j7p,r, i,) = -s(q,r) @Jq, r, j,). (Aclaración notacional: indicamos mediante 'i, que la f que tiene como uno de sus argumentos dicho índice "se debe a q", así 'fip,r.i,)' denota el valor de f sobre p en t "debido a q", e.e., la fuerza que ejerce q sobrep; '@' denota el producto vectorial.)
'a,
(1) presenta (el número de) los constituyentes de las estructuras. (2)-(6) son los axiomas impropios, meras tipificaciones lógico-matemáticas de las entidades que constituyen la estructura. La idea es que P es un conjunto específico de partículas: en una estructura x determinada ese conjunto contiene sólo la Tierra y la Luna; en otra, el Sol y los planetas; en otra, la Tierra y un péndulo; en otra la Tierra y dos objetos en una polea; etc. T es un conjunto de instantes temporales. s es la función posición, que asizna a cada partícula del sistema un determinado vector-posición en cada instante; es dos veces diferenciable respecto del tiempo, su primera derivada es la velocidad y su segunda derivada es la aceleración. 171 es la función masa, que asigna a cada partícula un número real positivo, su masa (que es independiente del tiempo). f es la función fuerza, que asigna a cada partícula en cada instante una serie de vectores-fuerza, las fuerzas actuantes sobre la partícula en ese instante; en vez de tener varias funciones, tenemos una única función que tiene como argumentos, además de partículas e instantes, ciertos índices que distinguen los diferentes \lectores-fuerza actuantes sobre p en r; así, f(p, t, i) = (Y,,x2, x3> y 0, t, j ) = <y,, F.y3> (i f j ) son los valores de dcs fuerzas diferentes actuantes sobre la partícula p en el instante t. (7) y (8) son los axiomas propios, expresan las leyes propiamente dichas de esta teoría. (7) expresa el segundo principio de Newton: la suma (vectorial) de las fuerzas actuantes sobre una partícula en un instante es igual a la variación de cantidad de movimiento, o como se suele decir, al producto de la masa de la partícula por su vector-aceleración en ese instante. (8) expresa (con ciertas deficiencias técnicas) el principio de acción y reacción: las fuerzas que se ejercen mutuamente dos partículas son de igual módulo y dirección y de sentidos contrarios. Éste es un ejemplo típico de la axiomatización suppesiana de una teoría mediante la definición de un predicado conjuntista. Debe quedar claro que lo que se hace es, como habíamos anunciado, definir cierta clase de modelos. Las estructuras que satisfacen (1)-(8) son, por dejiizición,sistemas mecánicos newtonianos. Presentar la mecánica newtoniana es presentar (definir) esa clase de modelos. Debe quedar claro también que esos modelos están sometidos a, son caracterizados a través de, algunas condiciones efectivamente restrictivas. Las condiciones (1)-(6), meras tipificaciones, determinan simplemente el tipo lógico-matemático de las entidades que constituyen los sistemas. Las entidades de ese tipo lógico, que satisfacen (1)-(6), son, por decirlo así, candidatos a ser modelos de la teoría; esto es, entidades de las que tiene sentido plantearse si se comportan del modo que dice la teoría, si cumplen las leyes propiamente dichas. Si una estructura no tiene una función que
asigne a los elementos del dominio números reales, no tiene sentido preguntarse si cumple o no ei segundo principio de Newton, pues tal principio involucra funciones de ese tipo. A las estructuras que satisfacen las tipificaciones las llama Suppes realizncionesposibles (cf. 1960, pp. 287-289). Lo que debe quedar claro es que lo esencial de una teoría no son (sólo) sus posibles realizaciones, sino (principalmente) sus realizaciones efectivas o modelos en sentido propio. La teoría no sólo contiene tipificaciones, contiene condiciones adicionales que son restrictivas en el sentido de que algunas de las realizaciones posibles las cumplirán, pero otras no. No por tenzr el tipo de conjuntos y funciones que especifican (1)-(6) toda estructura va a satisfacer (7)-(8); puede ser que tenga ese tipo de entidades, pero que la suma de los vectores-fuerza para una partícula en un instante simplemente no dé el mismo resultado que el producto de su masa por su aceleración, por ejemplo que sea igual al producto de la masa por el cuadrado de la aceleración, o la raíz cuadrada del producto de la masa por la aceleración, o cualquier otra cosa (como ejercicio, el lector puede construir un ejemplo puramente numérico de sistema que cumpla (1)-(6) pero no (7)). Las realizaciones efectivas o modelos de una teoría son aquellas realizaciones posibles que además satisfacen los axiomas propios; el conjunto de modelos será por tanto en general un subconjunto propio del conjunto de realizaciones posibles.
3. Adams y las aplicaciones intencionales En la sección anterior hemos presentado lo esencial de la nueva caracterización que hace Suppes de las teorías científicas, debemos ver ahora brevemente la importante modificación que introduce su discípulo E. Adams. La modificación de Adams está destinada a subsanar lo que él considera una insuficiencia cmcial de la versión original de Suppes. La insuficiencia que Adams atribuye a la propzesta de Suppes tiene que ver con algo que hemos hecho al presentar el ejemplo y que Suppes mismo hace, y que sin embargo no es claro que se pueda hacer desde sus presupuestos. Una vez presentado el predicado conjuntista, hemos indicado cuál era la interpretación pretendida de las entidades componentes de los modelos, esto es, partículas físicas, sus masas, posiciones espaciales, fuerzas incidentes, etc. La cuestión es, ¿quién dice eso?, ¿cómo dice eso la teoría? Puede ocurrir que el predicado sea satisfecho por entidades que ontolópicamente nada tengan que ver con esas entidades pretendidas. Por ejemplo. que los ángeles, junto con su "cantidad de espíritu", sus "afinidades" o lo que sea, satisfagan esos axiomas. 0, por poner un ejemplo menos absurdo, esos axiomas son satisfechos de hecho por estructuras puramente matemáticas, esto es, estructuras cuyo conjunto P está constituido por números. En otras palabras, entre los modelos efectivos, no meramente entre las realizaciones posibles, sino entre las realizaciones efectivas que cumplen (7) y (8) además de (1)-(6), hay con seguridad sistemas puramente matemáticos (y quizá "angélicos" u otros de parecida rareza), sistemas de los que nopretende hablar la teoría. Parece claro que es esencial a una teoría empírica el que pretenda aplicarse sólo a algunos de sus modelos efectivos; en el ejemplo visto no se pensaron los principios newtonianos para sistemas puramente
(o angélicos). Pero si presentar una teoría consiste exclusivamente en presentar una clase de modelos definidos mediante la introducción de un predicado conjuntista (con axiomas impropios y propios), no se ve cómo se puede recoger ese hecho. La cuestión en juego es, como el lector habrá adivinado, la de la interpretación empírica. EI predicado conjuntista que define los modelos es un mero formalismo matemático abstracto carente de interpretación empírica, o mejor dicho compatible con interpretaciones muy diferentes, tanto empíricas como no empíricas. El conjunto de modelos que tal predicado determina incluye sistemas de la más variada constitución, tanto empíricos como matemáticos. Efectivamente, estamos de nuevo ante el viejo problen~ade la conexión del formalismo con la experiencia. Otro modo de presentar la objeción a Suppes es mostrar que su caracterización, sin elementos adicionales, no permite distinguir las teorías empíricas de las teorías matemáticas. Para Suppes eso no es un problema tan grave, pues piensa que en realidad la diferencia entre unas y otras no es siempre tan clara como se pretende, y que una ventaja de su enfoque es justamente que hace explícito ese hecho. Naturalmente Suppes no pretende negar que a veces hay una diferencia. Reconoce que hay casos en que es así y ofrece una vía para dar cuenta de ella. Sin embargo, Suppes no piensa que esa diferencia, cuando se da, haya de reflejarse en la estructura manifiesta de la teoría. La diferencia radica en que, en las teorías empíricas (matematizadas), la determinación-medición de algunas de (o todas) sus magnitudes vincula dicha magnitud con situaciones empíricas cualitativas que fundamentan la medición; por ejemplo, la función masa está ligada a procedimientos de comparación cualitativa mediante una balanza de brazos. Esas situaciones empíricas cualitativas sobre las que descansa en última instancia2 la medición son estudiadas por las llamadas reorías de la medición (metri:ación)fif~lzdamental (para estas y otras nociones relativas a la medición, cf. cap. 6). La interpretación empírica de una teoría se expresa entonces a través de los vínculos que guardan sus funciones métricas con las teorías de la medición fundamental. Por tanto, la interpretación empírica no se manifi esta "inmediatamente" en la caracterización-axiomatización de una teoría, sino sólo en la reconstrucción de sus vínculos interteóricos con las teorías d e la metrización fundamental. Adams plantea esencialmente la misma objeción que hemos presentado, pero de un modo que no se puede resolver apelando a la medición fundamental. La objeción de Adams es que si caracterizamos las teonas, como hace Suppes, exclusii,amelzfe mediante el conjunto de sus modelos o realizaciones efectivas, entonces no es posible hacer explícito el elemento veritativo o proposicional de las teorías; esto es, no es posible hacer explícito el sentido en que las teorías son verdaderas o falsas, o si se prefiere, correctas o incorrectas. El conjunto de modelos caracteriza cierto modo como pueden ser las cosas, el modo como son las cosas 2. En Última instancia porque, como vimos en el capítulo 6, algunas veces (la mayoría en realidad) la medición de una magnitud para cierto objeto usa simplemente otros valores. Eso es la medición indirecta. Pero, recuérdese, la medición indirecta no puede ser el único procedimiento de medición, pues los valores previamente disponibles se han tenido que medir con anterioridad, y así sucesivamente. Así, en algún lugar debe empezar la tarea, en algún momento asienamos números a las cosas sin usar números previamente disponibles. Esos son justamente los procedimientos de medición directa o fundamentales, sobre los que descansa en úlrim instancia toda medición, y a los que se refiere Suppes.
~ I N , ~ L ISS I SS C R ~ N IDE C OTEORIAS III
339
según la teoría. Pero ¿de qué cosas trata? La teoría guiere decir "así son las cosas". Pero ¿de
qué cosas dice ella que son asi?: ¿planetas?; iPén&ulos?, @aíses?, ¿ángeles?, ¿simples números? El "así" está expresado por el conjunto de modelos. Pero si eso es todo lo que tenemos, nos falta algo que exprese "las cosas" de las que se pretende que son de ese modo. Sin eso no podemos expresar esa pretensión de la teoría. Como vimos, esta pretensión es esencial a las teorías, pues éstas son ideadas para dar cuenta de parcelas específicas de la realidad. Y esra pretensión contiene el elemento proposicional de las teorías, pues se expresa mediante una afirmación susceptible de ser verdadera o falsa: verdadera si esas cosas son efectivamente así(si están entre los modelos), falsa si no lo son. Adams propone "abordar el concepto de verdad o corrección [...] a través de la noción de interpretación pretendida ['intended'] o AodeCo pretindido de la"&~i%a,[... que es] cualquier sistema del cual [...] se pretende que se ajusta a los axiomas. Hay siempre en general un enorme número de sistemas que satisfacen los axiomas de la teoría, pero en las teorías de la ciencia empírica, normalmente sólo unos pocos de ellos serán aplicaciones o modelos pretendidos" (1959, p. 258). Son modelos pretendidos de la mecánica newtoniana, por ejemplo, el sistema formado por la Tierra y la Luna, o el constituido por el Sol con los planetas, o un plano inclinado, o un proyectil sobre la Tierra, etc. La identificación o caracterización metateórica de una teoría debe incluir entonces, además del conjunto de modelos que satisfacen el predicado, un conjunto de aplicaciones, de sistemas físicos específicos, de "partes concretas de la realidad", de las que se pretende que se comportan como la teoría dice, esto es, de las que se pretende que están entre los modelos. Resumiendo: "Si la verdad y la falsedad han de ser definidas, hemos visto que se deben tener en cuenta dos aspectos de una teoría: primero, el aspecto formal que corresponde al predicado conjuntista definido mediante los axiomas, [... o mejor,] la extensión de dicho predicado, el conjunto de los sistemas que satisfacen los axiomas; y segundo, el aspecto aplicativo, que corresponde a1 conjunto de modelos pretendidos. Formalmente, una teoría T se caracterizará como un par ordenado de conjuntos T = cC,I> tal que C es el conjunto de todas las entidades que satisfacen los axiomas, e I es el'conjunto de modelos pretendidos" (ibid.). Como se ve, una teoría no es estrictamente una entidad de la que cabe predicar primariamente la verdad o la falsedad, pero en un sentido lato, derivativo, sí que es adecuado, y esencial, decir que puede ser verdadera o falsa: "La teoría es verdadera si y sólo si todos sus modelos pretendidos satisfacen sus axiomas, en caso contrario es falsa. Si T = <C,I>, entonces T es verdadera si y sólo si I está incluido en C' (ibid., pp. 259-260). ''1 C' expresa pues sucintamente la aserción o hipótesis empírica vinculada a la teoría, de la cual ésta hereda su valor veritativo. Ésta es la modificación esencia: con la que Adams contribuye al programa de Suppes. En la versión de Adams, esta modificación presenta sin embargo algunas dificultades. La más inmediata es que queda oscuro el modo en que se determinan las aplicaciones pretendidas y, con ello, la forma en que se contrasta la aserción empírica. Por supuesto que las aplicaciones no se "extraen" simpIemente de entre los modelos del conjunto C, pues entonces la aserción sería tautológica. Para que quede claro la naturaleza del problema es esencial distinguir dos sentidos de 'determinar las aplicaciones'. En un primer sentido significa ''seleccionarlas". La cuestión es entonces cómo se seleccionan los siste-
mas empíricos, las partes concretas de la realidad a la que se pretende aplicar ia teoría. E] único modo de responder a esta cuestión es apelando a las intenciones de la comunidad de cjentíficos: I es el conjunto de sistemas empíricos x tales que la comunidad científica cc pretende o i~tterztaaplicar T a x. Por ejemplo, en las fases iniciales de la Mecánica Clásica, los físicos pretendían que la teoría se aplicaba a cuerpos en caída libre, tiros parabólicos, trayectorias de cuerpos celestes, y muchas otras cosas, entre ellas los rayos de luz; la luz fue inicialmente una aplicación intencional de la mecánica (al menos de 10s partidarios de la teoría corpuscular, como el propio Newton), aplicación que terminó por excluirse del dominio de aplicaciones cuando se impuso la teoría ondulatoria rival. Simplemente, qut sistemas específicos están en I depende exclusivamente de las pretensiones o intenciones de 10s científicos (en un momento dado, cf. cap. 13). En un segundo sentido, 'determinar las aplicaciones' significa, una vez seleccionadas, "determinar sus parámetros", típicamente en los casos de teorías cuantitativas, determinar en cada aplicación los valores precisos de cada una de las magnitudes involucradas. Y aquí es donde aparece el problema, pues, si en la determinación de las aplicaciones, en la medición de los valores de las magnitudes del sistema-aplicación x del que se quiere contrastar si se ajusta o no a las leyes de T, se usaran las leyes de T, estaríamos ante un expediente autojustificativo. Esto es, si en la determinación de los hechos o base empírica de aplicación se usaran las leyes de la teoría, la aserción se autojustzj5caría. El problema con la caracterización de Adams es que no es lo suficientemente fina para abordar esta cuestión. Nótese que según Adams la aserción empírica es de la forma Z c C, y por tanto cada aplicación concreta x es un sistema del mismo tipo lógico que los modelos actuales, tienen los mismos componentes, las mismas funciones. Eso supone que determinar una aplicación seleccionada exige medir en dicho sistema los valores de todas las funciones de las que habla la teoría. Como veremos más adelante, si eso fuese efectivamente así, estaríamos irremisiblemente condenados al problema de la autojustificación, pues algunas de las funciones de las que habla la teoría no se pueden medir sin usar sus propias leyes. En la medida en que las teorías no son localmente autojustificativas, en esa misma medida el análisis de Adams es insatisfactorio, no puede ser que la contrastación de una teoría exija disponer en los sistemas-aplicación de los valores para todas las magnitudes de que habla la teoría. Veremos que una de las motivaciones por las que surge el estructuralismo en Sneed es precisamente caracterizar las aplicaciones pretendidas de un modo más adecuado que permita elucidar el carácter no autojustificativo de la aserción empírica. Antes de concluir con la escuela de Stanford, hay que señalar que el propio Suppes se plantea en cierto momento la cuestión de la aplicación empírica de las teorías empíricas desde una perspectiva que guarda algo de semejanza con el espíritu de la propuesta de Adams. En un trabajo de 1960 publicado dos años más tarde, 'Models of Data', defiende que lo que cuenta como datos para una teoría se presenta también en forma de modelos, los ?nodelosde datos. La diferencia entre las teorías empíricas y matemáticas es que en las primeras, y no en las segundas, los modelos de datos son de distinto tipo lógico que los modelos teóricos. Aunque no es totalmente explícito en este punto, parece que la diferencia de tipo lógico a que se refiere en el caso de teorías empíricas consiste en que los modelos de datos son subestructuras de los modelos teóricos. A juzgar por el ejemplo que
i
presenta, de este modo parece que se debe interpretar su afirmación de que "en la teoría [empírica] se usan nociones teóricas que no tienen un análogo directo observable en los datos experimentales" ($1). En su ejemplo, la teoría del aprendizaje Estes-Suppes (cf, Suppes y Estes, 19.59). los modelos de la teoría están constituidos por ciertas entidades, algunas consideradas observables y otras no; los modelos de datos están constituidos entonces por los constituyentes observables de los modelos teóricos, de modo que resultan ser subestructuras de aquéllos. Los modelos de datos, además, son definidos por sus propias teorías, y es a través de su conexión con estas teorías de datos como adquiere contenido empírico la primera. '*Lo que he intentado argüir es que se establece una jerarquía completa de modelos entre los modelos de la teoría básica y la base experimental completa. Más aún, para cada nivel de la jerarquía hay una teoría por derecho propio. A la teoría de cierto,nivel le es dado su significado empírico al hacer conexiones formales con la teoría de un nivel más bajo" ($3). La propuesta de Suppes está sólo esbozada en este artículo, y no llegó a desarrollarla en trabajos posteriores (de hecho, posteriormente parece contradecirla parcialmente, pues exige que los datos sean del mismo tipo lógico que los modelos teóricos, cf. Suppes 1989, p. 264). En esa versión es muy imprecisa, está poco articulada con el resto de su programa y contiene elementos problemáticos que no se tratan. Aunque puede encontrarse cierta semejanza de espíritu con las ideas de Adarns, sus modelos de datos no se corresponden exactamente con las aplicaciones pretendidas de Adams. Aquéllos son observacionales y plenamente determinables teóricamente (mediante otra teoría de bajo nivel); éstas se determinan intencionalmente y no tienen porqué ser plenamente observawcionaies, de hecho no lo pueden ser si deben tener el mismo tipo lógico que los modelos teóricos. Veremos que el análisis satisfactorio de la base empírica incorpora elementos de ambos.
4. La familia semanticista Como indicamos, el enfoque semántico inaugurado por Suppes se mantiene en principio circunscrito al ámbito dz su grupo en Stanford, pero a finales de los años sesenta comienza a expandirse y durante los setenta se va asentando poco a poco hasta convertirse en dominante a partir de los ochenta. Veremos ahora brevemente los elementos específicos de los representantes más destacados de este nuevo enfoque: van Fraassen, Suppe, Giere y la Concepción Estructuralista (para la escuela polaca, cf. Przelecki, 1969, y Wójcicki, 1977 y 1979; para la escuela italiana, cf. Dalla Chiara y Toraldo di Francia, 1973 y 1976). Aunque la implantación general se realiza bajo la influencia de los trabajos de Suppes, no todos los miembros de la familia están directamente influidos por él o le siguen en los aspectos específicos de su propuesta. Se trata más bien de que a la estela de la propuesta específica de Suppes se desarrollan una serie de otras propuestas que en muchos casos comparten con aquél sólo la orientación modelística. Comparten tan sólo una estrategia general y una preferencia por determinada forma. ia modelística, de presentar y analizar los problemas, pero, como también advertimos, no comparten tesis filosóficas sustantivas. Casi todos los miembros de esta familia realizan contribuciones importantes en
312
FCND.431E3TOS DE FILOSOFLADE LA CIENCIA
varios ámbitos de la filosofía de la ciencia, y algunas de ellas se presentan en detalle en otras partes de esta obra. En relación al tema que ahora nos ocupa, la estructura de las teorías, la concepción estructuralista es la que ha realizado un análisis más detallado de la estructura fina de las teorías, ejemplificando tal análisis con numerosas reconstrucciones de teorías específicas. Los otros miembros de la familia se limitan en este tema a presentar 10s aspectos más generales de su propuesta semántica particular, sin desarrdlar en detalle la estructura fina de las teorías. Yeremos aquí cuáles son esos aspectos más generales característicos de cada una de las propuestas y en la próxima sección presentaremos en detalle el análisis estructuralista.
4.1.
VANFRAASSEN: ESPACIOS DE ESTADO; BASE E ~ ~ P Í R I C Y A OBSERV4BILIDAD
L7an Fraassen coincide con Suppes en que el modo filosóficamente más iluminador de caracterizar una teoría es presentándola como definiendo una clase de modelos. Discrepa de él, sin embargo, en la naturaleza matemática de estas entidades. Frente a los modelos como estructuras conjuntistas de Suppes, van Fraassen opta por los modelos como "puntos" o "trayectorias" en un espacio de estados, idea cuya aplicación a las teorías físicas atribuye a Beth. Beth (cf. 1960) propone un análisis semántico de las mecánicas newtoniana y cuántica en términos de sistemas constituidos por estados gobernados por las ecuaciones mecánicas fundamentales. Van Fraassen desarrolla y generaliza esta idea a principios de los años setenta (cf. 1970 y 1972). Aunque los detalles son complicados y no podemos verlos aquí, el núcleo de la idea es el siguiente (van Fraassen advierte sobre las limitaciones para el caso de teorías físicas relativistas, pero no nos detendremos en ello). Un estado de un sistema está definido por los valores de ciertas magnitudes en cierto momento (cf. cap. 5, $1.3). Por ejemplo, un estado de un gas queda definido por los valores del volumen, la presión y la temperatura; se puede identificar por tanto con una triada ordenada <v, y , r> de números reales, donde cada componente es, respectivamente, el valor de la correspondiente magnitud. En mecánica, el estado de cada partícula en un instante lo determina su posición q = (q,, q,, q,) y su momento p = (p,,y,, p;); el estado se puede identificar con el séxtuplo ordenado <q,, q,. q,, p,. p.,,y,>. Los estados se identifican por tanto en general con puntos en un determinado sistema de coordenadas, de tantas dimensiones como componentes tengan los estados, tridimensional en el primer ejemplo, hexadimensional en el segundo. A cada tipo de sistema le corresponde entonces un esyacio de estados, el conjunto de todas las posibles n-secuencias (n es la dimensión del espacio) de valores; los estados posibles de los sistemas de ese tipo son pues los puntos de ese espacio. Lo que hacen los postulados y leyes de una teoría es imponer constricciones sobre las relaciones entre estados, permitiendo ciertas transiciones (leyes de sucesión) o coexistencias (leyes de coexistencia) entre estados y excluyendo otras (sobre las leyes de sucesión y coexistencia, cf. cap. 5, $1.3). Las transiciones se identifican con determinadas trayectorias en dicho espacio, y las coexistencias con regiones específicas del mismo. Las leyes de una teoría permiten ciertas trayectorias y regiones y excluyen otras; de entre todas
las trayectorias y regiones I(jgicat7rerzte posibles, la teoría determina sólo algunas de ellas, las nómicarrtente posibles. Así, el conjunto completo de puntos del espacio es el análogo al conjunto de realizaciones posibles de Suppes, y el subconjunto del mismo permitido por las leyes es el análogo al conjunto de realizaciones efectivas de Suppes. En ambos casos tenemos un espacio de modelos lógicalnente posibles en relación con el cual las leyes de la teoría determinan el subespacio de modelosfísicamente posibles. Como en Suppes, por tanto, la teoría define mediante las leyes una clase de modelos, pero ahora tales modelos son trayectorias o regiones permitidas en un espacio de estados de determinada dimensión. Esta diferencia en la caracterización de los modelos no tiene consecuencias filosóficas sustantivas. En concreto, la forma de antirrealismo que van Fraassen defiende, su llamado etnpirisrno constr~rctivo,no depende de las preferencias sobre la forma de los modelos. El empirismo constructivo es una tesis epistemológica acerca de qué creencias implica la aceptación de una teoría. En la defensa de esta tesis epistemológica, \.an Fraassen desarrolla toda una variedad de tesis, de orientación general también antirrealista, sobre muchas cuestiones filosóficas sustantivas, como la causalidad, la explicación, las leyes, la modalidad o la observabilidad (cf. especialmente 1980 y 1989). No es éste el lugar de revisarlas, ni siquiera someramente. Nos limitaremos para concluir a presentar la idea de base empírica sobre la que sostiene parte de su argumento general. "La parte 'pura' de la teoría define el tipo de sistemas a los cuales se aplica; las aserciones empíricas tendrán la forma de que cierto sistema empírico dado pertenece a tal clase" (1970, p. 3 11). En realidad la aserción no dice, como en Adams, exactamente que los sistemas empíricos pertenecen a dicha clase, que son algunos de los modelos, sino sólo que son "subsumibles". La diferencia radica en que los sistemas a los que se aplica la teoría son submodelos, subestructuras de los modelos determinados por las leyes consistentes en quedamos con la parte observacional de los modelos: "ciertas partes de los modelos [son] identificadas como subestrzrcturas empíricas, y esos [son] los candidatos para la representación de los fenómenos observables con los cuales la ciencia se puede confrontar en nuestra experiencia, [...] la adecuación empírica consiste en la subsumibilidad de esas partes en algún modelo único del mundo permitido por la teoría" (1989, pp. 227-228). Lo que hace la teoría es postular la existencia de ciertas entidades inobservables, "ocultas", cuya (supuesta) interacción con las entidades observables produce (pretendidamente) los efectos observables, los fenómenos. Parte de lo que la teoría sostiene es que esas subestructuras empíricas son subsumibles bajo uno de sus modelos, esto es, que se comportan del modo en que lo harían si el mundo fuese uno de sus modelos, con sus entidades ocultas interaccionando con las observacionaIes del modo específico indicado en las leyes. Ése es el contenido de la aserción empírica y si dicha aserción es verdadera decimos que la teoría es emnpíricamnente adecuada (que "salva los fenómenos"). Van Fraassen insiste en que eso es sólo parte de lo que la teoría dice, porque quiere defender que la teoría dice también algo más, dice que el mundo contiene tales y cuales entidades además de las observables: "Es claro que podemos discutir dos cuestiones separadas: ¿qué dice la teoría sobre cómo es el mundo? J ¿qué dice la teoría sobre cómo son los fenómenos? Puesto que los fenómenos son la parte observable del mundo, y es
344
FUNDASIENTOS DE F I L O S O F ~ DE~ L 4 CIENCIA
contingente que haya o no otras partes, se sigue que estas preguntas no son la misma" (1989, p. 191). Lo que quiere defender es que la teoría misi?za, y no sólo su aserción empírica, puede ser verdadera o falsa. Por eso insiste en que la teoría debe ser una entidad en cierto sentido proposicional, con valor veritativo y susceptible de ser o no creída. Hay un sentido débil en que la teoría puede ser verdadera o falsa, a saber, que su aserción es verdadera o falsa, que /a parte observacional del mrotdo es como dice la teoría. Pero hay un sentido más fuerte en que la teoría puede ser ~erdaderao falsa, a saber, es verdadera si y sólo si el ~nundoes como dice la teoría, esto es, si el mundo es rtrto de sus nod del os. En el primer sentido prefiere hablar, más que de verdad de la teoría, de adecuación emnpím-ica; sólo en el segundo sentido la teoría es propiamente iyerdadera. Este doble sentido se aplica también a las actitudes proposicionales que los sujetos epistémicos podemos tener hacia las teorías. Podemos creer sólo que la teoría es empíricamente adecuada, que su aserción empírica es verdadera; o podemos creer algo más.a saber, que la teoría misma, toda ella, es verdadera. En estos términos puede formular ahora van Fraassen su antirrealismo sucintamente. En su opinión, el realismo no es una tesis onrológica sobre lo que hay, sino una tesis epistemológica sobre lo que estamos justificados en creer que hay. Su antirrealismo sostiene que al aceptar una teoría estamos justificados sólo en creer en su adecuación empírica, no en su verdad. Aceptar una teoría nos compromete sólo a creer que lo que afirma de la parte observable del mundo es verdad, no a creer que lo que también afirma acerca de inobsemables es verdad. A esta posición antirrealista hacia lo inobservable la denomina van Fraassen emnpii-iano co~7strz~crivo: "Uso el adjetivo 'constructivo' para indicar mi concepción de que la actividad científica es una actividad de construcción y no de descubrimiento: construcción de modelos que deben ser adecuados a los fenómenos, y no descubrimiento de la verdad acercade lo inobsen~able"(1980, p. 5). Este antirrealismo es en opinión de van Fraassen la conclusión ineludible de dos premisas en su opinión irrechazables: a ) la tesis empirista según la cual la justificación de toda creencia empírica debe descansar en los fenómenos, en la experiencia, y b ) el hecho lógico de que puede haber teorías diferentes ii~coi?ipatiblesentre sí pero e~npíi-icameizte equivalemíres, con las mismas consecuencias contrastacionales (en esto consiste la iigradeterrni~zacióizde la teoría por la experiencia, sobre la que volveremos por extenso en el capítulo 12 dedicado al problema de la inducción). De b) se sigue que la creencia en una teoría frente a otra incompatible empíricamente equivalente no está basada en la experiencia y, por tanto, por a), no será una creencia justificada. En general, pues, sólo estamos justificados en creer en la adecuación empírica, no en la verdad de una teoría, de roda ella. Aunque no podemos discutir aquí a fondo este argumento, debe notarse que para que concluya lo que pretende van Fraassen ha de aceptarse una premisa implícita adicional. De a) y b ) se sigue que sólo estamos justificados en creer las afirmaciones que las teorías hacen sobre entidades "dadas en la experiencia", pero para concluir que sólo estamos justificados en creer las afirmaciones que las teorías hacen sobre entidades observables, hace falta la premisa adicional según la cual c ) la parte e~npíricade las teorías, su base de comzrrastacióiz, es siempre obsemvaciomial. El reto todavía pendiente es ofrecer una noción precisa y plausible de obseivabilidad que sustente c). Van Fraassen defiende un concepto antropocéntrico de
observable. Afirma que. en tanto que organismos biológicos, somos cierto tipo de mecanismos de medición o detección, que como tales tenemos ciertas limitaciones inherentes y "son estas limitaciones a las cuales refiere el 'able' de 'observable"' (1980, p. 17). Por ser antropocéntrico, este concepto no puede tener relevancia ontológica, para saber lo que hay, pero sí epistemolópica, para saber qué estamos justificados a creer que hay. Reconoce además que el concepto es hasta cierto punto vago. Por ejemplo, sostiene que las lunas de Júpiter son observables, pues los astronauta serían capaces de verlas directamente si se acercaran a ellas, pero que las partículas en una cámara de niebla no lo son, pues el juicio sobre su presencia incluye inferencias teóricas; pero entonces, ¿que decir de la observación con microscopio electrónico?, i y de una estrella lejana que quizá ya ha desaparecido? Pero antropocentrismo y vaguedad no son los problemas principales, pues son asumibles por sus tesis. Recuérdese que su tesis antirrealista es epistérnica, es una tesis acerca de lo que los humanos estamos justificados en creer que hay, y por eso no es objetable que su antirrealismo esté relativizado a nuestras capacidades epistémicas, esto es, que dependa de una noción antropomórfica de 'observable'. El problema principal es si se puede sostener que los sistemas empíricos que ejercen de datos en las teorías están constituidos por entidades observables en srr serztido de 'observable'. Él mismo reconoce que "la teoría no se confronta con datos brutos sino con modelos de datos, y la constmcción de estos datos es un proceso sofisticado y creativo" (1989, p. 229). De nuevo, como ocurría con la Concepción Heredada, incluso si en términos globales nuestro conocimiento se origina en situaciones observables en dicho sentido, hace falta un argumento adicional para establecer que la base empírica de cada teoría tiene esas características. Más bien parece que no siempre es así; en realidad casi nunca es así, o nunca si hablamos de teorías científicas mínimamente desarrolladas. Por seguir con su propio ejemplo: reconoce que las partículas no son observables en una cámara de niebla, que lo observable son los rastros en la niebla; afirma que los modelos de datos que ejercen de base empírica son partes, subestructuras, de los modelos de la teoría; pero, simplemente, sucede que los modelos de la mecánica cuántica no incluyen entre sus entidades cosas como rastros en la niebla. Si C) no es cierto, entonces para que su argumento concluya lo que pretende hay que reinterpretar a) de modo que se refiera a la observación: la justificación de toda creencia descarzsa en la "observación directa". Pero el problema ahora es con 'descansa'. Si es "descansa inmediatamente", entonces su antirrealismo se aplica también a la base empírica de contrastación cuando no sea directamente observable. Si es "descansa en última instancia", entonces hay que elaborar en detalle cuál es la relación entre la base empírica y la observación y qué se considera "en última instancia" Esto es esencial, pues dependiendo de qué aceptemos como "descansar en última instancia", vuelven a abrirse toda serie de estrategias a los realistas para recuperar la justificación de la creencia en las entidades "teóricas" postuladas por la teoría para dar cuenta de los modelos de datos de experiencia. En definitiva, el antirrealismo de van Fraassen parece, sin especificaciones adicionales, inestable: o se aplica también a la base de contrastación (cuando ésta no sea directamente observable), o no tiene por qué aplicarse a las entidades teóricas.
Suppe inicia su propio enfoque semántica en su tesis doctoral (cf. 1967) dedicada al significado y uso de los modelos en la ciencia, influido por los trabajos de von Neumann y Birkhoff sobre fundamentación de la mecánica cuántica y por los de Suppes sobre modeIos de datos. En dos trabajos clásicos sobre la Concepción Heredada, prácticamente ignorada en su tesis, contrasta los aspectos centrales de dicho enfoque con la concepción axiomática clásica (cf. 1972 y 1974), y durante finales de los años setenta y en los ochenta desarrolla su concepción aplicándola a los principales temas de la filosofía de la ciencia (cf. 1989). Suppe sigue a Suppes en la aproximación modeloteórica general pero, como van Fraassen, influido en su caso por los trabajos de von Neumann y Birkhoff, prefiere caracterizar los modelos mediante estados en un espacio de estados, no al modo conjuntista de Suppes. El instrumental matemático es prácticamente coincidente con el de van Fraassen y no abundaremos en él. Una teoría se analiza ahora como un sisteina relacional (cf. 1989 p. 84), consistente en a ) un dominio que contiene todos los estados lógicamente posibles de los sistemas de que trata la teoría (e.e. el espacio de estados entero) y b) una serie de relaciones entre los estados, determinadas por los postulados o leyes de la teoría, que especifican las trayectorias y regiones físicamente posibles. El sistema relaciona1 contiene lo que Suppe denomina sistenzas físicos cartsaline?zreposibles, que son los que hacen de modelos teóricos. Una teoría, entonces, determina, a través de alguna de sus formulaciones, una clase de tales sistemas, una clase de modelos. Para su identidad no es esencial la particular formulación sino la clase de modelos. Mediante la determinación de los sistemas físicos causalmente posibles, la teoría pretende dar cuenta de cierto ámbito de la experiencia, lo que Suppe llama el alcance pretendido ('inteizded scope'). Este ámbito de aplicación está constituido por sistemas físicos que ejercen de "datos duros" (' "lzard" darn') para la teoría. Pero los datos no son en ningún sentido relevante "observables3: "Las teorías tienen como su principal objeto los informes de datos duros, no informes de obsen~acióndirecta. [...] La necesidad de una dicotomía observacionaVteórico desaparece. La reemplaza la distinción entre datos duros aproblemáticos sobre sistemas físicos y condiciones de entorno y los más problemáticos asertos teóricos acerca de ellos" (1989, pp. 69, 71). Los datos son relarii~ameizteaproblemáticos en dos sentidos: primero, porque son aproblemáticos relatiimnente a una teoría, aquella teoría para la que son datos; segundo, porque, incluso para la teoría en cuestión, no son totalmente aproblemáticos, en caso de contrastación negativa pueden ser problematizados, esto es, revisados. Ello es posible porque los sistemas físicos que presentan los datos son réplicas altamente abstractas e idealizadas de los fenómenos. En la réplica se seleccionan sólo los parámetros del sistema relevantes para la teoría y se abstraen los demás, y los que se seleccionan se idealizan. Por ejemplo (ibid., p. 65), en la determinación del sistema-dato en un caso de caída libre en mecánica se prescinde de parámetros como el color, etc., y otros relevantes como la velocidad se seleccionan en condiciones ideales, como ausencia de rozamiento, masa puntual, etc. La determinación de los datos es pues un complejo proceso de elaboración a partir de los fenómenos, que involucra un gran
número de supuestos teóricos en la selección de los parámetros, su medición, la idealización, la determinación de las condiciones de entorno, etc. En ciertas circunstancias puede ser más adecuado revisar este proceso que los postulados teóricos. Quizá se piense que esta caracterización de los datos, obtenidos a partir de los fenómenos, abre la puerta trasera a la distinción que se ha abandonado, pues aunque los datos no serían observables, los fenómenos "de los que se extraen" sí lo serían. La distinción volvería a ser fundamental, sólo que un peldaño más abajo. Pero según Suppe no es así. Los fenómenos están constituidos por particulares que poseen ciertas propiedades y que están en ciertas relaciones, pero "estos particulares, sus propiedades y relaciones no necesitan ser observables" (ibid., p. 93). Así caracterizada, una teoría es empíricamente verdadera si los datos coinciden con los modelos de la teoría, si los sistemas físicos del alcance pretendido coinciden con los sistemas flsicos cairsaknente posibles determinados por la teoría, esto es, si en los sistemas de datos los valores de los atributos son los determinados por la teoría (quizá con ciertas idealizaciones). En realidad esa es una condición sólo necesaria, pues Suppe añade otra condición "antinominalista", que aquí sólo podemos presentar imprecisamente y sin comentario: los parámetros de los sistemas de datos corresponden a clases nat~rrales(cf. ibid., p. 98; sobre este concepto, cf. supm, cap. 5, $2). Suppe coincide con van Fraassen en que la aceptación de la teoría no supone aceptar su verdad, la verdad de toda ella. Pero no coincide con aquél en sus motivos. Esta diferencia es la que le permite defender, contra van Fraassen, lo que califica de cuasi-realismo. Las teorías, afirma, no dan descripciones literales de cómo funciona el mundo real, sólo pretenden describir cómo funcionaría el mundo si los parámetros seleccionados fuesen independientes de los desestimados. "Las teorías proporcionan descripciones contrafácticas de cómo sería el mundo si los parámetros desestimados no inflriyesen en los fenómenos que la teoría pretende describir. Pero típicamente los parámetros desestimados influyen al menos a veces en los fenómenos, y por tanto las caracterizaciones ofrecidas por las teorías no son literalmente verdaderas, sino como máximo contrafácticamente verdaderas, de los fenómenos de su alcance. Ésta es la postura cuasi-realista que he defendido" (ibid., pp. 316-349).
Giere desarrolla su propia versión de la concepción semántica en el marco de un programa metacientífico más amplio de análisis de los diversos elementos de la ciencia desde una perspectiva cognitiva (cf. especialmente 1988; también 1979, su libro de texto clásico sobre la argumentación científica, con nueva edición muy revisada en 1991). Desde esta perspectiva, propone considerar las teorías como medios para definir modelos abstractos de los que se postula su aplicación a ciertos sistemas reales. "Mi sugerencia preferida es que entendamos una teoría como compuesta de dos elementos: (1) una. población de modelos, y (2) varias hipótesis conectando esos modelos con sistemas en el mundo real" (1988, p. 85). Los modelos ahora no se caracterizan como entidades conjuntistas, ni mediante
espacios de estado, ni de ninguna otra forma específica. No se les atribuye una naturaleza matemática determinada. La noción de modelo teórico es aquí extremadamente amplia, son entidades abstractas definidas mediante ciertos recursos expresivos, generalmente, pero no necesariamente, lingüísticos (p.ej. se pueden usar grafos o croquis). A veces los modelos pueden ser "modelos a escala" físicamente construidos, como en el caso del modelo de doble hélice de M'atson y Crick para el ADN. Pero en general no son así y, lo que es más importante, en tanto que rnodelos teóricos no tienen por qué ser (no cuentan como) entidades físicas. "Un modelo teórico es parte de un mundo imaginado. No existe en ningún lugar excepto en las mentes de los científicos o como sujetos abstractos de las descripciones verbales que los científicos escriben" (1991, p. 26). Por ejemplo, si antes de ir a una fiesta nos "imaginamos" quién viene con quién, estamos determinando, definiendo, una entidad abstracta que es un modelo de (algunos aspectos de) la fiesta; otro ejemplo, el preferido por Giere, son los mapas. "Un modelo es por tanto, como en estos ejemplos, una entidad abstracta y estructurada que rtpresenta algo distinto. Los postulados, leyes y ecuaciones que aparecen en los textos científicos define~zestas entidades. La ecuación "md2sldS = - kr" define lo que es un oscilador armónico simple; la ecuación "md2sldP = - (mgll)~''define un tipo de oscilador armónico simple, el péndulo sin fricción. Osciladores, péndulos, son por tanto modelos definidos mediante esas ecuaciones, y en tanto que tales son "entidades socialtne~zreconstruidas [y] no tienen realidad más allá de la atribuida a ellas por la comunidad de físicos" (1988, p. 78). Una vez definidos los modelos teóricos, la teoría formula ciertas hipótesis teóricas. Una hipótesis teórica es un enunciado o proposición que afirma cierto tipo de relación entre un modelo y un sistema real determinado (o una clase de sistemas tales). Giere enfatiza que a diferencia de los modelos, las hipótesis teóricas sí son entidades lingüísticas (proposicionales), verdaderas o falsas. La relación que se afirma en la hipótesis teórica no es la de identidad, no se afirma que cierto sistema es el modelo; nótese que los sistemas son entidades físicas y los modelos no lo son, son entidades abstractas. La relación afirmada en la hipótesis es la de siitzilitud O selnejait~a.Pero toda relación de semejanza debe ser cualificada para ser mínimamente precisa. Debe relativizarse a determinados aspecros y, en ellos, a cierto grado. La forma general de la hipótesis teórica es pues la siguiente: "Tal sistema real identificable es similar al modelo designado en los aspectos y grados indicados" (ibid., p. 81). Es esencial notar que no todos los aspectos del sistema real se desean reflejar en el modelo. En el caso del modelo para nuestra fiesta, no nos interesa quizá el color de las ropas, o incluso la hora de llegada. Lo mismo ocurre en la ciencia, p.ej. en la mecánica no nos interesa el color de los objetos, o incluso a veces tampoco la forma ni el tamaño. Así, las hipótesis contenidas en los textos científicos formuladas en términos identificatorios expresan en realidad afirmaciones de similaridad. Cuando los físicos dicen "la Tierra y la Luna constituyen un sistema gravitacional newtoniano de dos partículas", lo que están afirmando es: "las posiciones y velocidades de la Tierra y la Luna en el sistema Tierra-Luna se aproximan mucho a las de un modelo newtoniano de dos partículas con fuerza central cuadrático-inversa". Giere desea enfatizar que, en su perspectiva, los enunciados contenidos en la formulación de la teoría no están en conexión directa con el mundo real, sino que se
conectan indirectamente con el mundo a través de los modelos. Los enunciados definen los modelos, y los modelos están directamente conectados con el mundo físico a través de la relación de similaridad. Esta relación de similaridad-en-ciertos-respectos-relevantes-yhasta-cierto-grado es expresada por la hipótesis teórica, que sí es una entidad lingüística. La relación puede darse o no darse; si se da la hipótesis, es verdadera, si no, es falsa. Podría pensarse que la abstracción, aproximación e idealización de la relación de similaridad se pueden reducir, hasta eventualmente eliminarse, mediante la definición de modelos más completos y precisos. Al aumentar los respectos relevantes, disminuye la idealización y se afina la aproximación. Por ejemplo, se puede definir un modelo para el oscilador armónico que incluya la fricción; este modelo incluye un nuevo aspecto para la relación de semejanza, es por tanto menos idealizado y puede aumentarse el grado de semejanza o aproximación a los valores del sistema real. Pero eso sólo reduce o estrecha la semejanza, por lo general no es posible convertirla en correspondencia exacta, en correspondencia entre el sistema y el modelo en todos los aspectos y con una precisión completa. Una consecuencia de este enfoque es, en opinión de Giere, que las teorías científicas son entidades que no están bien definidas. El motivo es que no está bien determinado, al menos no formalmente, cuáles son los modelos vinculados a una teoría específica, por ejemplo, quC cuenta propiamente como modelo newtoniano. En su opinión, todo lo que se puede decir es que los modelos de la mecánica comparten "un parecido de familia". Según Giere, este parecido es innegable, pero no consiste (sólo) en algo estructuralmente identificable en los modelos. Los modelos por sí solos no muestran en qué consiste dicho parecido. La única determinación posible es en términos sociolópicos: "Nada en la estructura de los modelos mismos puede determinar que el parecido es suficiente para pertenecer a la familia. Esta cuestión es decidida exclusivamente por los juicios de los miembros de la comunidad científica en un momento. Eso no quiere decir que haya un parecido objetivo susceptible de ser juzgado correcta o incorrectamente. Lo que quiere decir es que el conjunto de los juicios de los científicos determina si el parecido es suficiente. Éste es un aspecto en el que las teorías son no sólo construidas, sino además socialmente construidas" (ibid., p. 86). Giere defiende sobre estas bases cierto tipo de "realismo", que él denomina realismo constructivista, que tan sólo podemos enunciar aquí superficialmente. La ciencia tiene un aspecto esencialmente constructivo, la definición de los modelos, y modelos diferentes pueden ser representaciones alternativas de un mismo sistema físico. Hay modelos mejores que otros, pero eso no se puede especificar apeIando exclusivamente al mundo. Nada en el mundo mismo fija los aspectos a representar, ni cuán buena es la representación. La especificación debe apelar necesariamente a intereses humanos, y no sólo episrCmicos o científicos, sino también a intereses prácticos de diverso tipo. Eso supone una cierta dosis de relativismo, pero no es un relativismo radical: podemos circular por Nueva Iórk, mejor o peor, con dos mapas de Nueva York diferentes, pero no con uno de San Francisco. Este relativismo es compatible en su opinión con cierto realismo, en el sentido de que los modelos representan "hechos del mundo". Pero éste es un sentido muy impreciso asumible por los antirrealistas. Precisarlo requiere al menos dos cosas. Primero, caracterizar más finamente los sistemas físicos "del mundo" de los que se predica su similaridad con los
modelos, y lo que dice Giere al respecto sobre los datos es muy poco (cf. 1991. pp. 29-30). Segundo, imponer constricciones claras a la similaridad predicada que permitan, p.ej., decir por qué cierto mapa no es un mapa de Nueva York; jacaso un mapa de San Francisco no es similar a Nueva York en algwzos respectos? Si las únicas constricciones posibles apelan esencialmente a intereses o prácticas humanas, entonces difícilmente se puede calificar esta posición de realista.
La concepción estructuralista aúna y desarrolla de un modo específico dos tradiciones anteriores. De un lado, el programa Suppes-Adams de análisis y reconstrucción de teorías mediante el instrumental modeloteórico de la teoría informal de conjuntos. De otro, los trabajos de los historicistas, en especial de Kuhn y Lakatos, donde se analizan las teorías como entidades estructuralmente complejas y susceptibles de evolución, con un "núcleo" central inmutable y un "entorno" complementario cambiante. Ambos elementos se encuentran ya en The Logical Structure of Marlze~naricalPhysics (1971). Uno de los principales problemas de los historicistas es la vaguedad de sus nociones centrales, que consideraban casi siempre ineliminable. En esta obra, Sneed ofrece ya una primera precisión formal, todavía muy tosca, de esas ideas aplicando el aparato conjuntista de Suppes-Adams. La propuesta de Sneed la recoge Stegmüller (cf. 1973 y 1979), dando lugar a toda una serie de trabajos que desarrollan las diversas partes del programa y lo aplican a la reconstrucción de un considerable número de teorías científicas. Estos trabajos culminan parcialmente a mediados de los años ochenta con la publicación de An Architectonic for Scietzce, de Balzer. Moulines y Sneed, sumrna del programa que contiene sus principales elementos y algunas reconstrucciones de teorías. El programa estructuralista continúa su desarrollo en los años ochenta y noventa, tanto extendiéndose a nuevos ámbitos y problemas metacientíficos como aplicándose a la reconstrucción de nuevas teorías (Balzer y Moulines (eds.) 1996 y 1998 recogen, respectivamente, los principales resultados en ambas tareas). La concepción estructuralista es, dentro de la familia semántica, la que ofrece un análisis más detallado de la estructura fina de las teorías. En la próxima sección vamos a ver los principales elementos de dicho análisis con cierto detalle. Para concluir ésta avanzaremos tan sólo sus rasgos generales. a) Se rechaza la distinción "teórico/obsen~acional" y se sustituye por otra, "teóricolno teórico", relativizada a cada teoría. b) En términos de esa nueva distinción se caracteriza la base empírica y el dominio de aplicaciones pretendidas. Los datos están cargados de teoría pero no de la teoría para la que son datos. c ) Con esta nueva caracterización se da una formulación de la aserción empírica que claramente excluye la interpretación "autojustificativa" de la misma. d) Se identifican como nuevos elementos en la determinación de los modelos,
ademrís de las tradicionales leyes, otros menos manifiestos pero igualmente esenciales, las ligaduras o restricciones cmzadas. e ) Se identifican los vínculos entre los modelos de diversas teorías. f) Se caracteriza la estructura sincrónica de una teoría como una red con diversos componentes, unos más esenciales y permanentes y otros más específicos y cambiantes. La evolución de una teoría consiste en Ia sucesión de tales redes. g) Se analizan en términos modelísticos las tradicionales relaciones interteóricas de reducción y equivalencia.
5. La concepción estructuralista de las teorías Una teoría tiene, como en la versión de Adams del programa de Suppes, una parte formal y otra aplicativa. Pero ambas partes se articulan a su vez, como en Kuhn y Lakatos, en diversos niveles de especificidad. Esta idea de los diversos niveles de especificidad se expresa mediante la noción de red teórica, que describe en toda su riqueza la estructura sincrónica de las teorías, su imagen "congelada" en un momento dado de su evolución. Las redes están formadas por diversos elementos estratificados según su especificidad. Cada uno de estos elementos tiene una parte formal y otra aplicativa. La parte formal global de la teoría-red queda expresada por el conjunto de las partes formales de los eIementos constituyentes; su parte aplicativa global por el conjunto de las partes aplicativas de sus constituyentes. A estos elementos constituyentes se les denomina elementos teóricos. La parte formal de los elementos teóricos se denomina núcleo y su parte aplicativa, doininio de aplicaciones pretendidas (o intencionales).
El núcleo, al que denotamos mediante la letra 'K', expresa la parte formal de la teoría, las tradicionales leyes. Como en la familia semántica en general, las leyes no se expresan en términos lingüísticos sino modelísticos, entendiendo los modelos, siguiendo aquí a Suppes, como estructuras conjuntistas definidas mediante la introducción de cierto predicado. El núcleo K contiene entonces una serie de modelos, las estructuras que satisfacen los axiomas del predicado. Sin embargo, a diferencia de Suppes y Adams, para el estructuralismo no es adecuado identificar el núcleo con un único conjunto de modelos. Es conveniente que la expresión modelística de la parte formal de la teoría recoja y haga explícitos los diversos elementos distintivos; algunos de ellos ya están implícitos en la caracterización de Suppes, otros sin embargo son nuevos. Para referimos a ellos vamos a recurrir al ejemplo de Suppes de la mecánica de partículas presentado en la sección 2. Hay algunas diferencias técnicas y de matiz entre esa versión y la estándar en el estructuralismo, pero a los efectos actuales se pueden obviar. Tenga pues el lector de nuevo presente a partir de ahora aquella definición de los modelos de la mecánica.
352
FLih'DrZblEhTOS DE F I L O S O F ~DE LA CIENCIA
Modelos pote~~ciales y modelos actuales Ya vimos entonces que algunos de los axiomas del predicado conjuntista, en ese caso los axiomas (1)-(6), son meras caracterizaciones o tipificaciones de los modelos. ~Esos&ma~s3rnp~ogi~s'', s&8s;.d&dei.r eEk"amente entidades o modelos, pero sólo e1 tipo lógico-matemático de los &s&s, por lo que toda estructura de ese tipo será modelo de ellos, sin irnporrar qué pase después de szrstantivo o espec$co a sus cortstiluyenres. Los axiomas (7) y (8) no son así, imponen constricciones efectivas adicionales no meramente lógicas, expresan las leyes en sentido propio de las teorías. Eso significa que de todas las estructuras que satisfacen (1)-(6), sólo algunas satisfacen además (7) y (8). Llamaremos modelos potelzciales (de la teoría en cuestión), y denotaremos su conjunto mediante 'Mp', a las estructuras que satisfacen los axiomas impropios o tipificaciones, y inodelos actuales (de la teoría en cuestión), y denotaremos su conjunto mediante 'M'. a las estructuras que satisfacen además los axiomas propios que expresan constricciones no meramente lógicas. Los modelos potenciales son porel~cialesporque pltederz ser modelos efectivos de la teoría, porque son las entidades de las que tiene sentido preguntarse si satisfacen o no las leyes propiamente dichas. Aquellos modelos potenciales que, además de las tipificaciones, satisfacen las leyes propiamente dichas son los modelos actuales o efectivos; es inmediato, por tanto, que M cMp.
x E Mp(MC) syssd=jxsatisface (1)-(6) de Def. 10.1.
x E M(MC) syssdej,fxE Mp(MC) y x satisface (7)-(8) de Def. 10.1.
Es conveniente expresar esta diferencia incluyendo en el núcleo aillbos conjuntos de modeIos. En primer lugar, porque la diferencia expresa un hecho importante, a saber, la diferencia entre la parte meramente conceptualizadora de la teoría, Mp, y la parte efectivamente restrictiva, M. Pero además, porque los modelos actuales no constituyen la única constricción efectiva de la teoría. Hay otros elementos de la teoría, menos manifiestos, pero igualmente restrictivos, cuya expresión requiere también hacer referencia a los modelos potenciales. Es importante pues tener singularizados los modelos potenciales, el aparato conceptual de la teoría, con relación a los cuales se expresan diversos tipos de restricciones teóricas efectivas. De momento vamos a presentar una, en el último apartado veremos otra.
Condiciones de ligadura Las restricciones a que nos referimos son lo que el estructuralismo denomina ligaduras o restriccio~tescruzadas ('constraints'). La idea es que las leyes usuales no son las
únicas que imponen condiciones adicionales efectivas a los modelos potenciales. Si consideramos modelos sueltos, sí, pero si tenemos en cuenta varios modelos a la vez, no. Por ejemplo, según la mecánica clásica no puede ser que una partícula p tenga una masa en un modelo x y otra masa diferente en otro modelo y (por supuesto que la mecánica clásica permite los cambios de masa, por ejemplo "si se quita un trozo" a un objeto, pero se considera siempre que eso corresponde a la generación de otra partícula); por ejemplo, si cierto cohete está en el dominio de dos sistemas, uno el sistema Tierra-cohete y el otro el sistema Luna-cohete, en ambos modelos ha de tener la misma masa. Ésta no es la única constricción intermodélica. La teoría tampoco permite que si un modelo x contiene una partículap, (p.ej. conductor-más-coche), que es la combinación de dos partículas p2(conductor solo) y p3(coche solo), haya modelos que asignen a p2y p3 masas cuya suma no coincida con la asignada a p, en x. La primera condición expresa simplemente que la masa de una partícula es constante, y la segunda que la masa es aditiva, esto es, la masa de un compuesto es la suma de las masas de los componentes. Este tipo de condiciones inrennodélicas son las que permiten "transportar la información" de unos modelos a otros. Si tengo la masa del cohete en el modelo que forma con Ia Tierra, puedo calcular ciertos valores dinámicos de la Luna gracias a que exporto la información sobre la masa del cohete al modelo que forma con la Luna (cf. cap. 6, $6 sobre la trascendencia de estos hechos para la medición indirecta). Debe quedar claro que no hay manera de expresar este tipo de constricciones mediante los axiomas usuales, pues éstos se aplican a modelos sueltos. La condición que define la ligadura de identidad para la masa es la siguiente: "para toda partícula p, y modelos potenciales x, y (que tengan a p en su dominio): nz,@) = m,@)". Esta condición no es satisfecha o insatisfecha por modelos potenciales sueltos sino por grupos de ellos: si un conjunto tiene dos modelos con una partícula común a ambos dominios y en cada uno la función m asigna a esa partícula valores diferentes, no satisface la condición; si todos los modelos del conjunto asignan a las partículas comunes de sus dominios la misma masa, sí que la satisface. El efecto que tiene esta condición, por tanto. no es determinar un conjunto de modelos, sino uq conjunto de conjuntos de modelos: esto es, agrupa los modelos en grupos, grupos taIes que, en cada uno, sus modelos asipan a una misma partícula una misma masa; cada grupo se caracteriza porque en él los modelos asignan a cada partícula determinada masa. Una condición que es satisfecha o no por modelos sueltos define un conjunto de modelos, el conjunto de los modelos que la satisfacen; éste es el caso de los axiomas (7)-(8). Una condición que es satisfecha o no por conjuntos de modelos, define un conjunto de conjuntos de modelos, el conjunto de los conjuntos de modelos que la satisface. Éste es el caso de la ligadura de identidad para la masa. La condición define pues un ' ,.' conjunto de conjuntos de modelos potenciales, al que denotaremos mediante C Definición 10.4:
C =,(MC) = dLf { X c M p ( M C ) 1 Vs.? E X V p
E
P., n Py : m,(p) = n l , ( p ) } .
Debe estar claro que, mientras que M ( M C ) c Mp(XfC). C=,(MC) c Pot(hfp(MC)). Análogamente procede la condición de aditividad, que definz otro conjunto de conjuntos de
modelos. Ahora en cada uno de esos grupos la masa de una partícula compuesta es la suma de la masa de sus componentes, en cualesquiera modelos del grupo en que estén el compuesto o los componentes ('o' denota aquí la composición de partículas).
Estas dos ligaduras cuentan por tanto como constricciones efectivas adicionales de la teoría, que, a diferencia de las leyes usuales, no operan a nivel de modelos aislados sino de grupos de modelos, por eso se califican de restricciones cruzadas. Como en nuestro ejemplo, puede haber varias ligaduras en una misma teoría, y lo que interesa es tener identificado el efecto combinado de todas ellas. A este efecto combinado o suma de las ligaduras se la denomina ligadura global y se denota mediante 'GC'. Puesto que cada ligadura es determinado subconjunto {{xl, y,, z,, ...}, {x-, y,, ...), ....} de Pot(Mp), la ligadura global se identifica con su intersección conjuntista, pues los elementos de dicha intersección satisfarán a la vez todas las condiciones de ligadura.
Así, en general, si Cl, ..., C, son las n ligaduras de una teoría (Ci Pot(Mp)), entonces GC = C, n ... n C., GC se incorpora pues como un nuevo componente dzl núcleo K, junto con n4p y M.
T-teoricidad y nzodelos parciales Falta un último elemento para que el núcleo contenga todo lo que es relevante de "la parte formal" de la teoría (último provisionalmente, pues como hemos anunciado en el último apartado haremos referencia a otro). Este elemento tiene que ver con la recurrente cuestión de la teoricidad. El estmcturalismo rechaza la distinción "teórico/observacional" por ambigua. Esta distinción esconde en realidad dos: "observable/inobservab~e" de un lado, y "no teórico/teórico" de otro. Ambas distinciones no coinciden intensionalmente rzi extensionalmente. La primera distinción no tiene relevancia alguna para el análisis local de la estructura de las teorías (aunque por supuesto es relevante para la cuestión general de cómo se relaciona el conjunto de las teorías con la observación). Para el análisis local de la estructura de las teorías la distinción relevante es la segunda, pero en este caso no se trata ya de una distinción absoluta, sino que está relativizada a las teorías. Un término, o un concepto, o una entidad, no es teórico o no teórico sin más, sino relativamente a una reoría dada. Por eso no se debe hablar tanto de teoricidad cuanto de T-teoricidad, teoricidad relativamente a una teoría T. La idea que hay detrás es, expresada en términos
modeloteóricos, similar a la distinción que vimos en el último Hempel entre vocabulario antecedente y vocabulario propio (aunque formulada ya con anterioridad en la obra fundacional del estructuralismo, Sneed, 1971). La idea es que un concepto es T-teórico si es un concepto propio de la teoría T, "introducido" por ella, y es T-no teórico si es un concepto disponible previamente a T. La cuestión es precisar esta intuición. La formulación precisa del criterio de T-teoricidad usa de la noción técnica de procedimiento de determinación, que no podemos presentar aquí en detalle. Bastará de momento con la siguiente caracterización informal. Como vimos en el capítulo 4, los conceptos se aplican o no a las cosas, o si son cuantitativos, asignan valores a ciertas cosas. Determinar un concepto es determinar si se aplica o no a un objeto particular dado, o si es cuantitativo, determinar el valor de la magnitud para el objeto. Los modos para proceder a ello son los procedimientos de determinación de los conceptos. Puedo determinar la distancia entre la Tierra y la Luna haciendo ciertos cálculos a partir del período de rotación y las masas correspondientes. Puedo determinarlo también mediante ciertos procedimientos óptico-geométricos. Puedo determinar la masa de un objeto mediante una balanza de brazos. También mediante una balanza de muelle. O viendo cuánto se desplaza otra masa tras chocar con ella a cierta velocidad. Todos ellos son procedimientos de determinación, unos de la distancia, otros de la masa, etc. Pues bien, si un concepto es T-no teórico, si es "anterior" a T, entonces tendrá al menos algunos procedimientos de determinación independientes de T; en cambio si es T-teórico, si es propio de T, su determinación depende siempre de T. Un procedimiento de determinación se considera dependiente de la teoría T si presupone la aplicabilidad de T, la validez de sus leyes, esto es, si usa o presupone modelos actuales de T. La idea es que un concepto es T-teórico si no se puede determinar sin presuponer la aplicabilidad de T, si todo procedimiento para su determinación la presupone; y es T-no teórico si tiene algiín procedimiento de determinación T-independiente, si es posible determinarlo sin suponer la aplicación de la teoría, por más que también tenga otros T-dependientes. En el caso de la mecánica que venimos usando como ejemplo, la posición es MC-no teórica. Es cierto que, como ilustra el caso de la distancia Tierra-Luna, se puede determinar por procedimientos que usan las leyes de la mecánica, como el efecto gravitacional, pero también se puzde determinar sin usar leyes mecánicas, por procedimientos óptico-geométricos. Lo mismo ocurre con el tiempo o duración. Sin embargo no ocurre así con la masa: todos los procedimientos de determinación de esta magnitud presuponen la aplicabilidad de la mecánica, usan modelos mecánicos. Ello es obvio de los procedimientos de medición indirectos (mediante dinamómetro, o a través de la alteración en la trayectoria de otro cuerpo, etc.). Pero también lo es respecto de la medición directa mediante balanza, pues a menos que se considere que la balanza satisface ciertas leyes mecánicas no se puede considerar que lo que se mide es la masa de la que habla la tnecánica (cf. cap. 6, 37). Faltaría más, se dirá, la masa es un concepto mccánico. Pues bien, eso es justamente lo que queríamos, precisar el sentido exacto en que lo es, en que es un concepto "propio de" o "introducido por" la mecánica. En eso consiste la distinción "T-teónco/T-no teórico". En el caso de la mecánica clásica de partículas, espacio y riernpo son MC-no teóricos, conceptos cinemáticos previos. masa y fi~erzason conceptos hIC-teóricos, los conceptos propiamente mecánicos,
dinámicos. Es probable que para todo concepto T-no teórico haya otra teoría 7" respecto de la cual el concepto sea TI-teórico, pero eso es una hipótesis metaempírica que se debe confirmar. La noción de T-teoricidad permite precisar el último componente del núcleo. Hemos visto que los modelos potenciales expresan el aparato conceptual de la teoría. Es conveniente ahora distinguir en el núcleo entre el aparato conceptual global de la teoría y el aparato conceptual específico de ella. Esto es, distinguir los modelos que usan todo el aparato conceptual de la teoría de aquellos que usan sólo conceptos previamente disponibles, en esa diferencia radica la contribución conceptual específica de la teoria (además de para estas consideraciones generales, la necesidad de distinguir entre ambos tipos de modelos se hará patente cuando discutamos la base empírica). La determinación de esos modelos que no contienen el aparato específico de la teoría es sencilla una vez se dispone de la noción de T-teoricidad presentada, pues tales modelos contienen como constituyentes exclusivamente las entidades correspondientes a los conceptos T-no teóricos; esto es, estos n~odelosse obtienen a partir de los modelos potenciales "recortando" de ellos las entidades T-teóricas. A estos modelos se les denomina ~ílodelos(potenciales) parciales, y se denota su conjunto r que genera los mediante 'Mpp'. Así, en general, se puede definir una jiinció~zre-eco~~e n.iodelos parciales a partir de los potenciales. Si los modelos potenciales de T son estructuras del tipo x = d),, ..., DI, ..., Rl, ..., R,, ..., R,> y R,+l, ...,R, son T-teóricos, entonces r(x) = <DI,..., DL, ..., Rl, ...,R,,>. El conjunto Mpp de los modelos parciales es entonces simplemente el conjunto de los modelos potenciales una vez que hemos recortado de ellos las funciones T-teóricas: Mpp = dCdg/ 3 x E Mp : y = r(x)} o, abreviadamente, Mpp = A, r[hlp], donde 'r[ ...]' denota la función recorte aplicada a conjuntos de modelos (recuérdese, cf. Apéndice, que r[X] es el recomdo de r restringido a X, en este caso el conjunto formado por los modelos de X una vez recortados). En nuestro ejemplo, los modelos parciales de la mecánica son entidades del tipo <P,T, S>. que no contienen parámetros MC-teóricos, contienen sólo parámetros cinemáticos; mientras que los modelos potenciales <P,T, S, 171, f> incluyen además los parámetros dinámicos, los propiamente mecánico-teóricos.
Con ello concluimos la presentación del núcleo, la parte formal de los elementos teóricos. El núcleo K se ediante la tupla = 41p, Mpp, M, GC>,d@de Mp es el conjuntode modelos ,Mpp el de los modelos parciales (Mpp = r[Mp]), M el de los modelos actuales (M L Mp) y GC la ligadura global (GC G Pot(Mp)).
El núcleo K es el componente formal de la teoría, pero no el único. Como hemos visto en general en las concepciones semánticas, las teorías enrpíricas pretenden que las
7.7
Y
3
constricciones de K lo son de ciertas panes de la realidadfísica, los sistemas empíricos a los que se pretende aplicar el núcleo. Estos sistemas empíricos se denominan en el estnicturalismo, como en Adams, aplicaciones pretendidas o inren$pnales ('intended applications'), y se denota su conjunto'mediante 'I'. En nuestro ejemplo de la mecánica clásica, son aplicaciones pretendidas cosas como el sistema Tierra-Luna, el sistema Solar, un trapecista en su balancín, dos bolas de billar chocando, una balanza, un esquiador deslizándose por una pendiente, un niiío saltando en una colchoneta elástica, un satélite de comunicaciones en órbita, etc. La caracterización estructuralista de 10s dominios de aplicaciones contiene sin embargo elementos específicos, especialmente los dos siguientes. En primer lugar, las aplicaciones pretendidas de una teoría T se individualizan y describen mediante el vocabulario previo a T, esto es, mediante el aparato conceptual T-no teórico. Así, en los ejemplos mecánicos mencionados, la descripción de las aplicaciones incluye exclusivamente valores de las magnitudes posición y tiempo, es decir, son descripciones de los sistemas en términos puramente cinemáticos que presentan sus trayectorias espaciales a lo largo del tiempo. Por tanto, las aplicaciones pretendidas que conforman la base empírica de la teoría, los "datos" de la teoría, ciertamente están cargados de teoría, pero no de la teoría para la que son datos sino, en línea con las observacionzs de Lakatos, de otra previa o antecedente. Los datos de la mecánica, a los que se pretende aplicar y sobre los que se contrasta, están cinemáticamente cargados, pero no dinn'micarnente cargados. Esto es esencial para dar cuenta del carácter no autojustificativo de la aserción empírica mediante la que se contrasta la teoría. Formalmente, ello se traduce en que cada aplicación pretendida es un determinado sistema que contiene exclusivamente entidades T-no teóricas. Cada aplicación pretendida es entonces un determinado modelo parcial y el conjunto I de todas ellas es por tanto cierto subconjunto de Mpp: I c_ Mpp. El segundo hecho a destacar (parcialmente apuntado por Adams y, dentro de los historicistas, por Kuhn) es que la selección de las aplicaciones, la determinación de I, contiene elementos pragmáticos ineliminablzs, pues tal determinación es esencialmente intencional y pnradigmática. La determinación es intencional porque lo que hace de un sistema específico que sea una aplicación pretendida es que sea un objeto intencional de los usuarios de la teoría, que la comunidad científica pretenda que las constricciones-leyes se aplican a tal sistema (cf, más aniba $3). Y es paradigmática porque el conjunto I no se presenta "listando" todos y cada uno de los sistemas físicos que son aplicaciones pretendidas, sino "paradigmáticamente". No sólo es una aplicación pretendida de la mecánica un cierto esquiador deslizándose por una pendiente determinada en cierto momento específico, sino cualquier esquiador en cualquier pendiente en cualquier momento; y, por supuesto no sólo los esquiadores, también los ciclistas, y los niños bajando por las barandillas, etc. Para determinar el dominio I no hemos de listar todos y cada uno de los sistemas cinemáticos particulares de plano inclinado, sino algunos paradigmáticos y añadir: "y cosas como ésas"; o, alternativamente si se prefiere, referirse de modo general y relativamente impreciso a "todos los sistemas en que un objeto desciende por una superficie inclinada". Y lo mismo con los objetos vibrantes, con las órbitas estacionarias, con los objetos chocando y separándose después, con los objetos chocando y siguiendo unidos después, etc. Esto
358
FUSD,AAlEbTOS DE FILOSOF~.~ DE LA CIENCIA
sugiere que quizá sería mejor caracterizar al dominio de aplicaciones 1, no simplemente como un conjunto de aplicaciones sueltas (1c Afpp), sino como un conjunto de conjuntos de aplicaciones (1 c Pot(Mpp)) que tiene por elementos conjuntos que son S I - v o sde aplicaciones d e urz ininno tipo. Pero aquí no \.amos a introducir esta complicación (para un estudio detenido de la misma, cf. Moulines, 1982, cap. 2.4) y seguiremos considerando la versión más sencilla según la cual los elementos de I son directamente las aplicaciones individualmente consideradas.
Elementos teóricos
Ahora podemos presentar ya la noción estructuralista mínima (y provisional) de teoría, la noción de eleinento reórico. Un elemento teórico, una teoría en este sentido mínimo, está constituido por (1) una parte formal que expresa los recursos conceptuales a diferentes niveles y las constricciones-leyes que según la teoría rigen su ámbito de estudio, y (2) una parte aplicativa que especifica en términos preteóricos los sistemas físicos a los que la teoría pretende aplicarse, de los que pretende que son regidos por sus constricciones-leyes. Haciendo uso del aparato previamente introducido, un elemento teórico T se identifica entonces con el par formado por el núcleo K,la parte formal, y el dominio de = <K I> aplicaciones I, la parte aplicativa: T u.--sij__z Ésta es la noción más simple de teoría, y, como veremos, resulta parcialmente inadecuada por su "rigidez", pero ya es suficientemente rica y útil para expresar de modo preciso la naturaleza de la aserción empírica de una teoría. Para ello es conveniente presentar primero la noción de contenido de una teoría. Contenido teórico y contenido empírico
Hemos visto que el núcleo K expresa la parte matemático-formal de la teoría. Es en ella donde se presentan las condiciones que, según la teoría, rigen las "partes de la realidad" de que ella trata. Estas condiciones consisten básicamente en las leyes propiamente dichas de un lado, y las condiciones de ligadura de otro, que en el núcleo se corresponden, respectivamente, con los conjuntos M y GC. Sin embargo, la teoría, al aplicarse, no pretende que estas condiciones rigen aisladamente o separadas, sino que las aplicaciones satisfacen todas las restricciones a la vez, tanto las leyes como las ligaduras. ES conveniente entonces "juntar" ambos tipos de condiciones, presentar su efecto restrictivo conjunto. Esto se expresa mediante la noción de co~zrenidoteórico, a la que nos referiremos mediante 'Con,'. El contenido teórico, esto es, el efecto combinado de leyes y ligaduras, queda representado mediante la apropiada intersección conjuntista de los conjuntos M y GC. Como M es un conjunto {x],x2, x3, ..., x9, ..., xis, ...} de determinados modelos potenciales (M c Mp) y GC es un conjunto { {x,,x:, xg, ...}, {x4,x-/,xg, ...), ..., {..., xi5, ...) } de conjuntos de modelos potenciales (GC E Pot(Mp)), la intersección apro-
piada correspondiente a la combinación de ambos tipos de condiciones no es la de GC con M, sino la de GC con Pot(h.f), esto es: Con, = de, Pot(bf) n GC. Es inmediato que Con, G Pot(Mp), el contenido teórico de T. es un conjunto de conjuntos de modelos potenciales, el conjunto cuyos elementos son conjuntos tales que: (1) satisfacen las ligaduras; y (2) están formados por modelos que satisfacen las leyes de la teoría, los axiomas propios del predicado conjuntista. La noción central para expresar la aserción empírica es la de contenido empírico, que se deriva de la de contenido teórico. El contenido empírico es el "contenido contrastacional"; en la versión tradicional, las consecuencias empíricas de la teoría. En nuestros actuales términos, las consecuencias empíricas del contenido teórico, el efecto a nivel empírico, esto es, T-no teórico, de las condiciones restrictivas de la parte formal de la teoría. El contenido empírico recoge entonces los (conjuntos de) modelos parciales que resultan de recortar los componentes T-teóricos de los modelos potenciales que satisfacen las restricciones. O de otro modo, los modelos parciales que es posible aumentar con componentes T-teóricos de forma que se cumplan las restricciones (y si las restricciones son efectivamente tales, no todo modelo parcial es aumentable de esta forma). Así, si denotamos mediante 'Con' el conjunto que expresa el contenido empírico, dicho conjunto es el resultado de recortar los componentes T-teóricos en los modelos que aparecen en Con,, abreviadamente: Con = r[[Con,]] (r(...) se aplica a modelos sueltos, r[...] se aplica a conjuntos de modelos, r[[...]] es la función recorte aplicada a conjuntos de conjuntos de modelos, como Con,).
Aserción empírica Ahora podemos expresar de modo preciso la naturaleza que, según el estmcturalismo, tiene la aserción empírica dz una teoría. La teoría pretende que ciertos sistemas físicos, T-no teóricamente descritos, satisfacen las condiciones impuestas por la teoría en el sentido siguiente: ésos son los datos de experiencia que se deberían obtener si la realidad operase como la teoría dice. Esta pretensión se expresa en la aserción empírica de la teoría. Por todo lo anterior debe ser claro que la forma lógica que corresponde a la aserción es "1 E Con", esto es, el dominio de aplicaciones pretendidas I es uno de los conjuntos de modelos parciales, T-no teóricos, que las constricciones del núcleo K determinan a nivcl empírico. Ésta es la versión modeloteórica precisa de la idea intuitiva de que las aplicaciones pretendidas satisfacen individualmente las leyes y, además, satisfacen colectivamente las condiciones de ligadura. Mejor dicho, no que "ellas mismas" satisfacen esas condiciones, pues ellas son estructuras T-no teóricas y tales condiciones involucran esencialmente constituyentes T-teóricos de los modelos. La aserción afirma que ciertos sistemas empíricos concretos, descritos T-no teóricamente, tienen el comportamiento que las restricciones legales determinan a nivel T-no teórico. Tomemos un sistema empírico que se comporta de cierto modo según ciertos parámetros T-no teóricos. Que la aserción sea cierta significa que ése es justamente el modo en que le corresponde comportarse si están presentes en él los parámetros T-teóricos que la teoría postula y éstos se relacionan con los T-no teóricos de la forma que establecen las leyes. Es decir, los sistemas de I son
n~odelosparciales que pueden ampliarse con funciones T-teóricas de modo que se obtengan modelos que satisfacen aisladamente las leyes y conjuntamente las ligaduras. En este sentido, la aserción afirma que la experiencia es subsumible o encaja en la teoná. Aplicada al ejemplo de la mecánica, la aserción entendida en estos términos expresa de modo sucinto lo siguiente: los sistemas físicos particulares intencionalmente seleccionados (planos, péndulos, muelles, poleas, órbitas, etc.) son tales que sus valores cinemáticos (posicioneso velocidad y aceleración en ciertos instantes) coinciden con los que deberían tener si en los sistemas estuvieran además presentes ciertos parámetros dinámicos (masas, fuerzas) interactuando con los cinemáticos del modo especificado en la mecánica, esto es, a) del modo que especifican el segundo principio de Newton y la ley de acción y reacción, y b) manteniendo la misma masa para las partículas que aparecen en diversas aplicaciones y respetando la aditividad de las masas cuando una partícula esté compuesta de otras (sean cuales sean las aplicaciones en que aparezcan). Es importante darse cuenta de que, aunque la experiencia o los datos están "cargados de teoría", eso no tiene consecuencias autojustificativas para la aserción. Se seleccionan intencionalmente ciertos sistemas físicos. Primero, se hacen ciertos cálculos suponiendo que en los sistemas está actuando todo lo que postula la teoría y del modo como ella establece. Segundo, e iizdependientemenre, se determinan en los sistemas los valores de ciertas magnitudes cuya medición no presupone la aplicación o validez de la teoría. Por último, se comprueba si esos valores coinciden con los calculados. No hay autojustificación en absoluto (al menos en sentido local). La aserción puede ser perfectamente falsa, lo es si los valores simplemente no coinciden. Esta caracterización de la aserción es parcialmente insatisfactoria por excesivamente rigurosa. Pretende que los valores coincidan exactamente, en cuyo caso toda aserción resulta falsa, pues siempre hay errores de aproximación. Ésta es en realidad una versión exacta o idealizada de la aserción, versión que no se corresponde con las pretensiones reales en la actividad científica. Los científicos nunca pretenden la coincidencia plena, sino el acuerdo aproxin~adocon los datos dentro de ciertos límites. Para reflejar este hecho el estructuralismo ofrece una versión modificada de la aserción empírica que recoge los aspectos aproximativos indicados. No vamos a presentarla aquí (cf. p.ej. Moulines, 1982, cap. 2.7), para la idea central basta con la versión idealizada.
Los elementos teóricos expresan la estructura sincrónica de las teorías sólo parcialmente, pues hay un aspecto estructuralmente relevante a nivel sincrónico que ellos no recogen. Se trata de un aspecto que, como vimos, enfatizaban especialmente Kuhn y Lakatos con la idea de que las teorías contienen partes esenciaks o inamovibles donde descansa su identidad y partes más accidentales que pueden 'perderse o modificarse permaneciendo, en un sentido diacrónico relevante, la misma teoría. Para capturar y formular en términos precisos esta idea, el estnicturalismo ha desarrollado el concepto de red teórica, que expresa la naturaleza sincrónica de las teorías en toda su riqueza estructural, y
que el propio Kuhn ha reconocido que es una buena precisión semiformal de sus matrices disciplinares en cierto momento de su evolución (cf. Kuhn, 1975).
Especialización
/
Una red teórica es un conjunto de elementos teóricos que guardan cierta relación entre sí. La idea es que el conjunto represente la estructura (sincrónica) de una teoría en sus diferentes estratos, esto es, en sus diversos niveles de especificidad. Tal conjunto, partiendo de elementos muy generales, se va concretando progresivamente en direcciones diversas cada vez más restrictivas y específicas, las "ramas" de la teoría-red. La relación que se ha de dar entre los elementos teóricos para considerar el conjunto una red ha de ser de "concreción" o "especificación" o, como se dice en terminología estructural, una relación de especialización. Podemos ilustrar esta situación con el ejemplo de la mecánica que hemos venido manejando. Vrolvamos a la definición de los modelos de la mecánica tal como vimos que la presentaba Suppes. Suppes exige que los modelos actuales de la mecánica satisfagan tanto el axioma (7), el segundo principio de Newton, como el (S), e1 principio de acción y reacción. Desde un punto de vista histórico eso es correcto, si por mecánica entendemos mecánica nebvtoniana, esto es, la que concibió y en la que creía Newton. Pero desde un punto de vista estructural, la estrategia es inadecuada. El segundo principio y la ley de acción y reacción no están al mismonivel, y es importante que este hecho se refleje en la estructura de la teoría. En contra de lo que creía Newton, no todo sistema que se ajusta a su segundo principio satisface además esa ley de acción y reacción. Hay sistemas mecánicos que satisfacen el segundo principio y que sin embargo son "no newtonianos", en el sentido de que incumplen dicha ley, por ejemplo sistemas que incluyen partículas moviéndose en un campo electromagnético (aunque este hecho queda algo oscurecido en la versión, como advertimos, técnicamente imperfecta que dimos de la ley). Así, mientras todo sistema mecánico satisface (7), no todos ellos satisfacen (8), sólo lo hacen algunos de ellos. Los modelos actuales que satisfacen (8) además de (7) son una especialización de los que sólo satisfacen (7). Los modelos actuales más generales de la mecánica son los que satisfacen (7). A partir de ahí se pueden abrir varias líneas de especialización. Algunos satisfarán además (8). Otros no satisfarán (8) pero satisfarán otro u otros principios específicos, etc. Y esto puede pasar también en niveles inferiores. Por ejemplo, no todos los sistemas de acción y reacción satisfacen otros principios adicionales. Unos satisfarán el principio de las fuerzas cuadrático-inversas de la distancia, otros el principio de oscilación armónica, etc. A partir del segundo principio, general, la mecánica clásica se va especializando en diversas direcciones específicas imponiendo propresivamente condiciones adicionales en diversas direcciones con la intención de dar cuenta de aplicaciones específicas. Éste es el panorama que pretende recoger y expresar la noción estructuralista de red teórica. El primer paso es definir de modo preciso la relación de especialización. Un elemento T' es una especialización de otro T si la parte formal (las constricciones) de T' es una concreción de la de T y está destinada a dar cuenta de una parte de las aplicaciones pretendidas de T. En términos modeloteóricos, ello si,@íca lo siguiente: (1) los modelos determina-
dos por las constricciones (leyes y ligaduras) del núcleo K son parte de los detem~inadospor K,esto es, los correspondientes conjuntos M' y G C de K' están incluidos respectivamente en M y GC de K (pues se van imponiendo condiciones adicionales), mientras que la parte conceptualizadora de los elementos teóricos, los conjuntos Mp y Mpp, queda igual; y (2) las aplicaciones de I' son algunas de las de I. La definición es pues la siguiente, donde 'T' o T' abrevia 'T' es una especialización de T': T' o T syssw (1) M'p = Mp, M'pp = Mpp, M' E M, G C c GC y (2) fc 1. Como puede verse, Ia relación de especiaIización es reflexiva, antisiméuica y transitiva, esto es, de orden parcial (no estricto).
Redes teóricas Con la noción de especialización disponible podemos precisar la noción de red teórica. Una red teórica N es simplemente un conjunto de elementos teóricos (parciaImente) ordenado por una relación de especialización: N = < { E } ,o > es una red teórica syssdef (1) { T , ) es un conjunto no vacío de elementos teóricos y (2) o es una relación de especialización sobre {T,).A cada red Ie corresponde un conjunto IN de aplicaciones pretendidas, la unión de los dominios I; de los elementos que la constituyen. Mediante el concepto de red teórica se captura la estructura de una teoría en un lno~neiztodado en toda su complejidad; este concepto expresa adecuadamente la naturaleza de las teorías desde un punto de vista sincrónico o estático. Sin embargo, el concepto es en cierto sentido demasiado débil. pues, al no exigir a o condiciones adicionales, se acepta (como en todo orden parcial) la posibilidad de que haya órdenes "extraños", con partes desconectadas entre sí, esto es, de que partes de una teoría estén totalmente aisladas de otras. El estructuralismo, que adopta por lo general una postura lo más liberal posible, considera que ello no es conceptualmeríte insatisfactorio. Se reconoce que en las teorías conocidas no ocurre de hecho tal cosa, pero se considera que se trata de una cuestión (~izeta)eti~pí~-ica que no hay que prejuzgar a priori. Aunque en parte es una cuestión abierta, se opta en general por limitarse a la versión débil y definir después un ripo de redes-teorías, las conecradas, constatando como cuestión de hecho que las teorías conocidas son de ese tipo. Una red conectada es una red "no degenerada", sin partes aisladas. Para ello no es necesario exigir que o sea conexa en el sentido lógico usual, esto es que cualesquiera dos elementos diferentes estén relacionados; eso daría lugar a un orden lineal, identificando, contra lo que se pretende, las redes conectadas con redes de una sola línea de especialización. Hay que exigir algo más débil, que sea una "malla", que siempre haya un camino que conecte dos elementos cualesquiera. Formalmente ello se garantiza si podemos "circular-vía-o" entre cualesquiera dos elementos de la red: N = < { E } ,o > es una red teórica colíecrada syssddpara todo T, T' E {Ti]hay Ti, ..., T, E { E ] tales que (T o TI O Ti o T ) y (TI O T ~ T:G o Ti) y ... y (Tn.i(3 T, O T,o T,.i) y (T'B T, O T,,(3 T'). Un tjpo especialmente interesante de redes (conectadas) son aquellas que presentan un único elemento superior, del cual "emana todo". Estas redes (que tienen forma de pulpo o de árbol invertido) se caracterizan formalmente por tener algún elemento teórico del que todos son especializaciones (es inmediato que si tiene alguno, tiene sólo uno). El estructuralismo llama arbóreas a tales redes: N = c{T,),o> es una red teórica arbórea
s y s s ~ hay ~ , T E [ T ; )tal que para todo T' E (Ti} T' (3 T. Las teorías arbóreas son especialmente interesantes pues en ellas, por así decir, la "esencia" está concentrada en un único elemento teórico básico. El siguiente gráfico ilustra esta situación.
Las redes arbóreas reflejan parcialmente la imagen de la ciencia que se desprende de los análisis de Kuhn y Lakatos, parcialmente porque faltan por ver los aspectos diacrón i c o ~ el , tipo de evolución de las redes que constituye la ciencia normal kuhniana. Resumamos cuáles son los principales elementos estructurales sincrónicos descubiertos por los historicistas que son recogidos en la noción estructuralista de red teórica. Las teorías tienen, en los elementos teóricos de la red, un componente formal, el núcleo K, y otro aplicativo, el dominio I de aplicaciones pretendidas. Una parte del núcleo, Mpp, conceptualiza la experiencia, los hechos, esto es, I Mpp. Otra parte explica lo así conceptualizado, explicación que introduce aparato conceptual nuevo propio de la teoría (Mp): las leyes M (cMp) y ligaduras GC (cPot(Mp)) intentan "subsumir" las aplicaciones, pretensión expresada por la aserción empírica de la teoría. Así, los hechos a explicar están cargados de teoría, pero no de la parte de la teoría que pretende explicarlos. El núcleo, que en sí mismo es puramente formal, se carga entonces de contenido empírico al aplicarse-alas-aplicaciones. Además, todo esto no ocurre de modo "rígido", como en un bloque indiferenciado. Las redes tienen partes esenciales (si son arbóreas, concentradas en un elemento teórico básico) cuyo componente formal es por lo general muy débil, muy poco o nada restrictivo en sí mismo (sin especializarlo), y partes accidentales que desarrollan mediante o la parte esencial especializándola en diversas direcciones, tanto en su componente formal, imponiendo restricciones más fuertes, como en el aplicativo.
Concluiremos señalando brevemente un último componente de la concepción estructuralista de las teorías que hemos obviado hasta aquí para simplificar la exposición. Este componente pretende dar cuenta de un hecho usual y esencial de la ciencia, a saber,
que las teorías no son entidades aisladas sino que mantienen estrechas relaciones entre si. Algunas de esas relaciones se expresan mediante "leyes mixtas" o "leyes puente", mediante postulados que involucran conceptos de diversas teorías. Las teorías mantienen pues i.í~ici~los interteóricos. En principio los vínculos pueden relacionar varias teorías a la vez, pero lo usual parece ser que relacionen dos teorías; en todo caso nos limitaremos aquí a este caso, el más sencillo, para evitar complicaciones de una presentación generalizada a cualquier número de teorías. Un ejemplo típico de vínculo interteórico binario lo constituye el que se da entre la hidrodinámica y la termodinámica expresado en la ecuación "P=dEldV' que relaciona presión, volumen y energía, siendo la presión una magnitud específicamente dinámica y la energía una magnitud específicamente termodinámica. Los vínculos interteóricos tienen, como las leyes propias de la teoría, efectos restrictivos sobre los modelos, pero a diferencia de ellas no son satisfechas o insatisfechas por modelos potenciales de una única teoría sino por pares (en el caso de los vínculos binarios) de modelos potenciales de teorías diferentes. Las leyes propias determinan un subconjunto de modelos potenciales, aquellos que las satisfacen (e.e. los modelos actuales). Los vínculos interteóricos no determinan directamente un subconjunto de modelos potenciales de una teoría. Si Mp y Mp' son respectivamente los conjuntos de modelos potenciales de dos teorías T y T', entonces el producto cartesiano Mp x Mp' contiene todos los pares posibles de modelos de ambas. Pues bien, dado un determinado principio puente entre T y T', sóIo algunos de esos pares satisfarán dicho principio, por lo que se puede considerar que el principio en cuestión determina o define cierto subconjunto L de h f p x Mp', el conjunto de pares de modelos que lo satisfacen. Por tanto, los principios puente determinan prilnarialnente conjuntos de pares de modelos. Pero eso supone una restricción efectiva adicional para cada una de las teorías, tiene como efecto la determinación de cierto subconjunto de modelos potenciales en cada una de las teorías: para T ese conjunto es el de los primeros miembros de los pares de L, para T' es el de los segundos miembros de los pares. Denotemos mediante 'Lr' al conjunto de modelos potenciales de T determinado-en-T por el principio puente L (y análogamente con T'). Pues bien, si el principio es efectivamente restrictivo, LT será un subconjunto propio de Mp. Como T puede tener varios vínculos interteóricos L;con diversas teorías, cada uno de ellos determina de este modo indirecto un cierto subconjunto Lir de modelos, que representa el efecto constrictivo del vínculo en la teoría T. El efecto combinado o conjunto de todos los vínculos se recoge entonces en la intersección de todos esos conjuntos, el i~'ncu10global que se denota mediante 'GL',y que es la intersección de todos los vínculos Lii para T. Una caracterización completa del núcleo K que exprese todas las condiciones que la teoría impone a los modelos debe incluir también este tipo de constricciones derivadas de las leyes puente. Así, hay que completar la anterior caracterización provisional del núcleo con este nuevo elemento: K = <Mp, Mpp, M , GC, GL>; el contenido teórico es entonces Con, = Pot(M) n GC n Pot(GL). Nótese que si no se incluyesen en la caracterización de las teorías este tipo de leyes-restricciones empíricas no aparecerían en la reconstrucción de ninguna teoría y por tanto "desaparecerían" en una eventual reconstrucción total de la ciencia resultante de reconstruir todas y cada una de las teorías. El motivo es
que estas leyes empíricas no se formulan con el vocabulario exclusivo de una única teoría, involucran conceptos de diferentes teorías, y por ello no aparecen como axiomas propios que determinan los modelos actuales. Pero no por ello son menos constrictivos empíricamente, son tan parte de lo que la teoría afirma de la experiencia como los axiomas propios de cada teoría y por tanto deben hacerse manifiestos en la reconstrucción de cada teoría. Nótese que no sería una buena estrategia alternativa "ampliar" por este motivo los conceptos propios de la teoría incluyendo cualquier concepto con el que se vinculen mediante leyes "los originales". Eso permitiría recoger las leyes-puente como axiomas propios pero al precio de unificar inaceptablemente diferentes teorías. Si la energía debiera incluirse como magnitud propia de la hidrodinámica por su relación con la presión mediante la ley mencionada, entonces también debería incluirse la entropía, dadas las leyes que la conectan con la energía. Pero eso tendría la consecuencia inaceptable de convertir la hidrodinámica y la termodinámica en una misma teoría. Y no sólo a ellas, sino que convertiría en la misma teoría gran número de teorías físicas (dadas las conexiones de hidrodinámica y termodinámica con otras), o quizá todas las teorías físicas o, si por distintos csminos se conectan con otras disciplinas, todas las teorías empíricas. . . Es obvio que no todas las teorías dentro de una disciplina, o de toda la ciencia, son la misma teoría. Por tanto, considerar los vínculos interteóricos exactamente del mismo modo que los axiomas propios de las teorías es inaceptable. Lo adecuado es reconstmirlos, e incluirlos en la caracterización de las teorías, como lo que son, a saber, leyes puente que vinculan teorías diferentes. Su existencia genera cierto tipo de "unidad", pero no puede convertir teorías diferentes en la misma teoría. Esas unidades que generan no son teorías individuales sino grupos de teorías interconectadas, o lo que el estructuralismo denomina holones ("totalidades") teóricos. Estas macro-unidades científicas pueden englobar partes de una disciplina, o incluso de disciplinas diferentes, y son fundamentales para elucidar algunas cuestiones relativas a la estructura global de la ciencia. El examen de estas cuestiones, sin embargo, sobrepasa los límites de este libro (para un estudio detallado, cf. Balzer, Moulines y Sneed, 1987, cap. VIII).
6. Consideraciones finales Con este capítulo concluimos el análisis de la estructura sincrónica de las teorías. La reconstrucción o análisis de una teoría debe poner de manifiesto todos los aspectos que sean relevantes para elucidar su naturaleza. Independientemente del formalismo que se prefiera usar para ello, la revisión que hemos hecho permite establecer al menos los siguientes elementos relevantes para la dimensión sincrónica de las teorías.
1. Las teorías tienen una parte formal, las leyes, y otra aplicativa, los sistemas físicos concretos a los que se pretende aplicar las leyes. Tal pretensión es expresada por la aserción empírica de la teoría. 2. Es más adecuado identificar las teorías a través de sus modelos que a través de sus enunciados. Para dar cuenta de algunas intuiciones hemos de referimos siquiera implí-
366
FUND.4XíESTOS DE FILOSOFL~DE LA CIENCIA
citamente a los modelos, y lo preferible es presentar el análisis metateórico, así como las cuestiones vinculadas al mismo, directamente en términos de modelos. 3. El aparato conceptual con el que se describen y determinan los modelos de datos es sólo parte del usado por la teoría. La determinación de los modelos de datos no puede depender de conceptos cuya aplicación presupongan la validez de la teoría. Los conceptos mediante los que se determinan los datos son pues previos, anteriores o no-teóricos en relación a la teoría para la que son datos. Los conceptos mediante 10s que la teoría explica o subsume esos datos son los conceptos propios o teóricos en relación a la teoría. La distinción "te6rico/no-teórico" es relativa a cada teoría. 4. La caracterización del componente formal debe hacer manifiesta la diferencia entre aparato meramente conceptualizador y aparato propiamente constrictivo. 5. En cuanto al aparato conceptuaiizador, se debe hacer manifiesta la diferencia entre los conceptos previos, T-no teóricos, y los conceptos propios, T-teóricos. 6. En cuanto al aparato propiamente constrictivo, la reconstrucción debe hacer manifiesta la diferencia entre: a) constricciones que se imponen a sistemas aislados e involucran conceptos exclusivos de la teoría en cuestión (leyes propias); b) constricciones que se imponen a sistemas aislados e involucran conceptos de diferentes teorías (leyes puente); c) constricciones que se imponen a grupos de sistemas (condiciones de coherencia o ligaduras). 7. La parte aplicativa, los sistemas de datos, seleccionada intencional y paradigmáticamente y determinada T-no teóricamente, contribuye esencialmente a la determinación del significado empírico de los términos teóricos. 8. Todo lo anterior se debe considerar conformando una estructura dúctil, con unas partes más genéricas y esenciales que constituyen el núcleo firme de la teoría, y otras partes más específicas y accidentales que pueden ir modificándose como resultado de la contrastación de la aserción empírica. En qué sentido se pueden producir estas modificaciones lo examinaremos en detalle en el capítulo 13.
Las teorías de las ciencias empíricas en general (a diferencia, quizá, de algunas teorías de la matemática pura y de las teorías metafísicas) no son "mónadas" conceptuales y metodológicas; es decir, ni desde el punto de vista de su armazón conceptual, ni tomando en cuenta el modo como funcionan, como se aplican y ponen a prueba, pueden ellas existir de manera completamente aislada unas de otras. En el capítulo anterior hemos visto ya un modo en que las teorías empíricas están conectadas unas con otras, a través de los vínculos interteóricos o leyes puente. En este capítulo examinaremos otros tipos de relaciones interteóricas de naturaleza más global, en especial la teorización, la reducción y la eq~~ivalencia. Después de una introducción a la noción general de relación interteórica, examinaremos cada una de estas relaciones y concluiremos con un apéndice dedicado al reduccionismo entre ciencias especiales y ciencia básica.
1 . Concepto general de relación interteórica
Cada teoría de las diversas disciplinas científicas se halla en relaciones más o menos estrechas y de diversa índole con otras teorías, con frecuencia de la misma disciplina, pero a veces también de disciplinas bastante distintas. No se puede entender y aplicar una teoría mecánica, pongamos por caso, sin tomar en consideración su relación con la geometría física; las relaciones de la termodinámica con la química son esenciales a ambas disciplinas; no sabremos realmente qué dice la genética sobre los seres vivos si no tomamos en cuenta conceptos esenciales de la taxonomía, etc. Es muy dudoso que, en el estado actual de la ciencia empírica, exista una sola teoría, por elemental que sea, que no conlleve relaciones significativas empírica y conceptualmente con otras varias teorías. En muchos casos, estas relaciones son incluso absolutamente esenciales a la teoría en cuestión en el sentido de que no podemos identificar esa teoría o determinar plenamente de qué trata si desconocemos algunas de sus relaciones con otras teorías. Por ejemplo, la relación de la mecánica con la geometría física es esencial para la primera (aunque no para
368
F U N D A h I E h ' S DE F I L O S O F ~DE ~ LA CIENCIA
la segunda): no comprenderemos lo esencial de una teoría mecánica si no aprehendemos la vinculación de algunos de sus conceptos bisicos con conceptos provenientes de la
geometría. En otros casos, aunque sería quizá exagerado afirmar que la identificación de una teoría dada presupone su relación con otras teorías, sin embargo, las relaciones interteóncas resultan esenciales a la hora de someter a prueba empírica la teoría en cuestión. Probablemente no haya una sola teoría empírica cuya contrastacibn con la experiencia no requiera del concurso de otras teorías, aunque sólo sea por el hecho de que los instrumentos utilizados para poner a prueba esa teoría vienen controlados por las leyes de otras teorías. Así, por ejemplo, cuando ponemos a prueba las predicciones experimentales de la termodinámica mediante un termómetro, presuponemos implícitamente que éste funciona correctamente, y ello quiere decir que funciona de acuerdo a leyes mecánicas, hidrodinámicas, electrostáticas, etc. La constatación de que nunca podemos poner a prueba una teoría empírica aisladamente, sin tomar en cuenta que forma parte de toda una familia de teorías coadyuvantes, la hizo ya Piene Duhem a principios del siglo xx. Este autor formuló esta tesis sólo para las teorías de la física y dudaba de que fuera aplicable a otras disciplinas (a la fisiología, por ejemplo). Sin embargo, hoy día sabemos ya lo bastante acerca de la estructura de otras disciplinas, además, de la física como para que nos atrevamos a suponer el mismo efecto en todas las ciencias empíricas: ninguna teoría empírica puede ser contrastada sin tomar en consideración sus relaciones interteóricas. Esta visión de la problemática de la contrastación de teorías fue radicalizada posteriormente por W. V. Quine, quien postuló que, en la contrastación de cada teoría particular, interviene una madeja inextricable y prácticamente inabarcable de relaciones de esa teoría con la totalidad de la ciencia (incluso las ciencias formales). A tal tesis se la suele caracterizar como ~olismo'(r&ro&lógico) (de la palabra griega Izolos, que significa "totalidad"); también se Ia suele llamar "tesis Duhem-Quine", dando a entender que ambos autores, Duhem y Quine, defendieron prácticamente el mismo punto de vista. Sin embargo, como acabamos de indicar, el "holismo" de Duhem es mucho más moderado (y verosímil) que el holismo extremo de Quine. A efectos de la discusión presente nos basta con dar por bien establecida la versión duhemiana del holismo: a1 contrastar una teoría con la experiencia siempre hay que tener en cuenta al menos algunas de sus relaciones con algunas otras teorías. Así, pues, tanto respecto a la cuestión de la identidad de teorías empíricas como respecto a su contrastación, sus relaciones mutuas juegan un papel de primer orden. Por ello es que el estudio de las relaciones interteóricas representa un capítulo muy importante de la filosofía de la ciencia, un capítulo largo tiempo negligido, pero que en las últimas décadas ha pasado cada vez más al primer plano de la discusión. El estudio de las relaciones interteóricas resulta imprescindible para comprcnder los aspectos más globales de la ciencia, tanto en una petspectiva sincrónica como en una diacrónica. Aquí podemos tratar sólo de los tipos más importantes y discutidos de relaciones interteóricas, y lo haremos sólo desde un punto de vista sincrónico; algunos aspectos de relevancia diacrónica de las relaciones interteóricas entrarán en j u e ~ oen el último capítulo. Otra restricción en el examen que asumiremos es la siguiente. Si consideramos un
grupo de n teorías, Ti. ..., T. (con rt > 2 ) . que constatamos relacionadas entre sí, podría ocurrir que hubiera una relación n-ádica R(Tl, ..., T,) que no se pudiera descomponer en relaciones parciales entre pares de teorías del grupo. Sin embargo, numerosos análisis de ejemplos reales de relaciones interteóricas parecen indicar que la eventualidad mencionada es meramente una posibilidad lógica en la inmensa mayoría de casos, y que los tipos realmente relevantes de relaciones interteóricas son (casi) siempre relaciones establecidas sobre un par de teorías, es decir, relaciones diádicas. En cualquier caso, aquí restringiremos nuestra atención a las relaciones interteóricas diádicas. De éstas, a su vez, hay de tipos diversos, según su forma lógica y su función metodológica. Muchos de esos tipos ni siquiera han recibido una denominación especial en la literatura, y los dejaremos de lado. Aquí nos limitaremos a examinar tres grandes tipos, que han sido objeto de amplias investigaciones, y que tienen también especial relevancia epistemológica: la teorización, la reducción y la equivalencia. La reconstrucción formal de los diversos tipos de relaciones interteóricas dependerá naturalmente, en parte, de la noción formal de teoría que se presuponga. Si se adopta una concepción axiomática o enunciativa de las teorías como cálculos interpretados (cf. capítulo S), entonces está claro que los diversos tipos de relaciones interteóricas aparecerán como relaciones entre (sistemas de) enunciados o axiomas; en cambio, si adoptamos una concepción semántica de las teorías (cf. capítulo lo), y en especial si las definimos como estructuras modeloteóricas (que es el punto de vista favorecido en este libro), entonces las relaciones interteóricas también se verán como relaciones entre modelos o conjuntos de modelos. En lo que sigue, y para el examen de cada uno de los tipos considerados, primero adoptaremos la idea más clásica de las teorías como sistemas de enunciados para pasar luego a la versión modeloteórica. En realidad, las dos formas de reconstrucción no son incompatibles entre sí, sino que la primera puede servir a modo de sugerencia "elemental" para la segunda que, como veremos, permite un análisis más diferenciado y complejo de las relaciones interteóricas.
2. Teorización
La teorización, vista como relación interteórica, se da entre dos teorías TI y TO cuando algunos de los conceptos que aparecen en las leyes de TI vienen determinados en la teoría To, o sea, le son "provistos" a TI por To; a tales conceptos podemos llamarlos "conceptos TI-no-teóricos", mientras que a los demás conceptos de TI, que no vienen determinados por ninguna teoría independiente de TI, los llamamos "Tl-teóricos".l En tal caso, cuando algunos de los conceptos de TI vienen determinados por una teoría TO independiente de Tiy otros, en cambio, no vienen determinados por ninguna teoría independiente de TI, decimos que TI es una teorización de To o que Toes una teoría subyacente 1. La distinción entre conceptos T-teóricos y T-no-teóricos que establecemos aquí está inspirada en ideas básicas de la concepción estnictunl, expuestas en el capítulo 10 ($5). Sin embargo, en Iq forma en que aquí la discutimos es independiente de dicha concepción. 13s
a Ti. También podemos decir que To es una teoría 171etodológicainenteprevia a Ti, pues sin ella algunos de los conceptos de TI no quedarían determinados y por tanto no sabríamos cómo aplicar Ti ni, en definitiva, de qué trata dicha teoría. Así, por ejemplo, si no dispusiéramos de los conceptos cinemáticos de distancia, tiempo, velocidad y aceleración (y de maneras de determinarlos de acuerdo a ciertos principios cinemáticos y geométncos), no tendría sentido tratar de utilizar, aplicar o poner a prueba una teoría mecánica. Por ello podemos decir que la mecánica es una teorización de la cinemática. O bien, si no dispusiéramos del concepto de volumen, no podríamos ni siquiera entender de qué trata la termodinámica, por lo que hay que considerar esta última como una teorización de la geometría física. Finalmente, está claro que la distinción entre fenotipo y genotipo es esencial para cualquier teoría genética; pero la noción de fenotipo viene determinada por los rasgos anatómicos y fisiológicos de los seres vivos, por lo que la genética será una teorización de la anatomía y la fisiología. En general, se suele suponer que, si Ti es una teorización de To, es porque TOestá más próxima a la experiencia inmediata del sujeto epistémico, puede servir como "base empírica" para poner a prueba TI, la cual por lo general se considerará más "abstracta", más alejada de la experiencia. Algunos autores también contraponen el lenguaje en que está formulada To, considerado como "lenguaje observacional", al lenguaje propio de Ti, considerado como "lenguaje teórico" (cf. cap. 8). Podemos aceptar este modo de hablar siempre y cuando tengamos presente que se trata de una distinción relativa al par <Ti, To> : To es "observacional" con respecto a TI, pero no tiene por qué serlo en un sentido absoluto; es decir, TOno tiene por qué considerarse una teoría basada únicamente en "observaciones puras", suponiendo que haya tal cosa. Basta simplemente que las determinaciones de los conceptos en To hayan de presuponerse antes de pasar a utilizar Ti. Pero por supuesto que To puede ser, a su vez, teorización de otra teoría aún más "elemental" T:, y por otro lado Ti puede servir de "base empírica" a otra teoría aún más "abstracta" T3,etc. La teorización puede ser total o parcial. Diremos que TI es una "teorización total" de To cuando To es la única teoría de la cual Ti es teorización, o sea, Te es 'la única teoría que subyace a TI. Es plausible suponer que un ejemplo de teorización total lo constituye la relación entre la mecánica y la cinemática, pues todos los conceptos no propios de la mecánica que hay que presuponer para aplicar la mecánica provienen de la cinemática. Sin embargo, la teorización total es más bien la excepción y no la regla. Por lo general, a una misma teoría subyacen varias teorías distintas, o sea, TI es teorización de To, To', T,,", ... . Así, por ejemplo, la termodinámica es teorización de por lo menos tres teorías: la geometría física (por el volumen), la hidrodinámica (por la presión) y la estequiometría (por el concepto de mol). Parece muy plausible suponer que la teorización es una relación asi~?zétrica;o sea, que si Ti es teorización de To, entonces no podrá ser To también teorización de TI. Sin embargo, es importante notar que no hay ninguna razón a priori o conceptual para que ello sea así: en principio, podría ocurrir en al& caso que algunos conceptos de TI presupusieran To, pero que ciertos conceptos de Tcpresupusieran a su vez la determinación de otros conceptos de Ti. En tal caso no tendríamos un círculo lógico vicioso, pero sí lo
RELACIONES INTERTE~RJCAS
37 1
que podríamos denominar un "círculo metodológico vicioso". Está claro que la praxis científica está constituida de tal modo que, en principio, tratará de evitarse trna situación así. No obstante, que realmente consiga evitarse siempre, es otra cuestión. Puede ocurrir que, en la práctica del uso de teorías, se introduzcan inadvertidamente tales círculos. Ello puede ocurrir especialmente cuando las "cadenas de teorizaciones" son relativamenta largas. En efecto, supongamos que tuviéramos una serie de teorías To, T I ,..., T,-1, T,, tal que T, sea teorización de T.-!, ..., Ti teorización de Toy finalmente que TQsea teorización de T,; admitamos además que la relación de teorización es transitiva, o sea que, si T, es teorización de T2 y T2 es teorización de TI, entonces también habrá que considerar T3 como teorización de TI (lo cual es un supuesto muy plausible); entonces tendríamos en el caso de esa "cadena" de teorías que T, es teorización de Ta y To es teorización de T,, precisamente el círculo que tratábamos de evitar. Es una cuestión todavía abierta la de si una situación como la descrita puede realmente darse en las ciencias empíricas, y qué consecuencias epistemológicas y metodológicas tendría ella; esta cuestión, como el lector habrá adivinado, está emparentada con las tesis del holismo señaladas al principio, en particular en su forma extrema debida a Quine. Aquí no podemos detenemos a fondo en este problema y nos limitamos a apuntarlo tan sólo. En general, supondremos que tales círculos no se dan. y que la constitución de la mayoría de disciplinas (al menos desde el punto de vista sittcrónico) es tal que la teorización es realmente una relación transitiva y asimétrica. EHo implica, a su vez, la existencia de un orden jerárquico entre las teorías, desde las más "básicas", que no son teorizaciones de otras teorías, hasta las más "teóricas", que revelan tener tras de sí largas cadenas de teorizaciones. Ésta es la alternativafundacionis{a. Según la alternativa opuesta, coherentista, no habría teorías básicas y globalmente considerado "todo estaría presupuesto en todo'". Caben alternativas intermedias, con la presencia tanto de algunas teorías básicas como de algunos círculos metodológicos. Aunque hemos supuesto que en general tales círculos no se dan (fundacionismo), debe quedar claro que ello no es algo que se pueda establecer a priori, sino que se debe resolver (meta)empíricamente mediante un detallado y exhaustivo trabajo de análisis y reconstrucción de conjuntos de teorías. Hemos iniciado la discusión de la relación de teorización caracterizándola como la relación que existe entre dos teorías TI y To cuando algunos de los conceptos de Tivienen determinados por To, mientras que otros conceptos de Ti no vienen determinados por ninguna teoría independiente de TI y son por tanto "TI-teóricos". Esta caracterización es más o menos intuitiva pero por ello mismo también más o menos vaga. Conviene que nuestra caracterización sea más precisa. La noción clave aquí, que aún no hemos dilucidado formalmente, es la de deternzinación. Hemos dicho que, cuando TI es una teorización de To,a l p n o s conceptos de T i vienen determinados en Toy otros no. Pero ¿qué quiere decir exactamente que los conceptos de una teoría son "determinados" en otra? Para elucidar esta cuestión haremos uso de la concepción modeloteórica de las teorías tal como la hemos expuesto en el capítulo anterior, especialmente en su versión estructural. Antes, sin embargo, conviene introducir la noción general de subestruca~ra.
Definición 11.1: Sean dos estructuras x = <Di,..., D,,RI,..., R,> y = <Dfi,..., D',,R'I, ..., Rfq>. Diremos que y es una subesrructura de x, ?Sx, si y sólo si: (1) p 5 m ~ q S n (2) V i 3 j D ' , ~ D j ( 1 l i l p , 1 I j l ~ n ) (3) '1!i3jR'~cR~(l l i < q , 1 lj51z) Intuítivamente: la estructura y es subestructura de x cuando todos los dominios de y son subconjuntos (propios o impropios) de algunos dominios de x y tnuraris ~nutandis para las relaciones (y funciones) respectivas. La noción de subestructura es pues simplemente una generalización de la noción elemental de subconjunto. Un caso extremo de subestructura es naturalmente la identidad de dos estructuras; en el otro extremo tenemos que el conjunto vacío es subestructura de cualquier estructura: un caso intermedio de subestructura es lo que en el capítulo anterior llamamos submodelo o "recorte" de un sistema, esto es, el resultado de suprimir algunas de las relaciones del sistema original. Esta noción de subestructura es pues extremadamente general (a veces se usa el mismo término para otra noción más estrecha, a saber, como Def. 11.1 pero exigiendo en (1) p = m y q = n). Supongamos ahora que los modelos (potenciales) de la teoría Ti tienen la forma x = <Di,..., Dm, Rl, ..., R,> (Di son los dominios básicos de TI y Rj las relaciones construidas sobre ellos), análogamente supongamos que los modelos (potenciales) de la teoría To tienen la forma y = cDfi, ..., D',,Rfi, ..., Rf,>, con p l 171 y q 5 11. Podemos definir ahora exactamente qué significa que Ti sea teorización de To. La idea básica es la siguiente: cuando Ti se considera teorización de TOes porque toda aplicación intencional x de TI (es decir, toda estructura que representa un "pedazo de realidad" al que se pretende aplicar TI, cf. cap. 10, $5) tiene una subestructura y "determinada por To" en el sentido de que cumple sus leyes, esto es, y es un modelo actual de TO(o parte de un modelo actual de To). Por otro lado, para que TI sea una teorización genuina deberá haber un "excedente" de conceptos no provistos por To, es decir, todos los modelos (potenciales) de Ti contendrán una subestructura "ajena" a los modelos de To.
Definición 11.2: Ti es una reorizació~lde Tosi y sólo si: (1) t l x E I(T1) 332 6:Sx A jSz A z E M(Tc)) (2) VXE Mp(Ti) 3y O;Sx A V Z ( ZE Mp(T0) + 7 jSz)). En el caso en que en la condición (1) ocurra y = x, tendremos que cada aplicación intencional "completa" de T I se concibe como un modelo o parte de un modelo de una determinada teoría subyacente, en cuyo caso sería superfluo buscar otras teoxías subyacentes para Ti, situación que se corresponde a lo que hemos descrito antes como teorización total. Pero, por lo general, las aplicaciones intencionales de una teoría TI estarán compues-
tas de diversas subestmcturas y, y', subyacentes To,T'c,, ... 3.
... determinadas
como modelos de diversas teorías
Reducción
La reducción de una teoría a otra es probablemente el tipo de relación interteórica que más se ha discutido en la filosofía de la ciencia. Ello se debe a que la relación d e reducción se ha conectado con cuestiones epistemológicas y metodológicas de largo alcance, como son las del realismo (epistemológico), la unidad de la ciencia, el progreso científico, etc. En efecto, si todas las disciplinas científicas existentes pudieran reducirse a una sola (por ejemplo, todas las ciencias sociales a la biología, la biología a la química, la química a la física), y dentro de esa disciplina hubiera una sola teoría que redujera a todas las demás (por ejemplo, la "gran teoría unificada" que persiguen los físicos de partículas), entonces podríamos considerar el desarrollo científico como un "progreso" hacia una "unidad cada vez mayor, en la que todas las teorías quedarían al fin reducidas a una sola que explicaría todos los fenómenos del universo y que se podría considerar "la verdadera representación" de "la realidad" tal cual es; tal situación parecería una garantía de conocimiento definitivo (cf. más adelante la última sección). Frente a este programa reduccionista se han planteando objeciones de diversa índole. Entre ellas, quizá las más frecuentes dentro de la filosofía de la ciencia provienen de una perspectiva diacrónica: se señala que la repetida manifestación de revolnciones científicas, en tanto que rupturas dramáticas en el aparato conceptual y metodológico de una disciplina, con la concomitante inconmetrs~lrnbiliddde las teorías involucradas (cf. cap. 13), dan al traste con la idea de reducir las teorías anteriores a las posteriores en una revolución'; al menos históricamente, según estos críticos, no resulta verosímil el programa reduccionista para teorías diferentes (y aún menos, si cabe, para las diversas disciplinas). Aquí no podemos entrar a fondo en esta discusión. Baste hacer notar, no obstante, que tanto las tesis reduccionistas como las antirreduccionistas han adolecido a menudo de cierta falta de rigor conceptual, y que en realidad se puede objetar al reduccionismo radical sin necesidad de apelar a "revoluciones" e "inconmensurabilidades". Tan pronto como se ofrece un concepto exacto y verosímil de reducción se comprueban dos cosas: a) que las consecuencias epistemológicas y ontológicas de las reducciones, caso de existir, son mucho menos importantes de lo que la discusión ha sugerido; y b) que hay muchos menos casos genuinos de reducción de lo que parece y de lo que en obras de divulgación científica suele sugerirse. Y para darse cuenta de ello no es necesario constatar ninguna "inconmensurabilidad", sino que basta con percatarse de que, incluso en el caso de teorías que pertenecen a una misma "familia" y que están vinculadas conceptualmente. reducir una teoría a otra es mucho más arduo de lo que puede esperarse, es una empresa que pocas veces ha culminado en un éxito total. Con otras palabras, incluso prescindiendo de la problemática de las revoluciones científicas y de la inconmensurabilidad, lo cierto es que se han sobrevalorado las posibilidades de reducir unas teorías a otras.
374
FüNDAME?;TOS DE F I L O S O F ~DE ~ L.4 CIENCIA
A esta dificultad se añade el hecho (debido precisamente a la falta de rigor en el tratamiento del problema) de que muchos supuestos ejemplos de reducciones no conesponden en realidad al concepto de redtrcciórí esacta, que es la reducción propiamentr dicha, sino a lo sumo a lo que podemos llamar una r-edzicciór~apronitnariipa.De hecho, la relación de aproximación como relación interteórica, ya sea de carácter reductivo o no, es mucho más importante y frecuente que la reducción exacta, y aunque en algunos casos la aproximación revela ciertas semejanzas estructurales con la reducción, sería erróneo equiparar y aún más identificar ambos conceptos. Muchos ejemplos que se han dado en la literatura científica o filosófica de reducciones revelan ser, ante un examen más cuidadoso, solamente aproximaciones: éste es el caso para la supuesta reducción de la teoría planetaria de Kepler a la teoría de la gravitación de Newton, de la termodinámica a la mecánica estadística, de la mecánica clásica a la relativista, de la genética mendeliana a la genética de poblaciones, etc. La relación interteórica de aproximación es, sin embargo, de naturaleza esencialmente más complicada que otras relaciones interteóricas, en especial la reducción, y su tratamiento requeriría de cierto nivel de tecnicismos que no podemos desarrollar en este libro. No obstante las prevenciones que hemos formulado sobre la tendencia a sobrevalorar el tema de la reducción en la ciencia, no cabe duda de que se trata de un tipo importante de relación interteórica, que conviene precisar y para el cual hay ejemplos concretos e interesantes. Casos claros de reducción (exacta) de teorías son: la reducción de la mecánica (cartesiana) del choque a la mecánica (newtoniana) de partículas, de la mecánica del sólido rígido a la mecánica de partículas, de la teoría de los gases ideales a la teoría cinética, de la electrostática a la electrodinámica y de la genética mendeliana a (cierta versión de) la biología molecular; probablemente haya otros varios casos que aún no han sido reconstruidos con detalle. Estos casos paradigmáticos de reducciones y las intuiciones asociadas a ellos pueden guiamos a la hora de formular un concepto viable y bien fundado de reducción, que además nos pudiera servir más adelante como base para tratar adecuadamente su "pariente próximo", la aproximación reductiva, la cual sin duda reviste cierta analogía con la reducción exacta. La intuición básica de la reducción puede ser interpretada tanto en una perspectiva diacrónica como en una sincrónica. Diacrónicamente, la teoría reducida T precede a la teoría reductora P en el sentido de que representa un estadio más "elemental", más "simple", de nuestro conocimiento de determinada parcela de la realidad. En cierto modo, T ha de quedar "cubierta" por P en el sentido de que los logros positivos de T estarán aunque probablemente no a la inversa. contenidos también en los logros positivos de P.', Podemos decir que, sobre el mismo dominio empírico, T"; dice lo mismo que ya decía T, pero lo dice mejor, y además dice otras cosas que nunca dijo I: Desde el punto de vista sincrónico, la teoría reducida T con frecuencia representa un modo más rápido y expedito, pero también "más grosero" de resolver los mismos problemas que se plantean en la teoría reductora P. Es decir, la teoría reducida simplifica la formulación de los problemas y las aplicaciones propuestas, haciéndolas más asequibles que su teoría reductora, aunque al precio de negligir ciertas informaciones relevantes. Así, por ejemplo, podemos tratar del choque de dos esferas macizas olvidándonos de cómo esas esferas están compuestas de partículas unidas entre sí por ciertas fuerzas de cohesión; o podemos predecir el cambio de
RELACIONES I';TEFCU~RIC,\S
375
volumen que sufrirá un gas al ser sometido a cierta presión sin preocuparnos del movimiento de las moléculas en el interior del gas. La cuestión que nos planteamos ahora es la de cómo desarroIIar un concepto genera1 de reducción que responda a estos ejemplos y a la idea intuitiva que ellos sugieren. Hemos dicho que la teoría reductora se refiere en lo esencial al mismo campo de la experiencia y que contiene la misma información, y más, que la que provee la teoría reducida. Ello sugiere dos cosas. Por un lado, que ambas teorías estarán vinculadas semánticamente, y por tanto que habrá una conexión entre los conceptos de ambas. Y por otro, que las aseveraciones sobre el mundo que hace la teoría reductora son "más fuertes" que las que hace la reducida, pero no incompatibles con ellas. Estos dos requisitos intuitivos de la reducción han sido explicitados en la concepción axiomática de las teorías como las dos condiciones fundamentales de toda reducción: la condición de conectabilidad y la de derivabilidad. Cuando en el capítulo 8 presentamos la noción de teoría axiomática ya dimos una primera idea de esta noción de reducción (sin tener entonces en cuenta los aspectos empíricos). Recuérdese (cap. 8, 61) que lo esencial consistía entonces en que una teoría reduce a otra si se pueden definir los términos primitivos de la segunda mediante términos primitivos de la primera de modo que los axiomas de la segunda se deriven de los axiomas de la primera más estas definiciones. Éste es el núcleo de la idea clásica de reducción (dos referencias básicas para la misma son Kemeny y Oppenheim, 1956, y Nagel, 196 1, cap. 11). El requisito de conectabilidad exige que, para disponer de una formulación explícita de la reducción de T a P,se establezcan ciertas "dzfiniciones coordinadoras" entre todos los conceptos básicos de T y al menos algunos conceptos básicos de P.Estas definiciones tendrán en general la forma de condicionales que afirman que, si cierto concepto C de T se aplica a cierto dominio de objetos D, entonces necesariamente a este dominio D se aplicará(n) también cierto o ciertos conceptos Ci,..., Cn de T* "coordinados" con C. El segundo requisito, el de derivabilidad, exige que las leyes de T sean todas deducibles de las leyes básicas de T:junto con las definiciones coordinadoras (y eventualmente algunos enunciados más particulares sobre condiciones iniciales). Tomemos el ejemplo de la reducción de la mecánica del sólido rígido a la mecánica newtoniana de partículas. En la primera, un concepto básico es el de sólido rígido y una ley básica es la de conservación del momento angular. En la segunda, tenemos como concepto básico el de partícula y las leyes básicas son el Segundo Principio de Newton y la ley de acción y reacción. Pues bien, para reducir la primera teona a la segunda hay que establecer primero una definición coordinadora del concepto de sólido rígido en términos del concepto de partícula, por la cual se define un sólido rígido como un conjunto de partículas que mantienen distancias constantes entre sí (y análogamente con las restantes nociones propias de la teoría reducida); y luego hay que demostrar que, de las leyes de Newton, más la mencionada definición coordinadora, se deduce la ley de la conservación del momento angular. Debe notarse que aunque las definiciones coordinadoras son afirmaciones generales cargadas (si la reducción es viable) de cierta noinicidnd ("necesidad" en virtud de la naturaleza), no se trata de leyes usuales; se trata más bien de relaciones de constitución (sobre esto, cf. más adelante la última sección).
Este análisis de la noción de reducción apunta, en lo esencial, en la dirección correcta; sin embargo, cuando la queremos aplicar a casos concretos, nos percatamos de que adolece aún de deficiencias. de que es demasiado simplista o idealizada. Ella enfrenta sobre todo dos problemas: (i) muchas veces es difícil o inverosímil establecer para cada uno de los conceptos básicos de Tuna definición coordinadora con conceptos de P;(ii) la deducción de las leyes de T a partir de las de T^ muchas veces no puede llevarse a cabo formalmente, ya sea porque nos faltan precisamente las definiciones coordinadoras (o ]as que se han propuesto son intuitivamente inaceptables), o bien porque la derivación requiere, además, de ciertos postulados o supuestos adicionales difíciles de formular o variables según el tipo de aplicación. Por ello, aun cuando podemos conservar la noción general de reducción estipulada antes, es conveniente tomar un enfoque "más global", que no adolezca de las dificultades señaladas. De nuevo nos ayudará aquí la versión modeloteónca. Los requisitos fundamentales serán ahora, dicho de manera intuitiva, los siguientes. Primero, en vez de estipular una coordinación para cada uno de los conceptos de T tomado singularmente, requeriremos simplemente una "correspondencia global" entre el marco conceptual de T y el de P;eila será formalmente una relación entre Mp(T) y Mp(T*). Ahora bien, tal correlación no sólo deberá existir a nivel de los modelos potenciales respectivos, sino también a nivel de las aplicaciones I(T) e I(F),o sea, de las porciones del mundo empírico a las que pretenden aplicarse ambas teorías; toda aplicación intencional de T deberá tener su correlato en P, pero no necesarimente a la inversa (en general, TXtendrá un mayor campo de aplicación que T). La correlación entre I(T) e l(T*), formalmente hablando, no será exactamente la misma relación que la que se da entre Mp(T) y Mp(T4), pues recuérdese que las aplicaciones intencionales son modelos parciales, esto es, subestructuras resultantes de "recortar" de los modelos potenciales sus constituyentes T-teóricos; sin embargo, es una relación "derivada" de la primera, en el sentido de que es esta misma restringida a las subestructuras en cuestión. Finalmente, el requisito de derivabilidad de las leyes adoptará en esta interpretación modeloteórica la siguiente forma. Aunque no podamos decir, en sentido estricto, que las leyes de T se deducen de Ias de P,no obstante podremos postular una condición intuitivamente análoga: siempre que una aplicación cumpla las leyes de P,es decir, sea extensible a un modelo actual de F ,y adernás cumpla ciertas condiciones específicas, es decir, sea extensible a un modelo actual de ulza especialización de F ,llamémosla Ff, entonces en T el correlato de esa aplicación cumplirá las leyes de la teoría reducida T, o sea, será extensible a un modelo actual de T. Podemos ahora sintetizar estos requisitos en la siguiente definición; en ella, denotamos añadiendo el subíndice 'e' a la relación que cualquier relación entre modelos potenciales genera a nivel empírico (T-noteórico): si p es una relación entre modelos potenciales, p, es el resultado de recortar los constituyentes T-teóricos de los modelos potenciaIes de 10s pares de p, esto es, p, = r[p]. La idea que hay detrás es que en la reducción no se usa "toda" la teoría reductora sino sólo parte de ella, determinada especialización (en la definición que sigue, y para simplificar la notación, no usaremos la noción de red teórica sino la de elemento teórico y consideraremos que la teoría reductora es un elemento teórico que tiene especializaciones; recuérdese que la relación o es la relación de especialización entre elementos teóricos, cf. cap. 10, $5).
Definición 11.3: Sean Mp(T), M(7), I(T), respectivamente, los conjuntos de modelos potenciales, modelos actuales y aplicaciones intencionales de T. y análogamente Mp(T*). M(T*), I(T*) respecto de T*. T es reducible a T:si y sólo si existe una relación p tal que: (1) P c M p ( 0 x MPV*). (2) I(T) E Dom Pt y pc[I(T)I G I(T*). (3) Vy, y* (<y, y*> E p, A ya E I(T*) + (3T*'(T4' O P A y* E r[M(P')]) y E r[M(T)I 1)La primera condición establece simplemente que ambas teorías están "globalmente correlacionadas" a nivel de sus marcos conceptuales. La segunda condición establece que la relación p, generada por p a nivel no-teórico (empírico) conecta también globalmente las aplicaciones, con la especificación adicional de que toda aplicación intencional de T deberá tener un correlato en T* (aunque no necesariamente a la inversa). La tercera condición dice, de cada par de aplicaciones correlacionadas, que si la "aplicación reductora" cumple ciertas leyes especiales de la teoría reductora (más, por supuesto, las leyes fundamentales de la misma), entonces la "aplicación reducida" cumplirá necesariamente las leyes fundamentales de la teoría reducida. En este sentido, dichas leyes se "derivan" de las primeras: que cierta aplicación es subsumible bajo la teoría reductora implica que su correlato es subsumible bajo la teoría reducida; esto es, que la reducida se aplique con éxito "se deriva" de que la reductora se aplica con éxito. Por otro lado, debe notarse que la condición (3) no exige que la especialización de T+sea siempre la misma para cada par de aplicaciones correlacionadas; en algunos casos puede que sea así, pero en otros la especialización escogida puede que varíe según ciertos tipos de aplicaciones intencionales consideradas en una y otra teoría.
4.
Equivalencia
La relación de equivalencia entre teorías también ha jugado un papel considerable en discusiones epistemológicas generales, aunque quizá no de manera tan controvertida como en el caso de la reducción. La significación de la equivalencia en términos generales estriba en que, cuando ella se da, dos teorías que a primera vista parecen muy distintas por sus conceptos y Ieyes, resulta, no obstante, que "hablan de lo mismo" o que aportan la misma información sobre la misma porción de realidad. De ahí puede inferirse fácilmente la conclusión epistemológica general de que no tiene por qué haber univocidad en el tratamiento teórico adecuado de la misma parcela de nuestra experiencia. Diversas teorías pueden ser igualmente aptas para explicar e1 mundo que nos rodea, ninguna de ellas es la verdadera en un sentido absoluto. Así, por ejemplo, podemos desarrollar una teoría de las relaciones espaciales en la que partimos del concepto básico de "punto geométrico" y definimos las líneas como sucesiones infinitas de puntos; o bien, alternativamente, pode-
378
FUNDAhlE\TOS DE F I L O S O F DE ~ ~ LA CIENCIA
mos partir del concepto de "línea recta" como concepto básico y definir los "punros" como las intersecciones de líneas rectas. Si escogemos bien los axiomas dz una y oira teoría, la que trata primordialmente de puntos y la que trata primordialmente de h e a s , constataremos que, aunque aparentemente las dos teorías hablan de cosas distintas, ambas establecen exactamente las mismas relaciones espaciales entre los objetos que podemos comprobar en nuestra experiencia cotidiana, y en este sentido "hablan de lo mismo". En otro campo, el del movimiento de los cuerpos, constatamos que la teoría mecánica de Newton y la teoría mecánica de Lagrange, aunque construidas sobre conceptos y principios distintos, conducen a los mismos resultados empíricos sobre el movimiento de los cuerpos en general; por ello es frecuente leer en los libros de texto de física que la mecánica newtoniana y la mecánica lagrangiana son dos "formuiaciones equivalentes" de la mecánica clásica. Al tratar el tema de la equivalencia de teorías y sus consecuencias epistemclógicas conviene, sin embargo, distinguir dos tipos generales de equivalencia que muchas veces se confunden: la que podemos llamar equii~aleitciafuerte, o equivalencia "en sentido estricto", y la que llamaremos equivalencia empírica, que es más débil. En el primer caso, aunque conceptos y leyes de una y otra teoría sean distintos, hay una correspondencia plena y biunívoca entre ambas teorías, de modo que todo lo que puede decirse en la primera teoría puede traducirse sin pérdida de información a la segunda, y viceversa. Es decir, hay una correspondencia exacta entre ambas teorías tanto a nivel conceptual como a nivel del contenido de sus afirmaciones respectivas. El ejemplo de la correlación entre una "geometría de puntos" y una "geometría de líneas" es de esta naturaleza. En el caso de la equivalencia empírica, más débil, ese paralelismo sólo se da a nivel de los datos empíricos que cubren ambas teorías: todo dato predicho por una teoría es también predicho por la otra, y a la inversa. Y, sin embargo, puede que no haya una correlación plena ni entre los conceptos ni entre las Ieyes de ambas teorías, de modo que no pueden derivarse las leyes de una teoría a partir de las de la otra, ni a la inversa. En tales casos pueden existir serias divergencias teóricas entre ambas teorías, las cuales, no obstante, no se traducen en divergencias en el campo de lo que podemos experimentar: las teorías dicen "más" de lo que dice la experiencia que ellas cubren. Es en este caso en el que piensa Quine cuando insiste en la Tesis de la Indeterminación de la Teoría por la Experiencia: el mismo dominio de datos experimentales es igualmente compatible con dos o más teorías, las cuales, sin embargo, son incompatibles entre sí a nivel teórico (de ello nos ocuparemos por extenso cuando estudiemos en el próximo capítulo el problema de la inducción; recuérdese también el argumento de van Fraassen que examinamos en el capítulo 10). Si bien la equivalenciafierte o estricta aparece con bastante frecuencia no sólo en geometría, sino en la mayoría de las ramas de la matemática pura, es dudoso que ella juegue un gran papel en las ciencias empíricas propiamente dichas (excepto en casos triviales como el de dos teorías físicas que se distinguen solamente por un cambio de notación). Se ha solido señalar el ejemplo, ya mencionado, de la relación entre la mecánica de Newton y la de Lagrange como caso de equivalencia fuerte en la física; sin embargo,
un análisis formal detenido de este ejemplo, como el que se ha realizado dentro de la concepción estructuralista, muestra que la equivalencia fuerte es válida sólo si se hacen ciertos supuestos (generalmente implícitos) acerca de la estructura global de ambas teorías que están lejos de haber sido confirmados (cf. Balzer, iMoulines y Sneed, 1987, cap. VI, $5.1). La cuestión de la equivalencia "Newton-Lagrange" sigue, en realidad, abierta. Con más razón aún puede decirse ello de otros ejemplos que suelen aducirse en la física, como la supuesta equivalencia entre la mecánica de Newton y la de Hamilton, o entre la mecánica ondulatoria y la mecánica de matrices en la física cuántica; lo más probabIe es que éstos sean sólo casos de equivalencia empírica. Dada la importancia de la distinción entre equivalencia fuerte y equivalencia empírica, conviene establecerla de la manera más rigurosa posible, pues ello también puede facilitar el examen de ejemplos concretos. Utilicemos de nuevo para ello nuestro aparato modeloteórico habitual. Hemos dicho, de manera intuitiva, que en el caso de la equivalencia fuerte todo lo que puede decirse en una teoría halla su correlato exacto en la otra, y a la inversa; o sea que hay un paralelismo estricto tanto a nivel del aparato conceptual como de las leyes y sus aplicaciones. En nuestros términos modeloteóricos ello significa una correlación tanto a nivel de los modelos potenciales y aplicaciones intencionales como a nivel de los modelos actuales. Y tomando en cuenta la noción de reducción que hemos explicado más arriba es plausible entonces interpretar la equivalencia entre dos teorías como reducción "de doble vía": una teoría es equivalente a otra cuando la primera es reducible a la segunda y la segunda lo es a la primera. Llegamos así a la siguiente definición.
Definición 11.4:
TI es equivalente en sentidofiderte a Tz si y sólo si TI es reducible a T2 y T2 es reducible a T I (en el sentido de la Def. 1 1.3). La elucidación de la equivalencia meramente empírica no es tan inmediata y requiere de una decisión previa acerca de qué se debz entender por "igualdad de datos empíricos". En el espíritu de muchos autores está la idea de apelar a situaciones observacionales neutrales; sin embargo, en diversas ocasiones en esta obra hemos señalado el carácter problemático de la idea de una "observación pura", y hemos constatado la necesidad de separar en principio las nociones de observabilidad y empiricidad y admitir sólo una "empiricidad" relativa a cada teoría. Dentro de nuestro marco modeloteórico, esa noción viene fijada por el dominio de las aplicaciones intencionales de cada teoría. De acuerdo a esta interpretación, la equivalencia empírica entre dos teorías consistirá entonces en una equivalencia meramente al nivel de las aplicaciones intencionales: una correlación entre los dominios de aplicaciones intencionales de ambas teorías de tal naturaleza que, siempre que una aplicación intencional de una teoría sea extensible a un modelo actual de la misma (o sea, cumpla las leyes de esa teoría), entonces su conelato en la otra teoría cumplirá lo mismo, y recíprocamente. He aquí la especificación formal de esta idea
(para simplificar, no hacemos mención en ella de las restricciones cruzadas o condiciones de ligadura, cf. cap. 10, $5).
Definición 11.5: TI es ernpíricameiíte equii*aIeiztea T2si y sólo si existe una relación E tal que: (1) E c ](TI) x l(T2). (2) V ~ Iy2, ( C ~ Iy+, E E + C y t E r[M(Ti)] ++y2 E r[M(T:)])). Nótese que, en esta definición de equivalencia empírica, no se especifica nada acerca de cómo estén correlacionados los modelos potenciales de ambas teorías, si es que 10 están de alguna manera; tampoco se dice nada acerca de los modelos actuales; en particular, no se infiere de ella que si un modelo actual .ul de TI tuviera un correlato xz en T2,este último sería necesariamente también un modelo actual de T2.
5. Apéndice: Ciencia especial y ciencia básica; reducción, múltiple realizabilidad y superveniencia (*) En esta última sección vamos a retomar el problema de la relación entre las ciencias especiales y la ciencia básica. Aunque en la literatura se plantea el problema sobre todo en relación a la psicología y la neurociencia (problema mente-cerebro), conceptualmente el problema es general. Se trata de precisar la supuesta "relación de dependencia" entre diversos pares de disciplinas científicas; por ejemplo, psicologíalneurología, lingüísticaípsico-socioIogía,biologíaíquímica, o química/física; en realidad plantear esta cuestión para disciplinas enteras es inapropiado, lo adecuado sería hablar de la relación de dependencia entre teorías concretas de estos pares de disciplinas. La cuestión es pues determinar hasta qué punto las explicaciones de (teorías de) las ciencias especiales "descansan" en explicaciones de (teorías de) ciencias más básicas, hasta llegar eventualmente, mediante una cadena de sucesivas dependencias explicativas, a una supuesta ciencia básica (jrnicrofísica?). Hicimos algunas consideraciones preliminares sobre esta cuestión en el capítulo 5, cuando examinamos la noción de ley y también al comienzo de la sección 3 de este no estricta o ley ceteris paribus (W), capítulo, al presentar la idea de reducción. Vamos a examinar ahora las diferentes posiciones al respecto con un poco más de detalle. Aunque algunos aspectos de este problema se pueden tratar más satisfactoriamente desde una perspectiva modeloteórica global, vamos a limitamos ahora a la perspectiva axiomática "enunciativa" clásica, pues así es como se presenta y discute en la literatura y los aspectos a que nos vamos a ceñir en este apéndice pueden abordarse de modo interesante ya en términos tradicionales. Recordemos que en la perspectiva axiomática clásica las relaciones de dependencia o reducción se contemplan, no de forma global, sino de forma local, término-a-término (concepto-a-concepto, propiedad-a-propiedad). Se trata de ver hasta qué punto un
recurso conceptual de una teoría es "dependiente en su función explicativa" de otros recursos conceptuales de otras teorías "más básicas". O en términos de propiedades, hasta qué punto unas propiedades "macro" dependen de, o se reducen a, propiedades "micro". La intuición, p.ej. en el caso de la psicología, es que puesto que los psiquisrnos, las mentes, están alojados en los cerebros y éstos están compuestos de neuronas, las propiedades psíquicas dependen de algún modo de propiedades neurológicas; o puesto que Ias sustancias químicas están formadas por partículas físicas, las propiedades químicas dependen de algún modo (son el resultado) de propiedades físicas; y análogamente en los restantes casos. A Ias primeras las vamos a considerar teorías macro, y a las segundas teorías micro. Antes de abordar directamente este problema vamos a presentar dos distinciones importantes en relación al mismo.
5.1. D i s r i x c r o ~ ~PREVIAS: s TÉRSIINOS GENERALES, COSCEPTOS EXPRESADOS Y ENTIDADES DENmADAS; ACAECIS1IE.UTO-UEXIPLAR Y ACAECISIIENTO-TIPO Expresada en términos lingüísticos, la cuestión que vamos a tratar consiste en determinar cuál es la relación entre los conceptos expresados, y las propiedades denotadas, por los predicados de las teorías macro y los predicados de las teorías micro. La primera distinción tiene que ver con los diferentes niveles que se hallan involucrados en las diversas alternativas, el lingüístico, el conceptual o semántico, y el ontológico. En lo que sigue, distinguiremos cuidadosamente entre: a ) los términos generales o predicados, como 'agua', 'rojo', 'sentir dolor', o 'H20'; b) los conceptos (significados o contenidos conceptuales) expresados por los términos generales, como el concepto de agua, el de rojo, el de sentir dolor, o el de molécula formada por dos dtornos de hidrógetzo y ~ ( 1 2 0de oxígeno; y c) las entidades, sustancias o propiedades, denotadas por los términos generales, como la sustancia asua, la propiedad de ser rojo, la de sentir dolor, etc. (a diferencia del resto de la obra, en este apéndice no usaremos cursivas para las mayúsculas que refieren a propiedades porque las cursivas se reservan para los conceptos). Puesto que a veces se usa 'significado' de modo ambizuo, para referirse unas veces al concepto expresado y otras a la entidad denotada, en general tenderemos a no usar dicho término y hablar directamente de los conceptos expresados o las entidades denotadas; en la medida en que lo usemos, lo usaremos, salvo advertencia en contrario, con el primer sentido. Insistimos en que esta distinción es fundamental, pues se puede defender que aunque, los significados conceptuales de dos predicados de dos ciencias son diferentes, ambos denotan la misma entidad. La segunda distinción, en términos de la cual se suelen presentar las diferentes alternativas en la literatura, es entre acnecimientos tipo ( ' h p e ' ) y acaecimientos ejemplar ('token'). Recordemos (cf. cap. 5, $3) que los acaecimientos son determinada especie de entidades particulares. Un objeto particular es cualquier entidad espacial y10 temporalmente localizada (p.ej. el auto de Adela, esta pantalla de ordenador, el cuerpo calloso del cerebro de Quine, la iinagen de la estatua de Colón en el córtex de Pedro ayer a las 14,30, etc.); los acaecimientos particulares (tanto los procesos como los estados) son cualquier
cosa que ocurre o silcede en cierto lugar durante cieno intervalo temporal (p.ej. la batalla de Waterloo, el último partido de fútbol Barcelona-Madrid, la salida de Juan de la carretera ayer en la Costa Brava, etc.). Tanto objetos como acaecimientos son entidades particulares que pueden tener diversas propiedades. Un mismo objeto particular puede tener muchas propiedades diferentes (p.ej. esto que está aquí abajo tiene la propiedad de ser una silla. pero también las de ser azul, ser cómoda, estar aquí debajo, o ser mencionado en este libro); también un mismo acaecimiento particular puede tener di~ersaspropiedades (p.ej. eso que ocumó el martes sobre la estatua de Colón de Barcelona tiene la propiedad de ser la caída de un rayo, pero también las de ocunir de día, asustar a Rosa, producir un cortocircuito en el funicular, ocumr sobre la estatua de Colón, o ser mencionado en este escrito). Cada particular concreto (objeto o acaecimiento) es un caso o ejelttplar ('token') de las propiedades que ejemplifica. Dos ejemplares son del mismo tipo ('r)pe5)si comparten determinada propiedad. El auto de José y el de Adela son dos ejemplares diferentes de un mismo tipo (de objeto), Opel Corsa; la enfermedad de Rosa -y la de Pedro son ejemplares diferentes de un mismo tipo (de proceso), infección gripal; la disfunción de María y la de Fernando son ejemplares diferentes de un mismo tipo (de estado), amnesia; los estados mentales de Enrique y Eugenia en la Nochevieja de 1996 son ejemplares de un mismo tipo, creencia de que en el Año Nuevo de 1997 lloverá. Dos particulares son o no del mismo tipo dependiendo de las propiedades que se tomen en consideración. Si consideramos cierta propiedad, el vehículo de José y el de Adela son del mismo tipo, un automóvil Opel Corsa, y de diferente tipo que el de Eduardo, un Seat Ibiza. Si consideramos otra propiedad, los tres son del mismo tipo, a saber, "vehículo a motor ligero de cuatro rue.das3', y de diferente tipo, por ejemplo, que la motocicleta de Luis. Y aún, según otra propiedad, los coches de Adela, Eduardo y José y la motocicleta de Luis son del mismo tipo "vehículo terrestre a motor", y de diferente tipo que la bicicleta de Pedro o el barco de vela de Ana. Etcétera. Y lo mis~noocurre con 10s acaecimientos. Según se considere cierta propiedad, lo que le pasó a Juan ayer en la Costa Brava y lo que le pasó en Nochevieja a Rosa son acaecinljentos del mismo tipo, accidentes de auto, y de diferente tipo a lo que le ha pasado esta mañana a Luis, un accidente de tren. Pero si consideramos otra propiedad más abstracta o general, los tres acaecimientos son de1 mismo tipo, accidentes, y d e diferente tipo que lo acaecido en Año Nuevo a Marta, recibir un premio de lotería. Etcétera. Así pues, hablar de tipos de objetos o acaecimientos no es en el fondo sino otro modo de hablar de determinada propiedad que ejemplifican. Esta distinción es importante para no confundir cuestiones diferentes. La pregunta acerca de si la creencia de Enrique de que lloverá en el Año Nuevo de 1997 es o no la misma entidad que el acaecimiento cerebral de tener las neuronas H en el estado 23, es ambigua. Una cosa es si son el mismo acaecimiento tokelt y otra si son el mismo acaecimiento Qpe, esto es, el mismo tipo de acaecimiento: si la propiedad de ser tal creencia es la misma propiedad que la de tener tales neuronas en tal estado. Como veremos, puede defenderse que son el mismo acaecimiento-ejemplar pero diferentes acaecimientos-tipo, es decir, que es un único acaecimiento particular que tiene dos propiedades diferentes (análogamente a
como eso que ocurrió sobre la estatua dc Colón tiene propiedades diferentes). En lo que sigue será esencial tener presente esta distinción.
El grado máximo de dependencia entre una ciencia especia1 y una ciencia básica, o mejor entre predicados de la primera y de la segunda, es el reduccionismo sernántico: los dos predicados significan lo mismo, son sinónimos, expresan el mismo concepto. 0, si se prefiere, uno da el significado del otro: el concepto expresado por el predicado 'E' de la ciencia especial se reduce a, se identifica con, el concepto expresado por determinado predicado 'B' de la ciencia básica. Se trata pues de una identidad entre los conceptos expresados o significados por ambos predicados. Ejemplos independientes de la relación entre ciencias especiales y ciencia básica provienen de los casos usuales de sinonimia en los que una expresión explicita el significado conceptual de otra. Por ejemplo, 'soltero' y 'varón adulto no casado'; o más interesante, 'agua' y (supongamos) 'sustancia inodora e insípida, que en estado líquido es (sin impurezas) incolora y que (en diversas disoluciones) confornla los lagos, ríos y mares; que en estado sólido constituye las nieves, hielos, etc.'. Así, aunque las expresiones lingüísticas 'agua' y 'sustancia incolora, [etc.]' son expresiones linpüísticas diferentes, los conceptos agua y sustancia incolora, [etc.] son el mismo concepto, análogamente a como las diferentes expresiones 'silla' y 'chair' expresan el mismo concepto silla (aunque en este caso una no "da" el significado de la otra). Ésta es la tesis que defendía el cond~ictianológico sobre la relación entre lo mental y lo conductual. Según los conductistas lógicos (cf. p.ej. Hempel, 1949; Ryle, 1949 y Wittgenstein, 1958), los predicados mzntales expresan conceptos conductuales disposicionales. Por ejemplo, 'tener sensación de dolor' y 'tener la disposición a chillar en tales circunstancias, a retorcerse en tales otras, a [etc.]' tienen el mismo significado conceptual; e1 concepto sensación de dolor y el concepto tener la disposición a chillar si ..., a retorcerse si... [etc.] son el mismo concepto, en el mismo sentido en que aglia y sustancia inodora, ins@ida [etc.] son el mismo concepto. Y análogamente, por ejemplo, con los predicados 'creer que va a llover la próxima hora' y (p.ej.) 'tener la disposición a tomar un paraguas si se desea salir de casa, a recoger la ropa si no se quiere que se moje, a [etc.]'. Si el conductismo lógico fuese correcto, esto sucedería con todo predicado mentalista. El modo de evaluar una hipótesis sobre una identidad conceptual específica es determinando si es o no conceprrialtnetirs posible que se ejernplifique una propiedad sin que se ejemplifique otra. Si 'E' expresa el mismo contenido conceptual que 'B', entonces una situación en la que un particular tensa la propiedad E y no tenga la propiedad B es conceptualmente imposible. Alternativamente: si tal situación es conceptualmente posible (incluso aunque no sea nómicamente posible), entonces los conceptos expresados por ambos predicados no pueden ser el mismo (sobre posibilidad conceptual y nómica, cf. cap. 5, $1). Ésta es la estrategia que usó Putnam para "refutar" el conductismo lógico. Putnam (cf. 1963) diseñó un experimento mental que a su juicio presenta una situación
perfectamente concebible (aunque quizá biológicamente imposible) en la que unos sujetos (super-super-espartanos, los denomina) tienen dolor pero no tienen ninguna disposición a la conducta, no ya gestual sino ni siquiera verbal. El conductismo lógico radical tiene otros problemas, como los derivados del holismo de lo mental, que no vamos a comentar aquí. Tras su, por lo general reconocido, fracaso, algunos filósofos de la psicología han propuesto otra alternativa también re-duccionista conceptual pero mucho más plausible. Se trata delfirl~cioilalisinoai7alític0, según el cual los predicados mentalistas significan conceptos funcionales, donde un concepto funcional es un concepto que establece las relaciones de causa-efecto, el rol causal, de los estados de un sistema computacional (cf. p.ej. Putnam, 1967; Fodor, 1968 y Lewis, 1972; para una buena exposición, García-Carpintero, 1995).
El reduccionismo sernántico, incluso si se da en algunas ocasiones (por ejemplo, entre predicados mentalistas y funcionalistas, si los funcionalistas analíticos tienen razón), es demasiado fuerte para dar cuenta de todas las situaciones en que consideramos intuitivamente que unas explicaciones dependen de otras. Es obvio que si los conceptos expresados son los mismos, las propiedades denotadas también lo serán. Pero muchas veces ocurre lo segundo sin lo primero, los predicados denotan la misma propiedad aunque signifiquen conceptos diferentes. Este tipo de situación en la que términos lingüísticos que expresan contenidos conceptuales diferentes denotan o refieren una misma entidad son conocidas de antiguo y tematizadas en semántica al menos desde Frege. La distinción fregeana entre el sentido y la referencia de una expresión pretende justamente dar cuenta de ella; esto es lo que sucede con las descripciones 'la mujer de Edipo' y 'la madre de Edipo', puesto que ambas nombran a Yocasta, o en el ejemplo preferido de Frege, entre 'la estrella de la mañana' y 'la estrella de la tarde', que nombran a Venus. Pues bien, algo anáIogo sucede con algunos predicados o términos generales. Los casos interesantes, a nuestros actuales efectos, son aquellos en los que (contrariamente a lo que sucede con las diferentes descripciones para Venus o Yocasta) uno de los predicados se puede considerar más básico o más fundamental que el otro. Esto es lo que sucede, por ejemplo, con 'agua' y 'H2Oy, o con 'temperatura' y 'energía cinética media'. Hemos visto que 'agua' no significa conceptualmente lo mismo que 'H-O', 'agua' no expresa el concepto sustancia corzstiruida por ntoléculas foritzadas por dos átomos de hidrógeno y lrito de o.xíge?zo. Si significara dicho concepto, todo usuario competente del predicado 'agua' debería poseer dicho concepto, lo que no es el caso; dicho término se ha usado competentemente durante siglos antes del descubrimiento de la química molecular, antes de disponer del concepto de ri~olécula,y todavía hoy muchos de los usuarios competentes de dicho término no tienen ni idea de química. Y lo mismo sucede con 'temperatura', un predicado del lenguaje ordinario, y también de una teoría científica sencilla, la termodinámica fenomenológica, y 'energía cinética media', un predicado de la mecánica estadística. Aunque 'temperatura' y 'energía cinética media' significan conceptos diferentes (el primero se
usaba correctamente antes de saber nada de mecánica, y menos de mecánica estadística) de hecho denotan la misma magnitud física (algo que ignoran la mayoría de los usuarios competentes del primer predicado). La temperatura es la energía cinética media, como e1 agua es HrO. En este sentido una propiedad se redlee a, depende de, o descansa en otra; no son sólo los mismos fenómenos-ejemplar, sino los mismos fenómenos-tipo. Por tanto, no hay en realidad dos propiedades diferentes tales que una descanse en otra. SóIo hay diferentes conceptos, la propiedad es la misma. El reduccionismo ontológico, la identidad de propiedades, es la posibilidad más fuerte después del reduccionismo semántico. El modo más radical de explicar cómo es que fenómenos que describimos mediante aparatos conceptuales diferentes son tales que uno descansa en otro, consiste en que no haya en realidad dos tipos de fenómenos sino sólo uno. Ésta es la tesis que defienden en filosofía de la psicología los llamados teóricos de la identidad psicofísica (cf. p.ej. Feigl, 1958 y Smart, 1959). Según estos autores, aunque el concepto sentir dolor no es el mismo concepto que tener Iasfibras H activadas, la propiedad de sentir dolor es de hecho la propiedad cerebral de tener las fibras H activadas, en exactamente el mismo sentido en que ser de agua es la misma propiedad que ser de H20, o "tener mayor temperatura que" es la misma propiedad (relacional) que "tener mayor energía cinética que". Los predicados mentalistas son nombres diferentes, que expresan conceptos diferentes, para las propiedades cerebrales.
Las hipótesis sobre identidades ontológicas son hipótesis empíricas y se deben evaluar por tanto empíricamente, investigando si de hecho el predicado 'E' denota efectivamente la misma propiedad o sustancia que el predicado 'B'. En muchos casos es sencillo ver que no es así, que el reduccionismo ontológico es todavía una hipótesis demasiado fuerte. El ejemplo más sencillo lo ofrecen las propiedades disposicionales, como las denotadas por los predicados 'elástico', '~oluble','frágil' o 'rojo'. Estos predicados expresan un concepto según el cual un objeto tiene la propiedad en cuestión si en determinadas circunstancias reacciona de cierto modo (cf. cap. 8, $4). Así, por ejemplo, un objeto es frágil si en caso de que se aplicara sobre él determinada presión tangencia1 el objeto se quebraría; o una superficie es roja si en caso de que incidiera sobre ella luz blanca la superficie absorbería tales frecuencias del espectro. Pues bien, las propiedades disposicionales descansan en propiedades físicas. Si un objeto es frágil lo es en virtud de ser microfísicamente como es; si una superficie es roja lo es en virtud de ser microfísicamente como es. Se dice entonces que las propiedades disposicionales macro se reali,-mz mediante propiedades físicas micro. Lo característico de estos casos es que ahora no podemos explicar esta dependencia entre propiedades macro y propiedades micro del modo más sencillo, a saber, mediante la identidad de propiedades, pues claramente cada propiedad disposicional no se puede ide~ztlficarcon rrna ~ínicapropiedad nzicrofisica. Las propiedades disposicionales se reafizalz mediante propiedades microfísicas, pero simplemente ocurre que 13 propiedad microfísica que realiza la propiedad disposicional no es la
misma en todos los casos. En cada caso particular de objeto frágil, la fragilidad "se debe" a cierta propiedad microfísica del objeto, pero en diferentes objetos la propiedad rea!izadora es diferenre. En unos objetos, por ejemplo los de yeso, la fragilidad se realiza mediante una propiedad física; en otros, por ejemplo los de vidrio, se resliza mediante otra diferente. El yeso y el vidrio son ambos frágiles y sin embargo microfísicamente no tienen nada en común (salvo, claro está, que ambos "realizan" la fragilidad). Lo mismo sucede con el resto de las propiedades disposicionales. Por ejemplo, una determinada tela y una determinada superficie plástica pueden ser ambas rojas, pero microfísicamente no tienen nada en común; la propiedad microfísica que realiza la rojez es diferente en cada caso. A esta característica, ejemplificada típicamente por las propiedades disposicionales, se la suele denominar tnúltiple realizabilidad. Una propiedad macro es múltiplemente realizable si: a ) el que cada objeto particular la tenga depende de que el objeto tenga determinada propiedad micro, pero b) en diferentes objetos particulares la propiedad corresponde a diferentes propiedades rnicro. En tal caso, no sólo el concepto expresado por el predicado macro es diferente al expresado por predicados rnicro, sino que ni siquiera se puede identificar la propiedad macro con una propiedad micro determinada. Cuando las propiedades macro son múltiplemente realizables no es posible explicar la dependencia entre propiedades macro y propiedades rnicro reduciendo o ident@caiído las primeras con las segundas. En estos casos la identidad de tipos-propiedades, el reduccionismo ontológico, no es una explicación viable. Se puede pretender quizá que la propiedad inacro es idéntica, no a una propiedad micro "atómica" sino a una propiedad rnicro "disyuntiva". Así, si la propiedad macro E se realiza múltiplemente mediante las propiedades atómicas micro B1, B2, ..., Bn se podría identificar quizá la propiedad E con la "propiedad disyuntiva" B1-o-B2-...-o-Bri. Sin embargo esta estrategia del reduccionista requiere aceptar que cualquier disyunción (en general combinación) de propiedades es también una propiedad, lo cual en opinión de muchos requiere a su vez una metafísica de las propiedades inaceptable. Es muy implausible que cualquier predicado molecular denote una propiedad, al menos una propiedad izatural, que es de lo que aquí se trata. Una vez más surge aquí la cuestión de la diferencia entre propiedades "naturales" y "no naturales" en la que no vamos a detenemos aquí (cf. cap. 5, $2 y S6, y cap. 7,95 y $6). Según muchos críticos de la teoría de la identidad psicofísica, esta teoría está condenada al fracaso precisamente porque con las propiedades mentales pasa lo mismo que con las disposicionales, a saber, que aunque se realizan mediante propiedades neurobio-físicas, son también múltiplemente realizables y por tanto no se puede identifícar cada propiedad mental con una propiedad neuro-bio-física (de hecho, para muchos, las propiedades mentales son un tipo de propiedades disposicionales, a saber, propiedades funcionales). No sólo atribuimos algunas propiedades mentales básicas (p.ej. percepción de formas) a seres que no tienen una morfología neniosa como la nuestra (p.ej. pulpos), sino que, limitándonos a los humanos, ocurre que un mismo proceso mental, especialmente en capacidades complejas, puede realizarse mediante procesos cerebrales de diferente tipo; por ejemplo, cuando una zona del cerebro ha resultado dañada, una zona vecina morfológicamente diferente asume la función de la dañada (en esto consiste parte de la denominada plasticidad del cerebro).
RELACIONES IINTERTE~RICAS
DE PROPIEDADES CON IDENTIDAD DE EIEXIPLARB 5.5. DUALISMO
Y SUPERVENIENCIA
Cuando las propiedades macro se realizan múltiplemente mediante propiedades micro, no podemos explicar la dependencia de las primeras respecto de las segundas apelando a la identidad de tipos, a que simplemente las propiedades son idénticas. Y sin embargo hay que elucidar esa dependencia de algún modo, pues en un sentido preanalítico intuitivo unas "descansan" en otras (claramente en casos como las disposicionales y quizá también en otros casos). La dificultad reside en que en estos casos las propiedades micro realizadoras son efectivamente otras, esto es, dverentes a las propiedades macro que realizan. Así pues, cuando hay múltiple realizabilidad la identidad de tipos es inviable. Se pensará que todavía queda la identidad de ejemplares, pero la identidad de ejemplares por sí sola es demasiado poco, no puede dar cuenta de la dependencia entre los dos niveles. Pensemos en el acaecimiento en que se vio envuelto Juan ayer en la Costa Brava. Tenemos un mismo acaecimiento-ejemplar con diversas propiedades, por ejemplo, la propiedad de ser un accidente y la propiedad de ocurrir en primavera. Ambas propiedades son propiedades diferentes de[ mismo acaecimiento particular. Y no pensamos que haya una dependencia entre ambas propiedades, no pensamos que el que haya sido un ejemplar del tipo "accidente" depende de que haya sido un ejemplar del tipo "ocurrido en primavera", o viceversa. Sin embargo, en muchos casos, como los que involucran propiedades disposicionales, sí consideramos que hay tal dependencia. Aceptamos que un mismo objeto particular tiene diversas propiedades, la propiedad de ser frágil y la propiedad de tener tal y cual estructura microfísica, pero no nos basta con eso, pues creemos además que el que dicho objeto particular tenga la primera propiedad depende de que tiene la segunda. Aceptamos que un mismo acaecimiento-ejemplar tiene diversas propiedades, la propiedad de ser una sensación de dolor y la propiedad de activarse las fibras H, pero no nos basta con eso pues creemos además que el que dicho acaecimiento particular tenga la primera propiedad depende de que tiene la segunda. Debe quedar claro que si lo único que tenemos es identidad de ejemplares dicha dependencia queda inexplicada. Para dar cuenta de estos casos se recurre a la noción de szlperveniencia, un tipo de dependencia más débil que la identidad de tipos (aunque la incluye como caso extremo). La idea es la siguiente. Lo que distingue a los casos en que no hay dependencia (como el del accidente) de aquellos en que sí la hay (como el de la fragilidad) es, por decirlo tautológicamente, que en el primero la ejemplificación de una propiedad no depende de la ejemplificación por el mismo particular de otra propiedad. Es decir: el particular puede r un tener una propiedad y no tener la otra. El suceso de la Costa Brava podría ': ~ b e sido accidente sin haber ocurrido en primavera. Que un acaecimiento particular ejenplifique la propiedad de ser un accidente no depende de que se ejemplifique la de ocurrir en primavera. Eso no es así en los otros casos. Que un particular tenga la propiedad de ser frá,oil depende de que tenga determinada propiedad microfísica en el siguiente sentido: no puede ser que tenga ésta y no tenga aquélla. En general, pues, una propiedad rnacro E depende de (descansa en, se realiza mediante) una propiedad micro B si no es (fsicarnente)posible que un particular .r ejemplifique B y no ejemplifique E. Nótese que la conversa puede no
388
FUNDAhlEhTOS DE F I L O S O F DE ~ ~ LA CIENCIA
ser cierta, y de hecho no lo es, debido a la múltiple realizabilidad.pues E puede realizarse mediante otras propiedades micro B', B", ..., por lo que x puede ser E sin ser B (la conversa sólo es cierta cuando vale la identidad de tipos). Ésta es la idea de dependencia que intenta expresar la noción de supeweniencia. Una propiedad A superviene en otra B si no puede ser que un particular ejemplifique B y no ejemplifique A. En realidad la relación de supenreniencia se suele caracterizar, no para propiedades sueltas, sino para grupos de propiedades. Así, por ejemplo, decimos que las propiedades cromáticas supervienen sobre propiedades rnicrofísicas si no puede ser que dos particulares tengan las mismas propiedades microfísicas y no tengan la misma propiedad cromática; o que las propiedades mentales supervienen sobre propiedades bio-físicas si no puede ser que dos sujetos estén en el mismo tipo de estado bio-físico (el misnw en seno, e.e. compartiendo todas las propiedades bio-físicas) y estén en diferente estado mental. En general, las propiedades de la clase <P supervienen sobre propiedades de la clase Y si y sólo si dos particulares (objetos o acaecirnientos) que tienen las mismas propiedades Y tienen también las mismas propiedades 0.En este sentido "lo Qi" descansa, depende o se realiza en "lo Y". Esta idea general se puede precisar de diferentes modos, pero no vamos a detenemos aquí en ellos (cf. Kim 1984 y 1987 y Savellos y Yalgin (eds.) 1995). Para muchos autores, la "identidad de ejemplares con múltiple realizabilidad (e.e. sin identidad de tipos) más superveniencia" es la situación más común en las ciencias especiales. Las propiedades de las que se ocupan las ciencias especiales supervienen sobre propiedades microfísicas, éste es el grano de verdad que hay en elfisicalis~no.Pero por lo general la superveniencia no es identidad de tipos, las propiedades macro son múltiplemente realizables; la pretensión contraria es el grano de falsedad que hay en el fisicalismo reduccionisra. En algunos casos la supe~enjenciapuede derivarse de la identidad, quizá por ejemplo algunas propiedades químicas básicas son idénticas a propiedades físicas complejas. Pero a determinado nivel eso es muy implausible. Propiedades biológicas mínimamente "elevadas" son múltiplemente realizables, no se pueden identificar con una única propiedad bioquímica. Y lo mismo sucede, como hemos visto, con las propiedades mentales respecto de las propiedades neurológicas. Debe notarse que ésta es una tesis empírica, compatible con tesis conceptuales complementarias. Así, por ejemplo, en psicología se puede defender como tesis conceptual cierto reduccionismo sernántico, como hacen los funcionalistas analíticos, según el cual los predicados mentalistas expresan conceptos funcionales-computacionales, y a la vez defender como tesis empírica que los predicados .mentalistas denotan propiedades (funcionales) que supervienen sobre, y se realizan múltiplemente en propiedades neurológicas. Además, para algunos de estos autores, como Fodor (cf. para lo que sigue Fodor, 1974), esta situación de las ciencias especiales explicaría el carácter no estricto de las leyes de las ciencias especiales, esto es, que sus leyes sean leyes ceteris paribus, que tengan excepciones (sobre estas nociones, cf. cap. 5, §4), aun cuando las leyes de la ciencia básica no las tengan. La existencia de excepciones se derivaría de que alguna de las propiedades micro que realizan la propiedad del antecedente de la ley macro podría no estar causalmente conectada con alguna propiedad de las que realizan la propiedad del consecuente de dicha ley. La situación se recoge en el siguiente gráfico.
CIENCIA ESPECIAL
CIENCIABASICA
-
~ l ( x ) 62(x)...
En(*...
BMx)...
8'1(fi
B'2(y) ...
Wp(y)...
Esta situación ilumina, según Fodor, un hecho aparentemente paradójico, a saber, que las leyes de las ciencias especiales tengan excepciones a pesar de que descansan sobre leyes de la ciencia básica que no tienen excepciones. Si la situación de dependencia es la mostrada por el gráfico, entonces podemos explicar las excepciones de la ley especial aun en los casos en que todas las leyes de la ciencia sobre la que descansa sean estrictas. Las excepciones corresponderían a los casos en que la propiedad macro (E) del acaecimientotipo antecedente de la ley especial se realiza mediante alguna propiedad micro (p.ej. Bn) que no está nómicamente conectada mediante una ley básica con ninguna propiedad micro que realiza la propiedad macro (E*) del acaecimiento-tipo consecuente (de todas formas, el propio Fodor ha cuestionado la viabilidad de esta explicación cuando se trata de propiedades funcionales, cf. Fodor, 1991). Para concluir con la noción de superveniencia conviene enfatizar que esta noción por sí sola simplemente elucida qué entendemos por dependencia, pero (salvo en el caso extremo de que la superveniencia se derive de la identidad) no explica metafísicamente a qué se debe tal dependencia. ¿Cómo es que unas propiedades supervienen sobre otras en 10s casos en que no hay identidad?, ¿qué vínculo metafísico hay entre ambas propiedades del que se deriva la superveniencia? Una posibilidad es tomar la relación de superveniencia como un primitivo metafísico bruto, algo que muchos se niegan a aceptar. Los recelos hacia esta posición hacen que algunos terminen cuestionando la legitimidad de las propiedades macro y sostengan que hay conceptos macro pero no propiedades macro; los predicados macro serían términos como 'jade' o 'cáncer', que no denotan una única propiedad, son términos ambiguos que en cada ocasión denotan alguna de entre varias propiedades básicas. O de otro modo, si se quiere considerar que denotan propiedades, éstas deben ser en todo caso propiedades "de segundo orden", donde una propiedad de segundo orden es la "propiedad consistente en tener alguna de entre tales y cuales propiedades básicas".
5.6. D u ~ ~ r s hDE f o PROPIEDADES CON IDEhTiDAD DE EJEMPLARES Y EPIFENOMENISMO
En relación con el último problema apuntado surge otra cuestión relativa a la eficacia causal de las propiedades macro y que aquí sólo apuntaremos. La cuestión es la
390
FUNDAXfE3TOS DE F I L O S O FDE ~ L.4 CIENCIA
siguiente (ignoraremos ahora las excepciones de la ley macro). Si cada acaecimiento antecedente de la ley especial es también un acaecimiento antecedente de una ley básica (de diferentes leyes en diferentes casos) y las propiedades micro son sin duda causalmente eficaces, ¿para qué son necesarias las propiedades macro? Un acaecimien:~ particular causa o produce otro en virtud de que ejemplifica determinada propiedad (cf. cap. 5, 93). Si hay causalidad básica, la propiedad en virtud de la cual un acaecimiento causa otro es determinada propiedad micro Bi, pero entonces parece que la propiedad macro E es superflua, causalmente ineficaz o causalmente redundante. Éste es el problenza de la exclusiór~e~plicatii~a (cf. p.ej. Kim, 1987), y es lo que motiva las posiciones epifenornenistus. Se dice que una propiedad A es un epifenómeno de una propiedad P si A "se debe" a la presencia de B pero A es causalmente ineficaz. En filosofía de la psicología se ha atribuido esta posición al monisiíto anóinalo de Davidson (aunque él mismo no acepta ser calificado de epifenomenista, cf. Davidson, 1970 y McLaughlin, 1984).
El epifenomenismo acepta la existencia de las propiedades macro, la identidad de ejemplares y la superveniencia, pero rechaza que las propiedades macro sean causalmente eficaces. Son "un lujo ontológico", por así decir. Esta posición le parece inaceptablemente conservadora al eliminacionista, que comparte con aquél los recelos sobre la eficacia causal de las supuestas propiedades macro pero no tiene sus escrúpulos conservadores. Si no hay eficacia causal, no hay propiedad. Según el eliminativista, los predicados macro expresan conceptos a los que no corresponde ninguna propiedad en el mundo, como ocurrió con el predicado 'flogisto' de la química del siglo XI~III. Hay concepto pero no hay propiedad, por tanto lo mejor, como en el caso del flogisto, es dejar de emplear el término, eliminarlo del lenguaje de la ciencia (exactamente igual que se eliminaron del lenguaje de la meteorología !os nombres de los dioses griegos y de sus "estados"). En filosofía de la psicología defienden una postura semejante los Churchland (cf. p.ej. Churchland, 1981 y 1984). Debe quedar claro que el eliminativismo ni siquiera admite la identidad de ejemplares, el motivo es obvio: si no hay propiedades macro (ni idénticas ni diferentes de las propiedades rnicro), entonces ni siquiera se puede plantear la cuestión de si un evento que ejemplifica una propiedad macro es o no el mismo acaecimiento-ejemplar que ejemplifica una propiedad rnicro; no hay propiedades macro y no hay por tanto acaecimientos que tienen propiedades macro.
El eliminacionismo (acerca de una determinada ciencia especial) rechaza la identidad de ejemplares, pero porque no hay propiedades macro (denotadas por los predicados de dicha ciencia especial). Pero se puede rechazar la identidad de ejemplares incluso si se acepta la existencia de propiedades macro. Esto es lo que defiende el dualista de ejempla-
res. Hay efectivamente propiedades de los dos niveles y son propiedades diferentes, pero se ejemplifican en acaecimientos particulares también diferentes. En filosofía de la psico-
logía se puede asimilar a esta posición 10s diversos tipos de dualismo de sustancias (p.ej. Descartes, Eccles) y de paralelismos (p.ej. la armonía preestablecida de Leibniz o el ocasionalisn~ode Malebranche).
En el capítulo 3 examinamos la metodología de la contrastación de hipótesis sin detenernos en los aspectos filosóficamente problemáticos. En particular, aplazamos la discusión epistemológica de dos cuestiones centrales en la contrastación, a saber, la naturaleza de la inferencia inductiva y el estatuto de la Condición 2 relativa a la relación entre la falsedad de la hipótesis y la improbabilidad de la predicción. En el presente capítulo vamos a volver sobre estas cuestiones en el marco más amplio del probIema de la inducción. Éste es un problema de larga tradición filosófica que ha recibido diversas fonnulaciones y tratamientos, algunos de los cuales entroncan directamente con las cuestiones que entonces aplazamos. En este sentido, la finalidad principal del presente capítulo es estudiar .los problemas epistemológicos relativos a la metodología de la contrastación de hipótesis. En la presentación metodológica advertimos que no distinguíamos en ese contexto entre leyes y teorías, refiriéndonos indistintamente a ambas como hipótesis teóricas. Después del camino recorrido, sabemos ahora que leyes y teorías son entidades muy diferentes; las teorías, como establecieron informaImeiite los filósofos historicistas y precisan después algunas concepciones semánticas, son entidades estructuralmente complejas y estratificadas (redes teóricas). Cabe presumir que esta complejidad estructural de las teorías es relevante a la hora de su evaluación epistémica y que, por tanto, la diferencia entre leyes y teorías debe desempeñar alguna función en el problema de la inducción. Sin embargo, como veremos, hasta hace relativamente poco dicha diferencia no ha desempeñado apenas papel alguno. El motivo es que el problema de la inducción se ha planteado mayoritariamente en el marco de la concepción axiomática, donde la diferencia entre leyes y teorías tiene menor trascendencia pues el análisis axiomático tradicional, tal como se realiza en la Concepción Heredada, no refleja el caráctzr estratificado y reticular de las teorías. Por ello, en las primeras secciones vamos a ver el problema de la inducción referido a cualquier tipo de hipótesis, esto es, indistintamente a leyes y teorías; deberemos esperar a las críticas de los historicistas al refutacionismo de Popper (sección 5 ) para ver el papel que juega la complejidad estructural de las teorías a la hora de su evaluación episténiica y su eventual aceptación o rechazo. Antes de ello, presentaremos en las dos
393
F L ~ N D - ~ ~ ~ ~ DE E ~ HLOSOF~A TOS DE LA CIENCIA
primeras secciones el problema tradicional de la inducción en términos generales y las principales aproximaciones al mismo. En las secciones 3 y 4 examinaremos dos de tales aproximaciones, el inductivismo y el falsacionismo (para un estudio más detallado cf. p.ej. Kneale, 1949; Lakatos, 1968a; Glymour, 1980, caps. 11 a IV y Rivadulla, 1991; algunas buenas antologías sobre el tema son Kyburg y Nagel (eds.), 1963; Lakatos (ed.), 1968; Camap y Jeffreys (eds.), 1971 y Cohen y Hesse (eds.), 1980). Para simplificar la exposición, dejaremos ahora al marzen tanto las leyes probabilistas como las no estnctas (cf. cap. 5) y limitaremos por tanto el problema de la inducción a hipótesis estnctas no probabilistas.
1. Evaluacióii epistémica. El problema de la inducción
Presentado del modo más conciso posible, el problema de la inducción consiste en determinar el sentido preciso en que podemos decir que ciertos datos empíricos confieren apoyo o justificación a una hipótesis, hipótesis que no es implicada deductivamente por los datos; y la dificultad básica a la que se enfrentan una y otra vez los diversos intentos de resolver este problema es, en sus diversas versiones, la infradeterminación de la hipótesis por la experiencia. La justificación de la hipótesis mediante los datos se supone que representa algún tipo de itlfei-eizcia de los datos hacia la hipótesis, pero la inferencia no es deductiva, la hipótesis no está "plenamente contenida" en los datos-premisas. La hipótesis excede el contenido de los datos y por tanto la inferencia no es explicitativa sino auntentativa o at>zpliatii~a.
Es común caracterizar la inducción (del griego 'epagogé') como el paso o inferencia de lo particular a lo general y el problema de la inducción como el problema de identificar el método-procedimiento correspondiente a dicho paso o inferencia. Pero esta caracterización es ambigua, pues hay dos sentidos de 'paso' o 'inferencia'. En un primer sentido, pasar de lo particular a lo general, inferir lo segundo de lo primero, significa fonnular o idear hipótesis (leyes, teorías) generales a partir de la observación de hechos particulares. si por 'inducción' se entiende eso, entonces no hay ningún problema de la inducción, pues simplemente no hay ningún método-procedimiento para idear una determinada hipótesis general a partir de cierta serie finita de hechos particulares observados. Es cierto que hay un procedimiento para generar rodas las correlaciones funcionales posibles compatibles con una serie de datos particulares, pero en la formulación de hipótesis científicas concretas no interviene dicho procedimiento. Los científicos formulan sus hipótesis generales sin partir de la colección de las (infinitas) alternativas lógicamente posibles. Usualmente se formula una única hipótesis, y más raramente dos o a lo sumo tres, y la formulación o invención de estas hipótesis no se atiene a ningún procedimiento
mecanizable. La formulación de hipótesis es un proceso esencialmente creador (conjetural, dirá Popper) e irreducible a un conjunto de reglas metodológicas. Seguro que hay algunas prácticas o "trucos" que a veces los científicos siguen, o incluso constricciones metodológicas generales relativas a la simplicidad, la elegancia, la coherencia con otras hipótesis, etc., pero ello no basta para dar cuenta del proceso de formación d e hipótesis, pues siempre hay más hipótesis alternativas lógicamente posibles que satisfacen estas constricciones que las que finalmente se formulan. Así pues, en el primer sentido de 'inducción', inducción como proceso de ideación y formulación de hipótesis generales, no hay un método ind~ictivo.La vieja aspiración de F. Bacon y de Mill (si se entienden de este modo sus cuatro reglas inductivas de las diferencias, las semejanzas, los residuos y las variaciones concomitantes, cf. Mill, 1904) es irrealizable. El proceso cognitivo de creación de hipótesis contiene elementos psicológicos ineliminables cuya explicación corresponde más a la psicología de la ciencia que a la metodología. En este sentido tampoco hay, por tanto, un problema metodológico de la inducción. Como ya vio parcialmente Whewell (1 858). el problema de la inducción no es relativo a la creación de hipótesis sino a su jrtstificación. En este segundo sentido de 'inducción', la inducción como paso de lo particular a lo universal (inferir lo segundo de lo primero) significa justQicar hipótesis generales a partir de hechos particulares. Es aquí donde se plantea el problema de la inducción, pues toda justificación es por su propia naturaleza normativa y la cuestión es qué normas o rzglas rigen la justificación inductiva. Estos dos sentidos de 'inducción' se corresponden, grosso modo, con la famosa distinción de Reichenbach (1935) entre contexto de describrimiento y contexto de justifícación. El problema epistemológico de la inducción no es un problema relativo al contexto de descubrimiento sino al contexto de justificación. O en términos más actuales, al contexto de evaluación episrémica. Hay varios respectos en que se puede evaluar una hipótesis (ley, teoría) científica, y el epistémico es sólo uno de ellos, el que corresponde a la noción tradicional de justificación (para una crítica y ampliación de la distinción de Reichenbach, cf. Echeverría, 1995, cap. 11). En adelante nos vamos a limitar aquí al segundo sentido de 'inducción'; por tanto, salvo advertzncia en contra, por 'inferencia' se deberá leer 'inferencia justificativa'. Por otro lado, vamos a usar aquí 'inducción (justificativa)' en su acepción más general, esto es, para cualquier tipo de inferencia ampliativa. Las inferencias demostrativas, o deducciones, proporcionan también justificación: si de a,,..., a, se deduce p, entonces la verdad de (o la creencia justificada en) a,, ..., a,justifica la verdad de (la creencia en) p. Pero, como ya vimos en el capítulo 2, estas inferencias no son ampliativas: el contenido factual de B está incluido en el contenido factual de a,A ... A cr,, justamente por eso no puede ocurrir que a,, ..., a, sean verdaderas y B falsa. Si hay inferencias que no son de este tipo, si hay justificación no demostrativa (y éste es precisamente el problema de la inducción), entonces tales inferencias son ampliativas: el contenido de lo justificado no está incluido en el contenido factual de lo que le proporciona justificación. A cualquier justificación de este tipo la consideraremos inductiva. Algunas veces se usa el término 'inducción' en una acepción más estricta, aplicado sólo a uno de entre los diversos tipos de inferencias ampliativas. De entre ellos, los
son los siguientes. En la i~lditcciónpor enitmeración se justifica una generalización a partir de la constatación de una serie de sus instancias, p.ej. cuando infiero que todas las esmeraldas son verdes a partir de que todas las esmeraldas que he observado lzasta la feclza son verdes. La inducción por enumeración, aunque quizá es la más smcilla, no es el único tipo de inferencia ampliativa, ni siquiera el más usual en contextos científicos. En la iiiducción estadístico-probabilisra se justifica una hipótesis particular a partir de una regularidad estadística o probabilista, p.ej. cuando infiero que Juan tendrá problemas pulmonares a partir de que es un fumador compulsi\~oy de que la práctica totalidad de los fumadores compulsi~~os padecen enfermedades pulmonares. En la itducciórz por eliminación infiero cierta hipótesis a partir de la eliminación del resto de hipótesis alternativas; para que este método sea propiamente inductivo, y no deductivo, al menos una de las eliminaciones de las alternativas ha de ser a su vez inductiva. En la inferencia a la inejor euplicación, llamada también por algunos autores abducción, se justifica una hipótesis porque ella explica (implica) cierto hecho observado; p.ej. cuando infiero la presencia de humanos a partir de la presencia de ciertas huellas en la playa (esta inferencia se reduce en .el fondo a la estadística si se considera que incluye como premisa implícita una premisa del tipo "usualmente las huellas de humanos son producidas por humanos"). Otra inferencia ampliativa, la más usual en contextos científicos, es la que constituye el denominado inétodo hipoféfico-deductivo,que es ni más ni menos que el patrón evaluativo que presentamos en el capítulo 2: de la hipótesis (junto con ciertos supuestos y condiciones iniciales) se deduce determinada predicción, que caso de cumplirse proporciona cierto prado de justificación a la hipótesis. Después del examen que hicimos, debe estar claro que debería denominarse 'método hipotético-deductivo-inductivo', pues contiene elementos claramente inductivos. En la versión que dimos de este método, se trata en realidad d e un caso complejo de inducción probabilista, pues la inferencia incluía una premisa probabilista, la Condición 2. Éstos son los principales tipos de inferencias ampliativas (cuando la hipótesis justificada no es ella misma probabilista). En todas ellris el contenido factual de la hipótesis justificada no está incluido en el contenido factual de la base de justificación, de los datos que se usan de evidencia; es posible que la base de justificación sea verdadera y la hipótesis sea falsa, en eso consiste su carácter ampliativo o no demostrativo. Esta caracterización pone inmediatamente de manifiesto el problema principal con que se enfrentan estas inferencias en tanto que presuntamente justificativas: si, aun siendo verdadera la base d e justificación, la hipótesis justificada puede ser falsa, ¿en qué sentido la base de justificación justifica la hipótesis? Éste es, brevemente formulado, el problema de la inducción; todas las formulaciones del mismo no son más que variantes de esta cuestión básica. O mejor dicho, en tanto que problema, surge de aceprar que hay inferencias anlpliativas justificativas. Pero es difícil negar que hay inferencias ampliativas. Desde una perspectiva empirista mínima, todo conocimiento empírico se inicia en la experiencia y la experiencia es siempre experiencia de hechos particulares. Sin embargo el conocimiento empírico contiene aseveraciones genuinamente generales. En la medida en que las aseveraciones empíricas generales estén justificadas, su base de justificación se retrotrae en última instancia a una serie finita de
E V A L U A C I ~ NDE LAS TEOR~:\SY EL PROBLEbIA DE LA I N D U C C I ~ N
1
l
I
1
1
i
I
1
1
397
hechos particulares. Pero a ) las aseveraciones generales estún justificadas, de otro modo no las consideraríamos conocimiento, y b) su contenido factual excede el de la serie de hechos particulares que constituye su base de justificación. Así pues, parece que el conocimiento en general, y la ciencia en particular. usa justificaciones ampliativas, inducciones. Es aquí donde se plantea la cuestión: ¿en qué sentido estas inferencias ampliativas son justificativas? Como sabemos, fue Hume el primero en cuestionar esta estrategia empirista. La solución (o disolución) escéptica de Hume consiste en rechazar a): ningún tipo de inferencia arnpliativa es justificativa, las creencias generales o sobre el futuro, incluso si resultan de hecho verdaderas, no constituyen conocimiento pues no están justificadas (cf., para lo que sigue, Hume, 1748, Libro 1, Parte 111, sec. VI). El paradigma de inferencia arnpliativa es para Hume la inducción por enumeración, la proyección de casos observados a nuevos casos. Para que tal proyección fuese "conforme a la razón", debería disponerse de un principio de rtrziformidnd de la natrtraleza, que establece que "los casos de los que no hemos tenido experiencia deben ser semejantes a aquellos en que sí la hemos tenido". Este principio debe ser, o bien a priori ("basado en argumentos demostrativos"), o bien empírico. No puede ser a priori, justificable mediante una inferencia demostrativa, pues las inferencias demostrativas descansan en el principio de no contradicción y no es contradictorio suponer (concebir) "un cambio en el curso de la naturaleza". Pero su justificación tampoco puede ser empírica, pues tal justificación se basaría en casos observados y requeriría del mismo principio para ser justificativa. Así pues, tal principio no está justificado conforme a razones y sin él las inferencias ampliativas no proporcionan justificación: "[D]espués de que la experiencia nos haya informado de su conexión constante, nuestra razón es incapaz de convencemos de que tengamos que extender esa experiencia más allá de los casos particulares observados" (lb. primero, parte 111, sec. IV). Como declara explícitamente Hume, no se niega la "justificación psicológica" de la proyección, sino que a dicha tendencia psicológica corresponda una justificación objetiva: "Suponemos que debe haber una semejanza entre los objetos experimentados y los que están más allá de nuestra experiencia actual, pero nunca podremos probarlo" (ibid., cursivas nuestras). Después de doscientos cincuenta años la epistemología sigue buscando una respuesta satisfactoria al reto escéptico de Hume. Nótese que, planteado en sus estrictos términos, el argumento de Hume no tiene escapatoria. Si por ' a justifica p' se entiende que la verdad de a garantiza plenamente la verdad de P, no hay nada más que hablar. En ese sentido, las únicas inferencias justificativas son las demostrativas; las inferencias ampliativas, por su propia definición, no son justificativas. Eso es así aunque se pretenda algo aparentemente más débil, a saber, que aunque no todas las inferencias ampliativas garantizan la verdad de la conclusión, la mayoría sí lo hace. El argumento de Hume no se ve afectado por esa aparente variación. Lo que el argumento muestra no es sólo que no podemos justificar que todas las inferencias ampliativas con premisas verdaderas tienen conclusiones verdaderas, sino que no podemos justificar eso de ninguna de ellas. El argumento de Hume, de ser conecto, obliga a rechazar una de las tres cosas siguientes: (1) la ciencia (caso de ser verdadera) proporciona conocimiento, esto es, creencia (verdadera) jrtstificada; (2) la ciencia usa inferencias ampliativas; (3) la justificación
preserva la verdad. Hume rechaza (l), la ciencia procede de hecho inductivamente pero la inducción no proporciona justificación. Popper aparentemente rechaza (2), la ciencia no pretende justificar hipótesis a partir de datos empíricos (cf. más adelante 34). La mayoria de los restantes filósofos rechazan (3). Para este último grupo de filósofos, hay justificaciones que no preservan la verdad. Eso no quiere decir que renuncien a vincular las nociones de justificación y ilerdad, sólo renuncian a establecer dicho vínculo en los términos tan fuertes de Hume. Algunas justificaciones (las ampliativas) no preservan la verdad pero, por así decir, sí la "transfieren parcialmenteo'. El problema es precisamente si se puede concretar esa idea de modo suficientemente preciso sin perder el vínculo entre justificación y verdad. Las diferentes alternativas recurren casi siempre de alguna forma u otra a la probabilidad. En las inferencias ampliativas la verdad de la base de justificación (premisas) no garantiza plenamente la verdad de la conclusión, sólo la garantiza parcialmente, hasta cierro grado, con cierra probabilidad: las justificaciones no demostrativas nos justifican en creer que si las prernisas son verdaderas la conclusión es probablemente verdadera. Ésta es la idea que defienden los inductivistas y que sus detractores consideran conceptualmente inconsistente. El reto de los primeros es dar un sistema de justificación ampliativa a la vez preciso y consistente.
N NUEVO ENIGMA DE LA INDUCCIÓN 1.2. LASPARADOJAS DE LA C O N F I R ~ ~ A CYI ~EL
La intuición básica que hay tras el inductivismo se encuentra ya explícitamente formulada en la rudimentaria teoría de la confirmación de Nicod para afirmaciones condicionales generales: la presencialausencia de B en un caso de A confirma/invalida la ley "A ilnplica B" (cf. 1930, p. 219). La confirmación de una ley se produce mediante la constatación de instancias posirivas o ejemplificaciones de la ley. Nicod considera la confirmación como inferencia ampliativa, pues acepta que un dato e confirme una ley o hipótesis h y que a pesar de el10 pueda ocurrir que e sea verdadero y h falso. Este concepto de confirmación es puramente cualitativo, no recoge el aspecto gradual de la justificación inductiva. Este concepto es tal que, dados e y 11, determina simplemente si e confirma (apoya, justifica) o no la hipótesis h. Para recoger la dimensión gradual de Ia justificación inductiva es preciso al menos un concepto coniparaiivo de confirmación, según el cual dados e, 11, e' y h' se pueda determinar si e confirma h tanto o más que e' confirma h'. Si este concepto comparativo es suficientemente rico, permite generar un concepto niétrico de confirmación (cf. cap. 4, 64 sobre la relación entre conceptos métricos y comparativos), esto es, uno según el cual dados e y h se pueda determinar que e confirma h en grado r. Para cada uno de estos tres conceptos usaremos, respectivamente, las letras 'C', 'K' y 'c': 'C(h, e)' significará que la evidencia e confirma la hipótesis h; '(11, e)K(hf, e')' que e confirma 12 tanto o más que e' confirma h'; y 'c(h, e) = r' que e confirma h en grado r. Más adelante nos detendremos en los conceptos comparativo y, sobre todo, métrico de justificación inductiva. En esta introducción nos basta el concepto puramente cualitativo para ver ya algunos aspectos problemáticos de la noción de confirmación entendida en el sentido de Nicod. Vamos a ver, en particular, las paradojas de la confinnaciólt de Hempel
EVALUAC~~': DE LAS TF.OR~ASY EL PROBLEMA DE L A I N D U C C I ~ N
399
y el nuevo enigma de la inducción de Goodman, sobre el que ya dijimos algo en el capítulo 5 (52). Hempel toma el criterio de confirmación de Nicod para afirmaciones generales condicionales sólo como condición suficiente (no necesaria) para la confirmación cuaiitativa de tales afirmaciones y presenta algunos ejemplos que resultan prima facie paradójicos (cf. 1943, 1945, 1966b). El ejemplo más famoso es el de la contraposición. Consideremos la ley (L1) "Todos los cuervos son negros".' Según el criterio en cuestión, L1 es confirmada por la presencia de una cosa que sea a la vez cuervo y negra. Por otro lado, L1 es lógicamente equivalente a (L2) "Todas las cosas no-negras no son cuervos", que de acuerdo con el criterio es confirmada por instancias positivas, p.ej. una hoja verde. Ahora bien, parece razonable aceptar cierta condición de eq~iivalenciasegún la cual si una evidencia e confirma una hipótesis h, entonces confirma toda hipótesis h' equivalente a h. La idea es que la confirmación afecta al contenido, independientemente de la forma específica en que éste se exprese. De lo anterior se sigue la consecuencia aparentemente paradójica de que la presencia de una hoja verde confirma la ley de que todos los cuervos son negros. En general, puesto que (HI) "Vx(Ax -+ Bx)" es equivalente a su contraposición (H2) "Vx (7 Bx + Rr)", la ocurrencia de Aa A -I Bu" es según el criterio de Nicod una confirmación de H1. Lo mismo sucede con otras equivalencias. Por ejemplo, HI es equivalente al condicional (H3) "Vx (AYv -I AY+ 7 Ax v Bx)", que según el criterio, para el ejemplo que nos ocupa, es confirmado por la presencia, tanto de cualquier cosa que no sea cuervo (sea o no negra), como de cualquier cosa negra (sea o no cuervo), y por la condición de equivalencia las mismas evidencias confirmarían el original '"Todo cuervo es negro". Por otro lado, H1 también es equivalente a (H4) "Vx (Ax A Bx + Bx A 7 Bx)", pero H3 no puede tener ninguna instancia positiva en el sentido de Nicod, pues su consecuente es contradictorio, y entonces puesto que es equivalente a H1 ésta tampoco podría tenerla. Hempel concluye que, contra lo que en principio parece, no hay nada realmente problemático en estos hechos. Para empezar con H4, que no pueda tener instancias positivas sería un problema si el criterio de Nicod se considerase una condición necesaria además de suficiznte, pero ya hemos advertido que no es así. Los casos interesantes son H2 y H3. La posición de Hempel, que considera correctas tanto la idea básica de Nicod como la condición de equivalencia, es que la impresión de que una instancia positiva de H2 (o H3) no constituye una confirmación de H1 es errónea si nos restringimos al concepto puramente cualitativo de conjnnación. La impresión la produce la idea errónea de que una generalización "habla sólo" de las cosas que satisfacen la propiedad antecedente. Supongamos, dice Hempel, que en la habitación de al lado hay un objeto x que no es negro. L1 dice algo de él, a saber, que no es cuervo, y por tanto si efectivamente x resulta 7
''7
1. Mantenemos el ejemplo de Hempel por haberse institucionatizado en la literatura sobre inducción, pero sería más adecuado usar otro. El motivo es que, como vimos en el capítulo 5 (§2), la confirmación por instancias no se aplica a cualquier regulxidad sino sólo a Ias nómicas o leyes, y entonces dijimos que la regularidad sobre el color de los cuervos muy probablemente no se podía considerar nómica. El lector puede aplicar todo lo que se diga en adelante a cualquier otra regularidad clxmente nómica, p.ej. "Los metales se dilatan al calentarlos".
no ser cuervo, podemos considerar legítimamente que nuestra hipótesis se ha confirmado. Así, Hempel no considera estas supuestas paradojas de la confirmación como una objeción contra el criterio cualitativo. Ahora bien, dice Hempel, ello no iguala a todas estas hipótesis en todos los respectos; hay algo acertado en la intuición de que hay alguna diferencia en el valor confirmatorio para H1 de "Aa A Ba", "7Aa A 1 Ba" y "1Aa v Bu", pero para mostrarlo es necesario abandonar el concepto puramente cualitativo y pasar al comparativo. Decir que las tres confirman H1 es compatible con decir que las tres lo hacen en diferente grado, y es posible dar cuenta de esta diferencia si se maneja un concepto comparativo o métrico de confirmación (cf. 1966b, pp. 120-121). En la versión de Nicod, el criterio cualitativo tiene importantes limitaciones, pues sólo es aplicable a afirmaciones generales condicionales. Para superar estas limitaciones, conservando el núcleo de la idea, Hempel construye un concepto alternativo de confirmación cualitativa. Más adelante nos detendremos en él; por ahora sólo nos interesa señalar que, como Hempel insiste, es también como el de Nicod un concepto puranterzre si~zráctico: toma en consideración exclusi\~amenteel tipo lógico de los predicados y la forma lógica de la afirmación, nada en el criterio depende del significado o contenido semántica de los predicados involucrados, de cuáles sean las propiedades denotadas. Y esta característica, como Hempel acabará reconociendo, lo convierte en inadecuado. Cualquier concepto cualitativo de confirmación por instancias positivas que sea puramente sintáctico se enfrenta a una dificultad fundamental, a saber, su incapacidad para dar una respuesta adecuada al nuevo eriignza de la i~zducciórzde Goodman (1955). Mencionamos ya este enigma cuando nos ocupamos de las leyes (cap. 5. $2), haciendo referencia a la distinción entre predicados proyectables y no proyectables y su función en la distinción entre regularidades nómicas y accidentales. Como entonces dijimos, el enigma tiene directamente que ver con la posibilidad de justificar inductivamente hipótesis alternativas incompatibles entre sí. La evidencia de que todas las esmeraldas observadas hasta el año 1950 son verdes confirma, según el criterio que venimos considerando, tanto "Todas las esmeraldas son verdes" como "Todas las esmeraldas son verdules" (donde 'verdul' significa "observado antes del año 2000 y verde, u observado después del 2000 y azul"; aunque nótese que en este caso no se trata de hipótesis incon~patiblesen sentido estrictamente lógico, son incompatibles sólo si se observan esmeraldas después del 2000). Si queremos distinguir ambos casos, negando que dicha evidencia confirme igual ambas generalizaciones, la noción de confirmación no puede ser puramente sintáctica, pues ambas generalizaciones son sintácticamente semejantes. La única posibilidad es que la noción de confirmación involucre características no puramente sintácticas, esto es, que haga referencia, o (1) a características semánticas (al contenido d e los predicados), o (2) a relaciones entre la generalización que se confirma y otras aceptadas. Goodman llama proyecrables a las generalizaciones cuyos casos observados se proyectan hacia los no observados, o lo que es lo mismo, a las generalizaciones que se confirman por instancias; derivadamente, se denominan también proyectables los predicados que intervienen en tales generalizaciones. La cuestión es qué hace a un predicado proyectable. Como vimos, es común apelar aquí a condiciones semánticas y proponer que los predicados proyectables son aquellos que significan propiedades (géneros, cla-
ses) naturales, pero la dificultad es entonces dar una elucidación satisfactoria de esta noción. Recuérdese que apelar aquí a la noción de ley, diciendo p.ej. que las propiedades naturales son las que intervienen en generalizaciones nómicas, no sirve de mucho, pues la diferencia entre leyes y generalizaciones accidentales requiere a su vez elucidación. Goodman prefiere la segunda opción, y sostiene que los predicados que intervienen en generalizaciones proyectables (e.e. leyes) se caracterizan por estar bien atrincherados ('entrenched'), con lo que quiere decir que se han usado frecuentemente y de forma integrada con otros del conjunto de la ciencia. Como el lector advertirá, ello no es sino apelar a criterios de integración teórica: una generalización proyectable es, en este sentido, una con apropiadas relaciones de integración con otras generalizaciones de nuestro cuerpo de conocimiento. Una tercera posibilidad, que es en realidad una variante de la segunda, es apelar a consideraciones de simplicidad, esto es, establecer que entre las diversas alternativas la evidencia confirma la más simple. Pero esto también es probIemático. En primer lugar, cualquier criterio de simplicidad permite que pueda haber diferentes teorías igual de simples. En segundo lugar, la simplicidad depende casi siempre del lenguaje, y por tanto de los predicados que se elijan como primitivos (cf. cap. 7, $6). Y en tercer lugar, incluso si se pudiera determinar un sentido neutral de la simplicidad, esta alternativa supondría que la naturaleza "maximiza" la simplicidad, que "prefiere" leyes más simples, y este principio de simplicidad de la natiiralera es algo que requeriría a su vez de justificación. Pero la justificación de un principio tal parece sujeta a las mismas dificultades humeanas que la justificación de un principio de regularidad. El nuevo enigma de la inducción de Goodman no es en realidad sino una nueva versión de un viejo problema, a saber, que cualquier serie finita de datos es subsumible bajo infinitas generalizaciones diferentes. Si visualizamos los datos como puntos en un plano, un teorema elemental del análisis establece que cualquier conjunto finito de puntos pertenece a infinitas funciones o curvas diferentes. El problema de la inducción consiste entonces en establecer criterios que permitan decir que la serie finita de datos confirma sólo una de las funciones, o menos dramáticamente pero igual de problemático, que confirma más a unas que a otras. El problema de la inducción es pues el problema de la infradeterminación de la teoría por la experiencia, que ha ido reapareciendo en diversos lugares de esta obra: por muchos que sean los datos experimentales recogidos, siempre serán subsumibles bajo hipótesis teóricas diferentes e incompatibles. Como acabamos de ver, apelar a un principio de simplicidad de la naturaleza es problemático por apelar a la problemática noción misma de simplicidad, y además es elusivo, pues él mismo requiere justificación. Debe notarse que este problema, aunque con pequeñas variaciones, es el mismo en Hempel que en Goodman. En ambos casos se trata de determinar si hay un sentido preciso en que se puede decir que ciertos datos justifican una hipótesis, o equivalentemente, si dadas dos hipótesis alternativas incompatibles, los datos justifican más una que otra.
402
FL;ND.ASIEhTOS DE FlLOSOFL4 DE LA CIENCIA
2. Aproximaciones al problema de la inducción
En las próximas secciones vamos a centrarnos en las dos principales aproximaciones al problema de la inducción dentro de la filosofía de la ciencia contemporánea, el inductivismo de Camap y su escuela, y el falsacionismo de Popper. Puesto que estas concepciones no agotan las diferentes aproximaciones al problema, antes de detenemos en ellas haremos en esta sección una breve mención a las principales alternativas involucradas (para una comprensión cabal de las mismas, que no podemos proporcionar aquí, consúltense las fuentes reseñadas en cada caso).
Algunos de los llamados filósofos del lenguaje ordinario han defendido que el supuesto problema de la justificación del razonamiento inductivo es sólo aparente (cf. p.ej. Strawson, 1952). El análisis lingüístico muestra que tal demanda de justificación es ella misma injustificada y por tanto el problema, más que resolverse, se disuelve. En su opinión, casi siempre que se exige una justificación de la inducción lo que se busca es un fundamento que la haga tan "firme" como la deducción, pero ello es simplemente un error conceptual, la inducción no puede ser tan firme como una inferencia demostrativa pues, simplemente, es por definición una inferencia no demostrativa. La inducción no requiere justificación. Es parte del significado de las palabras 'evidencia', 'grado de convicción' y 'creencia razonable' que es razonable aumentar el grado de convicción con la evidencia. "Es una proposición analítica aquella que dice que es razonable creer en cierta medida en un enunciado, medida que es proporcional a la fuerza de la evidencia [y es analítica en virtud de] lo significado por 'ser razonable"' (Strawson, 1952, cap. 9, $11.10). El problema, sin embargo, es que esta concepción no da cuenta del aspecto normativo de la inferencia inductiva, no explica en qué consiste la diferencia entre inferencias inductivas correctas e incorrectas (o más o menos correctas), y ése es el problema de la inducción. Las nociones defuerza de la evidencia y de creelzcia razonable proporcioizal a la fuerza de la evidencia dependen conceptualmente de la de (mayor o rnertor) corrección de la iriferencia rzo demostrativa, y el problema es determinar de modo preciso dicha dependencia.
La mejor justificación de la inducción, se puede decir, es que ha funcionado muy bien hasta el momento. Y aquí se pueden traer a colación los impresionantes logros tecnológicos de la ciencia a lo largo de la historia. Esta línea de argumentación supone que la ciencia ha procedido de hecho inductivamente, cosa que algunos niegan. Pero concediéndolo, el principal problema de esta posición es, obviamente, su circularidad. De lo que se trata es de justificar que podemos proyectar la experiencia observada a la no observada, y como caso particular la experiencia pasada al futuro. Si la justificación es que hasta el
E V A L U A C I ~ NDE LAS TEOR~ASY EL PROBLEMA DE LA I N D U C C I ~ N
403
momento eso nos ha ido bien, que la mayoría de las predicciones realizadas con tal método han sido exitosas, etc., entonces se está tomando por garantizado el punto en discusión, a saber, que en el futuro podemos esperar que las cosas sigan yendo igual de bien que en el pasado. Como ya advirtió Hume, justificar inductivamente un principio inductivo de regularidad de la naturaleza es circular. Algunos filósofos, sin embargo, sostienen que a pesar de las apariencias esta línea de defensa no es inadecuada. Braithwaite (1959, cap. 8)) sostiene que la circularidad es sólo aparente. Black (1954) que no es viciosa, pues las reglas inductivas son autoaplicativas por naturaleza. Skyrrns (1966) apela a una jerarquía sucesiva de niveles inductivos, pero entonces eIude la circularidad al precio del regreso.
Como sabemos, Kant respondió al reto de Hume defendiendo la existencia de juicios sintéticos a priori. Si existieran tales juicios, podría pensarse que la inferencia inductiva podría justificarse mediante algún tipo de principio inductivo general que fuese sintético a priori: su carácter sintético haría a la inferencia ampliariva, y su carácter a priori proporcionaría el componente de necesidad (epistémica) que requiere en tanto que inferencia justificativa. Pero aquí hay que distinguir dos tipos de principios o afirmaciones. Por un lado, principios-syuda muy generales del tipo "la naturaleza se comporta regularmente" o "la naturaleza se comporta simplemente". Éstos podrían ser candidatos a ser principios sintéticos a priori, caso de haber tal cosa, pero, como veremos, no resuelven el problema de la inducción, pues dejan demasiadas alternativas abiertas. Por otro, principios más específicos que sí podrían justificar hipótesis específicas, pero que no parecen buenos candidatos a principios a priori pues, como se verá, son en el fondo tan específicos como las hipótesis empíricas que pretenden justificar (si es que no son ellas mismas). Aunque en la actualidad hay pocos defensores decididos de los juicios sintéticos a priori, se sigue recurriendo de diversos modos a ambos tipos de principios (cuyo estatuto se debe elucidar). En general, se puede recumr a ellos como premisas implícitas adicionales, o como principios-reglas de inferencia. A estas alternativas corresponden, respectivamente, las dos próximas concepciones.
Una posibilidad es considerar que las inferencias inductivas son en realidad inferencia~deductivas con premisas implícitas u ocultas, esto es, entimemas. Una vez explicitadas las premisas ocultas, la inferencia es perfectamente demostrativa. La justificación de (1) "Todas las esmeraldas son verdes" a partir de (2) 'Todas las esmeraldas observadas antes de 1950 son verdes" consistiría en una deducción añadiendo una premisa adicional. Pero, enprimer lugar, esta opción se debe enfrentar al problema de la justificación de esta premisa adicional. Y en segundo lugar, ni siquiera es claro que (independientemente de su
justificación) una premisa tal siniera. La premisa adicional no puede ser un principio inductivo general del tipo (3) "La naturaleza se comporta regularmente", pues la naturaleza se puede comportar regularmente de itzjirzitas maneras diferentes, p.ej. siendo todas las esmeraldas verdes, o siendo todas verdules, etc. Así que añadiendo (3) a (2) no se deduce (1). Tampoco sirven variantes aparentemente más específicas, como (3') "Las esmeraldas no observadas son del mismo color que las obsenadas hasta 1950", pues (3') es ambigua, ya que estas esmeraldas además de verdes son verdules. Sólo serviría como premisa implícita para deducir (1) una premisa implícita como (3") "Las esmeraldas futuras son verdes", pero claro, eso es justamente lo que queríamos justificar. Esto muestra directamente el problema principal de esta alternativa: sean cuales sean las pre~nisasadicionales de las que efectiva?nenrese deducca la hipótesis original a justificar, el problema es que se pretende resolver la dificultad que plantean las inferencias ampliativas convirtiéndolas en demostrativas, pero al precio de trasladar su carácter arnpliativo a una premisa ociilta que requiere al menos tanta justificación como la hipótesis original.
Esta alternativa (que examinaremos en detalle en la próxima sección) es en principio la menos revisionista de todas: acepta que hay inferencias inductivas esencialmente diferentes de las demostrativas y que se rigen por sus prepias reglas lógicas, y trata de determinar cuiles son esas reglas y construir un sistema de 16gica inductiva. Esta propuesta comparte con la primera la idea de que el que cierta evidencia justifique no demostrativamente cierta hipótesis es una verdad analítica que se deriva de los conceptos de evidencia, grado de justificación, etc. Pero a diferencia de aquélla, no considera que ello ya resuelve, o disuelve, el problema. Asume la necesidad de distinguir entre inferencias ampliativas correctas e incorrectas, o más o menos correctas, y a tal fin procura desarrollar un sistema de lógica inductiva. Estos sistemas casi siempre recurren de un modo u otro al concepto de probabilidad. Como veremos, también necesitan algún tipo de principios de regularidad o simplicidad, que ahora estarán contenidos en los axiomas y reglas de la Iógica y cuya justificación se supone que es a yriori.
El desarrollo de una Iógica inductiva no es el único modo de abordar el problema de la inducción en términos probabilísticos. Desde el campo de la estadística matemática y la teoría matemática de la decisión se han hecho numerosos intentos de fundamentar de diversos modos la inferencia estadística. Entre los más destacados están Keynes (1921), Savage (1954), Fisher (19561, Neyman y Pearsons (19671, de Finetti (19721, Kyburg (1974), Jeffrey (1965), Howson y Urbach (1989) y Pollock (1990). A diferencia de lo que ocurre con la Iógica inductiva de Carnap, en estos autores la perspectiva metateórica no siempre está clara. Es difícil determinar si lo que se propone es algún tipo de deductivis-
mo, esto es, si la inferencia estadística (o la decisional) es una inferencia demostrativa que incluye como premisas adicionales ciertos principios matemáticos probabilistas (decisionales), o si se trata de alguna forma de inductivismo, esto es, si estas inferencias son propiamente ampliativas y la teoría matemática fundamenta las reglas inferenciales. Casi todos los autores de esta familia parten de un resultado clásico de la teoría de la probabilidad conocido como teorema de Bayes (para una buena exposición del bayesianismo, cf. Salmon et al., 1992, cap. 2). Uno de los principios fundamentales de la teoría de la probabilidad es que la probabilidad de la conyunción de dos sucesos es igual a la probabilidad de un suceso por la probabilidad del segundo condicionado al primero: p(x A y) = p(x) pblx). Este principio se deriva de la noción de probabilidad condicionada: la probabilidad de que ocurra y si ha sucedido x es, sobre la probabilidad de que ocurra x, la probabilidad de que adetnás de x ocurra y: pbl.~)= p(.r A y) 1 p(x). Ahora, puesto x A y es lógicamente equivalente a y A x, y las probabilidades de sucesos equivalentes son iguales, tenemos p(x A y) = p b A x) y por tanto (si p(x) # O # p b ) ) pblx) = p(x1y) - pCy)lp(x),que es el famoso teorema de Bayes. En los casos de confirmación o justificación inductiva de una hipótesis h mediante la evidencia e nos interesa la probabilidad condicionada de la hipótesis dada la evidencia, e.e. p(hle). Puesto que, en los casos de confirmación, e es un hecho implicado por h, y si a implica /3 la probabilidad condicionada p(j3la) es 1, tenemos que el teorema de Bayes aplicado a un caso de predicción exitosa toma la siguiente forma: p(hle) = p(h)lp(e). De aquí se infieren dos cosas. Primero (y dado que p(h)lp(e)está entre O y 1 ) p(h) < p(e): la hipótesis h es menos probable que la evidencia e, como cabía esperar, ya que h implica e pero no al revés. Segundo (y dado que p(hle) es igual a p(h) dividido por un número mayor que O y menor que 1) p(hle) > p(h): la probabilidad de la hipótesis h dada la evidencia positiva e es mayor que la que tiene h sin tomar en cuenta e. Este segundo hecho proporciona para los bayesianos la justificación teórica de la intuición que hay tras la noción cualitativa de confirmación: la ocurrencia de ciertos hechos implicados por la hipótesis aumenta la probabilidad de la hipótesis; la idea es entonces conceptualizar el grado de apoyo o justificación como la probabilidad de la hipótesis condicionada a los hechos implicados por ella. El teorema tiene otra consecuencia intuitivamente satisfactoria. Es fácil probar que una versión equivalente del mismo es p(h1e) = p(h) l [p(h) + ( p ( 7 h) p ( e l 7 h ) ) ] ,de donde se sigue que p(hle) es tanto mayor cuanto menor es p ( e l 7 h). Esto es, la evidencia positiva confirma tanto más la hipótesis cuanto más improbable sea e si h es falsa (recuérdese que la exigencia de que la predicción sea improbable si la hipótesis es falsa es justamente la Condición 2 que vimos en el capítulo 3, $3). El teorema de Bayes permite calcular, en casos de conuastaciones exitosas, cómo la evidencia e modifica la probabilidad anterior de la hipótesis h, pero ello no permite establecer el valor de p(h1e) a no ser que se disponga de las probabilidades anteriores p(h) y p(e), sobre cuya determinación nada dice la teoría. Se podría pensar que eso no es un problema, pero no es así. Es justamente en este punto donde aparece el problema de la inducción en toda su crudeza, pues lo que nos interesa es determinar si la misma evidencia e, predicha exitosamente por dos hipótesis diferentes h y h', justifica más a una que a otra. Y el teorema de Bayes no dice, por sísolo, nada al respecto. Todo lo que dice es que, dado
406
FUh'D.4hIE\TOS DE FILosoFÍ.~ DE LA CIENCIA
e, la justificación de h. pode), será mayor que la de h', p(hlle), si y sólo si la probabilidad anterior de h es mayor que la de 11': p(Iz/e) 2 p(hl/e) syss p(k) 2 p(h') (debe recordarse que este bicondicional sólo vale en los casos en que e es predicha por las hipótesis, e.e. tanto h como Iz' implican e). Es decir, que la evidencia presenla en las probabilidades posteriores el orden de las probabilidades asignadas antes de tener en cuanta la evidencia, lo cual no es de mucha ayuda; parece que la evidencia no aporta nada nuevo (al menos mientras nos mantenemos en el nivel cualitativo): lo mismo que se puede decir antes de tomarla en cuenta, se puede decir después. El teorema de Bayes por sí sólo no ilumina la cuestión sobre cuánto más apoyan a una de dos hipótesis cienos datos (predichos por ambas), lo único que establece es que una hipótesis es más probable relativamente a la ocurrencia de datos predichos por ella de lo que lo era "antes". Para que tenga efectos en la comparación de grados de apoyo entre dos hipótesis, para poder disponer de la medida cuantitativa, es necesario determinar las probabilidades anteriores, y si éstas son subjetivas, objetivas o a priori. En este punto, los bayesianos tienden por lo general a defender alguna forma de subjetivismo, aunque también los hay objetivistas (cf. p.ej. Pollock, 1990). Como veremos, la lógica inductiva de Carnap pretende ser una propuesta apriorista al problema de las probabilidades anteriores.
Algunos filósofos han aceptado que la inducción no se puede justificar ni a priori ni empíricamente, pero no están dispuestos a renunciar a ella y proponen que se acepten a modo de postulados algunos principios que la garantizan. El caso más conocido es el de Russell. Russell mantiene que el problema de la inducción en los términos de Hume es irresoluble, pero a la vez sostiene que la ciencia procede de hecho mediante inferencias ampliativas y que es imposible hacer inferencias ampliativas sin asumir ciertos principios sintéticos. Russell propone cinco postulados específicos (1948, parte VI), algunos muy problemáticos, en cuyo contenido no vamos a detenemos ahora. Sólo conviene insistir en que, para él, esta especie de argumento trascendental no supone una justificación a priori de 10s postulados y, con ellos, de la inducción. No hay justificación a priori ni a posteriori de estos postulados, su única "justificación" es que su rechazo conduce al escepticismo radical, al solipsisino del tnonzeizro presente. Sin embargo, esta línea de defensa parece inestable, colapsa en una de las tres siguientes posibilidades: o bien se convierte en una defensa a priori de los postulados, o bien en una empírica, o bien es una defensa meramente pragmática del método inductivo. Insistir en que no es ninguna de las tres cosas sin especificar qué es no la hace más inteligible.
Reichenbach (1935, 1938) propone abiertamente una defensa pragmática de la inducción. Hume tiene razón en cuanto a que no podemos asegurar que el método inducti-
1
E V : \ I ~ . \ ~ ~ / \ CDE I ~ XLAS TEOR~ASY EL PROBLEMA DE LA I N D U C C I ~ N
407
vo sea correcto. pero apostando por la inducción no tenemos nada que perder y sí mucho que ganar. La idea es que si hay algún método correcto para hacer predicciones sobre lo inobsewado, entoizces la inducción es ese método. Aunque no podemos justificar racionalmente el antecedente de este condicionai, sí podemos justificar el condiciona\. ESposible que la naturaleza no siga un curso regular, pero si lo sigue entonces el mejor modo de dar con él es el inductivo. Por eso apostar por la inducción es pragmáticamente correcto, no tenemos nada que perder y si mucho que ganar. Consideremos otro método para hacer predicciones además del inductivo, por ejemplo, predecir siguiendo las visiones de un mago con su bola de cristal. Quizá ninguno tenga éxito, pero si alguno lo tiene es el inductivo. Se dirá que el mago, quién sabe por qué motivos, podría también tener éxito en sus predicciones. Reichenbach no niega esa posibilidad, pero señala acertadamente que en tal caso el método inductivo daría el mismo resultado (pues s610 si la naturaleza es regular puede tener éxito el mago). Así, puede haber otros métodos tan exitosos como el inductivo, pero no mcis exitosos que él. Eso es suficiente para apostar por el método inductivo. 0, quizá se objete, por cualquier otro de entre los más exitosos. Pero no. En primer lugar, no habría ninguna diferencia práctica, pues los eventuales métodos alternativos igualmente exitosos darían los mismos resultados. Y en segundo lugar, y lo que es verdaderamente importante, sólo de la inducción podemos saber que está entre los más exitosos. Resumiendo: si algún método funciona, entonces la naturaleza se comporta regularmente; y si la naturaleza se comporta regularmente, entonces el Único método para realizar predicciones del que podemos saber que es correcto es el inductivo. Ésta es la justificación del mencionado condicional. Nótese, sin embargo, que esta defensa nada resuelve en cuanto a la aplicación del método inductivo, pues como hemos señalado en diversas ocasiones, la naturaleza se puede comportar regularmente de muy diversos modos; el curso seguido en el pasado es compatible con infinitos cursos futuros diferentes todos ellos regulares (infradeterminación de la teoría por la experiencia).
'
Hasta aquí todas las concepciones aceptan que la ciencia procede inductivamente e intentan justificar tal procedimiento. La última posibilidad consiste en negar justamente eso, en negar que la ciencia proceda inductivamente. Ésta no es la posición de Hume, que rechaza que la inducción proporcione justificación pero acepta que la ciencia procede inductivamente (y por ello la ciencia no proporciona conocimiento justificado). El único filrjsofo influyente que rechaza, o dice rechazar, que la ciencia es inductiva es Popper. Introducimos esta cautela en la descripción de su postura porque, como veremos en la sección 4, su teoría de la conoboración se parece mucho a una nueva conceptualización del soporte evidencia]. Éstos son los principales enfoques clásicos al problema de la inducción. Vamos a examinar ahora en detalle dos de ellos, el justificacionismo de C m a p y su escuela y el refutacionismo de Popper.
308
FUND.451EhTOS DE FILOSOFLADE LA CIENCIA
3. Justificacionismo, grado de confirmación y lógica inductiva (*)
La tesis central de la lógica inductiva es que la relación de co)?firinaciciizi~1d~ictii-a apoyo evidencial, o jusrificación inductii3a)es una relación lógica. Esto es, la expresión 'confirmar inductivamente' es análoga a 'implicar deducti~amente',ambas expresiones no denotan relaciones empíricas sino relaciones analíticas o lógicas. En realidad, como veremos, para Carnap la confirmación es iiiiplicació~~ lógica parcial. La idea es que, dados Ir y e, para establecer si e confirma h o no, o el grado en que lo hace, no hace falta información e~npíricaalguna, basta conocer el contenido lingüístico de 11 y e. Por tanto, "e confirma h (en grado r)", si es verdadera, es verdadera en virtud de reglas lingüísticas, en virtud del significado y la forma lógica de e y h. La intuición que hay detrás es que saber que e confirma Iz no es saber nada sobre el mundo. Por supuesto que saber e y saber 11 es saber cosas sobre el mundo, pero saber que lo primero confirma lo segundo no. La información sobre el mundo la proporciona e, necesitamos información empírica para saber si e ocurre o no. Y si e ocurre, entonces disponemos también, yarcialinelzre asegurada, de otra información empírica, 11. Pero lo que permite pasar de una información empíri-. ca a otra no es información empírica adicional sino, como en la deducción, información lingüístico-lógica. En este sentido la confirmación no es una relación empírica, como la causalidad, sino lógica, como la deducción. (O
La idea básica de que la confirmación es una relación lógica se encuentra ya en la definición pulurizeilre sinrácrica de la confim~acióncualitativa que da Hempel (cf. 1943 y 1945), como lo estaba también tras la propuesta de Sicod. Hempel pretende dar una definición de confirmación que no tenga las fuertes limitaciones del criterio de Nicod, el cual, además de ser sólo condición suficiente, se restringía a los casos en los que la hipótesis es una afirmación uni~.ersalcondicional. La definición de Hempel se aplica a cualquier hipótesis expresable en lógica de primer orden que contenga predicados y relaciones. Hempel da cuatro condiciones que en su opinión debe satisfacer cualquier concepto de confirmación (cf. 1945, S8 y $9; recuérdese que 'C(lr,e)' significa que e confirma h). ( C l ) Condición de implicación: si e implica Ir entonces C(12,e). (C2) Condición de consecuencia para hipótesis: si C ( h , e) y 11' es consecuencia Iógica de h, entonces C(Ii', e). (C3) Condición de consecuencia para evidencias: si C ( k , e ) y e es consecuencia lógica de e' entonces C(h, e'). (C4) Condición de consistencia: si e y h son cada una consistentes por sí solas y C(li, e ) entonces e A 12 también es consisrente. La definición de Hempel, que se ajusta a los requisitos establecidos, está basada en lo que se denomina desarrollo de iriia a$nlzación para zrila serie (fiiiita) de individuos.
I I 1
, i
l t
Puesto que las sencencias, o no contienen variables o, si las contienen, estarán ligadas par cuantificadores existenciales o universales, para caracterizar esta noción basta especificar los siguientes tres casos: (DI) si la afirmación es universal, "x a(x)",su desarrollo para la A ... A serie de individuos a , , ..., ri, es la conyunción de todas sus instancias, e.e. "a(ai) ~ ( a , ) " ;(D2) si es existencial, "3x cr(,~)", su desarrollo es la disyunción de todas sus instancias, e.e. "u(ai) v ... v a(a,)"; (D3) si no contiene variables, su desarrollo es ella misma. Con ayuda de esta noción, Hempel da la definición de confirmación cualitativa en dos pasos. Primero define la confir~nc~ciórzdirecta: e confirma directarnenre h syss e implica lógicamente el desarrollo de lz para los objetos de que habla e. Como se advertirá, esto no es más que la generalización de la idea de confirmación por instancias de Nicod. En el segundo paso se procede a una nueva generalización para cerrar la noción bajo las relaciones lógicas apropiadas: C ( h , e ) syss It es implicada por una clase de hipótesis cada una de las cuales es directamente confirmada por e. A partir de esta definición de confirmación cualitativa, Hempel define del modo natural las de discoi7firtnncióil y neiirr-rrlidod,también cualitativas: e disconfirma h syss e confirma la negación de h; e es neutral respecto a h syss e ni confirma ni disconfirma h. Por último, identifica verificncióti y refrrtnciótz con los casos extremos de confirmación y disconfirmación: e verifica 11 syss e implica A; e refuta h syss e implica la negación de h. Hempel enfatiza que las nociones de verificación y refutación, como las de confirmación y disconfirmación, son relativas, esto es, una hipótesis resulta verificada o refutada respecto (le [itin ei~irle~rcio e. Ahora bien, la posibilidnd de verificación y refutación de una hipótesis ya no es relativa sino absoluta, pues depende sólo de que piieda haber evidencia verificadora o refutadora. Una hipótesis es verficnblelref~itc101esi es lÓ,oicamente posible que haya un informe observacional que verifiquelrefute la hipótesis. Como señala Hempel, que una hipótesis sea verificable/refutable depende, si no se excluyen universos de discurso con infinitos objetos, sólo de su forma lógica: si no contiene cuantificadores es tanto verificable como refutable; si es puramente existencia1 es verificable pero no refutable; si es puramente iiniversal es refutable pero no verificable; si es cuantificacional mixta, no será en general ni verificable ni refutable.
Como se habrá percibido, la noción de confirmación cualitativa así construida, y todas sus derivadas, son puramente analíticas en el sentido antes indicado: dados h y e, la información que permite establecer si C(h. e) es o no el caso, es exclusivamente lingüístico-formal. Por ello la propuesta de Hempel participa plenamente del espíritu de la lógica inductiva. Pero se trata, por así decir, de una lógica inductiva cualitrrtiva. Puesto que el concepto de confirmación o justificación inductiva es intuitivamente gradual, una lógica inductiva meramente cualitativa no es dc mucha ayuda. Lo deseable es disponer de un concepto de confirmación cuando menos comparativo, y si es posible mitrico. Ésta es la pretensión que inspira el programa de Carnap y la escuela inductivista en ei desarrollo de una ntediricl del grndo de confirniocióti. El programa inductivista se inicia con la monu-
mental obra de Carnap Logical Fou~zdatio~ts of P r o b a b i l i ~(1950) y pasa por diversas formulaciones como resultado de las modificaciones que van introduciendo el propio Carnap y sus colaboradores para responder a las dificultades internas y las críticas externas. Entre la inmensa literatura que el programa generó, destacan Carnap, 1950, 1952, 1960, 1963 y 1968; Kemeny, 1955 y 1963; Bar-Hillel, 1968; Hintikka, 1965, 1966 y 1968, y Kuipers, 1978. Aquí sólo vamos a ver las ideas centrales, la primera versión de las mismas, las principales objeciones y las líneas de respuesta que dan lugar a nuevas versiones. La idea básica que inspira el programa de Carnap está contenida en la crítica que hace al concepto cualitativo de confirmación de Hempel. Carnap no tiene nada que objetar a un concepto cualitativo de confirmación en cuanto tal. Es mejor uno comparativo, o mejor todavía métrico, pero un concepto cualitativo puede ser, aunque de limitada utilidad, perfectamente legítimo. Pero sí tiene algo que objetar al concepto cualitativo de Hempel por no satisfacer un requisito que, en su opinión, debe satisfacer todo concepto cualitativo de confirmación. Según este requisito (cf. Carnap, 1950, secs. 86-88), si e confirma h entonces e debe incrementar la probabilidad de 11, e.e. C(12, e) debe implicar p(1zle) > p(h) y, como reconoce Hempel, el concepto por él definido es incompatible con esta condición (cf. Hernpel, 1966b, n. 17). Esta crítica, y el requisito que la inspira, muestra claramente la otra idea básica de la lógica inductiva tal como se desarrolla en el programa de Carnap. Una primera idea, común a todo concepto analítico o a priori de confirmación, es que la confirmación es una relación lógica. La segunda idea, específica de este programa y que acompaña a todas sus versiones, es que la confirmación es probabilista, esto es, la medida del grado de confirmación, el concepto métrico de confiimación, se ajusta a la teoría matemática de la probabilidad. Es más, como ya mencionamos en el capítulo 5 , para Carnap la confirmación cuantitativa corzsrituye uno de los sentidos de la noción de probabilidad, la que denomina probabilidadi o probabilidad lógica. Carnap define el grado de confirmación c de k por e como el cociente entre m(h A e) y m(e), donde m es una medida de lo que él llama peso probabilista de los hechos (sucesos, enunciados, proposiciones): c(lz, e) = ni(lz A e) l m(e). Recuérdese que según la teoría de la probabilidad, el principio que relaciona la probabilidad de la conyunción con la probabilidad condicionada es p(lz A e ) = p(e) . p(hle). Puesto que m es una medida probabilista, lo que está haciendo Carnap no es sino ide~zrificarel grado de confirmación c(k,e) con la probabilidad condicionada p(hle), y denotar mediante 'm' las probabilidades anteriores incondicionadas de e y de 11 A e. Hasta aquí todo es bastante bayesiano, aunque con una pretensión más general. En los casos de contrastación, en los que 11 implica e, el cociente p(lt A e) 1 p(e) se puede simplificar, pues en ese caso p(lz A e) = ~(11);pero Carnap tiene buenos motivos para no utilizar la forma abreviada c(h, e) = m(lz)lm(e), pues la noción de grado de confirmación, o probabilidad~,que está definiendo es una noción general que no se limita a los casos en que 11 implica e. La función c mide el grado en que e apoya (soporta inductivamente) h, sean e y h lo que sean; la contrastación de hipótesjs constituye tan sólo una aplicación. especialmente importante, de esta noción general.
1
I
ii
¡
I
1
i
41 1
EK\LUACIÓN DE LAS TEOR~ASY EL PROBLEMA DE LA INDL'cC~~N
La idea que inspira la medida carnapiana de grado de corroboración o soporte inductivo es que la inducción es una implicación parcial, y que dicha parcialidad se mide en términos probabilistas. En la inferencia demostrativa, a implica "totalmente" en el sentido de que en todas las situaciones o mundos posibles en que ocurre a,ocurre también p; P está "totalmente contenida" en a. La idea de Carnap de Ia inducción como implicación parcial es la siguiente: en la inferencia ampliativa, cl "implica parcialmente" en el sentido de que en parte (en algunas) de las situaciones o mundos posibles en que ocurre a, ocurre también B; B está "parcialmente contenida" en a. La función c es entonces una función general que mide el grado en que un estado de cosas (suceso, proposición, hecho, enunciado) está contenido en otro. La medida se hace sopesando las situaciones en que ambos ocurren; calibrando, de entre las situaciones en que ocurre e, la proporción de ellas en que también ocurre h. Ésta es la idea que hay tras la medida c(h, e) = m(h A e) l m(e), y el principal problema, fuente de todos los demás, es cómo se determinan las probabilidades anteriores m(h A e) y m(e). Recuérdese que la confirmación o probabilidad inductiva pretende ser a priori y que eso significa que dados e y h se debe poder determinar a priori c(h, e ) . Por tanto, m(h A e) y m(e) han de estar determinados a priori por el contenido y forma lógica de e y h, sin información empírica adicional alguna. En caso contrario se está abandonando la idea de una lógica inductiva.' Carnap formula inicialmente su sistema para lenguajes muy simples, que incluyan sólo predicados cualitativos monarios. Para la construcción de c impone algunas condiciones generales o axiomas que corzceptunlmente debe satisfacer cualquier función para poder ser considerada una medida de soporte inductivo. Algunos de esos axiomas están destinados a que c sea efectivamente una medida probabilista, p.ej. "si h implica h' entonces c(h, e) 1 c(hf, e)". Otros establecen condiciones adicionales pretendidamente derivadas del concepto de confirmación, p.ej. "si e y h no contienen variables, entonces el valor de c(h, e) depende sólo de los individuos mencionados en e y Iz" (esto es, los datos relativos a otros individuos que no intervienen en e no cuentan para determinar el apoyo que e confiere a h). El problema es que los axiomas solos no bastan para determinar c. Son posibles muchas funciones c diferentes que satisfacen los axiomas y la cuestión es cómo se determina una de ellas, si es que ha de haber una lógica inductiva. El problema (como ocurría con los bayesianos) es cómo determinar las probabilidades anteriores m, pues de ellas depende la medida c; hay tantas funciones de confirmación posibles como posibles determinaciones de probabilidades anteriores.
P
P
3.3. PROBABILIDADES ANTERIORES En la primera versión del sistema, de 1950, Carnap aborda la determinación de las probabilidades anteriores mediante la noción de descripción de estado ('state descrip2. Nótese que esta lógica. inductiva "incluye" la deductiva. De la definición de c y de que m es probabilista obtenemos: a implica deductivamente P si y sólo si c(P, a ) =m(p A a) / m(a),y como, si a implica B entonces P A a es equivalente a a,tenemos c(D, a)= m ( a )1 m(a)= 1.
112
FlJNDAhIEhTOS DE F I L O S O F ~DE ~ L.4 CIENCIA
riolz'), semejante como se verá a la de situación o mundo posible del Tractatils. Si el lenguaje contiene 11 predicados 'Fl', ..., 'F.' y k constantes individuales 'al', ..., 'am', cada descripción de estado especifica para cada individuo qué propiedades tiene y cuáles no. Una de las descripciones de estado para ese lenguaje es, por ejemplo, Flal A. 1 Fla2 A ... F.akw.Puesto que hay n k A F,ar., A 7 F l a k , A7 F2aiA ... A F2akA ... A Fnal A ... A estados de cosas atómicos, el número total de descripciones de estado es 2". '. Así. por ejemplo, si hay un único predicado 'F y tres constantes individuales 'a', 'b' y 'c', hay ocho diferentes descripciones de estado: 'L
Como se notará, cada descripción de estado describe exhaustivamente un mundo o situación posible. Entonces, como en el Pactarus, se puede identificar cada afirmación a con el conjunto de descripciones de estado en que es verdadera; por ejemplo, "Fb" se identifica con el conjunto (1, 2,4, 61, "Fb A 7 Fc" con {4,6}, y ''7 Fc" con (4, 6, 7, 8). La idea ahora es asignar a cada descripción de estado un número entre O y 1 de modo que entre todas las asignaciones sumen 1, esto es, asignar probabilidades a las descripciones de estado. Dada esa asignación, la función m se obtiene inmediatamente: m asigna a a la suma de las asignaciones de las descripciones de estado en que es verdadera. El problema consiste entonces en determinar el modo de asignar pesos probabilistas a cada descripción de estado. La posibilidad que parece más inmediata, puesto que desde un punto de vista a priori no se sabe ni se puede saber nada más, es aplicar el principio de indiferencia y asignar a cada descripción de estado el mismo peso; en el caso del ejemplo, 118 a cada una. Esta asignación genera una función de probabilidades anteriores específica, digamos m+, y con ello una medida de confirnlación específica, c+. Carnap desestima esta posibilidad porque, aunque parece intuitivamente plausible, tiene una consecuencia inaceptable, a saber, que la evidencia no puede alterar la probabilidad de la hipótesis. la deja siempre invariante: c+(lt,e ) = m+(h)para todo 11 y e. Aunque es sencilla, no vamos a transcribir la demostración (puede pensarla el lector), baste a modo de ejemplo ver que efectivamente es así en un caso concreto donde esta consecuencia resulta particularmente contraintuitiva desde el punto de vista de la lógica de la confirmación. Por ejemplo, si h es "Fb" y e es "Fa A Fc", tenemos m'(Fb) = 4(1/8) = 112 y c+(Fb,Fa A Fc) = m+(FbA Fa A Fc) 1m+(Fa A Fc) = 1(1/8) / 2(1/8) = 112. La probabilidad de Fb relativa a que se hayan dado ya dos casos de F (en realidad, en este caso, relativa a que todos los demás individuos sean F) es la misma que la probabilidad anterior incondicionada de Fb. Esto es claramente contraintuitivo si las probabilidades condicionadas han de servir para elucidar la noción de apoyo evidencial. Así pues, para que la evidencia pueda incrementar la probabilidad de la hipótesis es necesario asignar pesos desiguales a las descripciones de estado. La cuestión es cómo seleccionar, entre las infinitas alternativas, una de ellas. Para ello Carnap recurre a la
T;V,\LU,.\CI~NDE LAS TEOR~ASY EL PROBLESIA DE 1x1 INDL'CCIÓN
413
noción de de.rcripción de estrt4ctura ('srrucrrrre description'). Una descripción de escmctu-
ra a ~ r u p a l a sdescripciones de estado en grupos isornorfos. En nuestro ejemplo, las descripciones 2, 3 y 4 son isomorfas (cf. Apéndice), y las 5, 6 y 7 también, así que hay un total de cuatro descripciones de estructura: [ l ) , 12. 3, 41, 15.6. 7) y (8). Las descripciones de estado describen el total de situaciones, las diferentes posibilidades de ejernplificarse las propiedades en los individuos. Las descripciones de estructuras describen el total de situacione.r estruct~~raltnente diferentes.Aunque "-Fa A Fb A Fc" y "Fa A Fb A Fc" son diferentes situaciones, no son situaciones estructuralmente diferentes, son isomorfas. Las descripciones de estado quedan identificadas al determinarse qué individuos tienen cada propiedad; las descripciones de estructura, en cambio, quedan determinadas al determinarse el número de individuos que tienen cada propiedad. Carnap realiza ahora la asignación aplicando el principio de indiferencia a) a las descripciones de estructura, y b) a las descripciones de estado dentro de cada descripción de estructura. Esta asignación genera una función de probabilidades anteriores específica, m*,y con ello una medida de confirmación específica, c.. En nuestro ejemplo, este procedimiento asigna a cada descripción de estructura 114, quedando la asignación para las descripciones de estado del siguiente modo: 114 para la 1 y la 8 y 1/12 para cada una de las restantes. Es fácil comprobar que ahora la evidencia puede incrementar la probabilidad de la hipótesis. No siempre es así, no se pretende que cualquier evidencia aumenta la probabilidad de la hipótesis, sino sólo que pueda haber evidencia que sí lo haga. Por ejemplo, en el caso visto, de acuerdo a las intuiciones, la hipótesis "Fb" es apoyada positivamente por los datos "Fa A Fc", pues mW(Fb)= 112 y c'(Fb, Fa A Fe) = 314; y en otros casos ocurre lo contrario, por ejemplo con esa misma hipótesis y los datos "1Fc" obtenemos ca(Fb,7 Fc) = 113. Por tanto, las instancias positivas semejantes confirman la hipótesis y las instancias negativas semejantes la disconfirman. Así, m' garantiza que podamos aprender inductivamente de la experiencia. Hasta aquí las líneas generales del programa inductivista iniciado por Camap. Concluiremos comentando brevemente las principales dificultades del mismo y las modificaciones que se proponen para su solución.
Lenguaje cuantitativo. Las formulaciones iniciales que hace Carnap del programa inductivista se limitan a lenguajes muy pobres que contienen sólo predicados cualitativos. Esto representa un grave problema para la aplicabilidad del programa a casos de la ciencia real, pues la mayoría de las teorías científicas usan habitualmente conceptos cuantitativos. Aunque no es una dificultad de principio, Carnap la percibió como una grave limitación y en los Últimos tiempos trabajó en sistemas que incluyeran conceptos cuantitativos. Dependencia del lenguaje. La primera dificultad seria es la dependencia del grado de confirmación c de la riqueza expresiva del lenguaje. Cada uno de los métodos para asignar las probabilidades anteriores m arroja resultados diferentes en función de
cuáles sean los estados de cosas elementales posibles y eso depende del lenguaje que se use. En el sistema examinado es fácil ver que el modo de asignar los pesos a las descripciones de estructura y de estado hace depender los valores asignados, y con ellos m' y ca, del número de predicados del lensuaje. Esto es así tal como se ha construido m', pero un problema análogo tendría cualquier otra función determinada a priori por niétodos semejantes. En e1 sistema continuo de 1952 se manifiesta explícitamente este problema. Generalizando el tratamiento anterior, Carnap da una fórmula para determinar c(h, e) que además de h y de e, depende también de la riqueza del leitgriaje L (y de cierto parámetro numérico 3L que comentaremos más adelante). Ya en el sistema inicial, Camap introduce al efecto un requisito de completud expresiva, según el cual L debe contener todos los predicados necesarios para poder expresar todos los atributos de los individuos del universo de discurso (cf. 1950, p. 75). Más adelante introduce como axioma la exigencia de que c no debe v+ar con la inclusión de nuevos predicados (cf. 1963, p. 975). Pero, como hemos visto, esta exigencia no la satisface el sistema general de 1952, y tampoco lo hacen los posteriores. La única posibilidad parece ser partir de lenguajes expresivamente completos. Pero aquí sobreviene una dificultad de p~irzcipio: quien determina qué propiedades hay en el universo de discurso susceptibles de ejemplificarse en los individuos son las propias teorías científicas. Por lo tanto, la determinación de cuál es el Ieltguaje expresii)ameittecolnplero es relativa a una teoría o familia de ellas. La situación es pues la siguiente. Por un lado, la determinación de la función de confirmación c de acuerdo con la cual se evalúan las teorías científicas depende de.la determinación previa del lenguaje completo L. Por otro, la determinación de qué lenguaje L es expresivamente completo depende de las teorías científicas que consideremos describen correctamente el mobiliario de propiedades del universo. De ambas cosas se sigue que la medida de justificación inductiva depende de las hipótesis empíricas que hacen las teorías científicas. Esto tiene dos consecuencias fatales para el pro~ectoinductivista. En primer lugar, queda socavado el pretendido carácter a yriori de la lógica inductiva. En segundo lugar, o la justificación de la inducción es circular, o la inducción no es el método con el que evaluamos qué teorías son (más) correctas. En efecto, si la corrección de las teorías que permiten determinar el lenguaje completo L se evalúa inductivamente, caemos en una circularidad, pues la función inductiva c depende de cuál sea L; la alternativa sólo puede ser que se evalúen las teorías que detern~inanL por un método no inductivo. Nótese que no es posible eludir estos problemas rechazando que c dependa del lenguaje; es esencial que c dependa del lenguaje, pues sólo así constituye una Iógica inductiva. La única posibilidad.parece ser que (como ocurre en la lógica deductiva) c dependa sólo de aspectos generales del lenguaje, aspectos cuya determinación no varíe de una teoría científica a otra. Éste es seguramente el sentido del nuevo axioma que introduce Carnap (la invarianza de c respecto de la inclusión de nuevos predjcados), aunque al final se queda en una exigencia programática incumplida. En realidad es difícil concebir una lógica inducrii9a,no deductiva, que dependa sólo de esas propiedades tan generales del lenguaje. Arbitrariedad. La segunda dificultad importante se deriva de la aparente arbitrariedad en la elección de la función m que determina la medida c. ¿Por qué elegir m' y no
cualquier otra (diferente de m-)?Hay numerosas funciones que tienen 13s mismas consecuencias intuitivas que m', a saber, que crecen con las instancias positivas y decrecen con I,is negativas; ¿por qué quedarse con una más que con cualquiera de 13s otras? Hemos anunciado en el punto anterior que e n 1952 Carnap generaliza su sistema y establece u n a fórmula para determinar c(h, e) que, además de h, de e y del lenguaje L, depende de cierto prirsmetro numerico h. Este patrímetro puede variar entre O y -a, coriespondiendo c- y c., respectivamente, a íos casos con h = y A = 2. Tenemos pues a nuestra disposición un continuo de métodos inductivos diferentes e incompatibles que dependen del valor que frjzmos para el parárnetro h. La medida c' correspondz a h = 2, ¿qué razones hay para considerar que esa, o cualquier otra, es la lógica inductiva correcta? A veces se expresa esta dificultad acusando a Carnap de apt-ioristno. Pero ésa no es una acusación para el inductivista. Si el grado de confirmación c ha de expresar tina Iógicn inductivri, las probabilidades anteriores m se deben detennitzar a priori. El problema no es el apriorismo sino la arbitrariedad puesto quz no parece haber más razones n priori en favor de una m que de otras, jcórno se jrlstifca nuestra elección de una determinada? Los inductivistas, incluido Carnap, suelen identificar los diversos valores de h con los diversos grados posibles de uniformidad de la naturaleza; h sería una medida de la complejidad del mundo. Pero entonces, aceptar un valor determinado para h equivale a aceptar un principio especij7co de regularidad-simplicidad de la naturaleza y la cuzstión. obviamente, es qué justifica esa elección. Dicha justificación no parece poder ser a priori, pues el concepto de justificación no basta para determinar una única h. Carnap y otros sugieren a veces que h puede determinarse empíricamente, por ejemplo atendiendo a frecuencias observadas (cf. p.ej. Carnap, 1950, p. 181, y 1952, p. 55). Pero en primer lugar, y caso de ser viable optar por esta alternativa, ello supone renunciar al proyecto entero de una lógica inductiva, pues tal lógica no puede depender de hipótesis empíricas sustantivas. Y en segundo lugar, la alternativa es simplemente inviable, pues una hipótesis empírica sobre el valor de h requeriría, cor;io cualquier hipótesis empírica, dz justificación. lo cual conduce a un círculo o a un regreso infinito, ambos viciosos. Carnap mismo acaba desestimando explícitamente esta vía: "no es necesario referirse a la experiencia para juzgar la racionalidad de la función c" (1965, p. 263). En algunos lugares parece proponer que la elección de c descansa en nuestra intiiición indzicriva (cf. 1963, p. 978), pero eso hace que la lógica inductiva sea n priori en un sentido muy problemático. En la medida en que esa intuición pueda variar entre individuos o comunidades se estaría despIazando hacia el subjetivismo (al respecto, cf. también 1960). En definitiva, ninguna razón a priori determina una única función c entre todas las conceptualmente posibies, pero tampoco evidencia empírica alguna puede justificar inductivamente su determinación, pues antzs de determinar c no sabernos lo que significa 'justificar inductivamente'. Estamos una vez más ante el viejo problema de Hume; la indlicción no se puede justificar ci priori, pues su negación no es inconcebible, ni n posteriori, pues su justificación empírica presupondría la validez de un principio inductivo, que es lo que está en juego.
-
Ateoricisrno. Adem5s de las dificultades anteriores que afectan a la concepción misma del programa inductivista, hay otras más específicas. Una de las más graves es que, tal como se formula al principio, la lógica inductiva no se puede aplicar a aquello para lo que se había pensado, a saber, hipótesis generaIes o teorías. Como enfatizaron Popper y otros, y Caniap reconoció inmediatamente, Ias primeras y más acabadas versiones del programa (1950 y 1952) tienen la siguiente consecuencia: si el lenguaje contiene infinitas constantes individuales entonces, para cualquier h que sea una hipótesis condicional general (ley, teoría) y cualquier e que sea una afirmación particular (o un conjunto de ellas), c(k/e) = O. Eso se ve claramente con c' (compruébelo el lector), pero no depende de esa elección específica; lo mismo ocurre con cualquiera de las c que generan los diferentes valores de h. Así pues, cualquier cantidad finita de evidencia particular confirma (apoya, justifica) una hipótesis general en grado cero, esto es, no la confirma en absoluro. La lógica inductiva de Carnap es pues ateórica, no se aplica a hipótesis generales o teorías. Las teorías quedarían al margen de la justificación, serían dispeizsables en el contexto de justificación (aunque no en el de descubrimiento). Esta consecuencia no le parece a Camap, en principio, tan insatisfactoria. De hecho, ella se compadece bastante bien con la postura instmmentalista respecto de las teorías que durante mucho tiempo mantuvo Carnap, a saber, con la tesis de que las teorías son instrumentos para manejar datos de experiencia, para inferir unos a partir de otros, pero ellas no tienen "significación óntica" real. Sin embargo, incluso dejando al margen la cuestión de fondo del instrumentalismo, este ateoricismo tiene algo de contraintuitivo. Como dice Lakatos (1968a, 33b), Carnap primero exriende el problema clásico de la justificación inductiva, incluyendo hipótesis particulares, y después suprime la parte original, las hipótzsis generales. Para resolver este aspecto contraintuitivo, Carnap introduce la noción de confinnación cualificada por casos ('qualified insrance cor~firmariort') de una ley. La idea que hay detrás, y que en su opinión permite ajustar nuestras intuiciones, es que el grado de confirmación de una hipótesis se puede identificar con la fiabilidad o cocienre de apuesta raciortal a la luz de la evidencia disponible. Si eso es así, entonces podemos dar cuenta de lo que los científicos consideran justificación de las teorías en los siguientes términos. Cuando un científico sostiene que una teoría (hipótesis general) está bien fundamentada empíricamente, o que es fiable, no quiere decir que apostaría a que la teoría es verdadera (seguramente no apostaría nada a ello, e.e. c(lt, e) = O), sino que apostaría a que un nuevo caso (predicción) encajará en la teoría. Así, si It es la ley "Todo A es B", el grado de confirmación cualificada cc(lt, e) de la hipótesis-ley por la evidencia e es el grado de confirmación de un caso nuevo de la ley: cc(Vx(Ax + B.;), e) = c(Aa 4 Ba, e), siendo a cualquier individuo no involucrado en la evidencia e. Es inmedjato que cc, como c, sólo depende de la ley y de la evidencia, y además que aumenta hacia 1 al aumentar el número de instancias positivas de la ley de las que se tiene evidencia. Esta innovación es considerada inaceptablemente ad ltoc por Popper, Lakatos y muchos otros, pues consideran que su única finalidad es resolver lo que de contraintuitivo tiene la ateoricidad. Esto no es en realidad una objeción, si ése fuese el único problema. Pero no lo es. En el sistema de Carnap, si e implica la negación de 11 entonces c(h, e) = O pues m(h A e) = O. Aplicado a leyes, eso quiere decir que el grado de confirmación c de la
ley "Todo A es 8"por evidencia que contenga un caso de A que no sea B. "Aa y no Bu", es cero. La lógica inductiva de la confirmación basada en c incluye pues la refutación como caso especial. Pero con fa confirmación cualificada las cosas cambian, cc(V.r(Ax 4 B.r), e) puede ser muy cercano a 1 aunque e contenga muchos contraejemplos de la ley. Es fácil ver que el valor de cc aumenta hacia 1 al aumentar la proporción de casos positivos respecto de Ios negativos; esto es, si de los casos contemplados en e el x % son instancias positivas de la ley y el resto contraejemplos, el valor de cc es ~1100.Eso le parece a Popper completamente inaceptable, pues una medida que tenga esa consecuencia no tiene nada que ver con las nociones intuitivas de confirmación, apoyo evidencia1 o evaluación empírica (cf. p.ej. 1963, cap. 11, 46). Por ejemplo, si la e~idenciadisponible al lanzar una moneda varias veces es que la mitad son caras y la mitad cruces, según cc esa evidencia apoya la ley "Al lanzar una moneda siempre sale cara" en grado 0,5.A Popper eso le parece inadmisible, pues considera que esa evidencia no apoya esa ley etz absoluto. A Camap no le parece tan objetable, pues según él cc mide el cociente de apuesta racional, y en esas circunstancias es racional apostar a caras la mitad. La cuestión de fondo es hasta qué punto cc es una medida de evaluación de la ley. Si de evaluar la ley se trata, dice Popper, en el caso del ejemplo la evaluación debería ser totalmente negativa (a no ser que se rschace e, pero esa es otra cuestión de la que hablaremos más adelante). Y parece que en esto tiene razón. Pero Camap se resiste porque en realidad no acepta que se puedan evaluar las leyes en sentido estricto, en eso consiste su ateoricismo. Lo único que según él pretende cc es explicar qué quieren decir los científicos cuando dicen que una ley está bien fundamentada experimentalmente. Pero ni siquiera eso parece ser así si nos tomamos las leyes en serio, como objetos susceptibles de evaluación; en el caso del ejemplo es muy dudoso que los científicos considerasen mediarrnrnente fundada la ley de que en todos los lanzamientos saldrá cara. Lo que ocurre simplemente es que con esta innovación Camap tiene no uno, sino dos conceptos de confirmación y pretende tomar uno y dejar otro, o viceversa, cuando la situación lo requiera. Pero eso no se puede hacer sin más. Puesto que dan diferentes valores, jcuál es el que recoge la intuición de la justificación inductiva, del grado de apoyo eviilencial? El problema de la inducción, del grado de confirmación, se inició con las hipótesis generales. Carnap lo "ensancha" incluyendo hipótesis particulares. Entonces define una medida c de soporte inductivo que sólo se aplica a las hipótesis particulares, no a las generales. Para recoger las intuiciones sobre la confirmación de hipótesis generales define otra medida, cc, según la cual una ley cuya evidencia disponible contiene igual número de instancias positivas que de contraejemplos, está tan confirmada como disconfirmada por dicha evidencia. Ésta no parece una buena solución al problema del ateoricismo. Y de hecho Camap apenas fue seguido en este punto. La mayoría de los inductivistas, principalmente Hintikka, intentaron resolver el problema desarrollando sistemas de lógica inductiva en los que aun conteniendo L infinitas constantes individuales las hipótesis generales pueden tener grados de confirmación no nulos. El más conocido es el sistema bidimensional de Hintikka en el que c no depende de un único parámetro real h sino de dos. Estos sistemas son extremadamente complejos y no vamos a detenemos aquí en ellos (cf. Hintikka, 1965, 1966 y 1968; para una buena exposición simplificada, Kuipers, 1975).
Condicioizes de aplicacióit y guía para la racioi~alidad. Carnap, c o r o en general todos los teóricos de las inferencias ampliativas, pretende vincular su lógica inductiva con la teoría de la creencia y la acción racionales. La creencia racional se supone que idealmente está cerrada bajo relaciones inferenciales. En el caso de las inferencias deductivas es claro. Si alguien cree a, de a se deduce P, y el sujeto es racional, entonces debería idealmente creer P; o si alguien está justificado en creer a y de a se deduce P, está justificado en creer 0. En este sentido la inferencia inducti\.a también debería ser guía de racionalidad. Sin embargo aquí la cuestión es un poco más complicada, pues la aplicación de la lógica inductiva requiere condiciones adicionales (cf. Carnap, 1950, 634 SS.).La más manifiesta es la condición de eiidencia total. Aunque c(h, e) sea muy próximo a 1 y se esté justificado en creer e, no se debe "inferir" sin más h, pues la inclusión de evidencia adicional puede invertir drásticamente el soporte inductivo, esto es, c(lzle A e') puede ser cercano a O (ya mencionamos esto anteriormente, cf. cap. 2, 53, cap. 5, $5 y cap. 7, $2 y 93). Si la evidencia adicional e' está disponible en esas circunstancias, tomar esa decisión sin tenerla en cuenta no es racional. Por ello, el requisito de evidencia total exige que para aplicar Ia probabilidad inductiva racionalmente es necesario, además de que c(hle) sea alto y e esté justificado, que e incluya toda la evidencia relevante disponible. La satisfacción del requisito de evidencia total no basta. Es necesario además que se especifique cónto usar el grado de confirmación. Consideremos por ejemplo que lo vamos a aplicar para hacer apuestas, o para sostener creencias más o menos intensamente. Hay varias aplicaciones posibles. Una podría ser: si c(1zle) supera 0,5, apuesta todo a h. Otra de este mismo tipo exigiría un límite mayor. Éstas son condiciones de tipo ulí~br-al:si c supera cierto umbral (y se cumple e) apuesta todo a h. La condición que establece Carnap no es de este tipo sino propolrio~zal:apuesta proporcionalmente a c. Si c(lz1e) = r (y se cumple e), apuesta por h "r a 1-r"; p.ej. si c(h1e) = 0,75 apuesta 3 a 1 por I?. Por eso califica el grado de confirmación c de cociente de apuesta racional. Aquí Carnap presenta ciertas inconsistencias terminológicas (hemos visto más arriba que en el caso de hipótesis generales el cociente de apuesta racional es cc y no c, pero dejaremos esta inconsistencia de lado ahora). A veces parece que con el cociente de apuesta racional no se refiere a c(h, e) sino, justamente, al cociente de la apuesta c(h, e) l 1-c(h. e) (el cociente de la apuesta 3 a 1 no es 0,75 sino 0,75/0,25). Pero otras veces lo identifica con el grado de apojo evidencial, entendiendo por tal la diferencia c(h, e ) - m(lz), e.e. el i11crer7íentode probabilidad que e confiere a h. La idea es que lo que mejor expresa la fuerza evidencial de e es el efecto producido por e , la comparación entre las probabilidades de h antes y después de e (otros inductivistas usan el cociente p(hle) l p(lz)). Estas oscilaciones presentan algunos problemas no meramente terminológicos, pero no vamos a detenemos en ellos ahora (cf. p.ej. Lakatos, 1968a, 64). 4. Falsacionismo, grado de corroboración y verosimilitud (*)
Como consecuencia de los problemas vistos, y de otros que no hemos mencionado, el progranla inductivista de Camap y su escuela entra a finales de los sesenta y principios
EVALUACI~NDE LAS TEORÍAS
Y EL PROLiLE.Llr\ DE Lr\ ISI)UCCI~N
de \os setenta en una fase de estancamiento de la que no se ha recuperado.
419
Uno de 10s más
feroces detractores del programa inductivista es K. Popper, que comanda la escuela epistemológica rival conocida comofalsacionismo o refutacionisrno. Este programa alternativo es iniciado por Popper en los años treinta con la publicación de Logik der Forschlirtg (1935). pero permanece prácticamente ignorado, salvo por unos pocos, durante más de veinte años hasta que se traduce la obra al inglés a finales de los cincuenta. El falsacionismo se consolida a partir de los sesenta y constituye durante casi dos décadas la epistemología dominante en 10s países anglosajones y nórdicos, influencia q u e ha ido muchas veces más allá de la comunidad de especialistas y se ha extendido al gran público. Junto con el fundacional Popper, 1935-1958, otros trabajos destacados son Popper, 1956-1983, 1963, 1972 y 1974a; Watkins, 1968; Musgrave, 1973, y Niiniluoto, 1977, 1982 y 1984. El lema del falsacionismo de Popper es el siguiente: el método científico no es inductivo, el método de la ciencia es el de conjetlrras y refiltaciones. Ésta es la esencia del famoso racionalismo crítico de Popper. Sin embargo, este lema es parcialmente confundente. Es cierto que Popper niega que la ciencia proceda inductivamente, pero sólo si por 'inducción' se entiende estrictamente lo que los camapianos entienden. Como veremos, y aun a pesar de las protestas de su fundador, la metodología popperiana se puede calificar de inductiva en un sentido amplio.
Algunos de los problemas del inductivismo carnapiano que hemos visto habían sido planteados por Popper ya en 1935 pensando, a partir de ideas de Keynes y Reichenbach, en sistemas similares a los desarrollados posteriormente por Carnap. La crítica de Popper es pues incluso anterior a la primera versión acabada del programa carnapiano en 1950, y continuaría implacable ante las sucesivas modificaciones. Muchos de esos problemas no los señala sólo Popper, sino tambiin muchos otros autores (incluidos los propios inductivistas). Pero hay una crítica adicional específica de Popper que según él le separa del resto de los críticos. No la hemos incluido en la sección anterior porque no se refiere a la dificultad que tiene Carnap para desarrollar sus intuiciones sino a las intuiciones mismas, a saber, a la tesis de que el apoyo evidencial se mide en términos probabilistas. Así pues, a lo que Popper objeta especificamente es a la versión probabilista de1 grado de apoyo evidencia¡, que, como hemos visto, constituye el núcleo de la versión carnapiana de la inducción. Popper rechaza de plano la idea de una lógica indllctivn probnbilista. Cuando el grado de apoyo de una proposición por otras no es total (deducción), no se puede medir el apoyo parcial con una función probabilista. El grado de apoyo evidencial no es una probabilidad. Popper dice haber dado con un arsumento que prueba definitivamente que cualquier medida razonable del apoyo evidencial no puede ser probabilista. Hay varias versiones del argumento, pero la esencia del mismo es la siguiente (cf. p.ej. 1935-1958, SS3 y apéndice *iXy 1963, cap. 11, $6). (1) El contenido informacional varía inversamente con la probabilidad; cuanto más fuerte es una hipótesis, cuanto más dice, menor es su pro-
430
F U N D A S I E X ~ SDE FILOSOF~ADE LA CIENCIA
habilidad (las tautologías tienen probabilidad 1 al precio de ser vacías). (2) La ciencia
persigue hipótesis cada vez más informativas, con más contenido. (3) La ciencia persigue hipótesis cada vez mejor apoyadas por la evidencia. Por tanto (3), el apoyo evidencial no es una probabilidad. Nótese que si e1 argumento es válido se puede concluir también algo más fuerte, a saber, que ninguna medida que varíe directamente con la probabilidad puede medir el apoyo evidencial. La ciencia no avanza hacia hipótesis más probables sino más improbables. La aparente fuerza de este argumento depende de su ambigüedad; para que las premisas sean verdaderas, o convincentes, el término 'probabilidad' debe significar algo diferente en alguna de las premisas y en la conclusión. Si el término significa siempre lo mismo, el argumento es formalmente válido pero alguna premisa es claramente inaceptable; y si todas las premisas se interpretan de modo que sean aceptables, entonces el argumento es inválido por constituir una falacia de equivocidad (cf. cap. 2, $2). La equivocidad en cuestión involucra los sentidos incondicionado y condicionado de 'probabilidad'. Una cosa es la probabilidad de determinada hipótesis sin más, incondicionada (o condicionada sólo a cierto conocimiento de fondo), y otra diferente es la probabilidad de una hipótesis relativa o condicionada a una determinada evidencia. Y estas dos probabilidades pueden ser muy desemejantes, una hipótesis puede ser muy improbable "por sí sola" pero muy probable relativamente a ciertos datos. En concreto, para que la premisa (1) sea aceptable debe referirse a probabilidades incondicionadas, y en conlbinación con (2) dice que la ciencia persigue hipótesis cada vez menos probables, que es verdadero sólo en este sentido absoluto o incondicionado. Pero la conclusión (4) debe referirse a la probabilidad condicionada a la evidencia, pues de otro modo no se seguiría de la premisa (3), que habla del apoyo evidencia]. Lo único que se infiere válidamente de este argumento es (4') que el grado de apoyo evidencial no es una probabilidad incondicionada, algo que ningún inductivista ha defendido. Debe quedar claro que el sentido en que (1) + (2) es verdadero es el sentido incondicionado. En el sentido en que la probabilidad involucra 13 referencia a evidencia específica para la evaluación es fácil mostrar que en ciencia no siempre se prefieren las hipótesis menos probables. Supongamos que h, implica e y que e ocurre, con lo que e apoya evidencialmente (en el grado que sea) /ti; por ejemplo, h , puede ser la mecánica celeste newtoniana y e la reaparición del cometa Halley. Ahora tomemos una hz que no tenga intuitivamente nada que ver con e, por ejemplo la teoría de la combustión de Lavoisier. La conyunción hl A 1z2 es una nueva hipótesis que tambjén implica e, y además es más informativa o improbable en el sentido precisado, efectivamente ocurre que p(1t1 A h2) 5 p(h1). Pero en esta situación nadie diría que, relativameltte a la ei~idenciadisponible, la reaparición del cometa Halley, la ciencia prefiere la hipótesis de más contenido h , A 1z2. En cualquier caso, en opinión de Popper la idea de las probabilidades inductivas está inspirada en la vieja concepción de "La Ciencia" como conocimiento cierto, demostrable. La idea se ha modif cado, pues se reconoce que la certeza plena es inalcanzable, pero "como la inducción se considera una especie de generalización debilitada de la deducción, el antiguo ideal se ha modificado sólo ligeramente" (1956-1983, cap. IV,
S27). La pretensión que persisue el inductivismo es establecer nuestras hipótesis ernpiricas, si no con certeza plena, sí con certeza silfícietzte, con alta probabilidad. Pero esta pretensión es vana. En su opinión, no sólo los intentos específicos para desarrollarla están, como los propios inductivistas reconocen, llenos de problemas, sino que la idea misma de inducción probabilista, según cree haber probado con su argumento, está condenada al fracaso por principio: "Nuestra ciencia no es conocimiento (episteme); nunca puede pretender que ha alcanzado la verdad, ni siquiera el sustituto de ésta que es la probabilidad" (1935-1958, $85).
I: I
i 5
i
i I
!
1
11
El método científico no es inductivo. La ciencia no pretende establecer o justificar sus hipótesis. Sin embargo, aprendemos de la experiencia, aunque no por inducción. El método de la ciencia, el método por el que aprendemos de la experiencia. es el de las conjeturas y las refutaciones. El método científico es la máxima expresión del modo mediante el que todo organismo aprende de su entorno: por ensayo y error. En primer lugar, conjeturamos, inventamos libre y creativamente hipótesis generales sobre el mundo, cuanto más arriesgadas mejor (el objetivo de la ciencia no es buscar hipótesis más probables sino más improbables). En segundo lugar, sometemos las hipótesis a prueba mediante tests severos. De nuestras hipótesis (y del coiiocimiento de fondo) inferimos hechos particulares constatables mediante obser~acióno experimentación. Si el hecho particular predicho no acaece, la hipótesis no pasa el test y es refutada por ese informe observacional; si el hecho acaece, la hipótesis pasa el test y sobrevive provisionalmente. Todo lo que por el momento podemos afirmar en este segundo caso, a la espera de nuevos tests, es que la hipótesis puede ser verdadera. Se diseñan nuevos tests para refutarla hasta que no resista la contrastación y quede refutada, en cuyo caso la abandonamos e ideamos otra mejor que supere todas las contrastaciones de la primera y otras nueLas. Así es como se desarrolla y progresa la ciencia, por ensayo y error. El método científico es por tanto un método de contrastación de hipótesis, pero mediante la contrczstación la ciencia no pretende justificar sus hipótesis sino refictarlas. En esto consiste el racionalismo crítico, en hacer todo lo que está en nuestras manos para demostrar que estamos equivocados. Hacer todo lo que esté en nuestras manos incluye usar toda la lógica que podamos, pero no hay más lógica que la deductiva y por tanto no hay más inferencia posible en la contrastación que el ~nodztstollens, la refutación. Si el rnodus tollens no se puede aplicar porque la predicción es exitosa, no hay nada más que aplicar. La lógica sólo permite refutar hipótesis, nunca confirmarlas, ni total ni parcialmente. Al final de su Logik der Forschltng concluye: "No conocemos: sólo podemos conjeturar" (1935-1958, $85). Y nunca podemos saber, ni siquiera aproximadamente, si hemos acertado con nuestras conjeturas, sólo podemos saber que nos hemos equivocado. Ésta es la idea central del falsacionismo de Popper. Conviene enfatizar que no pretende establecer sólo cómo debe proceder la ciencia, sino cómo de hecho procede. Hay un problema lógico de la inducción, que resolvió Hume de una vez por todas (esto es, no
hay lógica inductiva). Pero no hay un problema ~~~erndológico de la induc~iónpues. simplemente, la ciencia no sigue de hecho un supuesto método induc~i\~o. La ciencia sigue de hecho el método de las conjeturas y las refutaciones, como muestra en su cpinión una correcta revisión de la historia de la ciencia, de la que él mismo extrae numerosos ejemplos (cf. p.ej. 1956-1983, "Introducción de 1982"). Conviene insistir en que no hay que interpretar estas afirrnliciones. hay que tomar literalmente la afirmación de que mediante la conuastación la ciencia 170 P K I C I Ijustificar ~ ~ SUS hipótesis sino refutarlas. Popper no dice que se pretende justificarlas empíricamente pero que tal pretensión es ilegítima, pues la justificación inductiva es impositile. Dice literalmente que no se pretende tal cosa, que cuando los científicos contrastan sus hipótesis no tienen la intención de justificar sus conjeturas sino de refutarlas. Eso. nuevamente, es un juicio metaempírico sobre las intenciones de los científicos que. cuando menos, dista de ser evidente sin cualjficaciones ulteriores. Como \*eremos, su teoría de la corroboración cabe entenderla como una importante cualificación al respecto. Hasta aquí cabria considerar la epistemolo,oía de Popper como una epistemología ~legatii-aen el sentido de que el único saber justificado sobre el mundo no es saber sobre cómo es el mundo sino sobre cómo no es. Se puede aducir que eso es efectivamente un modo de saber: saber que cierta hipótesis es falsa es saber algo del mundo. Pero aunque eso sea así, es cuando menos algo conuaintuitivo defender que ése es todo el saber al que aspira la ciencia, esto es, el tipo de saber que caracteriza al conocimiento científico (dejamos por el momento de lado el saber sobre hechos de obsen-ación particulares, sobre el que volveremos más adelante). La ciencia sólo podría aspirar a ser una especie de docra ignot-anria. Y, ciertamente, muchas veces Popper parece asumir abiertamente y sin reparos esta posición ("Fue mi viejo rnaesuo ebanista quien me enseñó l...] que cualquier saber al cual pudiera aspirar sólo podía consistir en conocer cada vez más la infinitud de ini ignorancia", 1973~7,8 1). Sin en~bargo.es difícil rechazar completamente la idea de que las contrastacjones exitosas permiten decir algo po~iti\~o de las hipótesis, esto es, que cuantos más datos resulten acordes con la hipótesis, ésta está, en algún sentido a especificar, mejor "justificada". Ésta es la intuición que hay tras el inductivismo y que parece difícil rechazar plenamente. La teoría de la corroboración de Popper matiza este rechazo incorporando ri su falsacionismo. pace Popper. un grano de intuición inductivicta.
La noción popperiana de grado de corroboracióií pretende expresar cierra evaluación de una hipótesis en virtud de e\idencia pasada favorable. Para ello no sólo importa la cantidad de la evidencia sino ~imbiénla calidad, el rigor de las contractaciones. Popper afirma que no todas las contrastaciones son jgua!es, unas son más rigurosas que otras, y es fácil ~ e que r esa diferencia sólo se considera relevante cuando la hipótesis supera el test, pues si sucuníbe a la contrastación queda refutada sin importar cuán riguroso haya sido el test; en la refutación no hay grados. El rigor de los tests depende de algunos elen~entos pragm5ticos ineliminables (como la autenticidad y sinceridad en la intención de refutar la
1 í
i
!
E V A L U A C I ~ NDE LAS TEOR~AS Y
EL PROBLEMA DE LA INDL'CCIÓN
423
hipótesis). Pero, fijados esos elementos, los restantes se pueden precisar formalmente en términos del contenido de las proposiciones involucradas. Ya hemos visto que, según Popper, se debe aspirar a hipótesis de mayor contenido y que por 'contenido' se debe entender improbabilidad, esto es, el contenido Ct de una afirmación Cl es el complemento de su probabilidad: Ct(a) = J - ~ ( a ) . ~ Popper identifica por lo general ia noción de contenido (o irnprobabilidad) con la de falsabilidad (o corroborabilidad), y ésta con la de explicatividad. La falsa'oilidad de una afirmación depende de la cantidad de sus falsadores porenciales: cuantos más hechos particulares puedan falsar a,tanto más falsable es. Hay casos en que es inmediato ver cuál de dos afirmaciones es más falsable: "Todos los seres inteligentes habitan en la Tierra" es más falsable que "Todos los seres inteligentes habitan en el Sistema Solar'', pues hay más hechos que falsarían la primera que la segunda (todo hecho que falsa la segunda falsa también la primera, p.ej. la presencia de inteligencia en Alfa Centauro, y la primera es falsada además por hechos que no falsan la segunda, p.ej. la existencia de un marciano inteligente). Aunque para otros pares de afirmaciones no sea tan fácil de determinar, se supone que también son comparables en cuanto a falsabilidad. Este concepto comparativo de falsabilidad sugiere otro absoluto que "mida" la falsabilidad de cada afirmación, y el mejor candidato al mismo es el contenido o improbabilidad. Aunque en general Popper recomienda proponer hipótesis de mayor contenido, el rigor de una contrastación no depende del contenido de la hipótesis. Lo que se quiere es determinar cuán riguroso es el test de h mediante la evidencia e y ello no depende del contenido de h sino de la relación entre h y e, y del contenido de e; dos hipótesis con diferente grado de falsabilidad se pueden contrastar con igual rigor. El ri;or depende, en primer lugar, del contenido de e, esto es, de la improbabilidad absoluta de e sin tensr en cuenta h (teniendo en cuenta tan sólo el conocimiento de fondo). Y en segundo lugar, de lo probable que sea e teniendo en cuenta h. La idea es que la contrastación de h a la luz de la evidencia e es tanto más rigurosa cuanto más probable sea e suponiendo que h es verdadera y menos probable sea e independientemente de h. La intuición que hay detrás es que un test en el que la predicción es muy probable tanto si ocurre h como si no, no es un buen test. La medida de rigor S(e, h) del test de h mediante e se puede identificar pues con p(e1h) - p(e) (en realidad, por motivaciones técnicas, Popper define la medida de un modo un poco más coinplicado, S(e, h) = [p(elh) - p(e)] / [p(elh) + p(e)], pero ello no afecta al núcleo de la cuestión y no tendremos en cuenta esta complicación técnica); esta medida S(e, h) se puede considerar también, según Popper, como una medida del poder explicativo de h respecto de e (cf. 1963, Apéndice, 42). En los casos de contrastación usuales en los que e se predice a partir de h (y del conocimiento de fondo), h implica e con lo que p(elh) = 1 y la medida del rigor es 1 - p(e), justamente la improbabilidad de e. Apreciará el lector que esta condición de Popper para un buen test no es sino la recurrente Condición 2 sprobabilidades relativizadris a un conocimiento de fondo h, por lo que 3. Popper considera todas 1 las probabilidades "incondicionadas" p(a) se han de interpretar como p(cllh). Aquí no intraduciremos la complicación notacional correspondiente; en adelante, salvo advertencia en contrario, $(a)'abrevia 'p(co'h)' y 'p(P1oc)' abrevia 'p(P/cr A h)'.
que vimos en el capítulo 3 ($2): e es altamente inesperada en ausencia de A (en cuanto a la Condición 1, Popper es más liberal. pues no exige que h implique e). Ahora estamos en situación de ver la noción de grado de corroboración. Popper dice que S mide "la severidad de los tests como elemento de juicio favorable" (ibid.). Esta afirmación resulta sorprendente si, como él mismo sugiere en numerosas ocasiones, se interpreta su crítica al inductivismo como un rechazo de cualquier concepto que quiera expresar "los elementos de juicio favorables". Pero no se debe interpretar así. Popper sostiene que hay dos sentidos en los que coloquialmente se usan los términos 'probable' y 'probabilidad' (cf. para lo que sigue 1956-1983,cap. IV). Según uno de ellos, la probabilidad de un suceso o una hipótesis está en relación con sus oportunidades para ocumr. Según el otro, la probabilidad de una hipótesis está en relación con los resultados de las contrastaciones. Los dos sentidos son diferentes, el primero satisface el cálculo matemático de las probabilidades, el segundo no (cf. más adelante). Coloquialmente no se distingue entre ellos y el error de los inductivistas consiste en identificarlos. Para distinguirlos, en su primera obra de 1935 reservó 'probabilidad' para el primero y acuñó 'grado de confirmación' para el segundo. Pero puesto que los inductivistas se apropiaron de esta expresión haciéndola sinónima de la primera, y puesto que le pareció después que su uso de 'confirmar' era desafortunado por sus connotaciones verificacionistas, terminó sustituyéndola por 'grado de corroboración'. Al principio Popper usa el concepto de corroboración sólo en un sentido comparativo. Una hipótesis h está tanto o más corroborada que otra h' si h ha pasado con éxito al menos tantos tests, y tan rigurosos, como h'. Pero este concepto comparativo es de poca utilidad. Si h y h' han sido refutadas en realidad ninguna está corroborada. Si h' ha sido refutada y 11 no, h está corroborada y h' no. Así, para que sea una noción interesante debe poder aplicarse a los casos en que ambas han resistido todas las contrastaciones, pero esta noción puramente cualitativa no permite de momento tal cosa. Para ello introduce una medida C del grado de corroboración. La función de C(h, e) es medir el éxito con que una hipótesis h ha superado las contrastaciones hasta cierto momento, contrastaciones cuyos resultados se expresan conjuntamente en e. C es. por tanto, una medida de apoyo evidencial. Advierte que, como en el caso de S, la corroboración depende en parte de aspectos no analizables formalmente, como la ingeniosidad o la "sinceridad" de las contrastaciones (e.e. la realización de la contrastación con la intención de refutar la hipótesis), pero que considerados fijados tales aspectos, el grado de corroboración se representa satisfactoriamente mediante la medida formal C. Popper afirma que los valores numéricos concretos que asigne C no son lo importante, sino ciertas condiciones según él intuitivas que debe satisfacer, y establece nueve desideruta (axiomas) para C (cf. 1935-1958, apéndice *m). No podemos detenemos en ellos aquí. Algunos parecen bastante arbitrarios, como (11) exigir que C esté entre -1 y 1; otros dudosamente intuitivos, como (N) C(x, x) = Cr(x) = 1 - p(.x). Y, como comentaremos más adelante, otros tienen un aspecto bastante inductivista (VI1 y VIII). Popper considera que la medida más intuitiva para C(lt, e) es la que corresponde al rigor de los tests pasados por h cuyos resultados contiene e, esto es, p(el1z) - p(e). Sin embargo, este valor incumple algunos de los desiderata (p.ej. 11), y opta conlo recurso técnico por dividirlo por el factor p(e1h) - p(h A e) + p(e), del que reconoce que no tiene significación intuitiva alguna y que se escoge sólo porque lleva a los resultados deseados
EV~ILUACI~N DE LAS TEOR~XSY EL PROBLEMA DE LA IXDUCCI~H
425
(cf. 1956-1983, $31). La definición del grado de corroboración queda entonces del siguiente modo: C(h, e) = [p(elh) - p(e)] / [p(e/h) - p(h A e) + p(e)l, donde el numerador contiene toda la intuición expresable por el concepto. Esta medida del grado de corroboración como grado de apoyo evidencial tiene en opinión de Popper muchas consecuencias satisfactorias. Primero, es una medida no probabilista y muestra que el grado de apoyo evidencial no es. una probabilidad. La probabilidad p (como el grado de confirmación carnapíano c ) varía entre O y 1, el grado de corroboración C varía entre -1 y 1 (másadelante discutiremos si esta razón basta como argumento antiinductivista); la interpretación pretendida es que la evidencia es favorable, irrelevante o desfavorable si C es, respectivamente, mayor, igual o menor que 0. Segundo, si e implica no-h (refutación), tanto p(elh) como p(h A e) son O y por tanto C(h1e) = -1. Tercero, si e y h son lógicamente independientes, entonces p(h A e) = p(h) p(e) y por tanto C(h/e) = O. Cuarto, la máxima corroboración C(hle) = 1 se obtiene cuando h implica e (e.e. p(h A e) = p(h)) y p(e) = 0; eso quiere decir que en casos de predicción exitosa, en los que e se deduce de h, el grado de corroboración se aproxima tanto más a 1 cuanto más se aproxima p(e) a 0, esto es cuanto mayor es el contenido de e. Éste es el núcleo de la teoría de la corroboración de Popper. Si la evidencia es contraria a una hipótesis, ésta queda refutada. Si la hipótesis resiste la contrastación, se puede mantener provisionalmente y considerarla "apoyada" por la experiencia en grado proporcional al contenido de e. Pero Popper sostiene que este apoyo evidencial no es probabilista. La experiencia no permite establecer la verdad de una hipótesis, ni ningún sucedáneo suyo como la probabilidad. Su grado de corroboración, insiste Popper, no es como el probabilista grado de confirmación de los camapianos. Lo que debemos perseguir son hipótesis mejor corroboradas, no más probables. Y no se ha de pensar por eso que el grado de corroboración es indicio de la aptitud para salir indemne de contrastaciones futuras. S610 expresa la nota con que ha pasado contrastaciones pasadas, y de ahí no se puede inferir nada del futuro. A pesar de ello, la corroboración es guía para la acción: "Desde un punto de vista racional no podemos~umosde ninguna teoría [...] sin embargo, debemos elegir la teoría mejor contrastada como base para la acción" (1972, $9).
De la anterior caracterización del grado de corroboración surge un problema. Si Popper tiene razón y su medida C no tiene nada de "sucedáneo de la verdad", nada de probabilista, entonces perseguir un mayor grado de corroboración no es acercarse hacia la verdad. ¿Qué tiene que ver en ese caso la investigación científica con la verdad? Para un antirrealista eso no representa mayor problema, pero para un realista declarado como Popper sí. Los carnapianos tenían al menos un sucedáneo de la verdad, Popper no. Por lo que a la verdad se refiere, de las hipótesis corroboradas sólo podemos decir que pueden ser verdaderas. Y podemos decir eso de todas las no refictudas, sean cuales sean sus diferentes grados de corroboración. Por tanto, hasta aquí la metodología de Popper debe tratar, por lo que a la verdad se refiere, a todas las hipótesis no refutadas exactamente del
inistno t~iodo.Aunque Popper se dice realista, la verdad no juega hasta ahora ningún papel. Lo único que se puede decir de ella es tan débil, a saber, que cierta hipótesis puede ser \,erdadera, que eso mismo se puede decir de todas las hipótesis (las no falsadas:~por igual. Popper intenta resolver esta dificultad mediante el concepto de \jerosiinili;ud ('trurhlikness'). La verosimilitud de una afirmación expresa su "distancia" respecto de la verdad. La idea es que, aunque dos hipótesis sean falsas, una puede estar objetivamente "más próxima" a la verdad que la otra. Una hipótesis falsa puede tener, además de consecuencias falsas, un gran número de consecuencias verdaderas, piénsese, p.ej., en el geocentrismo, o en la mecánica newtoniana. mies bien, una hipótesis (empírica) está tanto más cerca de la verdad, es tanto más i~erosfinil,cuanto mayor sea la diferencia entre su conreilido de verdad y su co~ttenidode falsedad (cf. para lo que sigue 1963, Apéndice, $3). Si hTes el conjunto (o conyunción) de consecuencias verdaderas de 11, Popper identifica el contenido de verdad de 11, Ctdh), con el contenido de 117, e.e. 1 - p(h~);y para que se cumplan ciertas condiciones que considera deseables, identifica el coltte~zidode falsedad de h, Ctdh), con 1 - p(ldhT).Así definidos los contenidos de verdad y falsedad, la verosimilitud de h es Vs(h) = Ctdh) - Ctdk) = p(Mh~)p(ltT). De nuevo, para que la medida satisfaga ciertos desiderata que le parecen iiituitivos, cambia a una versión normalizada dividiendo por p(ldhT)+ p(lzT): Vs(h) = [ ~ ( W ~ I-Tp(h~)] ) 1 [p(Idh~)+ y(h~)].En esta nueva forma, esta medida de distaizcia de la verdad genera los siguientes resultados: vaná entre -1 y 1; es -1 para las contradicciones; es O para las tautologías; es mayor que O cuando 11 es verdadera y tanto más próxima a O cuanto más alta sea p(h). Concluiremos el estudio del problema de la inducción en Popper con una breve discusión de las principales dificultades.
Verosii?zilinrd. Como ha reconocido el propio Popper, su definición precisa de verosimilitud es defectuosa, pues produce inconsistencias (cf. 1956-1983, "Introducción de 1982", $V, también p.ej. Rivadulla, 1991, cap. III). Algunos popperianos, especialmente Niiniluoto, han trabajado en definiciones alternati~as(Niiniluoto, 1977. 1982 y 1984). Pero el principal problema no es ése. El principal problema es que dicho concepto, independientemente de la medida específica que se dé, no resuelve el problema para el que el realista recurre a él. Simplemente, esa "distancia objetiva a la verdad es relativa exclusivamente a h, izo tiene en cuenta evidencia alguna eií absoluto. Pero entonces, ¿qué relación tiene con la corroboración? Ninguna. Debemos elegir las hipótesis mejor corroboradas, pero nada garantiza que corroboración y verosimilitud vayan de la mano. Es perfectamente posible que hipótesis cada vez más corroboradas sean cada vez menos verosímiles. La verdad sigue estando ausente de la investigación científica. Que la ciencia avanza hacia la verdad es un supuesto injustificado y, por tanto, gratuito. El realismo de Popper es puramente testimonial. Algo análogo sucede con la revisión de Niiniluoto. Define una verosimilitud objetiva que es independiente de la evidencia y que no tiene ninguna relación con la contrastación. Después define una verosimilitud estitnada que toma.en cuenta la evidencia, pero que puede diferir total~nentede la verosimilitud objetiva.
EV:\LUACI~N DE LAS TEOR~AS Y EL FRODLE\fX DE LA I N D U C C I ~ N
427
Severidad de los tests y falsación. En la medida S = p(e1h) - p(e) de severidad d e los tests. e contiene los datos empíricos resultantes del test o conjunto de tests realizados. En los casos de contrastación favorable, e es predicho por h. h implica e. En los casos d e contrastación desfavorable, e refuta h porque h predice-lo contrario de e, h implica no e y por eso e implica no h. Pero eso supone que los tests desfavorables nunca son severos, pues si h implica no e entonces p(elh) = O y S = - p(e). Esto es completamente contraintuitivo, pues la medida de severidad de un test no puede depender de que el test resulte favorable o desfavorable. Intuitivamente el rigor de un test determina cuán útiles son los resultados, sean éstos favorables o desfavorables. La medida de Popper de severidad d e los tests no se aplica a los casos de refutación, pero entonces tampoco se puede considerar que mida eso en los casos de corroboración. Simplemente S no es una medida de severidad de los tests. Y así parece reconocerlo implícitamente Popper cuando dice que S mide la severidad de los tests "como elementos de juicio favorables" (1963, Apéndice, $2). En realidad, como muestra la construcción de C. S es indicio del grado de corroboración, la "parte intuitiva" de ambas medidas es la misma: p(elh) - p(e). Corroboración e implicación. Según Popper, su medida C tiene consecuencias claramente satisfactorias en tanto que medida del apoyo evidencial. Pero, incluso si eso es así (cf. más abajo los próximos problemas), tiene otras consecuencias que son claramente contraintuitivas. La primera es que si e implica h, entonces C(h, e) = 1 - p(h). Esto es, cuando de los datos se deduce la hipótesis, C coincide con el contenido Ct de la hipótesis. En particular, C(.r, x) = Ct(,r): el "grado en que x se apoya a sí misma" no es el máximo, 1 (salvo que x sea una contradicción). Aunque eso no le parece a Popper contraintuitivo, e incluso lo exige como uno de los axiomas (cf. 1935-1958, apéndice *N,desiderata 111), no se ve entonces qué tiene C de medida del grado de corroboración o apoyo. Parece constitutivo de la noción de apoyo que si e y h son lo mismo, e apoya h en grado máximo. Y por supuesto lo mismo sucede si e implica deductivamente h. Ateoriciano. Popper es uno de los que más duramente ataca la ateoricidad del grado de confirmación c carnapiano (y la introducción, en su opinión ad hoc, del grado de confirmación cualificada cc; cf. p.ej. Popper, 1963, cap. 11, $6). Pero a su medida de corroboración le ocurre algo parcialmente semejante, con el agravante de que, contrariamente a Camap, él no está dispuesto a ser instmmentalista. En Camap, si el lenguaje es infinito, c asigna a toda hipótesis general el valor mínimo 0. Con la medida C de Popper no ocurre eso, pero ocurre que, relativamente a l mismo cuerpo de predicciones exitosas e, todas las hipótesis generales son corroboradas en el misino grado. En efecto, en los casos en que los datos e son los predichos, e es implicado por h y por tanto p(e1h) = 1. Si además h es universal (y, como en la situación problemática para Carnap. el lenguaje infinito), p(h) = O y por tanto también p(h A e) = O. Pero entonces, sustituyendo estos valores en la medida de Popper, tenemos que para cualquier hipótesis universal h, C(h, e) = (1 - p(e)) 1 (1 + p(e)). Como puede verse, este valor no depende de h, esto es: los mismos datos corroboran en igital grado crlalquier hipótesis general que los prediga. Ello representa sin duda otra forma de ateoricismo, pues el grado de corroboración es insensi-
ble a diferencias teóricas, es independiente de las diferencias entre las hipótesis generales
en juego. No se ve, entonces, cómo se va a poder "perseguir" o "elegir" entre diferentes hipótesis la mejor corroborada si de hipótesis generales (e.e. teorías) se trata. iA~zriitiductivismo? "El inodus tollens sin corroboración es vacío, el ~nodustoIlens con corroboración es inducción" (Salmon, 1966, p. 160). Muchos, como Salmon, han acusado a Popper de ser un inductivista encubierto, pues su grado de corroboración es despues de todo una medida de apoyo evidencial. Popper rechaza la acusación e insiste en que su medida no pretende decir nada del rendimiento futuro ofiabilidad de las hipótesis. Además de esta réplica general. demasiado vaga por sí sola, el único aspecto diferenciador concreto en que insiste es el probabilista. Su grado de corroboración, sostiene reiteradamente, no es probabilista. Pero, como vamos a ver, en la medida en que esta afirmación es verdadera, no establece ninguna diferencia interesante, y en la medida en que establecería diferencias interesantes su afirmación no es cierta. Popper dice que su medida C no es probabilista porque, a diferencia de la camapiana c, no satisface los principios del cálculo de probabilidades. Por ejemplo, C varía de -1 a 1 y no de O a 1; o, para 111y 112 incompatibles, no ocurre que C(hi v hz,e) = C(hl,e) + C(h2, e); o tampoco que C(h, e) = 1 - C(no-h. e). Todo esto es verdad, pero no establece una diferencia inreresaizte respecto al carácter probabilista de la medida. En primer lugar, y antes de entrar en el fondo de la cuestión, hay que recordar que C varía de -1 a 1 sólo porque así se ha definido ad Izoc. La parte intuitiva de C, el numerador p(e,h) - p(e), vana de -p(e) a 1 - p(e) y sólo consigue que varíe de -1 a 1 dividiendo por el factor reconocidamente a d hoc p(e, h) - p(h A e) + p(e). En general, todos los supuestos beneficios intuitivos de que C varíe en concreto entre -1 y 1 no son tales, pues estos límites son totalmente arbitrarios y satisfechos ad hoc. Es realmente sorprendente que, entre los axiomas o desiderata que según Popper cabe exigir intuitivamente a toda medida de apoyo evidencial, se incluya la exigencia de que C varíe de -1 a 1, y otras más que presuponen esto, cuando reconoce (cf. 1956-1983, $3 1) que, para que su propia medida satisfaga estas exigencias, debe introducir un factor sin significación intuitiva alguna. A pesar de ello, se dirá, la parte intuitiva de C varía entre -p(e) y 1 - p(e), y no entre O y 1. Cierto, pero eso no es por sí solo demasiado interesante, pues, como vimos, el propio Carnap afirma a veces que se puede medir la fiabilidad de h dado e mediante la diferencia c(h, e) - m(h), medida que varía entre -m(k) y 1 - m(h) y que tampoco cumple los principios del cálculo de probabilidades. Otra aparente diferencia en cuanto al comportamiento probabilista de estas medidas es que, cuando e implica deductivamente 11, c(h, e) (o su derivado c(h, e) - m(h)) alcanza, como la probabilidad, el valor máximo posible, mientras que C(lz, e) (o su parte intuitiva p(e, h) - p(e)) no. Pero, en primer lugar, como vamos a ver, esto no basta para liberar a C de todo espíritu probabilístico-inductivista. Y en segundo lugar, aquí las intuiciones están claramente en contra de Popper, pues si los datos implican la hipótesis parece claro que el grado de apoyo en este caso ha de ser el máximo de la medida. Lo que realmente importa para ver si una medida de apoyo evidencia1 es o no de inspiración probabjlista es si crece o no con las probabilidades anteriores. La insistencia
EVALUACIÓNDE LAS TEOR~AS Y EL PROBLEMA DE LA I N D C C C I ~ N
429
de Popper en que lo que cuenta, y hay que perseguir, no es la probabilidad sino la improbabilidad sugiere que su medida no es de inspiración probabilista. Incluso a veces Popper afirma explícitamente que apoyo evidencial e improbabilidad van juntas: "la corroborabilidad de una teoría, y el grado de corroboración de una que haya pasado realmente contrastaciones muy duras, se encuentran en razón inversa a la probabilidad" (1935-1958, 983); "contenido e improbabilidad tienen una relación tan estrecha con el grado de corroboración como la propia contrastabilidad" (1956-1983, $30). Pero, en la interpretación más natural. eso es simplemente falso. Es cierto que la contrastabilidad tiene una relación directa con la improbabilidad (o contenido), de hecho muchas veces las identifica sin más. Y la corroborabilidad también, pues es lo mismo que la contrastabilidad. Pero grado de corroborabilidad y grado de corroboracicín no son lo mismo, el primero mide cierta propiedad de h. su fuerza o contenido, el segundo mide cierta relación entre h y e, el apoyo a h de los resultados e de los tests pasados con éxito. Y aunque Popper diga lo contrario, simplemente no es cierto que ambas medidas tengan la misma relación con la probabilidad. De nuevo, se está mezclando la probabilidad incondicionada de la hipótesis y la probabilidad de la hipótesis condicionada a los datos. Nótese que cuando Popper afirma que el grado de corroboración es inverso a la probabilidad, debe estar refiriéndose a la probabilidad de la hipótesis h. No puede refirirse a la probabilidad de e, pues es inmediato que (en los casos de contrastación exitosa, en los que h implica e) la medida de Carnap c(h, e) = m(h A e)lm(e) también crece con la improbabilidad de e. Pero si de p(h) se trata, es simplemente falso que C(h, e) crezca al disminuir p(h). Y no sólo es falso de Ia C concreta que da Popper, sino de cualquier medida que satisfaga sus axiomas, pues el axioma VI11 establece que cualquier medida de apoyo evidencial aceptable debe satisfacer la siguiente condición: si h implica e, entonces C(h, e) y p(h) crecen a la vez. Así, no sólo no es cierto que C(h, e) decrece siempre con p(h), sino que en los casos más interesantes, cuando h predice e, ocurre justamente lo contrario, el grado de corroboración crece con la probabilidad anterior de la hipótesis. S e podría pensar que esto no hace necesariamente de C una medida probabilista, que lo importante no es si C crece con la probabilidad anterior de h sino si crece con la probabilidad posterior de h condicionada a los datos e. Según esta réplica, una medida de apoyo evidencial sólo puede ser calificada de inductivista-probabilista si crece con las probabilidades condicionadas p(h1e). Pues bien, es fácil ver que el anterior resultado, en combinación con otro de sus axiomas, el VII, tiene justamente esa consecuencia: en los casos de contrastación positiva (predicción exitosa) C(hle) crece con p(hle), esto es, el grado de corroboración y la probabilidad condicionada son citalirativamente indistinguibles. En efecto, para hl, h~ que impliquen e tenemos: (i) C(hl,e) 2 C(h2, e) syss p(hJ 2 p(h2), por a.~.VIII; (ii) p(hi) = p(hi A e) y p(h2) = p(h2 A e), pues ambas hipótesis implican e; (iii) p(h1le) 2 p(hJe) syss p(hl A e) 2 p(h2 A e), pues p(hle) = p(h A e)lp(e). De estos tres colorarios se sigue inmediatamente C(hl, e) I C(h2, e) syss p(hlle) 1 p(h:le). Por otro lado, su axioma VI1 establece en general (salvo que h sea contradictoria) que C(h, el) 2 C(h,ez) syss p(Wel) 1 p(hle2). En consecuencia, de las condiciones que según Popper cabe conceptualmente exigir a la noción de grado de corroboración o apoyo evidencial, cuando e es implicada (predicha) por Iz se siglie tanto C(h1, e) L C(h2, e) syss p(hile) 2 p(hile)
430
FUND,4hlE?;TOS DE FILOSOFLADE L.4 CIENCIA
como C(lz, e,) 2 C(h, e:) syss p(Wei) 1 p(lzlez). Ello significa que, en los casos de apoyo positivo por predicciones exitosas, el grado de corroboración popperiano y el grado de confirmación camapiano son cualitativamente indistinguibles. Si añadimos su insistencia en que lo que importa no es la asignación numérica específica, y si prescindimos de las condiciones derivadas de los límites -1 y 1 impuestos ad Aoc, entonces hay muy serias razones para considerar que el grado de corroboración de Popper, a pesar de sus declaraciones en sentido opuesto, es una medida de evaluación de carácter probabilista. Su lema "no hay que perseguir hipótesis altamente probables sino altamente corroboradas" es equívoco. De nuevo se fluctúa entre las probabilidades incondicionadas y las condicionadas, y si, como en Carnap, la cuestión es qué pasa con estas últimas, entonces también en Popper cuanto más corroborada está 1%por datos predichos e, más probable es h relativamente a e.
Carga teórica de los lzecltos y lílnires de la falsación. En el capítulo 8 (95) vimos que Popper fue de los primeros en llamar la atención sobre la carga teórica de los heclzos, en la que insistirían después los historicistas. En la contrastación, e contiene los datos empíricos "dados" en la observación-experimentación, es la base empírica o base de contrastación. Popper reconoce abiertamente el carácter teórico, hipotético, de la base de contrastación: "El paso siguiente consistió en aplicar el punto de vista crítico a los enunciados contrastadores, la 'base empírica': subrayé el carácter hipotético de toda observación y de todo enunciado observacional. Esto me llevó a pensar que todo lenguaje estáimpregnado de teoría" (1972, cap. 1, $13). Y también reconoce que eso tiene consecuencias para la contrastación: "Siempre que una teoría se somete a contrastación, ya resulte su corroboración o su falsación, el proceso tiene que detenerse en algún enunciado básico que decidirnos aceptar: si no llegamos a decisión alguna a este respecto [...] la contrastación no lleva a ninguna parte" (1935-1958, cap. V, 929). Pero entonces la lógica de la -falsación pierde gran parte de su fuerza. Si la refutación de lz es relativa al informe observacional e, y la aceptación de e equivale a la aceptación de otra hipótesis h', que como máximo sólo puede estar, como toda hipótesis, provisionalmente no refutada, lo que sucede en realidad en un caso de refutación de una hipótesis h mediante datos e es el conflicto lógico entre dos hipótesis Iz y h'. Esto nos conduce a toda una familia de críticas, provenientes de los filósofos de la ciencia historicistas, sobre el carácter radical o no del falsacionismo de Popper, que examinamos a continuación. 5. Complejidad de las teorías, anomaIías y falsación Cuando en los años sesenta los llamados ?luevosfilósofos de la cie~iciairrumpen en escena, el programa inductivista ya había entrado en decadencia. Aunque alguno de estos nuevos filósofos contribuye con sus críticas a aumentar los problemas del inductivismo (cf. Lakatos, 1968a), por lo general no dirigen su munición contra el inductivismo en crisis sino contra el falsacionismo popperiano que había cobrado nueva fuerza después de su redescubrimiento a finales de los cincuenta. Entre estos críticos, los más activos son
EVI\LUI\CIÓS DE LAS TEOR~ASY EL PROBLEXIA DE LA I N D U C C I ~ N
43 1
Toulmin (1961, 1970). Hanson (1958, 1967, 1971). Feyerabend (1963, 1965, 1 9 7 0 ~ . 1975), Kuhn (1962-1970, 1 9 7 0 ~ .1970b, 1970c) y Lakatos (19686, 1970. 1971. 1973a, 1974b, 1977). La crítica de casi todos ellos consiste en llevar hasta las últimas consecuencias algunos elementos que ya están presentes en la filosofía de Popper, especialmente la carga teórica de los hechos, pero que éste se resiste a asumir. Aquí nos detendremos sólo en Feyerabend, Kuhn y Lakatos, y especialmente en los dos Últimos. L a crítica de Kuhn y Lakatos muestra además la necesidad de distinguir, por lo que a la evaluación empírica se refiere, entre hipótesis y teorías. Aunque ellos mismos no lo hacen explícito, su crítica al falsacionismo popperiano aplicado a las teorías depende esencialmente de la nueva concepción de teoría empírica que estos autores están gestando (cf. cap. 9).
Feyerabend, el más provocador de los nuevos filósofos, comienza arremetiendo contra lo que considera los dos principios o reglas básicas del neoempirismo: (1) hay que desarrollar hipótesis teóricas consistentes con los hechos; y (2) hay que desarrollar hipótesis teóricas consistentes con otras teorías aceptadas. Feyerabend arremete contra ellos por razones tanto históricas como conceptuales. Si atendemos a la historia, y él presenta multitud de esrlidios de cosos que en su opinión avalan su tesis, debemos reconocer como cuestión de hecho que la ciencia pocas veces se atiene a tales principios, y en momentos cruciales nunca. Pero, además, la ciencia no debe comportarse así. La razón tiene que ver directamente con la carga teórica de los hechos: la ciencia no debe seguir (2), pues la ciencia evoluciona eliminando teorías y la evidencia en contra de una teoría sólo puede extraerse a la luz de otra teoría incompatible con ella. Los datos empíricos constituyen evidencia contra una teoría sólo cuando se contemplan a la luz de otra teoría incompatible. Puesto que los enunciados empíricos incluyen supuestos teóricos, los motivos para rechazar (2) constituyen a su vez motivos para rechazar (1). Esta crítica se dirige contra todas las formas de neoempirismo de la filosofía de la ciencia clásica, tanto contra el confirmacionismo de Carnap como contra el falsacionismo de Popper. Las consecuencias ruinosas para el neoempirismo explícito de Carnap y su escuela son inmediatas, pero en opinión de Feyerabend su crítica arruina igualmente el neoempirismo encubierto de Popper: proponer alternativas sólo tras la refutación es poner el carro delante del caballo, pues sólo con alternativas previamente disponibles es posible la "refutación". Feyerabend propone proceder contraindrtctivamente: elaborar hipótesis inconsistentes con los hechos y, por tanto, con teorías ya aceptadas. Más que una propuesta se trata de una supuesta constatación: así es como opera la ciencia en sus mejores momentos. El resultado natural de estas tesis es la defensa de una metodología irrestrictamente pluralista: proponer y sostener hipótesis no importa de qué tipo, incluso si los especialistas-guardianes no las consideran científicas. Éste es el origen de su famoso "todo vale" (hasta las ideas más descabelladas). No pretende defender con ello un nuevo método sino, como le gusta decir, un antimétodo, una (anti)teoría anarquistaldadaísta del conocimiento. No tiene ningún reparo, por supuesto, en admitir el irracionalismo que estas ideas implican. El mito
432
FUI\'DAhlE'\X)S DE FILOSOFL~ DE LA CIENCIA
de la racionalidad de la ciencia frente a la presunta irracionalidad de otros sistemas de creencias representa una amenaza para una sociedad libre, conduce a una sociedad sometida a la tiranía de los expertos. Feyerabend reconoce que la ciencia tiene también una tendencia a la re~lacidad (que tiende a valorar negativamente). pero eso no contradice sus tesis, pues no cree que la tenacidad sea el factor dominante en ningún período histórico. No acepta la parcelación kuhniana en períodos de ciencia normal y ciencia extraordinaria. Las crisis no se producen sólo por problemas internos a una teoría; para que surja una crisis es precisa la interacción entre diversas teorías. Por ejemplo, para el surgimiento de la crisis de la mecánica clásica fueron esenciales resultados de la electrodinámica y la teoría del calor. Según Feyerabend, los elementos dogmáticos y críticos actúan simultáneamente, se da una constante tensión entre las tendencias a la tellacidad y a la prolifel-ación que no se traduce en períodos cualitativamente diferentes.
Las críticas de Kuhn y Lakatos también explotan la carga teórica de los hechos señalada ya por Popper, aunque tienen consecuencias menos radicales que las de Feyerabend, principalmente porque disponen de una nueva noción de teoría que les permite configurar una alternativa metodológica. Las posiciones de Kuhn y Lakatos no son plenamente coincidentes (en general Lakatos es un poco más matizado en sus juicios sobre Popper), pero aquí vamos a obviar sus diferencias y a centramos sólo en un núcleo mínimoque comparten en líneas generales. Kuhn y Lakatos critican el falsacionismo ingenuo que, en su opinión, cabe atribuir a Popper a pesar de sus declaraciones en contra. El falsacionismo ingenuo es doblemente inaceptable. Es inaceptable de heclw, pues la historia nos muestra que no siempre, enrealidad muy raramente, se abandonan las teorías tras contrastaciones desfavorables. Las teorías están permanentemente llenas de arzomalías enlpíricas, experiencias que no enca. jan en la teoría, que son inconsistentes con ella y por tanto instancias refutadoras en el esquema falsacionista. Si fuera por eso, todas las teorías nacen ya refutadas y no dejan de estarlo jamás. Y también es inaceptable de derecho, pues las teorías no deben abandonarse ante cualquier contrastación desfavorable. El motivo es que los datos empíricos no son neutrales, no constituyen un tribunal "teóricamente neutral" sino que encubren hipótesis teóricas muchas veces de alto nivel. Lo que hay, pues, es un conflicto entre hipótesis teóricas: "No se trata de que nosotros propongamos una teoná y la Naturaleza pueda gritar NO; sino que nosotros proponemos una red de teorías y la Naturaleza puede gritar INCONSISTENTES'~ (Lakatos, 1970, p. 130). Las teorías nunca pueden considerarse falsadas concluyentemente, siempre se pueden arreglar las cosas modificando, en lugar de la hipótesis central en.juego, algunos de los supuestos auxiliares involucrados en la aceptación de los datos (es más, como ahora veremos, incluso si los datos se aceptan como aproblemáticos, siempre es posible preservar el núcleo de lo que está en juego y modificar aspectos específicos del cinturón protector).
EV,\LUACI~NDE LAS TEOR~AS Y EL PRORI-E\l;\ DE LA IN[IUCCIÓN
433
Popper se declara sorprendido por esta crítica pues, afirma, estas ideas no sólo no se oponen sino que coinciden plenamente con las suyas propias formuladas treinta años antes. En parte así es. Hemos visto sus tesis sobre la carsa teórica de los hechos contenidas ya en su primera obra, en las que insiste en su revisión para la traducción inglesa: "Las observaciones son siempre interpretaciones [...] a la luz de teorías" (1935-1958, $30, nota 2 añadida a la edición inglesa de 1958). Y también desdc el principio reconoce las limitaciones que ello supone a la idea de una refutación efectiva: "no es posibIe jamás presentar una refutación concluyente de una teoría" (ibid., $9); "siempre es posible encontrar una vía de escape a la falsación" (ibid., $6); "siempre he mantenido que nunca es posible demostrar concluyentemente que una teoría científica empírica es falsa" (1956-1983, $1). Pero coinciden sólo en parte, pues al mismo tiempo Popper hace numerosas afirmaciones que no se compadecen completamente con las anteriores, p.ej. "[las teorías científicas] deben ser eliminadas si entran en conflicto con observaciones" (1963, cap. 1, SIV), "ha de ser posible refutar por la experiencia un sistema científico empírico" (1935-1958, $6).Y lo que es más importante, aunque reconoce la posibilidad lógica de escapatorias a la falsación, anuncia que va "a proponer que se caracterice el tnérodo empírico de tal forma que excluya precisamente aquellas vías de eludir la falsación que mi imaginario crítico señala insistentemente, con toda razón, como lógicamente posibles" (ibid.). Y en plena polémica con Kuhn afirma que "[dlebería subrayarse que la incertidumbre de toda falsación empírica (que yo he señalado repetidas veces) no debe tomarse demasiado en serio (como también he señalado)" (1956-1983, $1). Estas afirmaciones, y muchas otras semejantes, hacen que Kuhn replique que "aunque no es un falsacionista ingenuo, sir Karl puede, sugiero, ser tratado legítimamente como tal" (1970a, p. 13). No es éste el lugar para seguir el detalle de la polimica, en la que cada parte dice no ser comprendida por la otra y a la vez, sorprendentemente, estar defendiendo en el fondo lo mismo (para un estudio detallado de la misma, cf. Díez, 1998). Lo importante es que el desacuerdo no se puede explicar atendiendo sólo a sus afirmaciones, aparentemente coincidentes, sobre la posibilidad o no de falsación. Tras la aparente congruencia en la superficie del problema hay una diferencia de fondo sobre la naturaleza y estructura de las teorías que hace entender a cada uno las mismas afirmaciones de diferente modo. Éste es uno de los puntos en los que, como expusimos en el capítulo 1 (S2), la dimensión interpretativa de la filosofía de la ciencia interacciona con la normativa o evaluativa. Popper tiene dificultades para articular coherentemente sus ideas sobre las normas que rigen la contrastación de las teorías porque maneja un concepto de teoría demasiado pobre. Si Kuhn y Lakatos pueden hacer "las mismas" afirmaciones de modo más coherente, y expresando en parte un contenido nuevo, es porque tras esas afirmaciones está emerpiendo un nuevo concepto de teoría empírica mucho más rico que el axiomático tradicional. La importancia de sus diferencias sobre la naturaleza de las teorías para el problema de la evaluación empírica se pone de manifiesto en una cuestión sobre la que Popper y Kuhn reconocen discrepar abiertamente, a saber, la existencia y el valor de la ciencia normal. Lo que está verdaderamente en juego no es el reconocimiento de la posibilidad lógica de escapatorias a la falsación, que ambos bandos reconocen, sino la valoración de las mismas. Kuhn afirma que las estrategias anti-falsación no sólo son extremadamente
434
F U K D A M E ~ ~DES FILOSOFL~ DE LA CIENCIA
comunes sino necesarias y las valora en general positivamente. Este tipo de estrategias son "normales" en el sentido kuhniano del término, son consustanciales al modo como nor~nalrnentese lleva a cabo la actividad científica, consustanciales a la ciencia normal. En este punto está plenamente de acuerdo con Lakatos y su idea de un cinturón protector al que se dirigen las refutaciones salvaguardando el núcleo de los programas-paradigmas. Para Kuhn y Lakatos, estas prácticas deben valorarse positivamente, pues son consustanciales a la práctica científica; simplemente, sin tales prácticas no sería posible la ciencia, pues no existe ni puede existir algo así como ciencia sólo revolucionaria y... la frase de sir Karl 'revoluciones permanentes', al igual que 'círculo cuadrado', no describe un fenómeno que pueda existir", Kuhn, 1970b, p. 242). Popper acepta que siempre se puede atener uno a tales estrategias, pero las califica casi siempre de ad hoc y las valora negativamente. Que además ese proceder pueda ser usual durante ciertos períodos le parece un serio peligro. Éste es el punto de abierto desacuerdo. Popper reconoce que Kuhn ha descubierto un fenómeno que a él se le pasó por alto, pero disiente radicalmente d e la valoración que Kuhn hace del mismo y llega a calificar al científico "normal" kuhniano de un peligro para la ciencia y hasta para la civilización (cf. 1970). Las reticencias y temores de Popper frente a la ciencia normal de Kuhn, y a ideas parecidas de Lakatos, y sus esfuerzos por admitirla-pero-desaprobarla, se deben a que no se apercibe de que lo que hacen Kuhn y Lakatos es básicamente llamar la atención sobre la complejidad estructural de las teorías y sobre el hecho obvio de que las teorías, entendidas de este modo, duran cierro tiempo. Los paradigmas de Kuhn y 10s programas de investigación de Lakatos son las teorías científicas contempladas emz toda su conzplejidad estructural. Los períodos normales son entonces aquellos en que las teorías "viven y se desarrollan" y los revolucionarios aquellos en que "nacen" y "mueren" (se suplantan). Aunque Kuhn y Lakatos contribuyen muchas veces a oscurecer el panorama, éste es el núcleo del que dependen el resto de sus afirmaciones sobre la evaluación de las teorías. Para la cuestión que ahora nos ocupa, los prjncipaies elementos de la nueva concepción de las teorías de Kuhn y Lakatos son dos (cf. para esto el capítulo 9, $2 y 33). En primer lugar, y aceptado ya por Popper, el carácter teórico de la base de contrastación; los datos experimentales están cargados con hipótesis teóricas implícitas. En segundo lugar, y no reconocido, o al menos no tematizado, anteriormente, la complejidad estructural de las teorías. Las teorías no son entidades monolíticas sino entidades estructuralmente muy complejas organizadas en diferentes niveles de esencialidad, con un núcleo programático formado por principios muy generales cuasi-vacíos que se desarrollan mediante un sistema de hipótesis-leyes progresivamente más específicas. Ante una experiencia refutadora siempre es posible "revisar los hechos", esto es, revisar las hipótesis implícitas que conceptualizan la experiencia. Pero incluso si se aceptan los hechos, la lógica no obliga a abandonar la teoría, siempre es posible retocar una o varias hipótesis específicas preservando el núcleo central. Popper no contempla esta posibilidad, o cuando lo hace la considera ilegítima, porque no la conceptualiza así. En línea con la tradición, concibe las teorías como entidades simples, monolíticas, ante las cuales la única opción es de tipo todo-onada; no distingue entre teorías, hipótesis y leyes. Y con esta concepción es imposible
diferenciar cambios de teorías y cambios en las teorías. Las teorías, según Kuhn y Lakatos, son entidades con diferentes niveles de esencialidad, con unas partes esenciales y otras accidentales. Una vez se ha reparado en esta complejidad estructural, lo que sostienen sobre la irrefutabilidad de las teorías (incluso no cuestionando los hechos) es casi una obviedad. Seguramente Popper no negaría que la Mecánica es, en un sentido del término 'teoría' que es cmcial para entender la ciencia real, una misma teoría de Newton a Laplace (con todos sus cambios). Pero en su metodología ese sentido no juega ningún papel, y es ese sentido el que le hubiera permitido articular coherentemente un falsacionismo no ingenuo, o no radical. Cuando discute con Kuhn y Lakatos sobre la falsación de teorías no está pensando en ese tipo de entidad, mientras que ellos sí. Popper tiene razón al decir que cuando las cosas van mal algo hay que hacer, pero no la tiene al decir que lo que hay que hacer es cambiar de teoría. Para aceptar lo primero sin verse obligado a aceptar lo segundo es preciso disponer de un concepto más rico y dúctil de teoría que permita distinguir entre cambio dentro de una misma teoría y cambio de una teoría por otra. Se dirá que, después de todo, Popper está en lo cierto respecto de su sentido estrecho de teoría: incluso desde la perspectiva de Kuhn y Lakatos, las hipótesis o leyes específicas sí se deben abandonar ante datos refutadores no cuestionados. Así es y así lo aceptan Kuhn y Lakatos. Éste es el grano de verdad del falsacionismo, aunque así presentado, sin cualificaciones ulteriores, es desorientador como análisis de la evaluación de teorías. Si no se añade nada más, se corre el riesgo de considerar cualquier cambio teórico al mismo nivel. Pero hay muy buenas razones para no hacer tal cosa. Consideremos los dos siguientes ejemplos de cambio teórico: a ) la introducción de un nuevo epiciclo en la órbita de Venus dentro de la teoría geocéntrica y b) la sustitución de la Tierra por el Sol como centro de giro en la revolución copemicana. Está claro que se trata de cambios teóricos cualitativamente diferentes. En el análisis de la evaluación de las teorías es esencial reconocer esta diferencia y, junto con ella, que la lógica sola jamás obliga a optar por una opción u otra. La diferencia cualitativa entre ambos tipos de cambio es, por supuesto, la que se da en cualquier entidad persistente entre cambios accidentales y cambios esenciales. En el caso de las teorías científicas, entre cambios intrateóricos- y cambios interteóricos. De ambos tipos de cambio nos ocuparemos en el próximo capítulo. Debe enfatizarse que no se trata de que Popper negara la complejidad estmctural de las teorías de la que depende una apreciación correcta de la lógica de la contrastación, sino que simplemente esta complejidad, puesta de manifiesto por los historicistas, no juega antes de ellos ningún papel, ni en Popper ni en ningún otro filósofo de la ciencia clásico. Seguramente, si se le hubiera planteado la cuestión abiertamente en estos términos, Popper mismo hubiera articulado su falsacionismo del modo "sofisticado" (e.e. no ingenuo) que pretendía.
6. Consideraciones finales En el capítulo 3 presentamos la metodología de la contrastación .de hipótesis aplazando para el presente la discusión de las cuestiones filosóficas sustantivas. Después
del recorrido realizado puede parecer que el panorama no es muy alentador. En parte así es. El viejo problema de la inducción y la evaluación tebrica sigue planteado, en sus aspectos centrales, en toda su crudeza. Pero algo se ha adelantado, cuando menos en el análisis de las prjncipales dificultades. Y a pesar de todas las dificultades, la intuición básica de que las predicciones exitosas suponen alzún tipo de apoyo empírico y que las predicciones fallidas se lo restan, sigue tan fuerte como al principio. El problema sigue siendo precisar esta intuición de modo satisfactorio. En términos generales se pueden extraer las siguientes conclusiones. 1. La aceptación de los datos empíricos mediante los que se realiza la contrastación comporta la aceptación de hipótesis teóricas de las que depende el uso que en la contrastación se hace de esos datos. Por tanto todo proceso de evaluación de unas hipótesis supone la aceptación de otras. Ésta es una nueva manifestación del carácter holista de la actividad científica que discutimos brevemente en el capítulo anterior. 2. Dejando provisionalmente al margen el problema del carácter hipotético de los datos de contrastación, la relación entre los datos (aceptados) y las hipótesis a evaluar presenta, como sabía la tradición, mayores dificultades en los casos de confirmación que en los de refutación. La idea de que la relación de confirmación va asociada a una lógica, en sentido estricto, parece abocada al fracaso. El principal problema es el de la determinación a priori de las probabilidades anteriores de las que dependen las relaciones de inferencia inductiva. No hay de momento un modo no circular o no arbitrario de determinar a priori una de las asignaciones y, con ella, una lógica inductiva. 3. A pesar de lo anterior, vaya o no vaya asociada la relación de apoyo evidencial a una lógica en sentido estricto, sigue siendo plausible que sea una relación de tipo probabilista. La alternativa presuntamente antiprobabilista del grado de corroboración de Popper participa en Última instancia del espíritu probabilista. En el curso de la discusión ha quedado claro que, si hay un modo de precisar la idea de grado de apoyo evidencial, éste debe crecer con las probabilidades posteriores relativas a los datos disponibles. Dado el fracaso de los intentos logicistas, sólo parecen disponibles alternativas en las que las probabilidades anteriores sean subjetivas (individuales o comunitarias); el problema entonces es articular esta alternativa sin caer en el relativismo. Una vez se tienen las probabilidades básicas, las relaciones entre ellas son objetivas (las de la teoría de la probabilidad, las de la teoría de la decisión, etc.); la cuestión todavía no resuelta es cómo analizar el apoyo evidencial para que el resultado sea invariante respecto de las diferentes posibilidades para las probabilidades básicas. 4. Sea cual sea el modo de precisar una medida de apoyo evidencial, la fuerza del apoyo no puede depender sólo del número de casos sino también de su variedad y calidad. Si lo que se evalúa es una teoría entera, el análisis de su estructura en términos reticulares, al modo de Kuhn-Lakatos o del estructuralismo, ayuda a clarificar estas dependencias. Por ejemplo, despuis de una serie limitada de predicciones exjtosas en una parte de la red, unas pocas predicciones exitosas en otra parte de la red puede conferir incomparablemente más apoyo que un número ilimitado de nuevas predicciones exitosas en la parte anterior. Lo mismo se aplica a cualquier hipótesis que tenga algún tipo de ramificación.
5. El mayor problema filosófico que comporta la confirmación es el de la infradeterminación de la teoría por la experiencia, el viejo enigma renovado por Goodman. Ante sistemas teóricos incompatibles igualmente avalados por la experiencia, ei único modo de optar por uno frente a otro es el de recurrir a sus relaciones con otros sistemas teóricos. Pero siempre hay varias integraciones teóricas posibles. Esto conduce nuevamente a cierto holismo cuyo "tamaño" hay que calibrar. 6. Además, la elección entre alternativas compatibles con los datos pero incompatibles entre sí parece que no puede ser una cuestión de lógica en sentido estricto. Es probable que se deba abandonar la idea de que hay relaciones lógicas objetivas entre datos y teorías a las que después hemos de ajustar nuestras decisiones. Quizá no haya modo de plantear la cuestión del soporte entre hipótesis y datos sin tomar en consideración desde el comienzo las decisiones de los sujetos. Ésta es la vía que exploran algunas concepciones sobre la elección de hipótesis en el marco de las teorías matemáticas de la acción racional, principalmente la teoría de la decisión y la teoría de juegos (para referencias clásicas sobre estas teorías, cf. von Neumann y Morgenstern, 1944; Luce y Raiffa, 1957 y Resnik, 1987). Según estos enfoques, las únicas propiedades objetivas que se pueden atribuir a una hipótesis en virtud de ciertos datos son las derivadas de su función en las estrategias de elección racional (para una discusión, y propuesta propia, cf. p.ej. Giere, 1988, cap. 6). Esta alternativa, sin embargo, en la medida en que, como es usual en las teorías de la elección racional, se recurre a probabilidades subjetivas, debe enfrentarse también al reto de explicar la elección teórica sin caer en el relativismo. 7. En los casos de contrastación negativa, la racionalidad teórica obliga a modificar algo, no podemos ser racionales e ignorar teóricamente las contradicciones. Eso es compatible con que la racionalidad práctica haga recomendable a veces (o siempre hasta cierto grado) comportarse como si no existieran contradicciones con la experiencia . Pero desde el punto de vista teórico, y por tanto como idea regulativa de la actividad científica, el conflicto con la experiencia exige revisión. Cuando teoría y experiencia se contradicen (y dejando a un lado las urgencias prácticas) algo hay que hacer. Pero siempre hay varias alternativas. Una es revisar los datos. esto es la5 hipótesis implícitas presupuestas por ellos. Otra es revisar el sistema teórico. Si dicho sistema es una única hipótesis "atómica", hay que rechazarla. Pero las cosas nunca son tan simples. Casi siempre lo que está en juego es un sistema complejo de hipótesis con relaciones de dependencia a diferentes niveles, una red teórica más o menos grande. En estos casos, incluso si aceptamos los datos, tenemos dos alternativas. Una, retocar la red. Otra, cambiar radicalmente e intentar desarrollar una teoría diferente. Pero como dice Kuhn, nada hay en la lógica que obligue a una opción frente a otra. La decisión no es cuestión de lógica sino de pragmática, de pérdida de confianza.
ANÁLISIS DIACRÓNICO DE TEORÍAS: EL CAMBIO TEÓRICO
1. La perspectiva diacrónica en filosofía de la ciencia La ciencia en la actualidad consiste en un vasto y complicado sistema de teorías, junto con un gran número de métodos específicos, aplicaciones y prácticas asociadas a ellas. Hoy día es una obviedad constatar que este enorme sistema representa un componente esencial de la cultura humana actual. Sin embargo, ello no siempre fue así. Si aceptamos que la ciencia es una manifestación cultural autónoma, claramente distinta de otras manifestaciones también de "alto nivel" como la religión, el arte, el derecho o la tkcnica, entonces también hay que admitir que estas otras manifestaciones culturales germinaron y se desarrollaron en diversos puntos del globo muchos siglos, incluso milenios, antes del surgimiento de las primeras formas de lo que hoy día reconocemos como conocimiento científico. Puede discutirse si el espíritu científico propiamente tal surgió en Grecia por primera vez apenas en el siglo vi a.c. con los filósofos jonios y la Escuela de Pitágoras, o bien hay ya expresiones indiscutiblemente científicas de aproximación a la realidad en una época bastante anterior (pongamos por caso en el Antiguo Egipto, en las civilizaciones mesopotárnicas, en la Lndia o en China); pero, en cualquier caso. incluso si tomamos este último punto de vista, más liberal o laxo, respecto a lo que pueden ser producciones culturales de carácter específicamente científico, incluso en los casos más antiguos ellas son decididamente muy posteriores a las primeras manifestaciones de los demás fenómenos culturales mencionados. Así, pues, la ciencia representa un fenómeno relativamente reciente en la historia de la Humanidad; pero precisamente por ello, al estudiar sistemáticamente la ciencia y sus componentes, conviene no olvidar su dimensión histórica. Es decir, debemos tener siempre presente (aun cuando para examinar ciertas cuestiones epistemológicas concretas lo tengamos en cuenta sólo de manera implícita) que las teorías científicas y todo lo que va asociado a ellas constituyen entidades que existen en el tiempo histórico; no son entidades connaturales al ser humano y mucho menos entidades que lo trasciendan, sino que tuvieron un nacimiento en determinado momento histórico, se desarrollaron y cambiaron de cierta manera y eventualmente desaparecieron en otra fase histórica, al igual que lenguas, naciones, códigos jurídicos o religiones.
Ahora bien, podría alegarse que. aun cuando el carácter histórico del fenómeno "ciencia" es obvio, ello no tiene por qué incidir en un estudio filosófico sistemático (metacientífico) de las teorías científicas y sus componentes. Podría alegarse que el t o m a en cuenta la dimensión histórica de la ciencia es tarea de otra disciplina, la Historia de la Ciencia (o Historiografía de la Ciencia, como preferimos denominarla para evitar una confusión entre la disciplina misma y su objeto de estudio), y no asunto de la Filosofía de la Ciencia en cuanto tal. Esta última procedería de manera puramente sincrónica, es decir, tratando de detectar las estructuras esenciales al conocimiento científico que son universales y comunes a las diversas fases históricas de su desarrollo. La Historiografía de la Cjencja sería así la disciplina que se ocupa de lo particular-histórico en la ciencia, mientras que la Filosofía de la Ciencia o Metaciencia se ocuparía de lo universal-sistemático en la misma, con exclusión de la dimensión diacrónica. El punto de vista puranlente sincrónico en Filosofía de la Ciencia fue el predominante en nuestra disciplina hasta mediados de la década de los sesenta. Es también la perspectiva metodológica que ha predominado en este libro hasta el presente capítulo. Esta decisión metodológica no es arbitraria. En efecto, puede señalarse que, aun cuando nuestro objeto de estudio sea de carácter inherentemente histórico, es conveniente y fructífero analizarlo ante todo desde una perspectiva teórica que sea puramente sincrónica. Así como podemos emprender un valioso estudio teórico de la gramática del castellano, pongamos por caso, haciendo abstracción de cómo y por qué esta lengua evolucionó a partir del latín vulgar en la Alta Edad Media, o examinar la estructura argumentativa formal del Código Civil sin preocupamos demasiado por sus antecedentes en el Derecho Romano, así también parece no sólo posible sino conveniente examinar la estructura y modos de funcionamiento de los diversos componentes de la ciencia sin ocupamos especialmente de los avatares y circunstancias de su desarrollo histórico. Ahora bien, aunque esta forma de proceder tiene su razón de ser metodológica y es la que hemos adoptado en este libro hasta esre punto, sería un error equiparar la distinción disciplinar entre Filosofía de la Ciencia e Historiografía de la Ciencia con la distinción metodológica entre perspectiva sincrónica y perspectiva diacrónica en el estudio metacientífico. Ésta es la lección que puede sacarse de las grandes controversias (meta-)filosóficas que tuvieron lugar a partir de la llamada reruelra hisroricisra en la década de los sesenta, algunos de cuyos elementos ya hemos examinado en el capítulo 9. A veces se ha interpretado el enfoque "historicista" como la propuesta de identificar Filosofía e Historiografía de la Ciencia, o de reducir la primera a la segunda, y es cierto que algunos de los propagandistas más radicales de dicho enfoque, parecieron abogar en ese sentido. Sin embargo, significaría un tremendo empobrecimiento conceptual identificar ambas disciplinas (como también lo sería identificar la gramática teórica con la filología, la Filosofía del Derecho con la Historia del Derecho, o la Musicología con la Historia de la Música, etc.). Aunque existen sin duda vínculos importantes entre Filosofía e Historiografía de la Ciencia, ambas disciplinas son, tanto por su temática como por su metodología, netamente distintas (cf. cap. 1, 6 1 ; para una discusión más detallada, cf. Moulines, 1991, cap. 1.4). El modo más constructivo de interpretar la 1-evuelra Izisroricista es como la pro-
puesta, no de reducir la Filosofía de Ia Ciencia a Ia Historiografía de la Ciencia, sino de enfatizar la necesidad de una perspectiva diacrónica también en Filosofía de la Ciencia, que complemente el análisis sincrónico, pero que sea igual de teórica, sistemática y general que aquél. En cualquier caso, éste es el punto de vista adoptado en este libro: aunque el análisis metateórico diacrónico ha resultado hasta la fecha más difícil de realizar de la manera precisa y sistemática característica del análisis sincrónico, no por ello debemos desesperar de la empresa, y de hecho se han elaborado ya diversos modelos de cambio científico que son lo bastante sistemáticos y articulados como para constituir la base de una futura Filosofía diacrónica de la Ciencia. Los dos fenómenos históricos más básicos de los que debe dar cuenta cualquier modelo de la Filosofía diacrónica de la Ciencia son, descritos brevemente, el de la identidad a través del cambio y el de la continuidad a través de la ruptura. Más concretamente, por el primero entendemos el hecho de que parece tener sentido (al menos ello corresponde a la autocomprensión de los practicantes de la ciencia) adjudicar a cada teoría científica (y a los demás elementos asociados a ella) una identidad a pesar de las modificaciones a que están sometidas en el transcurso del tiempo histórico: las teorías, de manera análoga, aunque no idéntica, a las personas, las lenguas o las naciones, pueden cambiar en una serie de constituyentes y, no obstante, seguir siendo las mismas. Esto es, las teorías científicas poseen la propiedad que se conoce como genidentidad (identidad diacrónica). La primera tarea de la Filosofía diacrónica de la Ciencia consiste, pues, en elucidar la genidentidad de las teorías científicas, en ofrecer un análisis diacrónico de la naturaleza y estructura de las teorías en tanto entidades que se extienden en el tiempo. Los conceptos de parndig~nao matriz disciplinar en Kuhn, de programa de ini~estigaciónen Lakatos, de tradición de investigación en Laudan o de evolrición teórica en el estructuralismo son respuestas con diverso grado de precisión a este reto (para los aspectos sincrónicos de los tres primeros, cf. cap. 9; el último, que veremos en el presente capítulo, se construye sobre el concepto sincrónico de red teórica, estudiado en el cap. 10, $5). El otro gran problema para la Filosofía diacrónica de la Ciencia consiste en dar cuenta de cambios radicalmente más dramáticos que los recién mencionados, cambios que, desde la obra pionera de Kuhn, suelen llamarse "revoluciones científicas". A pesar de su popularidad, esta denominación probablemente no es muy apropiada, no tanto por parecer exagerada dadas las asociaciones que despierta con su parangón, las revoluciones políticas, sino porque aparece como esenciaImente equívoca o ambigua, como explicaremos en seguida. En cualquier caso, llamemos como llamemos a estos fenómenos más dramáticos en la historia de una disciplina científica, parece incuestionable que ellos se dan y que se caracterizan en general porque a través de ellos se pierde precisamente la genidentidad de una teoría. La teoría en cuestión, después de tal tipo de cambios, "ya no es lo que era": es "subsumida", "reducida", "absorbida", "reemplazada" o, en fin, "desplazada" por otra u otras teorías. En adelante, y para usar una terminología lo menos cargada de connotaciones posible, al primer tipo de cambio científico lo denominaremos 'cambio itttrateórico' porque tiene lugar dentro de una misma teoría; mientras que al segundo tipo de cambio lo llamaremos 'cambio interteórico' porque consiste en un cambio de teoría, involucra teo-
fias distintas. Vamos a examinar a continuación estos dos tipos de cambio teórico. El de cada uno procederá en dos pasos: en primer lugar daremos una caracterizacidn 10 m i s intuitiva y neutral posible del fenómeno en cuestión, y a continuación proporcionaremos una elucidación más formal y "comprometida", que toma en cuenta las ideas de Kuhn y Lakatos pero que se basa esencialmente en la metodología de reconstrucción estnicturalista. Los ejemplos históricos aducidos en cada caso, en cuyo detalle naturalmente no podemos entrar aquí, tienen como misión solamente ayudar al lector a comprender la elucidación general y comprobar su plausibilidad. Por último, nuestro análisis diacrónico se va a limitar en general a los aspectos cinemáticos del cambio teórico. Los fenómenos diacrónicos son susceptibles de dos niveles de análisis, uno ci~zemáticoy otro dinámico. El análisis cinemático se centra en la descripción de las entidades in~rolucradasy de las formas o tipos de cambio d e las mismas. El análisis dinámico se ocupa de las causas o factores desencadenantes de los (diversos tipos de) cambios; debe quedar claro que, al igual que en física, el estudio dinámico presupone otro cinemático previo. El estudio de la cinemática del cambio teórico es una tarea básicamente analítica y corresponde por tanto básicamente a la Filosofía de la Ciencia, aunque para realizarla debe apoyarse en otras disciplinas metacientíficas, principalmente la Historiografía de la Ciencia, pero también en la Sociología de la Ciencia. El estudio de la dinámica del cambio científico es una tarea a la vez analítica y empírica. Es analítica, no sólo porque la dinámica presupone la cinemática, sino porque además deben elucidarse algunos aspectos conceptuales propiamente dinámicos, como los relativos a las actitudes intencionales, intereses, mecanismos de interacción, etc.; esta parte de la tarea corresponde realizarla a la Filosofía de la Ciencia. Pero es también una tarea (meta)empírica, pues se requiere investigación empírica sobre los factores psico-sociales que de hecho operan como agentes causales en el cambio teórico; esta parte de la tarea corresponde realizarla a disciplinas metacientíficas empíricas, principalmente la Sociología de la Ciencia y la Psicología de la Ciencia. En ambas partes del estudio dinámico, como en el cinernático, es esencial además el concurso de la Historiografía de la Ciencia. Pues bien, como hemos anunciado, aquí nos vamos a limitar a los aspectos conceptuales del cambio teórico, y ni siquiera a todos ellos sino principalmente a los cinemáticos. Esto es, vamos a centramos en la tipología de los diferentes cambios teóricos y en la n~orfología estructural de cada uno. 2. Cambio intrateórico 2.1.
CARAOERIZAC~~N GENERAL
Éste es el tipo de desarrollo científico más reconocido y estudiado dentro de la filosofía diacrónica de la ciencia, y para el que se han elaborado modelos (metateóricos) de un nivel razonable de precisión conceptual. Kuhn ha llamado a este tipo de proceso ciencia 1zo17íra1,ternlinología que se ha popularizado desde entonces. Dentro del enfoque de Kuhn, este tipo de actividad científica tiene lugar bajo la égida de un pul-adignza, una
matriz disciplinar algunos de cuyos constituyentes son paradigmáticos y esenciales. Para
Lakatos, el cambio consiste en el desarrollo de un programa de investigación regido por un niícleo que se desarrolla mediante un cinturón protector de hipótesis auxiliares. Laudan, a su vez, caracteriza estos procesos históricos como una tradición de investigación o de resolución de problemas, en que se aplican ciertos principios básicos. Dentro de la concepción estructuralista, la estructura de la ciencia normal aparece, como veremos a continuación, descrita en términos de una serie de redes teóricas que cumple ciertas condiciones, serie que constituye una evolución teórica. Todos estos modelos de cambio científico están basados en las nociones correspondientes del análisis sincrónico de cada enfoque particular. Ya hemos explicado en detalle dichas nociones sincrónicas subyacentes (cf. cap. 9 y cap. 10, S5), por lo que no es necesario volver a ellas. Baste hacer notar que la intuición básica común a todos estos enfoques es que, en el tipo de' desarrollo que aquí llamamos cambio intrateórico, existe una entidad estnictural persistente a través del tiempo, un marco teórico que permanece invariable a pesar de los cambios y que es justamente el elemento sobre el que descansa la identidad de la teoría involucrada en el proceso, aquello que permite hablar de "la teoría" en cuestión, teoría que sigue siendo la misma aunque se produzcan inodificaciones más o menos significativas en ella, tanto a nivel puramente teórico como empírico. Este elemento permanente en el cambio intrateórico es lo que Kuhn llamó primero 'paradigma' y, más tarde, 'matriz disciplinar',' lo que Lakatos denomina 'núcleo duro del programa' y en el estructuralismo aparece como "elemento teórico básico" (de una red determinada). Tanto para Kuhn como para el estructuralismo, este elemento identificatorio de cada teoría a través de los cambios es, a su vez, una entidad de articulación bastante compleja, como ya se ha señalado en los capítuloscorrespondientes. La intuición básica que acompaña a todas estas caracterizaciones es la misma: una teoría en sentido diacrónico, como entidad que se extiende en el tiempo, es una sucesión de .teorías en sentido sincrónico que comparten un elemento común; la imagen de una teoría en sentido diacrónico es la de una película cuyos fotogramas son los diferentes estadios o versiones por las que la teoría va pasando (cada una de las cuales se considera aproximadamente estable durante el lapso que dura). Para ello es esencial que, sincrónicamente consideradas, las teorías sean entidades dúctiles, con una parte esencial en la que descanse su identidad y otras partes más específicas o complementarias que se puedan "perder" sin alterar la esencia. Si aceptamos la descripción sociohistórica que hace Kuhn de los períodos de ciencia normal en una disciplina dada, cuando todos los cambios que se producen ocurren dentro de la matriz disciplinar aceptada y son por tanto intrateóricos en nuestro sentido, entonces estos períodos se caracterizan sociolópicamente hablando por ser relativamente homogéneos y "pacíficos": la disciplina viene representada por una sola comunidad cientíjica, dentro de la cual hay consenso acerca de los principios y aplicaciones fundamentales, y las controversias entre los científicos se refieren solamente a la oportunidad o adecua1. O la parte pxadigmática de ella, según se considere que la matriz en un momento dado es todo el conjunto de supuestos compartidos o sólo los esenciales (cf. cap. 8, 92).
ción de ciertas hipótesis secundarias y aplicaciones concretas. Según Kuhn, el consenso
básico se rompe únicamente durante el proceso que él denomina revolució?l cientfica, cuando una teoría fundamental o matriz disciplinar es reemplazada enteramente por otra. Durante la ciencia normal, la comunidad cambia las leyes especiales y las aplicaciones concretas, pero no los principios fundamentales ni las aplicaciones paradigmáticas. Abundan los ejemplos históricos claros de cambio intrateórico, en el sentido aquí especificado, sobre todo en las disciplinas físico-químicas. Un ejemplo notorio de tal tipo de desarrollo es el de la astronomía ptolemaica, es decir, la teoría geocéntrica de epiciclos para explicar el movimiento de los planetas, teoría cuyo desarrollo tiene sus inicios no en Ptolomeo, sino en Apolonio e Hiparco unos siglos antes. Esta teoría estuvo vigente hasta fines del siglo x v ~y, por tanto cubrió un lapso de casi 2.000 años. Sin embargo, y contra lo que sugieren algunas descripciones superficiales, no hay que creer que se tratara de un período de "estancamiento" de la astronomía. Al contrario, durante su larga vida la teoría sufrió diversos e importantes refinamientos y modificaciones, y estuvo asociada a deterrninaciones conceptuales y empíricas cada vez más precisas y diferenciadas, todo ello, claro está, regido por el principio "intocable" geocéntrico-epicíclico. Otro ejemplo claro de tal desarrollo intrateórico es el de la mecánica clásica de partículas, iniciada por Newton en los años ochenta del siglo xvr~y que tuvo un desarrollo relativamente largo y en cualquier caso muy fructífero hasta fines del siglo x u , durante más de dos siglos. También aquí se dieron durante este período una serie de cambios importantes en la teoría, con la postulación de nuevas leyes y la adquisición de nuevos casos de aplicación empírica o el abandono de casos propuestos anteriormente. Y, sin embargo, la teoría siguió siendo la misma, puesto que en ningún momento se cuestionaron las leyes fundamentales de Newton y sus aplicaciones paradigmáticas (sistema planetario, caída de graves, proyectiles, etc.). Podemos añadir algunos ejemplos más dentro de la física, muy plausibles, de cambio intrateórico en un período que Kuhn llamaría de ciencia normal: el desarrollo de la el de la teoría del calórico entre la Revolución teoría del flogisto a lo largo del siglo XVIII; Francesa y 1830; el de la termodinámica gibbsiana del equilibrio desde 1870 hasta la Segunda Guerra Mundial; el de la teoría general de la relatividad desde la Primera Guerra Mundial; y sin duda muchos otros. Dentro de las ciencias naturales, pero fuera de las ciencias físico-químicas, posiblemente no sea tan fácil encontrar muchos ejemplos de "cambio bajo permanencia", pero sin duda es plausible caracterizar así en biología el desarrollo de la teoría danviniana de la selección natural desde mediados del siglo xrx y el de la genética llamada "mendeliana" (es decir, en realidad, "morganiana"), desde la Primera Guerra Mundial hasta los años cincuenta. En geología, el desarrollo de la teoría de las placas tectónicas desde los años sesenta parece mostrar también esta estructura. En el caso de las ciencias sociales se ha argüido con frecuencia, en base a la noción kuhniana de paradigma, que no puede hablarse de períodos de ciencia normal en el sentido de Kuhn, puesto que tales períodos se caracterizan por estar dominados por un solo paradigma, y las ciencias sociales en cambio se hallan en una situación pr-e-yaradigmática, con múltiples enfoques radicalmente en competencia. Ahora bien, puede que esta conclusión sea correcta si se toman las ideas de Kuhn al pie de la letra y se
hace especial hincapié en los aspectos sociológicos o institucionales de las mismas; en efecto, la situación sociológica actual de disciplinas tales como la psicología, la economía o las ciencias de la cultura se caracteriza por la existencia de diversas comunidades científicas en agria competencia dentro de la misma disciplina, que no aceptan los postulados más básicos de las comunidades rivales. No obstante, si prescindimos de la caracterización sociológica de la ciencia normal y nos atenemos sólo a su aspecto metodológico-estructural, como desarrollo en que los cambios son meramente internos a cada teoría, entonces la diferencia entre las ciencias "paradigmáticas" y las "pre-paradigmáticas" se desvanece, o cuando menos se diluye considerablemente. En efecto, aun cuando. en una disciplina dada existan diversas subcomunidades rivales que "no se entienden entre sí", cada una de ellas puede operar con su propia teoría fundamental del mismo modo como lo haría una comunidad científica "total" en una etapa de ciencia normal en el sentido kuhniano, es decir, variando las componentes especiales de la teoría pero dejando incólume el núcleo fundamental. Tenemos, por así decir, varias teorías "simultáneas". Así, por ejemplo, es plausible describir el desarrollo histórico tanto del psicoanálisis como del conductismo en psicología desde principios del siglo XX hasta fechas recientes como "cambios intrateóricos" en nuestro sentido, aun cuando no haya habido el menor acuerdo entre psicoanalis'tas y conductistas acerca de los principios fundamentales de la psicología. En ambos casos se fueron introduciendo, modificando y desechando hipótesis particulares y explicaciones de fenómenos psicológicos concretos sin afectar los supuestos básicos de partida, aunque claro que estos últimos son completamente dispares en el psicoanálisis y el conductismo.
Veamos ahora cómo podemos precisar el aspecto estructural esencial de lo que hemos denominado cambio intrateórico. Para ello utilizaremos el aparato modeloteórico de la concepción estructural. En el capítulo 10 ( $ 5 ) presentamos la noción de red teórica y dijimos que ella expresa de modo plenamente satisfactorio toda la riqueza estructural de las teorías sincrónicamente consideradas, pero que para abordar los fenómenos diacrónicos el análisis debe dar un paso más. Este nuevo y definitivo análisis lo constituye la noción de evolución teórica. Ya hemos sugerido más arriba que un período de cambio intrateórico en una disciplina puede reconstruirse como una sucesión (en el tiempo histórico) de redes teóricas conectadas entre sí por ciertas condiciones, que explicitaremos en seguida. Recordemos que una red teórica es un conjunto de elementos teóricos conectados entre sí por la relación de especialización. En las redes arbóreas hay un elemento teórico básico del cual todos los demás elementos teóricos de la red son especializaciones. Es decir, si N = c{T,},o>es una red teórica arbórea con n elementos y Tosu elemento básico, entonces ocurre que para todo E { K } (T To. Recordemos, además, que cada elemento teórico T consta de un núcleo K (K = Mp, Mpp, M, GC>) y de un dominio de aplicaciones I, T = <K, I>. El núcleo básico Ko de To viene determinado por las leyes y ligaduras
'
fundamentales de la teoría, mientras que 10representa el dominio total de aplicaciones intencionales de la teoría. Podemos entonces reconstmir lo esencial de la idea intuitiva de un cambio jntrateórico de la siguiente manera: un desarrollo científico de tipo cambio irzrrareórico es un proceso evolurivo gradual que podemos representar formalmente como una sucesión finita O,, N2, ..., N,,> de redes teóricas (donde cada subíndice representa un determinado período histórico en Ia evoIución de la teoría) que satisface ciertas condiciones de continuidad parcial tanto a nivel teórico como aplicativo. Estas condiciones quedan recogidas en la siguiente definición de evolución teórica, reconstrucción formal del fenómeno de cambio intrateórico. (En lo que sigue, los supraíndices indican la red a la que los elementos pertenecen, y los subíndices fijan el elemento teórico concreto de que se trate. Así, 'E' denota el tercer elemento teórico de la segunda red de la sucesión, aunque recuérdese que los elementos de las redes no están ordenados en secuencias; y análogamente para núcleos y dominios de aplicaciones: ' K f ' y 'G'denotan, respectivamente, el núcleo y el dominio de aplicaciones de dicho elemento.)
Sean N,, N*, ..., N,, n redes teóricas (arbóreas). Diremos que E = <Ni,N2, ..., N,,> es una evolución teórica syss: ( 1 ) Hay un núcleo Kotal que para todo Kó (1 I iI 12): Kó = Ko. (2) Hay un conjunto Ip tal que 0 # Ip c 1; n ... nlo".
Koes el rzúcleo básico de la evolución, y I, el clo~ni~zio de aplicaciones perinane~zres. Así, pues, en una evolución teórica, la identidad de la teoría a través del cambio la determinan las leyes fundamentales, junto con (eventualmente) las condiciones de ligadura básicas entre los modelos, y además ciertas aplicaciones reconocidas siempre como tales a lo largo de la historia de la teoría y que podemos interpretar precisamente como los "ejemplares paradigmáticos" de los que habla Kuhn. Nótese que no hace falta añadir una condición intuitivamente obvia, a saber, que el aparato conceptual no varíe, esto es, que todos los elementos de todas las redes de la evolución tengan los mismos conjuntos Mp y Mpp. Eso se deriva de la condición (1) y de que en cada red la relación de especialización preserva tales conjuntos. Lo que no queda invariable en el cambio intrateórico son las redes de la sucesión <Ni,Nz, ..., N"> en su conjunto: tanto las leyes y ligaduras especiales como las aplicaciones no-paradigmáticas pueden cambiar mucho a lo largo de la evolución. Sin embargo, todas las leyes serán siempre especializaciones de un núcleo común a todas las redes, Ko,y todas las redes compartirán al menos las aplicaciones paradigmáticas. Podríamos reforzar la idea de continuidad en el cambio intrateórico con algunas condiciones adicionales, como por ejemplo que dos redes inmediatamente sucesivas compartan no sólo las aplicaciones paradigmáticas, sino incluso algunas de las no-paradigmáticas; pero no está claro que esta u otras condiciones adicionales plausibles siempre hayan de cumplirse. En cualquier caso, aquí hemos escogido la formulación más general (y débil) del cambio intrateó-
rico, con la cual son compatibles requerimientos de continuidad más fuertes que parezcan convenientes en un análisis más pormenorizado. Para fijar las intuiciones sobre la idea que está detrás de la noción formal de evoluci.ón teórica y de la reconstrucción propuesta de los cambios intrateóricos vamos a representar tales evoluciones mediante sucesiones de grafos en los que cada grafo representa una red teórica. Vamos a considerar como ilustración la evolución de una teoría que atraviesa por tres fases, es decir, tres períodos históricos sucesivos de una teoría en los que ocurren cambios importantes tanto a nivel teórico como respecto a las aplicaciones empíricas, pero que sigue siendo la misma teoría. Por lo tanto, la evolución consistirá en tres redes: E = dVI, N:, N+. Supongamos que, en una primera fase, la teoría (o sea, N,) consta del núcleo básico KOy tres especializaciones del mismo. Cada una de estas especializaciones tiene su propio dominio de aplicaciones; dos de estos dominios, por ejemplo, pueden traslaparse, o sea, hay aplicaciones comunes a núcleos diversos; otro dominio, en cambio, puede que aparezca "aparte". En cualquier caso, el dominio total de aplicaciones intencionales abarcará esos dominios parciales más quizá alguna otra aplicación "suelta" (necesariamente no paradigmática) para la que no se ha contemplado o no se ha encontrado todavía una ley especial. En la segunda fase de la evolución de la teoría (Nz) aparecen, digamos, tres especializaciones más y algunas aplicaciones más. En la tercera fase (N,) se rechaza, por las razones que sean, una de las anteriores especializaciones junto con una de las aplicaciones que le correspondían; en contrapartida, ese elemento teórico es sustituido por otros dos distintos que se encargan de algunas de las aplicaciones intentadas antes por el núcleo que ha sido eliminado. Esta situación se recoge en los siguientes gráficos. Los núcleos teóricos van enmarcados en cuadrángulos, las aplicaciones se representan mediante pequeños puntos, blancos para las paradigmáticas, negros para las restantes; sus conjuntos se representan mediante elipses que las contienen. Las flechas continuas representan la relación de especialización entre núcleos; Ias flechas discontinuas representan al aplicación de un núcleo a un dominio de aplicaciones. Dentro de cada red, y para facilitar la visualización, prescindimos de los supraínciices pues queda claro a qué red pertenecen los núcleos y los dominios de aplicaciones. Además, no incluiremos la correspondiente flecha entre cada núcleo y su dominio de aplicaciones para todos los núcleos. Salvo en el caso del núcleo básico, prescindiremos de ella cuando el núcleo tenga especializaciones y consideraremos por tanto que el dominio de aplicaciones de un núcleo con especializaciones es la unión de dominios de sus especializaciones. Esto es una idealización, pues puede ocurrir, como con el núcleo básico, que en un núcleo intermedio se proponga alguna aplicación que todavía no se sabe muy bien cómo encajar en una ley especial (v. gráf. págs. siguientes). Estos tres fotogramas constituyen la película de esta supuesta teoría. De acuerdo con las estipulaciones históricas que acordamos para el ejemplo, debe quedar claro que se dan las siguientes relaciones entre los núcleos teóricos de las diferentes redes: Kt = K? = G; K! = G = K$; Kj = = M ;K;- = E ; G = Kj; $ # k2;KS # G . Es fácil ver que esta secuencia ejemplifica adecuadamente las condiciones que definen una evoluci6n teórica: Kopermanece invariable y las cuatro aplicaciones paradigmáticas se preservan en toda la evolución, aunque cambien los núcleos específicos que se aplican a ellas. Este ejemplo,
RlNDAMEhTOS DE F I L O S O F ~DE LA CIENCU RED N,
RED
4
,\N,~LISISUIACRÓNICO DE TEORÍAS RED N,
contiene pues todo lo esencial de un cambio intrateórico. Todo cambio intrateórico de la ciencia real sigue este patrón de nuestra teoría imaginaria; es importante enfatizar que los casos reales son conceptualmente idénticos a éste, sólo se diferencian de él por su mayor complejidad, tanto en el número de redes de la secuencia como en el número de elementos en cada red (para una aplicación de este esquema a casos históricos concretos de teorías reales en evolución, cf. Balzer, Moulines y Sneed, 1987, cap. 5, donde se exponen en detalle la evolución de la mecánica newtoniana de Newton a Laplace y de la termodinámica desde Gibbs hasta la Segunda Guerra Mundial).
3. Cambio interteórico en general
La estructura de los cambios interteóricos, en los que se produce algún tipo de "innovación dramática" o revolución, es más difícil de capturar formalmente que la de los cambios intrateóricos: Ello es debido en parte a razones historiográficas, porque el rnaterial histórico correspondiente y su interpretación es asunto más sujeto a controversias. Pero en parte también es debido a razones epistemológicas y metateóricas, porque el estudio sistemático de estos casos presupone una (meta)teoría general de los cambios sernánticos en los conceptos científicos y de las complejas relaciones interteóricas típicas de estos casos consideradas en perspectiva diacrónica, y hay que admitir que ésta es una
temática de la filosofía de la ciencia que apenas ha empezado a abordarse de manera sistemática en los últimos años. Por lo demás, también parece claro que la expresión 'cambio interteórico' engloba tipos bastante distintos de fenómenos diacrónicos. La idea intuitiva de Kuhn según la cual en una re~~olución científica se sustituye o elimina completamente un paradiama por otro parece aplicarse sólo a un número limitado de casos de cambio interteórico, probablemente sólo a una pequeña minoría. Es bastante ardua la tarea historiográfica de probar la existencia de tales revoluciones científicas, al menos en el caso de las ciencias avanzadas, si se interpretan dichas revoluciones en el sentido kuhniano literal de que una teoría desaparece por completo en aras de otra nueva, en un plazo relativamente breve y sin que la primera resulte inteligible ("conmensurable") desde el punto de vista de la segunda. De hecho, no es fácil encontrar ejemplos claros de sustitución total de un paradigma por otro en las ciencias físico-químicas. Sólo la sustitución de la dinámica aristotélica por la newtoniana y de la teoría del flogisto por la teoría de la oxidación de Lavoisier parecen adecuarse bastante bien a la idea de rupturas radicales, acompañadas de inconmensurabilidad semántica, propug~iadapor Kuhn. Con cierta dosis de buena voluntad quizá también podrían subsumirse bajo este esquema algunos otros ejemplos importantes que aparecen con frecuencia en la literatura historiográfica: la transición de la astronomía ptolemaica a la copemicana, de la mecánica cartesiana a la newtoniana o de la teoría del calórico a la termodinámica fenomenológica. En cualquier caso, n~uchosde los ejemplos mencionados por Kuhn y sus seguidores como candidatos a revoluciones científicas responden, en realidad, a un esquema de cambios mucho menos dramáticos: no se trata 1,erdaderamente de rupturas totales, ni al nii1el conceptual, ni al metodológico, ni al aplicativo. Tales casos se distinguen más bien por las siguientes características: a) la teoría anterior al cambio es suplantada sólo en parte por la posterior; b) algunos, o incluso muchos, de los conceptos, principios y casos paradigmáticos de aplicación de la primera teoría quedan incorporados, con modificaciones semánticas leves, a la segunda teoría; c) la primera teoría es reinterpretada como un caso "especial", "idealizado" o "aproximado" de la segunda; d) a nivel sociológico, la comunidad científica afectada por el cambio izo queda dividida en dos comunidades rivales e irreconciliables, sino que una parte de la misma comunidad, aunque "oficialmente" adherida a la nueva teoría, sigue trabajando con la teoría anterior, al menos a fines didácticos, o para resolver problemas de cierto ámbito restringido o aplicaciones puramente tecnológicas.
A estas características responden, en efecto, muchos de los ejemplos concretos de "revoluciones científicas" que (generalmente prescindiendo de análisis historiográficos detallados) se han propuesto en la literatura sobre el tema: la transición de la teoría planetaria de Kepler a la mecánica newtoniana, de ésta a la relativista especial y de ésta finalmente a la teoría general de la relatividad; la transición de la termodinámica fenomenológica a la mecánica estadística; la transición de la óptica geométrica a la ondulatoria y
de ésta a la electrodinámica; la transición de la teoría atómica clásica a la química cuántica; la transición de la genética "mendeliana" a la teoría cromosómica de la herencia y de ésta a la biología molecular; la transición de la teoría darwiniana de la evolución a la teoría "sintética" de Mayr y sus seguidores; y sin duda batantes casos más. En vista de estos ejemplos y sus características esenciales, conviene, por lo tanto, distinguir netamente por lo menos dos grandes tipos de cambio interteórico: ( 1 ) la suplantación de teorías acompañada de inconmensurabilidad (semántica); (2) la incorporación de teorías sin inconmensurabilidad.
Sólo el primero de estos dos fenómenos corresponde aproximadamente a la noción kuhniana de revolución cientlJfica (aunque Kuhn mismo veía muchos casos del segundo tipo como revoluciones). Para abreviar, al primer tipo lo llamaremos simplemente 'suplantación' y al segundo 'incorporación' de teorías. Ambos tipos pueden elucidarse formalmentemediante el aparato conceptual del estructuralismo, aunque en el caso de la suplantación la elucidación es algo más problemática que en el caso de laincorporación. Empecemos por esta última.
4.
Cambio interteórico como incorporación
La incorporación de teorías como fenómeno diacrónico está inspirada en un tipo particular de relación interteórica sincrónica: la reducción (estructural, cf. cap. 11, $3). ya sea "exacta" o bien "aproximada" (en la inmensa mayoría de casos históricos se tratará más bien de lo segundo, o sea, de una "reducción aproximada" o "aproximación reductiva", como se la prefiera llamar). La intuición biísica detrás de la noción de reducción estructural se resume en las tres siguientes condiciones: a ) Existe una correspondencia formal entre los marcos conceptuales respectivos de la teoría reducida y la reductora, o sea, en perspectiva diacrónica, entre la teoría incorporada y la incorporadora. b) Las leyes fundamentales de la teoría incorporada son implicadas, al menos aproximativamente, por las leyes fundamentales de la teoría incorporadora reforzadas por alguna(s) ley(es) especial(es) de esta última. c) Todas las aplicaciones intencionales exitosas de la teoría incorporada pueden reinterpretarse (al menos aproximativamente) como aplicaciones intencionales exitosas de la teoría incorporadora; pero en general no será válida la relación inversa: habrá aplicaciones intencionales exitosas de la teoría incorporadora que fueron "fracasos" para la teoría incorporada o incluso que no fueron contempladas en absoluto por esta última.
Veamos cómo pueden precisarse estas intuiciones mediante las entidades que, según el estructuraIismo, componen una teoría cualquiera. Para simplificar y restringir nuestra
atención a lo esencial haremos uso solamente de las nociones de conjunto de modelos potenciales (Mp),conjunto de modelos potenciales parciales (Mpp), conjunto de modelos actuales (M) y dominio de aplicaciones intencionales I. Recordemos (cf. cap 10, $5) que las relaciones entre estos componentes son las siguientes: Mpp = r[MpJ,M G Mp. I G Mpp. Recuérdese también que en las redes teóricas arbóreas, que por lo general representan modelo-teóricamente las teorías científicas, hay siempre un subconjunto MOde Mp pnvilegiado que es el conjunto básico de modelos actuales de la red, es decir, el conjunto de modelos determinado por las leyes fundamentales. Por otro lado, y como venimos haciendo, usaremos 'M;' como variable para clases de modelos actuales especiales, los determinados por leyes especiales de la teoría (que, naturalmente, presuponen la ~alidezde las leyes fundamentales). Para referimos a la teoría incorporadora, o a cualquiera de sus componentes, usaremos los signos usuales seguidos de un asterisco: para referirnos a la teoría incorporada, o a sus componentes, usaremos los signos usuales solos. Finalmente, usaremos '=' como subíndice de relaciones conjuntistas para denotar que la relación en cuestión no es "exacta" sino "aproximada"; así, 'x E A' y 'A c B' significan, respectivamente, que los correspondientes casos de pertenencia e inclusión son aproximados.' Con estos instrumentos en la mano podemos definir ahora la relación de incorporación anunciada (de nuevo, cf; cap. 11, def. 11.3, p, es la relación que genera p a nivel no-teórico, entre modelos parciales; e.e. p, = r (p)). u
Sean N, N* redes teóricas. N es incorporable a N* syss existe una relación p c Mp* x Mp tal que: ( 1 ) p es función, es efectivamente calculable y Rec(p) = Mp. tales que (2) Existen n conjuntos no vacíos M , ..., M? incluidos en ~ [ M : u ... c-Mo. (3) lo n r[MolG pJlj8 n r[M'831.
~m
Estas condiciones definitorias de la incorporación de una red teórica N (una "teoría" en.genera1) en otra red teórica N* corresponden intuitivamente a las tres condiciones intuitivas de una reducción aproximativa presentadas más arriba. La definición formal aquí presentada, sin embargo, permite establecer una serie de precisiones y clarificaciones ulteriores. Veamos cuáles son y cuál es su razón de ser. En primer lugar, es importante notar que la relación de incorporación se establece entre redes enteras y no entre elementos teóricos aislados, lo cual responde a la idea de que son teorías en su totalidad y no sólo algunas leyes especiales de las mismas las que quedan incorporadas en una teoría distinta. Por supuesto que, desde un punto de vista puramente formal, podríamos contemplar la posibilidad de incorporación de una red teórica "degenerada", que constase de un solo elemento teórico; esta posibilidad extrema no 2. Esta noción puede precisarse formalmente con instrumentos topológicos (cf. Bnlzer, hfoulines y Sneed, 1987, cap. VlI, o bien, para una exposición m S sucinta, Moulines, 1982, cap. 2.9).
queda excluida formalmente por nuestra definición, pero está claro que no representa los casos normales. Ahora bien, aunque la relación de incorporación.quede definida entre redes en su totalidad, la incorporación atañe, por el lado de la teoría incorporada, directa y explícitamente sólo al elemento teórico básico To.Ello no significa una restricción indebida. En efecto, dado que los demás elementos teóricos de la red incorporada son especializaciones del elemento básico, podemos decir que la incorporación de este último en una red distinta "arrastra" consigo, indirectamente, la incorporación de sus especializaciones. Nótese que esta determinación deja abierta la posibilidad de que, a pesar de que hayamos establecido la incorporación de N en N* y por tanto de los conceptos y principios básicos de N en los de N*, no obstante, no dispongamos explícitamente para alguna ley especial de N de su correlato en N*, o simplemente lo ignoremos. Podría quizá argüirse que ello representaría una situación metodológicamente inaceptable para una "buena" incorporación, y que para que ésta sea verdaderamente satisfactoria debe indicarse qué elemento(s) teórico(s) especial(es) de N* corresponde(n) a cada uno de los elementos teóricos especiales de N. Desde un punto de vista puramente formal, sería fácil añadir una estipulación en este sentido a nuestra definición general de incorporación. Sin embargo, desde el punto de vista de la praxis real de las incorporaciones históricamente dadas, no parece necesario ni conveniente añadir esta condición tan restrictiva. En efecto, en la mayoría de casos se acepta una incorporación cuando se ha mostrado que ella ha podido establecerse para los conceptos y leyes fundamentales, así como las aplicaciones en general, de la teoría a ser incorporada, y no se espera a que se haya especificado, para cada ley especial de la red incorporada, cuál es su correlato concreto en la red incorporadora. En teorías con un mínimo de complejidad sería sumamente tedioso encontrar o construir tales correlatos para cada una de las numerosas leyes especiales; ello sólo se lleva a cabo para algunas leyes especiales cuyos correlatos incorporadores parecen especialmente interesantes por alguna razón concreta. Así, por ejemplo, para aceptar el éxito de la incorporación de la mecánica newtoniana en la mecánica relativista especial, cadie esperó a ver cómo las numerosas leyes dinámicas especiales de la mecánica newtoniana (incluyendo complicadas ecuaciones que ni siquiera aparecen en los manuales de física, sino sólo en los formularios de ingenieros dedicados a problemas mecánicos muy especiales) encontraban su correlato en la mecánica relativista; bastó comprobar cómo los conceptos y principios fundamentales de la mecánica newtoniana, y a lo sumo algunas otras leyes de alto nivel de generalidad, podían asimilarse a otras relativistas. Así, pues, para la relación interteórica que estamos analizando aquí, lo único esencial es la incorporación del elemento básico de la teoría anterior .al cambio. Esta incorporación ha de realizarse con respecto a los tres componentes más importantes de dicho elemento: el marco conceptual Mp (que, por definición, es el mismo para todos los elementos de la red N), las leyes fundamentales recogidas en M0 (de las cuales todas las demás leyes de N son especializaciones) y el dominio general 10 de aplicaciones (que abarca todos los casos de aplicación contenidos en la red). A estos tres componentes del elemento básico se refieren las tres condiciones de la Definición 13.2. Según la condición (l), la relación de incorporación queda formaImente fijada como una relación entre los modelos potenciales de ambas teorías que además es una
firi~ciónefecriifaiíre~~re calcz~lablede la clase incorporadora sobre la clase incoqorada; en general, sin embargo, la relación inversa p-' 110 será una función. Estas determinaciones de ]a relación tienen una serie de consecuencias dignas de ser notadas. En primer lugar, que p sea efectivamente calculable significa que entre Mp* y Mp no sólo se estipula la existencia de una relación cualquiera (lo cual siempre es trivialmente válido), sino que la relación p escogida debe ser tal que, en un número finito de pasos, pueda determinarse qué modelo de Mp corresponde a cuál de Mp* o a la inversa. Que además p cubre todo Mp significa que todo modelo potencial de h' tiene al menos un correlato en N*, es decir, queda efectivamente incorporado a N*. Pero, por otro lado, como p-' no es necesariamente una función, es posible que los modelos potenciales de N tengan ivat-ios correlatos distintos en N*. La idea intuitiva es que cada modelo incorporado puede traducirse en versiones diferentes en la teoría incorporadora, lo cual, a su vez, expresa el hecho de que esta última suele tener mayor poder de diferenciación o de análisis en la representación de los fenómenos. Por otro lado, el hecho de que el dominio de p esté incluido en Mp*, sin ser necesariamente idéntico a este conjunto, significa que, en general, habrá muchos modelos potenciales de la teoría incorporadora que no tienen ningún correlato en la teoría incorporada: intuitivamente, la teoría incorporadora puede tratar de algunos sistemas que caen por completo fuera del marco conceptual de la teoría incorporada. La condición (2) es, en lo esencial, una reconstrucción modeloteórica de la idea intuitiva acerca de la reducción de una teoría a otra según la cual las leyes fundamentales de la teoría reducida se "deducen" de las leyes fundamentales y algunas de las especiales de la teoría reductora. Recordemos el teorema elemental (pero metateóricamente muy relevante) de la teoría de modelos, según el cual si una fórmula a implica otra P, entonces 10s modelos de a, es decir, las estructuras que satisfacen a, constituyen un subconjunto del conjunto de modelos de P: U: r=
p
syss M,
c Mp.
La condición (2) reproduce, en lo esencial, esta idea pero generalizándola al caso en que las leyes de una y otra teoría pertenecen a "lenguajes", esto es, a marcos conceptuales diferentes aunque correlacionados por la función p. Tomamos primero cierto número de leyes especiales incorporadoras a!,..., a, (puede ser una sola), todas las cuales presuponen las leyes fundamentales (esto es, las clases de modelos que satisfacen esas leyes especiales A continuación construimos su "traducción" al lenguaje de N son subconjuntos de mediante p y ello ha de ser suficiente en cualquier caso para implicar las leyes fundamentales de N. Al tomar la unión M? u ... u M~contemplamosla posibilidad de que, según el tipo de sistema considerado, se necesiten diversas leyes especiales de N* para llevar a cabo la "deducción" de las leyes fundamentales de N. Dado que con frecuencia, si no casi siempre, la relación de incorporación ha de concebirse como una relación apt-oximativa entre las teon'as involucradas, la implicación de una teoría por la otra valdrá en general sólo de manera aproximada; en términos modeloteóricos ello se traduce en el hecho de que las relaciones conjuntistas de la condición (2) en general no se cumplen de manera exacta sino sólo aproximada. Por supuesto que el caso eventual en que la incorporación
m.
valga con exactitud también queda subsumido bajo este esquema, pues c-contiene como casos especiales aquellos en los que vale c. La condición (3) se refiere a la parte "empírica" o "base de datos" de una y otra teoría. Para que la incorporación sea realmente exitosa no basta con la correlación entre marcos conceptuales y la implicación (aproximativa) de leyes, sino que debe estar garantizado que todas las apIicaciones intencionales exitosas de N quedan engIobadas por la p-traducción de las aplicaciones intencionales exitosas de N*, o más exactamente, por un entorno topológico de las mismas, pues también aquí debemos tomar en cuenta el fenómeno de la aproximación. Esta condición relativa a las aplicaciones puede parecer quizá demasiado restrictiva o contraintuitiva en el sentido de que podría ocumr (y parece haber ejemplos históricos de ello) que algunas aplicaciones intencionales de la vieja teoría sean consideradas fuera de lugar por la nueva teoría y por tanto no se esperen conelatos pertinentes de aquellas en el nuevo dominio de aplicaciones intencionales. Para reflejar esta posibilidad podríamos debilitar de alguna manera la condición (3), por ejemplo, exigiendo sólo que una porción considerable de 10 n r[Mo] sea subconjunto de su correlato aproximativo en N*. Sin embargo, aquí mantendremos la formulación estricta de la condición (3), y no sólo a efectos de simplicidad expositiva sino, además, porque la posibilidad mencionada de que algunas de las aplicaciones intencionales exitosas de N caigan "en desuso" es menos probable de lo que parece a primera vista y de lo que algunos ejemplos históricos quizá sugieren. En efecto, la relación entre N y N* no ha de ser concebida en el sentido de que N* recoja toda la evolución de la teoría anterior desde sus inicios y con todos los cambios en el dominio de aplicaciones que el proceso lleva parejo, sino sólo lo que es la teoría en su último estadio. Es decir, la red N que hay que incorporar es sólo el último término de cierta sucesión <Ni, N?, ..., N,,> que representa una evolución teórica en el sentido de la Definición 13.1, esto es, N = N,. En tal caso, sí es de esperar que la teoría incorporadora N* recoja todos los éxitos de aplicación empírica que estaban ya recogidos en la teoría a ser incorporada; de la contrario, probablemente no consideraríamos que la incorporación ha sido verdaderamente exitosa. Este esquema da cuenta de la siguiente posibilidad históricamente interesante. Supongamos que una teoría dada ha evolucionado hasta llegar a una "fase" (una red) N,, en la cual es incorporada a una nueva teoría representada por la red Ni. Supongamos, no obstante, que a pesar de que Ia comunidad científica acepte el éxito de esta incorporación, una parte de la misma sigue desarrollando la primera teoría y que ésta llega a una fase N,,. en la que ya no se cumple la condición (3) de la i oración porque se descubren nuevas aplicaciones exitosas de la primera teoría que no n ningún correlato adecuado (exitodudas acerca de si la incorporación so) en la segunda. En tal caso, sena legítimo ab realmente puede efectuarse de manera satisfactor robablemente se seguirían desarrollando ambas teorías en paralelo. Puede interpre sta situación como la traducción a nuestros términos del fenómeno histórico que S describe en términos intuitivos Lakatos, 1977); al menos es ésta como programas de investigación en competen una interpretación plausible de algunos de los c vistos por dicho autor. En efecto, Lakatos sostiene que la mayoría de los ejempl ue Kuhn considera revoluciones
456
FUNDAMEhTOS DE FILOSOF~ADE LA CIENCIA
científicas, o cambios de paradigma, constituyen en realidad casos de competencia entre programas de investigación rivales, en los que uno de los prosramas acaba por ser "superado" ("incorporado", diríamos aquí) por el otro, pero sin que esta superación pueda ser nunca definitiva, ya que el programa aparentemente "perdedor" puede subsecuentemente recobrar fuerzas y mostrar éxitos empíricos para los que su rival no estaba preparado. Ahora bien, independientemente de si Lakatos tiene razón en su tesis historiográfica de que existe mayor fundamento histórico para su idea de programas en competencia que para los cambios de paradigma de Kuhn, está claro intuitivamente que ambas ideas son netamente distintas. Es por ello conveniente, si no es que necesario, precisarlas de tal modo que la diferencia resulte detectable en términos exactos; ello, a su vez, puede contribuir a dirimir la cuestión historiográfica de si, en la historia real de la ciencia, hay más casos "lakatosianos" que "kuhnianos7', o a la inversa (o quizá ni unos ni otros). La intuición lakatosiana es precisable, al menos en parte, mediante nuestra noción formal de incorporación de la siguiente manera.
Definición 13.3: Sean E = <N,, N2, ..., N,,> y E' = <N:, N;, ..., N> : dos evoluciones teóricas distintas en el sentido de Def, 13.1. Diremos que E y E' son programas de invesrigación en coinpetencia syss hay N;y Ni+,,de E y Nide E' tales que N; queda incorporada en N:. pero no existe N ~ A de E' que incorpore a Ni+h. Nótese que la definición permite que la competencia se dé en los dos sentidos, con lo cual tendríamos el caso de una "competencia perfecta" entre programas: cierta fase del uno es incorporada a una fase del otro, mientras que cierta fase del otro queda incorporada en una fase del primero; pero ninguno de ambos logra incorporar todas las fases ulteriores del otro. Para conc!uir queda por precisar la idea rival kuhniana de cambio revolucionario o cambio de paradigma (con inconmensurabilidad concomitante); para ello utilizaremos la noción de suplantación de teorías.
5. Cambio interteórico como suplantación Según la metateoría de Kuhn, en las genuinas revoluciones científicas se da la suplantación total de una teoría (un paradigma o matriz disciplinar) por otra. Ahora bien, este proceso de suplantación es radical en el sentido de que no sólo se abandona una teoría que hasta ahora se tenía por verdadera y a partir del cambio se la considera falsa: la suplantación no consiste en una mera falsación o refutación de una teoría y su sustitución por otra, sino que el cambio va acompañado, si Kuhn está en lo cierto, de un fenómeno semántico más profundo: la inconinensurabilidad entre ambas teorías. Ello significa que ocurre una verdadera ruptura entre los marcos conceptuales de una y otra teoría: no hay manera de correlacionar semánticamente los conceptos básicos de una teoría con los de la
i
1
I
1
i
;
1I t
i
!
I l
otra, y por lo tanto tampoco puede establecerse ninguna relación lógica entre los principios de una y otra teoría. Cada teoría se vuelve "ininteligible" para la otra. En consecuencia, no es que una teoría sea, propiamente hablando, falsa respecto de Ia otra, sino algo peor: carece de sentido. La tesis de la inconmensurabilidad d e Kuhn (defendida también, independientemente, por Feyerabend, aunque en un contexto algo distinto) ha tenido un gran impacto en la filosofía diacrónica de la ciencia de las últimas décadas. Se trata de una tesis acerca de los aspectos semánticos de los cambios interteóricos. Más concretamente, la tesis de Kuhn es que en la forma de cambio científico que él trata de apresar se da un tipo de relación especial entre los conceptos básicos antes y después del cambio que es precisamente lo que él llama "inconmensurabilidad" (la cual, según el propio Kuhn, no debe confundirse con la incomparabilidad: dos conceptos o principios pueden ser comparables en el sentido de apresar más o menos eficientemente el mismo tipo de fenómenos y, no obstante, ser inconmensurables en el sentido de que no pueda traducirse el uno al otro, de que no haya una base semántica común). Al darse la relación de inconrnensurabilidad en un cambio interteórico revolucionario, no sólo cambian de significado los términos básicos de una y otra teoría, sino también sus respectivos '*universos del discurso"; es decir, la ontología fundamental, que sirve de base a la interpretación de los términos y enunciados de una y otra teoría se vuelve completamente dispar: los científicos portadores de una y otra teoría "viven en mundos distintos" como dice Kuhn. Ejemplos clásicos de tales cambios sernánticos profundos, que implican cambios ontológicos fundamentales serían: el paso del concepto ptolemaico de planeta al concepto copemicano; el paso del concepto cartesiano de res extensa al concepto newtoniano de partícula; el paso del concepto de "aire deflogistizado" de la química del flogisto al concepto de oxígeno de Lavoisier. Ahora bien, si examinamos con un poco de atención la idea de la inconmensurabilidad como relación ontosemántica entre los conceptos básicos de dos teorías, nos percataremos pronto de que. aun admitiendo la realidad histórica de tales rupturas,. ellas no pueden (como parecen sugerir Kuhn y Feyerabend) ser un asunto de todo-o-nada. Dadas dos teorías separadas por un cambio revolucionario puede haber mayor o menor inconmensurabilidad entre ellas. Dicho en términos más técnicos, la inconmensurabilidad como relación ontosemántica entre teorías ha de concebirse como concepto comparativo, como una relación gradual. La inconmensurabilidad puede atañer sólo a un concepto básico de cada teoría (y a su correspondiente universo del discurso), o a varios, o quizá incluso a todos (las diversas posibilidades tienen que ver con cuán "holista" sea el sistema conceptual de las teorías involucradas). Ahora bien, hay que tener en cuenta que, cuantos más conceptos básicos de dos teorías queden involucrados en la relación de inconmensurabilidad, tanto más radical será ésta... pero también tanto más desprovista de interés, tanto más inverosímil para describir un cambio interteórico real en la historia de la ciencia. Pueden detectarse, sin duda, casos de inconmensurabilidad total entre dos teorías, incluso entre dos teorías que se suceden en el tiempo, pero es muy dudoso que tales casos tengan la menor significación para la filosofía diacrónica de la ciencia. Tomemos, por ejemplo, el siguiente par de teorías: la teoría del catastrofismo en geología y la teoría del valor en la economía marxia-
na; es muy plausible admitir que ambas teorías son totalmente inconmensurables; además, la primera teoría fue abandonada aproximadamente por las mismas fechas (alrsdedor de 1850) en las que emergió la segunda. Pero nadie estará dispuesto a hablar aquí de cambio revoluciona~o;por supuesto que no es en casos de esta naturaleza en los que piensan Kuhn y sus seguidores. Inconmensurabilidad total, incluso acompañada de sucesión temporal inmediata, no es un buen criterio para detectar revoluciones científicas. Cuando dos teorías "no tienen nada que ver entre sí", entonces ciertamente serán todo lo inconmensurables que se quiera, pero ello no es indicio del fenómeno de suplantación de teorías. En realidad, si examinamos con atención los ejemplos de revoluciones que han presentado los adalides de la tesis de la inconmensurabilidad, notaremos que los casos verdaderamente interesantes de inconmensurabilidad son aquellos en que ésta se da parcialmente: algunos de los conceptos de las dos teorías involucradas están ciertamente correlacionados pero carecen de una base ontosemántica común (no pueden "traducirse"), mientras que otros están correlacionados y además son interpretables sobre una base ontosemántica común. En términos modeloteóricos podemos decir que, en tales casos, algunas subestructuras de los modelos de una y otra teoría son comunes a ambas, o por lo menos formalmente conectables, mientras que otras subestructuras no lo son (y son las que causan el problema semántico al tratar de comparar ambas teorías). Por lo que respecta al contenido proposicional de dos teorías separadas por un cambio interteórico de suplantación, parece plausible suponer que, como sugieren los "inconmensurabilistas", las leyes fundamentales de la teoría suplantadora no pueden implicar (por razones estrictamente lógico-semánticas) las leyes fundamentales de la teoría suplantada, y por supuesto que tampoco a la inversa; de lo contrario, no tendría sentido hablar de "suplantación". En ello estriba la diferencia esencial entre un cambio interteórico con incorporación y uno con suplantación. Por otro lado, no obstante esta inconmensurabilidad a nivel proposicional, si no queremos que la relación entre teoría suplantada y teoría suplantadora se reduzca a un caso de mera inconmensurabilidad trivial como es el de la relación entre la geología catastrofista y la economía marxiana, tendrá que haber algo en común entre teoría suplantada y suplantadora: a saber, al menos algunos (tipos de) aplicaciones intencionales. En ellas, en cuanto que en general son subestructuras de los modelos potenciales de una y otra teoría (y por tanto admiten total disparidad a nivel de las "superestructuras" teóricas respectivas), radica la clave de la comparabilidad a pesar de la inconmensurabilidad. En efecto, supóngase que constatamos que algunas de las aplicaciones intencionales comunes a ambas teorías (como se verá a continuación, ello no supone que los sistemas de datos son literalmente los mismos, sino s61o que son conectables) y que consideramos especialmente importantes para nuestro conocimiento de la realidad o para nuestra praxis de manipulación de la misma, resultan ser de tal naturaleza que no pueden expandirse teóricamente para constituir modelos actuales de una teoría pero sí pueden convertirse en modelos actuales de la otra. Intuitivamente, ello significa que esas aplicaciones, aunque pertenecen al campo de lo que ambas teorías se proponen sistematizar, sólo lo son exitosamente por la segunda teoría. Ello es razón suficiente y plausible para que suplantemos la teoría menos exitosa por la más exitosa (incluso si para ello hay que pagar el precio, como sugiere Kuhn, de que algunas aplicaciones intenciona-
les de la primera teoría, que se consideran "menos importantes", quedan relegadas al olvido por la teoría suplantadora). No hay en todo este proceso de suplantación así concebido nada que suene a "irracionalidad", como han pretendido muchos críticos de Kuhn. No sólo es un proceso racionalmente comprensible, sino que los rasgos esenciales del mismo son formalmente apresables mediante el aparato modeloteórico del que ya hemos hecho uso en las páginas anteriores de este capítulo. Veámoslo con la definición de suplantación que se propone a continuación (recuérdese que p,es la relación generada por p a nivel no-teórico: p, = r(p)).
Dejnición 13.4: Sean N, N* dos redes teóricas distintas. Diremos que N es suplantable (inconmensurablemente) por N* syss existen una relación p c Mp" x . Mp y un conjunto no-vacío 1, tales que: (1) p no es efectivamente calculable. (2) p, es función, es efectivamente calculable y Rec(p,) = Mpp. ( 3 ) NO existen n conjuntos no vacíos M?, ..., Mnincluidos en i l í Ttales que ~ [ M...uU M;TI c,Mo. (4) (i) I, c lonp,[fl y (ii) para todo y E 1, (y E r[:m A y E r[Mo]). Comentenios el sentido de estas condiciones. Que p, en cuanto relación entre los aparatos conceptuales enteros de una y otra teoría, no sea efectivamente calculable significa que no hay manera de correlacionar sistemáticamente los modelos (y por tanto todos los conceptos básicos) de una y otra teoría. En esto, y en la condición (3) de no-deducibilidad de las leyes fundamentales de la teoría suplantada a partir de las leyes de la suplantadora, consiste la inconmensurabilidad. Determinamos pues dos factores de inconmensurabilidad distintos: uno conceptual, condición (l), otro proposicional, condición (3). Kuhn y otros partidarios de la tesis de la inconmensurabilidad también se refieren a veces a estos dos aspectos de la inconmensurabilidad, pero suelen dar la impresión de quererlos reducir a un solo factor. Nótese que aunque estos dos factores de inconmensurabilidad suelen ir juntos, estrictamente uno no se sigue de otro, (1) no implica (3); podría ocurrir que p no fuese calculable pero que p restringida a M: u ... u sí lo fuese. Por tanto, incluso si de hecho van siempre acompañados, es importante distinguir conceptualmente entre ambos factores. Por otro lado, por la condición (2), la inconmensurabilidad no es total, puesto que a nivel no-teórico o "empírico" hay manera de correlacionar efectivamente las estructuras parciales de una y otra teoría (la base de "datos") mediante el reducto no-teórico de p; éste tiene una estructura formal enteramente análoga a la relación de incorporación, pues la intuición básica es la misma. Con respecto a las aplicaciones intencionales de una y otra teoría, en-el caso de la incorporación hemos exigido una condición fuerte de superioridad de la teoría incorporadora frente a la incorporada: en lo esencial, que todas las aplicaciones exitosas de la segunda queden englobadas por la primera también. En el caso de la suplantación, la
460
FüXD.4hlEh'TOS DE FILoso~í.4 DE LA CIENCIA
condición homóloga respecto a las aplicaciones intencionales es mucho más débil: sólo exigimos que haya un subconjunto coiízlín de aplicaciones que hayan representado un fracaso para la teoría suplantada y resulten un éxito para la teoría suplantadora. A este subconjunto I, lo podemos interpretar como el conjunto de las anoríza~ías(en e1 sentido de Kuhn) de que adolece la -teoría suplantada (claro que la teoría suplantadora puede tener también sus propias anomalías, pero ellas no están en el punto de mira de la comparación entre ambas teorías). Para expresar esta idea (4) exige de este conjunto dos cosas: en primer lugar, que esté formado por aplicaciones pretendidas por ambas teorías; y en segundo lugar, que tales aplicaciones no sean subsumibles bajo las leyes de la suplantada pero sí bajo las de la suplantadora. Aunque esta estipulación respecto a las aplicaciones intencionales es más débil que en el caso de la incorporación, no obstante ella es suficiente para establecer la superioridad de la teoría suplantadora frente a la suplantada: la primera explica las cosas que la segunda quería explicar pero no podía. Es perfectamente comprensible entonces que la comunidad científica acabe por preferir una teoría frente a la otra, sobre todo en aquellos casos en los que, por razones cognoscitivas o tecnológicas, el conjunto I, se considere especialmente importante para la comunidad. Tampoco hay en esta preferencia ningún elemento que sea sospechoso de "irracionalidad".
6. Consideraciones finales: Las formas del progreso científico Concluiremos con unas breves obsenlaciones sobre la noción de progreso cient@co. Aunque las siguientes consideraciones están ya de hecho contenidas en lo dicho anteriormente, conviene explicitarlas aquí claramente a modo de conclusión, dado que la debatida cuestión del progreso científico pertenece sin duda a la problemática que debe abordar toda filosofía diacrónica de la ciencia. La idea de progreso en general es muy controvertida, pero no es éste el lugar para tratarla. Sin duda, hay una relación estrecha (aunque no una identidad, ni siquiera un condicionamiento absoluto) entre progreso científico y progreso técnico. También puede que haya algún tipo de relación interesante entre progreso científico y progreso moral o político-social, aunque esto ya sea una cuestión mucho más problemática. Pero el debatir sobre estos temas rompería el marco de este libro. Aquí nos hemos de limitar a hacer aIgunas sugerencias sobre el modo de precisar lo que pueda ser el progreso científico sensu stricto. Algunos autores, inspirados en una interpretación radicalmente relativista de las nociones kuhnianas, han sacado la conclusión de que la noción de progreso científico es vacía, que ella proviene sólo de ciertos prejuicios ideológicos calificados de "cientificistas": el desarrollo de las disciplinas científicas a través de la historia no es progresivo en ningún sentido objetivamente determinable, sino que más bien es comparable a una sucesión de modas. Y así como a nadie se le ocurre describir el paso de la falda corta a la falda larga (o al revés) como un progreso objetivo en el modo de vestir, así tampoco hay por qué hablar de progreso objetivo en el conocinliento cuando se pasa de una
teoría a otra en una disciplina. Ahora bien, independientemente de la constatación general de que el relativismo epistémico representa una posición argumentativamente insostenible (tema en el que no podemos detenemos aquí, cf. para ello Moulines, 1991. cap. 11.1). el hecho es que si se admiten los análisis de nociones diacrónicas propuestos en este capítulo, es fácil caracterizar de manera plausible y precisa al menos tres distintas formas de progreso científico, de las cuales, además, pueden detectarse nurnerosos ejemplos históricos. 1. En el caso del cambio intrateórico, determinaremos que hay progreso simplemente cuando las redes que componen una evolución teórica son cada vez más ramificadas y al mismo tiempo su dominio de aplicaciones exitosas cada vez mayor. Podemos formular estas dos condiciones más precisamente. Denotaremos mediante ' 1 N ) ' el número de elementos teóricos de que consta una red. Supongamos que Ni y N, son dos redes de una determinada evolución teórica E tales que i <j, esto es, N;precede a Ni.Diremos que la transición de N a N, ha representado un progreso si: (i) N; c 1.4 o (ii) Ió n r[Mó] c li n r [ ~ i ] Por . la primera condición, el progreso estriba en una mayor capacidad de discriminación y diferenciación de la teoría, lo cual va acompañado en general de un mayor potencial de explicación y predicción. Por la segunda condición, ese progreso a nivel de las leyes va acompañado de una mayor aplicabilidad de la teoría. Nótese que no exigimos que se den ambas condiciones sino sólo alguna de ellas, pues, aunque ambas formas de progreso suelen ir juntas, a veces se produce progreso sólo en uno de los ámbitos, bien el teórico, bien el aplicativo. 2. En contra d e l o que suponen muchos autores, también en el caso del cambio interteórico podemos dar cuenta "racionalmente" y objetivamente de lo que significa un progreso. En efecto, la relación de incorporación representa por sí misma un caso claro de progreso, por cuanto las leyes de la teoría incorporadora son a la vez más amplias y lógicamente más fuertes (tienen más consecuencias) que las leyes de la teoría incorporada; y además, también el dominio de aplicaciones exitosas de la primera abarca el de la segunda (y normalmente otras aplicaciones adicionales). 3. Finalmente, como ya hemos sugerido al final del apartado anterior, incluso en el caso.de la suplantación con inconmensurabilidad, podemos hablar de progreso de manera natural, al menos al nivel de las aplicaciones: la teoría suplantadora explica las anomalías de la teoría suplantada (además de muchas otras cosas).
1 1
1
Estos tres tipos de progreso científico ciertamente no son los únicos que pueden definirse con precisión. Las condiciones que hemos señalado son suficientes pero no necesarias para la idea intuitiva de progreso científico en general, tanto si nos restringimos al cambio intrateórico como si lo hacemos al cambio interteórico. Por ejemplo, una forma muy importante de progreso científico, en la que no hemos entrado aquí pero que sin duda es caracterizable formalmente, es la que representa el aumento en el grado de aproximación con el que el núcleo de un elemento teórico se aplica a sus aplicaciones correspondientes (cf. p.ej. Balzer, Moulines y Sneed, 1987, cap. VII). Esta forma de progreso ha tenido mucha importancia en la evoluciún de la astronomía y la física, por ejemplo. En
462
NNDAMENTOS DE FILOSOFÍA DE LA CIENCIA
cualquier caso, basten las formas señaladas para poner de manifiesto que la noción de progreso científico es precisable según diversos tipos y que es verosímil admitir que ellos tienen múltiples realizaciones en casos reales de la historia de la ciencia. Las consecuencias que se derivan de cada una de estas formas de progreso para otras nociones más fuertes, como la de progreso hacia la verdad, y su relación con otros problemas filosóficos sustantivos, como el del realismo cientifico, quedan fuera de los límites de esta obra.
1. Conjuntos 1.1. PERTENENCIA, EXTENSIONALIDAD Y CONJUNTO VACÍO Los conjuntos, o clases, son colecciones de cosas, son entidades que consisten en tener otras entidades como miembros. Ejemplos de estas entidades son el conjunto de los filósofos alemanes del siglo XIX, el conjunto de las letras de este libro, el conjunto de los números primos, el conjunto de los números primos menores que 10, el conjunto de los conceptos termodinámicos, el conjunto de las virtudes teologales, el conjunto de las teorías biológicas, el conjunto de los conjuntos de tres elementos, etc. Podemos nombrar estas entidades en lenguaje ordinario, como acabamos de hacer, pero para abrevix se suele usar el s i g o '( ... )', que se lee "el conjunto formado por ...". Este signo se puede usar de dos modos: a ) poniendo en los puntos suspensivos un nombre de todos y cada uno de los objetos que constituyen el conjunto; 6) poniendo una variable y dando una condición que satisfacen todos y sólo los objetos que constituyen el conjunto, e.e. '.(x1cp(x)}', que se lee "la clase de objetos d e s que cumplen la condición 9''(no toda condición determina un conjunto, pues eso conduce a paradojas, pero no podemos detenemos aquí en ello). En el primer caso decimos que nombramos el conjunto por extensión, en el segundo que lo nombramos por comprehensión; obviamente, sólo se pueden nombrar por extensión los conjuntos finitos. Son ejemplos de nombres de conjuntos por extensión '(1,2,3,5,7)', '(Churchill, Staiin, Roosevelt}', '{fe, esperanza, caridad}', etc.; y de nombres por comprehensión '(x l x es una letra de este libro)', '(x / x es un número primo)', '(x 1x es un número primo menor que lo}', ( x / x es una virtud teologal}', {xlxes un conjunto con exactamente tres elementos}', etc. Para referirse a la relación que se da entre un objeto y un conjunto del que es miembro se usa el signo de pertenencia ' E ', que debe estar flanqueado por un signo de objeto a su i~quierday por un signo de conjunto a su derecha. En general usaremos letras mayúsculas cursivas para variables de conjuntos; así, 'x E A' se lee "(el objeto) x pertenece a, es miembro de, es elemento de, (el conjunto) A", y su negación 'x E A' se lee "x no pertenece a (no es miembro de, no es elemento de) A". Son pues ejemplos de afirmaciones conjuntistas verdaderas "3 E ( 1, 2, 3,5, 7}", "3 E (x / x es un número primo)", "Schopenhauer E (x / x es filósofo alemán del siglo XK}", "(Churchill, Stalin, Roosevelt) E ( x / x es un conjunto de tres elementos}", "4 e ( 1, 2,3, 5, 7}", "4 E {xI x es un número primo}", "Stalin e ( x / x es un conjunto de tres elementos}", etc.
El principio básico que rige la identidad de los conjuntos es el principio de exfensionalidad, a saber, los conjuntos son extensionales, su identidad depende sólo de su extension, de cuáles son los elementos que los constituyen: Axioma de extensionalidad: Si dos conjuntos tienen los mismos elementos son el mismo conjunto: VA, B (VX(XE A XE
++
B)+A=B)
Así, por ejemplo, { 1, 2, 3,5, 7 ) y ( x / x es un número primo menor que 10) son el mismo conjunto, pues todo objeto que está en uno está en otro y viceversa; '{ 1,2, 3,5, 7)' y ' { x / x es un número primo menor que 10)' son nombres diferentes de la misma entidad. Es esencial notar que la extensionalidad de los conjuntos es una propiedad de las entidades mismas y que, por tanto, no depende de cómo se nombren. Que nombremos un conjunto por comprehensión, apelando a una propiedad que satisfacen sus miembros, no afecta para nada la extensionalidad del conjunto. Las propiedades pueden ser intensionales (e.e. puede haber propiedades diferentes que se apliquen a las mismas cosas), pero los conjuntos de cosas que las satisfacen no lo son. Así, { x1x es un número primo mayor que 2 y menor que 8) y (x / x es un número impar mayor que 2 y menor que 8) son el mismo conjunto, y { x/ x es un animal racional) y { x / x es un bípedo implume) también son el mismo conjunto; y eso independientemente de que las propiedades ser un número primo (entre 2 y 8) y ser un número impar (entre 2 y 8), o ser un animal racional y ser un bljledo implume, sean diferentes. Aunque intuitivamente un conjunto es una colección de cosas y no es claro que haya colecciones vacías en sentido intuitivo, es esencial para la teoría poder disponer de un conjunto que no tenga elementos. Este conjunto al que nada pertenece es el conjunto vacío, y se le denota mediante '0'. 1.2. INCLUSI~N Y CONJUNTO POTENCIA Los conjufitos pueden estar en diversas relaciones entre sí. Por ejemplo, dados A y B puede ocumr que todos los objetos que están en A estén también en B, o que no lo esté ninguno, o que estén unos pero no otros. De los dos últimos casos nos ocuparemos más adelante. Cuando ocurre lo primero se dice que el conjunto A está incluido en, o es un subconjunto de, B, y denotamos esta relación mediante el signo ' c ': A c B syssdefV x ( x E A + x E B). Así, por ejemplo, { ],S)E { 1,2, 3, 5), { l . 2, 3, 5 } E {1,2,3,5),{ x 1 x es un número primo menor que 10) c { x / x es un número primo), pero no { 1,2,8) c { 1,2,3,5), etc. Como se ve, todo conjunto esta incluido en sí mismo. Cuando los elementos de A están en B pero B tiene elementos que no están en A decimos que A está incluido esrricramente en, o que es un subconjunro propio de, E, y denotamos esta relación median. c (1,2,3,5},perono {1,2,3,5) c {1,2,3,5].Por te 'c':AcBsyssd4A G B A A # B . A s ~{1,2) tanto, todo conjunto está incluido en sf mismo, pero ninguno lo está estrictamente; por otro lado, es fácil ver que 0 está incluido en todo conjunto y además lo está estrictamente en todo conjunto diferente de él. A veces es útil poder hablar de todos los subconjuntos de un conjunto dado. Para ello acuñamos la noción de conjunro potencia o conjunto de las partes de un conjunto. El conjunto potencia, o conjunto de.las partes, de un conjunto A, 'Pot A' es el conjunto consistente en todos los subconjuntos de A: Pot A = hf { B / B E A). Así, por ejemplo, si A = {1,2), Pot A = ( 0 , Il)>I2)7Il211.
Dados dos conjuntos podemos formar otros reuniendo los elementos de los primeros de modo específico. Los modos más comunes son la intersección,-la unión y la diferencia. operaciones a las que denotamos, respectivamente, mediante 'n', 'u' y ' - '. La intersección A n B de dos conjuntos A y B es un nuevo conjunto que tiene por elementos los elementos comunes a A y a B: A n B = ( x 1 x E A A x E B ) . La unión A u B de dos conjuntos A y B es un nuevo conjunto que tiene por elementos los e l e m e n t o s d e a m b o s : A u B = ~ , ~ ( x lAxV~ X E B ) . La diferencia A-B de dos conjuntos A y B es un nuevo conjunto que tiene por elementos los elementos de A que no pertenecen a B: A-B = ( x 1x E A A x E B}. Así,p.ej.siA=(1,3,5,7}yB=(3,4,5,6},AnB=(3,5},AuB={1,3,4,5,6,7], A-B = ( 1 , 7 ) y B-A = (4,6}; si A = ( x / x es un número primo} y B = (A 1x es un número par), A n B = ( x / x es un número primo par} = {2},A u B = ( x 1 x es un número primo o par], A-B = ( x / x es un número primo impar} y B-A = ( x / x es un número par no primo} = ( x / x es un número par diferente de 2}. Nótese que tanto la intersección como la unión son conmutativas y asociativas, mientras que la diferencia no es ninguna de las dos cosas. Cuando dos conjuntos son tales que no tienen ningún elemento en común decimos que son disjuntos; por tanto, dos conjuntos son disjuntos si y sólo si su intersección es el conjunto vacío. J C ~
2. Relaciones 2.1.
PARES ORDENADOS Y PRODUCTO CARTESUNO
Los conjuntos en general se identifican sólo por los elementos que los integran, sin importar el orden en que se consideran tales elementos. Así, el conjunto de las letras de este libro es el mismo tal como estdn que cambiándolas de posición. En general, y si nos restringimos provisionalmente a conjuntos sólo con dos elementos, el conjunto ( x , y} es el mismo conjunto qae el conjunto (y, x ) . O de otro modo, si ( x , y} = ( 2 , t ) , no podemos asegurar que x = z e y = t ; puesto que en los conjuntos usuales el orden de los elementos no altera el conjunto, lo único que se sigue de ( x , y 1 = ( z , t } es "(x = z e y = t ) o (x = t e y = 2)". Sin embargo, como veremos a continuación, a veces es necesario referirse a conjuntos de elementos en los que sí se quiere que importe el orden. Para ello utilizamos el signo '< ... >'. Para dos objetos, hablaremos del par ordenado ~ r , y > ;para tres objetos, del trío ordenado <~,y,z>;y en general, paran objetos, de la n-tupln ordenada «,, .x?, ..., x,>. La propiedad fundamental de los pares ordenados es que en ellos sí ocurre "«,y> = <:,t> syss x = z e y = r". Esta propiedad se puede obtener definiendo los pares ordenados como conjuntos binarios (pares desordenados) de cierto tipo. Hay varias alternativas, todas con lo misma consecuencia; la más usual es: «,y> = ( (x},(x,y}} (el lector puede comprobar que, así definidos, los pares tienen efectivamente la propiedad deseada). Los tríos ordenados se pueden entonces definir así: a, y, z> = d,/ <a, y>, i>. Y así sucesivamente con las restantes tuplas. A partir de ahora nos limitaremos en general para simplificar a ejemplos binarios, pero todo lo que se diga se puede generalizar a tuplas cualesquiera. Dados dos conjuntos A y B, a ciertos efectos es útil disponer del conjunto completo de todos los pares ordenados posibles con primer miembro de A y segundo miembro de B. A este conjunto se le denomina el producto cartesiano de A y B, y se le denota mediante ' A x B'.
Formalmente este conjunto es el resultado de realizar una operación entre ambos conjuntos: A x B =&, {e, y> 1 x E A A y E B ] . Así, si A = {1,2,3) y B = {a,b), A x B = {<l,a>,<l,b >,<2,a>,<2,b>,<3,a>,<3,b>):si V = { x l x es un varón) y M = { x / x es una mujer), V x M = (-,y> 1 x es un varón e y es una mujer). El producto cartesiano de tres conjuntos A, B y C es el conjunto de todos los tríos ordenados tales que el primer miembro es de A, el segundo miembro es de B y el tercero es de C. Y análogamente con los productos canesianos de cuatro o más conjuntos.
2.2. RELACIONES; DOMINIO, RECORRIDO Y CAMPO Una relación R es cualquier conjunto de pares ordenados, o en general de tuplas ordenadas: si es un conjunto de pares, la relación es binaria; si es un conjunto de tríos, la relación es tenzaria; y en general, si es un conjunto de n-tuplas la relación es n-aria (por tanto, todo producto cartesiano de n conjuntos es una relación n-aria). Así, por ejemplo, P = {<1, a>, <1, b>, <3, b>} y Q = {a, y> / x es un varón, y es una mujer y x es padre de y) son relaciones; esta última relación podemos nombrarla abreviadamente mediante '{a, y> E V x M 1x es padre de y}'. El dominio de una relación binaria R, 'Dom R', es el conjunto de todos los primeros y> E R } . El recorrido (o conrradominio) de miembros de los pares de R: Dom R = def { X 1 3y a, una relación binaria R, 'Rec R', es el conjunto de todos los segundos miembros de los pares de R: Rec R = del {X/ 3y <y, X> E R}. El campo de una relación R es el conjunto de todos los (primeros y segundos) miembros de los pares de R, esto es, la unión del dominio y el recomdo: Cam R = d,f (DomR)u(RecR).Así,DomP={1,3},RecP={a,b} yCamP= {1,3,a,b};DomQ={xlx es un varón y x es padre de alguna mujer) (#V),Rec Q = { x / x es una mujer y algún varón es padre de x} (= M), Cam Q = {xlx es un varón padre de alguna mujer, o x es una mujer que tiene por padre algún varón } .
2.3. OPERACIONESENTRE RELACIOSES Las relaciones son cierto tipo de conjuntos, conjuntos de pares, en general tuplas, ordenados. En tanto que conjuntos, a ellas se aplican las operaciones generales entre conjuntos (unión, intersección, etc.). Pero además, en tanto que conjuntos de tuplas, se pueden definir para ellas ciertas operaciones especiales. Las más comunes, y útiles, son la resrricción a determinado conjunto, la imagen bajo un conjunto, la conversa (o inversa) y el producto ~elativo.Para simplificar, nos limitaremos a relaciones binarias, e.e. a conjuntos de pares ordenados. La restricción de una relación R respecto de un conjunto cualquiera A, que se denota mediante 'RLA', es una nueva relación formada por los pares de R cuyo primer miembro es elemento de A: RIA =dg {e, y> / a, y> E R A x E A ) . La imagen de una relación R bajo un conjunto A, 'R[A]',es el conjunto de los segundos miembros de los pares de R cuyo primer miembro pertenece f / 3x (a, y> E R A x E A ) ] = Rec RLA. Así, p.ej., si R = a A, esto es, el recorrido de RLA: R[A] = ~ {y {<l. a>, <2, b>, <2, c>, <3, c>} y A = {1,3,5,7},RIA = {<1, a>, <3, c>) y R[A] = {a, e } ;si S = { c x , y> / x es un libro escrito por y ) y B = { x / x es una novela policiaca}, SIB = {e, y> / x es una novela policiaca escrita por y ) y S[B]= { x / x ha escrito alguna novela policiaca). La relación conversa, o inversa, de una relación R, que denotamos mediante 'R", es la relación R "dada la vuelta", e.e. la relación cuyos pares son los pares de R "invertidos", intercambiando sus miembros: R 1= d d {a, y> / <y, x> E R J . Así, para los dos ejemplos anteriores, R'=
(<a, 1>, <b, 2>, <c, 2>, cc, 3 > ) y S'= (e, y> 1 x ha escrito el libro y } ; y si T = {e, y>/ x es progenitor de y}, T'= (a, y> 1 x es hijo de y ] . El producto relativo de dos relaciones R y S, 'R/S'. es la relación "puente" entre R y S. Es y> tales que x ek el primer miembro de un par de R una nueva relación formada por los pares a, cuyo segundo miembro es el primer miembro de un par de S que tiene y como segundo miembro; o más coloquialmente, x tiene a su derecha en R algo que está a la izquierda de y en S. Por tanto, RIS =de/ (a, y> / ~ z ( ( xZ>, E R A e, y> E S ) } . Por ejemplo, si R = {<l. a>, <2, b>. <3, o.<3. e > } y S = ( < a , a > , < a , c h , < c ,b > , < d , a > , < d , d > , < d , e > ) ,RIS= (<l,a>,<l,d>,<3, b > ) , y S I R = @ ; s iT = (a, y> 1 x es primo de y } y U = (a, y> I x es hijo de y } , entonces TIU = {e, y> 1 x es sobrino de y ) y U / T = (cx,y>/xeshijodeunprimodey). 2.4. PROPIEDADES DE LAS RELACIONES
Las relaciones, en tanto que conjuntos de pares, pueden tener propiedades, pueden ser de cierto tipo en función de qué les ocurra a sus pares conjuntamente considerados. Por ejemplo, una relación puede ser tal que, siempre que tenga un par, tenga también su par opuesto (p.ej. "ser hermano de"), o que no tenga nunca dos pares opuestos (p.ej. "ser progenitor de"), o que todo elemento del campo esté relacionado consigo mismo (p.ej. "ser tan o más alto que"). Las propiedades más destacadas son las siguientes: Reflexividad. Todo objeto del campo está relacionado consigo mismo: R es reflexiva H J ~Vx(x ~ E Cam R + e, x> E R). Irreflexividad. Ningún objeto está relacionado consigo mismo: R es irreflexiva *drf V X ( XE Cam R -+ e, x> E R). Simetría. Para todo par, el par converso está también en la relación: R es simétrica t ) d e f V x , y ( a , y > E R + < y j > E R). Asimetría. Ningún par está invertido en la relación: R es asimétrica t)defVx,y(-, y> E R + <y, x> 6E R). Antisimetrín. Los únicos pares conversos, caso de haber alguno, son los "idénticos" (e.e. con ambos miembros idénticos); no hay dos pares diferentes invertidos: R es antisimétrica -dcf Vx, y(cx, y> E R A <y, X> E R -+ x = y ) . Transitividild. La relación se "hereda"; siempre que un objeto esté relacionado con otro y éste lo esté con un tercero, el primero también está relacionado con el tercero: R es transitiva -def Vx, y, z ( a , y> E R A <y, Z> E R 4 e, 3 E R). Intransitividad. No hay ninguna secuencia de pares transitivos: R es intransitiva wdtfVx, y, z ( a , y> E R A <y, Z> E R -+ a , Z> E R). Conexión (débil). Cualesquiera dos objetos del campo diferentes están relacionados, en un sentido u otro (o en los dos): R es conexa t ) , f c f Vx, y(x E Cam R A y E Cam R A X;LY + a,y> E R v <y, X> E R). Conexión fuerte. Cualesquiera dos objetos del campo están relacionados en un sentido u otro (o en los dos): R es fuertemente conexa c+defVx,y(.r E Cam R A y E Cam R + <Y, y> E R v <y, x> € R).
Así, por ejemplo: R = (<1, 1>, <1, 2>, <2, 2>, d ,3>, < l . 3>, <3, 3>} es reflexiva, antisimétrica, transitiva, conexa y fuertemente conexa; S = (<1, 2>, <2, 1>, <2, 3 > , c3, 2 > } es irreflexiva,
e intransitiva; T = {<l. 2>. c2, 3>, el, 3>) es irreflexiva, asimétrica, antisimétrica, msitiva y conexa; U = {<1,2>,~ 2 1>, , <2, 2>, <2,3>] no tiene ninguna de estas propiedades; 0 tiene todas las propiedades (pues hace falso el antecedente de todos los definientes); V = {el,2>) es irrefiexiva, asimétrica, antisimétrica, transitiva, intransitiva (en este caso transitividad e intransitividad se cumplen ambas porque se cumplen vacuamente) y conexa; W = (4, 1>) es reflexiva, simétrica, transitiva, conexa y fuertemente conexa; Q = {a, y> 1x e y tienen los mismos progenitoy> 1x es más alto que y), es irreflexiva, asimétrica, res) es reflexiva, simétrica y transitiva; P = {e, y> I x ama a y } no tiene ninguna de estas propiedades. antisimétrica y transitiva; O = {a, Entre estas propiedades se dan las siguientes implicaciones: simetría más transitividad implican reflexividad; asimetría implica tanto irreflexividad como antisimetría; y conexión (débil) más reflexividad equivalen a conexión fuerte.
2.5. REIACIONES DE EQUIVALENCLA Y PARTICIONES Una relación de equivalencia relaciona individuos que son "equivalentes bajo cierto aspecto", como tener los mismo progenitores. haber nacido en el mismo país o ser del mismo sexo; Las relaciones de equivalencia se caracterizan por tener determinado grupo de propiedades: son reflexivas, pues todo individuo es "equivalente" (en el correspondiente respecto) a sí mismo; son simétricas, pues si un individuo equivale en cierto respecto a otro, éste también equivale en ese respecto a aquél; y son transitivas, pues la equivalencia se "hereda", los equivalentes a un tercero son equivalentes entre sí. Así pues, estas propiedades son las que definen las relaciones de equivalencia:
R es una relación de equivalencia ++kjR es reflexiva, simétrica y transitiva. Son ejemplos de relaciones de equivalencia: R = {<1,2>, <1,3>, <3, 1>, <3,2>, el, l>, <2,2>, Q, 1>, <2,3>, <3, 3>, <4,4>}, S = (<l, 1>), T = {e, y> I x tiene los mismos progenitores que y ] , U = {a, y> 1 x ha nacido en el mismo país que y ] , V = {e, y> 1 x es del mismo sexo que y ] o 1 = {a, y>lx=y].
Las relaciones de equivalencia tienen el efecto de dividir el campo de objetos en "clases de equivalencia", en grupos disjuntos de individuos equivalentes bajo el correspondiente respecto; o como se dice técnicamente, generan puniciones del campo. Para ver que ello es así necesitamos antes los conceptos de coclase de un individuo bajo una relación y de conjunio cociente del campo bajo la relación. La coclase de un individuo x bajo la relación R, '[x]R' es simplemente el conjunto de individuos que x tiene a su derecha en R: [ x ] =~&J {y / -a,y> G R). Así, para los ejemplos anteriores: [ i ] =~{ 1, 2 , 3 ) = [ 2 ] = ~ [3]R, [4]R = { 4 ); picas so]^ = { x 1 Picasso ha nacido en el mismo país que x } , etc. Nótese que esta noción es general, no se exige que la relación sea de equivalencia sino que está definida para cualquier relación. Por ejemplo, si W = {<1, 2>, <1,3>, <3, 2>, <2,4>, <2, 3>, <3, 4>), [I]w= (2, 31, [ 2 ] w = { 3 , 4 ) ;si P = {u, y> / x ama a y ) , [Picassolp = (y 1 Picasso ama a y } . Cuando la relación es de equivalencia, entonces a las coclases se las denomina clases de equi~*aalencia. El conjunto cociente de un conjunto A bajo una relación R, '[AIIR', es el conjunto de todas las coclases de los individuos de A bajo la relación R: [AIIR =M { [ x ]/~x E A ) . Lo interesante, por lo general, es cuando el conjunto A es el campo de R. Así, en los ejemplos anteriores, [ { l , 2, 3, 4 ) ] / W = {{2, 31, (3, 4 ) , {2, 4 ) . 0)y [{l, 2, 3, 4)IlR = ( ( 1 , 2, 3), {4)). El conjunto cociente del campo de una relación bajo dicha relación se puede considerar como una "división" del campo
generada por la relación. Así, toda relación "divide" su campo agrupando los individuos entre sí de diverso modo. Pero, como se observará, para la mayoría de las relaciones, como en el caso de W. esa "división" es muy imperfecta, hasta el punto de que apenas cabe hablar propiamente de división genuina. Sólo con las relaciones de equivalencia tenemos la garantía de que la división generada es una "buena" división. Este concepto de "buena división" (de un conjunto) es el que expresa la noción d e partición (de un conjunto). Una partición de un conjunto A es un conjunto de subconjuntos de A tales que: a) ningún individuo está en dos subconjuntos diferentes, 6) todo individuo está en algún subconjunto, y (c) ningún subconjunto es vacío: H e s u n a p a r t i c i ó n d e A # ~ ~ ~ V BH ( B+~B ~ A A B + ~ ) A V B , C ( BHEA C E H j B ~ C = @ ) A ~ X ( AX -E+ ~ B ( B H E A X EB)).
Así, ( [ 1,2, 31, ( 4 ) ) es una partición de (1, 2,541, mientras quz ((2, 31, (3,4}, (2,4]. 0) no lo es, pues incumple las tres condiciones (aunque bastan'a con que incumpliera una sola de ellas). Las particiones son por tanto las "buenas divisiones" de conjuntos y es inmediato que para cada conjunto (de dos o más elementos) puede haber varias. Hemos visto una partición del conjunto {1,2,3,4}, HI = ((1,2,3}, (41),perohayotrascomoH:= {(1,21, (31, (41) 0H3= ((1,4}, (2, 3)). Cuando dos particiones diferentes son tales que los subconjuntos de una son subdivisiones de los de la otra, decimos que la primera es másfina que la segunda; por ejemplo, Hz es más fina que H1 pero H3 no es ni más ni menos fina que ninguna de las anteriores. Ahora podemos expresar el hecho mencionado acerca de las relaciones de equivalencia: toda relación de equivalencia genera una partición, a saber, el conjunto cociente de su campo bajo ella. Aunque puede haber quizá alguna relación que no sea de equivalencia cuyo conjunto cociente sea también una partición (p.ej. { c l , 2>, <2, 3>, c3, 4>, <3, l>]), lo distintivo de las relaciones de equivalencia es que ellas siempre generan particiones; sólo de ellas sabemos en general que su conjunto cociente es una partición. En realidad es prácticamente equivalente hablar de relaciones de equivalencia o de particiones. Toda relación de equivalencia genera una partición, su conjunto cociente. Pero es fácil ver que también toda partición genera una relación de equivalencia. Llamemos relación asociada a un conjunto H (de conjuntos), 'RH'.a la relación que consiste en unir 10s productos cartesianos de cada elemento de H consigo mismo. Por ejemplo, para H = { ( 1, 21, (2, 4)), RH = { < I r l>, <1, 2>, <2, 1>, c2, 2>, <2, 4>, <4, 2>, c4, 4>}. Por lo general, como en este caso, si H no es una partición entonces la relación asociada no es de equivalencia; sólo si es una partición, la relación así generada es una relación de equivalencia (compruébelo el lector con Hz y H3). Por tanto, las relaciones de equivalencia generan particiones, sus conjuntos cocientes, y las particiones generan relaciones de equivalencia, sus relaciones asociadas.
2.6. RELACIONESDE ORDEN Las relaciones de orden "ordenan" los individuos del campo según determinado criterio comparativo, como la edad o la altura de las personas, el peso o la longitud de los objetos, etc. Hay muchos tipos de relaciones de orden, más o menos fuertes según los casos, pero en todas se han de dar ciertos hechos mínimos que son los que garantizan que se pueda hablar propiamente de orden. por muy débil que éste sea. Estos hechos mínimos asociados a toda idea de orden son básicamente dos: a) que no haya "círculos" o "bucles", y b) que se "herede" o "transmita". La segunda condición se plasma siempre del mismo modo, a saber, la relación ha de ser al menos transitiva. La
primera condición parece exigir que la relación sea al menos antisimétnca y en general así es, pero como veremos hay un tipo de orden que puede no ser antisimétrico y que a pesar de ello cabe considerarlo como un orden (aunque débil). En los órdenes antisimétricos tenemos dos tipos de condiciones adicionales. En primer lugar, según sea la relación reflexiva o irreflexiva; esto es, se permite que haya individuos relacionados consigo mismos, pero se exige que eso ocurra siempre o no ocurra nunca. Los órdenes irreflexivos se denominan estrictos, y los órdenes reflexivos, no esrricros. En segundo lugar, dependiendo de si la relación es conexa. A los órdenes conexos se les denomina lineales o fuertes, y a los que quizá no lo son, parciales. La combinación de estas posibilidades genera los siguientes cuatro tipos de orden.
R es un orden parcial no estricto H ~ esRreflexiva, antisimétrica y transitiva. Ejemplos: { < l . 1>, <1, 2>, <2, 2>, <2, 5>, <1, 5>, <3, 5>, <3, 3>, <4, 5>, < 4 , 4 > , <5, 5 > ) , {<1, 1>, <1,2>, <2,5>, <1,5>, <2,2>, < 5 , 5 > ) , {a, y> 1 x 2 ) ' ) . R es un orden lineal no estricto w W R es reflexiva, antisimétrica, transitiva y conexa. Ejemplos: {<1, 1>, <1,2>, <2,5>. <1,5>, c 2 , 2 > , <5, S>}, {e, y> l x 2 y } . R es un orden parcial estricto H ~ esRirreflexiva, antisimétrica y transitiva. Ejemplos: {<1, 2>, <2, 5>, <1,5>, <3,5>, <4, S>, < 4 , 5 > ) , { < 1 , 2 > , <2, 5>, <1; 5 > ) , {a, y> 1 (el objeto físico) x es más pesado que (el objeto físico) y ) , {a, y> / x > y ) . R es un orden lineal estricto tjdcf R es irreflexiva, antisimétrica, transitiva y conexa. Ejemplos: {<1,2>,<2,5>, < l . 5 > } , {e, y> l x > y } . En esta lista falta un tipo de orden que es muy débil pero que cabe todavía considerarlo orden y que, como hemos anunciado, no es antisimétnco. Un ejemplo de ello es la "versión no estricta y conexa" de "ser más pesado que", a saber, "ser tan o más pesado que". Intuitivamente, si "ser más pesado que" se puede considerar una relación de orden, entonces parece que "ser tan o más pesado que" también lo será, y sin embargo en este caso la relación no es antisimétrica, pues hay pares de individuos difereittes tales que el primero es tan o más pesado que el segundo y éste es tan o más pesado que aquél, a saber, cuando objetos diferentes son igual de pesados. A estos órdenes se les denomina débiles: R es un orden débil w d c f R es reflexiva, transitiva y conexa. Ejemplos: (además de los del orden lineal no estricto:) { < 1 , 2 > , < 1 , 1>, <2, 1 >, < 2 , 2 > , <2,4>, <1,4>, € 1 , 3>, <2,3>, <3, 3>, <3,4>, < 4 , 4 > ) , {a, y> 1 (el objeto físico) x es tan o más pesado que (el objeto físico) y).
3. Funciones 3.1. FUNCIONES; IMAGEN En las relaciones, un mismo objeto puede "tener a su derecha" varios objetos diferentes; por eso no podemos por lo general, para cada individuo, hablar de "el que está a su derecha". En la relación "ser más alto que" no tiene sentido hablar de "el más alto que Napoleón", pues hay varios. Para ello seria necesario que la relación fuese de un tipo especial, a saber, tal que cada individuo del dominio sólo estuviera relacionado con un único individuo del recomdo; en términos coloquiales, que no haya dos pares ordenados diferentes con idéntico primer miembro. A estas relaciones
especiales que tienen esta propiedad se las denomina funciones (y para ellas se suelen usar como variables las letras cursivas S , 'g', 'h', ... ).
f es una función ~
f es una relación A Vx, y, z (a, zsE f A <y, z>
d , /
E f-)
= Y).
Así, por ejemplo,f = { c l , 2>, c2, 3>, <3, 3>, <4, .1>), g = (a, y> / x tiene por madre a y } y h = {-a, y> I 2=y} son funciones; mientras que {<1,2>, <2,3>, <3,3>, <,4,2>, <4. 1>), {a, y> / x es hermano de y) y {a, y> l x = 7 )(siendo x e y números reales cualesquiera) no lo son. En tanto que relaciones, a las funciones se les aplica las mismas nociones de dominio, recorrido, etc., que a aquéllas. Por el tipo especial de relaciones que son, se puede definir para las funciones la noción de "el que está relacionado con" a que hemos hecho referencia. Ésta es la noción de imagen de un objeto bajo una función. La imagen del objeto x bajo la función f (en cuyo dominio está x), 'flx)', es el objeto y que está a la derecha de x enf: siendo f una función, f(x) =def el objeto y tal que -a,y> E f. Así, en los ejemplos anteriores, f(2) = 3, g(Edipo) = Yocasta, h(-3) = 9.
Una función se caracteriza porque cada objeto del domino sólo está relacionado con uno del recomdo, pero lo inverso puede no ser cierto, como en el caso de la anterior funciónf, en la que el 3 es imagen tanto de 2 como de 3. Por tanto, no siempre la relación inversa de una función es a su vez una función. A las funciones en que ello sí pasa las denominamos biyectivas o biunívocas, porque cada objeto del dominio está relacionado con un único objeto del recorrido y a la vez cada objeto del recomdo está relacionado con un único objeto del dominio. f es una función biyectiva ++de, f es función A f -' es función.
Así, por ejcmplo, (<1,2>, c2, 3>, <4, 1>), {a, y> / x es cónyuge de y } (en sociedades monógamas) y {a, y> / x + 8 = y ) son funciones biyectivas, mientras que {<1, 2>, <2, 3>, <4, 2>) y {<x, y> / x tiene por madre a y ) no lo son.
3.3. COMPOSICIÓNDE FUNCIONES I
i
¡
! i
1 (
En tanto que conjuntos, a las funciones se aplican las operaciones generales entre conjuntos, y en tanto que relaciones, a ellas se aplican las operaciones generales entre relaciones. Por ser un tipo especial de relaciones, se pueden definir operaciones específicas para ellas. La más importante es la composición, que se puede definir a partir del producto relativo de relaciones. La idea es que la función compuesta de dos funciones f y g, 'gof, es una nueva función tal que la imagen de un individuo x se obtiene aplicándole primero f y aplicando despues g al resultado así obtenido; esto es, g.ljx) es la imagen bajo p de Ir imrecn de x b a j o j g c j = d C f {a, y> i y = gflx))). Por ejemplo, si f = (si,22. <2, 2>. <3. 1>} y g = ( < l . a>, <2, 0.<4, 0,. t6. b > ) , gof(1) = g(J(1)) = g(2) = c, y la composición completa es gof = (cl,o , <2, o , <3, a > ) ; si h = {a, y> / y = x + S} y j = (cr,y> l y = 3 2 ) (en ambos casos sobre todos los números reales),j.h (-6) =j(h(4)) =j(2) = 12, y la composición completa es joh = (a, y> 1 y = 3(x + 8)'). Ei lector puede comprobar que la composición entre funciones no es más que el producto relativo en el orden opuesto: gaf =flg.
4. Sistemas y morfismos
Un sisrema o una estructura A es una secuencia o tupla ordenada consistente en un conjunto de individuos, llamado el universo del sistema, y una serie de relaciones y10 funciones sobre dicho dominio: A = 4,Ri,..., R.,$. ...,f,>. Una estructura expresa un modo en que puede cornponarse una parte de la realidad, es un mundo o situación posible en el que ciertos individuos, los miembros del universo, se comportan de cierto modo, guardan ciertas relaciones y están vinculados por ciertas funciones. Así, por ejemplo, tenemos las siguientes estructuras, constituidas todas ellas, además del universo, por una relación binaria y una función monaria (N es el conjunto de los número naturales, P el de los naturales pares y Z el de los enteros):
A = < ( 1 , 2 ) , {<1,1>,<1,2>,<2,2>}, { < 1 , 2 > , R , 1>)} B = <{a,b ) , {<a, a>, <a, b>, <b, b>}, {<a, b>, 4, a>}} C = <{+, *}, {<+, *>, <+, +>), (<+, +>, <*, *>}} N = < N , { e , y > l x S y ] ,{ a , y > l y = x + l } > P=<P, { e , y > I x ' y } , {cr,y>/y = x + 2 } > z = a , ( e , p > l x l y } , { - a , y > / y = x + 1)>
A veces dos sistemas pueden parecerse mucho, tanto que son como dos versiones diferentes de los mismos hechos; p.ej. A y B se parecen tanto que en ambos "pasa lo mismo", sólo que en lugar de 1 y 2 tenemos a y b. Decimos entonces que los sistemas son isomorfos, o que existe un isomorfismo entre ambos. Un isomorfismo es una función biunívoca que "traduce" un sistema al otro. En nuestro caso, una función que traduce A a B es hl = {<1,a>, <2, b>}:si en A cambiamos 1 por a y 2 por b, obtenemos B. N y P también guardan esta relación (antes de ver la noción técnica, procure el lector hallar un isomorfismo que realice la traducción en ese caso). Para que pueda existir un isomorfismo entre dos sistemas es necesario que los sistemas sean del mismo tipo lógico, que sean hornólogos: que tengan el mismo número de relaciones y funciones; y que se correspondan la ariedad de las relaciones/funciones de un sistema con las del otro. En nuestro caso, los seis sistemas son del mismo tipo. En general: Dos sistemas A = <A, RI,..., R..fi, ...,f,> y B = <B, Si,..., S,.,gj, ..., gmS>son homólogos syssdcf (1) n = n ' y m = m ' , (2) Ritiene la misma ariedad que Si (1 5 i In), y (3) f;. tiene la misma ariedad que g (1 5 j Ini). Veamos ahora la noción de isomorfismo: Sean A = 4,RI,..., R,,fi, ...,f,> y B = <B,Si,..., S,,g l , ..., g,> dos sistema homólogos, Iz es un isomorfismo de A en B syssd,f: (1) 12 es una función biyectiva con Dom h = A y Rec h =B. (2) Si k elementos al, ..., ae de A están relacionados mediante Ri, sus correspondientes
imágenes bajo h en B están relacionados mediante S;(k es la ariedad de R;, y S;,): Para todo a , , ..., cir de A: <al, ..., a& > E R; syss <h(a,),..., h(at)> E S;. (3) Sif;:asigna a k elementos al, ...,ak de A otro elemento a', g, asigna a las imágenes de a , , .... nk bajo h la imagen de a' bajo h ( k es la arirdad de& y si): Para todo a,,..., ak, a' de A:fj (al, ..., un) = a' syss gj (h(ai),..., h(nk))= h(at). Dos sistemas son isornorfos si son tales que existe un isomorfismo entre ambos. Nótese que, aunque dos sistemas sean isomorfos, no toda biyección entre sus dominios necesariamente es un isomorfismo; sólo se exige que al menos una lo sea. Es posible que haya más de una que lo sea, pero es posible también que alguna biyección no lo sea. Por ejemplo, la biyección h l = {<1, b>, <2, a>) no es un isomorfismo entre A y B (sí lo sería si la relación de A incluyera ademas el par <2, 1> y la relación de B el par <b, a>, compruébelo el lector). A y C no son isomorfos porque ninguna biyección de A en C es un isomorfismo (compruébelo el lector). S y P son isomorfos porque existe al menos una función que es un isomorfismo entre ambos, a saber, h3 = (a, y> E N x P / y = 2 r ) . N y Z no son isomorfos, pues, aunque los naturales y los enteros son biyectables, ninguna de tales biyecciones preserva la relación "menor que" ni la función "sumar uno". Entre sistemas homólogos cabe una relación de semejanza más débil que la de isomorfía, la relación de hornornofía. De los homomorfismos no se exige que sean biyectivos. Un homomorfismo de A en B es una función de A en B que cumple las condiciones (2) y (3) de la dzfinición anterior. A y B son homomorfos si existe un homomorfismo de A en B. Por ejemplo, N es homomorfo a Z bajo la función identidad (compruebe el lector que A no es ni siquiera homomorfo a C). En los homomorfismos puede haber elementos del universo del sistema de llegada que sean imagen de más de un original o que no lo sean de ninguno; en los isomorfismos no puede pasar ninguna de estas cosas, pues son biyecciones entre los universos completos. Los isornorfismos son pues un caso especial de homomorfismos, son homomorfismos biyectivos que agotan los universos. Nótese que siempre que existe un isomorfismo h de A en B existe otro de B en A, simplemente la función h'l inversa de h ; pero no ocurre lo mismo con los homomorfismos, p.ej. Z no es homomorfo a N.
Achinstein, P. (1968): Conceprs of Science. A Philosophical Analysis, J. Hopkins P., Baltimore.
- (1971): h w and Explanation. An Essay in the Philosophy of Science, Clarendon P., Oxford. - (1983): The Nature of Explanation, Oxford U.P., Nueva York.
- (1984): "The Pragmatic Character of Explanation", en Asquith y Kitcher (eds.) (1985), PSA 1984, Philosophy of Science Association, East Lansin, vol. 2. Adams, E. (1959): "The Foundations of Rigid Body Mechanics znd the Derivation of Its Laws from Those of Particle Mechanics", en Henkin, Suppes y Tarski (eds.) (1959), The Axiornntic Method, North Holland, Arnsterdam, 250-263. Apassi, J. (1981): Science and Society, Reidel, Dordrecht. Alexander, H. G. (1958): "The Paradoxes of Confirmation", Brirish Jortmal for the Philosophy of Science 9, 277-233. Aristóteles, Física; tr. esp. de F. Samaranch, Aguilar, Madrid, 1964. - , Rejktaciones Sofísticas; tr. esp. de M. Candel, Credos, Madrid, 1982. Armstrong, D. (1978): liniversals and Scientific Realism. Carnbridge U.P., Cambridge. Vol. 1: Nominalism and Realism; vol. Ii:A Theory of Universals. - (1983): What is a Law of Nature?, Cambridge U.P., Cambridge. Ayer, A. J. (1956): "What 1s a Law of Nature?', Revue Intemntionnl de Philosophie 10; reimpreso en Concept of a Person, Macrnillan. Londres, 1963, cap. 8. Bacon, F. (1620): Novum Organum: tr. esp. de C. Litrán, Fontanella, Barcelona, 1979. Balzer, W. (1982): Empirische Theorien: Modelle. Strukturen. Beispiele, Vieweg, Wiesbaden. - (1985); Theorie und Messung, Springer, Berlín. Balzer, W. y Moulines, C. U. (eds.) (1996): Srructuralist Theo? of Science, \Valter de Gruyter, Berlín. Balzer, W.; Moulines, C. U. y Sneed, J. D. (1987): An Architectonic for Science. The Structuralist Program, Reidel, Dordrecht. - (eds.) (1998): Structuralist Representation of Knowledge, Rodopi, Amsterdarn. Bar-Hillel, Y. (1968): "Inductive Logic as 'the' Guide of Life", en Lakatos (ed.) (1968), 66-69. Barnes, B. (1985): About Science, Blackwell, Oxford. - (1972): Sociology of Science, Penguin, Middlesex. Bartelborth, T. (1996): "Scientific Explanation". en Balzer y Moulines (eds.) (1996), 23-44. Bayes, T. (1763): "An Essay Towards Solving a Problern in the Doctnne of Chances", Philosophical Transactions ofthe Roya1 Society, vol. 53, 370-418.
Beauchamp, T. y Rosenberg, A. (1981): Hume and rke Problem of Causalir)l,Oxford U.P.,Oxford. Belnap, N. y Steel, J. B. (1976): T l ~ eh g i c of Quesrions and Annuers, Yale U.P., Xew Haven. Berka, K. (1 983): Measurement. Itx Concepts, Theories and Problem, Reidel, Dordrecht. Bemoulli, J. (1713): Ars Conjectandi, Basilea. Beth. E. W. (1949): "Analyse Sémantique des Théones Physiques", Syrttlzese vol. 7, 206-207. - (1960): "Semantics of Physical Theones", Synthese vol. 12, 172-175. Black, M. (1954): Problems of Analysis, Nueva York. Bloor, D. (1 976): Knoirtledge and Social Irnagev, Routledge and Kegan Paul, Londres. Boltzman, L. (1974): Theoretical PI~ysicsand Philosophical Problems: Selecred Wrirings, Reidel, Dordrecht. Boyd, R. (1983): "On the Current Status of the Issue of Scientific Realism", Erkennrnis 19,45-90. Boyd, R.; Gasper, P. y Trout, J. (eds.) (1991): The Philosophy of Science, MIT P., Londres. Braithwaite, R. B. (1953): Scientific Erplanaiion, Cambridge U.P., Cambridge. Bridgman, P. W. (1927): The b g i c of Modern Physics, Macmillan, Nueva York, 1961. - (193 1): Dimensional Analysis, Yale U.P., New Haven. - (1936): The Nature of Physical Theory, Princeton U.P.,Princeton. - (1938): "Operational Analysis", Philosophy of Science 5,114- 131. - (1951~):"The Operational Aspect of Meaning", Sjnrizese 8,251-259. - (1951b):"The Nature of Some of Our Physical Concepts", Brirish Joumal for the Philosoph)~of Science 1,257-272; 2,25-44 y 142-160. Brody, B. (1972): "Towards an Anstotelian Theory of Scientific Explanation", Plzilosophy of Science 39,20-3 l . - (1974): "More on Contirmation and Explanation", Philosophical Studies 26,73-75. Bromberger, S . (1962): "An Approach to Explanation", en Butler (ed.) (1962), Analytical Philosophy. Second Series, Basil Blackwell, Oxford, 72-105. - (1966): "Whyquestions", en Colodny (ed.) (1966), 86-1 11. Brown, H. 1. (1977): Perception, Theory and Commirment. Tlte h'eiv Philosoph)~of Science, Precedent P., Chicago. Brown, J. R. (ed.) (1984): Scienrific Rarionality: The Sociological Tum, Reidel, Dordrecht. Bunge, M. (1973): La ciencia: su mérodo y sufilosofia, Siglo Veinte, Buenos Aires. Campbell, N. (1920): Physics: Tlte Elcmenrs, Cambridge U.P.,Cambridge. Carnap, R. (1928): Der logische Aufbau der IVelr, Weltkreis, Berlín. - (1 934a): The Unity of Science, Routledge and Kegan Paul, Londres. - (1934b): Logische Synrax der Sprache, Spnnger, Viena. - (1936): "Testability and Meaning 1",Philosophy of Science 3,416-471. - (1937): "Testability and hfeaning Ii", Philosophy of Science 4, 1-40. - (1947): "On the Application of Inductive Logic", Philosophy and Pheitomenofogical Researclr 8, 133-147. - (1950): Logical Foundations of Probability, U. Chicago P., Chicago. - (1952): The Conri~tuumof Inductive hfeilíods, U . Chicago P., Chicago. - (1956): "The Methodological Character of Theorerical Terms", en Feigl y Scriven (eds.) (1956). Minnesora Studies in the Philosophy of Scieiice 1, U. Minnesota P., Minneapolis. - (1960): "The Aim of Induciive Logic", en Nagel, Suppes y Tarski (eds.) (1962), Proceedings of the 1960 Internarional Congress for Lugic, hfeihodologg and Philosophy of Science, vol. 1 , Stanford U.P., Stanford, 303-318. (1963): "Intellectual Autobiography", en Schilpp (ed.) (1963), 1-84. - (1966): Philosophical Foundations of Physics, Basic Books, Nueva York.
-
- (1968): "Inductive Logic and Inductive Intuition", en Lakatos (ed.) (1968), 258-267. Carnap, R. y Jeffrey, R. (eds.) (1971): Studies in Inductive L q i c and Probability, U. California P., Berkeley. Cartwri~ht,N. (1983): How the h w s o/ Physics Lie, Clarendon.P., Oxford. - (1989): NafureS Capacities and Their Propensifies, Oxford U.P., Oxford. Chalmers, A. (1976): Whar is this Thing Called Science, Queensland U.P., Brisbane. - (1990): Science and I t s Fabrication, Open U.P..Bristol. Churchland, P. M. (1981): "Eliminative Materialism and Propositional Attitudes", The Journal of Philosophy 78,67-90. - (1984): Matter and Conciousness, MIT P., Cambridpe. Churchland, P. M. y Hooker, C. (eds.) (1985): Images of Science, U. Chicago P., Chicago. Churchman, C. \.V. y Ratoosh, P. (eds.) (1959): Measurement: Defiriitions nrzd Theories, Wiley, NuevaYork. Cohen, L. J. (1989): An Introduction ro the Pltilosophy of Inducrion and Probnbili~,Clarendon P., Oxford. Cohen, L. J. y Hesse, M. (eds.) (1980): Applicntiorts of lnductive Logic, Oxford U.P., Nueva York. Colodny, R. (ed.) (1966): Mind and Cosmos, U.P. of America, Lanham. Craig, W. (1953): "On Axiomatizability within a System", The Jortmal of Syrnbolic Logic 18, 30-32. - (1956): "Replacement of Auxiliary Expressions", Philosopliical Reviav 65, 38-55. Dalla Chiara, M. L. y Toraldo di Francia, G. (1973): "A Logical AnaIysis of Physical Theories", Rivista di Nuovo Cimento 2:3, 1-20. - (1976): "The Logical Dividing Line between Deterministic and Indeterministic Theories", Studia Logica 35, 1-5. Davidson, D. (1970): "Mental Events", en Davidson (1980). Essays on Actions and Events, Oxford U.P., Nueva York, 207-22-1. Diederich, W. (198 1): Str~tkturalistischeRekonstritktioneri, Viewep, Braunschweig. - (1989): "The Development of Structuralisrn", Erkenntrlis 30, 363-386. Díez, J. A. (1989): "La 'Revuelta Historicista' en Filosofía de la Ciencia", Arbor 526, 69-96. - (1992): Metrización y Teoricidad. Una Reconstr~lcciónEstructrtralísta de la Teoría de la Metrización Fitndarnental, Tesis Doctoral, U. Barcelona. - (1993): "Comentario a Fourldations of Measurernerzt, vols. 11 y 111 (D. Krantz, D. Luce, P. Suppes, A. Tversky)", Theoria 19, 163-165. - (1994~):"Measurement Tlieory, procedimientos de medición fundamentales y semántica de conceptos métricos", Agora 13,73-91. - (1994b): "Comentario a The Advancement of Science (P. Kitcher)", Theoria 20,212-216. - (1997~):"A Hundred Years of Numbers. An Historical Introduction to Measurement Theory. Part 1: The Formation Period", Studies in Hisrory and Philosoplzy of Science 28 1, 167-181. - (19976): "A Hundred Years of Numbers. An Historical Introduction to Measurement Theory. Part 11: Suppes and the Mature Theory", Stitdies in Histoq nnd Philosophy of Science 28 2, 237-265. - (1997~):"The Theory-Nct of Interval Measurement Theory", en Ibarra y Mormann (eds.) (1997), Representation of SciertrificRationality. Formal Philosopl~yof Science in Spain, Poznan Studies vol. 6 1, Rodopi, Amsterdam. - (1998): "Descripción. prescripción e interpretación. La polémica entre Popper y Kuhn sobre la falsación y ia ciencia normal", en C. Solís (ed.), Homenaje a I: S. Kuhn (en curso de publicación).
I
Dilworth, C. (1994): Scienri'c Progress, Kluwer, Dordrecht. - (1995): The hfetapkysics of Science, Kluwer, Dordrecht. Dretske, F. (1977): "Laws of Nature", Philosophy ofScience 44,348-268. Dupré, J. (1993): The Disorder of Tl~ings,Harvard U.P., Cambndge. Duhem, P. (1914): La théorieplzjsique. Son object. Sa structure, Chevalier & Riviere, París. Earman, J. (1992): Bayes or But? A Critica1 Examinarion of Bayesian Conjirmarion Theo~y,MIT
P., Carnbridge.
- (1983): Testing Scierziific Theories, U . Minnesota P., Minneapolis.
r
Eberle, R.; Kaplan, D. y hlontague, R. (1961): "Hempel and Oppenheim on Explanation", Philosoplzy of Science 28,418-428. Echevern'a, J. (1989): Inrroducción a la rnetodologia de la ciencia. La filosofía de la cieilcio en el siglo XX,Barcanova, Barcelona. - (1995): Filosofía de la Ciencia, Akal, Madrid. Ellis, B. (1966): Basic Conceprs of Measurement, Cambndpe U.P., Londres. Estany, A. (1990): Modelos de cambio cient$co, Crítica, Barcelona. - (1993): Introduccióií a la Filosofia de la Ciencia, Crítica, Barcelona. Falguera, J. A. (1992): "La noción de modelo en los análisis de la concepción estructural", Agora 11/I, 97-105. Falguera, J. L. (1993): "El enredo de los modelos en los análisis de las ciencias factuales", Agora 12/11. 171-178. Feigl, H. (1958): The "Mental" and the "Pl~ysical",U. hlinnesota P., Minneapolis. - (1970): "The 'Orthodox' View of Theories: Remarks in Defense as Well as Critique", en Feigl (ed.) (1979). Minnesota Studies in the Philosopl~yof Science IV, U. Minnesota P., Minneapolis, 3-16. Fetzer, J. H. (1981): Scieiztific Knoic.ledge. Causarion, Explanation aitd Corroboration, Reidel, Dordrecht. Fetzer, J. H. y Almeder, R. (1993): Glossary of Episten~olog~/Phi[osoplí~~ of Science, Paragon, Nueva York. Feyerabend, P. K. (1963): "How to Be a Good Einpincist", en Baumrin (ed.) (1963), Philosophy of Scieitce. The Delaware Serninar, Interscience P., Nueva York, 3-39. - (1964): "On the Meaning of Scientific Terms", Tize lountal of Philosophy 61; reimpreso en Feyerabend (1481), Realisin, Ratioizalisnz and Scienrific Method, Cambridge U.P. Nueva York, 97-103. - (1965): "Problems of Empiricism", en Colodny (ed.) (1965). Bqond the Edge of Certainy, U.P. of America, Lanham, 145-160. - (1970~):"Against Method", en Radner y Winokur (eds.) (1970), Minizesora Srudies ilí the Philosophy of Scie~iceIV, U . Minnesota P., Minneapolis, 17-30. - (1970b): "Consolations for the Specialist", en Lakatos y Musgrave (eds.) (1970), 385-389. - (1975): Agaiiut Melhod, New Left Books, Londres. - (1981): "An Attempt at a Realistic Interpretation of Expenence", en Feyerabend (1981), Realism, Rationalis~nartd Scietztific hfethod, Cambndge U.P.,Nueva York, 17-36. Finetti, B. de (1937): "La prevision: ses lois logiques, ses sources subjectives", Ann. Inst. H. Poincaré 7, 1-68. - (1970): Tlzeory of Probability, Wiley, Londres, 1974; edición inglesa del original italiano. - (1 972): P~obabili~: Inducrion and Slaristics: Tl~e Art of Guessing, Wiley, Londres. Fisher, R. A. (1956): Staiistical Merlzods and Scientijic Inference, Oliver and Boyd, Londres. Fleck, L. (1935): Enrsrelzung und Bínr~icklungeiner ~sisse~zcltafilichen Tatsaclze, Benno Schwabe, Basilea.
Frege, G. (1 879): Begriffsschrift, Georg Olms,Mildesheirn, 1961. Fodor, J. (1968): Psychological Explanation, Randorn House, Nueva York. - (1 974): "Special Sciences (oc the Disunity o€Science as a Workjng Hypothesis)", Synthese 28, 97-1 16. - (1975): The Language of Thought, Harper & Row, Nueva York. - (199 1): "Hedged Laws and Psychological Explanations", Mind 100, 19-33. Forge,J. (ed.) (1957): Measurement, Realism and Objectivity, Reidel, Dordrecht. Friedman, M. (1974): "Explanation and Scientific Understanding", The Jo~rrnnlof Phifosophy 71, 5-19. García Carpintero, M. (1995): "El funcionalisrno", en Broncano (ed.) (1995), La mente humana, Trotta, Madrid, 43-76. - (1 996): Las palabras, los sign$cados y las cosas, Ariel, Barcelona. Giere, R. (1979): Understanding Scientific Reasoning, Holt, Reinhart and Winston, Nueva York. - (1988): Explaining Science, U. Chicago P.. Chicago. - (1991): Understanding Scientific Reasoning, Holt, Reinhart and Winston, Nueva York; nueva edición, sustancialmente modificada, de Giere (1979). - (1992): Cognitive Models of Science, U . hlinnesota P., hfinneapolis. Glymour, C. (1980): Theory and Evidence, Pnnceton U.P., Princeton. Goodman, N. (1955): Fact, Fiction and Forecast, Harvard U.P., Carnbridge. Greeno, J. G. (1970): "Evaluation of Statistical Hypotheses Using Inforrnation Transmitted", Philosophy of Science 37,279-293. Grice, H. P. (1957): "Meaning", Philosophical Review 66.377-385. Grünbaum, A. (1968): Geomerty and Chronometry in Philosophical Perspective, U . Minnesota P., Minneapolis. Hackett, D. (1970): Historian's Fallacies, Harper and Row, Kueva York. Hacking, 1. (1965): Logic of Statisticnl Itfererice, Carnbridge U.P., Cambndge. - (1975): The Emergente of Probabiliry, Carnbridge U.P., Carnbridge. - (1 983): Representing and Interverting, Czmbridge U.P., Cambridge. Hansson, B. (1974): E.rplanations-Of What?, Stanford (rnirneografía). Hanson, N. R. (1958): Patterns of Discovery, Carnbridge U.P., Carnbridge - (1967): "Observation and Interpretation", en Morgenbesser (ed.) (1967), Philosophy of Scieiice Today, Basic Books, Nueva York, 89-99. - (1971): Obscrvatiot~and Explanation: A Cuide to Pltilosophy of Science, Harper and Row, Londres. Harté, R. (198 1): Great Scientific Experimenrs, Phaidon, Oxford. Helmholtz, H. von. (192 1): Schnfren rur Erkenntnistheorie, Julius Spnnger, Berlín. - (1 930): Corinting and measuring, Van Nostrand, Princeton. Hempel, C. G. (1943): "A Purely Syntactical Definition of Confirmation", The Journal of Symbolic h g i c 8, 127-143. - (1945): "Studies in the Logic of Confirmation", Mind, 54, 1-26 y 97-12 1. - (1949): "Thz Logical Analysis of Psycholo,oy", en Block (ed.) (1980), Readings in Philosophy of Psychology, Harvard U.P., Cambridge, vol. 1. - (1952): Fundamentals of Concept Fomarion in Empirical Science, U. Chicago P., Chicago. - (1958): "The Theoretician's Dilernrna: A Study in the Logic of Theory Construction", en Feigl, Scriven y Maxwell (eds.) (1958), hlinnesota Strrdies in the Philosophy of Science 11, U . Minnesota P., Minneapolis, 37-97. - (1959): "The Logic of Functional Analysis", en Hempel, 1965, cap. XI.
- (1962): "Deductive-Nomological versus Statistical Explanation",
en Feigl y Mwwell (eds.) (1962), Minnesota Studies in tlre Philosophy of Science. 111, U. Minnesota P., Minneapolis,
98-170.
- (1 965): Aspects of Scientific Explanarion and Orfrer Essajs in [/re Pf~ilosopf~y of Science, Free P., Nueva York.
- (1966a): Plrilosophy of Natural Science, Prentice-Hall, N. Jersey. - (1966b): "Recent Problems of Induction", en Colodny (ed.) (1966), 112-134.
- (1967): "Scientific Explanation", en Morgenbesser (ed.) (1967). Philosopi~yof Science Today, Basic Books, Nueva York, 79-88. - (1970): "On the 'Standard Conception' of Scientific Theories", en Radner y Winokur (eds.),
(1970), Minnesota Studies in the Philosophy of Science IV, U . Minnesota P., Minneapolis, 142-163. - (1973): "The Meaning of Theoretical Terms: A Critique of the Standard Empiricist Construal", en Suppes, Henkin, Joja y Moisel (eds.) (1973), Logic, Metlrodology and Plzilosophj~of Science, 4, North Holland, Amsterdam, 367-378. - (1974): "Formulation and Formalization of Theories", en Suppe (ed.) (1974), 244-254. - (1981): "Turns in the Evolution of the Problem of Induction", Sjnlhese 46,389-404. - (1988): "Provisoes: A Problem Conceming the Inferential Function of Scientific Theories", Erkenntizis 28, 147-164. Hempel, C. G. y Oppenheim, P. (1948): "Studies in the Logic of Explanation", Philosophy of Science 15,567-579. Hesse, M. (1966): Models and Analogies irt Science, U . Notre Danie P., Notre Dame. Hintikka, J. (1965): "On a Combined System of Inductive Logic", Acta Philosophica Fennica, XVIII, 21-30. - (1966): "A Two-Dimensional Continuum of Inductive Methods", en Hintikka y Suppes (eds.) (1966), Aspecrs of Inducrive Logic, Reidel, Dordrecht, 113-132. - (1968): "Induction by enumeration and induction by elimination", en Lakatos (ed.) (1968), 191-216. Hooker, C. (ed.) (1978): Physical Theories as Logico-Operational Srructures, Reidel, Dordrecht. Howson, C. y Urbach, P. (1989): Scienrific Reasoning. TIre Bajesiun Approach, Open Court, La Salle. Hume, D. (1 748): An Enquiry Cortcen~ingHuman Utrderstandiiig;tr. esp. de F. Duque, Ed. Nacional, Madrid, 1977. Humphreys, P. (1981):"'Aleatory Explanation", Sjizthese 38,437-472. - (1983): "Aleatory Explanation Expanded", en Asquith y NickJes (eds.) (1983), PSA 1982, Philosophy of Science Association, East Lansing, vol. 2,208-223. - (1989): The Chances of Explanarion, Princeton U.P., Princeton. Ibarra, A. y Mormann, T. (1992): "L'explication en tant que gĂŠniralisation thĂŠorique", Dialectica 46, 151-168. - (1997): "Theones as Representations", en Ibarra y hformann (eds.) (1997), Represertratior~of Scientific Rarionaliv. Formal Pltilosoplzy of Science it1 Spain, Poznan Studies vol. 61, Rodopi, Amsterdam. Jeffrey, R. (1965): The Logic of Decision, hfcGraw-Hill, Nueva York. - (1969): "Statistical Explanation vs. Statistical Inference", en Rescher (ed.) (1969), Essays in Honor of CarL C.Hempel, Reidel, Dordrecht, 104-113. - (1980): Studies in hlductive Logic artd Probabili~,U. California P., Berkeley. Jeffreys, H. (1957): Sciertrific Injereilce, Cambridge U.P., Cambridge.,
Johnson-Laird, P. N. (1983): Mental Models. Harvard U.P., Cambridge. Kant, 1. (1781-1787): Kritik der reinen Verniinft; tr. esp. de P. Ribas, Alfaguara, Madrid, 1978. - (1802): O p ~ P'sf~Ămrtm; s ir. esp. de E Duque, Ed. Nacional, Madrid, 1983. Kaplan, D. (1961): "Explanation Revisited", Philosophy of Science 28,428-436. Kerneny, J . (1955): "Fair Bets and Inductive Logic", The Jorirnal ofSymbofic Logic 20,263-273. - (1963): "Camap's Theory of Probabilily and Induction", en Schilpp (ed.) (1963). 71 1-738. Kemeny, J. y Oppenheim, P. (1956): "On Reduction", Philosphicnl Studies 7,6-19. Keynes, J. M. (1921):A Trearise on Probabiliv, Macrnillan, Londres. Kim, J. (1963): "On the Logical Conditions of Deductive Explanation", Philosophy of Scicnce 30, 286-29 1. - (1984): "Concepts of Supervenience", Philosophy and Phenonienological Researclt 45. 153-176. - (1987): ''Explanatory Realism, Causal Realism and Explanatory Exlusion", en French, Vehlinp y Wettsteln (eds.) (198S), Midivest Stridier in Philosoplly, 12, U . Minnesota P., Minneapolis, 225-239. - (1993): S~iperveniertceand Mirld, Cambridze U.P., Nueva York. - (1996): Philosophy of Psychology, tvestview P., Colorado. Kitcher, P. (1976): "Explanation, Conjunction and Unification", The Jolrrnal of Philosophy 73, 207-2 12. - (1 98 1): "Explanatory Unification", Plzilosophy of Science 48, 507-53 1 . - (1987): "Van Fraassen on Explanation", The Journal of Phiiosophy 84,3 15-330. - (1989): "Explanatory Unification and the Causal Structure of the World, en Kitcher y Salmon (eds.) (1989), 410-506. - (1993): The Advancemenr of Science. Science tbirhour Legend, Objectivity bvithout Illusions, Oxford U.P.,Oxford. Kitcher, P. y Salmon, W. (1987): "Van Fraassen on Explanation", The Joirrnal of Philosophy 84, 3 15-330. - (eds.) (1989): Scientific Ezcplanation, U. hIinnesota P., Minnsapolis. Kneale, \.V. (1949): Probability and lndrtctiori, Clarendon P., Oxford. - (1950): "Natural Laws and Contrary-to-fact Conditionals", Arznlysis 10. Knowles, D. (ed.) (1990): Expfat:ation and 1ts Limits. Cambridgz U.P., Carnbridge. Knorr-Cetina, K. (198 1): The iCfotirrfcicture of Kriowledge, Pergamon, Oxford. - et al. (eds.) (1980): The Social Process of Scientific Itzvestignriorz, Reidel, Dordrecht. - y Mulkay, IvI. (eds.) (1983): Science Observed: Per-spectiies on the Social Study of Science, Sage, Hollywood. Kolmogorov, A. N. (1950): Fo~rndarioiuof the Theory ofprobability, Chelsea, Nueva York. Krantz, D.; Luce, D.; Suppes, P. y Tverski, A. (1971): Forindotions of Mensurement 1, Academic P., Nueva York. Kuhn, T. S. (1961): "The Function of Measurement in Modern Physics", Isis 52, 161-190. - (1962-1970): The Strrtcture of Scieritific Rei.701utions,U. Chicago P., Chicago (1." ed. de 1962; 2." ed., incluyendo el Postscripturn, de 1970). - (1970n): "Logic of Discovery or Psychology of Research'?", en Lakatos y Musgrave (eds.) (1970), 1-24. - (1970b): "Reflections on Ivly Cntics", en Lakatos y hlusgrave (eds.) (1970), 23 1-278. - (1970~): Second Thoughts on Porndigms, U.Illinois P., Urbana. - (1975): "Theory Change as Structure Change", Erkenntnis 10, 179-300. - (1977): The Esserttial Tension, U . Chicago P.. Chicago. - (198 1): IVlzat Are Scientific Rei.olrrrions?, hfIT P., Cambridge.
Kuipers, T. (1978): Studies in /rrdrrcrii,e Probabilig and Rafio~ialE~pectarion,Reidel, 3ordrecht. Kuipers, T. y Mackor, A. (eds.) (1995): Cognitive Partenrs i ~ Science i and Cornnlort Sense, Rodopi, Amsterdam. Kyburg, H. (1970): Probability alid Iildirctive Logic, hlacmillan, Londres. - (1974): The Logical Foundarions of Srarisrical hgererice, Reidel, Dordrecht. - (1 983): Epistemology and Inference, U . Minnesota P., Minneapolis. Kyburg, H. y Nagel, E. (eds.) (1963): Itiduction: Some Currenr Issires, Wesleyan U.P.,Middletown. Kyburg, H. y Smokler, H. (eds.) (1961): Srudies in Subjective Probabiliq, Wiley, Nueva York. hkatos, 1. (1968~):"Changes in the Problem of Inductive Logic", en Lakatos (ed.) (1 968), 3 15-417. - (1 968b): "Cnticism and the Methodology of Scientific Research Progammes", Proceedi~lgsof he Arisroteliatt Sociefy, 69, 149-186. - (1970): "Falsification and the Methodology of Scientific Research Programmes", en Lakatos y Musgrave (eds.) (1970), 91- 196. - (1971): "History of Science and its Rational Reconstructions", en Buck y Cohen (eds.) (1971), PSA 1970, Philosophy of Science Association, East Lansipn, 91-135. - (1974~):"Popper on Demarcation and Induction", en Schilpp (ed.) (1974), 241-273. - (19743): "The Role of Crucial Experiments in Science", St~idiesNz rlre Hisroiy aild Pltilosopl~y of Science 4, 309-325. - (1977): Tlze Methodology of Scientific ResearcA Programnies. Pltilosophical Papers, 1, Cambridge U.P., Cambridge. - (1968): Tlre Problein of htductiiye Logic, North Holland, Amsterdam. Lakatos, 1. y Musgrave, A. (eds.) (1970): Criricisni and rhe Groivih of K~~owledge, Cambridge U.P., Cambridge. Laplace, P. S. de (1795): Essai philosophiqire sur les probabilirés. V. Courcier, París. Latour, B. (1987): Science iiz Action, Hanlard U.P., Cambridge. Latour, B. y Woolgar, S. (1979): Luboraroiy Life: The Socia1 Construcrion of Scienrijic Facrs, Sage, Hollywood. Laudan, L. (1977): Progress alid Its Proble17zs,U . California P., Berkeley - (1981): Scieilce a ~ t dHypothesis, Reidel, Dordrecht. - (1984): Scier~ceaild Values, U . California P., Berkeley. - (1990): Sciei~cea ~ t dRelatiiis~tt,U . Chicago P., Chicago. Leplin, J. (ed.) (1984): Scientifíc Realisin, U. California P., Berkeley. Lewis, D. (1 969): Corzi~entiort,Harvard U.P., Cambridse. - (1 970): "HOWto Define Theoretical Terms", en Lewis (1983), Philosophical Papers 1, Oxford , U.P., O ~ f o i d78-95. - (1972): "Psychofisical and Theoretical Identifications", Australasian Journal of Philosophy 50, 249-258. - (1973~):"Causation", en Lewis (1986), Pliilosophical Papers 11, Oxford U.P., Oxford, 159-213. - (1973b): Coui7re1facfuals.Harvard U.P., Cambridge. - (1983): "New Work for a Theory of L?ni\lersals", Ausrralasiarl Journal of Philosophy 61, 343-377. - (1 986): "Causal Explanation", en Lewis (1 986), Pl~ilosophicalPapers 11, Oxford U.P., Oxford, 2 14-240. Lipton, P. (1991): I~lference10 rhe Besr Explatrarion, Routledge and Kegan Paul, Londres. - (ed.) (1995): Tlreoty, Evidence a12d Explanarion, Darrnounth, Aldershot. Hunratl U~rderstandiitg;tr. esp. de E. García, Ed. Nacional, Locke, J. (1690): An Essay Co~~cerning Madrid, 1980.
Losee, J. (1 972): An His~oricalIntroduction to the Pliilosoplty of Science, Clarendon, Oxford. Luce, D. y Raiffa, H. (1957): Games and Decisions, Wiley, XuevaYork. Luce, D.; Krantz, D.; Suppes, P. y Tversky. A. (1990): Forcndarions of Measurernenr 3, Academic P.,
Nueva York. Mackie, J. L. (1966): "The Direction of Causation", Philosophicnl Review 75,441-466. ( 1 974): The Cement of h e Universe: A Strrdy of Cau~atio~t, Ox ford U.P,Ox ford. Masterman, M. (1970): 'The Nature of Paradigm", en Lakatos y Musgrave (eds.) (1970), 59-89. Maxwell. C.(1961): "The Ontological Status of Theoretical Entities", en Feigl y Maxwell (eds.) (1962), Minnesota Studies in the Philosophy of Science 111, U. Minnesota P., Minneapolis, 3-27. Mayr, R. (199 1): Principles of Systematic Zoology, McGraw-Hill, Nueva York. McKinsey, J.; Sugar, A. y Suppes, P. (1953): "Axiomatic Foundations of Classical Particle Mechanics", Journnl of Rational Mechanics nnd Annlysis 2,253-272. McKinsey, J. y Suppes, P. (1953): "Transformations of Systzrns of Classical Mechanics", Jo~rrnalof Rational Mechanic and Analysis 2,273-289. - (1955): "On the Notion of Invariance in Classical Mechanics", British Jortrnal for the Philosophy of Science 5,290-302. McLaughlin, B. P. (1984): "Type Dualism, Type Epiphenomenalism and the Causal Priority of the Physical", Philosophical Perspectives 3, 109-135. Mellor, D. (1 97 1): The matter of chance, Cambridge U.P., Cambridge. Merton, R. (1973): The Sociology of Science, Free P., Nueva York. Michelson, A. (1881): "The Relative Motion of the earth and the luminiferous ether", Americatt Journal of Science, 3rd. Ser. 22. Mill, J. S. (1904): A System of b g i c : Raciocinative a~tdIndllctive, Longmans, Londres. Mises, R. von (1957): Probabilis; Stntistics nnd T r ~ ~ tMacmillan, h, Nueva York; edición inglesa del original alemán de 1928. Mormann, T. (1996): "Categorial Structuralism", en Balzer y &Ioulines(eds.) (1996), 265-286. Mosten'n, J. (1978): "La estructura de los conceptos científicos", en Conceptos y Teorías ett la Ciencia, Alianza, Madrid, 11-40. Moulines, C. U. (1973): Ln Estructura del Mundo Sensible. Sistemas Fenomenalistas, Ariel, Barcelona. - (1975): "A Logical Reconstruction of Simple Eq~iilibriurnThermodynamics", Erkenntnis 9, 101-130. - (1979): "Theory-Nets and the Evolution of Theories: The Example of Newtonian Mechanics", Synthese 4 1,417-439. - (1980): "Intertheoretic Approximation: The Kepler-Newton Case", Synthese 45, 387-412. - (1982): Exploraciones MetacientSficas, Alianza Editorial, Madrid. - (198.5~):"Theoretical Terms and Bridge Principles", Erkentttnis 22, 97-1 17. - (1985b): "Tipología Axiomática de Teorías Científicas", Crítica 17.4 1-67. - (1991): Ph~ralidndy Recursión. Estudios Epistemológicos, Alianza, Madrid. Moulines, C. U. y Díez, J. A. (1994): "Theones as Nets: Combinatorial Measurement Theory", en P. Humphreys (ed.) (1984), Pntrick Suppes, Mntl~emnticalPhilosopher, Kluwer Ac. P., Dordrecht, 275-297. Mulkay, M. J. (1985): Science nnd the Sociology of Knorrledge, Allen and Unwin, Londres. Mundy, B. (1986): "On thc General Theory of Meaningful Reprcsentation", Synthese 67,39 1-437. Musgrave, A. (1973): "Falsification and Its Critics". en Suppes (ed.) (1973). Proceedings of the 1971 Buchnrest International Congress for Logic, Philosophy nnd Methodology of Sciencr. Elsevier, Amsterdam.
-
Nagel, E. (196 1 ): The Structure of Science, Harcourt, Nueva York. Nagel, E.; Suppes, P. y Tarski, A. (eds.) (1962): Logic, Merhodology and Philosophy of Science: Proceedings of tke 1960 International Congress, Stanford U.P., Stanford. - (1966): Logic, Methodology and Philosophy of Science: Proceedings of rhe 1964 Inrernarional Congress, North Holland, Amsterdam. Narens, L. (1985): Abstract Measurement Tl~eory,M U P., Carnbridge. Newton, 1. (1687): Philosophiae Naruralis Principia Afathematica; tr. esp. de A. Escohotado, Ed. Nacional, Madrid, 1982. Neumann, J. von y Morgenstem, 0. (1944): Theory of Games and Economic Behaiyior, Princeton U.P., Princeton. Neyman, J. y Pearson, E. (1967): Joirlr Statistical Papers, U. Califomia P., Berkeley. Nicod, J. (1930): Foundarions of Geometv and Induction, Harcourt, Nueva York. Niiniluoto, 1. (1977): "On the Tmthlikeness of Generalizations", en Butts y Hintikka (eds.) (1977), Basic Problerns in Methodology aitd Linguisrics, Reidel, Dordrecht. - (1982): "What Shall we Do with Vensimilitude?', Philosophy of Sciertce 49, 181-197. - (1984): Is Sciertce Progressive?, Reidel, Dordrecht. - (1987): Truthlikeness, Reidel, Dordrecht. Oppenheim, P. y Putnam, H. (1958): "Unity of Science as a Working Hypothesis", en Feigl, Scriven y Maxwell (eds.) (1958). Minitesota Studies in thc Philosophy of Science II, U. Minnesota P., Minneapolis, 3-36. Palacios, J. (1956): Análisis Dimensional, Espasa Calpe, Madrid. Peirce, C. S. (1931-1958): Collected Papers, Harvard U.P., Cambridge. Pitt, J. (ed.) (1988): Theories of Explanatioit, Oxford U.P., Oxford. Poincaré, H. (1902): La science et 1'hypotlr2se, Alcan, París. - (1908): Science et rnéthode, París. Pollock, J. (1990): Nomic Probabiliy and rhe Justifica~ionof htduction, Oxford U.P., Nueva York. Popper, K. R. (1935-1958): The Logic of Scie~ttificDiscove~p,Hutchinson, Londres (ed. inglesa revisada de 1958 del original alemán de 1935). - (1956): "The Propensity Interpretation of Probability", 31-iris11Journal for the Philosophy of Science 10,2542, - (1956-1983): Realism and he Airn of Science, Hutchinson, Londres. - (1963): Conjectures and Refutations, Routledge and Kegan Paul, Londres. - (1970): "Normai Science and Its Dangers", en Lakatos y Musgrave (eds.) (1970), 5 1-58. - (1972): Objective Knowledge, Clarendon P., Oxford. - (1974~):"Unended Quest: An Intellectual Autobiography", en Schilpp (ed.) (1974), 3-181. - (1974b): "Replies to My Cntics", en Schilpp (ed.) (1974), 961-1 197. Przelecki, M. (1969): The Logic of Empirical Theories, Routledge & Kegan Paul, Londres. Putnam, H. (1962): "What Theories Are Not", en Nagel, Suppes y Tarski (eds.) (1962), 240-25 1. - (1963): "Brains and Behavior", en Putnam (1975), Philosopliical Papers vol. 2, Cambridge U.P., Carnbridge, 325-331. - (1967): "The Nature of Mental States", en Putnarn (1975),Philosophical Papers vol. 2, Carnbridge U.P., Cambndge, 429-440. - (1975): "The Meaning of 'Meaning"', en Putnam (1975), Pltilosophical Papers vol. 2, Cambridge, U.P., Carnbridge, 21 5-271. - (1978): Meaning a ~ urhe l Moral Sciences, Routledge and Keagan Paul, Londres. - (1980): "Models and Reality", Tlte Joirrnal of Syrnbolic Logic 45, 464-482. - (1981): Reason, h r l z and Hisfory, Carnbridge U.P., Cambridge.
- (1983): Realism and Reason. Philosophical Pcipers, vol. 3 ,Cambridge U.P.. Cambndge. - (1987): ManyFaces of Realisrn, Open Coun, La Salle.
- (1 958): Representarion and Realir).,MIT P., Carnbridge. cap. 11. ( 1 953): From a Logical Point of Kew, Harper and Rowe, Nueva York.
Quine, W. 0. (1951): "Two Dogmas of Empiricism", en Quine (1953), -
- (1960): Word and Object, MIT P., Carnbridge. - (1975): "On Empirically Equivalent Systems of the World", Erkenntnis 9,313-328. - (1 991): "Two Dogmas Retrospect", Journal of Philosophy 2 1, 265-274.
Railton, P. (1978): "A Deductive-Nomolopical Model for Probabilistic Explanation", Philosophy of Science 45,206-226. - (1980): Explaining Explanation, Tesis doctoral, Princeton. Rarnsey, F. (1926): "Truth and Probability", en Rarnsey (1931), 52-94. - (1938): "Reasonable Degree of Belief'. en Ramsey (193 1). 97-102. - (1929): "Theories", en Ramsey (193 l), 1 12-136. - (193 1): The Foundations of Mathernatics, Routledge and Kegan Paul, Londres. Reichenbach, H. (1928): The Philosophy of Space and Time, Dover, Nueva York, 1958. - (1935): The Theory of Probability, U . California P., Berkelzy, 1949. - (1938): Experience and Prediction, U . Chicago P., Chicago. - (1959): Modern Philosophy of Science, Humanities P., Nueva York. Rescher, N. (ed.) (1969): Essays in Honor of Carl G. Hernpel, Reidel, Dordrecht. Resnik, M. (1987): CIloices, U. hlinnesota P., Minneapolis. Rivadulla, A. (1991): Probabilidad e Inferencia Cientflca, Anthropos, Barcelona. Ruben, D. (1990): Explaining Elrplanation, Routledge and Kegan Paul, Nueva York. - (1993): Explanation, Oxford U.P., Oxford. Russell, B. (1938): Hiimari Kno,cledge. Its Scope and Limits, Allen & Unwin, Londres. Ryle, C.(1949): The Concept of Mind, Bames & Noble, Nueva York. - (1956), Dilemmas, Cambndge U.P., Carnbridge. Salmon, \.V. (1966): "The Foundations of Scientific Inference", en Colodny (ed.) (1966), 135-275. - (1967): The Foundations of Scientijic Inference, Pittsburgh U.P., Pittsburgh. - (1970): "Statistical Explanation", en Colodny (ed.) (1970), The Nnture and Function of Scienrific Theories, U. Pittsburgh P., Pittsburgh, 173-231. - (197 1): Statisticnl E.rplanation nnd Statistical Relevance, U . Pittsburgh P., Pittsburgh. - (1977): "Hernpel's Conception of Inducti~eInference in Inductive-Statistical Explanations", Philosophy of Science 44, 1SO- 185. - (1978): "Why ask 'Why"', Proceedings and Addresses ofthe American Philosophical Associarion, 5 1,683-705. - (1980): "Probabilistic Causality", Pacific Philosophical Quarterly 6 1, 50-74. - (1984): Scientific Explanation and the Causal Structure of the World, Princeton U.P., Princeton. - (1989): "Four Decades of Scicntific Explanation", en Kitcher y Salmon (eds.) (1989), 3-219; publicado como libro en U. Minnesota P., hlinneapolis, 1990. Salrnon, 1 ' .et al. (1992): lntroduction to Philosophy of Science, Prentice Hall, Englewood. Savage, L. J. (1954): The Foundntions of Statisrics, Wiley, Nueva York. Savellos, E. y Yalcin, U. (eds.) (1995): Supemenience. Nerv Essays, Carnbridge U.P., Carnbridge. Schiffer, S. (1991): "Ceteris Paribus Laws", Alind 100, 1-17. Schilpp, P. A. (ed.) (1963): The Plzilosophy of Rudolf Camap, Open Court, La Salle. - (1974): The Philosophy ofKarl Popper, Open Court. La Salle. Scriven, M. (1959): "Explanation and Prediction in Evolutionary Theory", Science, 30,477-482.
- (1962): "Explanations, Predictions and Laws", en Pitt (ed.) (1988), 5 1-74. Sellars, W. (1 963): Scierrce, Percepriorl and Realiv, Routledge and Kegan Paul, Londres.
- (1967): Science and Merapkysics, Routledge and Kegan Paul, Londres. Shapere, D. (1965): "The Problem of Theoretical Terms", en Shapere (ed.) (1965), "Introduction".
- (ed.) (1 965): Philosophical Problerns of Narural Science, Macmillan, Londres.
Sintonen, M. (1989): "In Search of the Rationale", en Kitcher y Salmon (eds.) (1989), 220-252. SAyrms, B. (1966): Choice and Cltance, Wadswonh, Belmont. Smart, J. J. C. (1959): "Sensations and Brain Proceses". Philosopliical Review 68, 141-156. - (1964): Berween Science and Philosophy. An Introducrion to rhe Philosoplzy of Science, Random House, Nueva York. Sneed, J. D. (197 1): The Logical Srructure of Matltemarical Physics, Reidel, Dordrecht; segunda edición revisada de 1979. Sosa, E. y Tooley, M. (eds.) (1 993): Causarion, Oxford U.P.,Oxford. Stegmüller, W. (1970): Theorie und Erfahrung, Springer, Heidelberg. - (1973): Theorienstrukturenund Theoriendynamik, Springer, Heidelberg. - (1979): The Srructuralist Weiv of Theories, Spnnger, Berlín. Stevens, S. S . (1946): "On the Theory of Scales of Measurement", Science 103, 667-680. - (195 1): "Mathematics, Measurement and Psychophysics", en Stevens (ed.) (195 1), Harrdbook of Experimental Psychology, Wilwy, Nueva York, 1-49. - (1957): "On the Psychophysical Law",Ps),clzological Review 64, 153-181. - (1959): "Measurement, Psychophysics and Utility", en Churchman y Ratoosh (eds.) (1959), 18-63. Strawson, P. (1952): Inrroducrion to Lugical Theory, hlethuen, Londres. Suppe, F. (1967): The Meaning and Use of Models in Mathematics and rhe Exacr Scieitces, Tesis doctoral, Michigan. - (1972): "What is Wrong with the Received View on [he Structure of Scientific Theories?", Philosophy of Scier7ce 39, 1-1 9. - (1974): "The Search for Philosophical Understanding of Scientific Theories", en Suppe (ed.) (1974), 1-241. - (ed.) (1974): The Strucrure of Scientific Theories, U. Illinois P., Urbana. - (1989): The Seinanric Concepfionof Theories and Scientific Realism, U. nlinois P., Urbana. Suppes, P. (1954): "Some Remarks on Problems and Methods in the Philosophy of Science", Philosophy of Science 21,242-248. - (1957): Inrroductioiz ro Logic, Van Nostrand, Nueva York. - (1960): "A Comparison of the Meaning and Use of Models in Mathematics and the Empincal Sciences", Syrzthese 12, 287-301. - (1962): "Models of Data", en Nagel, Suppes y Tarski (eds.) (1962), 252-261. - (1967): "What is a Scientific Theory?", en Morgenbesser (eds.) (1967), Philosophy of Science Toda)?,,Basic Books, Nueva York, 55-67. - (1970a): A Probabilisric Theory of Causaliry,North Holland, Amsterdam. - (1970b): Set-Theoretical Strucrures in Science, Stanford University, Stanford. - (1974~):"The Structure of Theories and the Analysis of Data", en Suppe (ed.) (1974), 266-283. - (1974b): "The Axiomatic Method in the Empirical Sciences", en Henkin (ed.) (1974), Proceedings of tlre Tarski Syntposium, Amencan Mathematical Society, Providence, 465-479. - (1979): "The Role of Formal hlethods in the Philosophy of Science", en Asquith y Kyburg (eds.) (1979), Curreizt Research in Pllilosophy of Science, Philosophy of Science Association, East Lansing, 16-27.
- ( 1 983): Probabilistic Metaphjsics, B lackwell, Ox ford. (1989): "Representation Theory and the Analysis oF Structure", Philosophia Nalliralis 25, 254268. - (1993): Models and Methods in the Philosophy o/ Science: Selecterl Essnys, Kluwer, Dordrecht. Suppes, P. y Estes, W. (1959): "Foundations of Linear Models", en Bush y Estes (eds.) (1959), Studies in Mathemarical Learninp T h e o ~Stanford , U.P., Stanford, 400-4 14. Suppes, P.; Krantz, D.; Luce, D. y Tversky, A. (1989): Folrndatiorls of Measlrrement 11, Academic P., Nueva York. Thagard, P. (1988): Computational Philosophy of Science, hIIT P., Carnbridge. Tooley, M. (1977): "The Nature of Laws", Canadian Journal of Philosophp 7, 667-698. - (1989): Causation: A Realistic Approach, Clarendon P., Oxford. Torretti, R. (1990): Creative Understanding, U. Chicago P., Chicago. Toulmin, S. (1961): An Inquiy into the Aims of Science, Indidna U.P., Bloornington. - (1970): Human Undersranding J, Princeton U.P., Princeton. Van Fraassen, B. (1970): "On [he Extension of Beth's Semantics of Physical Theories", Philosophp of Science 37,325-339. - (1972): "A Formal Approach to [he Philosophy of Science", en Colodny (ed.) (1972), Pnrndigms and Paradoxes, U . Pittsburgh P., Pittsburgh, 303-366. - (1 977): "The Pragmatics of Explanation", Americatz Philosophical QrĂarterly 14, 1 143-1 150. - (1980): The Scientific Jmage. Clarendon P., Oxford. - (1985): "Salrnon on Explanation", The Jo~trnalof Philosophy 82,639-65 1. - (1989): Lnws and Sjmetn, Clarendon P., Oxford. Venn, J. (1886): Tlze Logic of Chance, Londres. Von Wright, G. H. (1951): A Teatise on Inductio~land Probnbili~,Rotledge and Kegan Paul, Londres. - (1957): The Logical Problem of Inditction, hlacmillan, Nueva York. Watkins, J. (1968): "Non-Inductive Corroboration", en Lakaros (ed.) (196S), 61-66. Whewell, W. (1 847): Philosopb of the Indiicrire Scietices, Parker, Londres. - (1 858): Novum Otganum Renor'nt~Ăni,Parker, Londres. - (1989): Theory of Scientific Itfetl~od,Hackett, Indianapolis. Whitehead, A. N. y Russell, B. (1910): Principia Marhemarica, Carnbridge U.P., Carnbridge. Wittgenstein, L. (1931): Tracratus Logico-Philosophic~rs,Routledge and Kegan Paul, Londres, 1961. - (1958): Philosophische Bemerklargen, Blackwell, Oxford. Wojcicky, R. (1977): "Towards a General Semantic of Empincal Theories", en Butts (ed.) (1977), Historicnl and Philosophical Dimensions of Logic, Merhodology nnd Philosophy of Science, Reidel, Dordrecht, 3 1-39. - (1979): Topics in the Formal Methodology of Ernpirical Science, Reidel, Dordrecht. Wright, L. (1973): "Function", Philosophical Revierv 22, 139-168. - (1976): Teleological Explanations. U. California P., Berkeley. -
Achinstein, P., 247, 301, 305 Adams, E., 33, 67, 328, 334, 337, 338, 339, 340,341,343.350,351,357 Apolonio, 63.64. 8 1,82,444 Aristóteles, 26, 27,45, 63, 129,222, 224 Arrnstrong, D., 128, 15 1, 166, 17 1 Arquírnedes, 27,63,73 Austin, J. L., 147 Ayer, A. J., 168 Bacon, F., 27, 395 Baliani, 65 Balzer, LV., 214, 327, 350, 365, 379, 4-49, 452n, 46 1 Bar-Hillel, Y., 410 Barnes, B., 11 Bartelborth, T., 261 Bayes, T., 162,405.406 Beauchamp, T., 143 Belnap, N., 247 Berka, K., 180 Berkeley, G., 28 Bemoulli, J., 162 Beth, E. W., 342 Birkhoff, G., 346 Black, M., 403 Bloor, D., 11 Bohr, N., 319,321,323 Borges, J. L., 102 Boyle, R., 18 1,233,234,256 Brahe, T., 64, 65, 8 1 , 85, 85, 89, 18 1, 153, 303 Braithwaite, R. B., 164.287,296,403
Bridgrnan, P. W. 115,202, 287,290 Brody, B., 25 1 Brornberger, S., 247 Brown, H. I., 27 Calipo, 63 CarnpbeII, N., 30,224,287, 290 Cantor, G., 280 Carnap, R., 30, 160, 161, 287, 288, 290, 294, 295n, 296,300,301,302,394,402,404,407, 408, 409, 410, 411, 413, 414, 415, 416, 417, 418,419,427,428,431 Cartwrighr, N., 156, 166, 177 Cassirer, E., 29 Celsius, O., 117, 1 18 Churchland, P. M., 390 Cohen, L. J., 394 Comte, A., 29 64, 8 1, 89, 3 12 Copímico, N,, Coulomb, Ch., 155 Craig, W., 298 Crick, F. H., 69, 348 D'Alernbert, J., 28 Dalla Chiara, M. L., 33,327, 341 Darwin, Ch., 3 12 Davidson, D., 390 Dedekind, R., 279 Descartes, R., 28,390 Diderot. D.. 28 ~ í e zJ,. ' A . , '87, ~ 192, 258,433 Dretske, F.. 171 Duhem, P., 79,301,302, 368
Eberle, R., 330 Eccles, 390 Echevem'a, J., 27, 395 Ehrenhaft, 83,183 Einstein, A., 71, 73,77, 82, 164, 183,312 Ellis, B., 195 Estes, W., 341 Euclides, 27 Eudoxo, 63 Fahrenheit, 117, 118 Falguera, J. L., 283 Feigl, H., 30, 256, 385 Fetzer, J. H., 165 Feyerabend, P. K., 31, 32, 303, 309, 31 8, 431, 432,457 Finetti, B. de, 162,404 Fisher, R. A., 404 Fitzgerald, G. F., 69 Fleck, L., 31,311 Fodor, J., 133, 152,384,388,389 Foucault, J. B., 68, 88 Francia, T. di, 33,327,341 Franklin, R., 69 Frege, G., 30,92,281,282,287 Fresnel, A., 68 Fnedman, M., 256,258
Galileo, 65, 136, 139, 149, 154, 155, 181, 233, 255,256,303,323 García-Carpintero,M., 384 Gibbs, J., 449 Giere, R., 33, 62, 77, 327, 333, 341, 347, 348, 349,437 Glymour, C., 394 Goodman, N., 30,142, 168,399,400,401,437 Greeno, J. G., 243 Grice, H. P., 21 Hackett, D., 45 Hacking, I., 165, 177 Halley, E., 66,71, 72,74, 85 Hamilton, W., 379 Hanson, N. R., 300,302,303,309,431 Hansson, B., 247
Hegel, G. JV., 29 Helmhoitz, H. von, 29,208 Hempel, C. G., 30, 59, 62, 73, 74, 75, 88, 100, 137, 167, 168, 180, 214, 222, 223, 223, 225, 276, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 240, 241, 232, 245, 246, 217, 250, 251, 255, 256, 259, 261,262, 263, 287, 290, 293, 300, 301, 305, 316, 331, 355, 383,398,399,399n,400,401,408,409,410 Heráclides de Ponto, 64 Herschel, J., 30 Hertz, H., 30 Hess, H., 70 Hesse, M., 29211,394 Hilbert, O., 30,288 Hintikka, J., 1 60,4 10,4 17 Hiparco, 63,444 Hooke, R., 156,181 Ho\ilson,C., 404 Hume, D., 28, 167, 172, 255, 397, 407,415,421 Humphreys, P., 246,25 1,253,255 Huygens, Ch., 68
Jeffrey, R., 243,246,404 Jeffreys, H., 160,394 Jevons, W. S., 30 Johnson-Lair, P. N., 11 Kant, I., 28, 29, 91, 403 Kaplan, D., 230 Kelvin, \V. T., 117 Kemeny, J., 375,410 Kepler, J., 27, 89, 136, 137, 139, 110, 149, 154, 155,181, 183,233,234,256,303,374,450 Kegnes, J. M., 160,404,4 19 Kim, J., 230, 25?n, 388, 390 Kitcher, P., 169, 170, 223, 250, 256, 257, 258, 259,260,261 Kneale, \V., 394 Knorr-Cetina, K., 11 Kolmogorov, A. N., 160 Krantz, D., 196, 199, 202,215 Kuhn,T. S., 20,31, 32, 177, 181, 183, 184, 304, 305, 309, 310, 311, 312, 313, 314, 315, 316,
3 17, 3 18. 320, 32 1, 323, 321, 350, 35 1. 357, 360, 361, 363,431, 432,433.434, 435.436, 437, 441, 4-42, 443, 444, 446, 450, 451. 455, 456,457,458,429,460 Kuipers, T., 410,417 Kyburg, H., 162,394.404
Mosterín, E., J., 1 SO Moulines, C. U., 192,314, 327, 350,358,360, 365,379, 430,439,452n, 461 Mulkay,.M. J., I I Musgrave, A., 4 19
Nagel, E., 30, 32, 137, 263, 264, 287, 290, 29211,300,301,375,394 Lagrange, J. L., 320,378,379 Lakatos, I., 20, 31, 32. 304, 305, 309, 310, 318, Neiirnann, J. von, 316,437 319, 320, 321, 322, 324, 350, 351, 357, 360, Neurath, O., 30, 302 363, 394, 416, 418, 430, 431, 432, 433, 434, Newton, I., 28, 65, 137, 140, 145, 155, 182, 256, 312, 320, 373, 336, 340, 361, 374, 375, 435,436,44 1,442,443,455,456 378,378,379,435,441,439 Laplace, P. S. de, 162, 183,435,449 Neyman, J., 404 Latour, B., 11 Nicod, J., 395, 399,400, 408,409 Laudan, L., 309, 310, 320, 321, 332, 323, 324, Niiniluoto, I., 419, 426 441,413 Lavoisier, A., 66, 82,420,450,457 Leibniz, G. W., 390 Ohm, G., 201,233,301 Leverrier, V. J., 67 Oppenheim, P., 137, 222, 224, 227, 228, 230, Lewis, D., 20,21, 147, 170,251,253,255,295, -?,, 7 L 7 27; Lorentz, H., 69 Losee, J., 27 Luce, D., 437
Mach, E., 30 Mackie, J. L., 114, 147, 168 Malebranche, N., 390 Margenau, H., 290 Marx, K., 321 Masterman, M.. 3 1 3 hlaxwell, G., 68, 82, 89, 301, 321, 373 Mayr, R., 104,451 ivlcKinsey, J., 334 McLaughlin, B. P., 390 Mellor, D., 165 Merton, R., 11 Michelson, A., 68,69, 71, 72, 74, SO, 81, 82. SS Mill, J. S., 29, 222, 224, 356. 395 Millikan, 83, 183 Mises, R. von, 164, 165 Mohs, F., 112, 188 Montague, R., 230 Morgenstern, O., 437 Morley, E.. 68, 69, 85
Palacios, J., 202 Pascal, B., 65,66 Pauli, \V., 255 Peano, G., 267,279,287 Pearsons, E., 404 Peirce, C. S., 30, 161 Périer, 66 Planck, M., 204.2 15 Platón, 63, 9 1,222 Poincaré, H., 29 Polányi, M., 3 1 Pollock, J., 165,404,406 Popper, K. R., 20, 30, 33, 62, 77, 92, 161, 165, 222, 224, 293, 302, 304, 318, 393, 395, 398, 402, 407, 407, 416, 416, 417, 419, 470, 421, 422, 433, 424, 425, 426, 427, 425, 419, 430, 431,432,433,434,435,436 Prout, W., 319 PrzeIecki, M., 33, 327, 341 Ptolomeo, 4.44 Putnarn, H., l69,300,301,305,3S3,3S1 Quine, U: O., 129,297,302.368,371,378
Raiffa, H., 437 Railton, P., 243,255, 259 Rarnsey, E, 160, 161, 162, 287, 290, 296,297, 298
Rankine, W., 1 17 Réaumur, R., 1 17 Regiomontano, 1 8 1 Reichenbach, H., 30, 160, 164, 287, 395, 406, 407,4 19 Resnik, M., 437 Ri\~adulla,A., 394,426 Rosenberg, A., 144 Ruben, D., 222,223 Russell, B., 30, 164, 282,406 Ryle, G., 305,383
Stegmüller,W., 33, 180,327,350 Stevens, S. S., 121, 122 Stevin, S., 27 Strawson, P., 402 Sugar, A., 334 Suppe, F., 33,327,333,341,336,347 Suppes, P., 32, 165, 327, 328, 333, 334, 334, 335,337,338,33812,339,330,341,332, 343, 346,346,350,351,361 Thagard, P., 11 Tooley, M., 128, 144, 147, 171 Torricelli, E., 65,66 Toulmin, S., 303,309,431
Urbach, P., 404 Salmon, W., 10, 62,77,223,239, 240, 243, 244, 245,246,250,251,253,255,405,328 Savage, L. J., 162,404 Van Fraassen, B., 33, 133, 166, 222, 247, 248, Schelling, F. W., 29 249, 250. 327, 330, 333, 331, 342, 343, 344, Schiffer, S., 152 345,346,347,378 Schlick, M., 30 Venn, J., 164 Schrodinger, E., 3 14 Scriven, M., 239,243 Sellars, W., 169, 170 Watkins, J., 419 Semmelweis, 1. P., 67, 74 Watson, J., 69,348 Shapere, D., 301 Wegener, A., 70 Sintonen, M., 223 Whewell, W., 30, 395 Skgrms, B., 403 Whitehead, A. N., 30,282 Smart, J. J. C., 385 Wiitgenstein, L., 30, 383 Smokler, H., 162 Wójcicki, R., 33, 327, 341 Sneed, J. D., 33, 327, 340, 350, 365, 379, 449, Woolgar, S., 11 45211,461 Wright, L., 223,262, 263,265 Sosa, E., 144, 147 Stahl, G. E., 66 Steel, J. B., 247 Young, T., 68
ÍNDICETEMÁTICO EXPANDIDO
Prólogo
CAP~TULO 1. Introducción. Naturaleza y función de la filosofía de la ciencia 1. La ciencia como objeto. Los estudios sobre la ciencia (Saber implícito y saber explícito. Teorizar. Teorizaciones de primer orden y de segundo orden. Teorizaciones sobre la ciencia: historia, sociología, psicología y filosofía de la ciencia. Filosofía de la ciencia y análisis conceptual). 2. La ciencia como objeto de estudio filosófico. La filosofía de la ciencia (Saber ciencia y saber sobre ciencia. Prácticas que siguen reglas. Reglas, convenciones y normas. La práctica científica, descripción y prescripción. Interpretación de los constructos científicos. Descripción, prescripción e interpretación en la Filosofía de la Ciencia).
3. Nuestro tema: Filosofía general de la ciencia empírica (Ciencias empíricas y ciencias formales. Ciencias naturales y ciencias sociales. Filosofía general de la ciencia y filosofía especial de las ciencias. Filosofía general de la ciencia empírica). 4. Panorama sucinto de la historia de la filosofía de la ciencia (La Antigüedad. La Revolución Científica y la Modernidad. Fundamentación de las ciencias naturales y las ciencias formales. El Círculo de Viena y el Grupo de Berlín. La Concepción Heredada. La Revuelt~Historicista. Las concepciones semánticas).
CAP~TULO 2. Argumentos deductivos y argumentos inductivos 1. Argumentos, validez y verdad. 1.1. Raronamientos, argumentaciones, nrgcrmentos e inferencias (Apoyo entre afirmaciones. Pretensión argumentativa. Inferencias, premisas y conclusión). 1.2. Corrección, validez y verdad (Afirmaciones, verdad y falsedad. Argumentos, corrección e incorrección. Corrección formal y corrección material). 1.3. Fuerza de los argumentos: argltrnentos dedrictivos e inductivos (Inferencias y otros discursos persuasivos. Pretensión deductiva y pretensión inductiva. Apoyo deductivo y apoyo inductivo).
2. Argumentos deductivos. 2.1. Validez ded~icriva(Lógica deductiva. Forma lógica y constantes lógicas. Patrones qurnentativos). 2.2. Falacias (Petición de principio. Falacias formales. Ambigüedad e imprecisión. No atinencia. Premisas ocultas).
3. Argumentos inductivos. 3.1. Argiimentos inductivos y forma de premisas y conclusión (Conclusión universal o particular. Premisas particulares o universales. Premisas generales o
estadístico-probabilistas). 3.2. \'alidez inductiva (Lógica inductiva. Apoyo gradual. Aspectos formales y materiales de la validez inductiva). 3.3. Falacias (Afirmación del consecuente. Insuficiencia de datos. Conyunción de conclusiones. Ambigüedad inductiva). C A P ~ U L3. O Contrastación de hipótesis 1. Algunos episodios históricos. 1.1. Mecánica aristotélica. 1.2. Esferas homocénrricas. 1.3. Roración de la í7err-a. 1.4. Paralaje esrelar. 1.5. Fases de Venus. 1.6. El barómetro de Torricelli. 1.7. EI corneta Halley. 1.8. Flogisro. 1.9. Fiebre puerperal. 1.10. Neprurio I'ulcano. 1.1 1 . Las teorías de la luz. 1.12. El éter y los experimentos de Mickelson y Morl91. 1.13. El ADN. 1.14. La extinción de los dinosaurios. 1.15. Deriva continenral. 1.16. Relatividad general.
2. Elementos de la contrastación. 2.1. Hipóresis (H) y Supuestos Aux-iliares (SA) (Hipótesis y contrastación. Hipótesis subsidiarias y supuestos auxiliares. Intención contrastadora). 2.2. Predicción (P) y Condiciones hriciales (CI) (Predicción, implicación contrastadora. Predicciones particulares. Condiciones antecedentes o iniciales). 2.3. Datos, experinie~~tación y obsenjació~l(Predícciones, hechos y datos. Datos y observación. Observación experimental y observación no experimental).
3. Condiciones para la contrastación. 3.1. Condición relativa a la ocurre~zciade la predicción (Implicación-derivación de la predicción. Implicación material e implicación lógica. Ocurrencia esencial. Explicación). 3.2. Condición relativa a la no ocurrencia de la predicción (Improbabilidad de la predicción. Ni implicación deductiva ni implicación inductiva. Dependencia del contexto y relativización pragmática). 4. Resultado de la contrastación. 4.1. Evidencia negativa (i-efuración).Estrcregias ad hoc (Predicción falsa. Modus rollei~s.Aceptación de SA y CI. Rechazo de la hipótesis. Justificación deductiva. Estrategias ad lioc, rechazo de SA o CI. Dependencia del contexto y relativización pragmática). 4.2. Evidencia positiila (confirmación) (Predicción verdadera. Improbabilidad de la hipótesis, predicción verdadera y justificación inductiva). 4.3. Algoritmo-resumen. 4.4. Predicciones irzadecuadas (Vaguedad e imprecisión. Predicción múltiple disyuntiva. Predicciones sucesivas). 4.5. Co~ítrastacionescruciales (Experimentos cruciales. Contrastación simultánea de hipótesis contrarias).
5. Consideraciones finales. CAP~TZILO 4. Los conceptos científicos 1. ¿Qué es un concepto? (Conceptos como entidades abstractas. Conceptos y objetos;
aplicación y subsunción. Conceptos vacíos. Conceptos y predicados lingüísticos; expresión. Conceptos y conjuntos; representación. Extensión e intensión. Conceptos cualitativos y conceptos cuantitativos).
2. Conceptos clasificatorios (Clasificaciones. Conceptos clasificatorios y particiones. Jerarquías de clasificaciones, árboles clasificatorios). 3. Conceptos comparativos (Comparaciones. Conceptos comparativos y relaciones de orden. Coincidencia y precedencia).
4. Conceptos métricos: estudio preliminar (Matematización y medición. Magnitudes. Conceptos métricos y representaciones numéricas. Conceptos métricos y conceptos compa-
rativos. Escalas (proporcionales, de intervalos, ordinales, lineales, monótonas, ...)).
...) y transformaciones (similares,
CAP~TULO 5. Las leyes científicas 1, Tipos de generalizaciones y de leyes. 1.1. Leyes y regularidodes. 1.2. Tipos de regularidades (Regularidades y modalidad. Modalidad conceptual. Modalidad nómica. Modalidad epistémica. Regularidades nórnicas y regularidades fácticas-accidentales). 1.3. Tipos de leyes (Leyes de sucesión y leyes de coexistencia. Leyes probabilistas y leyes no probabilistas. Leyes estrictas y leyes ceterisparibus o interferibles).
2. Leyes y regularidades accidentales. 2.1. Generalidad piirn e irrestricción. 2.2. No vacuidad. 2.3. Confirmación. 2.4. Predicción. 2.5. Explicación. 2.6. Causalidad. 2.7. Apoyo a contrafácticos. 2.8. Intensionalidod. 2.9. Proyectabilidad y clases naturales. 2.10. Objetividad y descubribilidad. 2.1 1 . Sisteninticidad. 3. Acaecimientos, causalidad y leyes causales. 3.1. Acaecimieritos y relaciones causales (Objetos y acaecimientos. Estados y procesos. Acaecimiento-causa y acaecimiento-efecto. Factores causales. Causa total. Causalidad y dependencia contrafáctica). 3.2. Leyes causnles (Causalidad y propiedades generales. Propiedades causalmente relevantes. Leyes causales y multiplicidad causal. Leyes no causales). 4. Cláusulas ceteris pnribus y leves no estrictas. 4.1. Análisis de las leyes no estrictas (Incompletud, reducción epistémica. Nomicidad interferible primitiva. Interpretación probabilista). 4.2. Leyes no estrictas y ciencias especiales (Macroprocesos y procesos básicos. Ciencias especiales. Constitución, fisicalismo, reducción y superveniencia. Constitución, mecanismos e interferibilidad). 4.3. Leyes no estrictas y ciencia bcísica (Ciencia básica y cláusulas ceteris paribus. Cláusulas ceteris paribus e idealizaciones. Cláusulas ceteris pnribrts y leyes locales. Cláusulas ceterisparibus y leyes parciales).
5. Probabilidad y leyes probabilistas. 5.1. Leyes probabilistas (Regularidades probabilistas accidentales y nómicas. Leyes probabilistas interferibles y no interferibles. Probabilidad condicionada). 5.2. Probabilidad lógica, probabilidad subjetiva y probabilidad objetiva (Probabilidad lógica y Iógica inductiva; probabilidad lógica y leyes probabilistas. Probabilidad subjetiva y grado de creencia racional: principio de indiferencia; probabilidad subjetiva y evidencia epistémica: probabilidad subjetiva y leyes probabilistas. Probabilidad objetiva, frecuencias y propensiones; limites de frecuencias; secuencias finitas y secuencias potencialmente infinitas; propensiones y frecuencias observadas).
6. La naturaleza de las leyes (Condición de implicación de regularidades factuales y condición de distinción respecto de regularidades factuales). 6.1. Regularitivisrno humenno (Proyección epistémica. Condiciones sintácticas, semánticas y pragmáticas. Leyes, integración teórica, simplicidad y fuerza). 6.2. Regularitivisrno realista (Leyes y lenguaje. Predicados, propiedades y clases naturales). 6.3. Necesitativismo (Universales. Necesitación; realismo). CAP~TULO 6. La medición en la ciencia 1. Magnitudes. illedición y metrización. 1.1. Magnitudes, cualidad y canticind (Propiedades y magnitudes. Cantidades, valores, escalas. Relaciones comparativas. Magnitudes extensivas, intensivas, crecientes, decrecientes e internas. hlodo de combinación, masnitudes
aditivas). 1.2. Estructura de la medición: medición directa e indirecta; medir metrizar (Medición y metrización. Medición directa y medición indirecta. Procedimientos de medición. Metrización, metrizar). 2. Función de la medición (Recolección de datos y ciencia normal. Formulación de leyes. Contrastación. Error admisible. Anomalías). 3. hletrización fundamental (*). 3.1. Metri:ación furtdainerttal y rnagi~itudes(Representación numénca, escalas, invarianza. Escalas ordinales. Condiciones de mensurabilidad). 3.2. Teoría de la metrizaciótr. Estruciuras, representación, unicidad, escalas (Metrización fundamental. Procedimiento de comparación. Sistemas comparativos; métricas. Representación numénca. Teorema de Representación. Teorema de Unicidad. Escalas (proporcionales, de intervalos, de intenralos logari'tmicos, de intervalos absolutos, de proporciones logarítmicas) y transformaciones (similares, lineales, exponenciales, lineales simples, exponenciales simples)). 3.3. lipos de métricas (Métricas combinatonas. Métricas de intervalos. Métricas conjugadas. Métricas algebraico-conjuntistas).
4. hletrización derivada (*). 4.1. Metrización derivada y teorías cuantitativas (Metrización derivada, fórmulas conectoras y leyes cuantitativas. Leyes y teorías cuantitativas). 4.2. Me-. fricación derivada y dejinicioizes (Definiciones que no presuponen leyes. Dimensiones, análisis dimensional. Escalas, escalas derivadas. Introducción de un concepto métrico derivado sin eliminabilidad. Definiciones que presuponen leyes). 5. Procedimientos de medición directa (*). 5.1. Ejemplos de procedimientos de medición directa (Masa; escala M K S , escala cegesimal. Temperatura; escala Celsius, escala Fahrenheit). 5.2. Fonna general de los procedimientos de medición directa (Sistema comparativo. Objetos estándar. Valores convencionales. Función-representación. Teorema de Representación y Unicidad. Métodos de medición directa).
6 . Procedimientos d e medición indirecta (*) (Medición indirecta y modelos de teorías cuantitativas. Magnitudes-ayuda. Objetos-ayuda. Determinación. Carga teórica de la medición. Valores proporcionales y valores irracionales. Fallos sistemáticos). 7. Consideraciones finales. CAPÍTULO7. La explicación científica l . Explicación y explicación científica (Sentidos de 'explicar'. Preguntas "¿Por qué?'. Explicación científica. Intensionalidad. Explanandum, explanans y relación explicativa). 2. Cobertura legal inferencial. 2.1. Fo~mageneral de la explicació~~ mediante cobertura legal
i~ferencial(Explicación, esperabilidad e inferencia Leyes, esperabilidad nómica Condiciones antecedentes). 2.2. Explicación nomológico-deducrii-apat~icular(Explicación y predicción. Problemas: generalizaciones inesenciales; precedencia temporal; simetría; efectos de causa común; irrelevancia; explicaciones teleológicas y funcionales. Explicación y causalidad). 2.3. Explicación no~nológico-deductivogetteral (Problemas: autoexplicación). 2.4. Erplicaciót~deductivoestadística. 2.5. Explicación inductiilo-estadística (Leyes probabilistas. Argumentos inductivos. Problemas: irrelevancia estadística; baja probabilidad; ambigüedad inductiva. Requisito de evidencia total. Requisito de máxima especificidad. Clases estadísticamente homogéneas). 3. Relevancia estadística (Clase de referencia. Partición homogénea. Homogeneidad epistémica; homogeneidad objetiva. Partición relevante. Probabilidad, relevancia explicativa y
alcance explicativo. Desplazamiento ['screening off].Causas propiciativas y causas resislivas). 4. Pragmática de la explicación (P-preguntas. Clase de contraste. Tema. Relevancia explicativa). 5. Explicación y causalidad (Historia causal. Causa total, causa parcial e información causal. Relevancia causal. Causas propiciativas y causas resistivas. Problemas: sucesos particulares probabilistas; hechos generales; explicaciones no causales).
6. Unificación teórica (Independiente aceptabilidad. Cuerpo de creencias. K-partición. Inferencia unificadora. Patrón argumentativo. Esquema argumental. Clasificación. Sistematización; base de sistematización. Almacén explicativo. Comparación de sistematizaciones. Problemas: hechos particulares; simetrías e irrelevancias; explicaciones estadísticas; causalidad). 7. Apéndice: Explicación teleológica y funcional (*) (Rasgo, disposición. Función. Entorno. Proceso. Sistema; organización del sistema. Explicaciones funcionales, explicaciones teleológicas y causalidad). CAP~TULO 8. Análisis sincrónico de teorías 1. Concepción axiomática: las teorías como cálculos interpretados 1. Teorías axiornáticas. 1.1. Cdlcrrlos y teorías asiom8ticas: términos primitivos, axiornas y teoremas; definiciones y términos derivados. 1.2. Ejemplo: teorías del parentesco. Reducción y equivalencia. 1.3. Aritmética, teoría de corijuntos y lógica proposicional. 2. Teorías y modelos (Estructura. Interpretación. Modelo, realización. Realización posible; realización efectiva). 3. Caracterización general de las teorías empíricas como cálculos interpretados. 3.1. Teorías formales y teoríns empíricas (Concepción Heredada. Términos teóncos. Definición implícita. Convencionalismo. Formalismo. Observación; observación directa). 3.2. Cálcnlos interpretados: vocabulario; axiomas y reglas de correspondencia (Términos teóncos. Términos observacionales. Contenido-interpretación empírica. Reglas de correspondencia, definiciones coordinativas, postulados de significación, enunciados interpretativos, definiciones operacionales. Entidades teóricas. Vocabulario: formal, teórico, observacional. Enunciados teóncos. Enunciados observacionales). 4. Las reglas de correspondencia y la cuestión de la eliminabilidad de los términos
teóricos. 4.1. Ineliminabilidnd de los términos teóricos (Reglas de correspondencia y definiciones explícitas. Enunciados reductivos; elirninativismo. Propiedades categóricas, propiedades disposicionales. Enunciados de reducción parcial. Analítico/sintético). 4.2. Eliminabilidad a lo Ramsey. 4.3. Elitnitzabilidad a lo Craig.
5. La distinción teórico/observacional y la naturaleza de la base empírica. 5.1. Entidades teóricas y distinción teórico/observacional (Entidades fenoménicas; qualia; fenomenismo. Entidades observables. Observación directa; observación indirecta). 5.2. Neutralidad teórica de los términos obsen~acionalesy carga teórica de los hechos (Experiencia-observación neutra. Interpretación teórica. Holismo. Carga teórica de los hechos. Conocimiento de fondo. Nuevos Filósofos de la Ciencia). 5.3. Observación y base empírica (Datos; base empírica; base de contrastación. Teórico/no-teórico. Observacional/no-observacional. Vocri-
bulario preteónco; vocabulario teórico. Principios internos; principios puente. Aplicación e interpretación empírica). 6 . Consideraciones finales.
CAPÍTULO9. Análisis sincrónico de teorías 11. Concepciones historicistas: las teorías como proyectos de investigación 1. La revuelta historicisia y la naturaleza sincrónica de las teorías (Nueva Filosofía de la Ciencia. Cambio y evolución de teorías. Análisis diacrónico y sincrónico de teorías).
2. Los paradigmas-matrices disciplinares de Kuhn. 2.1. Ciencia nonnal y ciencia m ~ o l u cionaria (Resolución de enigmas. Anomalías. Crisis científica. Ciencia no-normal, ciencia extraordinaria. Revolución científica). 2.2. Paradigmas qua matrices disciplirtares (Paradigmas. Generalizaciones simbólicas; leyes paradi,máticas; principios guía. Modelos; modelos ontológicos y heurísticos. Valores; precisión, simplicidad, fecundidad, compatibilidad. Ejemplares; aplicaciones empíricas. Ejemplares paradigmáticos. Significado empírico. Inconmensurabilidad). 3. Los programas de investigación de Lakatos (Conocimiento de fondo. Teoría interpretativa; teoría explicativa. Heurística positiva; heurística negativa. Núcleo del programa de investigación; cinturón protector. Programas progresivos, estancados y regresivos).
4. Las tradiciones de investigación de Laudan (Compromisos me:~físicos;normas epistémicas. Articulación teórica. Resolución de problemas: problemas empíricos; problemas conceptuales. Evolución de las tradiciones. Coexistencia de tradiciones).
5. Consideraciones finales. CAP~TULO 10. Análisis sincrónico de teorías m. Concepciones semánticas: las teorías como entidades modeloteóricas 1. Teorías, enunciados y modelos. 1.l. Axiomas y modelos (Equivalencia e identidad de teorías. Identificación sintáctica. Identificación semántica o modeloteórica). 1.2. El er~foque modeloteórico (Definición de modelos. Aplicaciones empíricas. Afirmaciones empíricas. Complejidad teórica).
2. La noción de teoría de Suppes (Escuela de Stanford. Axiomatización mediante predicado conjuntista. Axiomas impropios: axiomas propios. Realizaciones posibles; realizaciones
efectivas, modelos. Ejemplo: mecánica de partículas). 3. Adams y las aplicaciones intencionales (Interpretación pretendida. Medición fundamental. Modelos pretendidos. Afirmación empírica. Autojustificación. Modelos de datos). 4. La familia semanticista. 4.1. Van Fraassen: espacios de estado; base empírica y obseri-labilidad (Estados, espacios de estados; trayectorias y leyes de sucesión; regiones y leyes de coexistencia. Subestructuras empíricas. Empiricidad y observabilidad. Adecuación empírica. Empirismo constructivo. Equivalencia empírica; incompatibilidad teórica. Infradeterminación de la teoría por la experiencia. Antirrealismo). 4.2. Suppe: sistelnas relacionales;fenómenos, daros y teorías (Sistemas relacionales; espacios de estados; leyes. Alcance pretendido; datos, observación. Verdad empírica; verdad teórica. Cuasi-realismo). 4.3. Giere: rnodelos e hipótesis tedricas (Modelo teórico. Hipótesis teóricas. Similitud. Realismo constructi-
vista). 4.4. Sneed y la concepciórr estrcictltralista (Teoricidad relativa. Aplicaciones pretendidas. Datos. Ligaduras. Relaciones interteóricas).
5. La concepción estructuralista de las teorias. 5.1. El núcleo K (Modelos potenciales y modelos actuales. Condiciones de ligadura; ligadura global. T-teoncidad y modelos parciales; procedimiento de determinación). 5.2. Aplicaciones intencionnles (Aplicaciones y modelos parciales. Carga teórica de los datos. Determinación intencional y paradigrnática del dominio de aplicaciones). 5.3. Lns teorias como elementos teóricos (Contenido y aserción empírica. Contenido teórico y contenido empírico. Aserción empírica. Subsunción o encaje teórico). 5.4. Especialización. h s teorías como redes teóricas (Matrices disciplinares; complejidad de las teorías. Especialización teórica, redes teóricas, redes conectadas, redes arbóreas; elemento teórico básico). 5.5. Vínculos interteóricos y holones (Leyes mixtas, leyespuente y vínculos interteóricos. Vínculos y núcleo; vínculo global. Holones teóricos).
6 . Consideraciones finales. CAP~TULO 1 1. Relaciones interteóricas 1. Concepto general de relación interteórica (Relaciones interteóricas. Relaciones interteóricas e identidad de teorías. Holisrno; tesis Duhern-Quine).
2. Teorización (TZrminos T-no teóricos. Teorías subyacentes. Base empírica, contrastación y teorización. Teorización total y teorización parcial. Fundacionismo y coherentismo. Subestmcturas. Determinación).
3. Reducción (Reduccionisrno. Revoluciones científicas, inconmensurabilidad. Reducción exacta; reducción aproximativa. Reducción y cambio teórico. Condiciones de conectabilidad y derivabilidad. Constitución). 4. Equivalencia (Equivalencia y reducción. Equivalencia fuerte o estricta. Equivalencia débil o empírica).
5. Apéndice: Ciencia especial y ciencia básica; reducción, múltiple realizabilidad y superveniencia (*). 5.1. Distinciones previas: términos generales, conceptos expresados entidades denotadas; acaecimiento-ejemplary acaecimiento-tipo. 5.2. Identidad conceptual. Reduccionismo senuíntico. 5.3. Idetzridad de tipos o propiedades. Reduccionismo ontológico. 5.4. kf~í!riplerealizabilidad. 5.5. Dualismo de propiedades con idenridad de ejemplares y superveniencia. 5.6. D~lolismode propiedades con identidad de ejemplares y epifenomenismo. 5.7. Eliminativismo. 5.8. Dualisnzo de ejemplares. CAP~TULO 12. La evaluación de teorías y el problema de la inducción 1. Evaluación epistémica. El problema de la inducción. 1.1. Inferencias amp1iarii.a~ justificación ind~tctiva(Inducción. Contexto de descubrimiento y contexto de justificación. Justificación, inducción e inferencias ampliativas. Inducción por enumeración. Inducción estadístico-probabilista. Inducción por eliminación. Inferencia a la mejor explicación. Método hipotético-deductivo. Principio de uniformidad de la naturaleza. Justificación parcial, probabilidad). 1.2. Lns paradojas de la confirmación y el nuevo enigma de la inducción (Confirmación por instancias. confirmación cualitativa; paradojas. El nuevo enigma de la inducción; proyectabilidnd, propiedades naturales; predicados atrincherados ('enrrenched'), integración teórica. Principio de simplicidad de la naturaleza. Infradeterminnción de la teoría por la experiencia).
2. Aproximaciones al problema de la inducción. 2.1. La induccióit corno pseudoproblema. 2.2. Jusrificación inductii>ade la inducción. 2.3. Principios sii~réricosa priori. 2.4. Inducción conto deducción encirbierta. 2.5. Justificación a priori de la inducción; lógica Ntducriifn. 2.6. Probabilidad, bayesianismo y teoría ntarernárico de la i~ferenciaesradísrica. 2.7. Posru~acionismo.2.8. Defensa pragmática. 2.9. Reclía:o de la inducción. 3. Lógica inductiva y grado de confirmación (*). 3.1. La reoría sintáctica de Henlpel (Criterio cualitativo de confirmación. Confirmación directa. Evidencia confirmatoria, disconfirmatoria y neutral. Verificación, refutación). 3.2. El programa inductivista de Calnap (Criterio cuantitativo de confirmación; grado de confirmación. Peso probabilista. Implicación parcial. Lógica inductiva. Inducción y probabilidad; probabilidad condicionada). 3.3. Probabilidades an~eriores(Descripción de estado. Grado de apoyo evidencial; principio de indiferencia. Descripción de estructura). 3.4. Problemas y discusión (Lenguaje cuantitativo. Dependencia del lenguaje; completud expresiva del lenguaje. Arbitrariedad; apriorismo; intuición inductiva. Ateoricismo; grado de confirmación y leyes; confirmación cualificada por casos; fiabilidad; cociente de apuesta racional. Condiciones de aplicación y guía para la racionalidad; condición de evidencia total; cociente de apuesta racional; grado de apoyo evidencial). 4. Falsacionismo, grado de corroboración y verosimilitud (*). 4.1. Aitriinductivismo (Lógica inductiva y probabilidad. Contenido informacional e improbabilidad. Probabilidad condicionada a la evidencia y probabilidad absoluta). 4.2. Falsacionismc (Confirmación y Refutación. Conjeturas y refutaciones. hfodus tollens. Problema lógico de la inducción; problema metodológico de la inducción. Falsacionismo; epistemología negativa). 4.3. Grado de coriaboración (Evidencia favorable y evaluación de hipótesis. Contenido, improbabilidad; falsabilidad, corroborabilidad; explicatividad. Medida de la severidad de los tests. Corroboración cualitativa. Medida cuantitativa de corroboración; grado de corroboración. Grado de corroboración y probabilidad). 4.4. I/erosimilitud (Refutación; verdadlfalsedad. Proximidad a la verdad. Contenido de verdad; contenido de falsedad). 4.5. Problenms y discusió~i(Verosimilitud. Severidad de los tests y falsación. Corroboración e implicación. Ateoricismo. ~Antiinductivismo?; grado de corroboración y grado de corroborabilidad; grado de corroboración y probabilidad. Carga teórica de los hechos y límites de la falsación).
5. Complejidad de las teorías, anomalías y falsación. 5.1. El contrainditcrii)is~node F q e rabend (Neoempirisrno. Método contrainductivo. Epistemología pluralista; anarquismo epistemológico. hilito de la racionalidad. Tiranía de los expertos. Tenacidad y proliferación). 5.2. Kuhiz y Lakatos: complejidad de las teorías, inmunidad p falsacióit (Anonialías. Observación e interpretación. Carga teórica de los hechos. Falsacionismo ingenuo; falsacionisrno sofisticado. Ciencia normal; ciencia revolucionaria. Complejidad teórica; evolución teónca. Cambio intrateórico; cambio interteórico).
6 . Consideraciones finales. CAP~TULO 13. Análisis diacrónico de teorías. El cambio teúrico 1. La perspectiva diacrónica en filosofía de la ciencia (Teorías científicas, desarrollo histórico. Historia de la ciencia y filosofía de la ciencia. Análisis sincrónico, análisis diacrónico. Revuelta hisroricisra. Paradigma, matriz disciplinar; programa de investigación; tradición de investigación. Jdentidad a través de cambio, continuidad a través de la ruptura; cambio intrateórico, cambio interteónco. Cinemática y dinámica de teorías).
2. Cambio intrateórico. 2.1. Caracreri:acicíti getreral (Paradigma, matriz discipiinar; programa de investigación; tradición de investigación. Evolución teórica. Cambio intrateórico. Marco teórico. Red teórica, elemento teórico brísico. Comunidad científica. Revolución científica). 3.2. Las leoríos cotno evoliiciones teóricas (Red teórica; cambio intrateórico; evolución teórica. Especiali~ación.Núcleo básico. Dominio de aplicaciones paradigmáticas; ejemplares paradigmáticos).
3. Cambio interteórico en general (Revolución científica. Sustitución de paradigmas. Inconmensurabilidad. Suplantación; suplantación parcial. Cambio semántico. Aproximación, idealización. Suplantación con inconrnesurabilidad. Incorporación sin inconrnensurabilidad). 4. Cambio interteórico como incorporación (Reducción; aproximación reductiva. Iniplicación teórica; aplicaciones intencionales. Incorporación y marco conceptual. Incorporación, redes teóricas y elemento teórico básico. Incorporación y leyes. Incorporación y aplicaciones intencionales. Programas de investigación en competencia). 5. Cambio interteórico como suplantación (Inconmensurabilidad; cambio sernántico. Inconmensurabilidad total; inconmensurabilidad parcial. Suplantación y marcos conceptuales. Suplantación y leyes. Suplantación y aplicaciones intencionales. nomal lías). .. ..-
ó. Consideraciones finales: Las formas del progreso científico. APÉXDICE. Recordatorio de teoría d e conjuntos.
1. Conjuntos. 1.1. Pertetreiicia. e.~tet?sionalidady conjiotto vacío. 1.2. Inclusión y corljiirtto potencia. 1.3. Operaciones básicas.
2. Relaciones. 3.1. Pnres ordenados y prodricto cartesiano. 2.2. Relaciones; dominio, rccorrido y cot~ipo.2.3. Operaciones entre relnciones. 2.4. Propiedades de las relaciones. 2.5. Relacioties de equii.aletrcia y pnrticiones. 2.6. Relnciotzes de orden. 3. Funciones. 3.1. Fiiticiones; itnagen. 3.2. Biyeccior7es. 3.3. Cotnposiciótz defiinciones.
4. Sistemas y morfismos. 4.1. Sistetnns. 4.2. MorjGstnos. I
Referencias bibliográficas Índice onornástico Índice temático expandido