CIENCIAS FORMALES Y FILOSOFÍA Selección de trabajos presentados en las VII Jornadas Rolando Chuaqui K.
COLECCIÓN JORNADAS ACADÉMICAS 29
Esta colección difunde las versiones escritas de conferencias y los textos de ponencias y relaciones presentadas en jornadas y seminarios, con el fin de facilitar el acceso a ellas por parte de los especialistas en los respectivos campos de estudio.
EN ESTA MISMA COLECCIÓN: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28.
Filosofía del Derecho, por varios autores, 1980. X Jornadas Chilenas de Derecho Público, por varios autores, 1980. Apreciación crítica de la teoría pura del derecho, por varios autores, 1982. Filosofía contemporánea, por varios autores, 1983. XV Jornadas Chilenas de Derecho Público, por varios autores, 1985. Desajustes entre norma y realidad, por varios autores, 1986. Historia de las mentalidades, por varios autores, 1986. 3 Estudios Políticos, por Abel González, Agustín Squella e Italo Paolinelli, 1987. Estudios Filosóficos, por varios autores, 1988. Proyecto de Código Procesal Civil Modelo para Iberoamérica, 1989. Teoría y realidad del derecho, por José Llompart S., 1989. En el umbral del siglo XIX. ¿Nuevos Conceptos e Instituciones Jurídicas?, por varios autores, 1989. Estudio de Derecho Procesal, por Raúl Tavolari Olivero, 1990. XX Jornadas Chilenas de Derecho Público, (dos tomos), por varios autores, 1990. Estudios sobre derechos humanos, por Agustín Squella, 1991. La enseñanza de los derechos humanos, por varios autores, 1992. Medio siglo al servicio del derecho procesal, por Mario Casarino Viterbo, 1993. Filosofía del Exilio, por varios autores, 1993. Comentarios Procesales, por Raúl Tavolari Olivero, 1994. XXV Jornadas Chilenas de Derecho Público (tres tomos), por varios autores, 1995. Nietzsche más allá de su tiempo 1844..., por José Jara, Editor, 1998. XXX Jornadas Chilenas de Derecho Público (dos tomos), por varios autores, 2000. 90 años de la Escuela de Derecho de la Universidad de Valparaíso, por varios autores, 2002. ¿Qué queda de la teoría pura del Derecho?, por varios autores, 2005. Las dos caras de Jano y otros ensayos, por Lautaro Ríos Álvarez, 2005. Norberto Bobbio: Su pensamiento político y jurídico, por Agustín Squella, Editor, 2005. XXXV Jornadas Chilenas de Derecho Público, por varios autores, 2006. Filosofía y Política en Rawls, por varios autores, 2007
Andrés Bobenrieth Miserda Editor
CIENCIAS FORMALES Y FILOSOFÍA Selección de trabajos presentados en las VII Jornadas Rolando Chuaqui K.
EDEVAL 2007
Ciencias Formales y Filosofía; Selección de trabajos presentados en las VII Jornadas Rolando Chuaqui K. es una publicación conjunta entre el Instituto de Filosofía de la Facultad de Humanidades de la Universidad de Valparaíso y las Jornadas Rolando Chuaqui Kettlun, que son coorganizadas por las siguientes universidades: Pontificia Universidad Católica de Chile (Facultad de Matemáticas y Facultad de Filosofía), Universidad de Santiago de Chile, Universidad de Chile, Universidad de Valparaiso.
# ANDRES BOBENRIETH MISERDA EDITOR Inscrito en el Registro de la Propiedad Intelectual bajo el Nº................ I.S.B.N. .............. Impreso en los Talleres de EDEVAL E-MAIL: edeval@uv.cl
Diseño Portada: Flavia Michell S.
7
INDICE Página
PRESENTACIÓN .................................................................................. 9 Andrés Bobenrieth M. SEMBLANZA ACADÉMICA DE ROLANDO CHUAQUI K. ....... 13 Wilfredo Quezada y Renato Lewin LOGIC AND ONTOLOGY ................................................................. 21 Oswaldo Chateaubriand REVISIONISMO Y COGNITIVISMO EN FILOSOFÍA DE LAS MATEMÁTICAS .................................................................. 45 Wilfredo Quezada Pulido LÓGICA, EMPIRISMO Y REALISMO EN EL PENSAMIENTO DE QUINE ............................................................................................ 69 Rodolfo Gaeta REALISMO CIENTÍFICO Y VUELO A LA REFERENCIA ......... 85 Nélida Gentile LOS DESAFÍOS DEL REALISMO ESTRUCTURAL .................... 103 Susana Lucero VAGUEDAD Y MEDIDA ................................................................... 119 Luis Adrian Urtubey
8 LA NATURALEZA DE UNA ECUACIÓN BÁSICA ..................... 135 José Tomás Alvarado Marambio OBJETOS POR OMISIÓN .................................................................. 155 Hernán Miguel LÍMITES DE LA ARGUMENTACIÓN EN SOBRE LA CERTEZA 171 Eduardo Fermandois FILOGÉNESIS Y ESPECIES COMO GÉNEROS NATURALES EN KRIPKE .......................................................................................... 193 Julio Torres Meléndez ALGUNOS CONCEPTOS PARA LA ENSEÑANZA DE LA LÓGICA .......................................................................................... 211 Rodolfo Ertola y Adriana Galli INFERENCIA HETEROGÉNEA, VISUALIZACIÓN, FLUJO DE INFORMACIÓN .............................................................. 223 Horacio Faas INDECIDIBILIDAD, INCOMPLETUD E INTEGRABILIDAD DE ECUACIONES DIFERENCIALES .............................................. 241 Enrique R. Reyes
9
PRESENTACIÓN
Las Jornadas Rolando Chuaqui Kettlun: Matemáticas y Filosofía se han venido realizando anualmente desde 1999. Se trata de un esfuerzo conjunto de varias universidades tradicionales chilenas por juntar personas interesadas en una diversidad de temas y desde distintas perspectivas disciplinarias, privilegiando por sobre todo la calidad académica de los trabajos que se presenten. La idea central es darle cabida a la gran variedad de temas académicos que preocuparon a Rolando Chuaqui, de modo que se hace énfasis en las siguientes áreas: a) epistemología, b) lógica matemática y filosófica, c) fundamentos de la matemática, de la teoría de la computación y de la inteligencia artificial, d) filosofía de la lógica y filosofía de las ciencias en general y en particular, e) inducción y probabilidad, f) historia de la ciencia. La primera versión de las jornadas se realizó en la Universidad de Valparaíso con la coorganización de la Pontificia Universidad Católica de Chile y la Universidad de Santiago; las segundas jornadas fueron realizadas el año siguiente (2000) en la Pontificia Universidad Católica de Chile; luego, las terceras jornadas en la Universidad de Santiago (2001), las cuartas y quintas en la Pontificia Universidad Católica de Chile (2002 y 2003); y al año siguiente la Universidad de Chile se incorporó al grupo de universidades coorganizadoras y realizó las jornadas del 2004. Las Séptimas Jornadas Rolando Chuaqui K. se realizaron en la Universidad de Valparaíso en Mayo del 2005, coorganizadas por: la
10
Pontificia Universidad Católica de Chile (con la participación de tanto la Facultad de Matemáticas, como de la Facultad de Filosofía), la Universidad de Santiago de Chile (Departamento de Filosofía de la Facultad de Humanidades), la Universidad de Chile (Departamento de Filosofía de la Facultad de Filosofía y Humanidades), y la Universidad de Valparaíso (Instituto de Filosofía de la Facultad de Humanidades). A Valparaíso y Viña del Mar llegó un conjunto de destacados académicos provenientes de distintas partes de Argentina, Brasil y Chile. Nuestro invitado internacional fue el Prof. Oswaldo Chateubriand. Todos ellos hicieron que tuviéramos tres días de memorable interacción académica y personal. La calidad de los trabajos presentados en esas Jornadas nos llevó a considerar la posibilidad de no dejar todo ahí, sino que dar lugar a una publicación que recogiera varios de estos textos. Decidimos entonces hacer una edición conjunta entre el Instituto de Filosofía de la Universidad de Valparaíso y las Jornadas Rolando Chuaqui Kettlun, constituyéndose entonces el Comité Organizador de las Jornadas en el comité editorial de esta publicación. El primer paso fue solicitarle a muchos de los ponentes que enviaran sus trabajos para ser sometidos a un proceso de selección y recibimos una respuesta muy favorable de ellos (de hecho, varios privilegiaron esta convocatoria por sobre otras posibilidades de publicación). Una vez llegados todos los trabajos, en el comité, conformado por Wilfredo Quezada (USACH), Renato Lewin (PUCCH Matemáticas), Manuel Correia (PUCCH Filosofía), Alejandro Ramírez (U. de CH.) y Andrés Bobenrieth (U. de V.), decidimos publicar los trece textos que tiene el lector en sus manos. Creemos que ellos en conjunto constituyen una excelente muestra del trabajo que realizan en los países del sur de América los académicos que están interesados en la interacción entre matemática, lógica y filosofía. Obviamente hay muchos temas que se trabajan y que aquí no están presentes, pero creemos que el lector tendrá una adecuada muestra de una diversidad de tipos de trabajo, así como de distintos enfoques. Ahora bien, cada uno de los artículos constituye por sí mismo un aporte a las discusiones contemporáneas sobre cada uno de los temas tratados. De modo que
11
este libro busca cumplir un doble provecho: uno por el conjunto y otro por cada uno de los artículos. Todos los textos cuentan con un amplio resumen, de modo que remito a ellos al lector que quiera hacerse una visión panorámica del contenido concreto de este libro. El orden de los artículos fue determinado siguiendo el criterio de cierta proximidad temática entre los textos colindantes —en la medida de lo posible—, comenzando por el trabajo del invitado internacional (el cual es publicado en inglés a petición del autor, si bien hemos hecho una traducción del resumen). Este libro constituye la primera publicación que está directamente relacionada con la Jornadas Rolando Chuaqui K., por lo cual hemos considerado adecuado que dos de las personas que mejor lo conocieron en su trabajo académico, en filosofía y en matemáticas, y que fueron quienes generaron las Jornadas, escribieran una semblanza académica del él. Con ese texto abrimos este volumen, si bien todo el libro constituye un homenaje a Rolando Chuaqui y especialmente a la huella que dejó en el trabajo académico en Suramérica. En todas las jornadas que hemos realizado, en innumerables ocasiones antes de comenzar los ponentes hacen referencia a la persona y la influencia de Rolando Chuaqui, y a uno no deja de sorprenderlo como personas que vienen de lugares tan diversos en nuestros países alcanzaron a ser tocados por este hombre excepcional. De la actitud de Chuaqui hacia el trabajo de otros académicos, y especialmente de los que estaban comenzando, no sólo pueden aprender los jóvenes, sino particularmente aquellos que tienen asentadas carreras académicas. La idea de publicar este libro también estuvo basada en la confianza que en el Instituto de Filosofía de la Universidad de Valparaiso genera la Editorial EDEVAL, de la Facultad de Derecho de esta Universidad. Dicha confianza se vio ampliamente ratificada con la muy favorable acogida que hizo de este proyecto el anterior decano Prof. Antonio Pedrals G. y la decidida ejecución del mismo a que dio lugar el actual decano Prof. Aldo Valle A. En la persona de Viviana Donoso D., quisiera agradecerle a todas las personas de EDEVAL que hicieron posible que este libro pasara de ser una realidad virtual a una material.
12
El respaldo de las autoridades del Instituto de Filosofía ha sido fundamental para llevar a cabo este proyecto, particularmente los profesores Carlos Martel Ll. y Jaime Villegas T., así como la del anterior decano de la Facultad de Humanidades profesor Carlos Verdugo S. En los aspectos administrativos ha sido determinante el aporte de Marianela Sepúlveda R. El trabajo en este texto ha contado con el apoyo de la Dirección de Investigación de la Universidad de Valparaiso por medio de un proyecto Dipuv (47/05). Parte fundamental de la labor editorial ha sido llevado a cabo por mi colega Marcelo Arancibia G. y por mi ayudante Rodrigo López O. Fue sólo gracias a la capacidad y la diligencia de ellos que fue posible que un montón de artículos de diversos formatos se haya convertido en un libro. También quiero agradecerle especialmente al profesor Wilfredo Quezada P. por su permanente apoyo y preocupación para que esta publicación se hiciera realidad. Quisiera terminar agradeciéndole a los autores de cada uno de los textos, además de por las razones obvias, por haber confiado en este proyecto y por la diligencia con que han contestado todos mi requerimientos. Este libro es de ellos. Andrés Bobenrieth M.
13
SEMBLANZA ACADÉMICA DE ROLANDO CHUAQUI K.
El sentido de esta presentación es explicar por qué la figura de Rolando Chuaqui influyó y sigue influyendo de manera estable en académicos e intelectuales de tan diferentes orígenes y formaciones. Obviamente ello ayudará a explicar también por qué las Jornadas que llevan su nombre, así como esperamos lo sea la publicación que el lector tiene ahora en sus manos, se han convertido en un producto estable y duradero de ese influjo. Es entendible que dicha influencia, innegablemente extraña al medio nacional chileno, sea en parte el resultado natural de los muchos talentos intelectuales que adornaban a Chuaqui, pero pensamos que aún más decisiva que ellos era la singular personalidad que sirvió de suelo para que tales talentos fructificaran. La personalidad de Chuaqui era a su vez compleja y profunda como sencilla y directa. Esto significa que Chuaqui aunaba en su personalidad tendencias, si no contradictorias, al menos antagónicas. Sin embargo, es justo decir que su vida, en su dimensión personal y académica, es tal vez el mejor ejemplo que conocemos de cómo tales tendencias pueden resolverse fluidamente en una armónica unidad. Dado el contexto en que se inserta esta presentación, hablaremos aquí fundamentalmente de cómo se gestó en el plano académico aquella unidad y cómo se expresó tanto en su formación, sus investigaciones y su enseñanza. En su formación académica vemos de inmediato dos tendencias aparentemente opuestas: por una parte, eligió estudiar medicina en la
14
Universidad de Chile, una disciplina eminentemente práctica, y por otra, casi inmediatamente se sintió interesado por cuestiones teóricas vinculadas a la disciplina, por ejemplo, acerca de los fundamentos lógicos y metodológicos de las ciencias médicas. La forma que Chuaqui ideó para resolver esta dualidad (y superar de paso algunos aspectos particularmente complejos para él de la práctica médica, p. e. la práctica quirúrgica) fue trasladarse a USA e ingresar al Grupo de Lógica y Metodología de la Ciencia de la Universidad de California-Berkeley, programa interdisciplinario de los departamentos de matemáticas y filosofía de dicha universidad. Al regresar a Chile, en vez de asociarse a una facultad de medicina y después de un breve paso por la Facultad de Ciencias de la Universidad de Chile, se integra finalmente a la Pontificia Universidad Católica de Chile donde iniciaría una intensa actividad en pro del desarrollo de las ciencias exactas, particularmente la matemática, llegando con el tiempo a ser el primer Decano de la Facultad de Matemáticas, que él ayudó a crear. Sin embargo, esta decisión a favor de una disciplina muy alejada de la medicina no significó en la vida de Chuaqui un abandono definitivo de esta última pues la formación adquirida le permitió seguir reflexionando profundamente sobre sus fundamentos y sus aplicaciones. Aún más, Chuaqui llegó a convencerse de que era fundamental tender puentes reflexivos permanentes entre las diferentes disciplinas científicas y sus respectivas prácticas. En una clase magistral dictada en 1992 en la Facultad de Humanidades de la Universidad de Santiago titulada «Disciplina e interdisciplina» él hizo perfectamente clara esta convicción. Decía, "[e]s mi convencimiento que para hacer estudios interdisciplinarios serios hay que partir de una disciplina estudiada, también, muy seriamente. Creo que, en general, la manera normal de llegar a la interdisciplina es a través de la profundización de la disciplina misma. Todo está unido con todo: al estudiar matemática profundamente, por ejemplo, se llega a la filosofía, como yo, o a la historia, o aun al arte, como otros". Y él ejemplificaba esta convicción con su propio caso agregando adicionalmente "como muchos de uds. saben, yo estudié primero medicina. Con el título de médico, fui admitido al Programa de Lógi
15
ca y Metodología de las Ciencias, un programa interdisciplinario entre matemática y filosofía de la Universidad de California en Berkeley. Así, sin tener estudios formales de las disciplinas del programa mismo fui admitido a él (aunque solo condicionalmente al principio)". A continuación él se explayó acerca de dos ejemplos de actividad interdisciplinaria en los que estuvo intensamente involucrado como matemático, médico y filósofo: en primer lugar, los fundamentos de la probabilidad y la estadística, y, en segundo, los fundamentos de la ciencia cognitiva y la inteligencia artificial. Casi al finalizar su clase magistral y especulando acerca de la conexión entre filosofía, ciencia y tecnología, él concluía diciendo "me parece que la separación entre investigación pura y aplicada es muy nociva para el desarrollo. Hay un continuo [...], entre la investigación más pura y las aplicaciones más concretas. Quebrar este continuo es artificial y creo que perjudicial. [....]. Aun más, yo creo que no debe haber separación entre filosofía y otras ciencias humanas, ciencia básica y tecnología". Esto sugiere que Chuaqui tenía clara conciencia de la necesidad de buscar síntesis productivas —de conectar todo con todo— a través de la reflexión profunda acerca de los fundamentos de cada ciencia. Esta fue la solución que él encontró para resolver los antagonismos que enfrentó en su propio camino intelectual y la que siguió luego aplicando consecuentemente. En sus investigaciones, como ya se observa de acuerdo a lo dicho anteriormente, Chuaqui buscó la misma integración. Ello no sólo se refleja en las palabras citadas anteriormente sino directamente en sus áreas de intereses. Por una parte, investigó en áreas tan abstractas como el análisis no standard, la teoría impredicativa de clases, y los fundamentos de la probabilidad. Y sin embargo, vio en todas ellas posibilidades de investigación aplicada. La forma que ideó para capturar las relaciones entre lo más abstracto de su producción y sus eventuales aplicaciones fue de nuevo original y penetrante. Daremos aquí un solo ejemplo relacionado con su obra más ambiciosa publicada dos años antes de su muerte y titulada Truth, Possibility and Probability; New Logical Foundations of Probability and Statistical Inference. Este libro propone en lo general una interpre
16
tación novedosa de la probabilidad basada en los conceptos de posibilidad y verdad lógica, que explica tanto los usos epistémicos como los usos en teorías científicas de la probabilidad y captura las intuiciones originales de los fundadores del cálculo de probabilidades. En esta obra se encuentran variados ejemplos de aplicación, sobre todo relacionados con la teoría de la decisión en el ámbito de la medicina y el derecho. Sin embargo, junto con aplicaciones directas de su formalismo, Chuaqui brinda ejemplos informales de aplicación, que sugieren cómo dicho formalismo puede servir para zanjar cuestiones prácticas fundamentales. El ejemplo que consideraremos aquí discute la forma en que dos principios probabilísticos defendidos extensamente por Chuaqui, el Principio de Inferencia Directa (PID) y el de Inferencia Inversa (PII), subyacen en los modelos de diagnóstico médico de una enfermedad. PID dice, formulado de la manera más sencilla posible, que podemos inferir, a partir de la creencia de una persona p en el tiempo t que la probabilidad aleatoria de un suceso A es r, que el grado racional de la creencia de p en A (i.e. la probabilidad epistémica de A) también es r. Por contraste a PID, que nos lleva a aceptar hipótesis propuestas, PII es un principio de inferencia que permite rechazar hipótesis. Formulado igualmente de manera simplificada, PII dice que, dado un dispositivo aleatorio (un conjunto de resultados posibles) que debemos explicar y un conjunto alternativo de hipótesis epistémicamente posibles (un modelo en la terminología de Chuaqui) para ese propósito, rechazaremos una hipótesis K del último conjunto si hay un experimento discriminador E para K que tiene un resultado a tal que la probabilidad de a es baja o algo peor en relación a K. Para entender completamente PII — un genuino aporte metodológico de Chuaqui— deberíamos también especificar las definiciones de algunas nociones involucradas en la definición anterior como son las de resultado peor, experimento discriminador y regla ideal de rechazo, entre otras. Ya que no podemos hacer esto en esta breve presentación, nos limitaremos a continuación a comentar su ejemplo y las consecuencias prácticas que de él se derivan.
17
Si admitimos que cada enfermedad tiene una causa que produce diferentes racimos de síntomas entonces, según Chuaqui, la primera implica un dispositivo aleatorio que determina los racimos posibles de síntomas que se presentan en diferentes personas. Así concebidas, las enfermedades se pueden interpretar como procesos estocásticos que evolucionan en el tiempo. A su vez, en una persona dada, los cambios evolutivos de la enfermedad se manifiestan como diferentes racimos de síntomas. Lo original de esta visión es lo que llamaríamos filosóficamente, su modalismo. Es decir, Chuaqui concibe la naturaleza de la conexión entre las diferentes alteraciones corporales producto de la evolución en el tiempo de la enfermedad como posibilística, en el sentido que las alteraciones en un cierto tiempo determinan las posibilidades de alteración en los tiempos sucesivos (y sus probabilidades asociadas). Por otra parte, la relación entre las alteraciones y los síntomas también puede interpretarse modalmente, es decir, ciertas alteraciones determinan un rango de racimos posibles de síntomas (con sus respectivas probabilidades) y no un racimo específico. De esto se desprende que Chuaqui acepta cierto realismo o primitivismo causal: él cree que existen procesos causales reales (los que producen las alteraciones corporales) y por tanto que existe cierto orden causal subyacente. Es este orden el que permite determinar (y descartar) posibilidades sucesivas en el tiempo y con ello asignar probabilidades. De ahí que su causalismo sea probabilístico sólo en un sentido derivado (esto seguramente afectará también la concepción general de indeterminismo que defendía Chuaqui pues, al menos, lo atenuará). A continuación Chuaqui considera un modelo bayesiano de diagnóstico médico basado en el PID y empleado en modelos computacionales. Luego de examinar dos variantes de aplicación del modelo bayesiano, Chuaqui arriba a la conclusión que dicho modelo enfrenta dificultades de adecuación que llevarán a cometer serios errores de diagnóstico, siendo la dificultad más grave el hecho que el modelo asume que los síntomas sólo pueden dar evidencia para una categoría de enfermedades pero no para una enfermedad particular sufrida por un sujeto particular Frente a esto, Chuaqui recomienda utilizar su PII (aunque sin abandonar PID,
18
o sea sin abandonar la regla bayesiana) para hacer el diagnóstico. Es decir, en este caso, asumimos que existen hipótesis alternativas para la explicación de los síntomas del paciente, donde cada hipótesis exige que el paciente tenga una enfermedad particular o una combinación de enfermedades. Por lo tanto, el paciente no es escogido a partir de un conjunto de pacientes, sino que es considerado individualmente. Ahora bien, al comparar, en un caso más realista, ambos modelos se ve la plausibilidad del de Chuaqui. Si suponemos que existe un solo síntoma S que se presenta en una enfermedad (Mi) y que ha sido observado (lo que llamaríamos en medicina, un síntoma patognomónico), entonces en el modelo bayesiano tenemos que Pr(S/Mi )=0 para todo j≠i. Usando la regla bayesiana obtenemos Pr ( S / Mi) Pr Mi Pr ( Mi / S) = ———————– = 1 Pr ( S / Mi ) Pr Mi como se esperaría. Sin embargo, esto bloquea pensar en la enfermedad desde un punto de vista evolutivo, es decir, no podemos aplicar de nuevo el modelo bayesiano pues él nos obliga a aceptar la enfermedad dado que esta tiene probabilidad uno. Empero, cambios debido a la observación de otros síntomas no previamente detectados, como es obvio, aún siguen siendo lógicamente posibles, lo que podría consecuentemente alterar el diagnóstico. El modelo de Chuaqui permite tal posibilidad. Aplicando PII al mismo caso (y desconsiderando los detalles) obtenemos PrD [E=S] = 0 para todo j≠i.1 Inicialmente ya que todos los síntomas peores que S para Mj toman probabilidad cero, la probabilidad del rechazo de Mi es cero y por tanto debe ser aceptada. Sin embargo, si suponemos que otros síntomas aparecen, aunque el rechazo de Mi sea muy improbable, se puede plantear finalmente su rechazo. Pero, en este caso, esto significaría que cual 1. PrD(S) es la probabilidad del síntoma S en el paciente que tiene la enfermedad M y, por lo tanto, es distinta de Pr(S/M), ya que no tenemos ninguna distribución común de probabilidad para todas las enfermedades. PrD(S) corresponde al concepto de likelihood matemática de Fischer.
19
quier Mj debería permanecer rechazada. En tal caso el modelo de Chuaqui permite considerar dos opciones: o que las alternativas consideradas no son exhaustivas o el rechazo ya sea de la nueva evidencia o (tal vez lo más sensato) del síntoma patognomónico. La posibilidad de considerar siempre estas alternativas le da obviamente al modelo de Chuaqui una eficacia práctica y una plausibilidad de las cuales no puede gozar el modelo bayesiano. Este ejemplo hace claro, por tanto, que ni siquiera en sus trabajos más abstractos Chuaqui se apartó del ideal de la síntesis y de la conexión con los asuntos humanos más urgentes. Finalmente, en su labor educativa, como pueden atestiguar todos los que trabajamos cerca de Chuaqui, esta actitud de integración era aún más palpable pues, como él indicaba explícitamente en el discurso citado al comienzo, la encarnaba en el aula al conectar la matemática con la filosofía. Por ejemplo, sus investigaciones en fundamentos de la matemática lo llevaron a la filosofía de la matemática, y de allí a la filosofía de la ciencia, y de ahí, a la filosofía en general. Esto lo convirtió en un insistente defensor y difusor del platonismo matemático contemporáneo. Además se interesó crecientemente por las interpretaciones modelo-teoréticas de la estructura de las teorías científicas en la línea de Sneed, Balzer y Moulines, cuando la discusión sobre estas materias en las aulas filosóficas chilenas simplemente no existía. Desde una posición filosófica más general, consumió una parte importante de sus esfuerzos teóricos intentando convencernos, en el aula y fuera de ella, que el escepticismo (en cualquiera de sus formas) era inviable. El sostenía que la única manera de garantizar la objetividad o la intersubjetividad del conocimiento era no intentar ninguna justificación de él. Cualquiera de estas justificaciones debían finalizar, a su juicio, en idealismos o cuasi-idealismos y por tanto se convertirían en victimas potenciales de la voracidad del escéptico. Finalmente, como los que lo conocían intuían, esta última convicción filosófica estaba, al menos, sugerentemente conectada con sus convicciones religiosas, pues, como creyente comprometido, él se sentía próximo a cierta forma de fideísmo de acuerdo a la cual toda necesidad de justificación de la verdad revelada pierde sentido. Ahora se
20
puede adivinar entonces cómo y con qué intensidad Chuaqui vivía el desideratum de la integración y la unidad de conocimientos. Por otra parte, esta actitud de integración, entraba en armonioso acuerdo con su actitud general ante la vida y las personas: su tolerancia, su sencillez, su paciencia y sobre todo su generosidad eran sin duda los más persuasivos y cálidos instrumentos de difusión de sus profundas y muchas veces áridas convicciones intelectuales. Déjesenos decir que en esto la comparación con Carnap es casi inevitable y en nada exagerada. Como Carnap, la tolerancia y la generosidad atravesaban tanto su vida personal como su vida intelectual y le daban un sello propio a su relación con los demás, fuesen colegas, alumnos, o simples desconocidos animados por el simple deseo de saber. Y como Popper recuerda de Carnap también, Rolando Chuaqui vivía al igual que el segundo en una quieta pero absorta devoción a los problemas teóricos, de la cual sólo lo sacaba su intenso deseo de escuchar críticas y observaciones. Hay un célebre dictum atribuido al filósofo norteamericano Donald Davidson que dice "es difícil incrementar la pasión sin disminuir la verdad". Sin embargo este dictum no puede ser verdadero al menos de Chuaqui pues de la manera que él escogió vivir su propio dictum —que todo está conectado con todo—, la pasión fue un vehículo para la búsqueda la verdad y viceversa. Esperamos por ello que esta publicación y las venideras, atestigüen que Chuaqui estuvo entre nosotros para enseñarnos que ambas, la pasión y la verdad, forman el continuo elemental sobre el cual toda vida intelectual adquiere su grandeza y su último sentido. Wilfredo Quezada Renato Lewin
LOGIC AND ONTOLOGY
Oswaldo Chateaubriand
23
LOGIC AND ONTOLOGY
Oswaldo Chateaubriand
Abstract In this paper I discuss the question whether, and in what sense, logic can be considered an ontological theory. After drawing some connections between Aristotle’s conception of logic, Frege’s development of logic, and the further development of modern logic, I conclude that the character of modern logic is fundamentally metaphysical, in a sense that includes both ontology and epistemology. The ontological aspect of logic is related to Aristotle´s view concerning a first science that formulates the most general principles of reality as such. I see Frege’s development of higher order logic as a hierarchy of objects and concepts as a partial realization of Aristotle’s idea. The epistemological aspect of logic is related to the theory of logical deduction, and to the development of the axiomatic method as a methodological method for theoretical science, which also goes back to Aristotle and was greatly extended by the modern development of logic. As part of my discussion I also examine critically Quine’s opposing view that logic does not formulate general laws about the structure of reality, but that it is based on grammar and truth. I argue that in spite of his disclaimers, Quine’s conception of logic also depends on general metaphysical considerations.
24
Resumen En este texto me ocupo de la cuestión de sí la lógica puede considerarse una teoría ontológica y en que sentido. Luego de establecer algunas conexiones entre la concepción de la lógica de Aristóteles, el desarrollo de la lógica por Frege y el desarrollo posterior de la lógica moderna, concluyo que el carácter de la lógica moderna es fundamentalmente metafísica, en un sentido que incluye tanto ontología como epistemología. El aspecto ontológico de la lógica esta relacionado con la concepción de Aristóteles acerca de una ciencia primera que formule los principios más generales de la realidad en cuanto tal. Considero que el desarrollo de Frege de la lógica de orden superior como una jerarquía de objetos y conceptos constituye una realización parcial de la idea de Aristóteles. Los aspectos epistemológicos de la lógica están relacionados con la teoría de la deducción lógica y con el desarrollo del método axiomático como un método metodológico para la ciencia teórica, el cual también se remonta a Aristóteles y que fue ampliamente extendido por el desarrollo moderno de la lógica. Como parte de mi presentación también examino críticamente la posición opuesta de Quine, que sostiene que la lógica no formula leyes generales de la estructura de la realidad sino que esta basada en la gramática y la verdad. Argumento que a pesar de sus alegaciones, la concepción de Quine de la lógica también depende de consideraciones metafísicas generales.
PRELIMINARY REMARKS I was very honored to be invited as the main speaker for the Séptimas Jornadas Rolando Chuaqui Kettlun. I met Rolando in 1963 when we were both students in the Group of Logic and Methodology of Science at Berkeley. After he went back to Chile we did not meet again until 1978, when I was back in Brazil and he invited me to the Fourth Latin American Logic Symposium that he organized in Santiago. We met often thereafter at other Latin
25
American and Brazilian Logic symposia. His death in 1994 was a great loss to all of us, his friends and colleagues, and to logic and foundational studies in Latin America. Rolando and I defended a Platonist view of mathematics, which was the subject of my talk «Platonism in Mathematics» at the Fourth Latin American Logic Symposium —which was part of a longer manuscript that is only being published now (Chateaubriand 2005a)— and the subject of a talk «Platonism as Philosophical Foundation of Mathematics» by Rolando at the Third Brazilian Conference on Mathematical Logic the following year —published in the proceedings of the conference (Chuaqui 1980). In my talk at the Jornadas I commented at some length Rolando’s excellent paper, but taking exception with his view that the paradoxes had shown that any robust form of Platonism in logic and in mathematics had to be abandoned. Such a form of Platonism is elaborated and defended in my book Logical Forms (Chateaubriand 2001 and 2005), and I summarized some of the ideas for logic as formulated in my book. The present text, extracted from the introduction (Chateaubriand 2001: 13-41), gives an outline of my view of the connection between logic and ontology.
1. LOGIC AS AN ONTOLOGICAL THEORY Logic has always been centrally concerned with truth, and truth has been traditionally conceived as an expression of what is real. The strict connection between truth and being was emphasized by Plato and by Aristotle. It was also Frege’s view of truth, though he gave it a new twist by postulating two objects, the True and the False, to which true statements and false statements refer. The connection between logic and truth also goes back to Plato and Aristotle, but Frege stated it in a very specific and distinctive way: logic formulates the laws of truth.1 1. Frege opens his paper «Thoughts» with the following well-known words: "Just as ‘beautiful’ points the way for aesthetics and ‘good’ for ethics, so do words like ‘true’ for logic. All sciences have truth as their goal; but of
26
If logic has as at least part of its task the investigation of laws of truth, and if truth is an expression of reality, then an aim of logic is the investigation of laws of being. The grounds of this ontological aspect of logic were explicitly laid down by Aristotle in the Metaphysics, where some of the basic laws of logic were held to be among "the most certain principles of all things". The law of noncontradiction in particular, which is still considered to be the most fundamental law of logic, was stated by Aristotle as "the most certain" of all such principles (cf. Metaphysics 1005b10-35). Evidently, the formulation of such principles depends on a categorization of reality, and the traditional categorization of reality that has been central to logic is the categorization in terms of objects and properties, or particulars and forms, deriving from Plato. It is through this categorization, and the notion of application (or instantiation, or participation), that the principles of logic are formulated by Aristotle as ontological principles, whether directly or in terms of truth. The principle of non-contradiction, for example, is formulated both as the principle that the same property cannot apply and not apply (at the same time, in the same respect) to the same subject, and as the principle that logic is also concerned with it in a quite different way: logic has much the same relation to truth as physics has to weight or heat. To discover truths is the task of all sciences; it falls to logic to discern the laws of truth. The word ‘law’ is used in two senses. When we speak of moral or civil laws we mean prescriptions, which ought to be obeyed but with which actual occurrences are not always in conformity. Laws of nature are general features what happens in nature, and occurrences in nature are always in accordance with them. It is rather in this sense that I speak of laws of truth. Here of course it is not a matter of what happens but of what is." (Frege [1918] 1984: 351).
This view of logic seems to have been developed by Frege independently of the specific treatment of truth in «On Sense and Reference» (Frege [1892] 1984), where the truth values the True and the False are introduced. It is presented in some detail in the introduction to the first volume of Grundgesetze (Frege 1893) and in two manuscripts titled «Logic» (Frege ([1879-1891] 1979 and Frege ([1897] 1979) in his Posthumous Writings (Frege 1979). In Grundgesetze (pp. xiv-xv) Frege comments in more detail on the two senses of ‘law’.
27
contradictory propositions cannot be true (Metaphysics 1005b18 and 1011b13). Although the connection between these formulations of the principle of non-contradiction is quite close, because any proposition is supposed to attribute a property or relation to some subject(s), they reflect two rather different analyses of logic, which are the basis for the division of modern logic into propositional logic and predicate logic. Propositional logic is generally considered to be a part of predicate logic, but there is a fundamental difference between the two. Propositional logic can be seen as a very broad theory of truth relations between propositions, quite independently of any analysis of the logical structure of propositions and of their linguistic expression. As a general theory of truth relations between propositions it is natural to say that propositional logic formulates laws of truth. The principle of non-contradiction in its second formulation can be taken as the fundamental principle of propositional logic. Predicate logic has two distinct aspects. On the one hand it can be seen as a general theory of properties and objects based on some specific logical properties and operations. Its laws are laws of being in a sense that is very close to Aristotle’s. The principle of noncontradiction in its first formulation is one of the fundamental laws of predicate logic. In this sense predicate logic is not a theory of logical truth, or of logical implication, but a theory of reality. Although one can say that the laws of predicate logic are truths of logic, it does not follow that predicate logic is a theory of logical truth in the sense of a classification of sentences or propositions. The distinction between formulating laws of logic as laws of being and characterizing logical truth and logical implication, brings out the other aspect of predicate logic. This involves a concern with propositional structure and its relation to reality. The connection between predicate logic and propositional logic derives from the analysis of the logical structure of propositions. The modern theory of logical form is a theory of propositional structure in terms of the categories of objects and properties and of specifically logical properties and operations. Through this structuring
28
one can bring together the logical analysis of the general features of reality with the logical analysis of the truth relations between propositions. One of the most fundamental truth relations between propositions is the relation of material implication, which is basically a relation of factual truth preservation. A proposition materially implies another if it is not the case that it is true and the other is not true. Logical implication is a stronger relation than material implication, because it derives from the logical character of the propositions, and not merely from their truth-values. That is, logical implication is an expression of logical necessity, rather than a factual relation between propositions. But truth preservation is a necessary feature of any implication relation, and the usual analysis of logical implication (or logical consequence) in terms of interpretations is a way of reducing logical implication to material implication plus a totality of interpretations. But even if one accepts this analysis of logical implication, it depends on certain metaphysical assumptions. An interpretation can either be conceived as a way in which the world could be, or as an aspect of how the world is. In order for the reduction of logical implication to material implication to work, one must either assume that reality could contain infinitely many objects or that it does contain infinitely many objects, depending on which approach one takes. The second approach normally involves the assumption that reality contains infinitely many mathematical objects —as well as infinitely many properties (or sets), in fact. If this is indeed a feature of reality, it is presumably a necessary feature of it, and it can only be accounted for in those terms. It would be rather odd to have the analysis of logical implication depend on whether or not, as a matter of fact, there are infinitely many objects and properties in the world. It seems to me, therefore, that the combination of propositional and predicate logic should be seen as an investigation of the general structure of reality, including possible and/or necessary features of it, an account of propositional structure, an account of truth relations between propositions, and an account of properties and operations
29
that are specifically logical properties and operations. This is essentially what I mean by logic as an ontological theory.
2. QUINE’S VIEW OF THE RELATION BETWEEN LOGIC AND ONTOLOGY
A rather different approach to the question of the relation between logic and ontology is due to Quine, who claims that if we know that a system of deduction is sound (i.e., is truth preserving) and complete (i.e., can deduce all logical consequences), then we can discard the appeal to ontology in favor of a syntactic notion of deducibility. If we assume an ontological analysis we can justify a syntactic analysis, and therefore we can get rid of the ontological analysis. It is a case of throwing away our ladder after we have climbed it. Quine offers this argument in various places to show that ontology can be eliminated from logic in favor of deducibility, or of proof procedures.2 Of course, the soundness and completeness theorems hold for propositional and first-order logic, but completeness does not hold for other logics such as second-order logic. Well, so much the worse for second-order logic, says Quine —who does not like second-order logic anyway.3 But second-order logic cannot be so easily discarded, because, among other things, it is an integral part of mathematical practice.4 2. See "Logic and the Reification of Universals" (Quine 1961: 116). The same theme is developed in Philosophy of Logic, (Quine 1970: 56-58). 3. Quine’s objections to second-order logic are in Philosophy of Logic, (Quine 1970: 68-72). At the end (p. 72) he uses the fact that there is no complete proof procedure for set-theory and second-order logic as the reason to place them outside the scope of logic. Broadening the totality of interpretations for second-order logic to interpretations of a certain kind, Henkin proved a completeness theorem for this logic. But by generating compactness —i.e., that if the sentence α is a logical consequence of a set of sentences Γ, possibly infinite, then α is a logical consequence of a finite subset of Γ— this seems to falsify the notion of logical consequence of second-order logic. Quine’s arguments against second-order logic are critically discussed by Boolos in «On Second-order Logic» (Boolos 1975). 4. There is a detailed examination of this question in Shapiro (1985) "Second-order Languages and Mathematical Practice".
30
What Quine suggests about second-order logic is that we should replace it by a first-order counterpart such as some system of set theory. But, on the one hand, this does not settle the question of mathematical practice, because that practice involves second-order logic in a way that is not simply reducible to first-order set theory. And, on the other hand, the claim that it is the existence of proof procedures that characterizes logic begs the question; Quine does not deny the ontological character of second-order logic, but disqualifies it as logic precisely because it cannot be reduced to purely syntactic proof procedures. It is essentially the restriction of logic to first-order logic, beginning in the twenties with Skolem and Hilbert5, and strongly defended by Quine, that has encouraged the idea of proof as syntactic. The appeal to the completeness theorem then suggests this rather formalistic approach of Quine’s to the question of ontology in logic. His argument depends on the idea, characteristic of linguistic conceptions, that what matters in logic are the classifications we make. It suggests that any appeal to ontology, or to epistemology for that matter, is basically irrelevant aside from generating a certain classification of sentences. If we can show that this classification can be recovered by purely syntactic means, it follows that we can get rid of whatever ontological or epistemological assumptions we used to begin with. What Quine does not do, but in my view should do for the argument to show the priority of proof over ontological considerations, even for first-order logic, is to discuss the notion of proof, or deduction, aside from a purely formal characterization of proof procedures. What makes this notion philosophically central to logic? It is quite remarkable that in Quine’s extensive work on logic we find no attempt to discuss the notion of proof philosophically. Quine’s elimination of ontology in favor of proof procedures is more in the nature of a reduction to grammar than a reduction to proof in any significant sense, and his main view of logic is indeed in 5. An interesting historical discussion of this question is in Moore (1988) "The Emergence of First-order Logic".
31
terms of grammar and truth rather than proof. As he puts it in Philosophy of Logic: "Logic is, in the jargon of mechanics, the resultant of two components: grammar and truth." (Quine 1970: 60)6 To the extent that Quine holds truth to be a central concern of logic, he agrees with Frege. But why should logic depend on (or result from) grammar? Because the notion of logical truth, which is the main notion of logic for Quine, is held to be characterized by grammar and truth. Let us interpret grammar as logical form —or logical grammar. (Quine’s formulation to which I referred above is supposed to be a generalization of this.) A sentence is a logical truth if all sentences with the same logical form are true; or, alternatively, a sentence is a logical truth if all its substitution-instances are true. If this is not some sort of cosmic coincidence, then there must be something about the logical form that guarantees it. The standard idea is that it is the interpretation of the logical symbols that guarantees it. In doing interpretations that is the one thing that is kept fixed; one is not allowed to fiddle with the interpretation of the logical symbols. This already suggests that the grammar is not so meaningless after all. Why not interpret those symbols in any way we want? Because they are the logical symbols characteristic of logical form. But what do they stand for? It would seem natural that they would stand for logical notions, or logical properties, or logical operations of some sort, but in practice they do not stand for anything. They are logical notions, in some sense, but their content seems to be to be translated away into other expressions of them. In order to define logical truth substitutionally Quine assumes a language that is sufficiently strong to include the truths of first-order arithmetic. His substitutional definitions of logical truth are then justified through the fact that any interpretation for first-order logic can be reflected in such a language —which again depends on an appeal to the completeness theorem and to a form of the LöwenheimSkolem theorem. 6. His grammatical characterization of logical truth is introduced in p. 58.
32
Quine’s grammatical characterization of logical truth is supposed not only to avoid an ontological interpretation of logic, but also to avoid any appeal to possibility, necessity, and meaning in connection with logic. The sense in which ontology, necessity, possibility, and meaning are avoided by these grammatical definitions is not altogether clear, however. In the case of interpretations we know that if we are dealing with actual interpretations rather than possible interpretations, we depend on there being enough things in reality to give us all the interpretations we need. Similarly, if we are dealing with sentences which are actually true rather than possibly true, we also depend on there being enough things in reality to disqualify various sentences as logical truths —for example, a sentence that asserts that there are at most n objects, for sufficiently large n. If we assume that reality contains the objects and structures of mathematics, then there is no problem, and something like this is generally assumed. Quine’s assumption that his language contains the truths of firstorder arithmetic is a version of precisely that assumption. And Quine must appeal to arithmetical truth in an ontological sense because the attempt to replace the ontological notion of mathematical truth by a structural (syntactic) notion of mathematical truth characterized in terms of proof did not work. What are the basic properties of truth? The laws of non-contradiction and of excluded middle. And what are their deductive counterparts for formal systems? Consistency and completeness of the formal system. Consistency for a formal system means that contradictions are not provable in that system; completeness for a formal system means that of a pair of contradictory sentences of the system at least one is provable in it. Therefore, if we have a consistent and complete formal system, the notion of theorem of the system may be considered a reasonable substitute for the notion of truth, at least in the sense that it has two very fundamental features of truth. The problem is that any formal system that includes a modicum of arithmetic —i.e., that can represent the primitive recursive functions— is either inconsistent or incomplete; which is the content of Gödel’s first incompleteness theorem7. 7. The philosophical (and mathematical) project of replacing the notion of
33
Quine claims that his assumption is very modest, but from an ontological point of view he is assuming that reality has a rather complex infinite structure, which on any reasonable view should be a necessary feature of it. So, in effect, even for first-order logic, his argument depends on assumptions which are naturally taken to be about the necessary structure of reality rather than about grammar and about truth in the sense of a mere classification of sentences.
3. LOGICAL PROPERTIES, LOGICAL TRUTH, AND LOGICAL FORM Logic is supposed to be universal in some sense, yet not an ontological theory. It is actually suggested that this derives precisely from the universality of logic. In terms of interpretations the suggestion is that since logic must hold in every interpretation, and interpretations come in all shapes and sizes, it cannot be about anything in particular. Another way of putting the thesis is to say that logic has no existential commitments; that it does not imply or presuppose the existence of anything.8 Everybody would agree, of course, that logic should not imply the existence of non-logical entities such as tables and chairs — something like this was one of the main problems with Russell’s axiom of infinity9. But the question is, or should be, whether logic says something about the structure of reality, and in particular whether there are specifically logical entities of some sort. In my view there are. mathematical truth by the notion of theorem of a first-order formal system was an important aspect of Hilbert’s project for the foundations of mathematics. This project has characteristics that are similar to those of other philosophical projects that attempt to justify transcendental notions in terms of a given that is subjectively clear —phenomenalism, for instance— and was definitely refuted, at least in its original formulation, by Gödel’s theorems. 8. A very explicit formulation of this view is in Hale "Is Platonism Epistemologically Bankrupt?" (Hale 1998: 92). 9. This axiom is part of the system of Principia Mathematica, and its rejection as a logical axiom is entirely justified. The problem was not only the assertion of existence of non-logical entities, but the assertion that there are infinitely many such entities.
34
If we assume the kind of categorization of reality which Frege used, and which still underlies standard logical practice, logic treats of objects, properties (concepts) of objects, relations among objects, properties of properties of objects, relations among properties of objects and objects, etc. That is, one has a hierarchy of levels beginning with objects (level 0), continuing with properties and relations of theseobjects (level 1), and so on, indefinitely. Are there among these entities some that have the character of universality that one would expect of logical entities? Leaving aside the question as to whether there are logical objects at level 0, suppose that we start at level 1.10 There seem to be only two kinds of relations at this level that are universal in the required sense; namely, Identity and Diversity relations —I will capitalize logical properties. There are actually infinitely many of these; for example, there are pairwise Diversity relations for all arities (i.e., number of arguments) greater or equal than 2. But at the second level is where things begin to get really interesting. As Frege saw it, the first-order quantifiers (quantifying over level 0) appear at level 2 as properties of properties of level 0 objects. Frege emphasized that existence is not a property of objects but of concepts —his terminology for properties. ‘There are philosophers’ asserts something about the property of being a philosopher —namely, that it does not have an empty extension— and not about the individuals who are philosophers.11 Therefore, the use of quantification over level 0 objects «generates», in a manner of speaking, a large number of logical properties of level 2. Subordination between level 1 properties, for example (Aristotle’s ‘All A is B’); Exclusion (‘No A is B’); etc. And as Frege showed in Grundlagen (Frege 1884), the Cardinality relations between level 1 properties —e.g., the level 1 property F applies to the same number of level 0 10. The assumption that there are specifically logical objects at level 0 raises some difficult questions that I will not discuss here. 11. One can hold, however, that Existence is a property of objects, in which case it would appear at level 1. It would also appear at all higher levels as a property of properties distinguishable from the property expressed by existential quantification.
35
objects as the level 1 property G— also appear at level 2. And there are many, many more. In fact, there are infinitely many logical properties at all levels. This view of logical properties also suggests an approach to logical truth that is independent of linguistic forms and that shows the connection between the laws of logic and the logical truths. Is it a logical truth that every object is self-identical? Well, yes, in the sense that it is a law of logic that for any object x, x = x. This can be understood as asserting Reflexivity —i.e., a certain level 2 property expressed by the universal quantifier— of the level 1 Identity relation. The logical truth ‘∀x (x = x)’ is an expression of this feature of Identity and, therefore, an expression of the logical law. But is it the case that specific sentences of the form ‘a = a’ are logical truths? I would say that sentences of the form ‘a = a’ are not logical truths, in the sense of being true in virtue of logical or grammatical form, because logic does not guarantee that the expression substituting ‘a’ has denotation, and, therefore, does not guarantee that a sentence of that form is true. If one holds, with Frege, that sentences containing expressions that do not denote are neither true nor false, then it is quite obvious that grammar is not a source of logical truth —because it is not a source of truth. Since in fact this holds for any sentences containing non-logical expressions, be they names or predicates, the only guaranteed logical truths will be sentences such as ‘∀x (x = x)’ consisting exclusively of logical notions. What accounts for their truth, however, are the logical notions (or properties), not grammar. Sentences can only be considered to be logically true in something like a grammatical sense relative to certain assumptions concerning the nature of the logical expressions and the denotation of the nonlogical expressions that they contain. This is what one does in the usual semantic characterization of logical truth by limiting the totality of interpretations to those in which the logical symbols denote (or get translated as) the «right» things, and the non-logical symbols always denote something. What this suggests, however, is that it is the ontological analysis, rather than the grammar, that accounts for logical
36
truth. To assume that the non-logical «constants» must always denote is tantamount to declaring that one wants to deal with reality, not with grammar.12 Why not then formulate the law of identity by saying that every object is (necessarily) self-identical rather than talk about grammar? In addition, by taking logical truth to be a feature of sentences one is assuming that each sentence has a definite logical form. But as far as ordinary sentences are concerned none of these assumptions are justified. What one really does is to work with a language of pure forms, the logical languages, conceived syntactically. It seems more natural to conceive of these languages as directly expressing the logical properties than as expressing sentential forms. That is, the usual so-called logical grammars are really theories of logical properties, and the linguistic forms represent these properties. The real forms are the properties themselves. The combination of grammar and truth only seems to work because one makes enough ad hoc assumptions to guarantee that the notion of logical truth will come out right —i.e., in agreement with the basic ontological content of the laws of logic. If truth is an expression of reality, logical truth should also be an expression of reality —it should express certain necessary features of reality. The idea that logical truth has to do with logical form is natural enough, but the idea that logical form is a grammatical feature of sentences (or is syntactic) seems to me completely unnatural. Take the sentence ‘Theaetetus is sitting', for instance. Its logical form is represented by, say, ‘Fa’. In my view it is not the expression ‘Fa’ that can be considered to be a logical form, but the logical property Application (or Instantiation) of a certain type; this property is expressed linguistically by the juxtaposition of a property letter ‘F’ to an object letter ‘a’. I agree that the expression ‘Fa’ represents 12. In Philosophy of Logic Quine (1970) does the same thing in a different way by leaving names out of his logical grammar and by assuming that he is only dealing with predicates for which that sort of failure cannot occur. To each denotationless name then corresponds a predicate with an empty extension.
37
the logical form, but this is not a purely syntactic feature of it. To analyze the sentence ‘Theaetetus is sitting’ as having the logical form ‘Fa’ is to analyze it as expressing the instantiation of a property by an object, with the specific association of the property ‘sitting’ to ‘F’ and the object Theaetetus to ‘a’ —where ‘F’ and ‘a’ are thought of as non-logical constants. We may also say that we are analyzing the form of the sentence ‘Theaetetus is sitting’ as corresponding to a certain type of state of affairs consisting of the instantiation of a property in an object. States of affairs are quite independent of language, and that Identity is Reflexive can be considered to be a logical state of affairs; a matter of logical necessity one might say, or a logical law. But for each object its self-identity is also a matter of logical necessity, though it is not a logical law that, say, Hesperus is self-identical. The existence of Hesperus is a contingent matter, and so is the existence of the state of affairs of Hesperus’ self-identity, even though it involves a logically necessary feature of Hesperus.
4. LOGIC AS SCIENCE As Frege said, the laws of logic are not merely laws of what happens but of what is, in the sense that they express fundamental features of the structure of reality. The relation of the law of identity to the logical truth that Hesperus is self-identical seems to me analogous to the relation of a law of physics to a specific consequence of that law (a physical truth, say) concerning Hesperus. Just as it is not the primary business of physics to classify sentences into physical truths and others, it is not the primary business of logic to classify sentences into logical truths and others. These classifications are derivative from the laws of these sciences. It is precisely because I take the laws of logic to express fundamental features of reality that I see logic as a science, or as a theory, rather than as a language. As other sciences logic came to maturity by the application of the axiomatic method developed initially by Aristotle. And it was with Frege’s first axiomatization in Begriffsschrift that logic was born as
38
a mature science. Not really by rejecting Aristotle’s logical project but by improving on it.13 The axiomatic method is an epistemological method, and Frege’s axiomatization of logic was just as much part of his epistemology of logic as Newton’s axiomatization of mechanics was part of his epistemology of physics. Theory making is an epistemological affair. Frege did not base his theory of logic primarily on an analysis of language but on ontological and epistemological considerations. Yet his idea of logic as formulating the laws of truth was also meant to delimit the scope of logic vis-à-vis both ontology and epistemology. Frege’s second axiomatization in Grundgesetze was a rather direct attempt to express the laws of logic as laws of truth, with the truthvalues the True and the False playing a very central role. But given the peculiar character of these objects, they seem to be a merely formal expedient. In his last publications on logic Frege no longer explicitly appeals to truth-values as objects, although the conception of logic as formulating the laws of truth is still there and is expressed in much the same terms that he used in the introduction to Grundgesetze. In «Thoughts» Frege ([1918] 1984) argues rather strongly against a view of truth in terms of correspondence, maintaining that it is both obscure and question begging, and concludes that truth is sui generis and undefinable. It pertains to logic to spell out the contents of this notion in the laws of truth. It must be assumed that for him this spelling out is an axiomatic spelling out akin to Newton’s axiomatic spelling out of the contents of the notion of motion. We do not ask anymore what motion is, in a direct definitional sense, but what its laws are. Similarly, I see Frege’s suggestion in «Thoughts» as a suggestion that one should not ask what truth is in a direct definitional sense, but what its laws are; and that this is the task for logic. This is not a linguistic (or syntactic) view of logic, though, for truth for Frege is in reality, not in words or 14 in 13.thoughts. To appreciate the continuity between Frege’s project and that of Aristotle see Lear (1988) chapter 6. 14. This is quite clear when Frege contrasts his conception of logic to the psychologistic conception in the introduction to The Basic Laws (1893) (p. xvi).
39
The paradoxes discredited Frege’s system while keeping certain aspects of his formalism more or less above the fray. Eventually thisformalism became somewhat independent of the philosophical dispute and gave way to the notion of formal language. There is an important ambiguity in this notion, however, for one must distinguish the use of a special notation in formulating one’s theories about reality from the notion of formal language in the sense in which mathematical logic is said to be a theory of formal languages. Frege’s conceptual notation was an example of the former, though it also inspired the latter. Frege’s system of notation is linguistic and has the characteristics and limitations of language generally. Formal languages, on the other hand, are not languages at all but abstract mathematical structures, which can even be conceived as generalized arithmetics 15 , that are correlated in various ways with other mathematical structures. From a Fregean point of view, they can also be seen as complex higher order properties.16 The result of mixing up these two altogether different things is that logic as a theory, in Frege’s sense, gets conceptualized as a formal language, which is both an abstract mathematical structure that can be correlated with other mathematical structures, and something linguistic. As a logical language it has some kind of definite content, yet it is not a theory of anything; it is rather like a schema that can be used in the formulation of theories.17 Logic as theory is then the theory of one or another formal language, or of many of them. This leads to a view of logic as an autonomous mathematical discipline that studies formal systems. The philosophical content of logic is not necessarily denied on this view, but it is conceptualized in terms of philosophical implications of the mathematical theory to be studied 15. See Kleene (1952) §50. 16. This was Frege’s point about Hilbert’s formal axiomatization of geometry. In "The Foundations of Geometry" (Frege [1903] 1984: 374) he argues that what Hilbert’s axiom system defines is a second level concept. 17. But Frege encouraged this sort of interpretation to some extent by referring to certain formulas of his concept script as "empty schemata". See «On the Aim of "Conceptual Notation"» (Frege [1882] 1972: 97).
40
in the philosophy of logic. Although there is a certain amount of truth in this view, I think that it puts the cart before the horse, for as I see it logic is philosophy studied and developed mathematically. Physics did not cease to be physics by being mathematized; similarly, logic did not cease to be metaphysics by being mathematized. The sense in which mathematical logic is an autonomous mathematical discipline seems to me exactly the same sense in which mathematical physics is an autonomous mathematical discipline. This is not to deny the importance of this mathematical development; on the contrary, I consider it the most significant ontological and epistemological advance in modern times. The view of logic as metaphysics (in a sense that includes both ontology and epistemology) is not unusual and has been a major point of dispute throughout the century. Opponents of classical logic often maintain that it should be rejected precisely because they see it as a metaphysical (realistic) theory. Curiously enough, however, many defenders of classical logic chose to fight on the grounds that it is not—a notable exception was Gödel, but he was definitely part of a small minority18.
18. Like Frege, Gödel was influenced by Leibniz, and he opens his paper "Russell’s Mathematical Logic" with the following words: "Mathematical logic, which is nothing else but a precise and complete formulation of formal logic, has two quite different aspects. On the one hand, it is a section of Mathematics treating of classes, relations, combinations of symbols, etc., instead of numbers, functions, geometric figures, etc. On the other hand, it is a science prior to all others, which contains the ideas and principles underlying all sciences. It was in this second sense that Mathematical Logic was conceived by Leibniz in his Characteristica universalis, of which it would have formed a central part." (Gödel [1944] 1964: 211)
41
REFERENCES Boolos, G. (1975): "On Second-order Logic", The Journal of Philosophy, 72, pp. 509-527. Chateaubriand, O. (2001): Logical Forms – Part I: Truth and Description. Campinas: Unicamp. Chateaubriand, O. (2005): Logical Forms – Part II: Logic, Language, and Knowledge. Campinas: Unicamp. Chateaubriand, O. (2005a): "Platonism in Mathematics", Manuscrito 28, pp. 201-230. Chuaqui, R. (1980): "Platonism as Philosophical Foundation of Mathematics", in Arruda, A.; da Costa, N. C. A. y Sette, A. M. (eds.): Proceedings of the Third Brazilian Logic Conference on Mathematical Logic. São Paulo: Sociedade Brasileira de Lógica, pp. 35-48. Frege, G. (1879): Begriffsschrift: eine der Arithmetik nachgeformte Formelsprache des reinen Denkens. Hale: L. Nebert. Translated in van Heijenoort (1967: 5-82), and in Conceptual Notation (Frege 1972: 101-203). Frege, G. ([1882] 1972) "On the Aim of Conceptual Notation", in Conceptual Notation (Frege 1972: 90-100). Frege, G. (1884): Die Grundlagen der Arithmetik. Eine logischmathematische Untersuchung über den Begriff der Zahl. Breslau: W. Koebner. English translation: The Foundations of Aritmetic: A Logico-Mathematical Enquiry into the Concept of Number. Oxford: Blackwell, 1950. Frege, G. ([1892] 1984) "On Sense and Reference", in Collected Papers (Frege 1984: 157-177). Frege, G. (1893, 1903) Grundgesetze der Arithmetik, Begriffsschriftlich abgeleitet I, II. Jena: H. Pohle. Translated and edited by M. Furth: The Basic Laws of Aritmetic: Exposition of the System. Berkeley and Los Angeles: University of California, 1964. Frege, G. ([1903] 1984) "On the Foundations of Geometry". In Collected Papers (Frege 1984: 273-284).
42
Frege, G. ([1918] 1984) "Thoughts", in Collected Papers (Frege 1984: 351-372). Frege, G. (1972): Conceptual Notation and Related Articles. Translated and edited by T.W. Bynum. Oxford: Clarendon Press. Frege, G. (1979): Posthumous Writings. Edited by H. Hermes et al. Oxford: Blackwell. Frege, G. ([1879-1891] 1979) "Logic", in Posthumous Writings (Frege 1979: 1-8). Frege, G. ([1897] 1979) "Logic", in Posthumous Writings (Frege 1979: 126-151). Frege, G. (1984): Collected Papers on Mathematics, Logic, and Philosophy. Edited by B. McGuinness. Oxford: Blackwell. GÜdel, K. ([1944] 1964): "Russell’s Mathematical Logic", in Benacerraf, P. and Putnam, H. (eds.): Philosophy of Mathematics: Selected Readings. Englewood Cliffs, N.J.: Prentice-Hall, pp. 211-232. Hale, B. (1998): "Is Platonism Epistemologically Bankrupt?", in Schirn, M. (ed.): Philosophy of Mathematics Today. New York, N.Y.: Oxford University Press, pp. 77-98. Kleene, S.C. (1952): Introduction to Metamathematics. New York and Toronto: Van Nostrand. Lear, J. (1988): Aristotle: The Desire to Understand. Cambridge: Cambridge University Press. Moore, G.H. (1988): "The Emergence of First-order Logic", in Aspray, W. & Kitcher, P. (eds.): History and Philosophy of Modern Mathematics. Minneapolis: University of Minnesota Press, pp. 95-135. Quine, W.V. (1961): "Logic and the Reification of Universals", in Quine, W. V. From a Logical Point of View. Cambridge, Mass.: Harvard. pp. 102-129. Quine, W.V. (1970): Philosophy of Logic. Englewood Cliffs, N.J.: Prentice-Hall.
43
Shapiro, S. (1985): "Second-order Languages and Mathematical Practice", The Journal of Symbolic Logic, 50, pp. 714742. Van Heijenoort, J. (ed.) (1967): From Frege to Gödel. Cambridge, Mass.: Harvard. Whitehead, A.N. & Russell, B. (1910-1913): Principia Mathematica I, II, III. Cambridge: Cambridge University Press.
Oswaldo Chateaubriand Pontifícia Universidade Católica do Rio de Janeiro - Brasil oswaldo@rdc.puc-rio.br
REVISIONISMO Y COGNITIVISMO EN FILOSOFÍA DE LAS MATEMÁTICAS
Wilfredo Quezada Pulido
47
REVISIONISMO Y COGNITIVISMO EN FILOSOFÍA DE LAS MATEMÁTICAS
Wilfredo Quezada Pulido Resumen En este artículo discutiré las implicaciones metodológicas del naturalismo de Maddy para la cognición matemáticas. Primero, delineo las tesis básicas del revisionismo naturalista interno de Maddy. Luego indicaré el que parece ser el mejor argumento de Maddy a favor de su revisionismo y en contra del holismo confirmacional de Quine: la aceptación del axioma de cardinales medibles (CM). En tercer lugar, precisaré algunas cuestiones sobre revisionismo a la luz de una discusión reciente sobre el tópico, y que sugieren la dificultad central de la posición de Maddy: su relativismo epistemológico. A continuación, argumento que Maddy no puede liberarse de este relativismo simplemente porque no puede explicar cómo y porqué es posible el cambio en matemáticas y discuto de qué manera esta crítica afecta los argumentos de otros autores así como los argumentos de Maddy a favor de CM. Finalmente, intentaré mostrar, usando la teoría de matemática corporeizada de G. Lakoff y Nuñez cómo se puede formular una explicación cognitivo-naturalista a favor de conjuntos constructivos. Esta explicación puede dar una indicación también de por qué la mayoría de los teóricos de conjuntos favorecen CM.
48
Abstract In this paper I will discuss the methodological implications of Maddy’s mathematical naturalism for mathematical cognition. First, I present the basic thesis advocated by Maddy and her best argument for internal revisionism (the acceptance of MC). Second, I examine the methodological usefulness of holding the distinction external revisionism vs. internal revisionism. Third, I discuss the epistemological relativism affecting Maddy’s account and pointed by several authors. I then argue that Maddy cannot deal with this criticism simply because she is not concerned to explain how and why the change in mathematics is possible. To set out the scene, I discuss how this criticism undermines Maddy’s own naturalistic arguments in favor of MC as well as some arguments by other authors. Finally, I show by using Lakoff’s cognitive theory of embodied mathematics how a cognitive naturalistic explanation for a constructivist conception of sets can be provided, and thereby I illuminate in cognitive terms why most set-theorists take side for MC.
INTRODUCCIÓN Como muestran algunas publicaciones recientes, la discusión acerca del revisionismo en filosofía de las matemáticas ha emergido con fuerza. P. Maddy en particular ha defendido un revisionismo interno de la matemática y rechazado cualquier intento de reforma externa de ella. Los orígenes de este revisionismo interno son normalmente asociados a la concepción naturalista de Quine y a los argumentos antifilosóficos del segundo Wittgenstein. Ambos, como es sabido, rechazan apelar a cualquier filosofía primera para describir la realidad. Por otro lado, ya que la matemática es una parte fundamental de la ciencia, el naturalismo estipula que la primera debe ser tan falible y corregible como el resto de las disciplinas científicas. Sin embargo, Maddy sostiene que a pesar de su base naturalista, el revisionismo interno es incompatible con el naturalismo de Quine debido a que el holismo que caracteriza este último no cuadra bien con los métodos que los matemáticos realmente usan. Por ejemplo, el holismo requeriría que la metodología que rige la práctica de la
49
matemática (que rige cuestiones de aceptación y rechazo de hipótesis o teorías en ésta) tome en cuenta desarrollos en la aplicación de la matemática a la física. En particular, los matemáticos trabajando en teoría de conjuntos con cardinales grandes o muy grandes e intentando resolver cuestiones relativas a las implicaciones de aceptar el axioma de constructibilidad (V=L) 1 o el axioma que afirma la existencia de cardinales medibles (CM) 2 deberían tomar en cuenta la aplicación de la matemática del continuo en la física cuántica, ya que en ésta rechazamos el supuesto de un continuo material. Pero, como cualquiera podría comprobar, los matemáticos que hacen teoría de conjuntos no muestran más interés en tales desarrollos que cualquier observador neutral. En contraste al holismo naturalista, Maddy favorece por tanto una concepción metodológica radical, que, aunque acepta el naturalismo, rechaza el holismo quineano y se concentra sólo en la práctica matemática sin tomar en cuenta nada del resto de la práctica científica. Es esta posición y sus implicaciones para la cognición matemática la que someteremos a investigación crítica aquí. De nuestra investigación esperamos que emerja la convicción de que si bien el naturalismo es la vía correcta para tratar las cuestiones fundamentales de la filosofía de la matemática, cuando ponemos el foco en la cognición matemática no necesitamos quedar presos ni del holismo ni del revisionismo interno. 1. Este axioma fue propuesto originalmente por Gödel en 1938. ‘V’ corresponde al universo de los conjuntos y ‘L’ a la clase de todos los conjuntos construibles de acuerdo a una condición recursiva (más adelante damos más detalles técnicos). Este axioma implica por tanto una restricción sobre los conjuntos aceptables, pues conjuntos no definibles de acuerdo a dicha condición no resultarán aceptables en la teoría estándard de conjuntos. A cambio, V=L implica tanto la hipótesis del continuo como el axioma de elección y permite por tanto responder muchas cuestiones abiertas en la mencionada teoría. Sin embargo, como tendremos oportunidad de mostrarlo, este axioma genera más controversia que acuerdo entre los teóricos conjuntistas. 2. Un cardinal medible, en primera aproximación, es un cardinal más grande que un cardinal inaccesible con una medida no trivial K-completa con dos valores definida sobre todos los subconjuntos de K. Asi como los cardinales inaccesibles implican V=L, los cardinales medibles implican, como probó Scott, su rechazo.
50
1. LA POSICIÓN DE MADDY: REVISIONISMO NATURALISTA INTERNO (RNI) La discusión sobre revisionismo vs. antirevisionismo en matemáticas, ha sido enfatizada recientemente entre otros por Burgess y Rosen (1997), Maddy (1997) y Shapiro (2000). En particular, P. Maddy, a cuyo trabajo brindaremos una atención preferente en este artículo, ha replanteado la cuestión de la imposibilidad de un revisionismo externo. La posición de Maddy se puede resumir en un conjunto de cinco tesis que especificaré a continuación con el propósito de facilitar la discusión. A. Rechazo al revisionismo externo: En este caso Maddy recomienda olvidarse de cualquier pretensión filosófica de introducir reformas en las teorías matemáticas, como aquellas propiciadas por Frege, Russell o Brouwer. Según Maddy, "[...] si nuestra explicación de la matemática entra en conflicto con la práctica matemática exitosa, es la filosofía la que debe ser abandonada [...] [L]a meta de la filosofía de la matemática es explicar la matemática que se practica, no propiciar reforma." (Maddy 1997: 161)
B. Aceptación del naturalismo quineano: Maddy argumenta extensamente a favor de introducir el naturalismo epistemológico de Quine a la matemática. Esta última, según ella, es parte de una indagación de la realidad "falible y corregible pero no susceptible de ser sometida a ningún tribunal supracientífico" (Quine 1986: 92). C. Aceptación de un revisionismo metodológico interno: Según Maddy, ya que la ciencia natural misma, de acuerdo a las enseñanzas epistemológicas de Quine, es una empresa autocrítica que desarrolla y debate sus propias normas metodológicas, es razonable que el filósofo naturalista pueda participar en esta tarea crítica. Sin embargo, dado su rechazo al revisionismo externo, según Maddy, la única opción abierta para dicho filósofo en tal caso es tomar pres
51
tado sus métodos no de la filosofía sino de la ciencia objeto de su crítica o examen. En sus palabras, "Los únicos métodos disponibles son los científicos; para el naturalista, la evaluación y valoración de los métodos científicos debe tener lugar dentro de la ciencia, usando aquellos mismos métodos." (Maddy 1997: 181)
D. Rechazo del holismo confirmacional del naturalismo quineano: El holismo confirmacional del naturalismo quineano implica inevitablemente aceptar que la aplicabilidad de la matemática debe afectar centralmente la metodología de esta última. Por tanto, según Maddy, "en esta visión, [...], la matemática va de la mano con la ciencia con la cual funciona: la confirmación empírica de la teoría como un todo confirma la matemática envuelta en aquella teoría; la disconfirmación expone la matemática, como el resto, a revisión." (Maddy 1997: 102)
Pero, característicamente, Maddy rechaza esta implicación del programa quineano sobre la base que la práctica científica concreta no se ajusta a la explicación holista de la confirmación de Quine. En sus palabras, "[...] en la práctica, los científicos no ven el éxito empírico global de una teoría como confirmando todas sus partes [...] Esto sugiere que hay algo errado con las premisas quineanas. Una forma de examinar este problema es sostener que el responsable [de estos errores] es el holismo y concluir que la noción holística de una teoría científica homogénea, confirmada por la experiencia como una unidad, es una representación demasiado simplificada de cómo la ciencia natural de hecho se comporta." (Maddy 1997: 142 y s.)
E. Rechazo del argumento de indispensabilidad de Quine El holismo confirmacional, según Quine, implica a su vez la aceptación de una ontología de entidades matemáticas, pues la aplicación exitosa de la matemática en una teoría empírica presupone dichas entidades y, como dijimos, la confirmación de esta última confirma la primera. Esta es una formulación (posible) del famoso argumento de
52
indispensabilidad de Quine. Sin embargo, para Maddy, por las mismas razones que se debe rechazar el holismo confirmacional se debe rechazar la indispensabilidad y su consiguiente platonismo, Como remarca Maddy, "[...] el problema de la defensa de la indispensabilidad [de Quine] es que choca con la práctica real de la matemática" (Maddy 1997: 108) A la conjunción del holismo confirmacional y la tesis de indispensabilidad las llamaré de aquí en adelante la concepción del holismo naturalista (HN) de Quine.
2. EL TEST CRÍTICO A FAVOR DE REVISONISMO NATURALISTA INTERNO (RNI)Y CONTRA EL HOLISMO NATURALISTA (HN) En particular a Maddy le interesa mostrar que sus argumentos contra HN se pueden aplicar directamente a la teoría de conjuntos, es decir, en relación a cuestiones fundacionales. Según Maddy, si las aplicaciones a la ciencia empírica fueran, de acuerdo a HN, los árbitros de la ontología matemática entonces los matemáticos trabajando sobre cuestiones de independencia en teoría de conjuntos no podrían tomar una decisión sin antes examinar los desarrollos en teoría cuántica. Ya que estos desarrollos estan en desacuerdo con la matemática del continuo, la metodología de la teoría de conjuntos debería depender de cómo "la cuestión de la aplicación literal de la matemática del continuo es resuelta" (cf. Maddy 1997: 159). Esto significa que tales matemáticos deberían estar vitalmente interesados en las cuestiones de renormalización en teorías de campo cuántico, de gravedad cuántica y otras aplicaciones de la matemática del continuo. Pero como indica Maddy, los matemáticos trabajando en teoría de conjuntos no parecen atender a dichas cuestiones más que cualquier otro observador neutral. El test crítico favorito de Maddy para mostrar lo anterior consiste en desafiar la opinión de Quine de acuerdo a la cual consideraciones emergiendo de HN, es decir, consideraciones que fluyen de la aplicabilidad de la matemática, apoyan el axioma de Gödel de constructibilidad V=L. Este último, en opinión de Quine, "desactiva
53
los vuelos más gratuitos de la teoría superior de conjuntos e incidentalmente implica el axioma de elección y la hipótesis del continuo" (Quine 1990: 95). Haciendo notar lo irónico de esta posición, que se opone a la opinión de la mayoría de los teóricos conjuntistas implicados en la actual práctica matemática, Maddy se propone mostrar que sólo RNI da sentido filosófico a dos tesis: (i) que en ZFC3 V=L debería ser rechazado, y (ii) que, en acuerdo con la práctica y la metodología internas de la teoría de conjuntos, debemos aceptar que existen cardinales medibles (CM), es decir, cardinales muy grandes inaccesibles y que no son construibles. Lo que, adicionalmente, da sentido filosófico a la demostración de Scott de CM → V≠L (cf. Maddy 1997: 82ss. y 110ss.).
3. CRÍTICAS Y CONTRACRÍTICAS DEL REVISIONISMO NATURALISTA INTERNO (RNI) En una serie de artículos sobre el tema, Barceló (2004) y Pinto (2004) han discutido extensamente las implicaciones de RNI y por tanto del antirevisionismo metafísico de Maddy. En Quezada (2005) he reevaluado a su vez las críticas de Barceló y Pinto, las que resumiré brevemente aquí por el bien de mi argumento. En términos generales me parece que tanto Barceló como Pinto capturan por un lado aspectos valiosos relacionados con el problema planteado por Maddy pero, por otro, desatienden algunos aspectos importantes. A. Críticas valiosas de Barceló En primer lugar, Barceló clarifica lo que debemos entender por revisionismo interno y revisionismo externo. Según él, una filosofía de las matemáticas es internamente revisionista si busca establecer, transformar o rechazar criterios matemáticos de justificación y existencia, a partir de otros criterios y medios matemáticos; y externa o metafísicamente revisionista si desde una posición externa a las matemáticas, sea filosófica o no-filosófica, busca hacer lo mismo considerando dichos criterios qua criterios de existencia y justifica 3. La teoría de conjuntos de Zermelo-Fraenkel más el axioma de elección (choice axiom).
54
ción real (sea como sea que definamos este último término y el área de la realidad acotada por la posición particular). En segundo lugar, Barceló se une a otros autores (por ejemplo, Dieterle 1999, Tennant 2002) al sostener que la defensa simultánea de un antirevisionismo metafísico o externo y de un revisionismo interno vuelven en conjunto la matemática y su práctica peligrosamente autónomas de cualquier otra ciencia, lo que lleva inevitablemente a abandonar la empresa total de la justificación de dicha disciplina. En particular, esta crítica implica que la respuesta de Maddy al HN, aunque eficaz para la cuestión de la metodología, impide justificar la matemática y la vuelve una empresa tan acientífica como la astrología, es decir, nos lleva a situarnos en la misma posición de un naturalismo astrológico que no da cuenta de sus métodos y criterios fuera de la astrología misma. Llamaré a esto el problema del relativismo metodológico. Finalmente, la crítica de Barceló muestra que, más allá de la cuestión del revisionismo externo vs. interno, una filosofía de las matemáticas que enfatiza excesivamente las prácticas llevará inevitablemente a descuidar las cuestiones sustantivas de existencia y justificación. B. Un problema con las críticas de Barceló El problema fundamental, a mi juicio, en la argumentación de Barceló es que ella sugiere que la salida al relativismo de Maddy debe ser el (eterno) retorno a un revisionismo metafísico o externo. En otras palabras, que admitir dicho revisionismo sea una condición (al menos necesaria) para superar el desafío del holismo naturalista. Esto, en mi opinión, desplaza el valor de la revisabilidad a una posición que no le corresponde. La revisabilidad de la matemática y sus posibles limitaciones siempre será la consecuencia de una posición epistémica general, sea el naturalismo de Quine, el naturalismo metodológico de Maddy u otra posición. Es decir, «revisable» o «norevisable» son categorías heurísticas, dentro de una metodología, garantizadas o no por una concepción filosófica general que toma en cuenta las prácticas concretas. Y esto me lleva a la crítica de Pinto.
55
C. Críticas valiosas de Pinto Pinto, acertadamente a mi juicio, argumenta que si uno examina la lógica y la historia de las prácticas concretas de la matemática no encuentra soporte alguno para sostener la distinción revisionismo (o antirevisionismo) externo / revisionismo (o antirevisionismo) interno, lo que la vuelve una construcción artificial. Esta artificialidad se deja ver además cuando Barceló sugiere que aquel que, contra lo que parecería, sostiene que las contribuciones de Frege, Hilbert y Russell no fueron revisiones externas sino internas, está cometiendo una petición de principio pues admitiría una visión histórica de vencedores, de acuerdo a la cual "los filosófos [¿?] serían presentados como matemáticos cuando sus propuestas son exitosas, y como revisionistas metafísicos cuando no lo son" (Barceló 2004: 152). Esta visión es posible pero dudo mucho que cualquier historiador profesional de las matemáticas la haría suya, pues significaría que ningún matemático-filósofo (o matemático-matemático, si uno quiere) podría cometer errores qua matemático. De este modo, en esa historia vencedora se debería decir, por ejemplo, que la defensa de Leibniz y otros que 1−1+1−1+1 ... = 1/2, o la insistencia de Cauchy de que no se podían ofrecer representaciones en términos de series trigonométricas de funciones arbitrarias, fueron errores metafísicos. No conozco ninguna historia de las matemáticas en que se afirme seriamente ese tipo de cosas. Por otro lado, es evidente que se podría construir una historia vencedora invertida en la que los vencedores son los metafísicos y en la que los errores corresponden a los matemáticos qua matemáticos. Todo esto suena tremendamente arbitrario y ayuda a inclinar la balanza a favor de Pinto. D. Un problema de las críticas de Pinto Por otro lado, señalar que no hay razones para defender la distinción revisionismo externo vs. revisionismo interno no permite imaginar todavía ninguna solución al problema del relativismo metodológico que afecta a la posición de Maddy. Y de esta manera, podemos vernos devueltos a los problemas del HN quineano que impulsaron a Maddy a hacer sus propias propuestas. De hecho, si no se invoca
56
una tesis adicional, quedamos igualmente comprometidos con el HN: dicho crudamente, la evidencia confirmando cotidianamente teorías científicas o filosóficas junto con el resto de nuestra visión total del mundo (incluyendo en ella las actividades de contar o medir, señaladas por Pinto), puede ser considerada igualmente como confirmando enunciados o inferencias matemáticas. Sin embargo, es valioso que Pinto invoque efectivamente un principio que puede arrojar luces sobre el problema creado por la decisión de Maddy de dar autonomía radical a la práctica matemática, el así llamado principio del equilibrio reflexivo de Goodman. En palabras de Goodman, "una regla es enmendada si proporciona una inferencia que no estamos dispuestos a aceptar; una inferencia es rechazada si viola una regla que no estamos dispuestos a enmendar" (Goodman 1965: 64). Este principio, a juicio de Pinto, permitiría explicar los cambios en las prácticas matemáticas en la medida que ellos son controlados por los criterios de evaluación normalmente aceptados —que corresponden a nuestra concepción general de las prácticas— y "tales criterios a su vez cambian como resultado de aquellas de sus aplicaciones que entran en conflicto con las prácticas vigentes" (Pinto 2004: 160). Esto entonces garantiza un equilibrio entre las prácticas matemáticas mismas y nuestra concepción de ellas. El problema, a mi juicio, con el principio de Goodman es que los criterios que controlan los cambios en las prácticas pueden efectivamente ser el resultado de cómo conciben las prácticas los mismos matemáticos: es su reflexión previa sobre las prácticas pasadas y presentes la que sirve para revisar las inferencias hechas por los matemáticos, o, al revés, son estas inferencias las que sirven para enmendar las prácticas vigentes de aquellos. El test crítico de Maddy a favor de RNI (es decir, aceptar o no V=L) satisface claramente esta lectura del principio: la discusión sobre las consecuencias de la aceptación de la independencia de V=L indicaría que los matemáticos y no otros determinaran el equilibrio, al menos en ese caso. Aquellos de acuerdo con V=L preferirán un universo conjuntista austero, que preserve el axioma de elección y la hipótesis del continuo y contenga sólo algunos cardinales grandes (por ejemplo, cardinales
57
regulares e inaccesibles). Otros (tal vez la mayoría) considerarán a V=L una hipótesis que restringe de una manera inaceptable nuestro concepto general, iterativo, de un conjunto. Según ellos, las consecuencias inferenciales más graves de dicho axioma serían, además de las severas restricciones internas sobre el universo conjuntista (por ejemplo el rechazo de CM, del cardinal de Mahlo, etc.), las externas: afectaría la anchura del buen orden de los reales, de los conjuntos medibles de acuerdo a una medida-no-Lebesgue, etc.4 Sea como sea que se decida esta cuestión, aparentemente las únicas prácticas y las únicas reglas o criterios de evaluación que deben ser contrastadas en este caso son aquellas admitidas por la comunidad de los matemáticos.
4. CONTESTANDO INICIALMENTE LAS PREGUNTAS METODOLÓGICAS BÁSICAS
Las consecuencias que hemos comentado anteriormente parecen más bien limitadas en su alcance filosófico, sin embargo, resultan esperables pues, en mi opinión, responden a la naturaleza de las cuestiones que Barceló, Pinto y, sin duda, Maddy han querido, en el fondo, contestar, es decir, cuestiones fundamentalmente de naturaleza metodológica. La primera cuestión es ¿quién debe revisar la matemática? De acuerdo al análisis hecho anteriormente, la respuesta razonable parece ser que puede ser un matemático qua matemático, o qua filósofo, o qua psicólogo, o qua físico, etc. Pero esto significa que también puede ser un filósofo qua matemático, o un psicólogo qua matemático, o un físico qua matemático, etc. Insistir en defender un criterio histórico o lógico para especificar cuándo ocurre un caso u otro, no parece una tarea alentadora para iluminar las cuestiones fundamentales relacionadas con revisionismo en matemática. En segundo lugar, zanjada la cuestión sobre quién revisa la matemática, la cuestión natural a plantearse es cómo se revisa en matemática y, con ella, la cuestión más profunda de cómo se verifica 4. Como señala Maddy, los filósofos críticos de V=L, entre los cuales el primero es el mismo Gödel (cf. Gödel 1946), son la mayoría (cf. Maddy 1997: 84-85).
58
el cambio en ella. La sugerencia de Pinto –con la que simpatizo– es que una buena explicación inicial se encuentra si se apela al principio de Goodman. En otras palabras, el cambio ocurre cuando se rompe el equilibrio reflexivo entre las prácticas de los matemáticos y los criterios de evaluación, y la revisión consistirá entonces en proponer criterios externos o internos que capturen las nuevas prácticas y viceversa. Sin embargo, como vimos, a pesar de la eficacia de esta respuesta, ella resulta filosóficamente impotente también para responder a las cuestiones no-metodológicas que suscita el HN de Quine y el RNI radical de Maddy.
5. UNA CLAVE PARA CONTESTAR LA PREGUNTA FILOSÓFICA BÁSICA: ¿QUÉ HACE POSIBLE LA REVISIÓN EN MATEMÁTICAS? Creo que lo que hace falta para avanzar en la dirección de contestar estas preguntas es enfrentar una cuestión epistemológica, o si quiere epistemológico-trascendental, previa, la cuestión de qué hace posible revisar en matemáticas. El mejor trasfondo para dicha respuesta a mi juicio lo sigue ofreciendo en buena parte el naturalismo defendido por Quine (y probablemente una interpretación naturalizada afín de Wittgenstein, como sugiere Maddy). Sin embargo, la respuesta al gran problema de dicho naturalismo, el HN, sólo puede residir en tomarse en serio los fundamentos naturalistas de nuestra red de creencias, entendidos como fundamentos biológicos-evolutivos de nuestra cognición global. Esto significa asumir que el conocimiento matemático esta íntimamente conectado con dichos fundamentos, lo que lo vuelve a su vez una extensión de nuestras actividades cognitivo-corporeizadas. Una visión como ésta ha sido defendida rigurosamente por Lakoff y sus colaboradores (cf. Lakoff y Nuñez 2002, Lakoff y Johnson 1999). Ellos sugieren que los objetos matemáticos son conceptos corporeizados, esto es, ideas que se encuentran últimamente ancladas en la experiencia humana y que se conectan entre sí mediante mecanismos conceptuales humanos. Tales mecanismos fundamentalmente descansan en el uso de lo que ellos llaman metáforas conceptuales (conceptual metaphors) y
59
mezclas conceptuales (conceptual blendings).5 En términos muy simplificados, los mecanismos aludidos se pueden visualizar como especificando relaciones (aplicaciones funcionales o mappings) entre dominios diferentes (normalmente llamados dominio fuente o dominio meta)6. Dadas las limitaciones de espacio, no es éste el lugar para explicar tales mecanismos y cómo operan en las prácticas matemáticas concretas. Sin embargo, al menos un ejemplo puede dar una idea de cómo aplicar la teoría de Lakoff a nuestra discusión. Para ello, volvamos al problema de Maddy sobre las razones para aceptar V=L o CM. Ya que evidentemente el primer axioma presupone el concepto de conjunto construible y el segundo es una de las tantas posibilidades de especificar un conjunto no-construible, parece más adecuado ver inicialmente, desde un punto de vista matemático-cognitivo general, el dilema de Maddy como una decisión entre ambos conceptos. Para hacerse una idea básica de lo que sea un conjunto construible es fundamental ofrecer una idea de la jerarquía acumulativa de conjuntos a partir de la cual, como sugirieron von Neumann y Zermelo, se puede obtener el universo conjuntista (V). En dicha jerarquía, V se concibe como el resultado de un proceso recursivo que, partiendo del conjunto vacío, genera los conjuntos a partir de otros ya obtenidos anteriormente mediante la aplicación de las operaciones de conjunto potencia (℘) y gran unión (U). Cada escalón de la jerarquía se puede ver como la indexación mediante un ordinal α. Esto se puede visualizar de la siguiente clásica manera. V(0) = ∅ (α + 1) = ℘ V(α) (para cualquier ordinal α) 5. Para una introducción a metáforas conceptuales y mezclas conceptuales véase Lakkof y Núñez (2002), pp. 39-45 y pp. 48-49, respectivamente. 6. Ejemplos simples son Estados son localizaciones y Categorías son contenedores. La primera metáfora mapea desde el dominio fuente ESPACIO al dominio meta ESTADO, la segunda desde el dominio fuente CONTENEDORES al dominio meta CATEGORÍAS (véase Lakoff y Núñez 2002: 39-49). Para cuestiones más generales véase Lakoff y Johnson (1999).
60
V(λ) = sup{V (β): β < λ} = Uβ<λ V (β) (para cualquier ordinal límite λ) La gran unión de todos los escalones, que podemos representar como Uα∈Ω V(α), es entonces la jerarquía acumulativa.7 V=L entonces significa identificar esta unión con la clase de los conjuntos construibles, es decir, significa admitir que los conjuntos que se pueden obtener mediante la jerarquía acumulativa solo pueden pertenecer a dicha clase. Esto sugiere que la jerarquía misma no resulta suficiente para caracterizar la noción de conjunto arbitrario y que para ello se debe agregar una restricción. Sin esta restricción podríamos aceptar una concepción de la jerarquía, y por tanto del universo de conjuntos, más liberal o en cualquier caso caracterizar los conjuntos de acuerdo a otra restricción. Debemos a continuación clarificar en qué consiste un conjunto construible. Para ello, me concentraré aquí en la versión más semántica ofrecida por Gödel (véase Gödel 1938 y 1939). En términos muy simplificados, Gödel determina lo que es un conjunto construible mediante un modelo M donde todo conjunto es obtenible mediante la jerarquía ramificada de los tipos de Russell extendida a órdenes transfinitos y con la restricción de que la colección de los subconjuntos del orden α, a partir de la cual se genera el conjunto potencia, sea definible por fórmulas de primer orden que no impliquen impredicatividad (cf. Gödel 1938: 211). Ya que la alusión a la teoría de los tipos de Russell no es fundamental en una definición contemporánea de la jerarquía acumulativa podemos desatenderla (véase Devlin 1979: cap. V). Por otro lado, la restricción a procedimientos no-impredicativos, aunque parece sugerir que M no permite en 7. Uno podría visualizar la jerarquía como un cono invertido cuyo eje es dado por la serie de los ordinales y que puede modificarse tanto en altura como en anchura dependiendo de la aceptación de determinados axiomas que exceden a ZF (o cualquier otra axiomatización clásica). Por ejemplo, la aceptación del axioma de constructibilidad o la hipótesis del continuo determinarán la anchura, la aceptación de axiomas de cardinales grandes o supergrandes determinarán la altura. Desde luego, opciones en cada lado tendrán consecuencias en el otro lado.
61
particular definiciones impredicativas de conjuntos8, tiene como propósito general sugerir que los conjuntos aceptables en él deben caracterizarse constructivamente, es decir mediante una definición explícita. Pero, como señala Mosterín, la única forma de obtener una caracterización constructiva adecuada de conjunto (arbitrario) en la jerarquía acumulativa transfinita es que sepamos definir la noción de conjunto de las partes de un conjunto infinito. Y esto nos lleva necesariamente a la segunda línea de la caracterización de la jerarquía dada arriba, es decir, a la aplicación de la operación de conjunto potencia. Como remarca Mosterín, "[...] qué sea el conjunto de las partes de un conjunto infinito dado es algo de lo que no tenemos una intuición suficientemente clara. No sabemos como construir todas las partes de un conjunto infinito ¿No sería posible sustituir esa segunda línea por otra que nos permitiera pasar de un conjunto dado, no al conjunto de todas sus partes, sino sólo al conjunto de aquellas de sus partes que sepamos cómo definir o construir?" (Mosterín 1989: 227).
Y en efecto esto es lo que propone Gödel directa (Gödel 1939) o indirectamente (Gödel 1940). En términos simples, dado un conjunto infinito A y un subconjunto x de él podemos decir que x es un subconjunto definible de A si y sólo si existe una fórmula ϕ(x) del lenguaje de primer orden de la teoría de conjuntos con la restricción fundamental que existan las suficientes constantes o parámetros para cada elemento de A (o de M dado el ordinal α respectivo). De manera que x es un subconjunto definible en A si y sólo si {x ∈ A: ϕ(x)}. Podemos entonces llamar Df(A) al conjunto de todos los subconjuntos de A definibles en A y reemplazar consecuentemente por este símbolo la operación de conjunto potencia en la segunda línea mencionada9. Si además reemplazamos V (es decir, «construible») por L en todas las líneas, obtenemos la siguiente caracterización general de los conjuntos construibles y por ende de la jerarquía acumulativa. 8. Una definición impredicativa de un conjunto es aquella que alude a una totalidad de los conjuntos a la cual pertenece también el conjunto definido. 9. Obviamente, aunque Df(A) ⊆ ℘A, no se sostiene la conversa.
62
λ)
L(0) = ∅ (α + 1) = Df L(α) (para cualquier ordinal α) L(λ) = sup{L(β): β < λ} = Uβ<λ L(β) (para cualquier ordinal límite
Simplificando aun más y relativizando la caracterización al modelo M de Gödel (1939) podemos decir que x es construible en una jerarquía ordinal si y sólo si existe un número ordinal α tal que x ∈ Mα. De todo lo anterior resulta suficientemente claro que la caracterización de un conjunto construible descansa en una operación de definibilidad que permite asignar a cada subconjunto de un conjunto de la jerarquía una fórmula dentro de un lenguaje de primer orden, no importando de qué ordinal se trate, e incluyendo por tanto al conjunto de los subconjuntos. La anterior caracterización resulta en principio suficiente para los propósitos de formular una base cognitivista mínima de los conjuntos construibles. En primer lugar, ya que la concepción recursiva de los conjuntos de von Neumann es extensional y presupone intuitivamente la inclusión de objetos (del tipo que sea) podemos con Lakoff y Núñez aplicar, entre otras, las metáforas conceptuales: conjuntos son contenedores10 y conjuntos son objetos construidos11 . Además dado que muchos cardinales grandes, por ejemplo, algunos cardinales inaccesibles, son conjuntos construibles también, debemos admitir que en la jerarquía acumulativa se aplica lo que Lakoff y Núñez llaman la metáfora básica de infinitud (MBI)12. 10. Lakoff Núñez Sin Véase embargo, ya yque los 2002: pp. 31 y ss. respecto a Esquemas de contenedor y pp. 140-1 sobre esta metáfora y su relación con la operación de conjunto potencia. 11. Para esta metáfora véase Lakoff y Núñez 2002: pp. 140-146. Ambas metáforas son lo que Lakoff y Núñez llaman metáforas de anclaje (grounding metaphors), que proporcionan ideas directamente fundadas en experiencia sensible. 12. MBI es una metáfora conceptual inconsciente que permite que procesos que transcurren indefinidamente sean conceptualizados como teniendo un fin y un resultado último; esto permite a su vez que tales procesos sean concebidos como cosas u objetos infinitos, lo que está a la base de nuestra noción de infinito actual. Véase Lakoff y Núñez 2002: cap. 8.
63
conjuntos construibles imponen límites a la colección de subconjuntos del orden α, MBI debe poner restricciones a los procesos indefinidos, es decir, no cualquier iteración puede originar un conjunto construible.13 La cuestión crucial entonces es caracterizar dicha restricción. La clave se debe encontrar, total o al menos parcialmente, en la caracterización de la noción de subconjunto (o parte) de un conjunto infinito. Como hemos visto ésta es una noción dependiente-de-lenguaje (language-dependent), en particular, dependiente de un lenguaje de primer orden. Bajo esta concepción, yo sugiero por tanto que podemos aislar claras metáforas conceptuales de este tipo para la noción de subconjunto de Gödel. La primera es que subconjuntos son conjuntos de fórmulas y la segunda es que todo conjunto es especificable mediante una fórmula en un lenguaje (véase Gödel 1939: 215 y s.). La operación de subconjunto (o de conjunto potencia de un conjunto construible) es por tanto una operación lingüística que consiste en dar un nombre a cada ordinal a partir del cual se forma el conjunto de los subconjuntos (los cuales también deberán contar de nombres). De modo que, de acuerdo a nuestra explicación anterior sobre la definibilidad de ordinales de Gödel, somos llevados a pensar que en la generación de la jerarquía acumulativa todo matemático constructivista tendrá que admitir que especificar el conjunto de las partes de un conjunto es asignar un nombre (mediante una fórmula) a dicho conjunto en una serie ordinal. En otras palabras, el mapping que conecta subconjuntos (en el dominio meta) con nombres de ordinales (en el dominio fuente) es una relación de bautismo. Por tanto, en términos de metáforas conceptuales parece razonable sugerir algo como lo siguiente como un buen candidato para capturar dicho proceso: Determinar los subconjuntos de un conjunto dado es bautizar un conjunto en un cierto orden. Reunimos aquí las metáforas en las que, en nuestra opinión, descansa, al menos parcialmente, la concepción de los conjuntos construibles desde un punto de vista cognitivo-corporeizado. 13. Esto restringirá también la clausura generativa de las operaciones de conjunto potencia y unión; véase Lakoff y Núñez 2002: 176.
64
1) Metáforas de anclaje: conjuntos son contenedores conjuntos son objetos construidos 2) Mezcla conceptual: metáfora básica de infinitud (con restricción) Restricción de MBI 3) Metáforas de subconjunto: subconjuntos son conjuntos de fórmulas / Todo conjunto es especificable mediante una fórmula en un lenguaje formal 4) Metáfora de conjunto potencia: determinar los subconjuntos de un conjunto dado es bautizar el conjunto de los subconjuntos en una serie ordinal. Desde luego, nada de lo anterior sugiere un camino directo para caracterizar conjuntos no-construibles y no es esto algo que me haya propuesto tratar en este artículo. Sin embargo, obviamente lo anterior sí permite sugerir al menos que dicha caracterización no podría cumplir con la restricción de MBI señalada anteriormente. Y el aflojamiento de MBI en esa dirección tal vez permitiría indicar una hipótesis explicativa productiva acerca de porqué normalmente algunos cardinales muy grandes (cardinales medibles, fuertes, de Woodin, supercompactos, etc.) parecen no poder ser discriminados o ser discernibles, dentro de una estructura (L,∈). 14 Esta indiscernibilidad podría perfectamente entenderse como una consecuencia de admitir que no todos los ordinales respectivos necesitan ser identificados mediante un nombre en un lenguaje formal dado, es decir bautizados 14. Esta sugerencia se basa en el descubrimiento de los números reales 0# (zero sharps) por Silver, los que muestran que una diferencia importante entre V y L parece residir en la indiscernibilidad de los cardinales incontables en L. La existencia de cardinales medibles y otros cardinales más grandes presupone la existencia de sharps (véase Maddy 1997: cap. 5).
65
en él.15 Si esta hipótesis tiene algún sustento entonces, proporciona un indicio para entender qué es lo que los matemáticos trabajando con conjuntos no-construibles —la mayoría, como indica Maddy y me indican mis amigos matemáticos— conceptualizan cuando prueban teoremas o propiedades acerca de tales conjuntos. El trabajo de Lakoff, como hemos visto, permite justamente dar sentido cognitivo-corporeizado al dilema planteado por Maddy. Más allá de la corrección matemática o cognitiva de la explicación propuesta, lo importante para mí era mostrar que es enteramente posible ofrecer una salida alternativa al problema del HN sin presuponer RNI, ni una forma radical de revisionismo externo ni mucho menos alguna forma de platonismo. Dicha salida muestra, adicionalmente, lo que hace posible el cambio en matemática sin desapegarse de las prácticas: las conceptualizaciones nuevas o diferentes de los matemáticos (sus mecanismos metafóricos internos) pueden licenciar modificaciones de sus prácticas sin considerar las prácticas en otras disciplinas científicas o filosóficas. Sin embargo, el fundamento biológico (que provee la base corporeizada común) otorga la necesaria continuidad con las conceptualizaciones que soportan la práctica en esas disciplinas diferentes. Esto garantiza el naturalismo y deja abiertas las revisiones a elementos externos. De este modo, lo que hace posible y valiosa la revisión en matemática permanece tan cerca del filósofo como del matemático pues es lo mismo que hace posible la cognición general que sostiene las vidas de ambos.
15. Gödel mismo en Gödel (1946) ha sugerido su propia explicación acerca de cómo V podría discrepar de L. Según Gödel la noción de definibilidad de los ordinales en las cuales se basa su caracterización de los conjuntos construibles es una formulación adecuada y absoluta de la propiedad "estar formados según una ley" y en cambio la nodefinibilidad (y la no-constructibilidad) reflejaría la propiedad "estar formados por una elección aleatoria de elementos" (Gödel 1946: 349). Aunque pienso que no es imposible hacer compatible mi explicación cognitivo-corporeizada de los conjuntos construibles con la de Gödel, no entraré en esta materia aquí.
66
REFERENCIAS Barceló, Axel (2004): "Revisionismo en filosofía de las matemáticas", Signos Filosóficos, vol. VI, No 12, pp. 149-154. Burgess, John P. y Rosen, Gideon (1997): A Subject with no Object: Strategies for Nominalistic Interpretation of Mathematics. Oxford: Oxford University Press Devlin, Keith (1979): Fundamentals of Contemporary Set Theory. New York: Springer Verlag. Dieterle, Jill (1999): "Mathematical, Astrological, and Theological Naturalism", Philosophia Matemática (3), vol. 7, pp. 129135. Goodman, Nelson (1965): Fact, Fiction and Forecast. New York: The Bobbs-Merrill Company. Gödel, Kurt (1938): "La consistencia del axioma de elección y de la hipótesis generalizada del continuo", en Gödel 1989: pp. 210-212. Gödel, Kurt (1939): "Prueba de consistencia de la hipótesis generalizada del continuo", en Gödel 1989: pp. 215-221. Gödel, Kurt (1940): "La consistencia del axioma de elección y de la hipótesis generalizada del continuo con los axiomas de la teoría de conjuntos", en Gödel 1989: pp. 231-310. Gödel, Kurt (1946): "Observaciones presentadas ante la conferencia del bicentenario de Princeton sobre problemas de las matemáticas", en Gödel 1989: pp. 346-350. Gödel, Kurt (1989): Obras Completas (traducción y comentarios de J. Mosterín). Madrid: Alianza Editorial. Kitcher, Philip (1984): The Nature of Mathematical Knowledge. Oxford: Oxford University Press. Lakoff, George y Johnson, Mark (1999): Philosophy in the Flesh: The Embodied Mind and its Challenge to Western Thought. New York: Basic Books. Lakoff, George y Nuñez, Rafael (2002): Where Mathematics Come From: How the Embodied Mind Brings Mathematics Into Being. New York: Basic Books.
67
Maddy, Penélope (1997): Naturalism in Mathematics. New York: Oxford University Press. Mosterín, Jesús (1989): "Introducción a: «La consistencia del axioma de elección y de la hipótesis generalizada del continuo con los axiomas de la teoría de conjuntos»", en Gödel 1989: pp. 222-230. Pinto, Sílvio (2004): "Revisionismo, anti-revisionismo y filosofía de las matemáticas", Signos Filosóficos, vol. VI, No 12, pp. 155-162. Quine, W. (1986): Teorías y Cosas. México D.F. :UNAM (ed. en inglés: 1981). Quine, W. (1990): Pursuit of Truth. Cambridge, Mass.: Harvard University Press. Quezada, Wilfredo (2005): "¿Quién revisa, cómo se revisa y qué hace posible revisar la matemática?", Signos Filosóficos, vol. VII, No 13, pp. 107-114. Shapiro, Stewart (2002): "Modeling and normativity: How much revisionism can we tolerate?", Agora, 20, pp. 159-173. Tennant, Neil (2000): "What is Naturalism in Mathematics, Really?", Philosophia Mathematica (3), vol. 8, pp. 316-338.
Wilfredo Quezada Pulido Universidad de Santiago de Chile wquezada@lauca.usach.cl
LÓGICA, EMPIRISMO Y REALISMO EN EL PENSAMIENTO DE QUINE
Rodolfo Gaeta
71
LÓGICA, EMPIRISMO Y REALISMO EN EL PENSAMIENTO DE QUINE
Rodolfo Gaeta Resumen Conforme a la interpretación más corriente, Quine se rebeló en contra de las tesis fundamentales del empirismo lógico. En oposición a esta convicción trataré de proporcionar argumentos para mostrar que las principales ideas de Quine, aun cuando parezcan alejarse de las doctrinas del positivismo lógico, coinciden bastante naturalmente con la dirección que llevaba aquel programa. Abstract According to the usual interpretation, Quine rebelled against the fundamental thesis of Logical Empiricism. In opposition to this view, I will offer arguments to show that the Quine´s main ideas, even as they seem to move away of Logical Positivism, agree quite naturally with direction of that program.
I Aunque no caben mayores dudas de que la filosofía de Quine guarda una estrecha relación con los aportes de los empiristas lógicos, la naturaleza de esa relación se ha prestado a diferentes interpretaciones. El más célebre de los ensayos de Quine, «Dos dog
72
mas del empirismo», anuncia desde su propio título las diferencias que lo separaban de la doctrina elaborada en los tiempos del Círculo de Viena. El impacto que causaron los agudos análisis de Quine de la pretensión de encontrar enunciados que se contrastan individualmente con la experiencia y de la distinción entre enunciados analíticos y sintéticos hacen que a medio siglo de aquella publicación sus tesis sigan siendo consideradas como la promulgación del fracaso de las aspiraciones del empirismo lógico. Alex Orenstein, por ejemplo, incluye entre los aspectos destacables de Quine su papel como representante del naturalismo y su argumentación en contra de la posibilidad de todo conocimiento a priori (cf. Orenstein 1998). Como consecuencia de las críticas de Quine, quedarían descalificados tanto los intentos de fundar las creencias empíricas a partir de consideraciones sobre los contenidos de la propia conciencia como la distinción entre ciencias formales y ciencias fácticas, dos componentes importantes del pensamiento de Carnap. Pero otros autores han preferido subrayar las afinidades entre el pensamiento de Quine y la posición adoptada por los empiristas contemporáneos. Sandra Laugier sostiene que Quine —a pesar de sus propias declaraciones— emprendió muy tempranamente una reelaboración del programa carnapiano (cf. Laugier 1997). De acuerdo con Laugier, en «Truth by convention» (Quine 1965d) Quine inició una tarea que se mantuvo dentro del marco fijado por Carnap, aunque sus conclusiones fueron opuestas. Mientras que Carnap había sugerido que todos los enunciados, aun los que parecían puramente empíricos, pueden ser entendidos como resultado de una convención, Quine invirtió el planteo y concluyó que todos los enunciados, incluidas las verdades lógicas, podrían considerarse empíricos. A juicio de Laugier, esta actitud constituye una crítica interna más que un rechazo de la concepción de Carnap. Acorde con la sugerencia de que las ideas de Quine conservan proximidad con la posición de los positivistas, trataré de proporcionar elementos para mostrar que sus tesis fundamentales, aun cuando parezcan contrastar con las doctrinas del positivismo lógico, coinciden bastante naturalmente con la dirección que llevaba aquel programa.
73
II Comencemos con el naturalismo. En la medida en que conlleva un absoluto apego a los resultados de la investigación científica, el naturalismo —la idea de que el conocimiento sea caracterizado conforme a la información que nos brindan sobre él las propias teorías científicas— colma las más pretenciosas expectativas de construir una filosofía científica. Quizá, el principal motivo que impidió a los empiristas lógicos encarar esta vía directamente fue el temor de caer en una argumentación circular. De alguna manera, se hallaban comprometidos en la tarea de fundar filosóficamente el conocimiento científico y es comprensible que consideraran reprochable apoyarse en los resultados brindados, precisamente, por aquello que estaba en discusión. Un motivo adicional, aunque no totalmente ajeno al que se acaba de mencionar, es el hecho de que las hipótesis teóricas de la ciencia se encuentran muy alejadas de la experiencia, parecen demasiado inestables como para buscar en ellas alguna fundamentación del conocimiento todo. Pero Quine cuenta con argumentos para superar esas dificultades. En primer lugar —señala—, no existe un conocimiento que nos inspire más confianza que la ciencia. La crítica del conocimiento científico sólo puede llevarse a cabo desde su interior; porque es, de todos modos, el único recurso efectivamente disponible. La práctica nos enseña que no hay ninguna razón para considerar extraño este procedimiento, porque estamos acostumbrados a ajustar desde adentro nuestro sistema de creencias. Quine reactualiza la metáfora de Neurath sobre la necesidad de reparar el barco mientras navegamos. En segundo término, a juicio de Quine, no hay por qué enfatizar la desconfianza en las hipótesis teóricas pues todas nuestras creencias, aun las que se refieren a datos sensibles, son hipotéticas. El naturalismo de Quine se alinea, entonces, con el empirismo y con la especial valoración de la ciencia característicos de los empiristas lógicos. Podríamos decir que los llevó resueltamente hasta sus últimas consecuencias.
III El naturalismo de Quine se encuentra vinculado, por otra parte, a su actitud realista. Su realismo científico marcha a la par con la posi
74
ción que adopta con respecto a las entidades del sentido común. Pero hay que entender la compatibilidad del empirismo, el naturalismo y el realismo como una consecuencia de la redefinición de los términos dentro de la concepción quineana. De acuerdo con su definición del realismo, decir que la mesa que está frente a mí existe es simplemente decir que tengo la evidencia empírica adecuada y suficiente para creer que es así. También la noción de evidencia es reformulada, o mejor dicho, recupera su sentido original. Porque poner en duda sistemáticamente —como a veces han hecho los filósofos— la validez de la información que brindan los sentidos cuando se discute el derecho de afirmar, en general, la existencia de objetos físicos, es apartarse ilegítimamente del uso originario del concepto de evidencia. Restablecidos los significados originales, empirismo y realismo se confunden en una sola posición. En «Scope and Language of Science» sostiene Quine: "No podemos cuestionar significativamente la realidad del mundo externo, o negar que hay evidencia de objetos externos en el testimonio de nuestros sentidos, porque hacerlo es simplemente disociar los términos «realidad» y «evidencia» de las propias aplicaciones que originalmente más hicieron para conferir a esos términos toda la inteligibilidad que pudieran poseer para nosotros." (Quine 1965b: 216)
Junto con la identificación del empirismo y el realismo encontramos, casi de paso, la aseveración de que carece de sentido plantear problemas cuya solución implique trascender los límites de la experiencia. Aquí reaparece, bajo ropas más inocentes, el tan mentado criterio empirista del significado. Por supuesto, Quine no quiere adherir a ninguna de las problemáticas formulaciones de ese principio; y tampoco puede hacerlo, conforme a su negativa a aceptar el concepto de significado. Pero de hecho, aunque no figure en ninguna parte elaborado, algún sucedáneo implícito del principio empirista del significado sigue operando. Así, Quine se propone eliminar las connotaciones metafísicas del realismo. Y al hacerlo adelanta una misma solución para dos problemas similares pero diferenciados. Uno es la cuestión de la realidad de los objetos físicos comunes; el otro, la realidad de las entidades teóricas. En cuanto a los compromisos
75
ontológicos, ambas clases de cosas viajan en el mismo barco, el barco de Neurath; y así como las razones empíricas llevan a afirmar la existencia real de los objetos físicos que de modo natural postulamos para organizar nuestra experiencia del mundo, la evidencia empírica también conduce a suscribir la realidad de las entidades postuladas por las teorías científicas vigentes.
IV La doble manifestación del realismo, el compromiso de Quine con los objetos físicos del trato cotidiano y con las entidades teóricas, obliga a observar desde un punto de vista diferente la tesis de la subdeterminación de las teorías científicas. Los antirrealistas científicos se han apoyado en ella para mostrar que el éxito empírico de una teoría científica no garantiza en absoluto la existencia de las entidades por ellas postuladas. Pero Quine desautoriza esta conclusión porque no sólo las teorías científicas permanecen indeterminadas: todos los enunciados están sometidos a la misma situación, aun los más próximos a la experiencia. Tal como lo ve Quine, sería arbitrario aceptar la existencia de los objetos físicos comunes y negarla en el caso de las entidades teóricas, y sería inapropiado, por los motivos ya expuestos, decir que podemos prescindir de la existencia de los cuerpos observables. En consecuencia, la subdeterminación no favorece el antirrealismo científico como tampoco la falibilidad de los juicios del sentido común beneficia la posición de quien niegue la existencia de los objetos físicos corrientes. Inquirir por un modo de existencia de las cosas más allá de cuanto permitan responder las experiencias sensibles equivale a internarse en una cuestión metafísica. Aunque Quine lo diga de otro modo, esta manera de excluir los problemas metafísicos evoca, sin mucha dificultad, la distinción carnapiana entre cuestiones internas y cuestiones externas.
V Podría parecer que el holismo, la llamada tesis de Duhem-Quine, se aparta considerablemente del objetivo empirista de encontrar enunciados directamente verificables. Pero en el seno del Círculo de Viena se abrió tempranamente el debate sobre esa posibilidad. No fue
76
Neurath el único que apreció las dificultades que se oponían a la pretensión de identificar tales enunciados. Después de ensayar la plausibilidad de construir el mundo a partir de una base fenomenalista, Carnap optó por el fisicalismo, un claro reconocimiento de que aun los enunciados más básicos entre los que componen la ciencia revisten el carácter de hipótesis. Y hasta el mismo Schlick tuvo la precaución de decir que los enunciados protocolarios, los que constituyen la base de las contrastaciones científicas, van más allá de expresar la experiencia inmediata. Y si los enunciados protocolarios tienen el carácter de hipótesis, no se enfrentan individualmente con la experiencia y dejan abierta la posibilidad de que sean rechazarlos cuando otras creencias integrantes del sistema lo aconsejen.
VI A medida que Carnap fue desarrollando sus análisis, llegó a presentar una versión considerablemente liberalizada del empirismo. En su biografía intelectual (Carnap 1963) señala que la adopción de un punto de partida fenomenalista para el Aufbau (Carnap [1928]1967) no respondía a un compromiso ontológico fundamental obligatorio por cuestiones de principio sino a una elección frente a otras alternativas posibles. Sostener que los datos sensibles son las entidades que propiamente constituyen el mundo real equivale a aventurarse en terreno metafísico, pronunciarse sobre una cuestión externa. Para Quine, en tanto, los datos sensibles son posits, como las mesas y las moléculas. Cada una de estas clases de entidades puede ser fundamental, pero solo en un sentido determinado: "Los datos sensibles son evidencialmente fundamentales: todo ser humano se halla obligado con sus sentidos en cuanto a cada indicio de los cuerpos. Las partículas físicas son naturalmente fundamentales de esta manera: las leyes de comportamiento de esas partículas proporcionan, hasta donde sabemos, la formulación más simple de una teoría general de los acontecimientos. Los cuerpos del sentido común, finalmente, son conceptualmente fundamentales: es por referencia a ellos como se adquieren las propias nociones de realidad y evidencia y como tienden a forjarse y expresarse en palabras los conceptos que tienen que ver con partículas y aun con datos sensibles." (Quine 1965b: 239)
77
En vista de estas opiniones, estamos autorizados a pensar que Quine no hubiera tenido razones para objetar la legitimidad inicial del propósito que motivó la elección del fenomenalismo como base de la construcción lógica del mundo. La decisión estaba justificada si lo que se quería explorar era hasta dónde nos permite llegar, sin salirse de sus límites, el tipo de evidencia que brindan los datos sensibles. Podemos conjeturar que el obstáculo capaz de malograr el objetivo de Carnap residía en la imposibilidad de reducir los conceptos y el lenguaje fisicalistas a un inimaginable discurso que reflejara adecuadamente un mundo de los puros datos sensibles. En este respecto, los conceptos y la lengua fisicalistas resultan irreductibles, como llegó a comprender el propio Carnap. El Aufbau fue el experimento que puso de manifiesto esa situación. Pero tampoco el lenguaje fisicalista es suficiente por sí solo para dar cuenta del mundo. Se requieren todos los recursos conceptuales y lingüísticos que la ciencia puede aportar. Nada menos. Y nada más. El empirismo, tal como Quine lo sustenta obliga a comprometerse con lo que la ciencia dice que hay, con lo que la ciencia necesita postular para organizar adecuadamente nuestra experiencia. Y no más, porque entre los criterios de la adecuada organización de la experiencia se encuentran la simplicidad y la economía. Ello explica la resistencia de Quine a aceptar entidades tales como los significados. Podemos prescindir de ellos porque no son necesarios para dar cuenta del mundo. No sucede lo mismo con otras entidades abstractas: la postulación de clases queda justificada por el papel fundamental que cumplen en las matemáticas, y estas últimas resultan obviamente imprescindibles para la ciencia. A despecho de su declarada inclinación por los paisajes desérticos, finalmente, la ontología de Quine es lo suficientemente hospitalaria como para albergar los datos sensibles, los cuerpos físicos, las entidades postuladas por las teorías científicas y también los remotos entes matemáticos que pueblan el cielo platónico. Si quedan dudas sobre el derecho de que después de tantas concesiones Quine siga presentándose como un empirista, su respuesta será, nuevamente, que es la experiencia sensible —y no la clarividencia, por ejemplo— la que regula en última instancia nuestras creencias. No es un empirismo radical, por supuesto, pero el
78
empirismo radical, afirma Quine, ha cedido definitivamente paso al empirismo relativo cuando se advirtió que es necesario abandonar "la vieja esperanza de traducir el discurso en términos de cuerpos al discurso de las sensaciones" (Quine 1990:138). Pero ése es, exactamente, el paso que dio Carnap cuando abandonó el camino del Aufbau.
VII Quedan pendientes algunas cuestiones con respecto a las cuales la posición de Quine y la doctrina de los empiristas lógicos parecen más difíciles de conciliar. Los miembros del Círculo de Viena adoptaron la tradición logicista de Frege y Russell y consideraron que las verdades de las matemáticas podían resolverse sobre la base del concepto de analiticidad. De este modo, se eludía la tesis kantiana de que las verdades matemáticas fueran proposiciones sintéticas a priori sin admitir la posibilidad de que alguna situación empírica llegara a refutarlas. Quine procuró mostrar que todos los intentos de caracterizar la analiticidad resultaban fallidos. Por otra parte, su creencia de que el cuerpo completo de nuestras creencias se contrasta como un todo con la experiencia, de tal modo que podemos hacer ajustes donde nos resulte más conveniente, lo llevó a afirmar que las matemáticas, e incluso los principios lógicos, pueden abandonarse llegado el caso, como sucedió con la propuesta de dejar de lado el principio del tercero excluido para acomodar la teoría de la mecánica cuántica. Laugier no vacila en juzgar, sin embargo, que estas declaraciones de Quine eran hipócritas (Laugier 1997: 553). Más allá de la profundidad de las convicciones que tenía cuando hizo esas afirmaciones, es cierto que Quine revisó más tarde sus opiniones acerca del tema (cf. Quine 1995a: cap. 5). Uno de los motivos de este cambio fue la teoría que elaboró sobre cómo se aprende el lenguaje. En consonancia con la función crucial que siempre otorgó a la información originada en los sentidos, su explicación del aprendizaje lingüístico reconoce la existencia de una clase especial de oraciones que se caracterizan por su vinculación directa con la experiencia sensorial en cuanto constituyen respuestas a una estimulación presente y les reserva el nombre de «oraciones de observación». La incorporación de este concepto en la doctrina de Quine manifiesta su disposición a matizar el holismo
79
y reinstalar de algún modo la clásica distinción entre enunciados téoricos y observacionales. Y por cierto, a través de esta vía se pueden recuperar, en alguna medida, conceptos semánticos que antes había descartado: las oraciones de observación cuentan con un significado estimulativo y así puede definirse también una clase de sinonimia, la que se predica de las oraciones de observación a las que les corresponde un mismo significado estimulativo. Y así también se abre una puerta para permitir el ingreso de un concepto restringido de analiticidad. Aunque mantiene algunas reservas y niega que haya una separación tan marcada entre las oraciones analíticas y las sintéticas como la que pretendía establecer Carnap, comenta a propósito de esta nueva perspectiva: "Quizá esta versión de la analiticidad tenga éxito en trazar una tosca línea entre oraciones tales como «Ningún soltero es casado» o «Somos primos de nuestros primos», de las que comúnmente se dice que son analíticas, y oraciones que no lo son. En todo caso, parecería que todos hemos aprendido «soltero» de manera uniforme, aprendiendo que nuestros mayores están dispuestos a asentir frente a ese término precisamente en las mismas circunstancias en las que asentirán a «hombre no casado»." (Quine 1990: 80).
Tal vez sería forzar demasiado las cosas concluir que lo importante es que Quine haya admitido, por fin, que algunas oraciones son verdaderas en virtud de su significado, pero, sin duda alguna, es un reconocimiento significativo.
VIII A pesar del carácter restringido de la noción de analiticidad que Quine se manifiesta dispuesto a aceptar, su positura respecto de la naturaleza de las verdades lógicas y matemáticas ha sufrido una notable transformación. En Pursuit of Truth (Quine 1992) explica cómo actúan realmente los científicos cuando el incumplimiento de una predicción afecta la estabilidad de una teoría. Sostiene que guiados por principios como el de mínima mutilación proceden a explorar las posibles correcciones en el sistema, pero entre estas potenciales modificaciones no contemplan el abandono de las leyes lógicas, porque ellas no agregan nada a lo que se pueda deducir del conjunto de
80
las hipótesis extralógicas (cf. Quine 1992: 14). Esta declaración me resulta extraña porque no alcanzo a entender que función cumplirían las verdades lógicas si no son capaces de modificar el conjunto de consecuencias de las hipótesis teóricas. Pero, en lo que concierne al presente trabajo, podemos dejar de lado esta inquietud porque lo que nos interesa es que Quine ha dejado atrás una de sus más profundas diferencias con la tradición de los empiristas lógicos. Una situación no menos sorprendente es la actitud de Quine con respecto a las proposiciones matemáticas. Gibson le había hecho notar que había una contradicción entre las afirmaciones sostenidas en Pursuit the Truth y las formuladas en From Stimulus to Science (Quine 1995a). Mientras en el primero asevera que las matemáticas tienen contenido empírico, en el último lo niega. (cf. Gibson 1995: p. 95). Quine reafirma entonces la segunda posibilidad: ningún conjunto de verdades matemáticas implica juicios sintéticos de observación. En síntesis, las verdades de la lógica y la matemática, pese a lo que Quine había sostenido en la época en la que sometió a crítica las tesis del empirismo lógico no derivan su verdad de la evidencia empírica. Gozan de una posición diferenciada de la que les corresponde a las teorías de la ciencia fáctica.
IX Las publicaciones más recientes de Quine contienen otras indicaciones de que había modificado considerablemente algunas de sus convicciones anteriores. Tal es el caso de la subdeterminación de las teorías científicas con respecto a la evidencia empírica. En Pursuit of Truth señala que frente a dos teorías incompatibles que comparten su evidencia empírica es posible considerarlas no como dos teorías diferentes sino como dos formulaciones distintas de una misma teoría. Ello equivale a trivializar los efectos de la subdeterminación y sostener, a fin de cuentas, que el contenido relevante de las teorías científicas se reduce a su aspecto empírico. Creo que los viejos empiristas no podrían pedir más. Aquí puede apreciarse la particular versión del realismo sustentado por Quine. Porque si sólo los aspectos empíricos de una teoría científica resultan pertinentes y lo demás
81
se convierte meramente en cuestiones relativas a la manera de formularla, ya no parece que haya quedado nada parecido a lo que habitualmente se entiende por realismo. Lo que resta, en todo caso, es puro empirismo. Y vale la pena recordar que Moritz Schlick también defendió en su momento la tesis de que el positivismo es la forma más acabada del realismo.
REFERENCIAS Basu, P.(1996): "Theory-Ladenness of Observation and Evidence", Journal of Indian Council of Philosophical Research, 13 (3), pp. 87-102. Bhat, P.R. y Sahu, Gopal (1998): "Quine on observation Sentences", Indian Philosophical Quarterly, 25 (3), pp. 403-418. Carnap, Rudolf ([1928]1967): Der logische Aufbau der Welt. Traucción al inglés: The Logical Structure of the World, Berkeley: University of California Press. Carnap, Rudolf (1963): "Intellectual Autobiography", en Schilpp P. A. (ed.): The Philosophy of Rudolf Carnap, La Salle, Illinois: Open Court. Gibson, Roger (1995): "Quine on Naturalizing of Epistemology", en Leonardi, P. y Santambrogio, M. (eds.): On Quine: New Essays. Cambridge: Cambridge University Press, pp. 89103. Hintikka, Jaakko (1997): "Three Dogms of Quine’s Empiricism", Revue Internationale de Philosophie, 4 (202), pp. 457477. Laugier, Sandra (1997): "De Quine à Carnap: L’empirisme Logique aujourd’hui", Revue Internationale de Philosophie, 51, n. 202, pp. 541-555. Lewis, Harry y Holdcroft, David (1997): "Quine on the Threshold of evidence", Revue Internationale de Philosophie, 51, n. 202, pp. 521-539.
82
Orestein, Alex (1998): "Quine, Willard Van Orman", en Craig, E. (ed.): Routledge Encyclopedia of Philosophy. London: Routledge, Versi贸n CD-Rom. Quine, Willard Van (1953): From a Logic Point of View. Cambridge, MA.: Harvard University Press. Quine, Willard Van (1960): Word and Object. Cambridge, MA and London: MIT Press. Quine, Willard Van (1965a): The Ways of Paradox. New York: Random House. Quine, Willard Van (1965b): "The Scope and Language of Science", en Quine, W. V. 1965a, pp. 215-232. Quine, Willard Van (1965c): "Posits and Reality", en Quine, W.V. 1965a, pp. 233-241. Quine, Willard Van (1965d): "Truth by Convention", en Quine, W.V. 1965a, pp. 77-106. Quine, Willard Van (1968): "Ontological Relativity", The Journal of Philosophy, vol. LXV, N潞 7, pp. 185-212. Quine, Willard Van (1969): "Naturalized Epistemology", en Quine, W. V.: Ontological Relativity and Other Essays. New York / London: Columbia University Press. Quine, Willard Van (1987): "El soporte sensorial de la ciencia", en Acero, J. y Calvo, T. (eds.): Symposium Quine: Granada: Editorial Universidad de Granada, pp. 11-22. Quine, Willard Van (1992): Pursuit of Truth. Cambridge, MA / London: Harvard University Press. Quine, Willard Van (1993): "In Praise of Observation Sentences", The Journal of Philosophy, vol. XC, n. 3, pp. 110-112. Quine, Willard Van (1995a): From Stimulus to Science. Cambridge, MA / London: Harvard University Press. Quine, Willard Van (1995b): "Reactions", en Leonardi, P. y Santambrogio, M. (eds.): On Quine: New Essays. Cambridge: Cambridge University Press, pp. 347-361. Quine, Willard Van (1990): The Roots of Reference. La Salle, Illinois: Open Court Publishing.
83
Hahn, Lewis y Schilpp, Paul (eds.) (1987): The Philosophy of W.V. Quine. La Salle, Illinois: Open Court.
Rodolfo Gaeta Universidad de Buenos Aires -Argentina Universidad Nacional de Lujรกn - Argentina rgaeta@filo.uba.ar
REALISMO CIENTÍFICO Y VUELO A LA REFERENCIA
Nélida Gentile
87
REALISMO CIENTÍFICO Y VUELO A LA REFERENCIA
Nélida Gentile Resumen En «The pessimistic induction, the flight to reference and the metaphysical zoo», Bishop desarrolla una versión directa del argumento de la inducción pesimista que, en su opinión, resulta inmune a los ataques realistas e, indirectamente, refuerza la posición antirrealista. En el presente trabajo se evalúa el alcance del punto de vista sustentado por Bishop y se ofrecen razones para mostrar que si bien la versión directa de la inducción pesimista parece reforzar la posición antirrealista, las consecuencias que se siguen de tal formulación resultan decididamente problemáticas. Abstract In «The pessimistic induction, the flight to reference and the metaphysical zoo», Bishop develops a direct version of pessimistic induction argument that, according to himself, comes about immune to the attacks of realists and, indirectly, reinforces the antirrealism position. In this paper Bishop´s view position is evaluated and reasons are offered in order to show that although the direct version seems to reinforce antirrealism, the consequences that follow from that formulation are absolutly problematic.
88
El debate contemporáneo realismo-antirrealismo ha dado lugar a una variada gama de argumentos en pro y contra de cada una de estas posiciones. Pero la más fuerte defensa del realismo científico ha sido apoyada en el llamado «argumento del no milagro» (Maxwell [1890]1962; Smart 1968; Putnam 1975; Boyd 1984; Kitcher 1993). En líneas generales, las diferentes versiones de este argumento sostienen la creencia de que el éxito de la ciencia muestra que nuestras mejores teorías son aproximadamente verdaderas. La contraofensiva antirrealista, por su parte, toma como pivote el denominado «argumento de la inducción pesimista» (Poincaré [1902]1968; Laudan 1981,1984a). En opinión de Laudan, la historia de la ciencia exhibe una amplia lista de teorías del pasado que han mostrado un alto éxito explicativo y predictivo y que, finalmente, fueron consideradas falsas. Por lo tanto, no hay razones para pensar que nuestras mejores teorías actuales son verdaderas o aproximadamente verdaderas. En el marco de este debate, Michael Bishop desarrolla un minucioso análisis orientado a ubicar la discusión realismoantirrealismo fuera del ámbito de la filosofía del lenguaje. Más específicamente, en «The Flight to reference, or how not to make progress in the philosophy of science» (1998), un artículo publicado conjuntamente con Stephen Stich, y posteriormente en «The pessimistic induction, the flight to reference and the metaphysical zoo» (2003), Bishop manifiesta que tanto los realistas como los antirrealistas han apelado siempre a lo que denomina la estrategia del «vuelo a la referencia» (flight-to-reference), esto es, que los argumentos han estado siempre ligados a las nociones de verdad y referencia. Como fundamento de esta afirmación cita las propias palabras que Laudan expresa en Science and Values (Laudam 1984a) cuando sostiene que muchas teorías que fueron exitosas contienen términos que ahora creemos que carecían de referencia; y recuerda que Kitcher —en su réplica a Laudan— trata de mostrar que muchos de los términos de teorías exitosas y obsoletas en algunas ocasiones refieren (cf. Bishop 2003: 163). En contra de la estrategia del vuelo a la referencia, Bishop desarrolla una versión directa del argumento de la inducción pesimista que, en su opinión,
89
resulta inmune a los ataques realistas e, indirectamente, refuerza la posición antirrealista. El objetivo del presente trabajo es evaluar el alcance de punto de vista sustentado por Bishop. En el primer apartado se caracteriza la denominada estrategia del vuelo a la referencia. En el segundo, se presenta la propuesta de Bishop, esto es, la reformulación directa del argumento de la inducción pesimista. En la tercera y última sección se ofrecen razones que, según creemos, debilitan la fuerza de la posición de Bishop: se considera que si bien la versión directa de la inducción pesimista parece reforzar la posición antirrealista, las consecuencias que se siguen de tal formulación resultan decididamente problemáticas.
1. LA ESTRATEGIA DEL VUELO A LA REFERENCIA En «The Flight to Reference, or How Not to Make Progress in the Philosophy of Science», Michael Bishop y Stephen Stich caracterizan una forma de argumentación, ampliamente utilizada —según su opinión— para resolver problemas filosóficos, a la que denominan "estrategia del vuelo a la referencia" (Bishop y Stich 1998: 34). En términos generales —sostienen— quienes apelan a este argumento siguen la siguiente secuencia de pasos: i) Ofrecen una explicación sustantiva de la relación de referencia, ii) afirman que una expresión particular refiere (o no refiere), y iii) extraen a partir de aquí conclusiones que van más allá de la referencia, por ejemplo, sobre la verdad y la ontología. Bishop y Stich consideran como teorías sustantivas aquellas versiones que conciben la referencia como una clase de relación compleja entre los términos y las entidades o clases de entidades en el mundo1. Pero sus críticas no están dirigidas contra una u otra teoría de la referencia sino a lo que perciben como un ilegítimo pasaje de las premisas a la conclusión y que bautizan, precisamente, como un vuelo a la referencia. En efecto, a su juicio, cualquier conclusión adecuada, debería afirmar algo sobre la refe 1. Bajo esta categoría agrupan tanto las teorías causales de la referencia de Putnam y Kripke, como las teorías de las descripciones de Russell, Searle y Lewis (cf. Bishop y Stich 1998: 34n).
90
rencia, pero en lugar de ello, alude a cuestiones que nada tienen que ver con la referencia sino, más bien, con la verdad y la ontología. La inferencia presupone, pues, algún principio respecto de la relación entre referencia y verdad que no está de ninguna manera justificado. Si el principio es constitutivo de la referencia misma, entonces, la teoría sustantiva en cuestión debería mostrar que la relación de referencia satisface el principio; y si no es constitutivo de la referencia, entonces, se deberían dar razones de por qué la relación de referencia lo satisface. Luego, en la medida en que este principio carece de fundamentación, toda tentativa de resolver problemas en la filosofía de la ciencia apelando a la estrategia del vuelo a la referencia fracasa. Bishop y Stich ilustran su posición a través de lo que consideran como un sofisticado intento, por parte de Kitcher, de usar la estrategia del vuelo a la referencia en defensa del realismo científico. Describen entonces, en primer lugar, la propuesta de Kitcher para evadir el argumento de Laudan de la inducción pesimista. En The Advancement of Science (1993), Kitcher diferencia entre la referencia de expresiones tipo (type) y la referencia de expresiones caso (token). Cada proferencia particular de una expresión constituye un caso, una instanciación del tipo. Pero diferentes casos del mismo tipo pueden estar asociados con distintos modos de referencia, que Kitcher agrupa, a su vez, en tres clases. El modo descriptivo de referencia corresponde a la situación en que un hablante refiere a algo que satisface una descripción particular, de manera que el referente es aquello que satisface la descripción. El modo bautismal es aquél en el cual la referencia se fija por ostensión. Por último, el modo conformista, reúne todas aquellas instancias en que el hablante alude al uso que ha sido transmitido, por medio de una cadena causal, desde que el término fue introducido, ya sea ostensivamente o por medio de una descripción. En la medida en que la referencia de un término tipo puede fijarse de distintos modos, en algunas ocasiones de uso el término puede referir exitosamente y en otras, en cambio, carecer de referencia. Así, afirma Kitcher, cuando Prietsley usó «aire desflogistizado» con
91
la intención de referir a «la sustancia obtenida cuando el flogisto es eliminado del aire», el modo de fijar la referencia de la expresión tipo es a través de una descripción. Luego, la descripción es falsa, dado que no hay ninguna sustancia emitida en la combustión y, por ende, la expresión tipo carece de referencia. Pero, cuando Priestley usó la expresión «aire desflogistizado» con la intención de referir a la sustancia que él y los ratones respiraban —conocida como oxígeno— (cf. Kitcher 1993: 100), la manera de fijar la referencia corresponde al modo bautismal y, en esta ocurrencia, la expresión tipo refiere exitosamente. La conclusión que Kitcher extrae de éste y otros ejemplos es que un término tipo puede referir exitosamente aun cuando la ciencia contemporánea lo considere obsoleto, de manera que muchas de las teorías que fueron exitosas pero consideradas falsas refieren a cosas que realmente existen y muchas de sus afirmaciones son verdaderas. De este modo, Kitcher enfrenta el más fuerte de los dardos antirrealistas, a saber, el argumento de la inducción pesimista. Pero, de acuerdo con Bishop y Stich, del hecho de que un término refiera no se sigue que el referente exista y, por ende, tampoco que muchas de las afirmaciones de teorías obsoletas sean verdaderas. En otras palabras, la objeción subraya el ilegítimo pasaje de las premisas a la conclusión, pues ello presupone un principio que, según los autores, debería tener la siguiente forma (cf. Bishop y Stich 1998: 44): Una proferencia de la forma ‘‘Fa” es verdadera sii (Ex) (esta instanciación de ‘‘a” refiere a x y x satisface esta instanciación de ‘‘F—”)
Esto es, la estrategia del vuelo a la referencia exige un principio que conecte la referencia con la existencia, principio que, por otra parte, no conciben como una verdad analítica. Luego —sostienen— es natural pedir una justificación y ello es, precisamente, lo que la teoría de Kitcher —o cualquier otra teoría sustantiva de la referencia— no ofrece.
92
2. INDUCCIÓN PESIMISTA SIN VUELO A LA REFERENCIA En términos generales, tal como afirma Bishop, los realistas sostienen que i) la mayoría de las entidades postuladas por nuestras mejores teorías científicas existen, y que ii) la mayoría de las afirmaciones centrales de nuestras mejores teorías científicas son verdaderas o aproximadamente verdaderas. A su turno, los antirrealistas se apoyan en el argumento de la inducción pesimista y concluyen que i) y ii) son falsas. Bishop considera, asimismo, que el antirrealista tiene una salida para enfrentar las estrategias que, como la de Kitcher, intentan refutar la tesis de la inducción pesimista. Todo lo que el antirrealista necesita es reformular el argumento de tal modo que resulte inmune a las críticas realistas. Con este propósito, Bishop desarrolla una «versión directa de la inducción pesimista» que supone diferenciar dos sentidos de la noción de referencia: una noción ontológica de referencia (referencia-o), y una concepción sustantiva de la referencia (referencia-s). La noción de referencia-o está implicada por un principio deflacionario: (O) ‘‘T” refiere sii T (o los T) existe(n) La concepción de la referencia-s, en cambio, supone que un término ‘‘T” refiere exactamente si ‘‘T” se halla en una relación de referencia sustantiva con algo. Esto es: (S) ‘‘T” refiere exitosamente sii (Ex) (‘‘T” Ref x) La teoría de la referencia-s da cuenta de la relación sustantiva (Ref) que hay entre una expresión y lo que ella denota: hay algo con respecto a lo cual la expresión se halla en una relación de referencia apropiada. Las teorías de la referencia-s generalmente definen las nociones de referencia de tal modo que no todas las instancias de sustitución de (O) resultan verdaderas. La razón reside en el hecho de que las teorías de la referencia-s, a diferencia de lo que ocurre en el caso de la noción deflacionaria de referencia, tienen una función
93
interpretativa: una expresión token en algunas ocasiones de uso puede referir y en otras ocasiones no. Así, es posible que en el sentido deflacionario una expresión no tenga referencia, pero que refiera en cambio en un sentido sustantivo (cf. Bishop 2003: 163). Por ejemplo, la situación descripta por Kitcher acerca de que en algunas ocasiones de uso la expresión «aire deflogistizado» refiere a la sustancia removida del aire mientras que en otras ocasiones refiere a oxígeno ilustra, precisamente, la modalidad de referencia-s. De ahí que la estrategia de Kitcher permita, en principio, evadir el alcance de la inducción pesimista, dado que el propio argumento de Laudan está formulado en términos de referencia-s: hay una lista de teorías del pasado que fueron exitosas y, sin embargo, sus términos no refieren. La diferencia entre la referencia-o y la referencia-s refleja —según lo manifiesta el propio Bishop en una breve nota final— la distinción que Kripke establece entre «referencia semántica» y «referencia del hablante», o la correspondiente de Grice entre «referencia convencional» y «referencia del hablante». Esta alusión, por cierto, arroja algunos elementos para clarificar la cuestión. De acuerdo con Kripke, el referente semántico de una expresión está determinado por las convenciones del lenguaje y ciertos hechos acerca del mundo. Si un hablante tiene un término en su idiolecto, entonces, ciertas convenciones (dados diversos hechos acerca del mundo) determinan el referente de su idiolecto. El referente del hablante, en cambio, es aquél objeto acerca del cual el hablante desea hablar, en una ocasión dada, y del cual él cree que satisface las condiciones para ser el referente semántico de la expresión. De todos modos, no es del todo claro que la distinción formulada por Bishop recoja exactamente las ideas expresadas por Kripke. Pero el aspecto que interesa subrayar, a los fines que nos ocupan, es que, de acuerdo con Bishop, tanto los defensores del realismo como sus oponentes, los antirrealistas, han apelado siempre a la noción de referencia-s y, de este modo, han extraído conclusiones acerca de la existencia de las entidades postuladas por las teorías (referencia-o) a partir de premisas que sólo hablan de la referencia sustantiva.
94
Su propuesta, entonces, consiste en ofrecer una reformulación del argumento de la inducción pesimista que no hace uso de la noción sustantiva de la referencia. En efecto, de acuerdo con Bishop, el pesimista directo puede construir, como lo hace Laudan, una lista de teorías del pasado que hayan sido exitosas y mostrar que las entidades postuladas no existen (Cf. Bishop 2003:166). En otros términos, la diferencia entre el pesimista indirecto y el pesimista directo reside en el hecho de que lo importante no es si los términos teóricos refieren sino si las entidades postuladas existen. Bishop es consciente de que preguntar si las entidades postuladas existen es equivalente a preguntar si los términos tienen referencia-o; pero lo esencial —a su juicio— es que el argumento directo no emplea ninguna noción de referencia-s. Una vez elaborada la lista, aun bajo el supuesto de que las entidades postuladas por nuestras teorías actuales existen —tesis central del realismo— el realista se verá obligado a concluir que las afirmaciones teóricas no son verdaderas ni aproximadamente verdaderas. En efecto, con la lista de teorías en mano ha de hacerse la siguiente pregunta: ¿Nuestras teorías dejan un lugar en el mundo, por ejemplo, para «aire deflogistizado»? La respuesta, naturalmente, es no. La razón de ello reside en el hecho de que a la luz de las teorías actuales y bajo importantes testeos empíricos, los químicos han demostrado que el flogisto no existe. El realista seguramente podría argüir que algunas veces Priestley usó «aire deflogistizado» para referirse al oxígeno, esto es, que «aire deflogistizado» refiere-s a oxígeno. Pero ello, de acuerdo con Bishop, es muy diferente que afirmar que el aire deflogistizado existe. Decir, como lo hacen los realistas, que las entidades postuladas por las teorías científicas exitosas del pasado y del presente existen (incluyendo aquellas teorías que los científicos actuales han desacreditando sobre la base de argumentos empíricos) equivale, en opinión de Bishop, a creer en el zoo metafísico. A menos que los realistas crean en el zoo metafísico, no pueden sino aceptar este paso de la inducción pesimista directa: las entidades postuladas por las mejores teorías científicas no existen. Luego, sus afirmaciones no pueden ser verdaderas ni aproximadamente verdaderas.
95
Así, aun bajo la suposición optimista de que nuestras teorías actuales son verdaderas, el pesimista inductivo ha encontrado suficiente evidencia para pensar que el realista está equivocado, porque tal suposición compone una reducción al absurdo. Luego, sobre la base de esta evidencia, por inducción enumerativa debería suponer que nuestras teorías actuales postulan entidades no existentes y hacen afirmaciones sobre el mundo que no son verdaderas ni aproximadamente verdaderas. Según Bishop, la mejor manera de entender el proyecto antirrealista es considerando el argumento de la inducción pesimista como un sub-argumento dentro de un dilema: Si el realismo es falso, entonces, el antirrealismo es verdadero. Si el realismo es verdadero, entonces, el antirrealismo es verdadero (por aplicación de la inducción pesimista directa). El realismo es falso o verdadero. Luego, en cualquier caso el antirrealismo es verdadero (cf. Bishop 2003: 168). El próximo paso en la propuesta de Bishop es mostrar que la tesis de la inducción pesimista directa queda a salvo de cualquier refutación que se apoye en una teoría sustantiva de la referencia. Sinteticemos, pues, su argumentación. La cuestión reside en saber si, de acuerdo con la teoría de la referencia de los realistas, expresiones como «aire deflogistizado» realmente refieren. Hay, entonces, dos alternativas: 1. Si no refieren, entonces la teoría de la referencia del realista no protege a éste de la inducción pesimista señalada por Laudan. Si los términos de teorías obsoletas no refieren, entonces, sus afirmaciones no pueden ser ni verdaderas ni aproximadamente verdaderas. Luego, la teoría de la referencia del realista no apoya el realismo. 2. Si refieren, entonces puede preguntarse si el realista aplica el esquema (O) a tales expresiones que refieren exitosamente. Y nuevamente aquí se abren dos posibilidades: 2.1. Si no lo aplica, entonces, la teoría de la referencia del realista no apoya el realismo. 2.2. Si lo aplica, entonces el realista cae en el zoo metafísico: debe admitir no sólo que las expresiones de teorías exitosas y obsoletas refieren, sino que las entidades postuladas realmente existen.
96
Si el realista no acepta el zoo metafísico y se detiene en 2.1., esto es, no aplica el esquema (O), entonces pareciera que el realista afirma que mientras las entidades postuladas por aquellas teorías no existen, los términos en cambio refieren-s a cosas reales como el oxígeno, y así las afirmaciones centrales de aquellas teorías pueden ser verdaderas o aproximadamente verdaderas. Pero, de acuerdo con Bishop, esta manera de proceder es ilegítima, ya que si el realista arguye que «aire deflogistizado» refiere-s a oxígeno, y ello significa que está ontológicamente comprometido con la existencia del aire desflogistizado, entonces no está autorizado a hacer tal tipo de juicios, pues desde la perspectiva del pesimista directo los científicos han encontrado suficiente evidencia para pensar que las entidades postuladas por nuestras mejores teorías actuales no existen. Y si bien el procedimiento del pesimista directo puede estar equivocado, el realista no puede derribarlo sólo con las armas de una teoría sustantiva de la referencia, con una teoría del lenguaje. Si el realista replicara que «aire deflogistizado» y «oxígeno» co-refieren de manera sustantiva (co-refieren-s), se le recordará que está formulando afirmaciones sobre las propiedades de las expresiones lingüísticas que nada tienen que ver con la existencia de las entidades postuladas. Así, la formulación directa de la inducción pesimista resulta, en opinión de Bishop, inmune a todos los intentos que intentan revocarla apelando a una teoría sustantiva de la referencia.
3. UN ANTIRREALISMO CONFLICTIVO 3.1. El retorno a la referencia Bishop apoya su posición, como hemos señalado, en la distinción entre referencia-s y referencia-o: si se formula el argumento de la inducción pesimista sin apelar a la noción de referencia, entonces, el antirrealista resulta ileso frente a los embates del realista. Pero cabe preguntarse, pues, si la versión directa de la inducción pesimista logra, efectivamente, eliminar el uso de la noción de referencia y evitar así el vuelo a la referencia. Hemos visto que, según Bishop, la referencia-o, a diferencia de la referencia-s, hace hincapié en el hecho
97
de si las entidades postuladas por nuestras mejores teorías existen, no si sus términos refieren; y ello queda expresado en un principio deflacionario que afirma que ‘‘T” refiere si y sólo si T (o los T) existe(n). Ahora bien, ¿cuál es el significado preciso de este principio deflacionario? En el sentido deflacionario decir que ‘‘T” refiere equivale a decir —según Bishop— que existe exactamente aquello a lo que T refiere, y no otra cosa. Pero ese algo que existe tendrá entonces que cumplir con algunas propiedades que forman parte del significado de ‘‘T”, esto es, para saber si T existe debemos conocer previamente al menos aquellas propiedades que son condición necesaria y suficiente para poder aplicar adecuadamente el término ‘‘T” a T. Y como conocer esas propiedades no es más que conocer la referencia, la formulación directa de la inducción pesimista cae en su propia trampa: de manera subrepticia ha elevado su vuelo sobre la referencia. Si así, la diferencia entre la referencia-s y la referenciao no parece ser tan significativa como Bishop cree. Podría replicarse que para conocer si una entidad existe (o no existe) no es necesario conocer el conjunto de propiedades necesarias y suficientes recogidas en la definición del término usado para referir a la entidad. Sin embargo, según creemos, en el nivel del conocimiento científico, al menos, no hay otra posibilidad. Ilustremos la situación a través de un ejemplo. Decir, por caso, «aquí hay oro» implica conocer que ciertos aspectos de la realidad indican que hay oro y no otra cosa. Supongamos, además, que la sustancia frente a nosotros es amarilla, es maleable y se disuelve en agua regia. La pregunta es, pues, si basta con estas propiedades. Naturalmente, cada una de ellas es una condición necesaria pero de ningún modo suficiente para que una sustancia sea oro. Ser amarillo y maleable son, obviamente, aspectos compartidos por más de una entidad, y lo mismo ocurre con respecto a la circunstancia de disolverse en agua regia, ya que ello también es propio del platino. Pareciera, entonces, que en nuestro ejemplo del oro no es posible desconocer que se trata de una sustancia cuyo número atómico en la tabla periódica es 79, si es que el término «oro» ha de aplicarse unívocamente. Pero poseer peso atómico 79 constituye no sólo una condición necesaria sino,
98
además, una condición suficiente. De manera que, al menos en el campo del conocimiento brindado por la ciencia, sólo es factible afirmar si una entidad particular existe (o no existe) si contamos con alguna descripción que sea condición necesaria y suficiente. Luego, como ya hemos señalado, afirmar que un término refiere no es más que afirmar que el referente existe. 3. 2. Referencia ontológica y semántica intensional Aun si, en favor de la discusión, admitimos la relevancia de la distinción entre ambos tipos de referencia y la crítica de Bishop de que tanto realistas como antirrealistas han pretendido resolver problemas filosóficos apelando a una noción sustantiva de la referencia —noción que sólo tiene que ver con cuestiones de lenguaje—, de todos modos la posición de Bishop se torna controvertida. Algunos años atrás, Bishop suscribió, en contra de Kuhn y Feyerabend, el punto de vista de que siempre es posible formular una definición incompleta de los términos que componen una teoría, de tal manera que queda garantizada la posibilidad de contar con un lenguaje teóricamente neutral compartido por los teóricos en competencia (cf. Bishop 1991). En otras palabras, Bishop apoyó la idea de una semántica intensional sensible al contexto según la cual en algunos casos un término puede expresar el concepto completo, mientras que en otros contextos podría expresar un concepto incompleto: en ciertas ocasiones de uso un término puede expresar el concepto completo, esto es, incluir en el definiens del concepto sólo aquellas descripciones que son condición necesaria y suficiente para su aplicación, pero ello no impide, sin embargo, que en otras ocasiones el mismo término pueda expresar un concepto incompleto, es decir, que incorpore en el definiens descripciones tales que, ninguna de ellas, mencione propiedades que dependan unívocamente de una teoría. Así, la definición incompleta de un término ‘‘T” se fija por la conjunción de las oraciones que constituyen un subconjunto propio de todas las oraciones de la teoría que contienen ‘‘T”, subconjunto que excluye aquellas descripciones que son condición necesaria y suficiente. Retomemos, para ilustrar su punto de vista, nuestro simplificado ejemplo del oro. Conforme con la caracterización de definición in
99
completa ofrecida más arriba, la definición de «oro» no puede incluir en su definiens la oración «x es una sustancia química de número atómico 79», pues en la medida en que tal descripción constituye una condición necesaria y suficiente, estaríamos ofreciendo el concepto completo. De manera que una definición incompleta podría formularse como sigue: «El oro es definido como el único x, tal que x es amarillo, y x es maleable, y x se disuelve en agua regia ....»2. Ahora bien, si aceptamos que hay una diferencia entre la referencia-s y la referencia-o, podemos a su vez establecer una vinculación entre ambos tipos de referencia y las definiciones de los términos que aluden a ellas. Hemos visto que un término refiere-o si y sólo si el referente existe, y afirmar que el referente existe no es más, a nuestro juicio, que afirmar que la entidad en cuestión satisface las propiedades necesarias y suficientes que nos permiten aplicar unívocamente el término en una situación particular. Si así, la referencia-o sólo puede quedar capturada a través de la definición completa del término en cuestión. Por otra parte, como ya señalamos, la relación de referencia-s supone que una expresión token en algunas ocasiones puede referir y en otras no. Pero ello sólo es posible, a nuestro entender, si la expresión no recoge el conjunto de propiedades que son condición necesaria y suficiente para su aplicación, lo cual equivale a decir que el token alude sólo a su concepto incompleto. Pero ahora, entonces, Bishop queda enredado en los hilos del propio ovillo que critica. La idea central desarrollada en 1998 y en 2003 ha sido que tanto realistas como antirrealistas falaciosamente han intentado resolver problemas filosóficos apelando a una noción sustantiva de la referencia que sólo atañe a propiedades del lenguaje. Sin embargo, conforme con nuestra argumentación, en 1991, él mismo ha usado —para decirlo con sus propias palabras— una teoría sustantiva de la referencia para resolver cuestiones de 2. Bishop propone una explicación del significado y la referencia de los términos que hace uso de la teoría de las descripciones definidas (cf. Bishop 1991: 349).
100
filosofía de la ciencia, a saber, enfrentar las indeseables consecuencias generadas a partir de la tesis de la inconmensurabilidad. En resumidas cuentas, entonces, la estrategia de Bishop para evitar el vuelo a la referencia presenta dificultades que otorgan a su posición un sesgo controvertido. Conforme con nuestro análisis podemos formular, pues, el siguiente dilema: si Bishop no hace uso de la referencia-s (por argumento directo de la inducción pesimista), entonces cae en el vuelo a la referencia. Si hace uso de la referencias (por adopción de una semántica intensional sensible al contexto), entonces, cae en el vuelo a referencia. Hace uso de la referencia-s o no lo hace. De modo que, en cualquier caso, Bishop cae en la estrategia del vuelo a la referencia.
REFERENCIAS Bishop, Michael (1991): "Why the Semantic Incommensurability Thesis is Self-Defeating", Philosophical Studies, 63, 3, pp. 343-355. Bishop, Michael (2003): "The pessimistic induction, the flight to reference and the metaphysical zoo", International Studies in the Philosophy of Science, vol. 17, nº 2, pp. 161-178. Bishop, Michael. y Stich, Stephen (1998): "The Flight to Reference, or How Not to Make Progress in the Philosophy of Science", Philosophy of Science, 65, pp. 33-49. Boyd, Richard (1984): "The Current Status of Scientific Realism", en Leplin, J. (ed.): Scientific Realism. Berkeley: University of California Press, pp. 41-48. Grice, Herbert (1969): "Utterer’s meaning and intentions", Philosophical Review, 78, pp. 147–177. Kitcher, Philip (1978): "Theories, theorists and theoretical change", Philosophical Review, 87, pp. 519-547.
101
Kitcher, Philip (1993): The Advancement of Science. New York: Oxford University Press. Kripke, Saul (1977): "Speaker’s reference and semantic reference", en French, P. A.; Uehling, T. E. y Wettstein H. K (eds.): Contemporary Perspectives in the Philosophy of Language: Minneapolis: University of Minnesota Press, pp. 255–276. Kukla, André (1998): Studies in Scientific Realism. New York: Oxford University Press. Laudan, Larry (1981): "A Confutation of Convergent Realism", Philosophy of Science, 48, 19-49. Laudan, Larry (1984a): Science and Values. Berkeley: University of California Press. Laudan, Larry (1984b): "Realism without the real", Philosophy of Science, 51, pp. 156-162. Maxwell, James Clerk ([1890]1962): "On Physical Lines of Force", en Maxwell, J. C.:The Scientific Papers of James Clerk Maxwell, vol. 1. New York: Dover, pp. 451-513. Poincairé, Henri ([1902]1968): La Science et L´ Hypothèse. Paris: Flammarion. Psillos, Stathis (1999): Scientific Realism: How Science Tracks the Truth. London: Routledge. Putnam, Hilary (1975): "The meaning of ‘meaning’", en Putnam, H.: Mind, Language and Reality: Philosophical Papers, Volume 2. Cambridge: Cambridge University Press, pp. 215–271. Smart, John J.C. (1968): Between Science and Philosophy. New York: Random House.
Nélida Gentile Universidad de Buenos Aires - Argentina nelgen@filo.uba.ar
LOS DESAFÍOS DEL REALISMO ESTRUCTURAL
Susana Lucero
105
LOS DESAFÍOS DEL REALISMO ESTRUCTURAL
Susana Lucero Resumen El presente artículo es una evaluación crítica del realismo estructural (RE) en la concepción de John Worrall; desarrolla los argumentos que podría construir el realista estructural para hacer frente a los desafíos de los antirrealistas representados en este caso por las críticas de Laudan. La tesis central del RE establece que hay continuidad o acumulación en el cambio científico, pero que tal continuidad es respecto a la forma o estructura la cual queda reflejada en las ecuaciones matemáticas de la teoría. Entre sus ventajas se advierte el hecho de que no postula la referencia de los términos centrales ni suscribe la tesis de la verosimilitud, ya que reemplaza el concepto de teorías verdaderas por el más liberal de teorías exitosas. La versión de John Worrall debe resolver, no obstante, algunas importantes dificultades: explicar con más precisión la continuidad a través de los episodios de revoluciones científicas y clarificar el principio de correspondencia aplicado al nivel matemático, es decir qué se entiende exactamente por la idea de continuidad aproximada de la estructura. Abstract The present article is a critical evaluation of John Worrall’s
106
conception of structural realism (SR). It develops some arguments a structural realist would build in order to face the antirealists’ challenges such as those posed by Laudan. The main thesis of SR claims that there is continuity or accumulation in scientific change but the continuity is one of the form or structure which is reflected in the mathematical equations of the theory. Among its advantages, we have the fact that it doesn’t postulate any reference to the central theoretic terms nor assumes it the thesis of verisimilitude, since it replaces the concept of true theories by the more liberal notion of successful theories. John Worrall’s approach needs to solve important difficulties like how continuity works in the episodes of scientific revolutions. It must also clarify the correspondence principle when it is applied at the mathematical level, in other words: what exactly is meant by the idea of approximate continuity of structure.
I En las últimas décadas, algunos participantes del ya célebre debate entre realistas y antirrealistas han elaborado concepciones del realismo científico de variada fuerza y modalidad. Una versión atractiva dentro de este grupo es la propuesta de John Worrall conocida como realismo estructural (Worrall 1997). Esta posición surge al calor de las críticas formuladas por los antirrealistas en torno al cambio científico y sus aspectos ontológicos y semánticos. El realismo estructural de Worrall intenta superar dos movimientos en tensión: el pragmatismo con sus variantes (instrumentalismo y empirismo constructivo) y el realismo conjetural de Popper, pues cada uno exhibe ventajas y debilidades. El propósito de Worrall es elaborar un realismo más robusto que el de Popper, ya que la concepción popperiana se le presenta demasiado débil, debido a su escepticismo respecto de la posibilidad de que lleguemos a conocer la verdad o aproximación a la verdad de las teorías. Worrall busca, en efecto, una versión de realismo que no se halle peligrosamente cercana a ninguna variante del anti realismo. Para ello considera seriamente dos argumentos que corren en direcciones opuestas: la metainducción pesimista (MIP) y el argumento del no milagro (ANM). El primero, apoyado en la evidencia que ofrece la historia de la ciencia, advierte
107
que en la marcha del conocimiento científico, las teorías antiguas han sido reemplazadas por otras nuevas y mejores, a su turno las nuevas teorías fueron abandonadas por otras mejores y así sucesivamente. De modo que tenemos buenas razones para creer que las teorías exitosas actuales también se van a revelar falsas y serán sustituidas por otras; en definitiva, no podemos afirmar que las mejores teorías de nuestro tiempo sean verdaderas o aproximadamente verdaderas. Varios antirrealistas han hecho pie en MIP para construir críticas demoledoras contra sus adversarios filosóficos, en particular Larry Laudan (cf. Laudan 1997). El ANM es en cambio el locus preferido de los realistas científicos. Brevemente este argumento sostiene que sería un verdadero milagro, una coincidencia cósmica, que las teorías que exhiben tantos éxitos empíricos y tecnológicos estuvieran edificadas sobre principios falsos; pero como no aceptamos los milagros, es racional creer que el éxito se debe a que esas teorías describen correctamente los hechos; tenemos entonces buenas razones para pensar que las teorías exitosas de nuestro tiempo son al menos aproximadamente verdaderas, y que las entidades no observables que ellas postulan (electrones, campos electromagnéticos) existen. Worrall llama la atención sobre una característica del realismo, su dependencia de la tesis de que el cambio científico es acumulativo, esto es, que gran parte del contenido observacional y teórico de una teoría predecesora T se conserva en la nueva teoría T’; además, la teoría triunfante estaría en condiciones de explicar por qué su predecesora tuvo el éxito que tuvo. A pesar del desafío que implica el argumento MIP para el realismo científico, Worrall está convencido de que puede ofrecer una respuesta satisfactoria que recoja «lo mejor de los dos mundos», es decir que acepte por un lado el núcleo del argumento del no milagro y por otro, que dé cuenta del cambio teórico producido tal como lo revela la historia de la ciencia. Esta respuesta es el realismo estructural, cuya tesis central afirma que lo que se conserva en el pasaje de una teoría anterior a una nueva no son solamente las consecuencias empíricas verdaderas sino algo del nivel de lo no empírico, aunque
108
no el contenido teórico sino la forma o estructura, expresada en las ecuaciones matemáticas. Su ejemplo preferido es el cambio desde la teoría ondulatoria de la luz desarrollada por Fresnel, la cual postula que la luz se desplaza en un medio sólido elástico —el éter—, a la teoría de Maxwell que afirma que la luz se debe a la propagación de ondas en un campo electromagnético, pero las formas del desplazamiento ondulatorio obedecen a las mismas leyes matemáticas. En este trabajo se exploran los recursos con que cuenta el realismo estructural para hacer frente a las críticas de algunos antirrealistas inspiradas en el argumento MIP, en particular las de Larry Laudan.
II En su artículo «A Confutation of convergent realism», Laudan (1997) elabora argumentos críticos de penetrante agudeza en contra de algunas tesis básicas del realismo científico; estas críticas resultan válidas inclusive con respecto a una versión más moderada del realismo denominado «realismo modificado» o simplemente «realismo epistemológico». Esta posición puede resumirse así: «Tenemos buenas razones para sostener que las teorías actuales empíricamente exitosas de las ciencias maduras son aproximada o esencialmente verdaderas». Las objeciones de Laudan a esta tesis, basadas en general en el argumento MIP, hacen blanco en diversos aspectos, a saber: (1) el carácter referencial de los términos centrales que concurren en las teorías de la ciencia madura, (2) la noción por demás problemática de aproximación a la verdad atribuida a las leyes y principios, (3) la idea de ciencia madura o ciencia exitosa y por último (4) el carácter convergente de las teorías sucesivas acerca de un mismo dominio de fenómenos. De acuerdo con Worrall las críticas de Laudan están bien fundadas aunque no afectan la propuesta del realismo estructural. Hay que tener en cuenta que una presuposición del realismo científico, como se dijo, es que existe alguna forma de continuidad en el cambio, no solamente en lo que respecta a las consecuencias empíricas verdaderas sino también en la parte no observacional de una teoría T que presumiblemente se conserva en su sucesora T’. Debe aclarase además que la clase de realismo epistemológico que está en danza y que ha sido defendido a su vez
109
por autores realistas como R. Boyd, H. Putnam, Newton-Smith y A. Shimony, pretende que las tesis del realismo epistemológico estén abiertas al test de la experiencia, es decir que puedan ser confrontadas con la práctica científica pasada y presente. En virtud de este rasgo de naturalización, Laudan procede a refutar las tesis, veamos en detalle los argumentos. La primera objeción demuestra que la afirmación que conecta el éxito de una teoría con el hecho de que sus términos centrales refieran es históricamente falsa. Llamemos a esta crítica, la crítica referencialista. Laudan menciona contraejemplos históricos que operan en la siguiente doble dirección: A) Numerosas teorías cuyos términos presuntamente refieren (desde el punto de vista del realista) no fueron exitosas en su momento, por ejemplo las teorías químicas del átomo en el siglo XVIII, la teoría de Prout acerca de que el peso atómico de los elementos químicos es un compuesto de átomos de hidrógeno en el siglo XIX, la teoría de la deriva continental de Wegener antes de 1960, carecieron de éxito y algunas debieron enfrentar importantes refutaciones. Esta circunstancia se explica además porque aun cuando las entidades aludidas existieran, la teoría podría atribuirles propiedades o relaciones que no les corresponden. La teoría de Dalton produjo muchas afirmaciones falsas acerca de los átomos y lo mismo ocurrió con la primera versión de la teoría de Bohr sobre el electrón. B) Numerosas teorías cuyos términos centrales hoy se sabe que no refieren fueron enormemente exitosas en su época, entre ellas la teoría óptica de Fresnel que postuló la existencia del éter lumínico y realizó asombrosas predicciones, la teoría del flogisto, del fluido eléctrico, etc. En conclusión, la conexión entre referencia y éxito científico es "extremadamente tenue" (Laudan 1997: 114). La segunda objeción señala que, dejando de lado la referencia de los términos teóricos, muchos realistas científicos suscriben la tesis de la existencia de una conexión entre verosimilitud y éxito empírico, de modo que se comprometen con la afirmación de que si una teoría es aproximadamente verdadera entonces es explicativamente exitosa. En este caso, el realista está obligado a ofrecer argumentos indepen
110
dientes a favor de esta conexión. Pero de atenernos al análisis histórico de Laudan, la relación entre verosimilitud y éxito empírico es tan errónea como la anterior. En primer lugar los realistas no han podido articular todavía una noción coherente de aproximación a la verdad y, por otra parte, el intento de aplicarla ha originado más problemas de los que se intentaban resolver. Pero aun suponiendo que la noción estuviera claramente definida, restaría probar que la aproximación a la verdad de una teoría implica su éxito explicativo y predictivo, tal conclusión es sin embargo un non sequitur. En efecto, un realista epistemológico que aceptara una teoría como aproximadamente verdadera (aunque sea a partir de una idea intuitiva de verosimilitud) debe aceptar a la vez que al menos algunos términos básicos de su teoría genuinamente refieren, pues cómo podría creer que las hipótesis de la teoría genética son aproximadamente verdaderas y negar que existan genes; o creer que la teoría atómica de la materia se aproxima a la verdad si en el mundo no hay entidades similares a los átomos, si no hubiera partículas subatómicas seguramente el realista no podría decir que la teoría cuántica es aproximadamente verdadera. En síntesis, el carácter referencial de los términos centrales de las teorías presentes no puede ser ignorado por alguien que defiende alguna versión de la tesis de la aproximación a la verdad o verosimilitud. Pero como ya fue demostrado por la crítica referencialista, la referencia no garantiza el éxito ni el éxito la referencia. Ahora bien, la referencia es una condición necesaria de la aproximación a la verdad, de modo que esta última tesis queda, a su turno, desvinculada del éxito científico. Nuevamente la apelación a la historia de la ciencia es decisiva en este argumento, Laudan presenta una larga lista de teorías químicas y físicas exitosas en su tiempo de las cuales hoy sabemos que no refieren ni se les podría atribuir verosimilitud. Y curiosamente, la historia de la ciencia muestra que varias teorías del pasado cumplen las siguientes dos condiciones: sus términos genuinamente refieren y gozaron de éxito empírico en su época pero los científicos hoy se resistirían a admitir que son aproximadamente verdaderas; por ejemplo, las teorías del átomo de los años 20 de acuerdo con las cuales el núcleo atómico es estructuralmente homogéneo.
111
La tercera objeción de Laudan es acerca de contar con un criterio preciso de madurez científica, a fin de que las críticas formuladas no sean evitadas con estratagemas ad hoc. Laudan especifica cuál es el criterio que va a adoptar para seleccionar contraejemplos históricos del realismo epistemológico: "asumiré que una teoría es exitosa en la medida en que se ha desempeñado bien, esto es en la medida en que ha funcionado en una variedad de contextos explicativos, ha conducido a predicciones confirmadas y posee un amplio espectro explicativo." (Laudan 1997: 111-112)
La última objeción de Laudan apunta hacia el fenómeno de la convergencia (acumulación o correspondencia) que muchos realistas científicos invocan para dar cuenta del desarrollo progresivo de las teorías de las ciencias maduras. Brevemente este principio establece que las nuevas teorías retienen porciones apropiadas de las teorías anteriores, más precisamente una teoría exitosa T2 conserva las leyes y los mecanismos teóricos propuestos por su predecesora T1 como casos límite. En este sentido T2 se halla en una relación de correspondencia con T1 , o dicho de otra manera, T1 es un caso límite de T2. La noción de «caso límite» podría todavía ser precisada un poco más. En su versión más estricta se formularía así: una teoría T1 es un caso límite de la teoría exitosa que la reemplaza T2 sólo si se cumplen las siguientes dos condiciones: (1) todas las entidades postuladas por T1 ocurren en la ontología de T2 , y (2) todas las leyes de T1 pueden derivarse de T2, dadas las condiciones limitantes apropiadas. Realistas científicos como Hillary Putnam afirman que esta estrategia es la que los científicos intentan aplicar y la que ha conducido a importantes descubrimientos. Por supuesto existen versiones más debilitadas de la convergencia dependiendo de qué porciones de la vieja teoría exitosa se postula que son retenidas en la nueva y en qué grado. En el caso de Popper se retienen las consecuencias observacionales verdaderas; para Boyd, Mc Mullin y Putnam son las leyes y los mecanismos teóricos los que se conservan, para Boyd y Putnam también la referencia de los términos teóricos. Laudan rechaza la tesis de la convergencia sobre la base de la
112
información que suministra la literatura histórica de la ciencia. Salvo algunas excepciones provenientes de la mecánica, el principio de correspondencia casi nunca se cumple. La teoría ondulatoria de la luz por ejemplo fue aceptada aunque no preservaba los principios teóricos de la anterior teoría corpuscular. Del mismo modo, la teoría de Darwin tampoco retenía muchos de los mecanismos de la teoría evolucionista de Lamarck. Por otra parte el principio de correspondencia no puede funcionar como una guía heurística, porque al tratar de conservar las leyes y mecanismos de las teorías precedentes, se limitaría la creatividad de los científicos. La única estrategia de alcance general que Laudan estaría dispuesto a sugerir a los científicos es la que dice: "acepte una teoría empíricamente exitosa sin tener en cuenta el hecho de que contenga las leyes teóricas y los mecanismos de su predecesora" (Laudan 1997: 126-127). En resumen, el fenómeno de la convergencia que el realista invoca es tanto históricamente falso como normativamente inapropiado.
III En su propósito de articular una concepción convincente del realismo científico, Worrall había descartado tanto el pragmatismo como el realismo conjetural de Popper. Ambos conciben el cambio científico en un sentido de acrecentamiento acumulativo en el nivel empírico y no acumulativo o discontinuo en el nivel teórico. La principal dificultad del pragmatismo, en su versión instrumentalista, es que no puede ofrecer una explicación del éxito empírico de la ciencia, debido a que otorga a los principios teóricos el rol de meros esquemas codificadores del conocimiento empírico. En cuanto al realismo científico de Popper, a pesar de que concibe las leyes básicas como descripciones de un mundo independiente de la mente; desde un punto de vista estrictamente epistemológico, resulta indistinguible del anti-realismo, dada su convicción de que no podemos saber cuándo nuestras teorías son verdaderas o aproximadamente verdaderas, ni tenemos indicios de haber triunfado en la interminable búsqueda de la verdad. Además el realismo científico de inclinación popperiana no hace ninguna concesión al argumento MIP, en tanto que Worrall está dispuesto a admitir la razonabilidad del argumento así como su
113
fundamentación histórica. En cambio, encuentra en la vieja filosofía de Henry Poincaré y P. Duhem la fuente del tipo de posición que desea defender. En La ciencia y la hipótesis, Poincaré había anticipado el núcleo del argumento MIP bajo el nombre de la «bancarrota de la ciencia», pero a la vez había contrarrestado el escepticismo que se deriva de toda bancarrota proponiendo una concepción no instrumentalista — en contra de lo que comúnmente se le atribuye (cf. Poincaré 1945)—. Sobre la base de esta propuesta original, John Worrall tomó a su cargo el desarrollo del programa del realismo estructural cuyo núcleo duro afirma la tesis de la continuidad de cambio teórico en el nivel de las ecuaciones matemáticas y no de la interpretación conceptual. En efecto, la preservación de la estructura puede ir acompañada de un cambio en la ontología postulada por la teoría sucesora e inclusive de los principios y mecanismos teóricos. El programa suscribe el principio de correspondencia a nivel formal en el siguiente sentido: las ecuaciones matemáticas de la antigua teoría re-emergen como casos límite en las ecuaciones matemáticas de la nueva; hay entonces una continuidad aproximada de la estructura. Worrall declara que esta concepción recoge «lo mejor de los dos mundos»: las intuiciones subyacentes en el argumento del no milagro y los resultados de la historia de la ciencia. El caso paradigmático analizado por Worrall es el cambio de la teoría ondulatoria de la luz de Fresnel en el siglo XIX por la teoría electromagnética de Maxwell. Respecto de la teoría de Fresnel, no se puede afirmar que sea verdadera o aproximadamente verdadera, pues sus términos centrales no refieren, y los mecanismos teóricos postulados no son retenidos en la teoría sucesora ni constituyen casos límite. Sin embargo, la óptica de Fresnel pertenece sin duda alguna a la ciencia madura como bien lo reconoce Laudan, "si ella [la teoría de Fresnel] no cuenta como un éxito empírico, entonces nada lo hace" (Laudan 1997: 115). Fresnel, en efecto, se equivocó al describir la naturaleza de la luz como el resultado de perturbaciones periódicas que se transmiten en un medio elástico sólido, el éter, pero su teoría tuvo un éxito empírico asombroso porque capturó correctamente las relaciones de los fenó
114
menos ópticos expresadas en las ecuaciones matemáticas. Estas mismas ecuaciones reaparecen en la teoría de Maxwell aunque ahora la luz consiste en vibraciones que se propagan en un campo electromagnético. Con ello se comprueba la continuidad formal o de estructura lo cual constituye un ingrediente formidable a favor del realismo estructural en su lucha contra las consecuencias devastadoras del argumento MIP. No obstante, la pertinenecia del ejemplo elegido por Worrall —en el cual las ecuaciones matemáticas se conservan intactas a través del pasaje de una teoría exitosa a otra— es dudosa, pues el caso de las teorías ópticas no es representativo del cambio teórico en general. Worrall aclara al respecto que, "el patrón corriente del cambio científico es aquel en el cual las ecuaciones antiguas reaparecen como casos límite en la nueva teoría, es decir las viejas y las nuevas ecuaciones son estrictamente inconsistentes, pero las nuevas tienden hacia las viejas como una cantidad tiende hacia un límite." (Worrall 1997: 160)
Nuestro objetivo en esta sección es examinar si las cuatro objeciones de Laudan mencionadas en la sección II son lo suficientemente intensas como para refutar las tesis del realismo estructural. En primer lugar, el realismo estructural no es una teoría referencialista, no asume que podemos conocer la naturaleza de las entidades referidas por los términos teóricos de las ciencias maduras. En este punto Worrall se apoya en Poincaré. En efecto, en La ciencia y la hipótesis, el matemático francés afirmaba que la naturaleza nos va a ocultar para siempre la esencia de los objetos reales, pero aún así podemos llegar a conocer las relaciones reales entre los objetos —sean los que fueren— expresadas a través de las ecuaciones matemáticas de la teoría, "[…] esas ecuaciones expresan relaciones, y si las ecuaciones permanecen verdaderas, es que esas relaciones conservan su realidad. Ellas nos enseñan, ahora como antes, que hay cierta relación entre un algo y otro algo, solamente que a ese algo lo llamábamos antes movimiento y ahora lo llamamos corriente eléctrica." (Poincaré 1945: 153 y s.)
También para Worrall es erróneo creer que las teorías científicas
115
develan la naturaleza de los objetos que pueblan el universo, las teorías exitosas deberían más bien tomar sus términos fundamentales como primitivos sin asumir compromisos ontológicos con sus presuntos referentes. Esto es lo que corresponde en el caso de la acción a distancia en la teoría de Newton o de los estados cuánticos en la mecánica cuántica. La exigencia de conocer la naturaleza de las entidades y la necesidad de apostar a su existencia tienen su origen en expectativas metafísicas que corresponden a una tradición de pensamiento profundamente arraigada en nosotros. En segundo lugar, el realismo estructural no se compromete con la idea de verosimilitud porque, como ya se demostró, esta tesis está ligada a la referencia de los términos teóricos. Por otra parte, cuando se ha dejado de lado la interpretación teórico-conceptual de los mecanismos y procesos que postula la teoría, el problema de la verdad o de la aproximación a la verdad simplemente no surge. En tercer lugar, Worrall ha brindado un criterio razonablemente preciso e independiente de madurez que obtiene a partir del argumento del no milagro; dicho criterio, en efecto, se aplica solamente a las teorías que han tenido éxito empírico genuino. En un espíritu claramente lakatosiano, Worrall define «ciencia madura» como aquélla cuyas teorías han logrado formular predicciones de hechos completamente nuevos, corroborados posteriormente por la experiencia. Es de notar que el éxito predictivo no es equivalente a las consecuencias observacionales verdaderas ni a la adecuación empírica, tiene un sobrevalor que radica en la auténtica novedad de ciertos tipos de hechos que la teoría ha logrado anticipar. Son ejemplos de éxito predictivo genuino la predicción del planeta Neptuno por la teoría de Newton y la aparición de un punto luminoso en el centro de la sombra proyectada por un disco opaco predicha por la teoría de Fresnel. En este sentido, el criterio de Worrall es más riguroso que el propuesto por Laudan; con él se pretenden evitar maniobras ad hoc en aquellos casos en que la tesis realista resulte refutada por contraejemplos históricos, alegando por ejemplo que los casos refutadores no pertenecen estrictamente a la ciencia madura. Con respecto a las tres primeras objeciones, hemos hallado que el realismo estructural se encuentra bien pertrechado para responder
116
las críticas del anti-realista. Pero el cuarto desafío o tesis de la convergencia no corre la misma suerte. Recordemos que esta tesis incorpora el principio de correspondencia para las ecuaciones matemáticas requiriendo que las ecuaciones de la vieja teoría re-emerjan como casos límite en las ecuaciones de la nueva. Se pretende además que el principio funcione como una herramienta heurística para desarrollar teorías nuevas. Desde nuestro punto de vista esta propuesta es deficiente, recuérdese que el caso de las teorías de la luz, en las cuales las ecuaciones de la teoría abandonada se conservan intactas en la teoría que la sustituye, no es representativo del cambio en general; Worrall habla de una «conservación aproximada de la estructura» para referirse a la mayoría de los cambios formales producidos entre teorías sucesivas, pero lo cierto es que no ofrece un análisis esclarecedor de en qué exactamente consiste que las ecuaciones de una teoría se «aproximen» a las de otra; se limita a ejemplificar el punto con una referencia a las teorías de Newton y Einstein: "Innegablemente las ecuaciones de Einstein se aproximan a las de Newton en ciertos casos límite especiales. En este sentido hay continuidad aproximada de la estructura […]" (Worrall 1997: 160, las cursivas son nuestras). Ciertamente algunos conceptos clave del realismo estructural reclaman ser mejor elucidados si van a desempeñar el rol que se pretende que cumplan, la noción de aproximación estructural es todavía demasiado imprecisa; a menos que Worrall elabore una definición más clara de lo que entiende por «continuidad aproximada de la estructura», el concepto resulta tan problemático como el de aproximación a la verdad. Parafraseando al propio Worrall, estamos en una situación tal que uno no puede continuar avanzando alegremente y dejar el término como primitivo. Por último, y fuera de las cuatro críticas anti-realistas de Laudan, parece necesario que el realismo estructural —sea en la versión preliminar de Poincaré o en la más elaborada formulación de Worrall—, ofrezca una explicación apropiada sobre qué lugar ocupan en esta concepción las revoluciones científicas y cómo deben ser entendidas. En los escritos de Worrall es posible deslindar dos tipos de cambio
117
científico: un cambio por extensión con modificaciones, esencialmente continuo y un cambio teórico radical o revolucionario que recuerda al de Kuhn. El segundo entraña que el reemplazo de una teoría T1 en su momento exitosa por otra teoría T2 que la supera implica un cambio de los principios teóricos, de los procesos y mecanismos postulados por la teoría anterior junto con el abandono de la ontología popularizada por T1 . Pero al mismo tiempo hay conservación acumulativa de las consecuencias empíricas verdaderas y además continuidad de la estructura matemática, sea completa o aproximada. Los factores de continuidad empírica y super-empírica mencionados parecieran indicar que el cambio revolucionario concebido por los proponentes del realismo estructural no es de corte kuhniano, de modo que no sería potencialmente generador de inconmensurabilidad. Dado el papel fundamental que tiene en esta posición la idea de que el cambio teórico es en algún sentido, esencialmente acumulativo, creemos que el caso de las revoluciones científicas merece un tratamiento especial, en particular porque Worrall suscribe la idea de que los cambios revolucionarios han ocurrido efectivamente en la historia de la ciencia. En el balance general de la concepción de Worrall, concluimos que varios de los desafíos planteados por los anti-realistas pueden ser respondidos de manera satisfactoria, otros en cambio quedan a la espera de ulteriores fundamentaciones, pero puesto que la propuesta del realismo estructural es programática, en consonancia con el espíritu lakatosiano deberíamos ser tolerantes y esperar a que nuevos aportes y articulaciones consoliden el programa como una alternativa viable de realismo científico. De todos modos, vale tener presente la agudísima sugerencia de Laudan en el sentido de que los desafíos que un realista científico debe afrontar suponen poder distinguir con claridad entre lo que deseamos fervientemente creer y el hecho de si tenemos buenas razones para creerlo.
118
REFERENCIAS Ladyman, James (1998): "What is Structural Realism?", Studies in History and Philosophy of Science, vol. 29, n. 3, pp. 409424. Laudan, Larry (1997): "A Confutation of Convergent Realism", en Papineau, D. (ed.): The Philosophy of Science. New York: Oxford University Press, pp. 107-138. Poincaré, Henri (1945): La Ciencia y la hipótesis. Buenos Aires: Espasa Calpe. Psillos, Stathis (1999): Scientific Realism: How Science Tracks Truth. London: Routledge. Saunders, Simon (2003): "Structural Realism, Again", Synthese 136, pp. 127-133. Worrall, John (1997): "Structural Realism: The Best of Both Worlds?", en Papineau, D. (ed.): The Philosophy of Science. New York: Oxford University Press, pp. 134-165.
Susana Lucero Universidad de Buenos Aires – Argentina lususa@arnet.com.ar
VAGUEDAD Y MEDIDA
Luis Adrian Urtubey
121
VAGUEDAD Y MEDIDA
Luis Adrian Urtubey Resumen En este trabajo procuraré mostrar que los argumentos en contra de establecer una relación entre vaguedad y medida se basan en una consideración inadecuada de los grados de verdad asociados a los enunciados con términos vagos en las teorías numéricas. Sostendré que esta línea de ataque no es del todo efectiva, puesto que los grados de verdad no sirven por sí solos para sustentar una semántica en este ámbito y por ello, para justificar la inferencia lógica. Una línea alternativa de investigación y más promisoria, es la sugerida por quienes, reconociendo las dificultades de una perspectiva gradualista, destacan el rol que tiene la noción de información para relacionar vaguedad y medida. Abstract I try to show here that most of the arguments against the apparent relationship between vagueness and measure are based on a misguided consideration of the degrees of truth usually associated with the statements in the so-called numerical theories of vagueness. I will argue that this kind of criticism would hardly suceded because the degrees of truth by themselves cannot manage to support the semantics and thereby justifying logical inference in this setting. An
122
alternative more promissory approach has been taken for those who by criticising the numerical theories have focused nonetheless on the role played by the notion of information as an intermediary between vagueness and measure.
1. PRESENTACIÓN Una de las tantas objeciones dirigidas contra la semántica lógica clásica, señala su ineficacia para tratar con los predicados vagos y los problemas asociados con ellos, tales como la conocida paradoja del sorites. Una forma en que suele presentarse este argumento pone en cuestión, por ejemplo, una regla de inferencia básica como el modus ponens. Represéntese por Pn el enunciado «una persona con n cabellos en su cabeza es calvo». Luego dada la verdad de las premisas: P0 , P0 ⊃ P1 , P1 ⊃ P2 ,....., P99999 ⊃ P100000 y por la validez del modus ponens, se sigue por reiteradas aplicaciones de esta regla la conclusión P100000, lo cual es obviamente falso. Para superar esta dificultad, las teorías de la vaguedad basadas en la aplicación de la teoría de conjuntos difusos o borrosos (fuzzy sets), han favorecido la introducción de un continuo de grados de verdad basados en los grados de pertenencia de los elementos de un conjunto difuso, dando lugar a las que se denominan teorías gradualistas de la vaguead. Tye, Sainsbury y Keefe, entre otros, han planteado objeciones contra este tipo de teorías numéricas, desde diferentes perspectivas, señalando su incapacidad para dar cuenta del fenómeno estudiado (cf. Tye 1994, Sainsbury 1997 y Keefe 1998). Williamson (1994), en particular, había ya centrado sus críticas en la dificultad que las teorías gradualistas encuentran frente a la vaguedad de orden superior (cf. Williamson 1994: cap. 4). En la dirección opuesta, diversos autores han tratado de fundamentar la forma de proceder de las teorías gradualistas, relacionando —como parece natural— la asignación numérica a los enunciados de un lenguaje con cierto tipo de medida, definida dentro del estándar de la teoría representacional clásica de la medición. Estos intentos se basan en diferentes formas de plantear la relación entre las nociones
123
de vaguedad y medida. Los detractores de las teorías numéricas, por su parte, han argumentado de diferentes maneras contra la viabilidad de esta propuesta. En este trabajo procuraré mostrar que los argumentos en contra de establecer una relación entre vaguedad y medida se basan en considerar en forma aislada los grados de verdad asociados a los enunciados con términos vagos en las teorías numéricas. Sostendré que tal cuestionamiento no es válido, puesto que los mencionados grados de verdad no sirven por sí solos para sustentar una semántica en este ámbito y por ello, para justificar la inferencia lógica. Una línea alternativa de investigación más promisoria, es la sugerida por quienes, reconociendo las dificultades, destacan el rol que tiene la noción de información en el vínculo que resulta útil establecer entre vaguedad y medida. Finalmente, vincularé una articulación de estas propuestas con una forma de ficcionalismo matemático.
2. LOS ARGUMENTOS DE KEEFE Keefe reúne en forma sintética diversos argumentos contra este tipo de teorías de la vaguedad, en las que los valores de verdad corresponden a grados de verdad, típicamente representados por el intervalo [0,1] (cf. Keefe 1998). Keefe evalúa el éxito de estas teorías para «capturar el fenómeno de la vaguedad», trazando una analogía con la medición de diversas magnitudes físicas, con números reales. Sus críticas abarcan tres puntos en particular: 1) las teorías gradualistas de la vaguedad están socavadas por el fracaso del principio relativo a la medida, por el cual resulta necesario que la relación asociada tenga la propiedad de ser conectada, es decir, ∀x, y o bien x ≤P y o y ≤P x, 2) la causa de la confusión que parece originar la teoría gradualista, se hallaría en no haber distinguido diferentes sentidos de la expresión «darse en grados», y finalmente 3) la semántica de las conectivas implica que debería haber una única asignación numérica correcta para las sentencias, lo cual no resulta plausible. El argumento central de Keefe para 1) y 2) se puede resumir como sigue. Tomemos el predicado vago «alto»: los números asignados en un intento por capturar la vaguead de «alto» no hacen más
124
que servir como otra medida de estatura. En general, en cuanto es posible asignar números que respetan ciertas verdades, por ejemplo, sobre relaciones comparativas, esto no es más que una medida de un atributo relacionado con, o que subyace al predicado vago. Keefe observa que "en muchos casos paradigmáticos de un predicado vago F hay un atributo medible correspondiente relacionado con F de modo tal que el estatus del valor de verdad de Fx está determinado por la cantidad en x de este atributo" (Keefe 1998: 575). Por ejemplo, el estatus del valor de verdad de «a es alto» está determinado por, o superviene sobre, la estatura de a. Lo mismo sucede con «a está caliente» y la temperatura de a. No obstante, aunque la medida de la cantidad subyacente puede determinar la aplicabilidad del predicado vago, no se sigue que esta medida se refleja en valores de verdad no clásicos. Keefe sugiere que hay un sentido en que puede decirse que F se da en grados —llamémoslo darse en gradosm— siempre que hay una medida del atributo F–dad, y en la cual las cosas tienen distintos gradosm de F–dad por tener más o menos de este atributo. Pero el hecho de que muchos predicados vagos se dan en gradosm no es suficiente para el teórico gradualista, quien necesita que haya implicaciones para valores de verdad o grados de verdad, de modo que si F se da en grados, las predicaciones de F pueden ser verdaderas en grados intermedios. Darse en gradosm no es el sentido de «darse en grados» requerido por el teórico gradualista. Algunos teóricos gradualistas parecen confundir efectivamente estos dos sentidos que se deberían mantener separados. Como sucede en el siguiente argumento que Keefe atribuye a Forbes (ver Forbes 1983): Considérese un par de personas a y b tal que: 1. a es más alto que b. Podemos inferir, 2. a es alto en un grado mayor que b, luego 3. a satisface el predicado «es alto» en mayor grado que b, de donde 4. «a es alto» tiene mayor valor de verdad que «b es alto».
125
Este argumento es erróneo. Estando en juego el sentido de «gradom», con el sentido de «grado», 2 se sigue de 1, pero 3 y 4 no se siguen de 2. Mientras que con el sentido de «grados de verdad», 4 se sigue de 2, pero 2 no sigue de 1.
3. UNA RÉPLICA En un artículo reciente, Nicholas Smith intenta mostrar que estas tesis de Keefe son falsas (cf. Smith 2003). Para Smith no se sigue del argumento de Keefe que la teoría gradualista está confundida. La forma correcta en que se relacionan los dos sentidos de «grado» antes señalados, es otra. Primero hay objetos que tienen alturas. Luego, están las alturas que estos objetos tienen, que son también objetos. Entonces tenemos dos conjuntos: un conjunto O de personas, montañas, etc. y un conjunto H de alturas, que consta de una relación de orden ≤ . Hay un mapeo h de O a H, que asigna a cada objeto su altura. Hay también un tercer conjunto de objetos R de números reales. Hay diferentes mapeos del conjunto de alturas al conjunto de números reales; cada uno de estos puede entenderse como dando un nombre a cada altura: h(Luis) = x . Un mapeo f del conjunto de alturas al conjunto de los reales asigna a x el número 6; intuitivamente f(h(Luis)) es la altura de Luis en pies. Otro mapeo m: H → R asigna a x el número 1.8; m(h(Luis)) es la altura de Luis en metros. Hay relaciones familiares entre estas funciones como: c(x) = 30f(x). Para interpretar «alto» decimos que hay un subconjunto distinguido T de H tal que para todo objeto x de O, x es alto si h(x) ∈ T. La idea es que x es alto sólo en caso que x tenga una altura «suficiente». En «suficiente» está implícito que para todo x e y de H, si x ≤ y y x ∈ T, entonces y ∈ T. Esto da inmediatamente una importante relación entre «alto» y «más alto que»: para cualquier x e y de O, si y es más alto que x y x es alto, entonces y es alto. Sin embargo, como señala Smith, este modelo ignora la vaguedad de «alto». Deberá haber dos objetos adyacentes de los cuales uno es alto y el otro no, aunque sus alturas se hallen muy próximas, resultando que «a es alto» es verdadero simpliciter y «b es alto» es falso
126
simpliciter (cf. Smith 2003: 286). En respuesta a este problema los partidarios de la lógica difusa proponen reemplazar el subconjunto clásico T de H con un subconjunto difuso F, y modificar el requisito que T sea cerrado hacia arriba con la exigencia de que para todo x e y de H, si x ≤ y entonces el grado de pertenencia de x en F es menor o igual que el grado de pertenencia de y en F. Ahora «a es alto» será verdadero cualquiera sea el grado con que h(a) está en F, y se da así la importante relación entre «alto» y «más alto que»: para cualquier x e y de O, si y es más alto que x, entonces el grado de verdad de «y es alto» es al menos el grado de verdad de «x es alto». Ahora están dados los recursos para acomodar la vaguedad de «alto». Si a y b en O están muy próximos respecto de la altura, entonces puede ser ahora el caso que «a es alto» y «b es alto» estén muy cerca respecto de la verdad. Y no existe un compromiso con la idea de que si a es más alto que b, entonces «a es alto» es más verdadero que «b es alto». Smith introduce una definición de vaguedad basada en este hecho: «P» es vago si y sólo si satisface la siguiente condición: Proximidad: si a y b son muy similares en aspectos P–relevantes, entonces «Pa» y «Pb» son muy similares respecto a la verdad.
En términos de la presente discusión, dos objetos son muy semejantes en aspectos P–relevantes si poseen cantidades muy similares de Q, siendo Q la cantidad mensurable que subyace a la posesión de la propiedad seleccionada por «P».
4. VAGUEDAD Y CONJUNTOS DIFUSOS: ALGUNOS PROBLEMAS. Planteadas desde la perspectiva de quienes han contribuido de manera importante al desarrollo de la lógica difusa, Settimo Termini hace algunas interesantes observaciones sobre las limitaciones de la teoría de conjuntos difusos para representar la vaguedad (cf. Termini 2002). Aunque planteadas de un lado diferente y con distintos propósitos, estas observaciones coinciden con las objeciones bastante radicales que hace tiempo formulara Sainsbury contra la posibilidad de cualquier teoría matemática de la vaguedad.
127
Reconocer la vaguedad, dice Termini, es admitir que en el curso de la comunicación (frecuentemente en el lenguaje ordinario pero recientemente también en lenguaje de la ciencia) podemos encontrar palabras que no están exactamente definidas, predicados para los cuales hay individuos para los que no es posible determinar si se aplica o no dicho predicado (cf. Termini 2002: 346). En este marco, la idea a primera vista novedosa de la teoría de conjuntos difusos, es generalizar las funciones características clásicas permitiendo que ellas tomen también valores diferentes de 0 y 1. Por otro lado, lo extravagante de esta idea es que la teoría de conjuntos difusos intenta fundar en un nivel más general la noción de pertenencia, pero haciendo uso de nociones (función, número real, etc.) que necesitan teorías clásicas nítidas para su definición, y puede por ello, reducirse completamente a nociones tradicionales. Parecería extraño que esta formalización se pueda ver como el explicatum para una noción mucho más innovadora y general. Asimismo, sostiene Termini, el tener individuos con diferentes grados parciales de pertenencia, no agota el trabajo de la vaguedad. El rol que esta tiene no se puede reducir al de asignar grados de pertenencia definidos: la vaguedad señala el hecho de que en algunas circunstancias no es fácil y no es algo mecánico decidir la pertenencia (cf. Termini 2002: 347). Se puede proporcionar información adicional, y al hacer esto la vaguedad juega el rol muy importante y central de «gran traductor» entre diferentes contextos. Hay una gran potencialidad en el alcance de la vaguedad, que tiene un rol crucial para cambiar contextos (con la dificultad de transformar todo esto en evaluaciones numéricas útiles). ¿Qué modeliza entonces la teoría de conjuntos difusos? Para Termini se trata del modo en que algunas representaciones difieren de algunos modelos ideales. Los conjuntos difusos son uno de los modos más eficientes de modelizar la siguiente idea intuitiva: tenemos idealizaciones (conjuntos nítidos) y podemos también medir la distancia de algunos datos primarios (proporcionados por la naturaleza misma o por nuestras aproximaciones en el caso de situaciones muy complejas) respecto de estas idealizaciones. Los conjuntos di
128
fusos se pueden ver entonces en relación con un tipo de medida. Las medidas difusas proporcionan indicaciones en este sentido de cuánto se aleja un conjunto difuso de una función característica clásica; las medidas de especificidad, en cambio, de cuanto se acerca un conjunto difuso a un conjunto nítido.
5. MEDICIÓN Y MODELOS DE USO DEL PREDICADO Desde el mismo ámbito, Trillas y Alsina exponen una interpretación que intenta vincular la noción de «conjunto difuso» con la noción de información a través del concepto de medida (cf. Trillas y Alsina 1999). Desde este punto de vista, los valores de las funciones de pertenencia son «medidas» de los enunciados atómicos o elementales hechas con los rótulos lingüísticos de un fuzzy set. Los predicados vagos pueden ser captados sólo a través del uso sobre el universo de discurso correspondiente, lo que puede lograrse mediante la generalización del concepto de medida difusa. Como antes vimos, para medir una característica k exhibida por los elementos de S necesitamos en primer lugar conocer una relación comparativa tal como «x muestra la característica k menos que y», para todo x, y en S. Asumiendo que la relación así definida en S es un preorden (i.e., reflexiva y transitiva) se puede entonces definir una función m: S → [0,1] como una ≤k–medida, siempre que: 1. m(x0) = 0 si x0 ∈ S es minimal para ≤k 2. m(x1) = 1 si x1 ∈ S es maximal para ≤k 3. Si x ≤k y, entonces m(x) ≤ m(y) Sea P un predicado, nombre propio de una propiedad, un sustantivo o un rótulo lingüístico, cuyo uso primario en un universo de discurso X es conocido. Decimos que el uso de P en X es R–medible si hay un subconjunto no vacío S de R equipado con un preorden ≤ , una función φ: X → S y una ≤–medida sobre S tal que: • φ(x) ≤ φ(y) sii «x es menos P que y» para x, y en X
129
• El grado en que x es P : = m(φ(x)) para cada x en X. La función φ corresponde a una característica numérica de cómo se usa P en X y, por supuesto, la función μP : X → [0,1] : = m(φ(x)) para cada x en X, puede definirse como la Función de Compatibilidad de P en X y por consiguiente, como la Función de Pertenencia del conjunto difuso rotulado P. Esta función se puede interpretar como reflejando el uso de P en X; es decir como un modelo matemático del uso de P en X. Concentrándose en el caso de los conjuntos difusos, se puede definir ahora a partir de un conjunto X, un «fragmento de información pura», como una función ƒ: X → [0,1]. Cada vez que tenga sentido considerar a ƒ como un conjunto difuso μP , entonces ƒ se considera como un fragmento de información sobre el uso del concepto P en X. Esto significa que todos los enunciados «x es P» tienen su valor de verdad correspondiente μP ∈ [0,1]. Cuando ƒ es tal que ƒ ∈ [0,1]X con algunos valores difusos ƒ(x) ∈ (0,1) se interpreta el fragmento ƒ como información imprecisa. En fin, se interpreta entonces un elemento de información como un conjunto difuso sobre X y tales elementos de información se refieren al uso de conceptos cuya aplicación a los elementos de X tiene algún grado definido. La función de pertenencia μP es vista entonces como expresando la medida en que cada objeto es P.
6. VAGUEDAD Y PRECISIÓN El otro argumento contra las teorías gradualistas, que también recoge Keefee, hace hincapié en la falta de precisión que debería justamente caracterizar a la vaguedad y que quedaría desvirtuada al introducir asignaciones numéricas de cualquier tipo. La fuerza del argumento ha sido aceptada y algunas respuestas implican cierto reconocimiento sobre las limitaciones del enfoque. No obstante, puede sostenerse en este caso, que este tipo de argumentos también encierran alguna confusión. Una idea en este sentido, expuesta por Cook, destaca que se puede manejar un grado de precisión matemá
130
tica en la semántica sin atribuirla al lenguaje natural que se está estudiando, haciendo uso de una forma de entender la lógica como simple modelización y no como descripción de la realidad (cf. Cook 2002). No se debe buscar entonces la vaguedad en la semántica misma, sino en la descripción de la conexión entre la formalización y el discurso informal. De lo cual a su vez resulta una interpretación diferente de los medios o «artefactos» de que se vale la semántica, como puede ser el caso de los llamados fuzzy sets. Cook señala una importante diferencia entre proporcionar un modelo y dar una descripción (cf. Cook 2002: 236). Algunas partes del modelo se supone que representan (aunque de una manera simplificada) aspectos reales del fenómeno modelizado. Otras, no obstante no se supone tengan que ver con algo real. De este modo, algunas partes del modelo lógico, incluyendo objetos y relaciones muy involucradas en la semántica, pueden hallarse allí sólo con el propósito de facilitar la tarea matemática o simplificar nuestro manejo del modelo. Cook da como ejemplo para ilustrar este punto la reconstrucción conjuntista de los números naturales, vista como un modelo de los naturales. En la construcción que representa los naturales como ordinales de von Neumann, por ejemplo, el hecho de que no hay ningún ordinal de von Neumann entre {∅} y {∅, {∅}} representa efectivamente el hecho de que no hay número natural entre 1 y 2. Por otro lado, el hecho de que {∅} tiene un elemento menos que {∅, {∅}} no refleja ninguna relación significativa entre 1 y 2. Cada aspecto del modelo que se supone que corresponde a algún aspecto real del fenómeno que se modeliza, Cook siguiendo a Shapiro, lo denomina representador, y aquellos que no se supone que se correspondan con algo, los denomina artefactos. En el ejemplo se puede notar que no sólo los objetos del modelo son representadores o artefactos, sino que además pueden serlo las propiedades de los objetos y las relaciones entre ellos. Las objeciones como las de Sainsbury y Tye según Cook se evitan distinguiendo cuidadosamente entre representadores y artefactos (cf. Cook 2002: 243). La idea es considerar las partes problemáticas de la presentación gradualista, o sea la asignación de números reales
131
particulares a las oraciones, como meros artefactos. Solamente los representadores se supone que reflejan algo que ocurre en el lenguaje natural vago. Como hace notar Cook, en Williamson se señala que "el teórico gradualista puede y debería considerar la asignación de grados de verdad numéricos a las sentencias del lenguaje natural como una cuestión vaga" (Cook 2002: 237, cf. Williamson 1994: 131). Por esto, continua, no puede considerarse la asignación de grados de verdad directamente como un desconocimiento de la vaguedad de orden superior. Con todo, dado que la intención de Williamson es argumentar contra las teorías numéricas, no se sigue allí la línea de este argumento.
7. CONSIDERACIONES FINALES Para concluir, hay que observar que parece más difícil encontrar la forma de justificar el modo en que las teorías gradualistas pueden escapar a un argumento colateral respecto al carácter multidimensional de los predicados vagos. En la línea del análisis que seguimos aquí, esto tiene que ver con que lo medido no son los elementos de un conjunto S, sino alguna característica de estos elementos. Por ejemplo, si S consta de cubos, se puede medir las superficies, los volúmenes o el peso. El problema entonces con los predicados vagos sigue siendo que se pueda aislar una propiedad P cuyo uso en X se está considerando. Pero el carácter multidimensional impediría separar una propiedad única para el predicado, dada la contribución que diversas dimensiones, definidas también en forma vaga, hacen a su evaluación y que parecen ser parte de la vaguedad del término. Keefe señala que debería haber una cuestión efectiva respecto a que, por ejemplo, una persona sea agradable en un grado mayor que otra (cf. Keefe 1998: 570). Pero esto es muy difícil, porque, como se dijo, la misma vaguedad del término implica una multiplicidad de dimensiones que confluyen en su aplicación y no pueden separarse con precisión. La respuesta sin embargo, es observar que la objeción se apoya en el punto en que no hay manera de superar la discontinuidad entre el modelo y la realidad modelizada. El punto de contacto entre am
132
bos. La vaguedad, debemos reconocer, permanece en el lenguaje natural y en ningún momento podrá ser parte del modelo lógicomatemático. La vaguedad se da en la descripción de la conexión entre la formalización y el discurso informal, como hemos argumentado antes con las justificaciones brindadas en 3-5. La introducción de la medida debería ubicarse entonces en este punto y es aquí donde tiene sentido ver a las medidas difusas como proporcionando algún tipo de información que guíe la adecuación del modelo. Podría decirse que esta solución adscribe a una especie de ficcionalismo parcial o semi-ficcionalismo, por llamarlo de algún modo. En general, el ficcionalismo matemático, como es sabido, sostiene que las aseveraciones en la matemáticas no deben «tomarse en serio», por así decir, sino que se presentan con el espíritu de «hacer creer» y, a la vez, la proposición comunicada es verdadera sólo en caso de que se satisfagan las condiciones de adecuación de esta ficción. Las condiciones de adecuación no requieren por supuesto que el mundo contenga objetos matemáticos. Se pueden distinguir una variedad de formas del ficcionalismo matemático, aunque todas establecen en última instancia esta diferencia sobre el contenido literal y de ficción de las afirmaciones (cf. Yablo 2001). Un eco de esta distinción puede percibirse en la separación entre elementos representadores y artefactos en el modelo matemático. La falta de vinculo con la realidad y su inclusión en el modelo a fin de facilitar la tarea o simplificarla, que motiva la presencia de estos elementos, recuerda bastante al ficcionalismo instrumentalista. En este caso la razón para actuar «como si» afirmásemos o creyéramos algo, es que sirve a algún propósito más amplio. Al hacerlo, se simplifica la teoría o se acortan las demostraciones. No obstante, vimos que a otros aspectos del modelo sí se les asigna una connotación real. En este sentido, si bien esta salida se acerca a una posición ficcionalista, no quedaría totalmente comprometida con ella.
133
REFERENCIAS Cook, Roy (2002): "Vagueness and mathematical precision", Mind, vol. 111, pp. 225-248. Forbes, Graeme (1983): "Thisness and vagueness", Synthese, 54, pp. 235-259. Keefe, Rosanna (1998): "Vagueness by numbers", Mind, vol. 107, 427, pp. 565-580. Sainsbury, R. M. (1997): "Concepts without boundaries", en Kefee, R. y Smith, P. (eds.): Vagueness: A Reader. Cambridge, Mass.: MIT Press, pp. 251-264. Smith, Nicholas (2003): "Vagueness by numbers? No worries", Mind, vol. 112, pp. 283-290. Termini, Settimo (2002): "On some vagaries of vagueness and information", Annals of Mathematics and Artificial Intelligence, vol. 35, 1-4, pp. 343-355. Trillas, Enric y Alsina, Claudi (1999): "A reflextion on what is a membership function", Mathware and Soft Computing, vol. 6, 2-3, pp. 201-215. Tye, Michael (1994): "Vagueness: wellcome to quicksand", Souther Journal of Philosophy, 33 (Supp.), pp. 2-22. Williamson, Tim (1994): Vagueness. London: Roudledge. Yablo, Stephen (2001): "Go Figure: A path through fictionalism", Midwest Studies in Philosophy, vol. XXV, pp. 72-102.
Luis Adrian Urtubey Universidad Nacional de C贸rdoba - Argentina urtubey@ffyh.unc.edu.ar
LA NATURALEZA DE UNA ECUACIÓN BÁSICA
José Tomás Alvarado Marambio
137
LA NATURALEZA DE UNA ECUACIÓN BÁSICA
José Tomás Alvarado Marambio Resumen Una «ecuación básica» es un bicondicional cuantificado en el que se establece que los estados de cosas de un cierto dominio se dan si y sólo si —dadas ciertas condiciones necesarias y suficientes para la operación óptima de las capacidades epistémicas— un cierto sujeto juzga que el estado de cosas en cuestión se da. Las ecuaciones básicas generan el problema sobre el orden de determinación entre los lados izquierdo y derecho del bicondicional. Crispin Wright ha propuesto algunos rasgos generales mediante los que el problema del orden de determinación de una ecuación básica puede ser adjudicado. Aquí se discute uno de estos requerimientos sobre el carácter a priori de las ecuaciones básicas «proyectivistas». Abstract A «basic equation» is a quantified biconditional where it is stated that the states of affairs of a certain domain obtain if and only if —given certain conditions necessary and sufficient for the optimal operation of the epistemic capabilities— a certain subject judges that the state of affairs in question obtains. Basic equations raise the issue of the order of determination between the left and the right-
138
hand sides of the biconditional. Crispin Wright has proposed some general traits by which the problem of the order of determination of a basic equation can be adjudicated. Here it is discussed one of these requirements about the a priori character of the «projectivist» basic equations.
I Existen muchos dominios de entidades en los que los hechos de que se trata se encuentran vinculados o parecen estar vinculados a ciertas respuestas cognitivas por parte de sujetos cognoscentes. Para estos dominios de hechos o estados de cosas pareciera ser válida una ecuación o bicondicional de esta forma: (1)
∀p (p ↔ ∃S (C → (S juzga que p)))
En la fórmula (1) el estado de cosas p (se entiende que el cuantificador está rigiendo sobre las proposiciones que enuncian los estados de cosas del dominio en cuestión) obtiene si y sólo si, dadas ciertas condiciones C el sujeto S juzga que p es el caso. Este tipo de bicondicionales han sido denominados «ecuaciones básicas» por Crispin Wright1. La cuestión que surge sobre una ecuación básica como (1) es el orden de dependencia que debe ser postulado entre los lados derecho e izquierdo del bicondicional. En el célebre diálogo platónico Eutifrón, Sócrates y Eutifrón están de acuerdo en que existe una ecuación básica semejante en su forma a (1) bajo la que caen todos los hechos «piadosos», de este tenor: (2) dioses))2
∀x ((x es piadoso) ↔ (x es amado por los
El debate, sin embargo, tiene que ver con cuál de los lados de la
1. Cf. Wright 1992: 108-139; Wright 1993: 63-84 (especialmente 77-82); Wright estaba desarrollando sugerencias de M. Johnston (1993). 2. En la ecuación (2) se han omitido las condiciones C pues se supone que no habría o que no podría haber circunstancias en las que pudiese ser impedido el «buen juicio» de los dioses sobre cuál debe ser el objeto de su amor. Nótese que se cuantifica en (2) sobre acciones, objetos o estados de cosas, tomados de una manera completamente neutral desde el punto de vista ontológico. Son estas acciones, objetos u estados de cosas los que serán calificados de «piadosos». Los hechos del do-
139
ecuación (2) debería considerarse como «prioritario» respecto al otro, esto es, si es que los actos son piadosos porque son amados de los dioses o más bien son amados de los dioses porque son piadosos3. Problemas de una estructura semejante se presentan en muchas otras áreas. Por ejemplo, muchos filósofos han sostenido que los colores son propiedades «secundarias» que provienen de cierta proyección subjetiva de algún sujeto cognoscente dotado de órganos sensibles. No es que las cosas se encuentren real y objetivamente «coloreadas», para la concepción de estos filósofos. Es nuestra sensación la que nos las presenta «coloreadas» ante nuestra percepción. Pareciera, entonces, que hay colores, esto es, hay hechos sobre el estar de los objetos físicos dotados de coloración siempre en conexión con sujetos dotados de órganos sensoriales adecuados en buen funcionamiento y en circunstancias epistémicas apropiadas para que sus juicios sobre la coloración sean «óptimos». También sucede algo semejante, o parece suceder algo semejante, con las valoraciones éticas. Muchos han pensado que estas valoraciones sólo pueden aparecer ante sujetos de ciertas capacidades de reacción emotiva, dotados de cierto carácter moral, ciertos hábitos constituidos para querer y rechazar ciertas cosas. Los hechos morales se dan sólo en conexión con las respuestas judicativas que pudieran prestarles tales sujetos. Cosas muy parecidas también podrían ser indicadas respecto de las valoraciones estéticas o si se quiere, para el carácter «gracioso» de un relato o de una situación. En todos estos casos parecen existir ecuaciones básicas que conectan los hechos en cuestión con respuestas judicativas adecuadas que ciertos sujetos darían en minio en cuestión están constituidos por las valoraciones —positivas o negativas— sobre la «piedad» de las entidades sobre las que se ha cuantificado. Nótese también que los hechos del dominio en cuestión no sólo deben considerarse como constituidos por las acciones, objetos y estados de cosas «piadosos» sino también por las acciones, objetos y estados de cosas «impíos» (o no-píos, si se quiere). Así, se sigue de (2) otra ecuación básica de este tenor para los hechos impíos: ∀x ((x no es piadoso) ↔ (x no es amado por los dioses)) Es razonable también pensar que se sigue: ∀x ((x es impío) ↔ (x es aborrecido por los dioses)). 3. Cf. Platón, Eutifrón, 10d – 11b.
140
circunstancias contrafácticas. Esto no significa, sin embargo, que de entrada no pueda atribuirse ningún tipo de objetividad a tales dominios de estados de cosas, por ejemplo a los hechos morales, a los hechos estéticos, a los hechos sobre la coloración de los objetos físicos. La cuestión que resta por considerar es cuál es el orden de dependencia en las ecuaciones básicas respectivas para cada uno de esos dominios. El punto, por ejemplo, en relación con los hechos morales es si las acciones laudables o reprobables existen porque hay sujetos dotados de cierto carácter moral o si es que existen respuestas judicativas de alabanza o reproche de ciertos sujetos d otados de un carácter moral porque las acciones poseen ciertas determinaciones intrínsecas. Es en este tipo de campos de estados de cosas en los que existen motivos para pensar que nuestra subjetividad, nuestras reacciones emotivas o nuestros «gustos» se encuentran inextricablemente imbricados con la constitución ontológica de ese dominio, en el que el llamado «contraste del Eutifrón» parece resultar de especial importancia precisamente para determinar el tipo de objetividad que cabe atribuir a ese dominio. Antes de pasar a la consideración de los modos en que podría ser resuelto el problema del orden de determinación para una ecuación básica, será conveniente señalar un par de casos más de aplicación del contraste del Eutifrón para dominios no considerados con frecuencia por la literatura con anterioridad. Un caso de especial importancia está constituido por el debate entre realistas y anti-realistas. Frecuentemente la discusión se ha concentrado en la validez del principio de cognoscibilidad según el cual todo estado de cosas es cognoscible: (3)
∀p (p → ◊Kp)
Se suele representar la posición realista como sosteniendo que habrían estados de cosas incognoscibles (esto es, negando la proposición (3)) y al anti-realista como simplemente defendiendo este principio4. La cuestión es que aún cuando este principio fuese 4. Véase al respecto Tennant 1997. Todo el debate realismo / anti-realismo se presenta como un debate sobre el principio de cognoscibilidad.
141
—algo respecto de lo que hay fuertes motivos de duda5— seguiría en pie la cuestión de saber cuál sería el orden de determinación entre los términos de la ecuación que resultaría. Esto es, aún si todo lo que existe es cognoscible resta la cuestión de determinar si todo lo que existe, existe porque se encuentra conectado con el estado epistémico de algún cognoscente o bien lo que es cognoscible, es cognoscible porque el estado de cosas objeto del estado mental de conocimiento existe de manera objetiva e independiente. Las usuales diferencias que separan a realistas y anti-realistas se repetirían ahora en el orden de determinación de una ecuación básica. Otra área en la que también hay preguntas sobre el orden de determinación de ecuaciones básicas (o de una ecuación básica, si se quiere) es la concepción constructivista de las matemáticas. De manera característica un constructivista o intuicionista va a sostener que toda entidad matemática debe ser el objeto de un acto de «construcción», comoquiera que vaya a ser comprendida la naturaleza de tal construcción. Valdría, por lo tanto, una ecuación básica de este estilo: (4)
∀p (p ↔ ∃S (C → (S construye una prueba de p))
5. El principal motivo de duda es la existencia de cierta forma de reducción de la tesis (3) a una tesis mucho más fuerte según la cual todo estado de cosas está siendo conocido actualmente. Este razonamiento ha sido denominado por algunos como la «paradoja de la cognoscibilidad». Considérese, en efecto, que si vale que ∀p (p → ◊Kp), entonces el principio sentado vale para el caso particular en el que el estado de cosas que resulta cognoscible es p & ¬Kp. Resulta entonces que (p & ¬Kp) → ◊K(p & ¬Kp) , pero parece obvio que no es «cognoscible» un estado de cosas p y al mismo tiempo que no se conoce que p. En el mundo posible para el que se haría verdadera la apódosis deberían ser verdaderos Kp y K¬Kp, lo que parece incoherente. Como (p & ¬Kp) → ◊K(p & ¬Kp) es equivalente a (p & ¬Kp) V ◊K(p &¬Kp) y el segundo término de esta disyunción es sabidamente falso por incoherente, el valor de verdad de toda la disyunción es equivalente al valor de verdad de su primer término ¬(p & ¬Kp) que, en lógica clásica, es exactamente equivalente a (p → Kp) (cf. Williamson 2000: 270-301).
142
En la proposición (4) ‘p’ está por proposiciones matemáticas que enuncian propiedades de entidades matemáticas. ‘S’ está por sujetos racionales. Aquí, si se quiere, se pueden idealizar las condiciones en que se efectúa la construcción de la prueba de p. Las condiciones C estarían haciendo ese trabajo. Esto no tiene relevancia para lo que aquí se discute. El punto es que aún si el intuicionista tuviese razón al sostener que una ecuación básica de la forma indicada en (4) es válida para los enunciados matemáticos restaría por dilucidar el problema de cuál es el orden de determinación entre los lados derecho e izquierdo de tal bicondicional. Podría suceder que los enunciados matemáticos (y las entidades matemáticas de que hablan esos enunciados matemáticos) fuesen verdaderos porque han sido objeto de un acto de construcción o bien podría suceder que esos enunciados matemáticos fuesen objeto de un acto de construcción, actual o posible, porque son verdaderos. En todos los casos se presentan dos concepciones alternativas. De acuerdo a la concepción llamada «detectivista» —que también será denominada aquí «objetivista»— son las respuestas judicativas del lado derecho del bicondicional las que deben tomarse como dependientes del lado izquierdo. Por otro lado, de acuerdo a la concepción llamada «eutifronista» —que también será denominada aquí «proyectivista»— los estados de cosas del lado izquierdo del bicondicional son dependientes de las respuestas judicativas que aparecen en el lado derecho.
II ¿Qué caracteres generales podrían ser descritos para decidir la cuestión del orden de determinación de una ecuación básica? Esta pregunta general no obsta, por supuesto, a la consideración detallada de los criterios que puedan ser pertinentes para resolver la cuestión en el caso de una ecuación básica particular. Esta discusión particularizada debe resultar de todos modos indispensable. El problema que aquí se plantea es, sin embargo, de tipo perfectamente general. Existen dos indicaciones de Crispin Wright que van a ser objeto de discusión. Wright sostiene que es una condición necesaria para que una ecuación básica sea interpretada
143
de manera proyectivista que: (i) esa ecuación sea necesaria, y (ii) que esa ecuación sea verdadera a priori y como resultado de un análisis conceptual6. Por los mismos motivos, son condiciones suficientes para que una ecuación básica sea interpretada de manera objetivista que: (i) ésta sea contingente, o (ii) que no sea verdadera a priori como resultado de un mero análisis conceptual. Señala Wright: "La verdad, si es que es verdad, de que las extensiones de los conceptos de color se encuentran determinadas por la respuesta humana idealizada —la opinión óptima— debe ser accesible por reflexión analítica pura sobre esos conceptos y, luego, debe encontrarse disponible como conocimiento a priori. Impuse, por lo tanto, una condición de aprioridad. En general, va a ser suficiente para clasificar una clase de juicios en el lado detectivista del contraste del Eutifrón si, cuando sostienen ecuaciones básicas […] ninguna de esas ecuaciones básicas puede ser conocida como verdadera a priori. De manera semejante, se puede sugerir que va a ser una condición necesaria para la corrección del punto de vista eutifrónico que las ecuaciones básicas apropiadas, especificadas de manera sustancial, puedan ser conocidas como verdaderas a priori." (Wright 1992: 116-117).
Wright presenta aquí estas indicaciones en relación con los conceptos de color, pero sus observaciones tienen la pretensión de ser de valor general. Supóngase que una ecuación básica fuese contingente, esto es, que fuese el caso que ciertos hechos de un dominio determinado estuviesen conectados por un bicondicional con cierta clase de respuestas judicativas, pero que esta conexión sea sólo con 6. Éstas no son, por supuesto, las únicas cuestiones que deben ser consideradas en relación con la naturaleza de una ecuación básica. Ni siquiera son éstas todas las cuestiones de interés que ha desarrollado Crispin Wright en su discusión. Algunos otros aspectos que requieren una consideración detenida tienen que ver con la necesidad de que las condiciones estipuladas para el carácter óptimo de la respuesta judicativa que se menciona en el lado derecho no sean triviales (cf. Wright 1992: 112 y 120-124) o con el modo de evitar una «falacia condicional» (cf. Wright 1992: 117-120). Estas cuestiones no serán discutidas aquí.
144
tingente. Considérese, por ejemplo, el caso de los hechos sobre la coloración de los objetos físicos. Sea la siguiente ecuación básica: (5) ∀x ((x posee color) ↔ ∃S (C → S juzga que x posee color)) Se supone que las condiciones C determinan —de una manera no-trivial— cuando va a haber un juicio «óptimo» sobre el color de x por parte del sujeto S. Si es que la ecuación básica fuese solamente contingente, entonces hay mundos posibles en los que es falsa, pues, parte de aquello en que consiste decir que la proposición (5) es contingente es que: (6) ◊¬∀x ((x posee color) ↔ ∃S (C → S juzga que x posee color)) Sea este mundo posible w1, entonces en w1 vale que: (7) ∃x ((x posee color) & ¬∃S (C → S juzga que x posee color))7 Esto es, en w1 la coloración de un objeto no se encuentra conectada con las respuestas judicativas de un sujeto S en las condiciones epistémicas óptimas. No es posible sostener, entonces, que los hechos en cuestión se encuentran «constituidos» por una contribución cognitiva de parte de nuestra subjetividad8. El hecho de estar algo coloreado no es, de manera intrínseca, algo proyectado por nuestras capacidades perceptivas si es que pueden darse hechos sobre el estar cosas coloreadas aunque no exista ningún tipo de respuesta judicativa. Una ecuación básica que haya de ser interpretada de manera proyectivista debe ser necesaria. De otro modo, no se puede sino suponer que las capacidades cognitivas de los sujetos 7. Desrrollando un poco más la hipótesis, sucede en w que: ∃x ((x posee color) & ∀S (C & ¬S juzga que x posee un color)) 8. La necesidad de la identidad vale respecto de objetos, pero también respecto de universales o propiedades. Si la propiedad de poseer un color posee como componente ontológico una contribución de nuestras respuestas judicativas en algún mundo posible, entonces ha de poseer esa misma contribución en todos los mundos posibles. Aquí, como se ha postulado que la conexión con cierta clase de respuestas judicativas es contingente, entonces no puede sostenerse que los hechos sobre colores sean una forma de «proyección» nuestra.
145
cognoscentes son —por razones contingentes— suficientes para «detectar» correctamente los hechos constituidos de manera objetiva. Hay aquí variados problemas sobre cómo debe ser formulada una ecuación básica necesaria, si es que la ecuación ha de mantener su referencia a las condiciones epistémicas ideales para el juicio óptimo en el mundo actual. Esto no es una cuestión en la que se pueda entrar aquí. Las ecuaciones básicas proyectivistas deben poder decir que para todos los mundos posibles vale que se dará un hecho p (del dominio en cuestión, sea D) si y sólo si, si se diesen las condiciones epistémicas ideales ‘C’ determinadas de acuerdo a lo que son condiciones ideales en el mundo actual, entonces un sujeto dotado de las mismas facultades cognitivas que un sujeto en el mundo actual juzgaría que p es el caso. El punto es que las condiciones establecidas por una ecuación básica deben poder valer para todos los mundos posibles. Wright ve que este carácter necesario se deriva del hecho de que la validez de la ecuación básica debería poder ser justificada como una forma de conocimiento a priori derivada del análisis conceptual «puro» de las nociones implicadas para la formulación de los hechos del dominio en cuestión. Dos observaciones serán convenientes antes de entrar a la discusión de este requerimiento. En primer lugar, es obvio que la justificación a priori no ha de convertir a la ecuación básica de que se trate en un juicio contingente a priori9. Buena parte de la motivación para exigir el carácter a priori de una ecuación básica es asegurar su necesidad. En segundo lugar, el carácter a priori del juicio ha de provenir del hecho de que se trata de 9. Un juicio contingente a priori es el que surge, por ejemplo, si es que se «rotula» con un nombre propio a quien quiera que satisfaga cierta descripción. Si se define a «Perico Los Palotes» como aquel que inventó la rueda, entonces el juicio «Perico Los Palotes inventó la rueda» será a priori, aunque no necesario pues quien quiera que haya inventado la rueda en el mundo actual (y que ha sido bautizado como «Perico Los Palotes») podría no haber inventado la rueda (cf. Kripke 1980: 54-60). Otro tipo de juicio contingente a priori podría ser «yo existo». Quien profiere esta proposición ha de existir para proferirla, pero no es necesario que el proferente exista.
146
una justificación proveniente de mero análisis conceptual. Algunos han sostenido, por ejemplo, que todo enunciado necesario ha de poseer algún tipo de componente a priori en su justificación, aunque esta justificación esté inficionada de fuentes a posteriori. Estos componentes a priori no es necesario que sean provenientes de análisis conceptuales10. La motivación que se encuentra detrás del requerimiento de aprioridad, o que parece encontrarse detrás del requerimiento, es que si los hechos a los que hace referencia la ecuación básica proyectivista de verdad son dependientes de nuestra contribución cognitiva o mental, entonces el que sean dependientes de nosotros ha de poder ser algo transparente a nuestra propia reflexión sobre el contenido de los conceptos que empleamos. La validez de una ecuación básica proyectivista debería poder seguirse de las definiciones de las nociones empleadas, tal como puede parecernos evidente tras una breve consideración que un «oculista» es un «médico de los ojos». La idea es que las misma nociones de, por ejemplo, «color», «bondad moral» o «belleza» tendrían inscritos en sí mismos la remisión a nuestros juicios que constituyen los hechos sobre coloración, los hechos morales y los hechos estéticos. El contenido de estos juicios es algo que debería estar siempre accesible a nosotros mediante la reflexión sobre esos contenidos.
III Se quisiera aquí presentar un par de dificultades sistemáticas para la propuesta de Wright sobre las ecuaciones básicas proyectivistas. No tienen que tomarse estas dificultades como refutaciones definiti 10. Véase al respecto Hale 1997: 487-514, especialmente 504-509. Por ejemplo, se va a sostener que el agua está necesariamente compuesta de H2O, porque de hecho está compuesta de moléculas de H2O. El conocimiento de que el agua está compuesta de moléculas de H2O es a posteriori, por supuesto, pero la conclusión modal no se sigue sino asumiendo una premisa adicional de este tenor: si un tipo de sustancia posee una composición química X, entonces esa sustancia posee esa composición química X de manera necesaria. Esta última premisa tendría justificación a priori.
147
vas de la conexión planteada entre ecuaciones proyectivistas y análisis conceptual a priori, sino como cuestiones sistemáticas que todo defensor de una concepción proyectivista en alguna de esas áreas debería considerar. Los problemas que se van a plantear tienen que ver con: (a) la propuesta de Wright no parece estar en concordancia con las concepciones ya ortodoxas sobre la semántica de términos de clases naturales o si se quiere, no parece funcionar bien con tales concepciones, y (b) esta propuesta parece generar o motivar una argumentación a priori inmediata para el carácter no proyectivista de las ecuaciones básicas en áreas como la ética, la estética o los colores. Este argumento parece demasiado fuerte y más que tomarse como una razón para concepciones objetivistas en esos dominios, debe tomarse como un llamado de cautela sobre la concepción de Wright que hace posible tal razonamiento. A. Un análisis conceptual ha de ser capaz de señalar qué nociones son necesarias y suficientes para determinar que algo cae bajo tal analysandum. Esta determinación ha de ser a priori y ha de resultar de tal justificación un juicio necesario del tipo: (8) [] ∀x (Fx ↔ (H1x & H2x & …& Hnx)) Aquí F es el analysandum y la batería de conceptos H1, H2, …, Hn son el analysans. Se supone que un juicio analítico es aquel que es verdadero sólo en virtud del significado de los términos que intervienen en ese juicio. Es el significado del término F el que impone por sí mismo la batería de predicados H1, H2, …, Hn como indicación de su contenido. Pues bien, el modelo ortodoxo Kripke-Putnam sobre el significado de términos de clases naturales postula que el significado de tales términos «no está en la cabeza» (cf. Kripke 1980: 115-144 y Putnam 1975: 215-271). ¿Qué otra cosa puede ser el «contenido» de un concepto sino su «significado»? El contenido entonces parece «no estar en la cabeza» y, por lo tanto, un «análisis» que tuviese la forma de (8) conducido por mera reflexión a priori no sería realmente una dilucidación del contenido de un concepto. No es necesario entrar aquí a repetir las conocidas argumentaciones para sostener esta conclusión. Un concepto como gato tiene como significado la naturaleza real de las entidades a las que —de hecho— hacemos
148
referencia mediante tal término y no el tipo de nociones que subjetivamente puedan haberle sido atribuidas a los gatos de acuerdo a nuestras creencias. Así, por ejemplo, nosotros creemos que los gatos son animales mamíferos tal como lo puede ser un perro o una vaca. Los egipcios creían que los gatos eran seres dotados de cierto carácter sobrenatural, eran una clase de entidad «divina». Existe una enorme diferencia entre las creencias que poseemos nosotros sobre los gatos y las creencias que poseían los egipcios, sin embargo esto no se toma como un motivo para dejar de pensar que los egipcios hablaban de «gatos» tal como nosotros hablamos de «gatos». Supóngase que el significado de lo que nosotros hemos traducido como «gato» en los escritos que han sobrevivido de los egipcios estuviese constituido no por la remisión indexical a un tipo de entidad, sino al conjunto de notas que los egipcios le atribuían a los gatos como esenciales. En este caso, no tendríamos derecho a traducir sus expresiones para «gato» como hablando de gatos, pues ellos habrían estado hablando de una entidad de carácter divino, con apariencia de lo que nosotros llamamos gato, pero no habrían estado hablando de gatos que son mamíferos y sin ningún carácter divino. Los egipcios —por lo que sabemos— estaban equivocados en pensar que tales entidades existían. Las expresiones que hemos traducido por «gato» en realidad no tendrían referente en egipcio. Sucede, sin embargo, que consideramos perfectamente aceptable traducir las expresiones egipcias como hablando de la misma clase de entidad a la que nosotros hacemos referencia mediante el término «gato». De la misma manera, supongamos que nuestras creencias presentes sobre los gatos fuesen altamente equivocadas en respectos fundamentales. Supongamos que el rasgo más determinante y explicativo de la pertenencia de un individuo a una especie fuese la existencia de un patrón muy preciso en un campo magnético generado en torno al cerebelo de un mamífero. Supongamos que llegamos a enterarnos de esto en el siglo XXV. ¿Es que iríamos a pensar entonces que los «gatos» realmente no existen, pues los gatos son animales cuyo rasgo definitorio — para un hablante del siglo XXI— es la posesión de cierto cuerpo de información genético y se habría llegado (en el siglo XXV) a la conclusión que ése no es el rasgo determinante de una especie de mamíferos?
149
Lo que en realidad pensaríamos en una situación así es que los gatos poseen una naturaleza diferente de la que le atribuíamos y no que los gatos no existen. El significado de un término como «gato», entonces, está constituido por aquello en que consiste esencialmente ser un gato, aunque esta esencia o naturaleza de un gato sea desconocida o mal conocida por los hablantes que hacen referencia a los gatos. Pues bien, la cuestión que surge aquí en relación con una ecuación básica es, ¿no sucede algo parecido con la semántica de términos como «color», «bondad moral» o «belleza»? Si sucede algo semejante, no existe ningún motivo para pensar que la validez de las ecuaciones básicas que rigen sobre los hechos sobre colores, evaluaciones morales o evaluaciones estéticas pueda aparecer por mera reflexión a priori sobre el contenido de esos conceptos. Pues el contenido de tales conceptos —su «significado»— viene dado por las naturalezas reales de los colores, la bondad moral o la belleza con independencia de lo que sea creído sobre tal naturaleza por los hablantes. La reflexión a priori o análisis conceptual que efectúen los hablantes a lo más permitirá precisar el contenido de sus creencias sobre cuál es esa esencia o naturaleza (si es que los hablantes poseen alguna), pero no es razonable pensar que va a permitir determinar por algún mecanismo mágico las esencias reales del color, la bondad o la belleza. Ahora bien, se podría argumentar que la semántica de los conceptos cuya extensión queda fijada por una ecuación básica proyectivista precisamente no es el tipo de semántica de un término de clase natural. Así, por ejemplo, se piensa que la esencia o naturaleza del agua es estar compuesta de moléculas de H2O y que esta composición química es causalmente explicativa de todas las propiedades del agua que nosotros utilizamos ordinariamente como criterio para decidir si algo es o no agua. Existen, por lo tanto, ciertas propiedades o atributos del concepto «agua» que yacen inmediatamente en la superficie, propiedades inmediatamente reconocibles para la percepción sensible ordinaria (e.gr. su carácter incoloro, inodoro e insípido). Nosotros podemos estar equivocados en nuestras creencias sobre cual es la naturaleza que explica los rasgos o «criterios» inmediatamente perceptibles mediante los que ordinariamente reco
150
nocemos el agua, pero pareciera que no podemos estar equivocados en nuestras creencias sobre cuáles son los «criterios» mediante los que reconocemos ordinariamente el agua con nuestra percepción sensible. Esto es, la esencia o naturaleza del agua es aquello que se postula para explicar porqué el agua presenta la apariencia de ser incolora, inodora e insípida y, además, porqué el agua cumple las funciones que cumple en los metabolismos de los seres vivos. Desde un principio, sin embargo, la tarea explicativa es dar cuenta de porqué esta sustancia es incolora, inodora e insípida y cumple ciertas funciones en el metabolismo. No parece que exista espacio para decir que el agua es otra cosa que esta sustancia que es reconocida de tal o cual manera, es decir, que no parece existir espacio para sostener que el agua no es realmente incolora, inodora e insípida11. La maniobra, por lo tanto, consistiría en sostener que la semántica de los términos regidos por una ecuación básica proyectivista no debe ser como la de un término de clase natural como «agua» sino como la de los términos que denotan propiedades inmediatamente 11. Wright sugiere que existe una conexión a priori entre estos rasgos o criterios mediante los que se reconoce una clase natural y la clase natural. La clase natural es —a priori— aquello que posee una naturaleza tal que explica estas «apariencias» o criterios (cf. Wright 1992: 129131). Creo que esta idea puede ser resistida mediante una argumentación análoga a aquella desplegada por Kripke contra la idea de un racimo de descripciones como «fijando la referencia» de un nombre propio (cf. Kripke 1980: 64-93), aunque no es posible entrar aquí en tal línea de argumentación. La posición defendida por Wright aquí está en conexión con la teoría defendida por varios filósofos de que incluso en el caso de términos que denotan clases naturales como «agua» es posible distinguir un componente que un sujeto racional puede conocer mediante simple inspección del contenido de sus propios estados intencionales. Este elemento ha sido denominado «intensión primaria» por D. Chalmers (cf. Chalmers 1996: 83-128) y como «extensión-A» por F. Jackson (cf. Jackson 1998: 47-48). No es posible aquí entrar a considerar las delicadas cuestiones a que da lugar esta concepción. Una extensa exposición y evaluación crítica puede consultarse en el volumen Szabó Gendler y Hawthorne (eds.) 2002, en particular los trabajos ahí incluidos de George Bealer, David Chalmers, Stephen Yablo y el mismo Crispin Wright.
151
observables como «incoloro», «inodoro» o «insípido» y que sirven de criterio para reconocer una instancia de cierta clase natural. La situación sería análoga a aquella descrita por Kripke para los conceptos de estados mentales (cf. Kripke 1980: 144-155). No hay en ellos una distancia que deba ser cubierta entre la apariencia ante la percepción (o el juicio, fundado o no en la percepción) y cierta realidad responsable por tal apariencia, pues el concepto denota precisamente la apariencia. No es posible que un dolor, por ejemplo, pueda ser sentido sin que exista realmente dolor, pues un dolor es esencialmente una apariencia subjetiva de dolor. En cambio, es posible que una sensación de calor sea errada porque el calor es esencialmente energía cinética molecular promedio y ciertos seres podrían tener la sensación que para nosotros resulta subjetivamente como de frío cuando hay una alta energía cinética molecular promedio. Si es que hay ecuaciones básicas proyectivistas rigiendo las nociones de color, bondad o belleza, entonces, el color, la bondad y la belleza serían sencillamente lo que aparece ante el juicio como tal y nada más. El sujeto que juzga en primera persona es la única autoridad para decidir si hay o no un hecho de color, un hecho moral o un hecho estético, de la misma manera como sólo es el sujeto en primera persona el que puede ser autoridad de si posee o no un dolor. B. Ahora bien, todo esta línea de consideraciones suscita múltiples preguntas. Sea que, en efecto, los conceptos de —por ejemplo— color, bondad y belleza son simples «apariencias» tales que los hechos sobre coloración, bondad y belleza son constituidos por el juicio de los sujetos racionales. Wright pretende que, por tal razón, esos hechos quedan regidos por sendas ecuaciones básicas proyectivistas y que la validez de tales ecuaciones se va a justificar simplemente por la reflexión a priori sobre el contenido de las nociones de color, bondad y belleza. Pero, ¿es esto razonable? ¿Se va a decidir la cuestión sobre el realismo moral o el realismo estético mediante mera reflexión a priori justificando una ecuación básica? Esto suena especialmente extraño cuando hay filósofos que están argumentando sobre la existencia de propiedades reales, independientes de nuestra contribución judicativa, constitutiva de tales dominios de hechos. ¿Es que se va a decretar que todos ellos están equivocados simplemente por una justificación a priori de una ecuación básica? Nuestros des
152
acuerdos sobre ética o estética no son del tipo que pueda ser resuelto mediante los procedimientos que permiten decidir que un oculista es un médico de los ojos. Al menos, no parece ser así. Un defensor de una concepción realista sobre ética o sobre estética, no se va a sentir inclinado a aceptar una ecuación básica proyectivista simplemente por el hecho de que tal ecuación despliega a priori el significado de los conceptos de bondad o belleza. El defensor del realismo ético va a esperar una explicación detenida de por qué los hechos en los que él ve afincarse la objetividad de los juicios morales en realidad no existen. ¿Esto también se va a mostrar mediante reflexión a priori? No parece que sea posible. Todos estos desacuerdos para los que tendría relevancia la cuestión sobre el orden de determinación de una ecuación básica requieren cierta dilucidación previa sobre, por ejemplo, qué tipo de propiedades físicas están detrás de la explicación de nuestras percepciones de color o, en el caso de la bondad moral, en qué es lo que consiste la naturaleza o esencia de un ser humano y qué tipo de plenitud se puede esperar de un ente de esta naturaleza, etc. No se quiere decir aquí que no existan componentes a priori en tal dilucidación, pero parece obvio que no se trata de cuestiones que puedan ser resueltas de manera satisfactoria sin ningún tipo de conocimientos a posteriori sobre cómo está constituido el mundo y sobre cómo estamos constituidos nosotros como seres humanos. Una muestra de lo dudoso que resulta la propuesta de Wright sobre cómo debe ser decidido el carácter proyectivista u objetivista de una ecuación básica es considerar cómo es que fácilmente su propuesta puede ponerse en servicio de un argumento muy simple para la conclusión de que las ecuaciones básicas asociadas con hechos morales, estéticos o sobre el color no pueden ser proyectivistas. Se trataría de un argumento a priori para, por ejemplo, el realismo moral que, naturalmente, va a aparecer demasiado pretencioso para un defensor del anti-realismo moral. La cuestión es que en la misma medida en que este argumento parezca poco convincente, resultará poco convincente el esquema de Wright. En efecto, si es que Wright está en lo cierto que las ecuaciones básicas —si fuesen proyectivistas— deberían poder ser justificadas por mero análisis concep
153
tual a priori, entonces para decidir si los conceptos de color, bondad moral o belleza son o no regidos por ecuaciones básicas proyectivistas se requiere que, previamente, se dilucide si es que existe una base de hechos y propiedades objetivos y ontológicamente independientes en los que se afinquen los juicios por los que atribuimos color, bondad o belleza a las cosas. Esta dilucidación no puede hacerse meramente a priori. Pero entonces las ecuaciones básicas de tales dominios no pueden ser justificadas a priori. Luego, tales ecuaciones básicas no son proyectivistas. Esta línea de argumentación puede tomarse como mostrando efectivamente que los colores, la bondad y la belleza son habitantes de pleno derecho de los estados de cosas del mundo o bien como mostrando que el requerimiento de Wright sobre cómo debe ser justificada una ecuación básica proyectivista es demasiado exigente. No creo, sin embargo, que ningún anti-realista sobre hechos morales, estéticos o sobre los hechos cromáticos vaya a ser persuadido por tal argumentación. Esto debe conducir, como es obvio, a la conclusión de que los requerimientos impuestos por Wright requieren reforma12.
REFERENCIAS Chalmers, David (1996): La mente consciente. En busca de una teoría fundamental. Barcelona: Gedisa. Hale, Bob (1997): "Modality", en Hale, B. & Wright, C. (eds.): A Companion to the Philosophy of Language. Oxford: Blackwell, pp. 487-514. Jackson, Frank (1998): From Metaphysics to Ethics. A Defence of Conceptual Análisis. Oxford: Clarendon Press.
12. Agradezco los comentarios y sugerencias recibidos por los asistentes a las Séptimas Jornadas Rolando Chuaqui K., Universidad de Valparaíso, mayo de 2005.
154
Johnston, Mark (1993): "Objectivity Refigured: Pragmatism Without Verificationism", en Haldane, J. & Wright, C. (eds.): Reality, Representation and Projection. Oxford: Oxford University Press, pp. 85-130. Kripke, Saul (1980): Naming and Necessity. Oxford: Blackwell. Putnam, Hilary (1975): "The Meaning of ‘Meaning’", en Mind, Language and Reality. Cambridge: Cambridge University Press, pp. 215-271. Szabó Gendler, T. & Hawthorne, J. (eds.) (2002): Conceivability and Possibility. Oxford: Clarendon Press. Tennant, Neil (1997): The Taming of the True. Oxford: Clarendon Press. Williamson, Timothy (2000): Knowledge and its Limits. Oxford: Oxford University Press. Wright, Crispin (1992): Truth and Objectivity. Cambridge, Mass.: Harvard University Press. Wright, Crispin (1993): "Realism: The Contemporary Debate — W(h)ither Now?", en Haldane, J. & Wright, C. (eds.): Reality, Representation and Projection. Oxford: Oxford University Press, pp. 63-84. José Tomás Alvarado Marambio Pontificia Universidad Católica de Valparaíso - Chile jose.alvarado.m@ucv.cl
OBJETOS POR OMISIร N
Hernรกn Miguel
157
OBJETOS POR OMISIÓN
Hernán Miguel1 Resumen Un tema inevitable en torno a la causación es el de las causas por omisión. Queremos poder decir que cierta omisión fue causa de ciertos efectos, pero algunas de sus características podrían llevarnos a rechazarlas como eventos, (cf. Lewis 1986). Aun cuando éste sea nuestro foco de atención, en este trabajo solamente nos concentraremos en la noción de agujero que es un tipo en particular de objeto por omisión. Analizamos cuáles podrían ser las condiciones físicas necesarias para que cierta región del espacio pueda identificarse como un agujero. Estas condiciones no conforman un criterio suficiente ya que encontraremos casos que lo cumplen y sin embargo, los hablantes deciden no aplicarles el término «agujero». Esto se debe presumiblemtne a razones pragmáticas cuyo análisis excede el marco de este trabajo. Se persigue entonces un criterio de necesidad tal que si algo no cumple, no puede ser llamado «agujero». 1. El presente trabajo se enmarca en el Proyecto "Causalidad, determinismo y libre albedrío" financiado por la Agencia Nacional de Promoción Científica y Tecnológica del que el autor es el Investigador Responsable. El autor agradece los acertados comentarios de los árbitros anónimos sobre una versión anterior.
158
Abstract Causation by omission is an unavoidable topic when we focus on causation. We would like to say that certain omission was a cause of certain effects, although some features of omissions could finally rule them out as events (cf. David Lewis 1986). Although causation by omission is the topic that we are mainly concerned with, in this paper we concentrate solely on holes, as a particular object by omission. We analyze the physical features certain space region have to have to be identified as a hole. These conditions do not build up a sufficient criteria since it easy to find cases that match the conditions and the speakers chose not to refer to them as a «hole». This is presumably debt to pragmatic reasons, which analysis falls beyond the scope of this paper. We pursue then, a necessary conditions criteria so that any region that doesn’t fit them, could not be named a «hole».
1. AGUJEROS Tomemos la noción de agujero y tratemos de encontrar las características por las cuales decidimos que el término «agujero» se aplica a algunos casos y a otros no. En esta tarea evitaremos resolver el asunto mediante un sinónimo, como por ejemplo que los agujeros son perforaciones en cierto material.2 Para que exista un agujero es necesario que exista otra entidad que es la que está agujereada. No hay posibilidad lógica de tener un universo que contenga como único elemento un agujero. Es decir que los agujeros no son entidades independientes sino que precisan de otras para su existencia. En una posición extrema podríamos sostener que el agujero no es una entidad sino una propiedad que tiene la entidad genuina que está agujereada. Pero sigamos con el intento de tipificar los agujeros como entidades. Un agujero se extiende en cierta región del espacio y ocurre durante un período. Podemos ubicar los agujeros tanto en el espacio
2. Este argumento es sostenido por uno de los personajes (Bargle) del diálogo que presentan Lewis y Lewis (cf. Lewis y Lewis 1970).
159
como en el tiempo, como en el siguiente caso: desde que le cayó una colilla encendida durante la fiesta de fin de milenio, la alfombra tiene un agujero cerca del borde. Es de esperar que el día en que la alfombra se destruya total o parcialmente el agujero cerca del borde dejará de existir. Vemos que el agujero tiene una existencia ligada de alguna manera a la alfombra (cf. Lewis y Lewis 1970)3. Por ejemplo, antes de la caída de la colilla encendida el agujero no existía y luego de que remendaron la alfombra, tampoco. Pero, el lapso en que existe el agujero tiene que estar incluido en el de existencia de la alfombra y su localización tiene que ser un subconjunto del espacio que ocupa la alfombra. Lo interesante de esta inclusión es que está planteada desde una descripción peculiar, ya que en la región espacial en que identificamos el agujero, en rigor de verdad, no hay alfombra. Esta descripción está sostenida por un recorte que hacemos de la zona que ocupa la alfombra en la que decidimos que la alfombra ocupa toda la región incluida dentro de su perímetro, y no que ocupa solamente la zona en que la tela de la alfombra está presente. Es decir que no estamos asignando a la alfombra la región del espacio que sus fibras ocupan, sino una región más amplia, del mismo modo en que se asig 3. Lewis y Lewis en el diálogo sostienen que algo es un agujero en virtud de la manera en que contrasta el material dentro de él con el que lo rodea ("A hole is a hole nos just by virtue of its own shape but also by virtue of the way it contrasts with the matter inside it and around it." Lewis y Lewis 1970: p. 210). Casati y Varzi retoman esta idea de que los agujeros necesitan un anfitrión material. Un agujero siempre es un agujero en algo. Un agujero requiere de un anfitrión y esos anfitriones son materiales. Los agujeros son entidades dependientes: existen en virtud del arreglo de la materia (cf. Casati y Varzi 1994). Estas consideraciones pueden llevar a sustentar una estrategia en la que se intente dar cuenta de los agujeros en términos de las características del material que los rodea. Estrategia de la que estos autores señalarán sus límites. Finalmente sugieren no perder de vista las dos estrategias, la de identificar los ajugeros con regiones del espacio, y la de relativa a las características de los anfitriones: "If we care spatial entities, then we must keep one eye on the doughnut and the other on the hole." (Casati y Varzi 1999, p. 20).
160
na a una multitud de manifestantes la ocupación de cierta zona de la ciudad. Cuando decimos que los manifestantes ocuparon la plaza, no queremos decir que entre un manifestante y otro no había intersticios o baldosas de la plaza sin que un manifestante estuviera parado en ella. Del mismo modo decimos que una alfombra de 2 m por 2 m cubre cuatro metros cuadrados, a pesar de que entre sus fibras podría haber intersticios no ocupados por el material de la alfombra, pero estos intersticios no son agujeros de la alfombra. Es interesante resaltar que esos intersticios entre las fibras de la alfombra no son entendidos habitualmente como agujeros. Si fuera así, podríamos reclamar al fabricante de alfombras por vendernos una alfombra colmada de agujeros... De hecho también podríamos quejarnos a nuestro proveedor de cualquier tipo de materiales como ladrillos, vidrios, e incluso las mismas fibras de la alfombra ya que todos ellos presentan espacios vacíos según nuestras mejores teorías sobre los constituyentes últimos de los objetos con masa. Pero justamente no son estos espacios vacíos rodeados de partículas que nos parecen agujeros. La noción de agujero está más asociada a esos lugares en donde se ‘esperaría’ una continuidad del material y no la hay. El agujero de la alfombra se identifica por que falta un poco de alfombra, y no porque las fibras, debido al tejido, naturalmente se ubican a cierta distancia. Sin embargo, a poco de avanzar en la dirección de que los agujeros son identificados a partir de la ausencia del material que se esperaba que estuviera allí, reconocemos que hay agujeros que no obedecen a esta tipificación. Por ejemplo, una alfombra en la que el diseño mismo involucra una serie de agujeros formando alguna figura. Aquí no dudamos que la alfombra tiene agujeros aun cuando no fueron ocasionados por la quemadura de una colilla sino por la manera en la que fue diseñada y construida. Así, los agujeros son la omisión de material en cierta región, ya sea por un accidente o por un acto deliberado para que así quede constituido. Por ahora hemos llegado a que un agujero parece ser la omisión de material en cierta región espaciotemporal. Pero de vuelta, no es suficiente con esta tipificación ya que es necesaria la entidad aguje-
161
reada. El agujero parece ser la ausencia de material en cierta región, pero tal región debe estar rodeada por ese material4. Pero ahora corremos el riesgo de que el espacio interno de un globo, una pelota, una copa, o una jarra, por ejemplo, sean entendidos como agujeros. Necesitamos agregar algo más. El espacio interno de una pelota inflada no debería identificarse como un agujero por más de que es una región del espacio que no está ocupada por el material de que está hecha la pelota y sí está rodeado de tal material. Necesitamos que el agujero sea una ausencia de material en un cuerpo que divida dos regiones, y que tal ausencia de material permita la conexión de esas dos regiones. De esta manera el espacio interior de la pelota no es un agujero ya que no «conecta» dos regiones del espacio. En cambio el orificio por donde se infla la pelota, sí. Digamos entonces que el agujero es una región en la que no hay cierto material del cual está rodeada, y que ese material que rodea la región divide el espacio en dos regiones, y el agujero conecta esas dos regiones. Por ejemplo, la alfombra divide dos regiones del espacio: encima de la alfombra, y debajo de la alfombra. Si en la alfombra hay o se produce un agujero, esas dos regiones estarán conectadas a través de ese agujero. Pero se podría argumentar en contra de esta característica de «conectar» regiones: las regiones encima de la alfombra y debajo de la alfombra ya estaban conectadas previamente a la aparición del agujero ya que los puntos de esas dos regiones podrían conectarse por fuera del borde de la alfombra. Entonces agreguemos algo que rescate los agujeros de esta crítica. Recordemos cómo enhebramos una aguja. Intentamos pasar el hilo por el ojo de la aguja y luego tiramos del hilo hacia un costado de la aguja para ver si quedó de alguna manera confinado a pasar por el agujero de la aguja. Si el hilo se desplaza hacia un costado no hemos tenido éxito en enhebrar la aguja ya que el hilo rodea o pasa por fuera del material de la aguja, pero si no logramos desplazarlo, entonces hemos cumplido la misión. 4. Como se ha señalado al principio de la nota anterior.
162
Pues bien, esto es que cuando está enhebrado, el hilo conecta las regiones a un lado y a otro de la aguja, y todo intento de desplazar el hilo se encuentra restringido a desplazamientos a través del agujero y no transversales a él. Intentemos formalizar esta característica. Tomemos dos puntos pertenecientes a sendas regiones separadas por cierto material. Estos pueden ser conectados por infinitas curvas. Tomaremos solamente curvas abiertas y planas5 que conectan estas dos regiones y tengan intersección nula con el material. De entre estas curvas hay un tipo de ellas (las que no pasan por el agujero sino por afuera de la alfombra) que pueden desplazarse mediante traslaciones en direcciones en las que jamás encontrarán el material en cuestión, es decir que para ellas, existen direcciones para las cuales toda traslación aplicada a la curva en esa dirección nos da como resultado que el conjunto de puntos ocupado por la curva luego de la traslación tiene intersección nula con el espacio de puntos ocupados por el material6. Otras de las curvas que conectan aquellos puntos (las que pasan por el agujero) tienen la característica de que para todas las direcciones en las que se les aplique una traslación, la curva tendrá una intersección no nula con el material en cuestión (más estrictamente, el espacio de puntos ocupado por la curva luego de alguna traslación tendrá intersección no nula con el espacio de puntos ocupados por el material). Podemos distinguir estas dos clases de curvas de la siguiente manera: diremos que las curvas de la primera clase no están concatenadas con el material, mientras que las segundas, sí lo están. La noción de concatenación entonces descansa sobre las de traslación y de intersección no nula. Hemos logrado llegar a distinguir distintas curvas que unen puntos de dos zonas del espacio mediante la característica de estar o no 5. Contenidas en un plano. Esta restricción es para evitar curvas anudadas y otras que pudieran complicar la aplicación del criterio. 6. Tomamos para esta operación un espacio euclideo o que en la región en cuestión pueda aproximarse por un espacio euclídeo. Esta restricción impide que consideremos traslaciones en un espacio curvo de modo que la curva pueda "volver" a intersecar el material en un mismo punto luego de una traslación.
163
concatenadas con cierto material, y esa característica no depende en absoluto de nuestros recortes para la descripción. También sabemos que las curvas concatenadas con el material son todas las que pasan por el agujero de manera que podrían ahora servirnos de guía para lograr una mejor definición de agujero. Tomemos la familia de infinitas curvas concatenadas con el material. Si la alfombra tiene más de un agujero debemos identificar cada uno de ellos por separado y por tanto debemos distinguir de todas las curvas concatenadas cuáles están asociadas a un agujero y no a otro7. Para diferenciar un agujero de otro entonces tendremos en cuenta un estilo de conexidad en el espacio ocupado por las curvas concatenadas. Si dos curvas concatenadas son conexas en el sentido que veremos, es decir que hay una manera de unir una con otra por una poligonal, entonces pertenecen al mismo agujero. El sentido de conexidad al que nos referimos debe tener en cuenta que el agujero se produce en una superficie8, esto es, si estamos en el 7. Nótese que no existe la amenaza del argumento planteado por Casati y Varzi según el cual no hay dos agujeros sino dos partes de un mismo agujero, o simplemente todos los agujeros en un objeto son solo uno (cf. Casati y Varzi 2004). 8. Técnicamente se produce en un hiperplano de dimensión n-1 del espacio de n dimensiones. Véase para esta nomenclatura Hocking y Young, 1966, p. 201. En general todo hiperplano es la traslación (incluso nula) de un espacio vectorial. Por ejemplo un hiperplano de dimensión 1 en el plano resulta ser una recta, y un hiperplano de dimensión 2 en el espacio de tres dimensiones, es un plano. Existen referencias a los agujeros en la bibliografía técnica en topología. Sin embargo hay dos aspectos por los cuales no se ha seguido ese tipo de análisis en este trabajo. Por un lado los tratamientos técnicos no suelen tipificar los agujeros como una determinada región del espacio sino en referencia a alguna homología o colección de curvas que lo rodean, con lo cual una vez sabido cuál es el agujero, se distinguen los ciclos asociados a él. Para este tipo de tratamiento véase por ejemplo Hwa y Teplitz 1966, cap. 2: Homolgy. El segundo motivo para no seguir este tipo de análisis es que intentamos encontrar características que puedan ser identificadas por los hablantes calificados del idioma, aun no siendo calificados técnicamente como topólogos, al referirse a los agujeros. De este modo un análisis técnico nos apartaría del objetivo de qué puede estar en juego
164
caso de la alfombra, el agujero se extiende en una zona plana horizontal paralela al piso a la altura de las fibras de la alfombra, y entonces la poligonal debe estar incluida en ese plano horizontal y no intersectar material. Finalmente todas las curvas que forman un conjunto conexo en este sentido, son curvas que pasan por un mismo agujero. Así cada agujero queda identificado por un conjunto de curvas conexas y no con el resto. Si quisiéramos identificar el perímetro del agujero9, podemos tomar el haz de curvas que pasan justo por el borde del agujero, es decir aquellas que atraviesan el agujero con intersección nula con el material, pero que en caso de desplazarse un diferencial en cierta dirección, su intersección será no nula con el espacio ocupado por el material. Analicemos otro ejemplo, esta vez el caso de un agujero en algo no tan concreto como la alfombra. Un navegante parte del puerto para cruzar el océano. Se mantiene comunicado con el puerto mediante su radio. Desde la antena del barco las ondas se propagan de manera de llegar al puerto. Algunas de las ondas, las ondas terrestres, se propagan a través del mar y la tierra de manera que llegan al al momento de que los hablantes identifiquen regiones como agujeros. Agradezco al Profesor Orellana sus comentarios resaltando este punto durante la exposición de este trabajo en las Jornadas. Un tercer motivo para no sumergirnos en tales tecnicismos es por último su fracaso en rescatar las distinciones que se intentan establecer aquí. En referencia a la estrategia topológica que intenta reducir los agujeros en términos de las características de su anfitrión (estrategia topológica adjetivista), Casati y Varzi (1999) p. 19-20 sostienen que no cumple su objetivo satisfactoriamente: "[T]he adjetivalist needs a lot of adjectives to characterize the various types of hole configurations, and there is no guarantee that all types can be distinguished by reference to topological properties of the objects." A cambio sugieren una estrategia que combine las características topológicas basadas en características de los objetos con consideraciones sobre sus complementos. 9. Aquí no identificamos al agujero con su perímetro tal como uno de los personajes del diálogo lo hace en Lewis y Lewis (cf. Lewis y Lewis 1970).
165
puerto por la trayectoria más corta. Otras de las ondas, las espaciales, se propagan hacia la ionosfera y luego de reflejarse utilizando esa parte de la atmósfera como un espejo, llegan a la antena del puerto. Pero el puerto nunca recibe ambos tipos de ondas ya que cuando el barco está muy cerca, las ondas espaciales que utilizarían la ionosfera como espejo inciden tan perpendicularmente a la ionosfera que en vez de reflejarse se escapan al espacio. Lo mismo ocurre para las ondas que el barco recibe del puerto. Entonces, en las cercanías del puerto, las ondas que mantienen comunicado al barco son las ondas terrestres. En cambio, cuando el barco está lejos las ondas terrestres que llegan a puerto han perdido su intensidad y ya no son útiles. En ese caso, las ondas espaciales pueden usar la ionosfera de espejo ya que inciden con ángulos menos perpendiculares y efectivamente son bien reflejadas. Pero hay una zona intermedia en la que las ondas terrestres han perdido intensidad y las espaciales todavía no se reflejan suficientemente. Esa zona es una zona de silencio radial, una franja de incomunicación, un agujero en la accesibilidad radial. Estrictamente es un hueco, pero podríamos tomar una lonja de altura igual a la que está la antena y espesor del orden del que ocasiona el movimiento oscilatorio del barco (rolido). Llamemos a esa zona «el sector Z». Supongamos ahora que el puerto está dando un alerta meteorológico por radio para que los barcos tomen recaudos. Pues bien, si nuestro barco ha entrado en el sector Z, podremos decir que no se tomaron precauciones dado que entró en esa zona10. Más tarde el barco comienza a recibir las ondas espaciales y al enterarse de las noticias, la tripulación toma los recaudos pertinentes. Podremos decir ahora que se tomaron recaudos gracias a que el barco salió del sector Z. Como vemos, a la entrada y a la salida de esa zona de omisión de comunicaciones les podemos asignar roles causales en nuestros relatos. Estas omisiones rodeadas por zonas en las que se instancia alguna propiedad que en la omisión justamente no está presente, cuentan como agujeros que pueden 10. Esta afirmación da lugar a causación entre omisiones: "no se tomaron precauciones debido a que no se escuchó el alerta".
166
jugar un rol causal en la descripción de los acontecimientos. También los límites de tales omisiones, es decir la zona en la que la omisión deja lugar a la ocurrencia, o la zona en que la ocurrencia deja lugar a la omisión, cuentan como eventos (ingresar en el sector Z, o salir del sector Z) que pueden jugar algún rol causal en las descripciones.
2. AGUJEROS VS. HUECOS: REFINANDO LAS CARACTERÍSTICAS Los agujeros son diferentes de los huecos11. Sostendremos que la característica esencial de los agujeros que permitirá distinguirlos de los huecos será la de poder conectar las dos zonas del espacio que el material divide. Los huecos no cumplen con esta característica. Los huecos también son una falta de material en donde se esperaba que lo hubiera. Por ejemplo son huecos las cavernas en las montañas, las hendiduras en la madera, la ratonera en el zócalo, etc. Los espacios del queso gruyere en donde no hay queso son huecos en donde se esperaba que hubiera queso pero no lo hay (aunque justamente en el gruyere se espera que haya estos huecos). Sin embargo al cortar el queso en lonjas esos huecos dan lugar a los típicos agujeros en la lonja de queso, y quizás esta relación es consistente con que en el lenguaje natural los llamemos agujeros y no huecos. Dijimos que el interior de una pelota inflada no es un agujero pero el orificio por donde se infla, sí. Ahora podemos decir que el interior de la pelota es un hueco, y por donde se infla es un agujero. Pero de inmediato surge una dificultad. Si queremos aplicar el mismo método que utilizamos con el agujero de la alfombra para identificar el orificio de inflado de la pelota encontramos que todas las curvas abiertas que pasan por el agujero tienen intersección no nula con el material de que está hecha la pelota. Por ejemplo una recta que pase por el medio del agujero y perpendicular a la superficie que rodea al agujero, tocará en las antípodas del agujero. Esto es, toda recta que 11. Confundir estos dos tipos de cosas dificulta el diálogo citado en Lewis paseypor el agujero inflado,ocurre tocará pelota algúnpresentado punto de su Lewis, cosa quedetambién enlaparte del en diálogo en super Casati y Varzi, aunque más tarde se intentan distinguir (cf. Lewis y Lewis 1970, Casati y Varzi 1994).
167
ficie. Así, toda curva abierta que conecte el interior de la pelota con el exterior, tendrá intersección no nula. El resultado será que no hay orificio sino solo un hueco dentro de la pelota. Para subsanar esto debemos hacer un recorte restringiéndonos a la zona cercana al agujero. Esto es que no tomaremos la pelota toda en su conjunto para decidir si el orificio de inflado es un agujero o no de acuerdo a nuestra caracterización en virtud de las curvas concatenadas. Tomaremos por ejemplo el hemisferio de la pelota que contiene al orificio de inflado. Con este recorte podremos aplicar el criterio sin problemas para poder decidir si es o no un agujero y que el resultado coincida con nuestra intuición de que efectivamente es un agujero el lugar por donde se infla la pelota. Del mismo modo podremos decir que la pelota está pinchada si presenta un agujero, además del de inflado, en su superficie. Notemos que hemos tenido que restringirnos a una porción de superficie para poder aplicar el criterio de las curvas concatenadas. Las preguntas que surgen de inmediato son ¿cuál es la medida de esta restricción? ¿Hay alguna característica no subjetiva que permita decidir esta medida? Para responder tomemos la estrategia de llevar a un extremo la restricción. Por ejemplo tomemos una porción tan pequeña como se desee de material de la pelota que todavía incluye al orificio de inflado. Dado que cualquier porción de superficie de la pelota que contenga al orificio de inflado cumplirá con el criterio de que allí hay efectivamente un agujero según las características que pide el criterio, entonces el recorte no es subjetivo. La medida es tan pequeña como se quiera (siempre que no sea menor al agujero, cuestión que no introduce subjetividad) y tan grande como se quiera en tanto no desaparezca el agujero por haberse cerrado la superficie (en las antípodas) y así impedir la aplicación del criterio. Es más, esta restricción no subjetiva permite distinguir, de paso, los casos en los que los agujeros conectan dos regiones del espacio ninguna de las cuales constituye un hueco, de los casos en los que los agujeros son en efecto la entrada a un hueco. Si, en el caso de la pelota tomamos una porción de su superficie que contenga al agujero y luego vamos tomando porciones más extensas, llegará un momen
168
to, al tomar la totalidad de la superficie de la pelota, en que la aplicación del criterio muestra que no hay agujero. Allí se puede concluir entonces que la pelota contiene un hueco y que el agujero anteriormente identificado es la entrada a tal hueco. Si la restricción se toma de manera de hacer mínima la porción de superficie que contiene al supuesto agujero, nos encontramos con un anillo o un aro del material del que está hecha la pelota. Y nuestra intuición es que los anillos y los aros tienen un agujero en su centro o interior. Por lo tanto la restricción que nos lleva al extremo de tomar la mínima extensión de superficie para aplicar el criterio no contradice los resultados de nuestra intuición. En resumen, la restricción para la aplicación del criterio no contiene elementos subjetivos y permite la aplicación del criterio para detectar la presencia de agujeros.
3. AGUJEROS Y HUECOS: ¿ENTIDADES, PROPIEDADES O RELACIONES? La única cuestión que ha quedado imposible de remover es que para la existencia de un agujero, se necesita la existencia de otra cosa más: aquello que tiene tal agujero. Los agujeros pueden tratarse como entidades en tanto pueden ubicarse espaciotemporalmente, pero su existencia está ligada a la de otro objeto12. En virtud de esta dependencia quizás fuera más acertado pensar que los agujeros son propiedades de los objetos que los poseen. Por ejemplo tal pelota tiene la propiedad de estar agujereada en dos puntos de su superficie. Pero parece absurdo decir que los agujeros son propiedades de los objetos en el sentido de que ocurren allí donde el material del objeto no está presente13. Si la pelota es roja, lo es en toda la exten 12. Como se menciona en nota 3 respecto a la dependencia que tiene todo agujero de la existencia de otro material que parece ser su portador. En términos de Casati y Varzi (1994) los agujeros necesitan un anfitrión material. 13. También esta advertencia se encuentra en Casati y Varzi (1994) en el sentido de que los agujeros están en donde el anfitrión no está. Véase también este pasaje en Lewis y Lewis (1999) p. 184.
169
sión en donde está la superficie de la pelota. Pero si la pelota está pinchada y por tanto tiene un agujero, justamente lo tiene en el lugar en donde no hay pelota (y debería haberlo). Estas consideraciones hacen que sea al menos dudoso que los agujeros puedan tomarse llanamente como una propiedad y dan lugar a continuar con el intento de tratarlos como entidades, aunque no independientes de cierto marco respecto del cual adquieren existencia. Finalmente queda la posibilidad de tomar a los agujeros como una relación entre la zona del espacio y un objeto. Esto es entre la zona del espacio en la que no hay alfombra y la alfombra misma. Esta relación tiene una dificultad enorme para su análisis. Por un lado los argumentos de la relación no son del mismo tipo, no es una alfombra más grande que otra sino una zona del espacio que está en relación de ser agujero de la alfombra. Por otra parte habría que ver si el aspecto de propiedad no está dado solamente por la dependencia ontológica en que los agujeros están respecto de sus huéspedes. La noción de agujero como relación no puede descartarse rápidamente pero tampoco puede asumirse como exenta de problemas. Aquí hemos querido establecer el criterio físico que podrían tomarse como condición necesaria para que luego, en la esfera pragmática los hablantes decidan referirse a algo como un agujero. No parece haber contraejemplos, esto es, no parece haber agujeros en el sentido corriente y como los hablantes los detectan, que no cumplan con el criterio sugerido. La fuerza de la vertiente pragmática muestra sin embargo que el criterio no es suficiente ya que son muchas las situaciones en las que se cumple tal criterio y los hablantes deciden que sería absurdo hablar de agujeros en esos casos. Queda pendiente entonces un análisis de esta segunda vertiente, la pragmática, mientras que la vertiente proveniente de las características físicas parece haber quedado resuelta.
REFERENCIAS Casati, Roberto y Varzi, Achille (1994): Holes and Other Superficialities. Cambridge: MIT Press. Bradford Books.
170
Casati, Roberto y Varzi, Achille (1999): Parts and Places: The Structures of Spatial Representation MIT Press. Casati, Roberto y Varzi, Achille (2004): "Counting the Holes", Australasian Journal of Philosophy, 82, pp. 23-27. Hocking, John G. y Young, Gail S. (1966): Topología. Exposición sistemática de los resultados más importantes en el momento actual. Barcelona: Reverté. Hwa, Rudolph C. y Teplitz, Vigdor L. (1966): Homology and Feynman Integrals. New York: W. A. Benjamin, Inc. Lewis, David (1986): "Events", en Lewis, D. Philosophical Papers, vol. II, Oxford: Oxford University Press, pp. 241-269. Lewis, David (1999) Papers in Metaphysics and Epistemology Cambridge University Press. Lewis, David y Lewis, Stephanie (1970): "Holes", Australasian Journal of Philosophy, 48, pp. 206-12. Lewis, David y Lewis, Stephanie (1970): "Casati and Varzi on holes" en David Lewis (1999) Papers in Metaphysics and Epistemology pp 183-186.
Hernán Miguel Universidad de Buenos Aires - Argentina Universidad Nacional de General Sarmiento - Argentina herny@mail.retina.ar
LÍMITES DE LA ARGUMENTACIÓN EN SOBRE LA CERTEZA
Eduardo Fermandois
173
LÍMITES DE LA ARGUMENTACIÓN EN SOBRE LA CERTEZA
Eduardo Fermandois En el fundamento de la creencia bien fundamentada se encuentra la creencia sin fundamentos. Todo hombre razonable se comporta así. (Wittgenstein, Sobre la certeza, § 253 y § 254)
Resumen A partir de algunos pasajes en Sobre la certeza de Wittgenstein (entre otros, los parágrafos 92, 94, 105ss, 162, 262 y 608-612), abordo aquí el tema de los límites de la argumentación. Uso esta fórmula para referirme a la situación en que desemboca un diálogo entre miembros de culturas muy diferentes, una vez que se agotan las posibilidades de seguir argumentando, por no existir acuerdo en relación
174
a premisas fundamentales. Wittgenstein ofrece un comentario conceptual a este tipo de impasse intercultural, cuando escribe que "[c]ualquier prueba, cualquier confirmación y refutación de una hipótesis ya tiene lugar en el seno de un sistema" (SC § 105). Ofrezco una interpretación de pasajes como éste, para luego examinar la relación entre el tema de los límites de la argumentación y el del relativismo cultural. Entre las preguntas que respondo figuran éstas: ¿Se puede decir que culturas muy diferentes entre sí poseen conceptos diferentes de justificación? ¿Cuáles son exactamente las estrategias que nos quedan, una vez que se nos acaban las razones? ¿Qué parecidos y diferencias existen entre esas estrategias y la argumentación? Abstract Departing from some paragraphs of On Certainty (esp. 92, 94, 105 ff, 162, 262, 608-612), I deal with the topic of the limits of the argumentation. By this I mean the situation obtained in a dialogue between members of very different cultures when, due to an ultimate disagreement regarding some fundamental premises, the possibility of keep arguing is exhausted. Wittgenstein offers us the following conceptual remark to this kind of intercultural impasse: "Every proof, every confirmation or refutation of a given hypothesis, obtains within the framework of a certain system." (OC § 105). First, I provide an interpretation of paragraphs of this kind, and then I proceed to examine the relation between the limits of the argumentation and cultural relativism. I deal with the following questions: Is it plausible to say that very different cultures have different concepts of justification? Which exactly are the strategies at hand when reasons exhaust? Which are the similarities and differences between these strategies and argumentation?
1. INTRODUCCIÓN: PREGUNTAS A PARTIR DE CITAS1 Quiero presentar mis preguntas comentando dos citas tomadas 1. Desarrollo en esta ponencia un tema que había dejado planteado al final de Fermandois 2003. En ese artículo abordé, entre otros tópicos, el
175
de Sobre la certeza (cf. Wittgenstein 1988b). En el parágrafo 105, refiriéndose a la idea de argumentación, Wittgenstein escribe lo siguiente: "Cualquier prueba, cualquier confirmación y refutación de una hipótesis, ya tiene lugar en el seno de un sistema. Y tal sistema no es un punto de partida más o menos arbitrario y dudoso de nuestros argumentos, sino que pertenece a la esencia de lo que denominamos una argumentación. El sistema no es tanto el punto de partida, como más bien el elemento vital de los argumentos." (Wittgenstein 1988b: § 105)2.
Llama aquí la atención que el sistema del cual se habla sea caracterizado como el elemento vital de los argumentos. La alusión metafórica suscita de inmediato la pregunta ¿qué entiende Wittgenstein exactamente por «sistema»? En efecto, si el pasaje no contuviera la metáfora del elemento vital, la noción de sistema tampoco conllevaría mayor dificultad interpretativa; simplemente entenderíamos por «sistema» un conjunto de enunciados o creencias, ordenado de alguna manera coherente —o algo similar—. Decimos que el elemento vital de los seres humanos es el aire, y que el agua es el de los peces. ¿En qué sentido la relación entre argumentos y sistema puede ser considerada análoga a la que los seres humanos guardamos con el aire y los peces con el agua? ¿En qué consiste el contraste entre «punto de partida» y «elemento vital»? ¿Y qué está en juego en este contraste? Mi segunda cita, tomada del parágrafo 92, dice así: "[…] «¿Puede tener alguien una razón convincente para creer que la Tierra existe desde hace poco, desde el día en que él nació?» —Suponiendo que se le hubiera dicho siempre que era de ese modo— de la comprensión intercultural, en el que ahora no entraré mayormente, pese a su estrecha relación con la cuestión de los límites de la argumentación. 2. He cambiado levemente la traducción de la última oración, acercándola más al original. Prades y Raga traducen: "El sistema no es el punto de partida, sino el elemento vital de los argumentos." (Wittgenstein 1988b: § 105).
176 ¿tendría alguna buena razón para dudarlo? Los hombres han creído que podían hacer que lloviera; ¿por qué no podría darse el caso de un rey que se hubiera educado en la creencia de que el mundo había comenzado con él? Y si este rey y Moore se encontraran y discutieran, ¿podría Moore demostrar que su creencia era la correcta? No afirmo que Moore no pudiera convertir al rey a su punto de vista, pero se trataría de una conversión muy peculiar: el rey se vería conducido a considerar el mundo de otra manera." (Wittgenstein 1988b: § 92)
No se habla aquí de ser convencido por razones o argumentos, porque ante diferencias culturales profundas, las razones, como decimos, se nos agotan pronto. Me interesa esta frase: «las razones pronto se nos agotan». Corresponde de hecho a una retórica muy propia de nuestro autor quien se ha valido de ella, más o menos directamente, en diversos contextos: refiriéndose a la aclaración filosófica (cf. Wittgenstein 1988a: § 1), al aprendizaje de un lenguaje natural (cf. Wittgenstein 1988a: § 208) y al seguimiento de reglas en general (cf. Wittgenstein 1988a: § 217). Es indudable también que el tópico del fin o agotamiento de las razones se halla latente en todos los ejemplos de diferencias culturales contenidos en Sobre la certeza. En dicha frase se detecta, por lo demás, la relación entre el tema de las diferencias culturales y el del escepticismo, porque, al menos desde la perspectiva de Wittgenstein, en la discusión con el escéptico la justificación también llega, y legítimamente, a un fin o límite (cf. Wittgenstein 1988b: § 204). Pero, ¿qué significa exactamente, con respecto al fenómeno de la diversidad cultural, que se nos acaben pronto las razones? ¿Qué implica sostener que no podemos seguir argumentando, que la práctica de pedir y dar razones conoce límites? Una pregunta emparentada: ¿se puede afirmar que culturas muy diferentes entre sí poseen incluso conceptos diferentes de justificación? En mi segunda cita encontramos además una pista de respuesta a una de las preguntas suscitada por la primera. La frase «el rey se vería conducido a considerar el mundo de otra manera» evoca nítidamente una noción clave en estas notas tardías de Wittgenstein: la noción de «imagen del mundo» (Weltbild). ¿No será que podemos interpretar la metáfora del sistema como elemento vital de los argu
177
mentos a la luz de la noción de imagen del mundo? Ahora bien, esta noción es capaz de sembrar por sí sola la sospecha de un relativismo. Un argumento sólo sería válido al interior de una determinada imagen del mundo y no, si opera en otra diferente; ningún argumento podría entonces aspirar a ser universalmente válido, es decir, con independencia de una determinada imagen del mundo. Considero fuera de toda cuestión que Wittgenstein no fue un relativista con respecto a la noción de verdad.3 Pero frente a conceptos como los de justificación, argumentación o racionalidad, la sospecha de una postura relativista dista de ser fácil de disipar. Ahora bien, dado que no estoy interesado, como fin en sí mismo, en lo que Wittgenstein «realmente» pensó —menos en el caso de un texto tan inacabado como Sobre la certeza, un texto que ni siquiera es un álbum— la pregunta de si Wittgenstein fue un relativista con respecto a la justificación no puede sino tener el sentido de esta otra: ¿encontramos en sus observaciones buenas razones para serlo o no serlo?
2. ‘‘LAS RAZONES PRONTO SE NOS AGOTAN” Premunido de suficientes preguntas, quiero comenzar abordando el impasse argumentativo al que aluden locuciones como «las razones se nos acaban pronto» o «llegados a este punto, ya no podemos seguir argumentando». Voy a sostener que estas locuciones admiten varias lecturas, las que, a su vez, implican diversos modos concretos de reaccionar frente al impasse. Sin embargo, me quiero referir antes a aquel filósofo que simplemente se empeña en negar lo que tales formulaciones intentan aprehender. ‘‘No se nos agotan las razones —nos dirá este imaginado objetor—, lo que ocurre es que hay culturas cuyos miembros viven aferrados a ciertas creencias falsas y que, en tal medida, se revelan como culturas menos racionales que la nuestra. Que nuestros interlocutores de otras culturas no acepten nuestros argumentos, no 3. Wittgenstein 1988a: § 136s puede dar pie, y lo ha dado, para atribuir a Wittgenstein algún tipo de deflacionismo respecto de la noción de verdad, pero en ningún caso una postura relativista.
178
justifica en absoluto el empleo de expresiones como «el fin de la argumentación», que sugieren una limitación esencial en esta práctica que nos distingue en tanto seres humanos —no, si es que hemos revisado debidamente nuestros argumentos—. Porque si lo hemos hecho, entonces el problema no está en nuestros argumentos, ni mucho menos en nuestra idea de argumentación, sino que en nuestros interlocutores: en su obstinación, su dogmatismo, su irracionalidad.” Una debilidad estructural en esta postura, que podríamos llamar de «antirelativista» o «absolutista», es que no permite distinguir entre interlocutores que, proviniendo de una cultura muy diferente a la nuestra, son además muy diferentes entre sí. En toda cultura el oyente de turno puede ser un falto de curiosidad, un inflexible o derechamente un fanático; y en esos casos es correcto localizar el problema en el oyente y no en el argumento. Fácilmente, sin embargo, podemos imaginarnos también a una persona que, sin responder a ninguna de esas características, pero habiendo sido socializada de un modo muy diferente al nuestro, simplemente tenga inmensas dificultades para abandonar creencias que a nosotros nos parecen evidentemente falsas 4. Es más, tendríamos que preguntarnos asimismo: ¿por qué siquiera habría de abandonar esa persona sus creencias más fundamentales? En la segunda cita, Wittgenstein pregunta si el rey tendría alguna buena razón para dudar que el mundo haya comenzado a existir el día de su propio nacimiento. La pregunta es retórica; la respuesta es que el rey no tendría razones para poner en duda dicha creencia. No, por cierto, antes del encuentro en que Wittgenstein se lo imagina conversando con Moore (quien, desde luego, está lejos de pensar que el nacimiento del rey y el comienzo del mundo se hallen cercanos temporalmente). Pero incluso después de aquella conversación, 4. Una «fenomenología de la experiencia argumental», como la propuesta y desarrollada por Carlos Pereda, permite distinguir diversos casos: el aferrado a sus convicciones, pero en principio abierto a ponerlas en entredicho, el obcecado, el fanático. Los gestos, el tono, el silencio en que se adivina una reflexión, la mirada que lleva curiosidad, etc. son indicios que funcionan a diario (cf. Pereda 1994).
179
¿por qué habría el rey de desechar tan fácilmente una creencia así de fundamental? ¡Una simple conversación con un extranjero contra una larga y venerable tradición, un modo de haber visto las cosas durante toda una vida! Hasta parecería injustificado entonces, que el rey, después de escuchar un par de argumentos de Moore, adoptara la creencia de que el mundo comenzó a existir no sólo un poco, sino muchísimo antes que él mismo. Son imaginables muchos casos similares. En todos ellos, las razones, efectivamente, se nos agotan pronto. Esta expresión capta entonces una situación que es real —y si pensamos en los conflictos interculturales de nuestros días, podríamos hasta decir que la situación no puede ser más real— . Quien niega que la argumentación tenga sus límites, demuestra una actitud cerrada y dogmática. Es ser cerrado y dogmático tratar miembros de otra cultura como si todos fueran o tendieran a ser cerrados y dogmáticos. Ahora bien, la formulación «las razones pronto se nos agotan» y otras emparentadas admiten tres lecturas diferentes: una lectura relativista, una lectura etnocentrista y la que llamaré una «doble lectura». 1. La lectura relativista. Como no podemos darle razones al otro, debemos abstenernos de todo enjuiciamiento o evaluación. La danza de la lluvia constituye una práctica menos racional que la meteorología, pero tal juicio sólo es válido para nosotros, no para ellos. Eso es todo lo que se puede decir, y cualquier atisbo de evaluación crítica será muestra de incomprensión, intolerancia, imperialismo, etc. Frente a esta primera interpretación, dos comentarios. En primer lugar, que no encontraremos en Sobre la certeza citas que vayan en esa dirección. Wittgenstein pone gran énfasis en la diversidad cultural, pero nunca pone entre paréntesis sus propias convicciones, a menudo críticas5. Aquí importa tener en cuenta lo siguiente: si bien el relativismo comienza con la constatación enfática de la diversidad, tal constatación no conduce necesariamente al relativismo. Y en segundo lugar, que la lectura relativista implica mirar las cosas desde un punto de 5. Cf., por ejemplo, Wittgenstein 1988b: § 609s. Hay también comentarios en ese sentido en Wittgenstein 1996.
180
vista que no puede ser el nuestro, lo cual queda reflejado en la cláusula: «pero sólo para nosotros, no para ellos». En efecto, esta cláusula sólo se puede pronunciar desde una perspectiva que no es la nuestra, porque desde nuestra perspectiva las danzan no causan lluvias —y punto—. En tal sentido, y al margen de otros descargos que se pueda hacer contra el relativismo (autorefutación, arbitrariedad), es preciso destacar que el relativista y el absolutista, más allá de sus evidentes diferencias, convergen en un punto, no tan evidente, pero absolutamente crucial: el infructuoso intento de pensar y hablar desde una meta-perspectiva6. Desde nuestra perspectiva — la única que tenemos, pero que la tenemos—, el asunto con la lluvia no nos puede dar intelectualmente lo mismo. Con respecto al origen causal o la predicción de fenómenos climáticos, no somos ni podemos ser imparciales. 2. La lectura etnocentrista (Rorty). Como no podemos darle razones al otro, pero como pensamos sinceramente que, cuando se trata de predecir el tiempo7, la danza de la lluvia es una práctica menos efectiva que nuestra meteorología, nos vemos obligados a recurrir a métodos ya no propiamente argumentativos: la propaganda persuasiva, la apelación a los afectos mediante el impacto de imágenes televisivas, novelas sentimentales, etc. Estos últimos ejemplos están tomados de Richard Rorty, el autor que más ha escrito en nuestros días en favor de esta segunda lectura, dejando en claro, por lo general, que el etnocentrista (como él lo entiende) no es un relativista, dado que, a diferencia de éste, no aparenta falsas neutralidades. En un pasaje de su artículo «Solidarity or Objectivity?» leemos: 6. Esta crítica conecta directamente con las anotaciones de Wittgenstein, pues como señala Putnam: "[…] the whole burden of On Certainty is that we have no other place to stand but within our own language game." (Putnam 1992: 172). 7. Wittgenstein y Winch subrayan los malentendidos que pueden surgir al tomar un juego de lenguaje expresivo por uno cognoscitivo. En el artículo mencionado en la nota 1 sostengo, sin embargo, que es a Taylor a quien debemos las mejores observaciones sobre este tema (cf. Wittgenstein 1996; Winch 1994 y Taylor 1982).
181 "Comportarse etnocéntricamente significa: dividir el género humano entre aquellos frente a los cuales uno debe justificar sus convicciones, y el res-to. El primer grupo —el ethnos— abarca a aquellos seres humanos con cuyas opiniones concordamos lo suficiente como para hacer posible una conversación fructífera". (Rorty 1985: 15)8
El etnocentrismo a la Rorty me merece reparos, tanto a nivel teórico como práctico. En cuanto a lo primero, Rorty (y esto vale también para el relativista) opera con una concepción demasiado pobre y esquemática de argumentación, donde se tiende a reducir «argumento» a «argumento deductivo». Sólo podemos conversar argumentadamente con aquellos seres humanos con los que tenemos opiniones básicas en común —es lo que se infiere de la cita—. Pero esto implica que la deducción a partir de premisas compartidas es el único modo de argumentación, afirmación altamente cuestionable9. Pero además, no deja de ser interesante que pese a las obvias diferencias teóricas entre el etnocentrista rortyano (que niega toda objetividad) y el absolutista (que cree ser su único dueño), sus modos concretos de reaccionar frente al impasse argumentativo sean fun 8. La traducción es mía. 9. El concepto pobre o estrecho de argumentación manejado Rorty queda también en evidencia en la siguiente cita: "No podemos justificar nuestras opiniones (sobre física, ética o sobre lo que sea) ante cualquier persona, sino que sólo ante aquellos que tienen ideas que se ajustan adecuadamente a las nuestras […] No es que vivamos en otro mundo que el de los nazis o los indígenas del Amazonas, pero aunque no es imposible una conversión a o de sus respectivas posturas, ésta no ocurrirá a través de inferencias a partir de premisas que nos sean comunes a ellos y nosotros desde un comienzo" (Rorty 1985: 15).
La alternativa es aquí: argumentación deductiva versus conversión; pero, ¿dónde queda la argumentación no deductiva en sus diferentes tipos? Otro aspecto problemático del modo en que Rorty enfoca el tema de la argumentación, a saber, su comparación metafórica entre argumentos y herramientas, no le permite decir que el problema, en algunos casos, efectivamente está en el oyente (el oyente cerrado, tozudo o dogmático) y no en el argumento. Según Rorty, el argumento que no convence es lisa y llanamente un mal argumento, una mala herramienta.
182
damentalmente los mismos: cese del diálogo argumentativo, si es que lo hubo alguna vez, y aplicación de métodos menos «simpáticos», para decirlo en jerga rortyana, desde el bombardeo de la propaganda hasta otros bombardeos. En lo práctico entonces, el absolutista y el rortyano no están nada lejos: ambos enfrentan culturas lejanas como si fueran entidades homogéneas, ambos conllevan un problemático paternalismo. Si, por lo tanto, uno es pragmatista y cree que las diferencias teóricas importantes son sólo aquellas que hacen de alguna manera una diferencia práctica10, entonces las diferencias entre Rorty y el absolutista comienzan a perder importancia. 3. La doble lectura. Según una tercera interpretación, expresiones como «se nos acaban pronto las razones» poseen dos sentidos que hemos de distinguir con claridad: un sentido débil y un sentido fuerte. En un sentido débil, el agotamiento de las razones significa haber alcanzado las premisas más básicas de una argumentación deductiva sin que ellas generen acuerdo. Dicho de otro modo, ya no resulta posible deducir ciertas creencias a partir de la verdad de creencias más fundamentales, dado que éstas ni son compartidas ni pueden ser deducidas, a su vez, a partir de otras aún más fundamentales. En consecuencia, el fin de la argumentación es en este caso el fin de un cierto tipo específico de argumentación: la argumentación deductiva, aquella que funciona mostrando que una determinada creencia (la conclusión) se sigue con necesidad de otras creencias (las premisas), de ser éstas verdaderas. Ahora bien, que se nos acaben las razones, en este sentido débil de la expresión, en absoluto elimina la posibilidad de argumentaciones no deductivas, como por ejemplo los argumentos por analogía o la inferencia a la mejor explicación y, en general, todo tipo de razonamiento que demuestra una conclusión no como verdadera, sino sólo como plausible. En un sentido fuerte, en cambio, el fin de las razones implica la inviabilidad de cualquier forma de argumentación, y no sólo de la deductiva. Ningún tipo de argumento tiene chance alguna de lograr un resultado en 10. Estoy castellanizando la famosa expresión de James. La cita completa dice: "There can be no differences anywhere that doesn’t make a difference elsewhere […]" (James 1978: 30).
183
casos de diferencias culturales profundas, la idea misma de una conversación argumentativa comienza aquí a perder su razón de ser. Por dos motivos que por ahora me limitaré a dejar apuntados, la lectura doble, la única que matiza la expresión «límites de la argumentación», poniendo en juego la distinción entre formas deductivas y no deductivas de argumentación, me parece definitivamente más promisoria que las dos anteriores. Primero, porque es la única que plantea la necesidad de preguntarse por formas de argumentación no-deductiva una vez que se nos agotan las razones articuladas deductivamente, y porque, como esbozaré más adelante, esas formas de argumentación son posibles. Segundo, porque es la única que, manteniendo vigente la posibilidad de una conversación que las otras interpretaciones tienden a finalizar demasiado pronto, crea un espacio para la idea del respeto a una cultura diferente, sin por ello caer en los vicios del relativismo. Se nos agotan pronto las razones, decimos, pero ¿qué quiere decir aquí el adverbio temporal? De nuevo, me parece entrever dos significados posibles: a) pronto me doy cuenta que, no pudiendo ya argumentar en absoluto, lo mejor es sustituir el juego de lenguaje argumentativo por uno diferente: propaganda, manipulación de afectos, etc.; b) pronto me doy cuenta de que el otro es muy diferente a mí, por lo que un simple argumento deductivo lo dejará imperturbable. De lo que vengo diciendo se sigue que hay más verdad en esta última lectura del «pronto» que en la primera.
3. IMÁGENES DEL MUNDO (WELTBILDER) Es importante contar con una noción como «imagen del mundo» (Weltbild)11. Los aborígenes de Australia, los indígenas del Amazo 11. Frente a la pregunta de por qué Wittgenstein acuñó un nuevo término y no prefirió continuar empleando, y elaborando, la noción de «formas de vida», no existe una respuesta fácil. Acaso un motivo diga relación con que ya había empleado también el singular de esta última noción («forma de vida»), mientras que ahora quiere decididamente enfatizar la dimensión de la pluralidad. Wittgenstein no habla nunca de la imagen (universal, humana) del mundo. El uso de «forma de vida» —así, en
184
nas, los musulmanes o los asiáticos, tienen —eso decimos— una imagen del mundo muy diferente a la nuestra. Importa que lo podamos decir, porque es una forma —yo diría que la primera— de respetar y tomar realmente en serio a otras culturas. Tomarlas en serio es reconocer su diversidad, y éste es precisamente el principal propósito que motiva la creación y el uso de conceptos como los de «imágenes del mundo», «Weltanschauungen», «formas de vida», etc. Si no dispusiéramos de estos conceptos, no podríamos reconocer realmente la alteridad, y por lo mismo estaríamos asimilando, aunque fuese más implícita que explícitamente, otras culturas a la nuestra. Ahora bien, tan importante como disponer de una noción que sirva a ese propósito, es entender que su uso no nos compromete automáticamente con una posición relativista. Un aspecto muy interesante relacionado directamente con la noción que comentamos, es el planteo de un tipo de holismo que, según me parece, se distingue de otros holismos discutidos en la filosofía analítica contemporánea. Son varios los indicios textuales que hacen pensar en tal planteo. En el parágrafo 141 leemos: "Cuando empezamos a creer algo, lo que creemos no es una única proposición, sino todo un sistema de proposiciones. (Se hace la luz poco a poco sobre el conjunto.)" (Wittgenstein 1988b: § 141).
La primera frase podría ser perfectamente de Quine, Davidson u otros «holistas analíticos». En cambio, el «poco a poco» de la frase entre paréntesis parece apuntar a un holismo distinto. Hay más indicios: en el § 94 se habla de «trasfondo» y cabe recordar también el término «entorno» (Umgebung), empleado por Wittgenstein en otros singular— se refiere sobre todo a modos instintivos de actuar y reaccionar que se presentan en toda la especie humana, y en parte también en especies inferiores; es el «modo de actuar humano común», del que habla nuestro autor (Wittgenstein 1988a: § 206). El hecho de que éste usara tanto «Lebensform» como «Lebensformen»" ha generado un debate entre los intérpretes: mientras que autores culturalistas (como Hunter 1986) enfatizan el uso del término en plural, autores naturalistas (como Haller 1984) privilegian el singular. En mi opinión, la alternativa es falsa porque ambas interpretaciones, ambos usos del término, apuntan a algo correcto y no se excluyen realmente.
185
textos12. En un autor que elegía con lupa cada una de sus palabras, nada de esto puede ser casual, como tampoco lo es el hecho de que caracterice metafóricamente la idea de sistema como «elemento vital». Con todos estos términos y metáforas Wittgenstein quiere apuntar a una atmósfera o ambiente social, es decir, a un modo distinto de organizar la vida, que en cuanto modo no es susceptible de fijar en una lista de creencias o enunciados. Así, tampoco puede ser casual el término mismo «imagen», en vez de «teoría» o «creencias» acerca del mundo. El holismo del cual habla Wittgenstein —sin usar, claro, esa palabra— no concierne simplemente a las relaciones que se pueden dar entre estructuras proposicionales (creencias, enunciados). Un enunciado como «Sólo el brujo de la tribu tiene poderes especiales» no expresa simplemente una creencia particular, un punto de partida equivocado, sino un modo de ver ciertas relaciones sociales. Este modo se verifica, por ejemplo, en un cierto tono en que se habla con el brujo o de él, en una manera de mirarlo o esquivar su mirada, de saludarlo y atender a sus palabras, etc. Más que ser, entonces, la expresión de una creencia que nos parece falsa, la frase apunta a un complejo entramado de prácticas y tradiciones con cualidades específicas, a un «trasfondo» o «entorno», como diría Wittgenstein. Por lo mismo, sólo alguien que se ha compenetrado, que se ha empapado con ese modo distinto de ver el mundo podrá, primero, comprender realmente la cultura de la que se trate, para poder luego, eventualmente, criticarla en aspectos específicos. Siguiendo esta línea de razonamiento, otra de las ideas que Wittgen-stein vincula con la noción de «imágenes del mundo» es la de que hasta se puede hablar, en cierto sentido, de conceptos diferentes de justificación al interior de imágenes del mundo diferentes. Es así como interpreto el parágrafo 608, donde leemos: "¿Es incorrecto que guíe mi conducta por las proposiciones del físico? ¿He de decir que no tengo ninguna buena razón para ello? ¿No es precisamente eso lo que denominamos una «buena razón»?" (Wittgenstein 1988b: § 608) 12. Por ejemplo: "Las palabras ‘jugar un juego’ sólo tienen sentido en una determinado entorno." (Wittgenstein 1987: § 346)
186
Las diferencias con respecto a seres humanos que poseen otra imagen del mundo no sólo conciernen premisas no compartidas, sino también modos diferentes de argumentar, relacionados con el tono, las personas y hasta los lugares y momentos que son considerados indicados para hacerlo. De ahí también la importancia de dirigir las preguntas apropiadas al miembro de otra cultura y de formularlas en el orden, el lugar y el tiempo justos. (Supongo que los políticos y empresarios que trabajan a nivel internacional podrían dar muchos ejemplos, avalando lo anterior.) Todos somos producto de una determinada socialización que abarca no sólo contenidos, sino también modos de aprendizaje, pautas respecto de lo que es relevante y lo que no, de lo que requiere justificación y lo que no, de lo que cuenta como una buena evidencia y lo que no, etc. Concebir las diferencias culturales como meras diferencias de opinión, por más elementales que éstas sean, no es plantear el problema de la diversidad cultural a un nivel suficientemente profundo. Ahora bien, nada de lo anterior debe identificarse sin más con el relativismo de la justificación. A la pregunta de si culturas muy diferentes entre sí poseen incluso conceptos diferentes de justificación, la respuesta ha de ser, en mi opinión: en cierto sentido sí, en cierto sentido no. Ya he dicho en qué sentido la pluralidad de conceptos de justificación parece una realidad. Pero existe también un núcleo común: todo intento justificatorio es un intento de afirmar algo verdadero. Y en esta referencia a la verdad, el concepto de justificación es, me parece, uno solo. Es el que nos permite criticar ciertas creencias o prácticas de otras culturas no sólo como falsas o incorrectas, sino también como injustificadas o menos justificadas. Una cosa es tener razones, otra cosa es tener buenas razones. Los conceptos de razón, justificación o argumentación son conceptos que poseen dos caras, una relativa y otra no relativa. Lo crucial es entender que ninguna de estas dos caras es más importante que la otra13. Por último, Wittgenstein nos recuerda en Sobre la certeza el carácter heredado de las imágenes del mundo. Nadie ha llegado a 13. He desarrollado este punto en Fermandois 2001.
187
tener su primera imagen del mundo (en muchos casos también la última) en virtud de justificaciones o argumentos. Por de pronto, a cada cual le toca la imagen del mundo que le toca. Se trata del "trasfondo que me viene dado y sobre el que distingo entre lo verdadero y lo falso" (Wittgenstein 1988b: § 94). Es éste otro aspecto o dimensión de los límites de la argumentación: no elegimos una imagen del mundo luego de considerar, por así decir neutralmente, todas o al menos una cantidad representativa de alternativas —como cuando uno se compra su primer auto—. Que una imagen del mundo no sea objeto de una elección, es obviamente válido para los niños, pero quizá lo sea en cierta medida también de los adultos. Sospecho que en una descripción cuidadosa de conversiones adultas, ya sean religiosas o de otro tipo, hablar de «elección» nunca resultará del todo adecuado para dar con lo que realmente ahí sucede.
4. ENTRE LA ARGUMENTACIÓN DEDUCTIVA Y EL PATERNALISMO Retomo aquí la tesis de la sección 2: la de que tras agotarse nuestras posibilidades de argumentar deductivamente (por no compartir premisas a partir de las cuales hacerlo), no tenemos por qué pasar inmediatamente a la propaganda paternalista. Existe un espacio intermedio de formas de argumentación no deductiva. Si el planteo general de esta ponencia está bien encaminado, uno de sus beneficios teóricos será el de hacernos ver que estamos aquí frente a un fértil e importante campo de investigación. Se trata de analizar, describir y sistematizar estrategias no deductivas de argumentación que resulten relevantes en el diálogo intercultural. En lo que sigue me referiré a sólo una de esas estrategias y sólo a modo de esbozo no sistemático. Otras que quisiera al menos dejar nombradas son la argumentación analógica y lo que se ha llamado «redescripción»14. También habría que pensar en formas legítimas, es decir, no paternalistas, de apelación a los afectos y, más en general, en la 14. Respecto de esta última habría que, claro está, dar razones para considerarla una forma de argumentación. Pero creo que esas razones efectivamente existen.
188
distinción entre usos argumentativos y no argumentativos de la persuasión. Pero todo esto va más lejos. Veíamos que una imagen del mundo no se elige, como se elige el primer auto, sino que simplemente la heredamos, por una cuestión de educación y tradición. Es aquí precisamente donde se abre la posibilidad de lo que con Hubert Schleichert podemos llamar «argumentación subversiva» (Schleichert 1999 passim). La idea de fondo es matizar y complementar la educación que nuestro interlocutor recibió durante su infancia o adolescencia. Esto se logra ofreciéndole información más precisa y completa sobre la imagen del mundo que ha heredado, sobre sus aspectos problemáticos y/o menos conocidos, sus rarezas, etc.; y presentando modos alternativos de enfocar los mismos temas. La pregunta que en todo esto dejamos caer constantemente, aunque sin formularla, es la siguiente: «Si hubieses sabido todo esto que te cuento ahora, ¿habrías visto entonces las cosas como de hecho las ves?» Ahora bien, es crucial entender que no se trata aquí de refutar a nadie, ni tampoco de hacer como si se lo hubiese refutado. Aquello que se ha llegado a tener como la visión correcta sin necesidad de argumentos, no puede ser refutado mediante argumentos. Lo que sí se puede es generar curiosidad y vacilación, se puede abrir sospechas y echar a andar una reflexión autónoma. Pero esto nada tiene que ver con refutaciones conclusivas. El tenor de este tipo de crítica intercultural no es entonces: «Lo que tú crees es falso, injustificado», sino: «Te intento mostrar lo que crees». Sólo nos atenemos aquí a referir hechos reales, sobre todo aquellos que puedan resultar incómodos a nuestro interlocutor; pero dejamos, y esto es crucial, que él mismo saque sus consecuencias. La característica de esta estrategia subversiva es entonces su carácter no conclusivo, lo propio, a su vez, de toda argumentación no deductiva. No por ello, sin embargo, se debe pensar que este proceder no haya de ser eficaz a largo plazo. Pero también esto es crucial: a largo plazo. No es una característica casual o accidental de la argumentación intercultural que los posibles cambios se den muy lentamente. Por lo demás, esta lentitud se ajusta bien al hecho de que una imagen del mundo no pueda ser refutada de una vez. Lo que
189
más bien ocurre es que una imagen del mundo devenga obsoleta, que con el tiempo se llegue a ignorarla y olvidarla, en virtud de un proceso paulatino, complejo y que no siempre está en nuestras manos.
5. LO QUE PODEMOS APRENDER DE WITTGENSTEIN ¿Y dónde queda en todo esto Wittgenstein? Voy a responder brevemente esta pregunta en forma de cuatro tesis que pueden tomarse también como un apretado resumen de la ponencia. 1. Wittgenstein no fue un relativista con respecto a la justificación, porque reconoció claramente la legitimidad de criticar creencias y prácticas de otras culturas. (Con todo, hay algunas citas que es difícil no interpretar como expresiones de relativismo: por ejemplo, Wittgenstein 1988b: § 95). 2. Tampoco hizo suyo un etnocentrismo a la Rorty, pese a algunas afirmaciones que podrían leerse en esa clave. En Sobre la certeza leemos lo siguiente: "Si alguien nos preguntara «Pero, ¿es tal cosa verdad?», podríamos responderle «Sí»; y si exigiera que se le dieran razones podríamos decirle «No puedo darte ninguna razón; pero si aprendes más cosas, compartirás mi opinión»." (Wittgenstein 1988b: § 206).
Esta referencia a un aprendizaje podría sonar a paternalismo etnocentrista. Pero hay un aspecto que no se puede pasar por alto: Wittgenstein, a diferencia de Rorty, no niega nunca que frases como ésas puedan ser leídas también al revés, es decir, que seamos nosotros (occidentales liberales, demócratas, etc.) los que tengamos que aprender de otras culturas, incluidas las así —y mal— llamadas «culturas primitivas». Por otro lado, la referencia al uso de slogans (Schlagworte, Wittgen-stein 1988b: § 610) o al hecho de que en conflictos culturales se trata a los otros como «locos» o «herejes» (Wittgenstein 1988b: § 611), no deben ser mal interpretadas. Creo que Putnam está en lo correcto al plantear que en esos pasajes Wittgenstein adopta un tono crítico, distanciándose precisamente del uso de un lenguaje agresivo (cf. Putnam 1992: 173).
190
3. Con todo, las evidencias textuales no son siempre claras o inequívocas, lo cual demuestra que Wittgenstein no alcanzó a pensar más acabadamente sobre estos temas. Resulta al respecto sintomático que haya lanzado dos conceptos absolutamente centrales para la cuestión intercultural, sin decir nada sobre ellos: persuasión y conversión. En la investigación que es preciso emprender en torno a estos conceptos, creo que no podremos aprender mucho del Wittgenstein de Sobre la certeza. 4. Comentando una determinada diferencia radical de opinión, Wittgenstein escribe: "Nos sentiríamos muy alejados intelectualmente de quien dijera tal cosa." (Wittgenstein 1988b: § 108) «Alejados intelectualmente» —en esta expresión se escucha una actitud de respeto por el otro—. En tal sentido, lo que sí podemos aprender de Wittgenstein es que el tema de la diversidad cultural es ante todo un tema delicado y que el respeto que nos merecen otras culturas, aun cuando no estemos de acuerdo con ellas, está relacionado de alguna manera con la idea misma de argumentación. Vimos al comienzo que toda argumentación opera al interior de un sistema que es su elemento vital. Esto lo interpretamos luego, entendiendo por «sistema» una imagen del mundo. Que otros seres humanos posean no sólo creencias y teorías diferentes a las nuestras, sino una imagen del mundo distinta, parece, de alguna manera, exigirnos antes que nada eso: respeto.
REFERENCIAS Fermandois, Eduardo (2001): "Verdad y justificación: la intrínseca relación y la imborrable diferencia entre dos conceptos", en Ideas y Valores. Revista Colombiana de Filosofía, vol. 17, pp. 55-78. Fermandois, Eduardo (2003): "Wittgenstein: entre relativismo y pragmatismo", en Cabanchic, S.; Penelas, F. y Tozzí, V. (eds.): El giro pragmático en la filosofía. Barcelona: Gedisa 2003, pp. 75-92. Haller, Rudolf (1984): "Lebensform oder Lebensformen?", en Grazer Philosophische Studien, vol. 21, pp. 55-63.
191
Hunter, J. F. M. (1986): "«Forms of Life» in Wittgenstein’s Philosophical Investigations", en Shanker, S. (ed.): Ludwig Wittgenstein. Critical Assessments, vol. II. London / Sydney, pp. 106-124. James, William (1978): Pragmatism. A New Name for Some Old Ways of Thinking and The Meaning of Truth. A Sequel to Pragmatism. Cambridge, Mass. / London: Harward University Press. Pereda, Carlos (1994): Vertigos argumentales. Una ética de la disputa. Barcelona: Anthropos. Putnam, Hilary (1992): "Wittgenstein on Reference and Relativism", en Putnam, H.: Renewing Philosophy. Cambridge, Mass.: Harward University Press, pp. 158-179. Rorty, Richard (1985): "Solidarity or Objectivity?", en Rajchman, J. y West, C. (eds.): Post-Analytic Philosophy. New York: Columbia University Press 1985, pp. 3-19. Schleichert, Hubert (1999): Wie man mit Fundamentalisten diskutiert, ohne den Verstand zu verlieren. München: C.H. Beck. Taylor, Charles (1982): "Rationality", en Hollis, M. y Lukes, S. (eds.): Rationality and Relativism. Cambridge, Mass.: MIT Press, pp. 87-105. Winch, Peter (1994): Comprender una sociedad primitiva. Barcelona: Paidós. Wittgenstein, Ludwig (1987): Observaciones sobre los fundamentos de la matemática. Madrid: Alianza Universidad. Wittgenstein, Ludwig (1988a): Investigaciones Filosóficas. México, D. F. / Barcelona: Instituto de Investigaciones Filosóficas, UNAM / Editorial Crítica. Wittgenstein, Ludwig (1988b): Sobre la certeza. Barcelona: Gedisa. Wittgenstein, Ludwig (1996): Observaciones a La rama dorada de Frazer. Madrid: Tecnos. Eduardo Fermandois Pontificia Universidad Católica de Chile efermanm@uc.cl
FILOGÉNESIS Y ESPECIES COMO GÉNEROS NATURALES EN KRIPKE
Julio Torres Meléndez
195
FILOGÉNESIS Y ESPECIES COMO GÉNEROS NATURALES EN KRIPKE
Julio Torres Meléndez Resumen Se presenta aquí un examen crítico de una reciente evaluación del concepto de especies como géneros naturales en Kripke. Se trata de aquella que surge en el contexto de la interpretación esencialista del cladismo o sistemática filogenética hecha por LaPorte. En oposición a los argumentos de LaPorte se sostiene que Kripke no está comprometido con un concepto no histórico de esencia para las especies. Para mostrarlo se propone derivar la misma tesis de LaPorte respecto de las especies, a partir de una tesis metafísica de Kripke en relación con la identidad de objetos cualitativamente idénticos.
196
Abstract This article introduces a critical examination of a recent assessment of Kripke’s notion of species as natural kinds. It is about that one arising in the context of essentialist interpretation of cladism or phylogenetic systematics given by La Porte. Opposing LaPorte’s arguments, it is claimed that Kripke is not committed to a nonhistorical species essence notion. In order to prove it we propose to derive the same thesis on species stated by LaPorte from Kripke’s metaphysical thesis on the identity of qualitatively identical objects.
1. INTRODUCCIÓN Se discute aquí una reciente interpretación de la tesis de Saul Kripke acerca de las especies biológicas. Se trata de la interpretación que hace Joseph LaPorte en el contexto de una defensa de la concepción esencialista de las especies que es construida a partir de una interpretación esencialista de un actual paradigma de taxonomía biológica: el cladismo o sistemática filogénetica (Cf. LaPorte 2004). LaPorte desarrolla su concepción esencialista de los géneros naturales en oposición a aquella concepción que es propuesta independientemente por Kripke y Hilary Putnam. Los argumentos esencialistas fueron desarrollados modernamente por estos filósofos a partir de la tradición que W. V. Quine, en sus críticas a la modalidad, llamara esencialismo aristotélico. Entendiendo por ello un esencialismo que atribuye propiedades necesarias a las cosas y no es sólo una forma de hablar acerca de cosas (cf. Quine 1977). La tesis esencialista sostiene entonces básicamente que podemos distinguir en las cosas propiedades esenciales y accidentales. Del agua, por ejemplo, podemos afirmar que sus propiedades organolépticas son accidentales o contingentes; pero su estructura molecular le pertenece esencial o necesariamente, pues si la pensamos como distinta lo que tendríamos allí no sería agua sino cualquier otra sustancia, incluso si sus propiedades causales conocidas fueran las mismas que las que encontramos en el agua. En la formulación de Kripke, una propiedad es necesaria si es verdadera de un objeto en todo mundo
197
posible o en toda situación que pueda ser estipulada para ese objeto. El agua en este sentido sería una clase o género natural pues podemos proyectar que todo aquello que es agua tiene esa y no otra estructura interna en cualquier mundo posible. Pero también habrían géneros naturales en el mundo biológico, estos son paradigmáticamente las especies y también, en un sentido amplio, los taxa o agrupaciones naturales de distinto nivel. Ahora bien, ¿qué propiedades le pertenecen necesariamente, por ejemplo, a una especie animal, a un tigre, por ejemplo? Hoy en día estaríamos inicialmente inclinados quizás a responder que la propiedad que hace de un tigre un tigre es ADN de tigre. Pero esta respuesta no puede ser correcta. Una pregunta simétrica a la pregunta acerca de naturaleza del agua, sería aquí: ¿podría tener o haber tenido un tigre un ADN distinto del ADN de tigre? Y la respuesta ahora no puede ser evidentemente negativa como en el caso del agua, las especies evolucionan. Lo que la teoría científica parece confirmar respecto de términos como ‘oro’ y ‘calor’ parece refutarlo respecto de las especies. El examen de la sustitución del concepto tipológico de especie, construido sobre la base de relaciones de similaridad morfológica, por el concepto de biológico de especie muestra los problemas a los que se puede ver enfrentada una respuesta como la que se atribuye aquí, tanto a Kripke como a Putnam, respecto de la esencia de las especies.
2. EL CONCEPTO TIPOLÓGICO Y EL CONCEPTO BIOLÓGICO DE ESPECIE
De acuerdo a la concepción esencialista tradicional pre-darwiniana podemos definir esencialmente a una especie natural en términos de aquellas cualidades que son propias de un conjunto de individuos y que los distinguen de otros. Esta parece ser la aproximación natural y espontánea mediante la cual los seres humanos han clasificado las especies. Si las especies fueron creadas independientemente entonces cada especie debe poseer una morfología única que la diferencia de las otras. Y estas propiedades son las que deben ser identificadas por el taxónomo. Una versión avanzada de este concepto surge cuando se agregan a estos indicadores morfológicos criterios de cruzamien
198
to reproductivo como lo hicieron Linneo y otros taxónomos noevolucionistas. Los organismos que pueden cruzarse entre sí pero que no pueden hacerlo con otros, forman ciertamente una agrupación natural que debe ser reconocida como tal. Estos deberían ser también los criterios usados por los pueblos aborígenes para identificar las especies en su entorno. Es conocido que las distinciones de la tradición de los pueblos aborígenes en un determinado entorno coinciden en un muy alto porcentaje con las distinciones que puede hacer en nuestros días un taxónomo cuando trabaja sobre ese mismo entorno. La incorporación de criterios reproductivos integra el fenómeno de la vida al criterio de clasificación morfológico y al concepto de especie que surge de allí. Sin embargo, queda implícito que las diferencias morfológicas son la causa del aislamiento reproductivo de las poblaciones que son reconocidas como clases naturales. Con ello se muestra que las especies son entendidas como entidades tipo y que los organismos ejemplifican ese tipo en la medida en que poseen los rasgos morfológicos esenciales del tipo. Este concepto tipológico o esencialista de especie entra en crisis luego de la aceptación del paradigma evolutivo que finalmente termina imponiéndose con Darwin. Desde el paradigma evolucionista se reconoce ciertamente que existe una correlación entre las diferencias morfológicas y el aislamiento reproductivo. Pero ahora el aislamiento reproductivo toma un lugar central y el orden causal se invierte: la diferencia morfológica es causada por el aislamiento reproductivo y no a la inversa. Como insiste Ernst Mayr: "El grado de diferencia morfológica exhibido por una población natural es un subproducto de la discontinuidad genética resultante del aislamiento en la reproducción" (Mayr 1968: 46). Pero el concepto morfológico es refutado en el mismo trabajo de campo del taxónomo pues existen diferencias morfológicas importantes entre individuos y poblaciones de la misma especie. De acuerdo a la moderna teoría de la evolución la variación individual al interior de las especies es no sólo una realidad sino también una fuente de la que se nutre el cambio evolutivo. Y, por otra parte, existen poblaciones que tienen rasgos morfológicos semejantes a pesar de constituir especies distintas. Estas son las llamadas sibling species o especies gemelas. Es decir, son poblaciones que presentan ausencia de dife
199
rencias morfológicas y que, sin embargo, constituyen especies distintas pues hay en ellas aislamiento reproductivo y diversidad genética. De ahí el surgimiento del llamado concepto biológico de especie de Theodosius Dobzhansky y del mismo Mayr. Este concepto está basado en la capacidad real o potencial de reproducción entre los miembros de una población animal. El aislamiento reproductivo que implica el concepto biológico de especie no es aquel de la esterilidad dado que existen poblaciones no estériles entre sí que, sin embargo, no se cruzan. Los mecanismos de aislamiento reproductivo son aquí distintos a los de la barrera de la esterilidad. Este tipo de fenómenos destruye también la pretensión ingenua de que podríamos tener criterios puramente genéticos para individualizar especies. Dicha pretensión no parece ser más que una versión genotípica del concepto morfológico de especie: los rasgos esenciales por los que pertenece un organismo a un tipo no radican en el fenotipo o morfología externa sino en su genotipo o configuración genética. Esto queda refutado dado que pueden existir diferencias genéticas y morfológicas importantes sin haber especiación (polimorfismo), como puede existir especiación sin diversidad morfológica (especies gemelas) (véase Mayr 1968: 29-179 y Futuyma 1998: 447-479). Dado este contexto científico LaPorte rechaza las pretensiones de formular un concepto de especie sólo sobre la base de los rasgos de la estructura externa o interna de los organismos. No hay posibilidad aquí de construir sobre esta base empírica un concepto científico de especie biológica. La alternativa inicial sería entonces el concepto biológico de especie pero, como hemos visto, este concepto no permite construir una definición esencial de especie. El concepto biológico de especie abandona ciertamente los presupuestos esencialistas del concepto tipológico. Los mecanismos de aislamiento reproductivo son claramente contingentes y con ello los procesos de especiación también lo deben ser. Pues si las especies surgen unas de otras como lo predice la teoría evolutiva, y esto se debe básicamente al aislamiento reproductivo que finalmente impone una historia genética divergente entonces evidentemente la evolución es un fenómeno contingente. Pero ¿qué ocurre entonces con las relativamente recientes propuestas esencialistas que tienen entre sus ejemplos paradigmáticos
200
de géneros naturales a las especies biológicas? ¿Es posible encontrar respaldo en la teoría empírica para la construcción de un concepto esencialista de especie como lo pretenden Kripke y Putnam? De acuerdo a LaPorte si modificamos nuestra concepción acerca de la esencia en las especies es posible encontrar un respaldo empírico para las tesis de Kripke y Putnam. Como veremos LaPorte obtiene esta concepción de una interpretación esencialista de la sistemática filogenética.
3. UNA INTERPRETACIÓN ESENCIALISTA DEL CLADISMO O SISTEMÁTICA FILOGENÉTICA. El paradigma de una nueva concepción para la clasificación biológica en términos de relaciones genealógicas fue establecido por el entomólogo alemán Willi Hennig, quien formuló los conceptos y la metodología de la sistemática filogenética, hoy conocida como análisis cladístico o simplemente cladismo —en consideración de la estructura ramificada y jerarquizada de las representaciones genealógicas—, o cladogramas, mediante las cuales se pretende discernir las distintas categorías que hay en la diversidad de la vida. De acuerdo a la sistemática filogenética los conceptos y categorías para el análisis taxonómico deben surgir inicialmente del conocimiento que alcancemos de las relaciones entre los elementos que son epistemológicamente primarios para el taxónomo. De acuerdo a Hennig, aquello con que nos encontramos en el mundo vivo como materia primaria para la conceptualización no son los organismos o individuos sino los estados de un organismo. Es decir, aquello que es primario es la experiencia que tenemos de un organismo tal como se nos aparece en un determinado momento o "tal como se observa durante un lapso infinitamente pequeño de su vida" (Hennig 1968: 8). Este será el elemento constitutivo de toda la sistemática biológica y es lo que Hennig denomina el semaforonte o portador de caracteres. Considérese, por ejemplo, cómo es que llegamos a determinar que los distintos estados de un proceso de metamorfosis son estados de un solo ciclo individual. En los casos no familiares esto no es evidente y se necesita un gran esfuerzo de investigación empírica para
201
determinar que los distintos estados metamórficos que presentan una sorprendente diversidad morfológica son estados de un mismo individuo. De acuerdo a Hennig, no existe ningún indicio morfológico que permita por sí mismo determinar que distintos semaforontes son estados metamórficos de un mismo individuo. Es por ello que las relaciones de semejanza no cumplen ninguna función científica aquí. Esencialmente lo mismo ocurre respecto del desarrollo de organismos que no están sometidos a metamorfosis, aquí la variabilidad morfológica puede no tener el dramatismo que tiene en el caso anterior pero a veces es necesaria una investigación empírica sistemática para determinar que dos estados de un individuo en dos momentos de su desarrollo ontogenético son justamente dos estados de un individuo y no dos ejemplares de dos especies distintas. Si la unidad epistemológica de la sistemática filogenética son los estados de individuos o semaforontes, la unidad metafísica la constituye los individuos y sus relaciones de parentesco que Hennig llama «relaciones tocogenéticas» y que corresponden a las relaciones reproductivas entre los individuos. El conjunto de todas las relaciones tocogenéticas define a una especie, de ahí que las nuevas especies surjan cuando aparece una barrera en las relaciones reproductivas. Aquí, como en el caso del metamorfismo, la morfología común o relación de semejanza tampoco constituye un indicio que por sí mismo permita establecer relaciones tocogenéticas. Las relaciones que se establecen entre las especies son las relaciones filogenéticas y la sistemática tiene como objetivo descubrir estas relaciones para establecer clases o géneros naturales. Hennig toma una posición explícitamente realista, asume que las categorías de la sistemática existen por sí mismas independientemente de la teoría, aunque desde el punto de vista epistemológico nunca podremos tener certeza acerca de si las categorías que muestran los árboles filogenéticos representan la estructura real de estas relaciones. Esto se debe básicamente a la diversidad y complejidad de la vida y a que el tiempo en que ocurren las relaciones filogenéticas es enorme en comparación con el tiempo en que ocurren las relaciones ontogenéticas y tocogenéticas. En principio, podríamos tener percepción de estas
202
últimas relaciones, algo que está excluido respecto de las relaciones filogenéticas. El criterio básico para establecer un género natural y no una construcción meramente teórica es que las agrupaciones biológicas o taxa que se establezcan reflejen estrictamente el principio genealógico. Si una especie es una comunidad reproductiva, el único criterio de individuación del que se dispone para determinar que dos individuos pertenecen a especies diferentes es la existencia de procesos bifurcantes, es decir, de procesos que produzcan la separación de una comunidad reproductiva en dos comunidades descendientes aisladas reproductivamente entre sí. No hay criterios morfológicos de identificación. Una comunidad reproductiva puede en el tiempo haber sufrido cambios importantes producto del proceso evolutivo pero ello no la convierte en una nueva especie. Así como los distintos estados metamórficos de un ciclo individual son estados de una y la misma cosa, de igual manera podríamos referirnos a los estados de transformación en el tiempo de una y la misma especie. De ahí que sostenga Hennig que: "La duración temporal de una especie está determinada por dos procesos de bifurcación de especies: el primero es aquel al cual debe su existencia como comunidad reproductiva independiente, y el segundo, es aquel que la divide en dos o más comunidades reproductivas nuevas." (Hennig 1968: 87)
LaPorte ve en este proyecto de la sistemática filogenética, consistente en rechazar los criterios morfológicos para construir las clasificaciones biológicas sólo sobre la base de criterios genealógicos, la base correcta para apoyar una nueva forma de esencialismo respecto de las especies. Desde el punto de vista de la interpretación esencialista que hace LaPorte de la sistemática filogenética, un organismo no pertenece esencial o necesariamente a su especie, pero la especie a la que de hecho pertenece sí pertenece necesariamente a cualquier taxón superior que esté relacionado genealógicamente con ella. Por ejemplo, un individuo cualquiera de tigre pertenece sólo contigentemente a la especie Panthera tigris pero no por ello esta especie carece de una esencia. La esencia queda determinada por su linaje: "Panthera tigris =df. el linaje que desciende de la po
203
blación P y que termina en especiación o en extinción" (LaPorte 2004: 61). La esencia es histórica, radica en el linaje o historia biológica de los taxa. La clasificación tradicional no cladista en la que parecen estar pensando tanto Kripke como Putnam, según LaPorte, se funda básicamente en el criterio de los cruzamientos reproductivos entre individuos y en las taxonomías tradicionales que incluyen criterios morfológicos para distinguir los taxa. Sin embargo, tanto el aislamiento reproductivo como las adaptaciones que explicarían las diferencias morfológicas se deben a causas contingentes. En cambio los taxa inferiores pertenecen esencialmente a los taxa superiores correspondientes. Un individuo de tigre no pertenece bajo esta interpretación esencialmente a la especie de los tigres aunque esta especie sí pertenece esencialmente a la clase de los mamíferos. Dado que los eventos de especiación son contingentes, hay mundos posibles en donde un individuo de tigre no pertenece a la especie a la que de hecho pertenece. Pero si un ejemplar pertenece a la especie Panthera tigris, por ejemplo, entonces no existe ningún mundo posible en donde este individuo tenga un linaje distinto al que posee Panthera tigris: "No hay un mundo en el cual todo aquello que pertenezca a Panthera tigris no pertenezca a este linaje, y no hay un mundo en el cual todo aquello que no pertenezca a Panthera tigris pertenezca a este linaje. Ciertamente, algunos miembros de Panthera tigris no son miembros de Panthera tigris en todo mundo posible en el cual existen estos miembros, no pertenecen al linaje pertinente en todo mundo posible en el cual existen. No obstante, estos miembros pertenecen al linaje pertinente exactamente en aquellos mundos en los cuales les ocurre ser miembros de Panthera tigris." (LaPorte 2004: 61-62)
El linaje, agrega LaPorte, es la esencia de una especie. Y para el tigre es parte de su linaje ser mamífero. Panthera tigris pertenece esencialmente a la clase de los mamíferos. De este modo queda definida una esencia histórica para las especies en oposición a una supuestamente errónea concepción no histórica tanto de Kripke como de Putnam. LaPorte insiste, como se ha visto, que estos filósofos apoyan una concepción no histórica de la esencia que es inconsistente con lo que sabemos empíricamente acerca de ellas. Una afirmación semejante se encuentra en Ereshefsky y Matthen 2005: 16. En lo
204
que sigue argumentaré, sin embargo, que esta interpretación no puede ser correcta en el caso de Kripke y que puede mostrarse, inicialmente, que éste concordaría con la afirmación según la cual las especies tienen esencias históricas en el sentido de ‘esencia’ que surge de una interpretación esencialista de la sistemática filogenética.
4. KRIPKE Y LA ESENCIA HISTÓRICA DE LAS ESPECIES. Como se ha adelantado, LaPorte sostiene que Kripke tiene una errónea concepción de la naturaleza la esencia de los taxa que ha sido motivada por concepciones equivocadas acerca de la manera como los biólogos construyen las agrupaciones biológicas. De acuerdo a LaPorte: "[...] la explicación popularizada por Kripke y Putnam está un poco desinformada biológicamente y esto la hace vulnerable a rechazos anticipados. [...] Kripke y Putnam erróneamente suponen que la estructura cromosómica ( [...] Putnam 1975: 240) o alguna "estructura interna" (Kripke 1980: 120-121) es lo que une los miembros de un tipo biológico, una especie, por ejemplo, en un tipo común. En general, como ya he enfatizado, los biólogos no delimitan las especies y los otros taxa sobre la base de propiedades intrínsecas tales como estas. Los biólogos generalmente ubican los organismos dentro de los taxa sobre la base de ancestros compartidos." (LaPorte 2004: 64)
En oposición a lo que aquí sostiene LaPorte, se mostrará que para Kripke pertenecer a una clase natural biológica no es tener una esencia que podamos descubrir en el individuo prescindiendo de su historia biológica. Hay señales que muestran que el criterio, por ejemplo, de cruzamiento reproductivo es, para Kripke, un criterio contingente que sólo sirve de indicio para determinar si dos individuos semejantes pertenecen a la misma clase natural. Algo similar a como las cualidades de color y maleabilidad pueden ser indicios para la identificación de un elemento como siendo oro, por ejemplo. Aunque es claro que estas evidencias no son criterios inequívocos en la medida que el oro podría tener estas propiedades sólo contingentemente, aun así Kripke no negaría que estas propiedades nos conducen usualmente al oro. Lo mismo respecto de las clases biológicas. Usualmente identifica
205
mos una especie por medio de las cualidades superficiales a ella asociadas, aunque podemos concebir, por ejemplo, que un tigre carezca de las cualidades mediante las cuales usualmente identificamos a un tigre. ¿Cuál es la propiedad que hace a un individuo de tigre pertenecer a la especie de los tigres? ¿Cuál es la esencia de un tigre según Kripke? LaPorte supondría aquí que la respuesta de Kripke sería proponer algo que está en el individuo de tigre y que lo hace pertenecer necesariamente a su especie. Como se ha adelantado, estaríamos inclinados a responder que es el código genético el que cumpliría esta función. Pero, como se ha mostrado, la información genética no reúne las condiciones exigidas por el esencialismo. El esencialista entonces necesita identificar un criterio apropiado para la definición de ‘tigre’ en términos de propiedades esenciales o necesarias. La acusación de LaPorte implica que Kripke no identificaría un criterio adecuado y pretendería que la esencia puede ser definida respecto de una especie independientemente de su historia biológica. Pero no hay evidencia que muestre que Kripke estuviera inclinado a seguir esta ruta. Es cierto, como lo señala LaPorte en la cita anterior, que Kripke se refiere a la estructura interna del tigre como un criterio para determinar si un animal con un aspecto superficial semejante al tigre es o no un tigre. Si un animal que parece ser un tigre tiene una estructura interna de un reptil ciertamente no puede ser un tigre. Y esto es verdadero, dice Kripke, del concepto de tigre antes de que se haya investigado su biología, pues aunque no conozcamos la estructura interna de los tigres suponemos que los tigres forman una especie o clase natural (Kripke 1980: 121). Esta es una condición necesaria que debe cumplir un tigre para ser un tigre. Pero, ¿es una condición suficiente? Si así fuera LaPorte estaría correctamente encaminado en su crítica. En lo que sigue presentaré un argumento para sostener que la estructura interna no puede ser una condición suficiente para Kripke y que, por tanto, la acusación de LaPorte no tendría fundamento. Cuando Kripke, en Naming and Necessity, examina el caso del tigre como un género natural sus ejemplos de propiedades necesarias para un tigre son propiedades tales como ser mamífero, ser felino
206
o ser animal. Aunque no profundiza en su examen de los términos de especies, y esto es una desventaja para decidir de manera directa esta disputa, es posible inferir cuál sería su punto de vista al respecto en el contexto de la discusión propuesta por LaPorte. Es así como quisiera argumentar indirectamente, tratando de derivar la misma tesis de LaPorte acerca de la esencia de las especies biológicas a partir de dos tesis que son explícitas en Kripke. La primera de ellas es una tesis acerca del significado de los términos de géneros naturales. La llamaré tesis de la conexión histórica. La segunda, es una tesis metafísica acerca de la naturaleza posible de objetos cualitativamente idénticos. La llamaré tesis de la contraparte cualitativamente idéntica. De acuerdo a la primera tesis sólo la conexión histórica entre una muestra de una especie animal y el término general que la nombra es capaz de fijar su referencia y, por tanto, dentro de esta concepción, dar el significado del término general. El concepto de especie no expresa una propiedad o un conjunto de ellas, aunque la ciencia puede descubrir empíricamente propiedades necesarias de las especies animales (Cf. Kripke 1980: 128). De acuerdo a la segunda tesis, es lógicamente posible para alguien estar, dada la evidencia disponible para esa persona, en una situación epistémica cualitativamente idéntica a aquella que causaría una instancia de una verdad necesaria a posteriori, apareciendo en esta situación como contingente esa verdad a posteriori. Por ejemplo, podríamos concebir que alguien podría haber percibido las mismas propiedades que originalmente se sabía que poseía el oro bajo el supuesto que en esta situación el oro fuera un compuesto y no un elemento. Esta, afirma Kripke, no sería una situación en donde el oro no fuera un elemento, sino una situación en donde un compuesto pudo haber tenido las mismas cualidades que el elemento oro bajo la evidencia empírica disponible acerca del oro para esa persona (Kripke 1980: 142). Ahora bien, bajo estos mismos supuestos, es lógicamente posible encontrar, dada la evidencia disponible, un animal que no sea un tigre (que no pertenezca a la especie Panthera tigris) pero que sea cualitativamente idéntico a los tigres tanto en sus rasgos externos
207
como en su constitución biológica interna. Esta identidad cualitativa podría ciertamente incluir diferencias, como las que hay entre las subespecies o razas, que carecen de valor clasificatorio para el taxónomo que busca distinguir entre distintos taxa. ¿Es una confusión pretender que pudieran haber dos animales con idéntica estructura externa e interna que no pertenecieran a la misma especie? Recordemos que la identidad cualitativa de la que habla Kripke es relativa a la evidencia empírica disponible y no implica, por tanto, identidad entre objetos. De ahí que podríamos concebir un mundo posible en donde exista ese animal que comparte la estructura externa e interna del tigre que conocemos y no sea un tigre. La pregunta entonces es cómo en principio podríamos llegar a determinar nosotros, bajo la hipótesis de que tenemos otra evidencia empírica, que este animal no es de la especie tigre. Pues si lo que supiéramos hasta ahora acerca de los tigres estuviera relegado sólo a sus rasgos superficiales paradigmáticos y al conocimiento de su estructura interna no tendríamos criterios para distinguir. ¿Qué haría la diferencia? La haría, ciertamente, el origen de ese animal, su historia biológica, el linaje al que pertenece. Y aquí convergemos naturalmente a la sistemática filogenética y a la propuesta de LaPorte según la cual la esencia de una especie queda definida por el linaje del que desciende. La esencia de la especie no radica aquí en el individuo sino en su historia biológica. Esta historia es la que le pertenece esencialmente y es la que hace de él ese tipo de animal. Aunque un individuo que pertenece a un género natural podría no haber pertenecido a ese género es imposible que hubiera tenido un origen biológico distinto del que efectivamente tiene si pertenece de hecho a este género natural. ¿Si encontráramos, en un lejano planeta, animales que producto de improbables convergencias evolutivas sumaran tal cantidad de analogías para tener identidad cualitativa, tanto interna como externa, con nuestros tigres, los incluiríamos como parte de nuestras especies de tigres? Evidentemente no, pues descubriríamos pronto que todos sus rasgos comunes con nuestros tigres serían justamente analogías que no permitirían emparentarlos con ellos. Serían como las alas de los insectos, de los murciégalos y de las aves que a pesar
208
de ser rasgos adaptativos análogos no son en un sentido técnico homólogos. Es decir, no son rasgos que nos remitan a un ancestro común pues surgieron independientemente y, por tanto, a pesar de las similitudes de las estructuras no ingresamos por estos rasgos ni a los insectos alados, ni a los murciélagos ni a las aves en un grupo común. De acuerdo a la tesis de la conexión histórica es claro que el significado de la palabra ‘tigre’ para la contraparte cualitativamente idéntica no es el mismo que para el del tigre originalmente reconocido como tal. Aunque usemos la palabra ‘tigre’ para referirnos a la contraparte cualitativamente idéntica esta contraparte no tiene ninguna conexión histórica con nuestras muestras de tigre, ambas están asociadas a distintas historias biológicas. Habría que admitir, si seguimos a Kripke, que los significados de ambas palabras son distintos. Y con esto que LaPorte no puede estar en lo correcto cuando atribuye a Kripke una concepción a-histórica de la esencia. En este caso los significados de las palabras están dependiendo de la naturaleza de las distintas historias biológicas aunque no sepamos nada de esa historia.
REFERENCIAS Dupré, John, (1981): "Natural Kinds and Biological Taxa", The Philosophical Review, XC, N° 1 (January), pp. 66-90. Ereshefsky, Marc, (2001): The Poverty of the Linnaean Hierarchy: A Philosophical Study of Biological Taxonomy. Cambridge: Cambridge University Press. Ereshefsky, Marc y Matthen, Mohan (2005): "Taxonomy, Polymorphism, and History: An Introduction to Population Structure Theory", Philosophy of Science 72 January, pp. 1-21. Futuyma, Douglas (1998): Evolutionary Biology. Cambridge (Mass.). Sunderland. Hennig, Willi (1968): Elementos para una sistemática filogenética. Buenos Aires: Eudeba.
209
Kripke, Saul (1980): Naming and Necessity. Oxford: Blackwell. Laporte, Joseph (2004): Natural Kinds and Conceptual Change. Cambridge: Cambridge University Press. Mayr, Ernst (1968): Especies animales y evolución. Santiago de Chile / Barcelona: Universidad de Chile y Ariel. Mayr, Ernst (1985): "Darwin and the Definition of Phylogeny", Systematic Zoology, Vol. 34, N° 1 (Mar., 1985), pp. 9799. Okasha, Samir, (2002), "Darwinian Metaphysics: Species and The Question of Essentialism", Synthese 131: 191-213. Putnam, Hilary (1975): "The meaning of ‘meaning’", en Mind, Language and Reality. Philosophical Papers. Vol. 2. Cambridge: Cambridge University Press, pp. 215-271. Putnam, Hilary (1997): La herencia del pragmatismo. Barcelona: Paidós. Quine, Willard V. O. (1977): "Three Grades of Modal Involvement", en Quine, W. V. O.: Ways of Paradox and other Essays. Cambridge (Mass.): Harvard University Press, pp. 158184. Julio Torres Meléndez Universidad de Concepción - Chile jutorres@udec.cl
ALGUNOS CONCEPTOS PARA LA ENSEÑANZA DE LA LÓGICA
Rodolfo Ertola y Adriana Galli
213
ALGUNOS CONCEPTOS PARA LA ENSEÑANZA DE LA LÓGICA
Rodolfo Ertola y Adriana Galli Resumen En esta presentación divulgamos algunos conceptos que pueden ser útiles para una mejor enseñanza básica de la Lógica. Se trata de los conceptos de extensión conservadora, univocidad y conectivo nuevo. En primer lugar desarrollamos una lógica sencilla, la lógica de las letras proposicionales, es decir, una lógica sin conectivos. Luego presentamos la lógica de la conjunción, que resulta ser una extensión conservadora de la lógica anterior. Demostramos que en esta lógica el conectivo conjunción es unívoco y nuevo. Abstract In this paper we develop some concepts that may be useful for a better introduction to Logic. It is the case of the concepts of conservative extension, univocity and new connective. We firstly develop a very simple logic, the logic of propositional letters, that is, a logic without connectives. Afterwards, we develop the logic of conjunction, which is a conservative extension of the previous logic. We show that in this logic the conjunction connective is univocous and new.
214
1. INTRODUCCIÓN Este es un artículo de divulgación de ciertos conceptos que pueden ser útiles en la enseñanza básica de la Lógica. Se trata, desde ya, de conceptos conocidos por los lógicos pero que no suelen aparecer en cursos elementales, a saber, el de extensión conservadora, el concepto de univocidad y el concepto de conectivo nuevo. Los dos primeros conceptos mencionados han aparecido en discusiones sobre filosofía de la lógica (véase Belnap 1962). Estos conceptos también son útiles, por ejemplo, cuando interesan las lógicas noclásicas, e.g. han sido especialmente útiles en trabajos recientes como el de Caicedo y Cignoli (véase Caicedo y Cignoli 2001). Con el fin de poder ver fácilmente la aplicación de los conceptos mencionados, consideramos dos lógicas muy sencillas: la Lógica de las Letras Proposicionales y la Lógica de la Conjunción. Para aquellos interesados en aspectos históricos, indicamos brevemente aquí que el concepto de extensión conservadora se remonta al lógico polaco-norteamericano Emil Post y el concepto de univocidad ya aparece en el artículo de Belnap (1962). El concepto de conectivo nuevo es muy sencillo y lo más prudente parece ser atribuirlo al folklore lógico. La Lógica de las Letras Proposicionales puede encontrarse brevemente en Bostock (cf. Bostock 1997: 7). También aparece en Hacking como «lenguaje pre-lógico», donde se indica como precursor a Wittgenstein (cf. Hacking 1979). Para definir a los conectivos no usaremos axiomas sino reglas. Usaremos las expresiones «Com», «Cor», «Def», «Dem», «Not», «Pro», «pt», «sii» y «Teo» como abreviaturas, respectivamente, de «comentario», «corolario», «definición», «demostración», «notación», «proposición», «para todo», «si y sólo si» y «teorema». Además, usamos el símbolo «∇» y la expresión «QED» para indicar, respectivamente, el fin de una definición o notación y el fin de una demostración. Cuando una demostración es fácil o trivial la omitiremos escribiendo «QED» al final de la linea. Se aconseja a los lectores realizar las demostraciones omitidas en este texto.
215
2. LÓGICAS Comenzamos dejando en claro algunas nociones básicas. Un conectivo es simplemente un símbolo (lo cual no definimos). Usaremos la letra K para hacer referencia a un conjunto de conectivos. Usaremos también un conjunto infinito enumerable de letras proposicionales p1, p2,…pn,…, las cuales también son simplemente símbolos, diferentes de los conectivos. El concepto de fórmula también será el habitual en lógica, a saber, toda letra proposicional es una fórmula; si ϕ1, ϕ2,…, ϕn son fórmulas y k es un conectivo, entonces kϕ1ϕ2…ϕn también es una fórmula; nada más es una fórmula. Usaremos la noción de regla sin definir. Las reglas habituales de los sistemas de deducción natural son buenos ejemplos. Def 1
Una lógica es un par (K, R(K)), donde K es un conjunto de conectivos y R(K) es un conjunto de reglas definidas con fórmulas que sólo usan los conectivos de K. Usaremos la letra L con o sin subíndices para hacer referencia a una lógica. Usaremos la notación F(L) para referirnos al conjunto de fórmulas que se pueden formar con los conectivos de L. Usaremos las letras griegas minúsculas ϕ, ψ y χ para referirnos a fórmulas cualesquiera y las letras griegas mayúsculas Γ y Δ para conjuntos de fórmulas. ∇
Def 2
Sean L1 = (K1, R(K1 )) y L2 = (K2, R(K2 )) lógicas. Se dice que L2 es una extensión de L1 sii (i) K1 ⊆ K2 ; (ii) R(K1) ⊆ R(K2). ∇
Def 3
Sea L = (K, R(K)) una lógica y k un conectivo (no necesariamente perteneciente a K) con un conjunto de reglas R({k}) (en adelante sólo anotaremos R(k). Designaremos con Lk a la lógica que tiene el conjunto
216
de conectivos K ∪ {k} y las reglas R(K) ∪ R(k).
∇
Def 4
Sea L una lógica y sea Γ ∪ {ϕ} ⊆ F(L). Se dice que ϕ es derivable de Γ en la lógica L (notación: Γ⎥⎯ L ϕ ) sii existe una sucesión ψ 1, ψ2, … , ψn de fórmulas, ψi ∈ F(L) tal que ψn = ϕ y tal que para todo i, 1≤ i ≤ n, o bien ψi ∈ Γ o bien ψi viene de fórmulas anteriores de la sucesión por alguna regla de L. ∇
Not 1
⎥⎯ L es la relación binaria en P(F(L)) × F(L) tal que (Γ, ϕ ) ∈⎥⎯ L sii Γ⎥⎯ L ϕ, donde P designa la formación del conjunto de partes de un conjunto. ∇
Pro 1
⎥⎯ L es «reflexiva», esto es, si ϕ ∈ Γ , entonces Γ⎥⎯ L ϕ. QED
Pro 2
⎥⎯ L es «transitiva», esto es, si Γ⎥⎯ L ϕ y Δ , ϕ⎥⎯ L ψ, entonces Γ, Δ ⎥⎯ L ψ. QED
Def 5
Sea L una lógica y sean ϕ, ψ ∈ F(L). Se dice que ϕ y ψ son mutuamente derivables en L (notación: ϕ ⎯⎢ L⎥⎯ ψ ) sii {ϕ}⎥⎯ L ψ y {ψ}⎥⎯ L ϕ. ∇
Not 2
Sea L una lógica. Se designa con ⎯⎢L⎥⎯ a la relación en F(L) × F(L) dada por ( ϕ , ψ ) ∈ ⎯⎢ L ⎥⎯ sii ϕ ⎯⎢L⎥⎯ ψ. ∇
Pro 3
La relación ⎯⎢L⎥⎯ es de equivalencia (esto es, es reflexiva, simétrica y transitiva). QED
Def 6
Sea L = (K, R(K)) una lógica y k ∈ K con aridad n. Se dice que k es congruencial en L sii pt ϕi ,ψi ∈ F(L) (1
217
≤ i ≤ n) ocurre que si pt i, 1 ≤ i ≤ n, ϕi ⎯⎢L⎥⎯ ψ i, entonces kϕ1 … ϕn ⎯⎢L⎥⎯ kψ1 … ψn. ∇ Not 3
La fórmula [ ψ /ϕ ] χ resulta de χ reemplazando una ocurrencia de ϕ en χ por ψ. En el caso que no haya ninguna ocurrencia de ϕ en χ la operación también está definida y resulta que [ ψ /ϕ ] χ = χ. ∇
Def 7
Sea L una lógica. Se dice que L tiene substitución de equivalentes sii pt ϕ, ψ, χ ∈ F(L), si ϕ ⎯⎢L⎥⎯ ψ, entonces [ ψ / ϕ ] χ ⎯⎢L⎥⎯ χ. ∇
Pro 4
Una lógica L = (K,R(K)) tiene substitución de equivalentes sii pt k ∈ K, k es congruencial en L. QED
Def 8
Sea L = (K,R(K)) una lógica y k ∈ K con aridad n. Se dice que k es unívoco en L sii pt k´ ∉ L con aridad de k´ = aridad de k y reglas R(k´) análogas a las de k, k´p1 … pn⎯⎢Lk´⎥⎯ kp1 … pn. ∇
Def 9
Sea L una lógica y k un conectivo con aridad n y reglas R(k). Se dice que k es nuevo respecto de L sii no existe ϕ ∈ F(L) tal que ϕ ⎯⎢Lk⎥⎯ kp1 … pn. ∇
Def 10
Sean L1 y L2 lógicas. Se dice que L2 es una extensión conservadora de L1 sii (i) L2 es una extensión de L1 ; (ii) pt Γ ∪ {ϕ} ⊆ F(L1), si Γ⎥⎯ L2 ϕ, entonces Γ⎥⎯ L1 ϕ. ∇
218
3. LA LÓGICA DE LAS LETRAS PROPOSICIONALES En esta sección consideramos la lógica PR, que no tiene ningún conectivo ni ninguna regla. Nos interesa poder decidir, dado Γ ∪ {ϕ} ⊆ F(PR), si Γ⎥⎯ PR ϕ. Es fácil ver que Teo 1
Γ⎥⎯ PR ϕ sii ϕ ∈ Γ.
QED
Como la relación ϕ ∈ Γ es decidible si Γ es finito, entonces se puede decidir fácilmente si Γ⎥⎯ PR ϕ usando el Teo 1.
4. LA LÓGICA DE LA CONJUNCIÓN Podemos agregar conectivos a la lógica PR. En esta sección lo hacemos para la conjunción considerando la situación en detalle. Def 11
La lógica CJ tiene como único conectivo al símbolo ∧ con aridad 2, llamado conjunción. Usaremos la notación ϕ ∧ ψ en lugar de ∧ϕψ . Las reglas de CJ son la regla de Introducción de la Conjunción (I∧) dada por ϕ, ψ /ϕ ∧ ψ y las reglas de Eliminación de la Conjunción (E∧) dadas por ϕ ∧ ψ /ϕ y ϕ ∧ ψ /ψ, donde el símbolo / indica que la fórmula a su derecha se sigue de la(s) fórmula(s) a su izquierda. ∇
Com 1
Las reglas que acabamos de dar expresan que la fórmula ϕ ∧ ψ es la más débil de las fórmulas de las cuales se siguen tanto ϕ como ψ. CJ es una extensión de PR. QED
Pro 5
Sea Γ ∪ {ϕ} ⊆ F(PR). Se tiene el siguiente Cor 1
Si Γ⎥⎯ PR ϕ, entonces Γ⎥⎯ CJ ϕ.
QED
219
Pro 6
Sean ϕ, ψ, χ ∈ F(CJ). Entonces, a) (Asociatividad) ϕ ∧ (ψ ∧ χ) ⎯⎢CJ⎥⎯ (ϕ ∧ ψ)∧ χ ; b) (Conmutatividad) ϕ ∧ ψ ⎯⎢CJ⎥⎯ ψ ∧ ϕ ; c) (Idempotencia) ϕ ∧ ϕ ⎯⎢CJ⎥⎯ ϕ . QED
Pro 7
El conectivo ∧ es congruencial en CJ.
Cor 2
QED
CJ tiene substitución de equivalentes. QED
Pro 8 El conectivo ∧ es unívoco en CJ. Dem Usando E∧ se obtienen ϕ y ψ a partir de ϕ ∧ ψ. Luego se usa I∧’ para obtener ϕ ∧’ ψ. La derivación recíproca es análoga. QED A continuación usamos la notaciones LP(ϕ ) y LP(Γ ) para los conjuntos de letras proposicionales de ϕ y Γ, respectivamente. Tenemos el siguiente Teo 2 Dem
Γ⎥⎯ CJ ϕ sii LP ( ϕ ) ⊆ LP ( Γ ). (⇒) Sea ψ1 ψ2… ψn una derivación de ϕ a partir de Γ. Veamos por inducción que toda ψi satisface alguno de los siguientes casos: 1) ψi ∈ Γ ; 2) hay una ψj , j < i tal que ψ j = ψ i ∧ χ o bien ψ j = χ ∧ ψ i ; 3) hay ψj ,ψk, j, k < i tal que ψi = ψj ∧ ψk. En el caso 1) vemos inmediatamente que LP( ψi ) ⊆ LP( Γ ). En el caso 2), obtenemos por la hipótesis inductiva que LP( ψj ) ⊆ LP( Γ ). Pero LP( ψi ) ⊆ LP( ψj ). En el caso 3), se sigue por hipótesis inductiva que LP( ψj ) ⊆ LP( Γ ) y que LP( ψk ) ⊆ LP( Γ ). Entonces se sigue que LP( ψi ) ⊆ LP( Γ ). En particular, se sigue que LP( ψn ) ⊆ LP( Γ ).
220
(⇐) Sean p1, …, pn las finitas letras proposicionales de ϕ . Entonces hay ψ 1, ψ 2, … , ψ n ∈ Γ tales que p i ∈ LP( ψ i ). Podemos construir la derivación ψ1 ψ2 … ψn … p1 p2 …pn … ϕ, donde obtenemos las pi a partir de las ψi usando las reglas de eliminación el número de veces que corresponda. Finalmente obtenemos ϕ a partir de las pi usando la regla de introducción el número de veces que corresponda. QED Como la condición LP( ϕ ) ⊆ LP( Γ ) es decidible si Γ es finito, podemos fácilmente decidir si Γ⎥⎯ CJ ϕ usando el teorema previo. Com 2
Tener en cuenta la expresión «para todo» implícita en LP(ϕ ) ⊆ LP(Γ ). Por lo tanto, en el Teo 2 se presenta la siguiente situación familiar en lógica: la existencia de una derivación es equivalente a una condición universalmente cuantificada.
Def 12
Dados un Γ y una ϕ, en el caso que LP(ϕ ) NO ⊆ LP(Γ ), llamaremos contraletra de ϕ respecto de Γ a cualquier letra proposicional p ∈ ϕ tal que p ∉ LP(Γ ) y diremos que «hay una contraletra de ϕ respecto de Γ ». En el caso que LP(ϕ ) ⊆ LP(Γ ), diremos que «no hay una contraletra de ϕ respecto de Γ ». ∇
Cor 3
Si LP(ϕ ) NO ⊆ LP(Γ ), entonces Γ NO⎥⎯ CJ ϕ.
Cor 4
QED
Dado un Γ y una ϕ, o bien hay una contraletra de ϕ respecto de Γ o bien hay una derivación de ϕ a partir de Γ. QED
221
Com 3
Los corolarios previos considerados conjuntamente dicen que dados un Γ y una ϕ, se cumple exactamente una de las dos siguientes condiciones: a) Γ⎥⎯ CJ ϕ ; b) hay una contraletra de ϕ respecto de Γ . Esta afirmación refleja una situación habitual en Matemática: la búsqueda de una demostración o de un contraejemplo.
A partir del teorema 2 podemos deducir que ∧ es nuevo respecto de PR y que CJ es una extensión conservadora de PR. Tal como se demuestra a continuación. (Conectivo nuevo) No hay ninguna ϕ ∈ F(PR) tal que p1 ∧ p2 ⎯⎢CJ⎥⎯ ϕ. Dem Supongamos que hay una ϕ ∈ F(PR) tal que p1 ∧ p 2 ⎯⎢ CJ⎥⎯ ϕ . Entonces ϕ debe ser una letra proposicional. Podemos considerar tres casos: 1) ϕ es p1; 2) ϕ es p2; 3) ϕ no es ni p1 ni p2. En el caso 1) resulta que p 1 NO ⎥⎯ CJ p 1 ∧ p 2 usando el Cor 3 porque p2 ∉ LP(ϕ ) y por lo tanto una contradicción; en el caso 2) resulta análogamente una contradicción y en el caso 3) resulta análogamente que ϕ NO⎥⎯ CJ p1 ∧ p2 porque p1 ∉ LP(ϕ). QED
Pro 9
Sea Γ ∪ {ϕ} ⊆ F(PR). Entonces tenemos lo recíproco del Cor 1: Pro 10 Dem
(Conservatividad) Si Γ⎥⎯ CJ ϕ, entonces Γ⎥⎯ PR ϕ. Supongamos que Γ⎥⎯ CJ ϕ. Entonces, como Γ ∪ {ϕ} ⊆ F(PR), LP(Γ) = Γ y LP(ϕ) = ϕ . Entonces, usando el Teo 2 se sigue que ϕ ∈ Γ. Luego, usando el Teo 1, se sigue que Γ⎥⎯ PR ϕ. QED
222
5. COMENTARIO FINAL Lo que hemos hecho con la conjunción se puede hacer análogamente con la disyunción, el condicional y la negación. Por supuesto, ello depende siempre de las reglas que les damos a los respectivos conectivos, esto es, si, por ejemplo, omitimos la regla habitual de eliminación de la disyunción, entonces la lógica resultante será una extensión conservadora pero no habrá univocidad y si, por el contrario, agregamos alguna regla adicional a las tradicionales reglas de introducción y eliminación de la disyunción, entonces el conectivo resultante será unívoco, pero la lógica podrá no ser una extensión conservadora. Finalmente agregamos que la negación no es unívoca en la lógica minimal de Johansson, pero sí lo es en la lógica intuicionista, ambos hechos fáciles de demostrar (suponemos a estas lógicas conocidas por el lector).
REFERENCIAS Belnap, Nuel (1962): "Tonk, Plonk and Plink", Analysis, vol. 22, n. 6, pp. 130-134. Bostock, David (1997): Intermediate Logic. Oxford: Clarendon Press. Caicedo, Xavier y Cignoli, Roberto (2001): "An Algebraic Approach to Intuitionistic Connectives", The Journal of Symbolic Logic, vol. 66, n. 4, pp. 409-419. Hacking, Ian (1979): "What is Logic?", The Journal of Philosophy, vol. LXXVI, n. 6, pp. 285-319. Rodolfo Ertola Universidad Nacional de la Plata - Argentina rudolf@huma.fahce.unlp.edu.ar Adriana Galli Universidad Nacional de la Plata - Argentina adriana@mate.unlp.edu.ar
INFERENCIA HETEROGÉNEA, VISUALIZACIÓN, FLUJO DE INFORMACIÓN
Horacio Faas
225
INFERENCIA HETEROGÉNEA, VISUALIZACIÓN, FLUJO DE INFORMACIÓN
Horacio Faas Resumen La existencia de programas de computación que producen y controlan inferencias entre una representación lingüística y otra diagramática revela cómo en las representaciones diagramáticas juega un rol fundamental la visualización, aceptada en matemáticas en general como ayuda para las demostraciones, pero no como integrante genuino de ellas. La visualización en matemáticas, sin embargo, se ha venido rescatando en las últimas décadas. Como cualquier deducción lógica, la inferencia heterogénea pretende validez lógica; si se estableciera, podrían explicarse algunas desviaciones lógicas ocurridas en conjeturas matemáticas en las que se ha apelado a intuiciones equivocadas. Puede conjeturarse que la validez lógica se apoya en el flujo que recorre la información. Empleamos aquí una noción de consecuencia lógica como extracción de información y la aplicamos a la inferencia heterogénea para referirnos a algunos de los así llamados monstruos matemáticos, a la comparación de diferentes sistemas de representación para considerar sus potencialidades y a las posibles influencias de estos nuevos enfoques en posiciones vinculadas con escuelas tradicionales de filosofía de la matemática.
226
Abstract The existence of softwares which produce and control inferences between linguistic and diagrammatic representations reveals the importance of visualization in the latter ones. Visualization has long been accepted in mathematics as an additional assistance in proofs, but not as a legitimate part of them. Nevertheless, it has become to be redeemed during the last decades. Heterogeneous inference claims logical validity, just as any logical inference; should it be established, some logical deflections in mathematical conjectures in which intuition is involved may be explained. It is claimed that logical validity is supported by information flow. We understand here logical consequence as information extraction, and we apply this notion to heterogeneous reasoning in order to study some of the so-called mathematical monsters. We also employ it in the comparison of different representation systems so as to evaluate their potential. Finally, we consider the influence of these new perspectives in some of the traditional positions in philosophy of mathematics.
La validez de las inferencias ha constituido el tema principal de la lógica desde hace ya mucho tiempo, y la aparición de nuevos sistemas intenta adecuarse a ello. La inferencia heterogénea pretende esa validez y, de lograrlo, podría explicar algunas desviaciones lógicas ocurridas en conjeturas matemáticas en las que se ha apelado a intuiciones equivocadas. Como se sabe, la inferencia heterogénea vincula lógicamente sistemas de representación distintos y existen programas de computación como Hyperproof, que producen y controlan inferencias entre una representación diagramática y otra lingüística. Por otra parte, en las representaciones diagramáticas juega un rol fundamental la visualización, aceptada en matemáticas en general como ayuda para las demostraciones, pero no como integrante genuino de ellas. Sin embargo, la visualización en matemáticas se ha venido rescatando desde la década de los ’80 en el siglo XX apoyada por tres vertientes algo asimétricas en sus resultados: por un lado, el
227
manejo de imágenes por computadora, con logros quizás no alcanzables sin ellas, por otro lado, la cuestión del papel de las imágenes en ciencias cognitivas y en neurociencias, y finalmente la rigorización de la inferencia diagramática, con avances más modestos. Se podría conjeturar que en todos esos casos hay una inferencia justificada cuando se explicita información de algún modo preexistente, es decir, la validez lógica se apoya en el flujo que recorre la información. En este trabajo se muestra el uso de la noción de consecuencia lógica como extracción de información, esto es, explicitar información implícita, y se la aplica a la inferencia heterogénea para referirse a los precitados problemas matemáticos (algunos de los así llamados monstruos matemáticos), a la comparación de diferentes sistemas de representación para considerar sus potencialidades y a las posibles influencias de estos nuevos enfoques en posiciones vinculadas con escuelas tradicionales de filosofía de la matemática. La inferencia heterogénea se realiza entre sistemas de representación distintos, por ejemplo, entre un sistema lingüístico y un sistema diagramático, y se ha desarrollado de manera concreta con el programa Hyperproof de Barwise y Etchemendy (véase Barwise y Etchemendy 1994). A continuación se muestra un ejemplo de demostración1 en Hyperproof en el cual se ha pedido que se satisfagan dos objetivos (goals): el primero, que se identifique cuál es el objeto que lleva por nombre a, y el segundo, si una cierta oración del lenguaje de primer orden que dice que hay al menos dos tetraedros grandes es una consecuencia lógica de los datos del problema2. Uno de los datos es todo lo que uno ve en la imagen de la pantalla, esto es, tres cubos, dos tetraedros y dos dodecaedros —todos ellos de tama 1. Este ejemplo ha sido tomado de la pagina web de CSLI (http://wwwcsli.stanford.edu/hp/, visitado el 22/11/06).
2. El programa cuenta con un lenguaje interpretado acerca de un mundo tridimensional con figuras geométricas ubicadas en una grilla; hay símbolos de predicado: Tet (Tetraedro), Cube (Cubo), Dodec (Dodecaedro), Large (Grande),etc.; símbolos de relación: Larger (MásGrande), LeftOf (Izquierda De),etc. y nombres y variables de objetos (a, b, c,… y u, v, w,… respectivamente).
228
ño visible— y un tetraedro en la columna de más a la derecha cuyo tamaño es desconocido (lo cual se indica mediante un cilindro que tiene dibujado un triángulo en la superficie). Los sucesivos pasos de la prueba se indican en los renglones correspondientes mediante una oración de la lógica de primer orden (representación lingüística), o mediante un icono que es un pequeño rombo con cuatro puntos (representación diagramática) y que se refiere a la imagen de arriba cuando está destacado (en la primera figura, el rombo destacado es el del primer renglón y se refiere a la imagen de datos iniciales descripta). Las oraciones que operan como datos dicen que el objeto b es un dodecaedro, que tal objeto b está a la izquierda del objeto a (desde nuestra ubicación), y que el objeto a es grande.
229
Uno intentaría solucionar este problema de la manera siguiente: ya que b es un dodecaedro, ha de ser uno de los dos que hay en la sexta columna, lo cual plantea dos casos como posibles y en ambos el objeto a, que está a la derecha de b, ha de ser el tetraedro de tamaño desconocido. Ya que a es grande, hay por lo menos dos tetraedros grandes. La solución en Hyperproof se corresponde con lo que acabamos de decir, mientras que si hubiéramos traducido todo a lenguaje de primer orden y hubiéramos logrado una demostración puramente en ese lenguaje, habríamos producido una solución de un centenar de renglones. He aquí cómo se produciría la demostración en Hyperproof: Se comienza presentando los dos casos posibles, que corresponden a las asignaciones adecuadas de a y de b. El objeto b puede ser el dodecaedro que está adelante y el objeto a, el tetraedro a su derecha:
230
O el objeto b puede ser el doecaedro de atr谩s:
Hay que mostrar ahora que estos dos casos son exhaustivos con respecto a la informaci贸n dada en la primera oraci贸n:
231
De esto podemos concluir que el objeto a es sin duda el tetraedro de la derecha, con lo cual se satisface el primer objetivo:
Y por consiguiente, ya que se nos ha dicho que a es grande, podemos aplicar (Apply) esta informaci贸n al diagrama:
232
Esto permite observar que hay dos tetraedros grandes, lo que satisface el segundo objetivo:
No hay duda de que una demostración de esos objetivos con sólo lógica de primer orden habría sido mucho más larga, como ya se dijo, si es que se tiene la suerte de encontrarla. En el artículo que constituye el fundamento matemático de la inferencia heterogénea, Barwise y Etchemendy establecen el tipo de álgebra que subyace a la teoría de la inferencia como extracción de información (un álgebra de Heyting), y muestran cómo se elabora un diagrama de flujo de información para un ejemplo concreto, mediante recorridos entre nodos del diagrama que llevan como rótulo los trozos de información (infons) que corresponden a cada nodo (cf. Barwise y Etchemendy 1990: 33-78). Un infon puede ser básico o compuesto. El diagrama de flujo lleva en cada uno de sus nodos una etiqueta en la que figuran los infons explícitos que le corresponden.
233
Como el proceso va extrayendo información implícita, en cada nodo están todos los infons de los nodos precedentes en su correspondiente rama, más algún o algunos nodos adicionales según el caso. Todo el proceso está regido por cinco principios: Datos (Given): Aceptar alguna información como dada. Esta información corresponde a la información presente en los supuestos iniciales de un trozo de razonamiento. Refirámonos a este paso como el «caso abierto» inicial. Suponer (Assume): Dado un caso abierto d, suponer algo extra creando un subcaso abierto de d. Un ejemplo de este principio es suponer el antecedente de un condicional con el propósito de demostrar el consecuente. Este principio también se usa repetidamente en la construcción de un modelo que muestre que algo no se sigue de la información dada. Subsumir (Subsume): Desestimar algún caso abierto si ha sido subsumido por otros casos abiertos. Una instancia importante de este principio surge si toda la información del caso es agotada por sus subcasos. Otro ejemplo surge si la información presente es incoherente (y por consiguiente subsumida por cualquier caso abierto). Confluir (Merge): Tomar la información común a ciertos casos abiertos, y llamarla un nuevo caso abierto. Este principio se aplicaría típicamente cuando uno ha subdividido un caso abierto en subcasos que lo agotan y establecido un resultado deseado en cada uno de ellos. Reconocer como posible (Recognize as Possible): Dado algún caso abierto, reconocerlo como representando una posibilidad genuina si la información presente se da en alguna situación. El uso típico de esta forma de razonamiento se da cuando uno acepta un contraejemplo como muestra de que un resultado no se sigue de la información dada. También se usa cuando uno construye un modelo para mostrar que una información es coherente. La conjetura desafiante que se propone es la siguiente: "Proponemos tentativamente la tesis de que todo razonamiento deductivo válido puede justificarse por una combinación de estos cinco principios. Hay dos manera de leer esta tesis, una débil y otra fuerte.
234 La lectura débil dice que el resultado final de de todo trozo válido de razonamiento deductivo puede justificarse por estos principios. Hay un sentido en el que esto es obviamente verdadero, ya que los principios son semánticos y no sintácticos. Pero esta lectura no es interesante. Queremos plantear la tesis en un sentido mucho más fuerte, ya que nos referimos no sólo a la inferencia deductiva, sino también a la clase de inferencia que involucra la construcción de modelos. Y pretendemos aplicarla paso a paso, no sólo al resultado final. No vemos aún un modo de dar un argumento convincente para esta tesis, de manera que por ahora permanece como una conjetura (claim) empírica. Aun si la tesis resultare falsa, nos parece que una teoría de la inferencia sustentada en un enfoque de información se apoyará en algún conjunto similar de tales principios." (Barwise y Etchemendy 1990: 61)
Como se advierte, hay un paralelo notable entre estos principios y algunas de las reglas de deducción natural: Datos corresponde a las premisas; Suponer, a la introducción de supuestos; Subsumir, a la apertura de supuestos para aplicar la regla de eliminación de la disyunción; Confluir, al reconocimiento de la misma conclusión en cada una de las subdemostraciones abiertas en el Subsumir, y a su ubicación como independiente ya de ellas. En realidad, se han privilegiado las reglas de deducción natural que requieren subdemostraciones. La novedad, sin embargo, radica en que todos estos principios, como se ha dicho, se aplican a cualquier tipo de representación, y su utilización en el programa Hyperproof, por ejemplo, permite inferencia heterogénea entre diagramas y oraciones de la lógica de primer orden. En general, la teoría de la inferencia basada en flujos de información permite independizarse de la forma en que está representada la información, y de tal manera combinar diversas formas. Para el ejemplo que hemos propuesto recién, algunos de los infons presentes en los datos son que hay tres tetraedros (uno de ellos de tamaño desconocido), dos dodecaedros y tres cubos, así como las posiciones relativas de esos objetos entre ellos; todos estos infons son dados por el diagrama. Pero también hay infons dados por las oraciones: que un dodecaedro se llama b y está a la izquierda de a, y que a es grande.
235
El álgebra que se aplicaría a nuestro ejemplo de Hyperproof debería contener todos los predicados de dicho programa dentro del conjunto R de relaciones del álgebra y una función que vaya desde objetos a posiciones en el tablero; un infon básico tendría el siguiente aspecto: < R, a→ ; i >, donde R∈R , a→ es una secuencia de argumentos de la función que corresponde a la aridad de R, e i ∈ {0,1} para indicar con el cero que no se da la relación, y con el uno, que sí. Resulta obvio que en el razonamiento diagramático la visualización ocupa un papel central. Barwise y Etchemendy cuentan acerca de lo que los llevó a crear Hyperproof que ya habían notado que al emplear el programa Turing’s World, los estudiantes elegían la forma de representación diagramática, con diagramas de flujo, en lugar de la forma de instrucciones con letras (que podría llamarse sentencial) que indican estado inicial, información existente, acción, y estado final.3 Opino que quienes hayan trabajado con máquinas de Turing coincidirán con esa apreciación. Los rulos en los programas son absolutamente evidentes en la representación diagramática. A su vez, esos rulos indican recursión, lo que invita a usar una inducción en una demostración. Pero, además, en varios problemas de los ejercicios de Tarski´s World, los razonamientos parecen proceder de lo visual a lo sentencial y viceversa.4 Cuando se trabaja en Hyperproof, la propuesta de una demostración por casos no depende exclusivamente de una disyunción explícita, a diferencia de las demostraciones en sistemas de deducción natural, sino de enunciados a veces atómicos, a veces negados, a veces cuantificados. Me parece que estas consideraciones muestran que la
Turing’s World es un programa en el cual es posible representar máquinas de Turing. Cuenta con una cinta, instrucciones (moverse a la derecha o a la izquierda, escribir o leer), y diagramas de representación de estados de la máquina. 3
Tarski’s World es un programa de apoyo para la enseñanza del lenguaje simbólico de la lógica de primer orden. En él pueden representarse mundos tridimensionales que contienen objetos geométricos de distinto tamaño y forma, y puede evaluarse la verdad de sentencias respecto de tales mundos. 4
236
inferencia realizada es heterogénea. Además, en la resolución de problemas es muy conveniente apelar a un razonamiento heterogéneo, ya que en muchos casos frente a un problema complejo han de intervenir diversas disciplinas con sus peculiaridades. En general, hay tres heterogeneidades en la resolución de problemas: de representación, de procedimientos racionales, y de objetivos. Todo esto se ha podido ver en el ejemplo que puse de Hyperproof: la heterogeneidad de la representación por diagramas y oraciones; la de procedimientos, ya que a las reglas de deducción natural se agregan las que vinculan ambos sistemas de representación, y la de objetivos, ya que no se trata solamente de buscar la demostración de una única fórmula, como tradicionalmente se hacía en lógica. Como se ha dicho, en la inferencia heterogénea juega un papel fundamental la visualización, pero las prevenciones con respecto a su utilización no dejan de estar justificadas. Por ejemplo, la utilización de círculos de Euler para representar cuatro conjuntos de modo tal que las intersecciones de ellos tomados de a tres no sean vacías, lleva a la conclusión equivocada de que la intersección de los cuatro ha de ser no vacía, lo cual es falso, como se sabe por el teorema de Helly. Es decir, si se asume que
A∩B∩C ≠ ∅ B∩C∩D ≠ ∅ C∩D∩A ≠ ∅ y se representa esta situación mediante círculos de Euler, uno visualiza que la intersección de los cuatro no es vacía: A∩B∩C∩D ≠ ∅.
237
Esto se representa como sigue:
Pero es muy fácil mostrar mediante un ejemplo que eso no es general. Tomemos A = {1, 2, 3, 4}, B = {2, 3, 5}, C = {3, 4, 5, 6}, y D = {4, 5, 6}, entonces A∩B∩C = {3} ≠ ∅ B∩C∩D = {5} ≠ ∅ C∩D∩A = {4} ≠ ∅, pero
A∩B∩C∩D = ∅
Lo que aquí ha ocurrido es que la información dada por las premisas no autoriza que se explicite la información de la conclusión equivocada. En términos de la semántica de situaciones uno diría que la conclusión no es una extensión de la situación en que se expresan las premisas,5 y en términos del flujo de información uno diría que el nodo correspondiente a la conclusión no está justificado por los infons presentes en los nodos precedentes. El error de la conclusión se origina en que los círculos utilizados son figuras convexas, y no se había dicho para nada que A, B, C y D fueran conjuntos convexos; la
5. Un completo desarrollo de la semántica situacional puede encontrarse en Barwise y Perry 1983.
238
representación estaba equivocada porque agregaba información. El rigor con que actualmente se enfocan algunos sistemas diagramáticos los hace confiables, y en tal caso la visualización puede jugar un papel en el que se evitan los posibles errores. Indicábamos anteriormente que hay tres motivos principales para que se considere importante regresar a alguna forma de visualización: por un lado, el manejo de imágenes por computadora, con logros quizás no alcanzables sin ellas, por otro lado la cuestión del papel de las imágenes en ciencias cognitivas y en neurociencias, y finalmente la rigorización de la inferencia diagramática, con avances más modestos. Lo que acabamos de tratar apunta a la tercera razón que señalábamos como justificativo del rescate de la visualización. Con respecto a la primera, puede señalarse que el manejo de imágenes por computadora ha mostrado que ciertas cuestiones no podrían establecerse por otros medios (por ejemplo, la inclusión de conjuntos de Julia en el de Mandelbröt); y por lo que concierne a la segunda, cada vez se avanza más en el estudio del papel de las imágenes en la construcción del conocimiento en las ciencias cognitivas. Como se sabe, la intuición ha sido severamente cuestionada como generadora de errores en matemáticas. En referencia a ella y a su papel en las matemáticas, y ante la contundencia del ataque por parte de Hahn en su famoso artículo en su contra (cf. Hahn 1994), Reuben Hersh escribe: "Sin embargo, si uno no está haciendo matemáticas, sino observando cómo lo hace otra gente y tratando de entender lo que hace, se hace inevitable reconocer la intervención de la intuición. Sostengo que: 1) Todos los puntos de vista filosóficos estándar descansan en alguna noción de intuición. 2) Ninguno de ellos explica la naturaleza de la intuición que postula. 3) La consideración de la intuición como realmente experimentada lleva a una noción difícil y compleja, pero no inexplicable. 4) Un análisis realista de la intuición matemática debería ser un objetivo central de la filosofía de la matemática." (Hersh 1997: 62)
239
La referencia a puntos de vista filosóficos estándar indicados en el punto 1 apunta a constructivismo, platonismo y formalismo. Como se sabe, en el segundo caso se requiere alguna manera de aprehender entidades matemáticas subsistentes (¿una forma de intuición?); en el tercer caso, resulta difícil justificar cómo fue tan exitoso el crecimiento de las matemáticas antes del nacimiento del programa de Hilbert, es decir, se habían alcanzado verdades matemáticas con métodos incorrectos (¿la intuición, otra vez?). Con respecto al primer caso, su nombre más común —intuicionismo— huelga cualquier comentario. Como mostró Hilbert, los Elementos de Euclides tenían defectos formales, ya que faltaban algunos postulados. Uno podría preguntarse por qué no se equivocó con los teoremas; y una respuesta posible es que sus intuiciones eran correctas, en el sentido de que la información que se extraía estaba ya implícita en las premisas. Por el contrario, en el caso de los «monstruos matemáticos» se producen nuevos infons ausentes —aun implícitamente— en los pasos precedentes del flujo de información; me estoy refiriendo a los conocidos casos de las curvas de Weierstrass y de Peano (cf. Faas 2005: 13-14). Con ellos ocurriría algo similar a lo que hemos mostrado en teoría de conjuntos y su representación con círculos de Euler. La conclusión no se hace explícita a través de la información implícita en las premisas. Pienso que el razonamiento heterogéneo está presente en la tarea cotidiana de los matemáticos —y de otra gente también— y que ello es inevitable, de modo que es muy conveniente fortalecer su tratamiento riguroso. Me parece que la tarea de los lógicos puede cambiar en el futuro inmediato, de acuerdo con lo propuesto por Barwise y Etchemendy: "El dominio propio de la lógica es el estudio de las formas válidas de extracción de información, sin que importe de qué manera está representada esa información. Tradicionalmente, los lógicos se han focalizado en una porción estrecha, aunque importante, de ese dominio. En el futuro la lógica debe ocuparse decididamente de cómo usa la gente una multitud de representaciones de manera rigurosa. Ello nos forzará a extender y enriquecer las nociones tradicionales de
240 sintaxis, semántica, consecuencia y demostración lógicas, de forma tal que se admitan estas nuevas formas de representación. En tal proceso, lo que parecía una exitosa historia acabada en los análisis filosófico y matemático se rediseñará en excitantes nuevas maneras." (Barwise y Etchemendy 1996: 20)
REFERENCIAS Barwise, Jon y Etchemendy, John (1990): «Information, Infons, and Inference», en Cooper, R.; Mukai, K. y Perry, J. (eds.): Situation Theory and its Appplications, vol. I, 22. Stanford: CSLI Publications, pp. 33-78. Barwise, Jon y Etchemendy, John (1994): Hyperproof. Stanford: CSLI Publications. Barwise, Jon y Etchemendy, John (1996): «Computers, Visualization and the Nature of Reasoning», en www-csli.stanford.edu/ hp/CVandNR.pdf, visitado el 22/11/06. Barwise, Jon y Perry, John (1983): Situations and attitudes. Cambridge: MIT Press. Faas, Horacio (2005): «Implicación visual y heterogénea», en Faas, H. y Urtubey, L. (eds.): Temas de Razonamiento Aproximado e Inferencia Heterogénea. Córdoba: CIFFyH, Universidad Nacional de Córdoba, pp 11-23. Hahn, Hans (1994): «La crisis de la intuición», en Newman, J. (ed.): SIGMA - El Mundo de las matemáticas. Barcelona: Grijalbo. Hersh, Reuben (1997): What is Mathematics, Really? New York: Oxford University Press.
Horacio Faas Universidad Nacional de Córdoba - Argentina horaciofaas@gmail.com
INDECIBILIDAD, INCOMPLETITUD E INTEGRABILIDAD DE ECUACIONES DIFERENCIALES Enrique G. Reyes
243
INDECIBILIDAD, INCOMPLETITUD E INTEGRABILIDAD DE ECUACIONES DIFERENCIALES1 Enrique G. Reyes Resumen En la ultima década del siglo XX, N.C.A. da Costa y F.A. Doria estudiaron indecibilidad e incompletitud en matemáticas y física teórica. Su trabajo está basado en un resultado clásico de D. Richardson sobre sentencias indecidibles en análisis y también en la teoría de predicados de Suppes introducida por P. Suppes y desarrollada por Newton da Costa y Rolando Chuaqui. En este artículo revisamos la teoría de integrabilidad de ecuaciones diferenciales parciales, presentamos algunos aspectos de la teoría de da Costa y Doria y bosquejamos su aplicación al problema de integrabilidad. Abstract During the last decade of the 20th century N.C.A. da Costa y F.A. Doria studied undecidability and incompleteness in mathematics and theoretical physics. Their work is based on a 1. Artículo escrito con el apoyo del Fondo Nacional de Desarrollo Científico y Tecnológico (FONDECYT) Proyecto # 1040255.
244
classical result of D. Richardson about undecidable sentences in analysis and also on the theory of Suppes predicates introduced by P. Suppes and developed by Newton da Costa y Rolando Chuaqui. In this article we review the integrability theory of partial differential equations, we present some aspects of the da Costa and Doria’s theory and we sketch its application to the problem of integrability. I. Introducción Ecuaciones en derivadas parciales (EDPs) aparecieron en el siglo XVIII como herramientas esenciales para el estudio analítico de modelos físicos. Posteriormente, demostraron ser fundamentales para la matemática misma. Podemos mencionar, por ejemplo, que U. Pinkall e I. Sterling [16] han demostrado la existencia de un número infinito de toros con curvatura media constante por medio de un estudio cuidadoso de la ecuación de sinh–Gordon uxx + utt + 2 sinh 2u = 0
y sus “simetrías generalizadas”, una noción que consideraremos en la tercera sección de este artículo. (La importancia de este trabajo radica en el hecho que encontrar superficies compactas de curvatura media constante es un problema difícil: aproximadamente durante cincuenta años se creyó que la única superficie con esta propiedad era la esfera, ver [16] para referencias sobre este tema). Recíprocamente, otras áreas de la matemática han jugado papeles importantes en el desarrollo de la teoría de ecuaciones diferenciales. Por supuesto, pensamos inmediatamente en análisis funcional y topología, y ciertamente estas disciplinas han transformado el modo de estudiar y pensar sobre EDPs [1, 3], pero éstas no son las únicas posibilidades: Es posible estudiar ecuaciones diferenciales por medios geométricos, y como pretendemos mostrar en este artículo, la teoría de números y la lógica matemática son relevantes también.
245
Para apreciar mejor las siguientes secciones es apropiado detenerse un poco en la influencia de la geometría en la evolución de la teoría de EDPs. Los trabajos clásicos en este tema son las contribuciones de Sophus Lie sobre la teoría de simetrías [14], el teorema de Emmy Noether sobre simetrías de las ecuaciones de Euler-Lagrange y leyes de conservación [14], y la investigaciones en geometría diferencial llevadas a cabo durante el siglo XIX: incluso hoy se pueden encontrar tesoros ocultos en el impresionante “Leçons sur le théorie genérale des surfaces et les applications géométriques du calcul infinitesimal” de Gaston Darboux [7] y en los “apuntes”sobre ecuaciones en derivadas parciales de primer y segundo orden de Edouard Goursat [11, 12]. Durante la primera mitad del siglo XX una parte de estos estudios evolucionaron en la teoría moderna de sistemas diferenciales exteriores en las manos de maestros como Elie Cartan. Dos artículos representativos de esta área son [13], donde R. Hermann resume los trabajos de Cartan, y [9], donde R. Gardner y N. Kamran estudian geométricamente ecuaciones hiperbólicas de segundo orden. Otra parte del esfuerzo hecho durante el siglo XIX, la parte más directamente relacionada con el trabajo de S. Lie, se transformó en una teoría sobre la “geometría formal”de las ecuaciones diferenciales, una teoría madura, profunda y de amplia aplicabilidad. Es en este contexto que preguntas fundamentales tales como ¿Qué es una ecuación diferencial? ¿Qué es una ley de conservación? ¿Qué es una solución local? pueden ser rigurosamente contestadas. En las palabras de uno de los principales especialistas contemporáneos en esta área (P.J. Olver, Bulletin AMS 37 (2000), 369-371): The key results and ideas, many of which can be traced back to Lie’s original work, include explicit, algorithmic determination of the symmetry group of any system of differential equations, integration of systems of ordinary differential equations by quadratures, determination of explicit solutions to nonlinear partial differential
246 classification of differential invariants, invariant differential equations and variational problems, classification of integrable systems, Hamiltonian structures for both ordinary differential equations and evolution equations, linearization of nonlinear differential equations, equivalence of submanifolds and differential equations, contact transformations, boundary value problems, bifurcation theory, symmetry-preserving numerical methods and difference equations, etc., etc. Specific physical applications include fluid mechanics, magnetohy-drodynamics, elasticity, general relativity, shock waves, solitons, image processing, control theory, and any aspect of physics and engineering where nonlinear differential equations play a significant role.
El estudio de integrabilidad de ecuaciones diferenciales en derivadas parciales pertenece a esta segunda área. Su origen está en el descubrimiento de ecuaciones en derivadas parciales que se comportan como sistemas hamiltonianos completamente integrablescon un número finito de grados de libertad [14, 15], en el desarrollo de métodos experimentales para resolver ecuaciones nolineales, principalmente a partir del siglo XIX [7, 11, 11, 14, 15], y en la teoría de pares de Lax, que, grosso modo, identifica ciertas ecuaciones con deformaciones isoespectrales de operadores diferenciales [15]. Veremos algunos ejemplos de experimentos en la siguiente sección. Por ahora, simplemente digamos que existe una definición satisfactoria de integrabilidad para ecuaciones en derivadas parciales no-lineales íntimamente relacionada con la noción de simetrías [14], y por supuesto es fundamental saber cuán robusta esta noción es. ¿Quizás es posible esperar que se pueda determinar algorítmicamente si una ecuación dada es integrable o no? Es en este punto que es necesario recordar el profundo resultado de K. Gödel sobre incompletitud e indecibilidad y preguntarse si acaso tiene alguna relevancia para la matemática de todos los días o si, a pesar de su profundidad, es de interés sólo a especialistas en los fundamentos de la matemática. Newton da Costa y Francisco Doria han probado que éste no es el caso [4, 5]: ¡Cada propiedad no trivial escrita en el
247
lenguaje del análisis clásico se puede transformar en un teorema de indecibilidad e incompletitud! En las siguientes secciones revisaremos la teoría de integrabilidad de ecuaciones diferenciales parciales tratando de obviar los aspectos más técnicos del tema, y bosquejaremos la aplicación de los teoremas de da Costa y Doria en este contexto. El artículo finaliza con algunos comentarios preliminares sobre el posible significado de los resultados discutidos aquí II. ¿Qué es integrabilidad? Comencemos con dos ejemplos clásicos de ecuaciones diferenciales [3, 7, 12, 15]: la ecuación del calor
y la ecuación de sine-Gordon (1)
Ambas ecuaciones son especiales no sólo por su contenido físico, sino también porque es posible estudiar sus soluciones en gran detalle. La ecuación del calor es lineal y ecuaciones lineales han sido consideradas a lo largo de tres siglos [1, 3]. La ecuación de sine-Gordon no es lineal, pero puede ser estudiada usando un método analítico descubierto alrededor de 1960, el método de la difusión/difusión inversa. Además, la ecuación de sine-Gordon posee un contenido geométrico: sus soluciones determinan superficies de curvatura Gaussiana igual a -1 [7]. Esta propiedad permitió encontrar un método para descubrir soluciones nuevas partiendo de soluciones ya conocidas: Ejemplo 1 (Transformación de Bäcklund para la ecuación
248
de sine-Gordon). Consideremos el sistema de ecuaciones (2) (3) Este sistema es integrable si 0 (u; v es una solución a la ecuación sine-Gordon y, en este caso, es simple ver que !(u; v) es una nueva solución a la misma ecuación. Por ejemplo, si comenzamos con (obviamente una solución!) entonces las ecuaciones (2) y (3) implican que, como el lector puede comprobar, es también solución de la ecuación de sine-Gordon. Así hemos reducido el encontrar soluciones a (1), una ecuación no-lineal de segundo orden, a encontar soluciones de un sistema de ecuaciones de primer orden, algo si no sencillo, al menos teóricamente conocido, puesto que corresponde a resolver sistemas de ecuaciones diferenciales ordinarias [3]. Inmediatamente nos preguntamos si existen otras ecuaciones no–lineales que pueden estudiarse por medio de transformaciones tales como (2), (3). La respuesta es afirmativa: Ejemplo 2 (La transformación de Cole y Hopf para la ecuación de Burger). Consideremos la ecuación (4) introducida por Burger en su estudio de turbulencia (ver [2] para la referencia exacta). Definamos la transformación
249
No es difícil comprobar que la función Q así definida satisface la ecuación del calor
si Q es una solución a la ecuación de Burger. Tenemos entonces un método de solución para la ecuación (4) con condición inicial que resumimos en el diagrama siguiente: invierta transf.
aplique transf. Ecuaciones para las cuales es posible encontrar transformaciones que las reduzcan a ecuaciones lineales se llaman ecuaciones linealizables. En vista de la existencia de estas ecuaciones, es natural preguntarse ahora si existe una teoría que permita encontrar estas transformaciones y/o clasificar ecuaciones linealizables. Se ha llegado paulatinamente a la convicción que la idea básica detrás de estos ejemplos es la noción de simetría [2, 14]. Para introducir esta idea veamos un nuevo ejemplo: Ejemplo 3 (La ecuación de Korteweg-de Vries (KdV)). I was observing the motion of a boat which was rapidly drawn along a narrow channel by a pair of horses, when the boat suddenly stopped - not so the mass of water in the channel which
250 it had put in motion; it accumulated round the prow of the vessel in a state of violent agitation, then suddenly leaving it behind, rolled forward with great velocity, assuming the form of a large solitary elevation, a rounded, smooth and well defined heap of water, which continued its course along the channel apparently without change of form or diminution of speed. I followed it on horseback, and overtook it still rolling on at a rate of some eight or nine miles an hour, preserving its original figure some thirty feet long and a foot to a foot and a half in height. Its height gradually diminished, and after a chase of one or two miles I lost it in the windings of the channel. Such, in the month of August 1834 was my first chance inter- view with that singular and beautiful phenomenon...
Así describe John Scott Russell su encuentro con la onda que hoy llamamos solitón, durante un paseo a caballo por la orilla del Union Canal en Edinburgh (J. Scott Russell, Report on Waves, Fourteenth meeting of the British Association for the Advancement of Science, 1844). En 1895 los científicos D.J. Korteweg and G. de Vries encontraron una ecuación diferencial que podía describir el fenómeno observado por Russell. La ecuación es (5) y el solitón que Russell persiguió es la función donde c; d son constantes. Esta ecuación posee una serie de características (algebraicas, analíticas, geométricas) que la han convertido en una de las ecuaciones más conocidas e importantes de la física matemática [14, 15]. No podemos mencionar todas sus propiedades aquí Sin embargo, sí es importante señalar que, si bien no es linearizable, posee una transformación formalmente análoga a la transformación de Bäcklund presentada en el primer ejemplo, y además (algo que explicaremos en algún detalle en l a
251
sección siguiente) posee un número infinito de simetrías generalizadas, esto es, existe un número infinito de maneras de obtener soluciones nuevas de KdV partiendo de una solución dada [2, 14]. Un ejemplo elemental de esta situación es el siguiente: si u = f(x;t) es una solución de la ecuación (5) entonces, para cualquier valor de , también lo es. Un problema fundamental es precisamente reconocer ecuaciones con propiedades tales como: existencia de transformaciones de Bäcklund, existencia de linealizaciones, existencia de un número infinito de simetrías generalizadas. Diremos por ahora que una ecuación que posea estas propiedades (o al menos algunas de ellas) es integrable y, como ya hemos mencionado anteriormente, se ha llegado a comprender que la propiedad más básica de las nombradas es la existencia de simetrías. A continuación discutimos simetrías generalizadas para explicar con mayor cuidado qué entendemos por integrabilidad. III. Simetrías generalizadas Sea E = Rp x R q el espacio de variables independientes y dependientes que aparecen en una ecuación diferencial dada. Lo primero que debemos hacer es —siguiendo Sophus Lie— dotar ecuaciones diferenciales con un contenido geométrico: Sea Nk el numero de derivadas parciales de orden k de una función suave Definimos
Asi J k E es un espacio euclídeo de dimensión p+q +N1 + ··· + Nk cuyas coordenadas representan todas las derivadas parciales de funciones f hasta orden k. Este espacio se llama el espacio de jets de orden k de E [14].
252
Ahora identificamos un sistema de ecuaciones diferenciales parciales de orden k (6) con una sub-variedad de J k E , en forma análoga a cómo una ecuación algebraica ( x2 + y2 + z2 = 1, por ejemplo) se identifica con una sub-variedad del espacio euclídeo R 3. Esta identificación es la base de la geometría de ecuaciones diferenciales. Una solución de la ecuación (6) es una función
donde , del espacio de variables independientes al espacio E tal que su prolongación definida por
está contenida en la sub-variedad . Un momento de reflexión basta para convencerse que esta definición captura perfectamente la idea intuitiva que f es una solución de (6) si ella y sus derivadas satisfacen (6) idénticamente. Definición 1. Una simetría clásica del sistema campo vectorial
sobre E cuyo flujo transforma soluciones de soluciones de .
= 0 es un
en
Como explicamos en la primera sección simetrías son fundamentales para el estudio y la aplicación de las ecuaciones diferenciales. Lamentablemente, esta definición de simetrías no
253
es útil porque requiere conocimiento de las soluciones del sistema de ecuaciones en que se está interesado! Una de las brillantes observaciones de Sophus Lie fue que es posible reemplazar Definición 1 por un criterio infinitesimal: El campo vectorial X induce un campo vectorial prk X sobre Jk E como sigue: (7) donde las funciones medio de
se obtienen inductivamente por
(8) y las derivadas totales Di son las derivaciones formales (9)
Entonces, se puede demostrar que (asumiendo algunas hipótesis técnicas, ver [14]) X es una simetría de ¢a = 0 si prk X es tangente a la sub-variedad S¢ (esto es, si prk X (¢a ) = 0 en soluciones a ¢a = 0 ). Ahora generalizaremos el criterio infinitesimal que acabamos de establecer siguiendo a Emmy Noether: en vez de campos vectoriales sobre E consideramos operadores de la forma
y decimos que Y es una simetría generalizada de ¢a = 0 si para cada solución f(xi ) = (xi, u (xi )) del sistema de
254
satisface el sistema ¢a = 0 a primer orden en . Ejemplo 4. Consideremos nuevamente la ecuación de Korteweg– de Vries en la forma y definamos el operador
Entonces, se puede probar fácilmente que si G es una simetría generalizada de la ecuación KdV, ¡R(G) también lo es! Así, obtenemos una familia infinita de simetrías Yn = Gn@=@u donde
Ahora, si una ecuación posee un numero infinito de simetrías generalizadas, entonces también, por lo general [8, 15, 14, 17, 18] 1. posee transformaciones de Bäcklund 2. puede resolverse mediante difusión/difusión inversa 3. tiene un número infinito de leyes de conservación 4. pueden ser interpretadas como sistemas bihamiltonianos 5. aparece en geometría diferencial. Así, decimos simplemente que una ecuación (o sistema de ecuaciones) es integrable si posee un número infinito de simetrías generalizadas. ¿Será posible clasificar todas las ecuaciones integrable? ¿Existe un algoritmo para decidir si una ecuación arbitraria es integrable o no? Por ejemplo, en la lista siguiente
255
IV. Indecibilidad e incompletitud Gracias al trabajo de Kurt Gödel, sabemos que preguntar por la existencia de algoritmos —como lo hacemos en la sección anterior— es algo delicado. Pretendemos argumentar que tal algoritmo no existe, y que la teoría de integrabilidad de ecuaciones diferenciales es esencialmente incompleta. Tal resultado se sigue de una profunda aplicación de lógica a la matemática clásica desarrollada por Newton da Costa y Francisco Doria en los 1990’s. Sin entrar en mayores detalles, su resultado es: Teorema 1. Sea P cualquier propiedad no-trivial escrita en el lenguaje de análisis. Existe una expresión » para un objeto en el lenguaje de análisis tal que ni
256
La abreviatura ZFC indica la teoría de conjuntos de Zermelo-Frenkel más el axioma de elección. Para ser más rigurosos debemos definir algunos conceptos: Primero, recordemos que una función real es llamada elemental si se construye en base a polinomios, senos, cosenos, exponenciales en base e , coeficientes racionales y el número . Denotamos por el álgebra de expresiones polinomiales en un número finito de variables sobre los enteros Z , e identificamos con el conjunto de expresiones para polinomios diofánticos en ZFC. De la misma forma, denotamos por F el conjunto de expresiones para funciones reales elementales en una sola variable. El teorema de da Costa y Doria ahora se puede escribir así Teorema 2. Supongamos que añadimos la función a , y que cerramos bajo esta nueva expresión para obtener el conjunto extendido de expresiones p F¤q. Entonces: 1. Podemos construir algorítmicamente una familia enumerable de expresiones para funciones reales km(x) > 0 tales que no hay un algoritmo que decida si km(x) = 0. 2. Si M es un modelo de ZFC que contiene el modelo estándar de la aritmética, existe una expresión para una función real k(x) tal que
La primera parte del teorema nos da la indecibilidad; la segunda parte la incompletitud. La demostración de este profundo resultado está basada en el teorema clásico de Gödel, por supuesto, en la indecibilidad del Problema 10 de Hilbert (No existe un algoritmo que decida si una ecuación diofántica es soluble en los enteros, ver [6]) y en la construcción de un functor que traduce ecuaciones diofánticas en funciones reales [19]. Así, es la indecibilidad de la teoría de ecuaciones diofánticas la que implica la existencia de problemas
257
teorema anterior es el hecho que la igualdad es indecidible. Más precisamente: Corolario 1. Sea f una función real arbitraria. Existe una expresión en el lenguaje de ZFC tal que Ahora aplicaremos estas ideas al estudio de integrabilidad. Nuestro primer resultado es: Teorema 3. Asumamos que la ecuación de evolución ut = F (x, t, u, ux , . . .) satisface que la derivada parcial es una función suave deu y un número finito de sus derivadas con respecto a x (es decir, ut = F es una ecuación no-lineal en u, como la KdV). Entonces,existe un operador tal que no es posible decidir algorítmicamente si es una simetría generalizada de ut = F o no. Demostración. Primero que nada debemos re-escribir un poco lo que significa ser una simetría generalizada en el caso de ecuaciones de evolución. Si la ecuación de evolución que estamos estudiando es ut = F , “empujamos”los operadores (9) a la variedad determinada por la ecuación ut = F y obtenemos
donde por simplicidad hemos puesto También definimos (10) Entonces, no es difícil ver que probar que un operador como el
258
que aparece en el enunciado del teorema es una simetría generalizada se reduce a verificar que la ecuación se satisface identicamente. Ahora definimos
Se ve fácilmente que Dt(G) = km(t) , donde G es por supuesto el coeficiente de Y, mientras que
Puesto que la ecuación DtG = F* G debe satisfacerse idénticamente, la única posibilidad es que ambos lados de esta ecuación se anulen. Pero esto significa que km(t) debe anularse para todo t, y esto es indecidible. Un resultado más general, pero menos explíciito, puede obtenerse fácilmente del trabajo de da Costa y Doria sobre sistemas dinámicos. En [5] ellos prueban: Proposición 1. Sea P cualquier predicado no-trivial en ZFC. Existe una expresión para un campo vectorial V sobre en ZFC tal que si M es un modelo de ZFC que contiene el modelo estándar de la aritmética, pero y
259
Entonces es inmediato ver que la descripción geométrica de simetrías nos permite establecer el siguiente corolario: Corolario 2. Sea ut = F(x, t, u, ux, . . . ) una ecuación de evolución y M como en la proposición anterior. Existe una expresión para un campo vectorial V sobre tal que
También podemos probar incompletitud de la teoría de integrabilidad. Usando las mismas notaciones que en el corolario anterior tenemos: Teorema 4. Existe una expresión tal que
Demostración. (Sketch) Vamos a usar el Corolario 1. Aunque está escrito para funciones reales solamente, podemos extenderlo a funciones reales de un número arbitrario (finito) de variables. Ahora codificamos los lados derechos de las ecuaciones que aparecen al final de la tercera sección. Definiendo una variable para cada derivada (como en la prueba del Teorema 3) podemos considerar cada una de esas ecuaciones como expresiones del tipo ut = f , donde f es una función de algún Rn a R. Ahora ponemos » = f(x1; : : : ; xn) + k(x1) , donde k es la función definida en parte 2 del Teorema 2. Entonces, por construcción, tenemos
260
y por lo tanto pero ZFC 0 » = f y ZFC 0 : (» = f) . Ahora, ZFC 0 “la ecuación ut = » es integrable y homogénea”, puesto que si no fuera así, entonces tendríamos que ZFC ‘ » = f para algún f de los considerados arriba, lo que es una contradicción. También podemos concluir que ZFC 0 : \ “la ecuación u = » es integrable y homogénea”, puesto que si no fuera así tendríamos que ZFC ‘ : “la ecuación ut = » es integrable” o : “la ecuación ut = » es homogénea”, y cualquiera de estas alternativas significa que ZFC ‘ : (» = f) para algún f como arriba, lo que es una contradicción. Terminamos este trabajo con algunos comentarios preliminares sobre el posible interés de los resultados presentados aquí. Primero, y lo más obvio, la investigación de N. da Costa y F. Doria es importante porque muestra que los fenómenos de indecibilidad e incompletitud aparecen en “la vida diaria” y no en los arrabales de la práctica matemática. (Se podría argüir que la hipótesis del continuo ya muestra que la incompletitud aparece en matemática clásica, pero se podría contestar que la teoría de conjuntos en sí no es de importancia central para una mayoría de matemáticos). El teorema de da Costa y Doria nos dice que indecibilidad e incompletitud aparecen en todas partes, incluyendo la teoría de sistemas dinámicos, mecánica hamiltoniana y como hemos visto aquí, la venerable teoría de ecuaciones diferenciales. Sobre las consecuencias filosóficas del trabajo de da Costa y Doria no podemos hacer mejor que citar a estos autores [4]: What can we make out of all this? We cautiously suggest that the trouble may lie not in some essential inner weakness or flaw of mathematical reasoning, but in a too narrow, too limited concept of formal system and of mathematical proof. [...] The authors
261 algorithmicity and formal system, but they feel that if there are so many quite common-place things that should somehow be provable or decidable within a sensible mathematical structure, and which, however, turn out to be algorithmically undecidable or unprovable, then one cannot blame the whole of mathematics for that. [...] The problem lies in our current ideas about formalized mathematics. They are too weak.
Tercero, sobre el significado de este trabajo para la teoría de integrabilidad. Mientras pone cota a la idea de algorítmicamente determinar todas las ecuaciones integrables, no nos impide, por supuesto, tratar de caracterizar estas ecuaciones. Lo que tenemos en mente es una práctica que ha probado ser muy fructífera en el desarrollo de la matemática, y que quizás se puede explicar mejor usando un caso particular: en geometría los grupos de cohomología son los depositarios de información sobre la topología de las variedades diferenciables. Así, por ejemplo, los grupos de cohomología pueden medir (en forma invariante bajo cierta equivalencia natural) cuánto falla una variedad en ser simplemente conexa. Un problema diferente es el cálculo de estos grupos. Presumiblemente los resultados de da Costa y Doria nos dirían que existen limitaciones para realizar este cálculo algorítmicamente. La conjetura que podemos hacer es que la integrabilidad de ecuaciones diferenciales está también medida por invariantes. En cierto sentido esto correspondería a desarrollar una teoría de cohomología que midiera la integrabilidad de ecuaciones diferenciales! Tal teoría no existe aún, pero es muy interesante señalar que ya se han dado pasos en esta dirección y que, por ejemplo, existe un invariante que mide si una ecuación dada es “formalmente”integrable (este tipo de integrabilidad es mucho más débil que el considerado aquí, y es generalmente asumido antes de comenzar el estudio geométrico de EDPs [10]). Si tal desarrollo es posible, entonces los aspectos de incompletitud e indecibilidad inherentes a la práctica matemática
262
incompleta (en un sentido intuitivo, no formal) sino más bien que nuestras capacidades para calcular algorítmicamente sus invariantes son limitadas. De algún modo, esta distinción nos parece satisfactoria.
REFERENCIAS Brezis, H. and Browder, F. (1998): “Partial differential ecuations in the 20th century.en Advances in Mathematics 135 p.p. 76–144. Cantwell, B.J. (2002): “Introduction to symmetry analysis” (Cambridge Texts in Applied Mathematics) Cambridge: Cambridge University Press. Courant R. y Hilbert, D. (1966):“Methods of Mathematical Physics”, New York: Interscience Publishers. da Costa, N.C.A. y Doria, F.A. (1991): “Undecidability and incompleteness in classical mechanics”, International Journal of Theoretical Physics vol. 30, 1991, p.p. 1041–1073. da Costa, N.C.A. y Doria, F.A. (1994): “Suppes predicates and theconstruction of unsolvable problems in the axiomatized sciences. en Humphreys, P., Patrick Suppes: Scientific Philosopher, Vol. 2, (Amsterdam:Kluwer Academic Publishers), p.p. 151– 193. Davis, M., Matijashevich, Y. y Robinson, J. (1976): “Hilbert’s tenth problem. Diophantine equations: Positive aspects of a negative solution.en Proceedings of Symposia in Pure Mathematics Volume 28, p.p. 323–378. G. Darboux, G. (1896): Leçons sur le théorie générale des surfaces et les applications géométriques du calcul infinitesimal. Paris: Gauthier–Villars. Foursov, M. V., Olver, P. J. y Reyes, E.G. (2001): “On formal integrability of evolution equations and local geometry of surfaces”, Diff. Geom. Appl. vol. 15 Nº 2, 2001, p.p. 183–199. Gardner, R. B. y Kamran, N. (1993): “Characteristics and the geometry of hyperbolic equations in the plane”, J. Differential Equations vol. 104, 1993, p.p. 60–116.
263
Goldschmidt, H. (1967): “Integrability criteria for systems of non-linear partial differential equations”, Journal of Differential Geometry vol. 1, 1967, p.p. 269–307. Goursat, E. (1891): Leçons sur l’integration des équations aux derivées partielles du premier ordre. Paris: A. Hermann. Goursat, E. (1896): Leçons sur l’integration des équations aux dérivées partielles du second ordre. Paris: A. Hermann. Hermann, R. (1965): “E. Cartan’s geomeric theory of partial differential equations”, Advances in Mathematics vol. 1, 1965, p.p. 265–317. Olver, P. J. (1993): Applications of Lie Groups to Differential Equations (Second Edition. New York: Springer-Verlag. Palais, R. (1997): “The symmetries of solitons”, Bull. Amer. Math. Soc. (N.S.) vol. 34 no. 4, 1997, p.p. 339–403. Pinkall, U. y Sterling, I. (1989): “On the classification of constant mean curvature tori”, Annals of Math. vol. 130, 1989, p.p. 407–451. Reyes, E.G. (1998): “Pseudo-spherical surfaces and integrability of evolution equations”, J. Differential Equations vol. 147 Nº 1, 1998, p.p. 195–230. Erratum: J. Differential Equations vol. 153 Nº 1, 1999, p.p. 223–224. Reyes, E.G. (2000): “Some geometric aspects of integrability of differential equations in two independent variables”, Acta Appl. Math. vol.64 Nº 2/3, 2000, 7p.p. 5–109. Richardson, D. (1968): “Some undecidable problems involving elementary functions of a real variable”, The Journal of Symbolic Logic vol. 33, 1968, p.p. 514–520. Sanders, J. A. y Wang, J. P.(1998): “On the integrability of homogeneous scalar evolution equations”, J. Differential Equations vol. 147, 1998, p.p. 410–434. Enrique Reyes Universidad de Santiago de Chile Departmento de Matemáticas y Ciencia de la Computación, ereyes@lauca.usach.cl; ereyes@fermat.usach.cl
SE TERMINÓ la impresión de este libro en los talleres gráficos de E D E V A L Avda. Errázuriz, nº 2120, en la ciudad de Valparaíso (Chile), el 30 de abril del año dos mil siete