ISSN 0124 - 4620
Revista Colombiana de
FILOSOFÍA DE LA CIENCIA
Revista Colombiana de
FILOSOFÍA DE LA CIENCIA
Vol. X ∙ No. 20 - 21 • 2010 • ISSN 0124 - 4620
Contenido
Revista Colombiana de Filosofìa de la Ciencia
Vol. IX ∙ No. 19 • 2009 • ISSN 0124 - 4620
Sets and Pluralities Gustavo Fernández Díez ¿Probabilidad cuántica o espacio–tiempo relativista? Rafael Andrés Alemañ Berenguer Un argumento pragmático para el concepto de lo mental Fabrizio Pineda Diferenciación y explicación causal en los escritos biológicos de Aristóteles Alejandro Farieta Una defensa de la teoría searleana de los nombres propios Marcela del Pilar Gómez
http://www.uelbosque.edu.co/ Vol. IX ∙ No. 19 • 2009
Por una Cultura de la Vida, su Calidad y su Sentido
Revista Colombiana de
FILOSOFÍA DE LA CIENCIA PROGRAMA DE FILOSOFÍA
Indexada en Philosopher’s Index Red de revistas científicas de América Latina y el Caribe, España y Portugual (RedALyC)
PROGRAMA DE FILOSOFÍA
©Revista Colombiana de Filosofía de la Ciencia ISSN: 0124-4620 Volumen IX No. 19 Suplemento Diciembre de 2009 Editor Carlos Escobar Uribe, Universidad El Bosque Editor Asistente Alejandro Farieta, Universidad El Bosque Comité Editorial Luis Humberto Hernández, Mágister en Filosofía - Universidad de Antioquia. Jorge António Mejía, Ph.D. en Filosofía - Universidad de Antioquia. Virigilio Niño, Ph.D. en Física - Universidad El Bosque. José Luis Villaveces, Ph.D. en Ciencias - Universidad de los Andes. Eugenio Andrade Pérez, Magister en Genética Molecular - Universidad Nacional de Colombia. Philippe Binder, Ph.D. en Física Aplicada - Universidad de Hawái Comité Asesor Editorial Nicolas Rescher, Universidad de Pittsburg. Paulo Abrantes, Universidad de Río de Janeiro. Eduardo Flichmann, Universidad de Buenos Aires. Alfredo Marcos, Universidad de Valladolid. Ivelina Ivanova, Instituto de Investigación Filosófica de Sofía. Ciprian Valcan, Universidad Tibiscus de Timisoara Fundador Carlos Eduardo Maldonado, Universidad El Bosque Solicitud de Canje Universidad El Bosque, Biblioteca – Canje, Bogotá - Cundinamarca Colombia, biblioteca@unbosque.edu.co Suscripción anual Colombia: $20.000. Latinoamérica: US$20. Otros países: US$40 | Correspondencia e información Universidad El Bosque, Departamento de Humanidades, Cra. 7B # 132-11, Tel. (57-1) 258 81 48, revistafilosofiaciencia@unbosque.edu.co Tarifa Postal Reducida No. 2010-280, 4-72 la Red Postal de Colombia, Vence 31 de diciembre de 2010 UNIVERSIDAD EL BOSQUE Rector Carlos Felipe Escobar Roa, MS, MD Vicerrector Académico Miguel Ruíz Rubiano, MEd.,MD Vicerrector Administrativo Rafael Sánchez París, MBA, MD Director del Programa de Filosofía Carlos Escobar Uribe Concepto, diseño y diagramación Centro de Diseño y Comunicación; Facultad de Diseño, Imagen y Comunicación; Universidad El Bosque. Diana María Jara Rivera D.G. Impresión ---
Contenido
Sets and Pluralities
Gustavo Fernández Díez
¿Probabilidad cuántica o espacio–tiempo relativista? Rafael Andrés Alemañ Berenguer
Un argumento pragmático para el concepto de lo mental
Fabrizio Pineda
Diferenciación y explicación causal en los escritos biológicos de Aristóteles
Alejandro Farieta
Una defensa de la teoría searleana de los nombres propios
Marcela del Pilar Gómez
5 23 43
57 67
DIVISIÓN DE POSGRADOS Y FORMACIÓN AVANZADA ESPECIALIZACIONES EN MEDICINA
DOCTORADO
Doctorado en Bioética 51832 MAESTRÍAS
Maestría en Ciencias Biomédicas 52068 Maestría en Salud Sexual y Reproductiva 53309 Maestría en Psiquiatría Forense 51833 Maestría en Bioética 11197 Maestría en Psicología 54322 ESPECIALIZACIONES EN EDUCACIÓN
Docencia Universitaria 20781 Educación Bilingüe 1323 ESPECIALIZACIONES EN INGENIERÍA
Gerencia de Proyectos 10531 Gerencia de Producción y Productividad 13773 Salud y Ambiente 54377 Seguridad de Redes Telemáticas 90475 Diseño de Redes Telemáticas 90330 ESPECIALIZACIONES INTERDISCIPLINARIAS
Especialidad en Bioética 3069 Especialidad en Filosofía de la Ciencia 5302 Especialidad en Epidemiología General 51642 Especialidad en Epidemiología Clínica 51644 Especialidad en Higiene Industrial 3060 Especialidad en Gerencia de la Calidad en Salud 3885 Especialidad en Salud Familiar y Comunitaria 4852 Especialidad en Salud Ocupacional 1794 Especialización en Ergonomía 10626 ESPECIALIZACIONES EN PSICOLOGÍA
Psicología Médica y de la Salud 8498 Psicología del Deporte y el Ejercicio 12932 Psicología Ocupacional y Organizacional 10756 Psicología Social Cooperación y Gestión Comunitaria 53451 Psicología Clínica y Autoeficacia Personal 54199 Psicología Clínica y Desarrollo Infantil 54207 ESPECIALIZACIONES EN ODONTOLOGÍA
Cirugía Oral y Maxilofacial 1795 Endodoncia 3572 Patología Oral y Medios Diagnósticos 1806 Periodoncia y Medicina Oral 1801 Prostodoncia 2674 Operatoria Dental y Estética 52352 Ortodoncia 1790 Odontología Pediátrica 1805
Informes
Anestesia Cardiovascular y Torácica 52890 Anestesia y Reanimación 1796 Cardiología Adultos 1781 Cardiología Pediátrica 1803 Cirugía de Columna 15984 Cirugía de Mano 15980 Cirugía de Tórax 1799 Cirugía General 1782 Cirugía Plástica Reconstructiva y Estética 7465 Cirugía Vascular y Angiología 20577 Dermatología 1783 Gastroenterología Pediátrica 52359 Ginecología y Obstetricia 1784 Medicina Critica y Cuidado Intensivo Pediátrico 52368 Medicina del Deporte 1802 Medicina del Dolor y Cuidados Paliativos 52360 Medicina Familiar 7243 Medicina Física y Rehabilitación 1785 Medicina Interna 1786 Nefrología Pediátrica 11047 Neonatología 5033 Neumología 1783 Neumología Pediátrica 1800 Neurocirugía 8193 Neurología 1788 Oftalmología 1789 Oncología Clínica 1797 Ortopedia y Traumatología 1791 Pediatría 1792 Psiquiatría 1793 Psiquiatría de Enlace e Interconsultas 54236 Psiquiatría Infantil y del Adolescente 53999 Radiología e Imágenes Diagnósticas 1798 Reumatología Pediátrica 54776 Urología 15689
Universidad El Bosque - División de Posgrados y Formación Avanzada Calle 134 No. 7 b - 83 - Edificio El Bosque, primer piso. PBX 6489000 ext. 108 - 233 - 315 - 170 Telefax 6489040 Línea gratis 01 8000 11 30 33 - postgrados@unbosque.edu.co
Por una Cultura de la Vida, su Calidad y su Sentido
Inscripciones en línea
www.unbosque.edu.co
Institución de educación superior sujeta a inspección y vigilancia por el Ministerio de Educación nacional
Sets and Pluralities1 Gustavo Fernández Díez2
Resumen En este artículo estudio el trasfondo filosófico del sistema de lógica conocido como “lógica plural”, o “lógica de cuantificadores plurales”, de aparición relativamente reciente (y en alza notable en los últimos años). En particular, comparo la noción de “conjunto” emanada de la teoría axiomática de conjuntos, con la noción de “pluralidad” que se encuentra detrás de este nuevo sistema. Mi conclusión es que los dos son completamente diferentes en su alcance y sus límites, y que la diferencia proviene de las diferentes motivaciones que han dado lugar a cada uno. Mientras que la teoría de conjuntos es una teoría genuinamente matemática, que tiene el interés matemático como ingrediente principal, la lógica plural ha aparecido como respuesta a consideraciones lingüísticas, relacionadas con la estructura lógica de los enunciados plurales del inglés y el resto de los lenguajes naturales. Palabras clave: conjunto, teoría de conjuntos, pluralidad, cuantificación plural, lógica plural.
Abstract In this paper I study the philosophical background of the relatively recent (and in the last few years increasingly flourishing) system of logic called “plural logic”, or “logic of plural quantifiers”. In particular, I compare the notion of “set” emanated from axiomatic set theory, with the notion of “plurality” which lies behind this newly proposed logical system. I conclude that the two are utterly different in scope and limits, and that the difference comes from the distinct motivations that have led to each of them. While set theory is a genuine mathematical theory, with a primary mathematical interest, plural logic has arisen from linguistic considerations, which have to do with the adequate representation of the logical structure of plural statements of English and most other natural languages. Keywords: set, set theory, plurality, plural quantification, plural logic. 1
Research supported by Spanish Government Grant FIS2007–63830.
2
Doctor en Filosofía – London School of Economic and Political Science. Profesor Departamento de Filosofía. Universidad de Murcia – España. Correo electrónico: gfdezdp@um.es.
Sets and Pluralities - Gustavo Fernández Díez
Introduction A set is a collection of objects which, regarded as a whole (or as a unity), can be considered in turn as a new object. This simple and apparently innocuous idea, gave rise to one of the greatest revolutions in logic and the foundations of mathematics, by the end of the 19th century. Few times in history such a simple insight has led to so many consequences. The idea was put forward by the Russian–born German mathematician and philosopher Georg Cantor. In Cantor’s own words, “A set is a collection into a whole of definite distinct objects of our intuition or of our thought. The objects are called the elements (members) of the set” (Cantor 1895 481). In turn, the new object obtained, i.e., the set, can itself be considered as a member of other collections of objects, thus being used for the construction of other sets. So we will have sets, some of whose members are themselves other sets. And in turn these larger sets will themselves be members of other sets, even larger than them. And so on, leading to sets which are larger and larger, and more and more complex. In a series of seminal papers between 1879 and 1884, Georg Cantor published his first treatise, in six parts, on what soon was to become known as “set theory”: a completely new discipline, invented by him, in which, starting from the notion of set and the membership relation, Cantor managed to build up a full autonomous branch of mathematics in its own right. With the creation of set theory, Cantor fulfilled two major achievements. In the first place, he conducted, for the first time in the history of mathematics, a truly rigorous and systematic study of mathematical infinite: he pointed out the existence of different sizes among infinite sets, and devised a precise method to compare them; later on, a full scale would be provided for the exact dimension measurement of infinite sets of all sizes (von Neumann’s theory of ordinals, in 1923). In the second place, Cantor’s set theory positioned itself as the main essential discipline for the exploration of the foundations of mathematics, as it started to become clear that most (indeed, virtually all) mathematical concepts could be defined, and the respective theorems proved, in the framework of set theory. Since then, the importance that set theory, and the notion of “set”, have had for mathematics and philosophy, is difficult to overestimate. In particular, in the philosophical field, it has been a central topic of discussion in philosophy of mathematics: the ontological commitments of that notion and of the axioms governing it, have been scrutinized in detail, as well as the very philosophical nature of the notion itself, and its efficacy in providing a foundational ground for mathematical science. Moreover, set theory has also had an impact in philosophy through formal logic, and through those branches of philosophy which
[6]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 5-22
use formal logic. Thus, formal logic is standardly developed today in a set–theoretic framework, and all its basic notions, such as formal language, deduction, model, logical consequence, etc, are defined in set–theoretical terms. In philosophy of language, an increasing number of theories of meaning for natural languages (from Quine onwards), make use of formal logic and set–theoretical notions. And the same happens within some trends of philosophy of science, such as the so–called structuralist approach, and others. For all these reasons, it has been highly surprising the appearance, a decades ago, and the rapid proliferation in the last few years, of a completely new logical discipline called “plural logic” (or, sometimes, “plural quantification logic”, or “logic of plural quantifiers”). A new logical discipline that attempts to describe a logical regimentation in which a plurality of objects is accounted for without treating it as a logical object in itself, but only as a collective way of referring to the members that constitute it. Hence, within plural logic —so it is alleged— we can refer to a plurality of objects by way of a plural (combined, collective) reference to the objects that constitute it, bypassing the ontological commitment to the plurality as an entity in itself. Likewise, within plural logic we are supposedly able to predicate a property over a bunch of objects collectively taken, and to make existential and universal quantification over such pluralities of objects, without committing ourselves to the existence of the pluralities as such, but only of the objects that are contained within them. Plural logic, hence, is a trial to give a logical treatment of pluralities of objects, not as objects in themselves, but only as collective representations of the objects which form each plurality. In a certain way, this initial standpoint is quite the opposite as that of set theory, where the idea of gathering a collection of different objects into a new object (a whole, a unity, a new thing), was essential. And yet, as plural logic theoreticians point out, this new logical system has been used in attempts “to account for set theory, and to eliminate ontological commitments to mathematical objects and complex objects” (Linnebo 2004, Introduction). The reason why plural logic might have an impact on the philosophical implications of set theory lies in the fact that, if it turns out that some of the role that sets play in standard set theory, can be covered by this new logical treatment of pluralities, then the ontological commitments that are usually attributed to sets, both in set theory and in the applications of set theory to other disciplines, might drastically vary. In other words, if there is a possibility that plural logic provides a new way of looking at the sets of set theory, discharging some of the ontological commitments that they carry within them, then, in the light of this new logical system, some of those ontological commitments might not longer be considered inevitable.
[7]
Sets and Pluralities - Gustavo Fernández Díez
Whether these perspectives are finally confirmed or not, the fact is that the appearance of plural logic on the scene, the growing interest that it is attracting, and the utter importance of the notions involved, demands that a serious philosophical debate is opened up to discuss all theoretical background of the matter. In this respect, the purpose of the present paper is to outline the general terms in which such a debate could be conducted. I will start by giving a brief exposition of set theory, plural logic, and the contrast between them, in a way as clear and accesible as I can make it, avoiding technicalities. I hope that the basic conceptual features of both theories can be got conveniently reflected in a direct, colloquial language. Then, I will go on to sketch the main lines of what would be a philosophical assessment of the new theory at issue, the motivations behind it, its scope and limits (judging from the formulations that have so far been devised), and indeed the main implications of the theory in its present form.
The notion of set of axiomatic set theory Georg Cantor developed his Begründung der Mengenlehere (The Theory of Sets) in the late 19th Century. Departing from an intuitive notion of a set of objects, and of the membership relation —the relation that connects an object and a set of which it is a member—, Cantor inaugurated an entirely new approach to mathematical study, which was quickly shown to be applicable to virtually any branch of mathematics. The simplicity of the starting point of the theory, compared to its vast range of applications, made for a really impressive contrast. Moreover, the theory allowed him to undertake, for the first time in history, a precise investigation into the nature of mathematical infinite: transfinite set theory. Cantor’s final exposition of set theory was his paper Contribution to the Founding of the Theory of Transfinite Numbers, published in the “Mathematische Annalen” in two parts (Cantor 1895, 1897). It is at the beginning of that paper that we find Cantor’s well–known definition of set, already given above, as “a collection into a whole of definite distinct objects of our intuition or of our thought” (Cantor 1895 481). By the same years, another great mathematician and philosopher of the time, Gottlob Frege, was attempting to culminate his life time project of showing that arithmetic can be reduced to logic, a project known as “Frege’s logicist program”. What Frege wanted to establish was that both the natural numbers (that is, the numbers used for counting: 0, 1, 2, 3, and so on, indefinitely), and the basic principles governing them, could be reduced to purely logical notions. Put in other words: that the natural numbers could be defined in logical terms alone, and that the laws governing them —the laws of arithmetic—, could
[8]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 5-22
be derived by the exclusive use of logical principles. The execution of such a project took Frege three books to write, which today are acknowledged as three masterpieces of philosophy ever. In the first place, his Conceptography (Frege 1879), in which he laid down the bases of modern mathematical logic, an immensely richer and more powerful discipline than syllogistic logic (the only logical theory known at the time). In the second place, the Foundations of Arithmetic (Frege 1884), in which Frege made an ample exposition and philosophical defense of his logicist thesis that arithmetic can be reduced to logic, and advanced the conceptual basis of a reduction of the notion of natural number into completely general notions —notions that appeared to be purely logical terms—. And in the third place, Frege’s last and culminating work, the Basic Laws of Arithmetic, published in two volumes (Frege 1893–1903), in which he carried out in detail the derivation of the main theorems of elemental arithmetic and mathematical analysis from the basic (apparently logical) terms settled down before, using for the derivations the formal logical apparatus that he himself had also introduced in the first of his three seminal books. The connection between Frege’s logicist program and the early stages of set theory is crucial. It lies in the fact that the main and most fundamental notion that Frege used in order to analyze the idea of a natural number, was that of the extension of a concept (Umfang eines Begriffes). The strategy that Frege followed in order to give a definition of each natural number by means of what appeared to be purely logical terms, was precisely based on the use of the notion of the extension of a concept, and ingenious combinations of this notion, together with virtually nothing else. Hence, the use of that notion was absolutely essential to Frege’s attempted reduction. And what did Frege mean by the “extension of a concept”? Well, although at that point he —quite revealingly— eluded to give an explicit definition —under the pretext that “the sense of the expression extension of a concept is assumed to be known” (cf. Frege 1884 §68 footnote, §107)—, we can trace quite clearly what he signified, from the use he made of it: what he meant was simply the totality of things that fall under a given concept (cf. e.g. ibid. §37, §69). That is to say, what Frege meant by the extension of a concept was simply the set of things that fall under the concept in question. Hence, Frege’s attempt to reduce arithmetic to logic was implicitly (but fundamentally) based on the same very notion that Cantor was working out in his own theory: the notion of a “set of objects”. And in fact, although Cantor was not particularly concerned with the reduction of natural numbers to sets, the later developments of the set theory, remarkably von Neumann’s theory of ordinals, would carry out a method for representing natural numbers as sets, which substantially embodied many of the insights of Frege’s attempted reduction.
[9]
Sets and Pluralities - Gustavo Fernández Díez
However, as fate would have it, the use that Frege made in these works of the notion of a set (or better said, of the notion of the “extension of a concept”, as he put it by then), was fatally contaminated by an erroneous assumption. An assumption whose consequences, once detected, would lead to a full revision of the idea of a set, and indeed to a complete reformulation of the whole of set theory. As a result of Frege’s investigation, and thanks, in particular, to this fatal oversight of his, the notion of set, and the entire theory that was being built upon it, were forced to a transformation by which they would abandon their premature state and upgrade to their full–fledged present form. Frege’s erroneous assumption was very simple: to consider that to every well–defined concept there corresponds an extension, i.e., to consider that to every well–defined concept there corresponds the extension, or set, formed by all the objects that fall under it. Put in other words, Frege assumed that whenever we can formulate a clear and precise concept, there will exist an extension, and thus a set, which comprises all things that fulfill the concept in question. Frege’s assumption is known today as the “comprehension principle”, and it is quite understandable that it appeared at the time as a natural thing to hold. Frege adopted it, first in his Foundations of Arithmetic (quite evidently, though never stating it explicitly in that book), and then more definitely in his Basic Laws of Arithmetic, where he placed it as the Basic Law (or “Axiom”) V of his designed formal system for the derivation of arithmetic from logic (Frege 1893–1903 §9). However, despite all appearance of naturalness and intuitiveness, such an assumption was wrong, and the way in which it was shown wrong would turn out to be extremely instructive, leading to an extensive revision and substantial improvement of the theory to which it concerned, i.e., the theory of sets. In fact Cantor himself, by 1899, had already noticed that not all “collections” (or “multiplicities”) could be consistently considered as sets. As he explained it in a letter to his friend and colleague Richard Dedekind, [...] a multiplicity can be such that the assumption that all of its elements “are together” leads to a contradiction, so that it is impossible to conceive of the multiplicity as a unity, as “one finished thing”. Such multiplicities I call absolute infinite or inconsistent multiplicities. [...] If one the other hand the totality of the elements of a multiplicity can be thought of without contradiction as “being together”, so that they can be gathered together into “one thing”, I call a consistent multiplicity or a set (Cantor 1899 114). Indeed, what Cantor was seeing was the possibility that by introducing arbitrarily large collections one could run in contradiction. He detected one such case, which is today known as “Cantor’s paradox” (the details of which
[10]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 5-22
are not of interest to us here). Two years earlier, the italian mathematician Cesare Burali–Forti had detected another, known today as “Burali–Forti’s paradox”. And shortly afterwards, in 1902, Bertrand Russell would report on a third one, known as “Russell’s paradox”, which would definitely shattered the intuitive concept of set, and the whole foundations of the naive set theory that had being handled all the way up to then. Of these three (main) set–theoretical paradoxes, Russell’s paradox is by far the simplest to formulate and to understand. And precisely for that reason the consequences of this paradox were a lot more devastating than those of the other two previous paradoxes had been. In short, Russell’s paradox goes as follows. Russell noticed that most sets are clearly not members of themselves; in contrast, other sets, at least apparently, seem to do so. For example, the “set of all human beings” is not a human being, but a set; hence we can rapidly say that it is a set which does not belong to itself. By contrast, however, the “set of all things which are not teapots”, being as well a set and hence certainly not a teapot, seems to force us to conclude that it is a set which is a member of itself, or so it appears. Hence it seems we have established a classification of sets into two categories: one category for those sets which are members of themselves (i.e., self–membered sets), and another category for those sets which are not members of themselves (non self–membered sets). And it was in this context that Russell suggested to think of a set formed with all sets which are not members of themselves, i.e., a “set of all non self–membered sets”. Indeed, if we put “R” (after Russell) for that set, we will say that any given set X belongs to R, if and only if X is not a member of itself. And then, the contradiction follows at once, as soon as we ask whether the very set R belongs to itself or not: if we suppose that R belongs to R, then R qualifies as a set which is self–membered, and so by the very definition of R, we will have to conclude that R does not belong to R. But if we then, accordingly, assume that R does not belong to R, then we will be forced to conclude that R is a set which belongs to itself after all, and hence by the definition of R, it should not be the case that R belongs to R. In other words: R belongs to R if and only if R does not belong to R (contradiction). The only way out of this trap is to conclude that R does not exist, or at any rate, that despite appearances, R is not really a set. More in general, the lesson drawn from Russell’s and the other set–theoretical paradoxes, was that the unruled introduction of large collections or gatherings of objects had its limits, and that beyond those limits contradictions began to appear. It became necessary to make a revision of the theory, starting from the very beginning, in order to establish some few basic principles which could mark the distinction between collections of objects which formed real sets, and others
[11]
Sets and Pluralities - Gustavo Fernández Díez
which did not. In other words: some basic principles by means of which to distinguish those “extensions of concepts” which could be really said to give rise to a set, from those others which could not. Once such a distinction was drawn, and indeed it did not take too long before several methods were advanced to draw it, it became possible to neatly separate the “sets” from those other collections —“apparent sets”, or as today are technically known, “proper classes”—. In view of all this, Frege’s comprehension principle had to be ineluctably abandoned: not every well–defined concept determines a set, but only those concepts which comply with the axioms of the (renewly founded) set theory. Both Cantor’s definition of set, and Frege’s notion of the extension of a concept, in their original formulations, carried with them a natural and intuitive flavour, that were more than sufficient for qualifying them as purely logical notions: there were conceived in so general terms, they were so immediate, so easy to understand, and so independent of any particular field of study (mathematical or of any other type), that it appeared to be certainly natural at the time to consider them as purely logical concepts. That was the reason why Frege came to be convinced that he had managed to derive all elementary arithmetic from logical principles alone, thereby showing that arithmetic was reducible to logic. With the advent of the set–theoretical paradoxes, however, the comprehension principle had to be set aside, and with it, the naive conception of sets had to be set aside too. After Russell communicated his paradox to Frege in a famous letter (Russell 1902), and following a number of vain struggles of Frege for trying to save his system (Axiom V in particular), Frege gave up. He abandoned his project, and was forced to recognize the inadequacy of the basic notion on which we had erected his theory (the notion of set, or “extension of a concept”), at least in the way he had conceived of it: Because of the definite article, this expression [“the extension of a concept”] appears to designate an object; but there is no object for which this phrase could be a linguistically appropriate designation. From this has arisen the paradoxes of set theory [...]. I myself was under the illusion when, in attempting to provide a logical foundation for numbers, I tried to construe numbers as sets. It is difficult to avoid an expression that has universal currency, before you learn of the mistakes it can give rise to (Frege 1924–1925 269). In the decades that followed the discovery of the paradoxes, set theory was subjected to a complete revision. Several ways were put forward in order to reconstruct the theory, the most successful of all being the so–called axiomatic approach, initiated by the work of Ernst Zermelo. In axiomatic set theory, the
[12]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 5-22
(full, unrestricted) comprehension principle is discarded, and the notion of set does not exhaust itself in the intuitive or naive understanding of it. Instead, a list of axioms are laid down, as a means to regulate the behaviour of sets and to distinguish between true sets and proper classes (i.e. classes which are not sets). Some of the axioms of axiomatic set theory are of a distinct mathematical nature, three of them in particular: the axiom of infinity, which amounts to stating that there exists an infinite set; the axiom of regularity, which amounts to postulating that no set can be self–membered; and the axiom of choice (a little bit more complicated, and whose content is not of interest to us here). Along with these three axioms, other more “natural” ones, so to speak, are laid down, such as: the union axiom, which amounts to saying that the union of two or more sets is another set; the separation axiom, which says that all subsets of a given set are themselves sets; and others. In axiomatic set theory the existence of a set cannot be freely postulated, but has to be derived step by step from the axioms of the theory (on pain of ending up describing a proper class, and then running into contradictions). Most results obtained in naive set theory were harmlessly translated into the new axiomatic framework. Even Frege’s once dreamt reduction of natural numbers to sets, could be realized, if in a succedaneous way, in von Neumann’s theory of ordinals, where each natural number corresponds to a perfectly defined set (called a “finite ordinal”). And in the course of such a reduction, many of Frege’s insights were incorporated (one particularly salient, that the set corresponding to each natural number turned out to be identical to the union of all the preceding ones). All of this work was conducted in the context of a rigid axiomatic schema, in which the natural and intuitive flavour that the notion of set had in the eyes of Cantor and Frege, had almost entirely disappeared. Instead, the notion of set that transpires axiomatic set theory, is the one derived from the axioms (some of them of a distinct mathematical nature), to which practitioners must follow strict observance. The axiomatic notion of set can in no way be regarded any more as a logical notion. And in view of this, it is generally accepted today that Frege’s logicist thesis, as originally stated, is untenable (i.e., it is generally accepted that arithmetic cannot be reduced to logic alone). Such is the price that had to be paid, in the end, for the requirement that a set of things constituted itself a new thing, that is, a new object (which could in turn be a member of other sets).
The notion of plurality of plural logic In contrast with what happened in the case of set theory, whose origin is linked to mathematical science, the basic idea behind plural theory comes from a distinc-
[13]
Sets and Pluralities - Gustavo Fernández Díez
tively linguistic phenomenon: the use of plurals in natural language. And more in particular, the phenomenon of the so–called “plural predication”, i.e., that kind of predication in which a predicate is jointly attributed to a plurality of objects. Indeed, we are all familiar with a predicate being jointly attached to a plurality of objects in the same statement (a linguistic phenomenon which occurs in English and most other natural languages). If we look at this phenomenon more closely, we will see that it adopts either of the following two forms. It can be either a “distributive predication”, that is, one in which the predicate can be also attached to each of the objects individually; for example: “Bill Gates and Paul Allen are immensely rich”, which simply means that “Bill Gates is immensely rich and Paul Allen is immensely rich”. Or it can be a “collective predication”, in which case the predicate does only apply to the whole of the objects taken collectively; for example: “Bill Gates and Paul Allen co–founded Microsoft in 1975”, where the idea of the two doing it together is crucial. Although both are cases of plural predication (and indeed they are superficially —at least syntactically— similar), there is a great difference in meaning between them. We can find more examples of distributive versus collective predication in the texts of some of the most prominent logicians. Thus, Frege again: “Schiller and Goethe are poets” versus “Siemens and Halske have built the first major telegraph network” (Frege 1914 227). The first is distributive, being equivalent to “Shiller is a poet and Goethe is a poet”; the second is collective, as Siemens and Halske worked in the telegraph network together (in fact, as heads of a company known as “Siemens and Halske” at the time), and it would be untrue to say that either of the two did it alone. Also, Aristotle (SE 166a30–35): “Two and three are numbers” (distributive: “two is a number and three is a number”) versus “Two and three are five” (collective: only adding them they make up 5). And other examples of distributive versus collective predication are easy to come up with: “Larry Collins and Dominique Lapierre are well–known writers” (distributive, each of them alone is known enough) versus “Larry Collins and Dominique Lapierre wrote Freedom at midnight” (collective, they wrote it together); “Bill Clinton and Hilary Clinton were candidates in Democratic Presidential Primary Elections” (distributive, they did it in different elections with different results) versus “Bill Clinton and Hilary Clinton married each other in 1975” (collective); etc. The important thing to notice is that in some cases the plural predication distributes itself over the various objects to which the predicates applies, while in others it is only the combination of the objects taken collectively which fulfills the predicate. And it is of course these last cases in particular (the cases of collective predication), which have inspired and given rise to plural logic.
[14]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 5-22
As we said at the beginning, plural logic is a trial to account for the logical role of pluralities of objects without taking the pluralities as objects in themselves. More specifically, it is an attempt to account for pluralities of objects without treating them as sets. It thus aims to represent the logical form of statements of collective predication, in such a way that the collectivity of objects to which the predicate applies, does not have to be taken itself as a single object (and in particular, as a set). This issue turns out to be quite crucial for the representation of logical inferences. For example, from the distributive plural “Gates and Allen are billionaires”, it logically follows e.g. “Gates is a billionaire and someone else is a billionaire”. And using a unary predicate symbol Bx for “x is a billionaire”, and first–order logic as standardly formulated, the corresponding inference can be perfectly well formalized and its validity accounted for. However, from the collective plural “Gates and Allen founded Microsoft” it also follows, e.g. “Gates and someone else founded Microsoft”. But this other inference cannot be formalized by means of the corresponding binary predicate symbol Fxy for “x founded y”. We could use a ternary predicate symbol Gxyz for “x and y founded z”, but this would conceal the semantic similarity between the binary F and the ternary G. To be sure, the logical inference from “Gates and Allen founded Microsoft” to “Gates and someone else founded Microsoft” can be represented within set theory. Indeed, all we have to do is to introduce a new object, a set, for the pair {Gates, Allen}, and then to paraphrase the statements as “The set {Gates, Allen} founded Microsoft” and “The set {Gates, someone else} founded Microsoft”, respectively. Once we have done this, it is straightforward to deduce one statement from the other using first–order logic together with basic set theory. Then the point is this: is it really necessary to postulate the existence of a set (the set {Gates, Allen}) in order to represent the logical structure of the statement “Gates and Allen founded Microsoft”? Is it faithful to the everyday meaning of the sentence “Gates and Allen founded Microsoft”, to paraphrase it as “The set {Gates, Allen} founded Microsoft”? Is there not another way to represent the logical inference from that statement to “Gates and someone else founded Microsoft”, which does not rest on the formal axioms of a full–fledged mathematical theory such as set theory? The attempts to provide satisfactory answers for these questions are what we know today as plural logic: Abandon, if one ever had it, the idea that use of plural forms must always be understood to commit one to the existence of sets (or “classes”, “collections”, or “totalities”) of those things to which the corresponding singular forms apply. [...] It is haywire to think that when you have some Cheerios, you are eating a set—what you’re doing is: eating The Cheerios (Boolos 1984 66, 72).
[15]
Sets and Pluralities - Gustavo Fernández Díez
Probably the main papers which mark the beginning of the investigation in plural logic are Morton (1975), in turn heavily inspired in Leonard and Goodman (1940), and the just cited Boolos (1984), which was written independently of the first two. Later on, the seminal ideas laid down by Morton and Boolos were pursued and successively streamlined in other publications, whose number is rapidly increasing in the last few years. The following are only a sample (we can expect a lot more to come): Grandy (1976, 1977), Boolos (1985), Dowty (1987), Mundy (1989), Lewis (1991), Taylor and Hazen (1992), Lasersohn (1995), Schwarzschild (1996), Yi (1998, 2005, 2006), Cameron (1999), Oliver and Smiley (2001, 2004, 2005a, 2005b, 2006, 2008), Rayo (2002, 2005), Rouilhan (2002), Winter (2002), Linnebo (2003, 2004), Burgess (2004), Frost (2008), Slater (2008). Of all these, the article for the Stanford Encyclopedia of Philosophy (of free online access) Linnebo (2004) (revised 2008), and the substantial contributions of Burgess (2004), Oliver and Smiley (2005a) and Yi (2005, 2006), deserve special mention. Although plural logic is still in evolution, there are some characteristic elements common to nearly all approaches that have been advanced so far. In the formal language we find “plural terms”, whose role is to directly denote pluralities of objects (such as “the founders of Microsoft”). The reference of these terms is constituted by the very objects which make up the plurality in question (e.g., the founders of Microsoft, in the case just mentioned), and never by the set or any other “composite object” made up of them. In addition to plural terms, in the formal language of plural logic we also have the so–called “plural quantifiers”, by means of which one can directly assert the existence of pluralities, or general or universal facts about pluralities. This enables us to translate into this new formal language a statement such as “there were a plurality of people which founded Microsoft in 1975”, by means of the plural existential quantifier; or a statement such as “all orchestras [pluralities] of musicians which play Vienna New Year Concert sound in tune”, using the plural universal quantifier. Finally, plural logic systems also have an additional logical symbol for the relation of an object being among the objects of a given plurality —the “among symbol”, as Burgess (2004 197) calls it—. By means of the among symbol one can immediately translate into the formal language of plural logic a statement such as “Bill Gates was one the founders of Microsoft”, or “Larry Collins is one of the co–authors of Freedom at midnight”, etc. Besides, the among symbol is extremely important for expressing the basic logical features of pluralities (such as two pluralities are equal if and only if every element of one is among the elements of the other, etc). These logical resources (plural terms, plural quantifiers and the among symbol) are not to be found in classical (standard) first–order logic. The addi-
[16]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 5-22
tion of them to first–order logic leads to a proper extension of the logical system. Hence, the logic obtained by this extension contains all logical inferences that are included in standard first–order logic, plus a big new bunch of inferences (the “plural inferences”) that can be validated and accounted for only with the help of the extra resources that this system provides (for example, the inference from the statement “Gates and Allen founded Microsoft” to the statement “Gates and someone else founded Microsoft”, and many others). However, unlike classical first–order logic, plural logic is not recursively axiomatizable, that is to say: there can never be a recursive (“finitely characterizable”) set of axioms or deduction rules for plural logic (cf. e.g. Burgess 2004 220). This means that plural logic is a system of logic far more complex and difficult to handle that first–order logic in its standard form: the introduction of plural terms, plus the plural quantifiers and the new logical symbol “among”, is by not without consequences. But still, it allows to account for inferences involving pluralities without having to resort to set theory. And that was precisely the aim pursued: to find an intermediate logical system between first–order logic and set theory, which was specifically conceived and designed for the representation of inferences involving plural statements. This is not the place to go into more detail with respect to the technical aspects of plural logic, as it would take us too long, and we are here mainly concerned with the philosophical import that this theory carries with it. The important thing to point out, once again, is that pluralities are not taken as objects in themselves, but only as ways of conveying the objects they contain. For this reason plural logic systems do not normally allow “pluralities of pluralities”, that is to say, pluralities which are constituted by other pluralities. The operation of forming pluralities is not normally allowed to iterate. To be sure, a few variants have explored the possibility of admitting “superpluralities” (pluralities whose members were themselves pluralities of individual objects). For example, when we say “the Mafia families of New York City cooperate against the police” we are making a plural predication about that complex plurality (the whole of the Mafia families of NYC) whose elements (the families) are themselves pluralities of individuals. But even in the variants of plural logic which admit these complex plurality cases and provide the logical resources to deal with them, the possibility of indefinitely re–iterating this complexity is out of the question. The reason is plain to see: if we permitted infinite chains of pluralities being members of other pluralities, we would end up falling into exactly the same kind of paradoxes that were encountered by the notion of set in the early times of set theory, by the turn of the 19th to the 20th century, recalled in the preceding section of this paper. And that is precisely what plural logic theoreticians try to avoid.
[17]
Sets and Pluralities - Gustavo Fernández Díez
As remarked before, plural logic is motivated by a linguistic phenomenon: the use of plurals in English and other natural languages. More in particular, that use of plurals in which there is no trace of an implicit appeal to the existence of a “composite entity” (name it “set” or whatever) that gathers together the elements plurally referred. Even the discussion on whether the so–called “super pluralities” should be allowed, is neatly connected to these two points: their relevancy for analyzing English or other natural language real statements, and the condition of avoiding any commitment to the existence of pluralities of any level as objects in themselves (cf. Linnebo 2004 §2.4). This condition is fulfilled by modelling superpluralities as complex structures directly imposed upon the individuals at the lowest level, so that at no point in the process a plurality is treated itself as a single object.
Conclusion As we have seen, the difference between the philosophical ground which is behind each of these two notions (the notion of set, and the notion of plurality), is enormous. The notion of set is eminently a mathematical notion. It was first conceived with an air of freshness which made it appear as a purely logical notion, despite the eminent mathematical role that it was meant to play. The discovery of the paradoxes showed that for that notion to play a role as a foundational concept for the various branches of mathematics, the naiveness about it had to disappear. Set theory was axiomatized, and the notion of set derived from the axiomatic theory lost all the freshness that the preceding notion had had. By contrast, the notion of plurality which emanates from plural logic, is inspired and motivated by a linguistic phenomenon. Oddly enough, it appears to recover much of that freshness that the notion of set once had, as indeed the sense of “plurality” that derives from the everyday use of plurals is much more akin to plural logic than to the concept of set of axiomatic set theory. But there is one fundamental difference between them: sets were conceived from the beginning as collections of objects forming “new objects”, with the specific proviso that they could be members of other sets and so on, in an indefinitely iterative operation (iterativity that was essential to the mathematical expansion of the universe of sets, so that they could play the foundational role that they were meant to); while pluralities were, also from the beginning, expressly not allowed to be thought of as objects in themselves. And that is why the pluralities of plural logic, though serving very well the purpose of representing natural language plural expressions and inferences, will never be able to do the mathematical job that the sets of set theory do.
[18]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 5-22
We can conclude that the two notions are complementary, rather than rival. The motivations for the introduction of one and the other are different; the roles that each of them is meant to play are different too; and they are regulated by completely opposite principles: the idea that a set must be an object in itself, and thus eligible to be a member of other sets, versus the idea that a plurality cannot be regarded as a thing in itself. Plural logic can no doubt help to undermine the appeal to sets in representing the logical structure of every day statements such as “I am eating the cheerios” (which obviously does not carry with it any kind of ontological commitment to a “set” of cheerios in the sense of axiomatic set theory). For this reason we should welcome the appearance of plural logic as a new logical system to occupy a place in the catalogue of non– classical logics. But there is no serious prospect, in my view, that the notion of plurality which emanates from plural logic can ever override the notion of set of axiomatic set theory as used in mathematics, or as used for the foundations of mathematical and metalogical theories; hence, there is no serious prospect that the notion of plurality can ever discharge the ontological commitments that the notion of set carries with it in all those contexts.
Works Cited Aristotle. (SE) “Sophistical Refutations”. The Complete Works of Aristotle, revised Oxford translation edited by J. Barnes. Vol I. Princeton (NJ): Princeton University Press, 1984. 278–314. Boolos, George. “To Be is to Be a Value of a Variable (or to Be Some Values of Some Variables)”. The Journal of Philosophy 81 (1984): 430–449. (Reprinted in Logic, Logic and Logic 54–72). —. “Nominalist Platonism”. The Philosophical Review 94 (1985): 327–344. (Reprinted in Logic, Logic and Logic 73–87). —. Logic, Logic and Logic. Cambridge (MA): Harvard University Press, 1998. Burgess, John P. “E Pluribus Unum: Plural Logic and Set Theory”. Philosophia Mathematica 12 (2004): 193–221. Cameron, J. Robin. “Plural Reference”. Ratio. New series 12 (1999): 128–147. Cantor, Georg. “Beiträge zur Begründung der transfiniten Mengenlehere (I)”. Mathematische Annalen 46 (1895): 481–512. —. “Beiträge zur Begründung der transfiniten Mengenlehere (II)”. Mathematische Annalen 49 (1897) 207–246.
[19]
Sets and Pluralities - Gustavo Fernández Díez
—. “Letter to Dedekind”. Trans. S. Bauer–Mengelberg. Heijenoort 113–117. Dowty, David. “Collective Predicates, Distributive Predicates and All”. Proceedings of the Third Eastern States Conference on Linguistics (ESCOL) ’86. Ed. F. Marshall, A. Miller and Z. Zhang. Columbus (OH): Ohio State University. 97–115. Frege, Gottlob. Begriffsschrift, Verlag von Louis Nebert, Halle, 1879. (English transl S. Bauer–Mengelberg. Heijenoort 1–82). —. Die Grundlagen der Arithmetik, Verlag von Wilhen Koebner, Breslau, 1884. (English transl J. L. Austin The Foundations of Arithmetic. 2nd rev. ed. Oxford: Basil Blackwell, 1978). —. Die Grundgesetze der Arithmetik, 2 vols. Verlag Hermann Pohle, Vol I, 1893; Vol. II, 1903. (Partial english transl. M. Furth The Basic Laws of Arithmetic. Berkeley (CA): University of California Press, 1964). —. Logic in Mathematics. 1914. Manuscript. (English transl. P. Long and R. White. Poshumous Writings 203–250). —, Sources of Knowledge of Mathematics and the mathematical natural Sciences. 1924–1925. Manuscript. (English transl. P. Long and R. White. Poshumous Writings 267–274). —. Poshumous Writings. Ed. H. Hermes, F. Kambartel and F. Kaulbach. Oxford: Basil Blackwell, 1979. Frost–Arnold, Greg. “Too much reference: Semantics for multiplying signifying terms”. Journal of Philosophical Logic 37 (2008): 239–257. Grandy, Richard E. “Anadic Logic and English”. Synthese 32 (1976): 395–402. —. Advanced Logic for Applications, Dordrecht: Reidel, 1977. Heijenoort, Jean van, ed. From Frege to Gödel. Cambridge (MA): Harvard University Press, 1967. Lasersohn, Peter. Plurality, Conjunction and Events, Dordrecht: Kluwer Academic Publishers, 1995. Leonard, Henry S. and Nelson Goodman “The Calculus of Individuals and Its Uses”. The Journal of Symbolic Logic 5 (1940): 45–55. Lewis, David. Parts of Classes, Oxford: Blackwell, 1991. Linnebo, Øystein. “Plural Quantification Exposed”. Noûs 37 (2003): 71–92.
[20]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 5-22
—. “Plural Quantification” 2004, rev. ed. 2008. The Stanford Encyclopedia of Philosophy. Web. 10 Nov 2008. <http://plato.stanford.edu/entries/plural– quant/>. Morton, Adam. “Complex Individuals and Multigrade Relations”. Noûs 9 (1975) 309–318. Mundy, Brent. “Elementary Categorial Logic, Predicates of Variable Degree, and Theory of Quantity”. The Journal of Philosophical Logic 18 (1989): 115–140. Oliver, Alex and Timothy Smiley. “Strategies for a Logic of Plurals”. The Philosophical Quarterly 51 (2001): 289–306. —. “Multigrade Predicates”. Mind 113 (2004): 609–681. —. (2005a) “A Modest Logic for Plurals”. Journal of Philosophical Logic 35 (2006): 317–348. —. (2005b) “Plural descriptions and many–valued functions”. Mind 114 (2005): 1039–1068. —. “What are sets and what are they for?”. “Noûs. 2006 Supplement Philosphical Perspectives on “Metaphysics”. 2006, pp. 123–155 (errata for this paper in “Noûs” 41, 2007, p. 354). —. “Is Plural Denotation Collective?”. Analysis 68 (2008): 22–34. Rayo, Agustín. “Word and Objects”. Noûs 36 (2002): 436–464. —. “Plurals”. Philosophical Compass 2 (2007): 411–427. Rouilhan, Philippe de. “On What There Are”. Proceedings of the Aristotelian Society 102 (2002): 183–200. Russell, Bertrand. “Letter to Frege”. Transl B. Woodward. Heijenoort 124–126. Schwarzschild, Roger. Pluralities, Dordrecht: Kluwer Academic Publishers, 1996. Slater, B. Hartley. “Natural Language Sets”. Logique et Analyse. 201 (2008): 29–48. Taylor, Barry and A. P. Hazen “Flexibly Structured Predication”. Logique et Analyse 139–140 (1992): 375–393. Winter, Yoad. “Atoms and Sets: A Characterization of Semantic Number”. Linguistic Inquiry 33 (2002): 493–505. Yi, Byeong–Uk. “Numbers and Relations”. Erkentnnis 49 (1998): 93–113.
[21]
Sets and Pluralities - Gustavo Fernández Díez
—. “The Logic and Meaning of Plurals. Part I”. Journal of Philosophical Logic 34 (2005): 459–506. —. “The Logic and Meaning of Plurals. Part II”. Journal of Philosophical Logic 35, (2006): 239–288.
[22]
¿Probabilidad cuántica o espacio–tiempo relativista? Rafael Andrés Alemañ Berenguer1
Resumen Se admite generalmente que las teorías cuánticas de campos combinan satisfactoriamente la relatividad especial y la física cuántica. Sin embargo, no se dispone todavía de una descripción relativista satisfactoria del colapso de la función de onda. El hecho de que el instante de dicho colapso dependa de cada observador inercial rompe con la interpretación de la probabilidad cuántica como una propiedad objetiva de los micro– objetos. Las alternativas parecen ser el abandono de la equivalencia entre sistemas inerciales, o un replanteamiento de nuestras ideas sobre una posible estructura subyacente al espacio–tiempo. Palabras clave: relatividad, cuántica, colapso, probabilidad, espacio–tiempo.
Abstract It is generally admitted that quantum field theories satisfactorily combine special relativity and quantum physics. However, a proper relativistic description for the wave–function collapse has not been achieved. The fact that the instant of this collapse depends on inertial observers ruins the propensity interpretation of quantum probability as an objective property of the micro–objects. The alternatives seem to be the abandonment of the physical equivalence among inertial frames, or a reformulation of our ideas on a possible underlying structure for space–time. Keywords: relativity, quantum, collapse, probability, space–time.
1
Dpto. de Ciencia de Materiales, Óptica y Tecnología Electrónica. Universidad Miguel Hernández – Elche, España. Correo electrónico: raalbe.autor@gmail.com.
Probabilidad cuántica o espacio–tiempo relativista - Rafael Andrés Alemañ Berenguer
Introducción Cuando Paul Dirac presentó su conocida ecuación cuántico–relativista para el electrón, pareció que la reconciliación entre las dos grandes revoluciones en la física del siglo XX se hallaba próxima a completarse. La relatividad de Einstein por un lado, y la teoría cuántica por otro habían trastocado dramáticamente nuestra concepción del la naturaleza. Y los expertos no dejaron de preguntarse si la conjunción entre ambas era posible. Al fin y al cabo la expectativa parecía muy razonable: los fenómenos cuánticos habían de poderse contemplar desde cualesquiera sistemas de referencia en movimiento inercial relativo. Sin embargo, pocos autores repararon en que, dado que las funciones de onda se definían en un espacio de abstracto de configuraciones, el hecho de que obedeciesen las transformaciones de Lorentz, no garantizaba un significado físico tan directo como en la mecánica relativista. Es más, el proceso más importante desde un punto de vista empírico, la reducción de la función de onda, aún carecía de un adecuado tratamiento relativista, por cuanto era expresada todavía como un acontecimiento instantáneo. El posterior desarrollo de la teoría cuántica de campos, trocando funciones de onda por operadores sobre espacios de Fock, no mejoró las cosas. La relatividad especial 2 combina las coordenadas de espacio y tiempo en un entramado espacio–temporal que constituye de por sí el escenario de todos los acaecimientos del universo. Por otra parte, la teoría cuántica permite la existencia de estados “entrelazados”; es decir, estados en los cuales las propiedades de las partículas sólo pueden definirse de manera conjunta y por ello los resultados de las medidas se encuentran correlacionados con independencia de la distancia que las separe. El problema surge cuando las transformaciones relativistas de espacio y tiempo convierten los entrelazamientos entre sistemas espacialmente separados en correlaciones entre estados cuánticos en distintos instantes. Y no parece haber una salida natural a este conflicto, que comparativamente ha recibido mucha menos atención que famosas paradojas como las asociadas con el gato de Schroedinger (problema de la transición del régimen cuántico al clásico) o con los efectos EPR (problema de la no localidad cuántica).
2
El controvertido vínculo entre la física cuántica y la relatividad general no se menciona directamente al tratarse del objetivo central del programa de las teorías de campo unificado, o “teorías del todo”.
[24]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 23-41
El nacimiento de un dilema Desde sus propios orígenes, resultó evidente que la teoría cuántica contenía elementos difícilmente reconciliables con la relatividad especial. La teoría de Einstein sustentaba una visión geométrica del espacio–tiempo, en la que pasado presente y futuro componían una estructura única cuya percepción conjunta quedaba vedada por la tridimensionalidad de nuestros sentidos. En total oposición se situaba el indeterminismo cuántico, promotor de una realidad esencialmente probabilista, y por ello aleatoriamente abierta a numerosas posibilidades de futuro. Ahora bien, si “futuro” es un término relativo —de acuerdo con Einstein, lo que para unos es futuro para otros puede ser presente o pasado— ¿qué sentido tiene semejante indeterminismo? A lo más, podría considerarse como una expresión de nuestra ignorancia sobre la totalidad de los acontecimientos físicos desplegados espacio–temporalmente. Pero esto choca frontalmente con las interpretaciones que atribuyen un carácter objetivo a las probabilidades cuánticas. La Relatividad especial, así pues, parecería abogar por la existencia de variables ocultas en un nivel submicroscópico. La alternativa obvia a esta postura, consistiría en negar la validez de la descripción espacio–temporal, típicamente relativista, en el reino de los fenómenos cuánticos. La idea de un continuo tetradimensional escindible en espacio y tiempo según cada sistema de referencia inercial, sería lisa y llanamente inaplicable en el rango de tamaños en el cual cobran importancia los efectos cuánticos. Esa fue la posición de Bohr, si bien el danés nunca llegó a precisar la idea que en su opinión debería sustituir la del espacio–tiempo relativista. El propósito de combinar congruentemente la teoría cuántica con los presupuestos de la Relatividad especial, parece requerir el cumplimiento de una serie de condiciones a primera vista poco reconciliables entre sí; a saber: (1) la evolución dinámica de los sistemas cuánticos debería describirse en términos espacio–temporales, en relación con algún sistema de referencia inercial; o bien, (2) las transformaciones de coordenadas entre sistemas de referencia inerciales deberían ser las de Lorentz, de modo que los estados cuánticos y sus leyes de evolución permaneciesen invariantes. Pero el camino hacia la conjunción de ambas teorías aparece plagado de trampas engañosas, cuya complejidad es mucho más profunda de lo que parece en un primer análisis superficial. Los sistemas cuánticos, para empezar, se representan mediante operadores de densidad o vectores de estado (tradicionalmente llamados “funciones de onda”) en un espacio de Hilbert, y su evolución tiene lugar en ese mismo escenario abstracto. Ahora bien, el espacio de Hilbert no guarda relación directa, en modo alguno, con nuestro familiar espacio–tiempo en el que
[25]
Probabilidad cuántica o espacio–tiempo relativista - Rafael Andrés Alemañ Berenguer
se aplican los principios de la relatividad especial. No hay forma de obtener el espacio–tiempo como caso límite de un espacio de Hilbert. En segundo lugar —aunque no menos importante— nos topamos con la dificultad esencial de concebir el colapso de la función de onda como un proceso físico en un cierto marco espacio–temporal. Los experimentos de difracción de cuantones a través de una rendija, se explican mediante el ensanchamiento en el espacio de la amplitud de probabilidad representada por la función de onda. Sin embargo, cuando se produce una interacción (denomínese “medida” si se quiere) como el oscurecimiento de un punto concreto en una placa fotográfica situada tras la abertura, por ejemplo, la función de onda se anula —colapsa— instantáneamente en todo el espacio circundante. Del mismo modo, una medición realizada sobre un miembro de una pareja de cuantones entrelazados, colapsa la superposición y cambia el estado del otro componente de la pareja. El dilema es obvio: ¿cómo pueden expresarse estos colapsos en términos espacio– temporales?, ¿es aceptable su índole instantánea y no local en un contexto relativista? La gravedad de tales incógnitas ha inclinado a numerosos investigadores hacia una interpretación instrumental, centrada en la utilidad de la función de onda como mero artefacto mediante el cual el observador obtiene el máximo conocimiento posible del sistema observado. Pero esto nos llevaría sin remedio hacia un subjetivismo difícilmente admisible en una teoría física formulada con rigor. La escapatoria más sencilla consiste en negar la raíz del problema y adherirse a una teoría sin colapso, ya sea modificando la dinámica de la teoría cuántica ordinaria (Bohm 1952; Albert 1992; Cushing 1994, 1996), o incluso su ontología (DeWitt y Graham 1971). Un mérito adicional de estas dos posibles opciones estriba en su capacidad para despojar la física cuántica de su naturaleza probabilista. Efectivamente, por un lado la dinámica de Bohm es determinista3, y por otro la interpretación de Everett permite que cualquier resultado de un experimento cuántico tenga lugar en alguno de sus múltiples universos.
Objetividad del ‘colapso’ cuántico Uno de los postulados en los que Von Neumann basó su formalización matemática de la naciente física cuántica, era el de la reducción o “colapso” de la función de onda. Consiste en una prescripción que, cuando se realiza una medida, nos obliga a abandonar la superposición lineal de los diversos estados posibles de un microsistema, y conservar tan solo la función correspondiente 3
Al menos en su forma original, pero véase Nelson (1985).
[26]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 23-41
al resultado obtenido de hecho en el experimento. A ninguno de los padres fundadores de la teoría cuántica se les ocultaba que semejante colapso era, con toda evidencia, un proceso no relativista. En principio el asunto parecía revestir escasa importancia puesto que el formalismo de Von Neumann también era explícitamente no relativista; el gran matemático húngaro–americano no pretendía otra cosa en aquellos momentos. Las inquietudes, empero, fueron creciendo conforme se revelaba que la conciliación de la Relatividad con este aspecto de la física cuántica, resultaba mucho más delicada de lo que con tanta ingenuidad se había supuesto. El problema, curiosamente, acabó envuelto en la más amplia polémica sobre el problema de la medida cuántica. La confusión y las perplejidades acarreadas por las andanzas del gato de Schroedinger, eran tan asombrosas de por sí que acabaron por eclipsar las implicaciones relativistas del debate. Pero tales implicaciones, pese a permanecer ignoradas, subsistieron estrechamente ligadas al indeterminismo de la teoría cuántica. La dinámica unitaria y lineal, común a las formulaciones ordinarias de la teoría cuántica elemental, no proporciona las descripciones de los procesos físicos que cabría esperar a partir de nuestra experiencia directa. La práctica cotidiana muestra que las medidas experimentales arrojan valores concretos y bien definidos, no una mera superposición de resultados potenciales. Se admite en general que el carácter no determinista de la teoría cuántica proviene de la conjunción de dos premisas: a. La función de estado, Ψ, constituye una representación completa de los sistemas cuánticos (los autoestados y los autovalores configuran la única descripción posible de los mismos) b. Ψ siempre evoluciona en el tiempo de acuerdo con una ecuación dinámica lineal. Tan embarazosa situación fue resumida por Bell en un célebre comentario (Bell 1987), según el cual o la descripción usual del estado cuántico no lo es todo, o la evolución cuántica unitaria no es del todo correcta4. El creciente interés en las teorías cuánticas no lineales se justifica por la riqueza de posibilidades que ofrece en dominios de la investigación como la gravedad cuántica, teorías de cuerdas, representaciones algebraicas y toda clase de especulaciones funda4
En esta dicotomía no entra la teoría de muchos universos debida a Everett, en la cual se supone que la descripción cuántica es completa y la evolución unitaria correcta. Una interesante discusión del asunto aparece en Barrett (1999).
[27]
Probabilidad cuántica o espacio–tiempo relativista - Rafael Andrés Alemañ Berenguer
mentales. Ahora bien, se hace pronto evidente que tales formulaciones padecen, en origen, graves defectos formales que hacen de su manejo una cuestión harto delicada. Los obstáculos teóricos son de muy diverso género, pero quizás el más notorio surge de su conflicto con la relatividad (o, en otras versiones, con el principio de causalidad). Se ha señalado que la no linealidad en las ecuaciones cuánticas permitiría emplear las correlaciones EPR y el colapso instantáneo de la función de estado, para establecer una comunicación efectiva entre sucesos separados por un intervalo de tipo espacial (Gisin 1989, 1990; Svetlichny 1995). Una solución factible pasaría por modificar los algoritmos asociados a los procesos de medida, ya que la dificultad parece residir en el carácter instantáneo de la reducción del vector de estado, de modo que la no linealidad resultante impidiese señales más veloces que la luz. Otros autores, por su parte, han argüido que la no linealidad de las ecuaciones no es en sí misma el origen de estos inconvenientes (Goldin 1994; Doebner & Goldin 1995; Doebener, Goldin & Nattermann, 1996). De todas las teorías sin colapso debido a mediciones, la más adaptable a las exigencias relativistas es la de las llamadas “historias coherentes”, extensamente discutida en la literatura especializada (Roland Omnès 1994). Por tanto, resolver el problema cuántico de la medida implica, o bien rechazar uno de estos dos supuestos (linealidad y completitud), o alternativamente explicar la disparidad entre nuestra experiencia y las inevitables superposiciones macroscópicas a las que nos aboca la teoría. En caso de que optemos por suprimir alguna de las dos premisas anteriores, hemos de hacerlo en el marco de una reasignación global de significado a los conceptos básicos de la teoría, que debe ser a la vez empíricamente correcta y lógicamente coherente. Tales replanteamientos semánticos se conocen como “interpretaciones” de la física cuántica, los cuales, pese a su vertiginosa abundancia, pueden clasificarse en tres grandes grupos5. El primero de ellos lo componen las interpretaciones basadas en el colapso objetivo de la función Ψ, caracterizadas por rechazar el supuesto de linealidad en la evolución de la función de estado. Se suelen reescribir las ecuaciones dinámicas de modo que resulten sensibles a ciertos valores umbrales del número de partículas o de la densidad de masa en un sistema cuántico. Al superar estos umbrales se produce el colapso de la función de estado de forma espontánea y estocástica. La propuesta más desarrollada de esta clase (conocida como teoría GRW) se debe a Ghirardi, Rimini y Weber (1986). 5
Véanse Albert (1992) y Barrett (1999) para una interesante discusión al respecto.
[28]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 23-41
Junto a la teoría GRW, y en leal competción, se alzan los postulados básicos de la teoría cuántica alternativa elaborada por Bohm6. Uno de ellos afirma la existencia de partículas cuyo comportamiento obedece las prescripciones contenidas en la función de onda a ellas asociada, la cual evoluciona en el tiempo y en el espacio de acuerdo con cierta ecuación directora según el caso. En la situación más sencilla, la ecuación de Schroedinger y esta última ecuación de guía, serían las leyes fundamentales del mundo microscópico, según las ideas de Bohm. A menudo se añade un supuesto llamado “postulado de distribución”. Este postulado consiste en admitir que la densidad de probabilidad inicial de las partículas, viene dada por el valor absoluto del cuadrado de la función de onda inicial, |Ψ|2 . No es excesivamente difícil construir versiones relativistas de una teoría cuántica al estilo de Bohm para una sola partícula (Bohm 1953; Bohm & Hiley, 1993; Holland 1993). Las cosas realmente existentes o “existenciables” (beables, en la terminología del físico John Bell) serían ahora la función de onda de la partícula y su trayectoria, entendida ésta como la curva integral de un cierto campo 4–vectorial7. Lo cierto es que cualquier teoría puede hacerse trivialmente covariante bajo las transformaciones de Lorentz, mediante el recurso de añadir todas las estructuras adicionales que resulten necesarias. Bastar con incluir, por ejemplo, un sistema de referencia inercial privilegiado como parte de la especificación de los estados cuánticos. Parece evidente, no obstante, que actuando así no logramos una genuina covariancia relativista -entendida ésta como el cumplimiento de las simetrías geométricas del espacio–tiempo minkowskiano- aunque se trate de una noción muy sutil y controvertida8. Tal grado de incandescencia ha alcanzado la controversia, que algún experto ha llegado a sostener por escrito la imposibilidad de construir una teoría física realista capaz de acomodar en su seno tanto los fenómenos cuánticos como las exigencias de covariancia relativista (Albert 2000). No es obvio en absoluto si las interpretaciones de la física cuántica que tratan de resolver el problema de la medida, comportan también una violación de la invariancia de Lorentz, impidiendo con ello su compatibilidad con la relatividad especial. Si restringimos su significado, la invariancia lorentziana 6
Para una discusión filosófica sobre las teorías bohmianas de campos cuánticos, es aconsejable consultar Callender y Weingard (1997). Una de las más recientes versiones de tales teorías se halla en Durr et al (2003). Y una interesante tentativa de construir una teoría bohmiana sin recurrir, hasta cierto punto, a un referencial privilegiado, se debe a Goldstein et al (2003).
7
Por ejemplo, las corrientes asociadas de modo natural a las ecuaciones de Klein–Gordon o Dirac.
Una explicación notablemente diáfana de tales dificultades puede hallarse en Bell (1987, 1990) o en Albert (1992).
8
[29]
Probabilidad cuántica o espacio–tiempo relativista - Rafael Andrés Alemañ Berenguer
afectaría tan solo a las leyes dinámicas que gobiernan la conducta de la materia y la radiación, no a la estructura del espacio–tiempo en sí misma. Entendida así, la invariancia de Lorentz no es una simetría espacio–temporal, sino puramente dinámica. Y dado que el comportamiento de la materia y la radiación en diferentes sistemas de referencia obedece las transformaciones de Lorentz, este punto de vista resulta empíricamente adecuado. Sin embargo, las teorías lorentzianas de este tipo adolecen de un grave defecto formal, pues se muestran incapaces de reflejar con todo rigor las simetrías espacio–temporales como sí lo consigue la relatividad especial. Parafraseando a Einstein, podríamos decir que en esta perspectiva encontramos asimetrías teóricas que no parecen existir en los fenómenos (Janssen 2002). Por si todo esto fuese poco, todavía más confusiones ocasiona la participación en el debate de las lecturas atípicas de la invariancia de Lorentz (denominadas “teorías con dependencia del hiperplano”). Si se acepta la validez de estas formulaciones inusuales, cualquiera de las interpretaciones cuánticas precedentes tendría derecho a juzgarse invariante bajo las transformaciones de Lorentz. Recordemos que al aplicar una transformación de Lorentz trasladamos nuestra perspectiva del mundo desde un cierto sistema inercial, que escinde el espacio– tiempo en una 3–superficie espacial y un eje temporal asociado (eso es la foliación espacio–temporal), a otro sistema de referencia también inercial con su propia foliación del espacio–tiempo. Es necesario, en todo caso, subrayar las diferencias prácticas entre la perspectiva espacio–temporal de un observador concreto, y una foliación tetradimensional asociada con dicho observador. Es verdad que un observador puede situarse en cualquier sistema de referencia físicamente accesible. Y también lo es que cada referencial está acompañado por una foliación consistente en hiperplanos ortogonales a su eje temporal (o, si se prefiere, a la línea de universo del observador ubicado en el referencial). Los relatos pedagógicos tradicionales en la relatividad -con sus ilustraciones sobre observadores montados en trenes o, modernamente, cosmonaves- se arriesgan a transmitir la impresión de que el observador tiene acceso directo a todos los puntos que en cada instante forman su hiperplano espacial asociado. En realidad, cualquier observador carece de información sobre sucesos que no se hallen en la región que cabría denominar su “pasado causal” (su cono de luz pasado), sin que mantenga una relación con aquellos acontecimientos que le son causalmente ajenos, aunque se encuentren estos en su hiperplano espacial ortogonal De hecho, para dada punto espacio–temporal P disponemos de una multitud de presentes a escoger, cada uno correspondiente a las diversas hipersuperficies que contienen P. Falla, pues, la idea de un presente espacialmente extenso e independiente de una foliación arbitrariamente escogida.
[30]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 23-41
La fallida descripción relativista del colapso Pues bien, siendo todo ello cierto, se sabe que en la vecindad de regiones espacio–temporales en las que se produzca un colapso de la función de onda, resulta imposible aplicar coherentemente las transformaciones de Lorentz. Pura y simplemente, no podemos realizar una transformación desde un hiperplano de simultaneidad para el cual el colapso se sitúa en su futuro, hasta otro hiperplano con respecto al cual ese mismo colapso está en el pasado. Sólo renunciando a tratar por separado estos puntos singulares —los colapsos— se evitan las dificultades. Por el contrario, las transformaciones han de aplicarse a segmentos finitos de la línea de universo de un sistema cuántico, segmentos que ahora sí pueden incluir también un colapso de la función de onda. Aun así el coste es elevado, pues el colapso del estado cuántico tiene lugar instantáneamente en cada hiperplano de simultaneidad asociado a cada sistema inercial de referencia. La decisión de adoptar la covariancia de Lorentz estricta descansa en nuestra convicción de que las simetrías espacio–temporales subyacentes a la Relatividad especial deben ser respetadas también por la teoría cuántica en cualquiera de sus formas. Sin duda, podría tratarse de una suposición equivocada. Pero mientras no se demuestre lo contrario, haremos bien en admitir que los requisitos relativistas han sido satisfechos siempre por la naturaleza, y en comprobar hasta dónde nos lleva las expectativas de su cumplimiento también en el micromundo. A este respecto, la clave de la controversia estriba en la imposibilidad de establecer un sistema de referencia inercial privilegiado. Y si no existe semejante referencial preferente, en cierto sentido las afirmaciones realizadas sobre la naturaleza por un observador inercial deben ser esencialmente equivalentes a las afirmaciones de cualquier otro observador inercial. Esto no significa, desde luego, que las propiedades de un mismo fenómeno físico sean idénticas, punto por punto, en todos los sistemas inerciales; ya sabemos que no es así. La relatividad tan solo impone que los valores de dichas propiedades en distintos sistemas de referencia, se relacionen entre sí mediante determinadas transformaciones de coordenadas (a saber, las transformaciones de Lorentz). Solucionar el enredo imponiendo una foliación privilegiada en el espacio–tiempo relativista de Minkowski —ya se dijo— enturbiaría la teoría con asimetrías sin contrapartida en los fenómenos. Y no se consigue una mejora notable al adoptar el punto de vista de la teoría GRW. También aquí hay una foliación espacio– temporal preferida, pues la dinámica del colapso de Ψ no es invariante de Lorentz (Albert 2000). Ahora bien, las teorías GRW de segunda cuantización predicen violaciones ocasionales de la invariancia de Lorentz, diminutas pero observables, lo que permitiría escoger un sistema de referencia privilegiado.
[31]
Probabilidad cuántica o espacio–tiempo relativista - Rafael Andrés Alemañ Berenguer
El perfil de la futura gravedad cuántica, demasiado rudimentaria aún en sus primeros balbuceos, tampoco sirve de mucha ayuda. Algunos de estos bosquejos teóricos parecen apoyar la posibilidad de una foliación preferida, mientras que otros (como la gravedad cuántica de bucles) prescinden de semejante artimaña. Pero también es cierto que ninguna de estas teorías se halla plenamente desarrollada, la mayoría carece de suficiente poder predictivo, e incluso algunas de ellas (la teoría topológica de campos cuánticos, por ejemplo) ni siquiera cuenta con una noción física de “interacción local” en modo alguno. La simetría del espacio de Hilbert, por otra parte, permite expresar una función de estado en cualquiera de las posibles bases funcionales (posición, energía, impulso, espín, etc.) a nuestro alcance. Una función Ψ que se escriba como superposición en una cierta base, no tiene por qué desarrollarse también como combinación lineal en otra base diferente. Por ejemplo, una función de estado que resulte ser autofunción del operador espín en el eje X con valor propio —½, se expresará en general como una superposición de las autofunciones cuyos valores propios sean + ½ y –½ en el eje Z. Por consiguiente, si atribuimos una realidad física objetiva al colapso de la función de estado, hemos de decidir en qué base tiene lugar. Una elección cómoda —pero no lógicamente necesaria— es la base de posiciones, como se hace en la teoría GRW, lo que suprimiría las superposiciones de propiedades macroscópicas en otras bases. Sin embargo, esto no eliminaría las superposiciones en bases asociadas con operadores distintos: los autoestados en el espacio de posiciones, digamos, se corresponden con estados que no son propios en el espacio de los impulsos.
Probabilismo cuántico y atemporalidad relativista Las dificultades se agudizan cuando tratamos de acoplar las perspectivas que sobre la variable tiempo nos ofrecen tanto la Relatividad especial (no hay un genuino “flujo del tiempo”, los sucesos forman series —líneas de universo— causalmente conectadas en el espacio–tiempo de Minkowski) como la teoría cuántica (probabilidades objetivas asignadas a sucesos aleatorios impredecibles). Supongamos para fijar ideas que en un instante t un átomo radiactivo presenta, según nuestros cálculos, una probabilidad igual a 0,5 de desintegrarse al día siguiente. Ahora bien, una afirmación semejante tan solo tiene sentido si en el instante t no hay un futuro “prefijado” por la geometría de Minkowski que sustenta la relatividad especial. De tener un cuadro espacio–temporal completo en el que dicho átomo estuviese desintegrado a las veinticuatro horas
[32]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 23-41
a partir de t, la probabilidad entendida como una propiedad objetiva del fenómeno físico, no debería ser 0,5 sino 1. Además de la no localidad EPR, esta es otra de las claves de la incompatibilidad conceptual —aunque no empírica— entre ambas teorías: si la relatividad especial aboga por una imagen estática del espacio–tiempo, imposibilita a la vez la asignación de probabilidades objetivas y no triviales a los fenómenos cuánticos (Shanks 1991). Se ha aducido al respecto que esta incomodidad teórica sólo surge adoptando ciertas interpretaciones del azar, concretamente la interpretación propensiva de Popper sobre la probabilidad. Otros autores (Lewis 1994), admitiendo la ausencia de flujo temporal, consideran que la imposibilidad de obtener información sobre acontecimientos futuros salvaguarda la objetividad de las probabilidades. Puede ser así, pero ello nos acerca peligrosamente a la controversia sobre el carácter incompleto de la función de estado y su naturaleza como una entidad física por derecho (en lugar de tomarla como una mera herramienta de cálculo, según pensaban Bohr y sus seguidores). Tampoco ha de olvidarse que la mayoría de los investigadores han rehuido estos debates a causa de su aroma filosóficamente sospechoso, toda vez que siempre han venido entremezclados con abstrusas cuestiones acerca del fatalismo y la predestinación9. Quizás por eso no faltan quienes piensan que incluso sumergidos en una realidad física atemporal, en el sentido de Minkowski, las probabilidades cuánticas sí poseen un significado objetivo, al igual que la geometría espacio–temporal de la relatividad no minó nuestras convicciones sobre el libre albedrío. La respuesta a este dilema no parece tan sencilla si pensamos en una pareja de observadores A y B tal como los describe la relatividad especial. Suponiendo que B se mueva con respecto al átomo radiactivo de modo que para él la desintegración no se ha producido, su plano de simultaneidad le permite asignarle una probabilidad de desintegración igual a 0,5 en el instante t. Pero si A se mueve de manera adecuada, su plano de simultaneidad intersectará la línea de universo del átomo radiactivo en el futuro de B. Entonces, para A en el instante t¢ el átomo permanecerá intacto o se habrá desintegrado, y asignará, por tanto, una probabilidad 0 o 1 a cada suceso. Todo indica, en apariencia, que A y B no coincidirán en las distribuciones de probabilidad atribuidas a los mismos fenómenos (Fleming 1989), aun cuando sus sistemas de referencia inerciales sean perfectamente equivalentes desde una perspectiva relativista10. 9
Una aguda crítica sobre estas discusiones improcedentes puede encontrarse en Sobel (1998)
10
Un tratamiento sin tecnicismos de esta delicadísima cuestión se ofrece en Maudlin (1994), pp. 204–212, 233–234 y Maudlin (1996), pp. 298–303. Una crítica más profunda puede hallarse en Dorato (1996), pp. 593–595.
[33]
Probabilidad cuántica o espacio–tiempo relativista - Rafael Andrés Alemañ Berenguer
Dicho con un lenguaje algo más técnico: sabemos que cada sistema de referencia inercial selecciona un hiperplano espacial de simultaneidad en el espacio–tiempo relativista de Minkowski. Y también sabemos que en cada uno de esos hiperplanos la función de estado Ψ define una distribución de probabilidad ρΨ = |Ψ|2. Pero si no existe un hiperplano privilegiado —que concrete la noción de “simultaneidad absoluta”— y dado que en general no concordarán los diferentes cálculos realizados en distintos planos de simultaneidad, ¿sobre cuál de ellos evaluamos |Ψ|2? Desde un punto de vista empírico estricto, es cierto que los fenómenos EPR no permiten enviar señales más veloces que la luz11. Los postulados relativistas, así pues, quedan salvaguardados en la práctica, aunque ya es más dudoso que se respeten igualmente en el plano teórico. Que las correlaciones cuánticas del tipo EPR entre pares de cuantones no pueden ser utilizadas para enviar un mensaje al observador de uno de ellos mediante la realización de operaciones sobre el segundo cuantón, se demostró como un teorema en 1980 sin haber sido refutado desde entonces (Ghirardi, Rimini & Weber, 1980). De hecho, sólo cabe abrir la discusión acerca de posibles interacciones físicas más rápidas que la luz en el nivel cuántico, presuponiendo —contra los propios fundamentos de la teoría cuántica— que los fotones del experimento de Aspect poseen, cada uno separadamente, un estado de espín bien definido antes de la medición.
Relatividad versus no localidad Para comprender los problemas que la correlación cuántica no local plantea a la Relatividad, basta imaginar las descripciones espacio–temporales que de una misma experiencia EPR ofrecerían dos observadores inerciales. El observador A en movimiento, por ejemplo, hacia el dispositivo experimental consideraría —según su plano de simultaneidad— que la medición sobre el primer fotón hace saltar al segundo fotón a un estado de espín correlacionado con el primero. Por el contrario, el segundo observador B, que se aleja de los experimentadores, afirmará con razón que es el colapso espontáneo del segundo fotón a un estado definido de espín lo que origina el resultado de la medición, que para B es posterior. La cuestión no es baladí, puesto que si los dos observadores se hallan físicamente en pie de igualdad, la perspectiva espacio–temporal de B introduce una flagrante violación de los postulados cuánticos: la superposición de estados de espín del segundo fotón colapsa espontáneamente sin interacción externa. Y ambas descripciones espacio–temporales discrepan sobre cuál de los sucesos 11
Una correlación no necesariamente comporta la facultad de enviar señales o transmitir información, a cusa de la posible “incontrolabilidad” de las señales. Véase Earman (1987), p. 453.
[34]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 23-41
es un resultado aleatorio (de un colapso espontáneo de Ψ o de uno inducido por la medición), y cuál es producto de la correlación. Como todo cuanto sabemos hasta ahora indica que el colapso de Ψ depende del sistema de referencia en el cual se contempla, lo que infringe abiertamente la invariancia relativista, una posible vía de escape pasaría por admitir la prevalencia de una de estas dos descripciones contrapuestas. Ya sea el observador A o el B, siguiendo con el ejemplo previo, sólo uno de ellos posee la perspectiva física correcta; tan solo uno “ve” —por decirlo así— lo que realmente ocurre. El inconveniente de esta opción es que favorece el punto de vista de uno de los sistemas de referencia sin que aparentemente haya razones de peso para ello. ¿Por qué ha de concederse prioridad al observador A, que ve antes la medida del primer fotón, sobre el B?, ¿y si realmente ocurren colapsos espontáneos previos (no considerados por la teoría cuántica usual) que inducen los resultados de las medidas en los experimentos EPR? Con todo, supongamos que para cada foliación del espacio–tiempo contamos con una serie de estados que abarcan todos los sucesos físicos a lo largo de las sucesivas hipersuperficies que constituyen la propia foliación. El reto ahora sería acomodar la noción de “colapso de la función de estado” en semejante imagen de la realidad sin sacrificar, de entre las condiciones antes enumeradas, ni la segunda (no hay foliaciones privilegiadas que suministren la única serie correcta de estados) ni la tercera (las diferencias entre las series de estados contenidas en diversas foliaciones, se deben enteramente al hecho de que distintas foliaciones reordenan localmente las series de manera diferente). La pregunta es, equivalentemente, ¿pueden satisfacer, o no, las teorías de Colapso condiciones de evolución local preservando a la vez una noción aceptable de probabilidad cuántica12? Un ingrediente crucial en esta construcción es la objetividad de las probabilidades cuánticas, cuyos valores —ya lo hemos visto— aparentan ser distintos en cada sistema de referencia y evolucionar además con el tiempo. En todo instante t, existe una función aleatoria, Pt, que asigna una cierta probabilidad de acaecimiento a cada posible suceso pasado, presente o futuro. La distribución probabilística Pt’ correspondiente a un tiempo t’, posterior a t, se obtiene imponiendo sobre Pt condiciones dependientes de la serie completa de estados del sistema13 entre t y t’. La idea parece físicamente razonable a primera vista; pero, ¿resulta factible en la práctica? 12
Aquí, la palabra “aceptable” implica el cumplimiento del teorema de no señalización, de modo que las correlaciones EPR no permitan enviar señales más veloces que la luz ni establecer relaciones de simultaneidad a distancia. Véanse al respecto Eberhard (1978), o Ghirardi, Rimini y Weber (1980)
13
Podría objetarse que la totalidad de las “historias” (series completas de estados) de un sistema entre
[35]
Probabilidad cuántica o espacio–tiempo relativista - Rafael Andrés Alemañ Berenguer
En un espacio–tiempo galileano, con una foliación distinguida gracias al concepto de tiempo absoluto, el cómputo de los estados intermedios entre dos instantes dados carece de ambigüedad. En un marco relativista, sin embargo, dados dos puntos A y A’ sobre la línea de universo de un objeto, ¿cómo seleccionar los sucesos de los que depende la evolución de la función estocástica a fin de obtener las probabilidades adecuadas de los distintos sucesos posteriores a A, (el propio A’ entre ellos)? No queda claro, por ejemplo, si debemos incluir —y cuáles— los sucesos espacialmente separados de aquél cuya probabilidad tratamos de calcular. En cualquier caso, para cada hipersuperficie espacial Σ, tendremos una distribución de probabilidad PΣ condicionada por todos los sucesos pertenecientes al pasado de Σ. Esta es la razón de que necesitemos especificar la hipersuperficie espacial a la cual nos referimos cuando buscamos calcular la probabilidad de un cierto estado en un sistema S dentro una región espacio– temporal Ώ. O en otras palabras, es indispensable saber de qué sucesos depende nuestra probabilidad condicionada (que justamente por ello es “condicionada”). Existe un elaborado modelo de reducción del vector de estado, debido a Fleming (1996), de acuerdo con el cual los valores de espín de los fotones utilizados en los experimentos EPR se consideran propiedades relativas a un cierto sistema de referencia, o más concretamente, relativas a un hiperplano espacial especificado14. Pero, cualquiera que sea la solidez de estas propuestas, tienen la virtud de iluminar una cuestión central en nuestra controversia: la búsqueda de una conciliación entre la no separabilidad cuántica y la localidad relativista obliga a considerar las propiedades afectadas por el entrelazamiento cuántico, no como rasgos intrínsecos de los micro–objetos, sino como propiedades relacionales (es decir, propiedades que adquieren significado en relación con algo externo al objeto que las posee). Parece claro que diferentes sistemas de referencia en movimiento inercial relativo asignarían a los distintos puntos de una línea de universo de un cuantón diferentes probabilidades sobre el resultado de una medida, dependiendo de si los planos de simultaneidad asociados a cada referencial se encuentra en el dos instante dados, conformase un conjunto infinito no numerable. Por ello resultaria imposible –al menos en la definición usual de probabilidad– asignar a cualquier historia individual una valor probabilístico no nulo. Este dilema cuenta con dos vías de escape: o bien alteramos la noción ordinaria de probabilidad condicionada, o bien establecemos restricciones adecuadas sobre el dominio de nuestra función de probabilidad. Véase una interesante discusión de las alternativas en Lewis (1980), pp. 263–293. 14
Una descripción no muy técnica junto a una evaluación crítica de este punto de vista se encuentra en Maudlin (1994) pp. 204–212, 233–234; (1996), pp. 298–303. Una discusión más detallada del asunto se halla asimismo en Dorato (1996), pp. 593–595.
[36]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 23-41
futuro o en el pasado de la medición. Esto es así, en efecto, y con ello la interpretación propensiva de la probabilidad queda despojada —al menos en un contexto relativista— de su mayor atractivo. Ya no podemos considerar que las probabilidades cuánticas son propiedades inherentes a un objeto microfísica, como su carga eléctrica o su espín, sino rasgos parcialmente dependientes del marco espacio–temporal escogido para su descripción. Semejante conclusión no es en sí misma una tragedia, pero ciertamente enmarañará todavía más las profundas discusiones sostenidas al respecto por epistemólogos y metafísicos. Así lo entendió el célebre físico matemático británico Roger Penrose, cuyas palabras expresan la cuestión con diáfana transparencia: “Debería dejar claro que la compatibilidad entre la teoría cuántica y la relatividad especial que proporciona la teoría cuántica de campos es solo parcial15 […] y es sobre todo de naturaleza matemáticamente formal. La dificultad de una interpretación relativísticamente consistente de los «saltos cuánticos» […], la que nos dejaron los experimentos de tipo EPR, no es ni siquiera esbozada por la teoría cuántica de campos. Tampoco hay todavía ninguna teoría cuántica de campo gravitatorio consistente o creíble. […]”(Penrose 1991 366).
Conclusiones De todo lo dicho se infiere que no es legítimo esperar una estricta compatibilidad ontológica entre la Relatividad especial y la teoría cuántica., si bien aparenta existir una compatibilidad “dinámica” —si se quiere llamar así— entre ambas teorías. Esta compatibilidad dinámica se da tanto en las teorías cuánticas de Colapso como en las que prescinden de él. Y en ambos casos, la relativización de los estados cuánticos según la hipersuperficie espacial donde nos hallemos, parece ser el modo natural de extender la no localidad cuántica al dominio relativista. Pese a todo, y aun reconociendo que una respuesta más elaborada podría tal vez llegar de la mano de la teoría cuántica de campos, queda todavía un amplio territorio por explorar en la búsqueda de una combinación enteramente satisfactoria entre la teoría cuántica y relatividad einsteiniana. Necesitaríamos garantizar la adecuada covariancia tanto de Ψ, al transformarse entre sistemas de referencia inerciales, como de una regla para calcular las probabilidades de transición, y de una ecuación de evolución para Ψ (excepto, quizás, durante el colapso). Asimismo, cuando Ψ fuese autoestado de un cierto operador, la probabilidad de obtener el autovalor correspondiente debería ser igual a 1. ¿Podemos definir entonces un conjunto completo de operadores conmutables 15
Cursiva en el original
[37]
Probabilidad cuántica o espacio–tiempo relativista - Rafael Andrés Alemañ Berenguer
utilizando las simetrías espacio–temporales de las transformaciones de Lorentz? Si la respuesta resulta negativa no será posible definir el estado físico de un sistema mediante una autofunción común a todos esos operadores. Una vez más, la fuente de las mayores ambigüedades se halla en la libertad de los diferentes observadores inerciales para definir sus propias superficies espaciales de simultaneidad. Con ello, en cada sistema de referencia inercial obtendremos distintas distribuciones de probabilidad para un mismo proceso cuántico. Renunciar a dicha libertad supondría herir de muerte la relatividad einsteiniana e infringir la equivalencia física de todos los sistemas inerciales, lo que parece ser un principio capital de la naturaleza. En otras palabras: • O bien abandonamos la equivalencia relativista de todos los sistemas inerciales −sin otro motivo para ello− y adoptamos un hiperplano de simultaneidad privilegiado con respecto al cual se considere que el colapso es genuinamente “real”, • O bien rechazamos la interpretación propensiva de la probabilidad cuántica, que considera tales probabilidades como propiedades intrínsecas de los micro–objetos cuánticos en pie de igualdad con su carga eléctrica o su espín, por ejemplo, • O hallamos una estructura matemática cuyas proyecciones en los distintos sistemas de referencia —como sucede con los tensores— posean un significado físico, en este caso relacionado con la probabilidad definida por cada observador para el suceso cuántico en cuestión. Esta última opción sugiere los contornos del camino que quizás nos conduzca a la solución de estas y otras paradojas semejantes. Si se me permite un pequeño ejercicio de especulación razonada, sobre la base de la experiencia en el trato prolongado con este problema, diría que la respuesta tal vez aflore tras una drástica revulsión de nuestras ideas sobre el espacio y el tiempo, que modifiquen los perfiles tanto de la teoría cuántica como de la relatividad. Muy plausiblemente, el espacio y el tiempo no han de ser conceptos últimos sobre los que se forje un entendimiento verdaderamente básico de la naturaleza. Más bien parece que deberían ser reducibles a unas entidades fundamentales todavía por dilucidar. Y si el espacio–tiempo posee una estructura interna, las nuevas propiedades que cabe esperar de ella acaso se manifiesten en lo que se nos antoja como incomprensibles pautas de comportamiento de los sistemas cuánticos. Las nociones de distancia y duración habrían de contemplarse también con este nuevo trasfondo, y posiblemente entonces una justificación
[38]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 23-41
para esa no localidad cuántica que tanto perturba la ortodoxia relativista, así como también para la paradoja EPR y la del gato de Schroedinger. El interrogante de qué pueda ser esa estructura interna del espacio–tiempo, solo el porvenir de la investigación científica podrá disiparlo. Pero sin duda será fascinante estar presente cuando suceda.
Trabajos citados Albert, D. Z. Quantum Mechanics and Experience. Cambridge (MA): Harvard University Press, 1992. —. “Special Relativity as an Open Question”. Relativistic Quantum Measurement and Decoherence. Ed. H. P. Breuer & F. Petruccione. Berlin: Springer, 2000. 1–13. Barrett, J. A. The Quantum Mechanics of Minds and Worlds. New York: Oxford University Press, 1999. Bell, J. S. Speakable and Unspeakable in Quantum Mechanics. Cambridge (UK): Cambridge University Press, 1987. (Versión española: Lo decible y lo indecible en mecánica cuántica. Madrid: Alianza Universidad, 1990). —. “Against Measurement”. Physics World 3 (1990): 33–40. Bohm, D. “Quantum mechanics”. Physical Review 85 (1952): 166–180. —. “Comments on an Article of Takabayasi concerning the Formulation of Quantum Mechanics with Classical Pictures”. Progress in Theoretical Physics 9 (1953) 273–287. Bohm, D. & B. J. Hiley. The Undivided Universe: An Ontological Interpretation of Quantum Theory. London: Routledge, 1993. Callender, C. & R. Weingard.. “Trouble in Paradise? Problems for Bohm’s Theory”. Monist 80.1 (1997): 24–43. Cushing, J. T. Quantum Mechanics, Chicago: Chicago University Press, 1994. —, ed. Bohmian Mechanics and Quantum Theory: an Appraisal. Dordrecht: Kluwer, 1996. DeWitt, B. & N. Graham. The Many–Worlds Interpretation of Quantum Mechanics. Princeton (NJ): Princeton University Press, 1971. Doebner, H. D. & G. A. Goldin. “Properties of Nonlinear Schrödinger Equations”. Physical Review A, 54.5 (1995): 3764–3771.
[39]
Probabilidad cuántica o espacio–tiempo relativista - Rafael Andrés Alemañ Berenguer
Doebner H. D., G. A. Goldin & P. Nattermann. “Introducing nonlinear gauge transformations in a family of nonlinear Schrödinger equations”. Quantization, Coherent States, and Complex Structures. Ed. J.P. Antoine et al. London: Plenum Press, 1996. 27–68. Dorato, M., “On Becoming, Relativity and Nonseparability”. Philosophy of Science, 63 (1996): 585–604. Dürr, D., et al.. “Bohmian Mechanics and Quantum Field Theory”. Physical Review Letters 93 (2003): 1–4. Earman, J. “What is Locality? A Skeptical Review of Some Philophical Dogmas”. Kelvin’s Baltimore Lectures and Modern Theoretical Physics. Historical and Philosophical Perspectives. Ed. R. Kargon & P. Achinstein. Cambridge (MA): MIT, 1987. Ch. 2. Eberhard, P.H. “Bell’s Theorem and the Different Concepts of Locality”. Il Nuovo Cimento 46B (1978): 392–419. Fleming, G. N. “Lorentz Invariant State Reduction, and Localization”. PSA 1988. Ed. A. Fine & M. Forbes. East Lansing (MI): Philosophy of Science Association, 1989. 112–126. Ghirardi, G. C., A. Rimini & T. Weber. “A general argument against superluminal transmission through the quantum mechanical measurement process”. Lettere al Nuovo Cimento 27 (1980): 293–298. —. “Unified Dynamics for Microscopic and Macroscopic Systems”, Physical Review D 34 (1986): 440–491. Gisin, N. “Nonlinear Quantum Mechanics at the Planck Scale”. Helvetica Physica Acta 62 (1989): 363–371. —. “Weinberg’s non–linear quantum mechanics and superluminal communications”. Physics Letters A 143 (1990): 1–2. Goldin, G. A., “On a general nonlinear Schrödinger equation”. Nonlinear, Deformed and Irreversible Quantum Systems. Ed. H. D. Doebner, V. K. Dobrev & P. Nattermann. Sinagpore: World Scientific Publishing, 1994. 246–251. Goldstein, S., et al. “Bohmian Mechanics and Quantum Field Theory”. Physical Review Letters, 93 (2003): 1–4. Holland, P.R. The Quantum Theory of Motion. Cambridge (UK): Cambridge University Press, 1993.
[40]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 23-41
Jansen, M. “Reconsidering a Scientific Revolution: The Case of Einstein Versus Lorentz”. Physics in Perspective 4 (2002): 421–446. Lewis, D. “A Subjectivist’s Guide to Objective Chance”. Studies in Inductive Logic and Probability, Vol. II. Ed. R. C. Jeffrey. Los Angeles: University of California Press, 1980, Ch. 3. —. “Humean Supervenience Debugged”. Mind 103 (1994): 473–490. Maudlin, T. Quantum Non–Locality and Relativity, Metaphysical Intimations of Modern Physics, Oxford: Blackwell, 1994. —. “Space–Time in the Quantum World”. Bohmian Mechanics and Quantum Theory: An Appraisal. Ed. J. Cushing, A. Fine & S. Goldstein. Dordrecht: Kluwer, 1996. Ch. 5. Nelson, E. Quantum Fluctuations. Princeton (NJ): Princeton University Press, 1985. Penrose, R. La Nueva Mente del Emperador. Madrid: Mondadori, 1991. Roland Omnès, R. The Interpretation of Quantum Mechanics. Princeton (NJ): Princeton University Press, 1994. Shanks, N. “Probabilistic Physics and the Metaphysics of Time”. The South African Journal of Philosophy, 10.2 (1991): 37–43. Sobel, J. H. Puzzles for the Will. Toronto: University of Toronto Press, 1998. Svetlichny, G. “Quantum Evolution and Space–Time Structure”. Nonlinear, Deformed and Irreversible Quantum Systems. Ed. H.D. Doebner, V.K. Dobrev & P. Nattermann. Singapore: World Scientific Publishing, 1995, pp. 246–251.
[41]
Profesor: Estudie Filosofía en la Universidad El Bosque Ahora los profesores de la Universidad El Bosque tienen la oportunidad de adelantar estudios en el nuevo programa de Filosofía a un muy bajo precio y en horarios muy cómodos. Ventajas:
{
¿Quiere reflexionar de manera profunda y sistemática sobre su disciplina y otros asuntos de vital importancia?
- Los horarios son especialmente convenientes para trabajadores, con clases a partir de las 5 p.m. - Dependiendo de su antigüedad en la institución, recibirá un descuento hasta del 20% en la matrícula.
- Aprenderá lo mejor de la historia y los problemas de la filosofía, y recibirá las herramientas para analizar y reflexionar sobre aspectos fundamentales de su propia disciplina y otros temas.
- Si lo desea, podrá homologar parte de las asignaturas del pensum.
- Tenemos convenios con las universidades de Poitiers y París VIII tanto para realizar intercambios como para obtener doble titulación. Nuestros estudiantes reciben un descuento especial del 30% en los cursos de francés de la Alianza Francesa.
Inscripciones Abiertas Consulte en la secretaría de Filosofía. secfilosofia@unbosque.edu.co Casa 4, Calle 132 No 7 A 35. Tel.6489000 Ext. 531 www.unbosque.edu.co
- Contará con un pregrado adicional en su hoja de vida.
- El pregrado se encuentra íntimamente vinculado con la Revista colombiana de Filosofía de la ciencia y la especialización en Filosofía de la ciencia. - Además, contaremos muy pronto con una maestría en Filosofía e historia de la ciencia.
Por una cultura de la vida, su calidad y su sentido
Un argumento pragmático para el concepto de lo mental Fabrizio Pineda1
Resumen Este artículo presenta algunas consideraciones sobre el dilema de la ontología de lo mental descrito por John Searle como la incapacidad de elegir entre considerar lo mental como un epifenómeno de los fenómeno neurobiológicos o resolver la relación causal de lo neurobiológico a lo mental a través de un enigmático indeterminismo. Considero que este dilema adolece de una visión cerrada del marco de realidad de lo mental. Las razones se presentan como una defensa pragmática de la ontología de lo mental. Palabras clave: argumento pragmático, ontología de lo mental, neurobiología, estados mentales, red de creencias.
Abstract This paper presents some considerations on the dilemma of the ontology of mind described by John Searle as the inability to choose between taking the mental as an epiphenomenon of a neurobiological phenomenon or solve the causal relationship of the neurobiological to the mental through an enigmatic indeterminism. I consider this dilemma as suffering from a narrow point of view of the reality frame of mind. The reasons are presented as a pragmatic defense of the ontology of the mental. Keywords: pragmatic argument, ontology of mind, neurobiology, mental states, belief network.
1
Magister en Filosofía – Universidad del Rosario. Profesor Universidad El Bosque – Bogotá, Colombia. Correo electrónico: faospace@gmail.com.
Un argumento pragmático para el concepto de lo mental - Fabrizio Pineda
La pregunta central que quisiera considerar en este texto es la de la plausibilidad y consecuencias de lo que llamo el ‘argumento pragmático’ de lo mental para responder al problema de la ontología de lo mental. El argumento pragmático afirma, en términos generales, que aun si los fenómenos mentales no son más que un epifenómeno, al menos desde el punto de vista físico en el cual sólo podemos hacer descripciones verificables y nomológicas de los fenómenos cerebrales, es necesario suponer la existencia de lo mental mientras vivamos en una comunidad de seres racionales que se comunican e interactúan entre sí. Sin embargo, asumir este argumento pragmático implica cuestionar la deducción que precede al punto de vista físico: si la existencia de lo mental es ante todo una condición necesaria para la comunicación y, empero, no es posible establecer leyes causales entre fenómenos mentales y fenómenos físicos, ¿es suficiente afirmar que lo mental es, aunque necesario, un epifenómeno? Considero entonces que un punto de vista pragmático acerca de lo mental da cuenta de ciertos postulados cuestionables del punto de vista físico: o está exigiendo al plano de lo mental condiciones que no caben dentro de sus atributos, o dicho criterio de lo real debería ser reconsiderado y extendido al punto de poner en niveles más próximos los fenómenos físicos y los mentales, en tanto construcciones sociales de realidad. A fin de considerar las posibilidades que abre el punto de vista pragmático propongo una lectura de algunos de los desarrollos conceptuales de Searle y Davidson en torno a la ontología de lo mental y sus implicaciones respecto al punto de vista físico. De esta manera, 1) consideraré el dilema planteado por Searle acerca de la libertad y los procesos cerebrales y trataré de mostrar que 2) el dilema se resuelve una vez cambiamos el punto de vista acerca de lo mental del físico al pragmático; 3) ello nos permitirá mostrar cómo la idea de lo mental debe ser ampliada a fin de extenderse más allá de lo que el dilema ha considerado como tal.
El dilema de lo mental En el texto “Libre albedrío y neurobiología: una relación problemática” Searle procura definir los términos del problema de lo mental. En principio, el problema tiene la forma lógica de una disyunción exclusiva: por una parte, tenemos un conjunto de creencias que dictan que el mundo esta formado por partículas materiales completamente describibles en términos físicos y, por otra parte, tenemos otro conjunto de creencias que nos convencen de que hay fenómenos inmateriales como la consciencia, la intencionalidad y la libertad que no pueden ser descritos en términos físicos y nomológicos. Searle plantea la tesis de que el problema mente–cuerpo se resuelve una vez aceptamos que
[44]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 43-55
nuestros estados mentales están causados por procesos neurobiológicos “realizándose en él como rasgos suyos de orden superior o sistémico” (2005 29). Con ello, afirma, el problema se desplaza a la neurobiología. Sin embargo, hemos de cuestionar la plausibilidad de este desplazamiento, en razón de la pregunta con la cual continúa Searle: ¿sería posible hacer un desplazamiento semejante a la dicotomía particular entre libertad y procesos neurobiológicos? En este primer paso de Searle ya se evidencia el punto que quisiera ir resaltando a lo largo de estas consideraciones: ¿no es acaso parte de lo mental la sensación o la experiencia de libertad? ¿No es la experiencia de libertad una experiencia de tipo consciente? Allí donde no soy consciente de mis acciones libres —por ejemplo, en tocarme la barbilla cada vez que leo— no me cuestiono sobre si mi acción ha sido determinada o no. Si no soy consciente de mi voluntad de acción no he de sentir que he sido libre de actuar. Searle no desestima esta cuestión, pero aceptar el primer desplazamiento supone ya un efecto retórico en su exposición de separación entre consciencia y libertad. Empero, continuemos con la presentación del dilema. Según Searle, toda acción en la cual experimentemos la libertad o, en sus términos, libre albedrío, presenta como rasgo fundamental la experiencia de intervalo entre las partes de la acción, a saber: “que no tengo la sensación de que las causas antecedentes de mi acción en forma de razones, como mis creencias y deseos, establezcan condiciones causalmente suficientes para la acción” (2005 32). Esta ausencia de sensación es lo que Searle llama intervalo entre las partes de la acción, a saber, la deliberación, la decisión, la actuación y la continuación de la acción. “En cada una de las fases se tiene la experiencia de que los estados conscientes no son suficientes para forzar el estado consciente que viene a continuación” (Id. 34). Este intervalo se da entre un estado consciente y el siguiente, más no entre estados conscientes y movimientos corporales. El dilema empieza a tomar forma una vez Searle postula que otro rasgo fundamental de nuestra relación con el mundo es que lo vemos sometido a condiciones causalmente suficientes y que “cuando explicamos algo indicando la causa, damos por supuesto que la causa que indicamos, juntamente con el resto del contexto, es suficiente para dar lugar al acontecimiento que estamos explicando” (Id. 36). Así, pues, la primera parte del dilema, la disyunción inicial, consiste en que por un lado tenemos la experiencia consciente del intervalo que nos convence de libre albedrío y, por otro lado, la confianza en la descripción causalista con la cual comprendemos los fenómenos de la naturaleza. A continuación, nuevamente Searle introduce un sesgo retórico que pretende opacar la disyunción: “partiendo de la base de que tenemos la experiencia de libertad, ¿es dicha experiencia válida o ilusoria? ¿Corresponde esa experiencia a algo real
[45]
Un argumento pragmático para el concepto de lo mental - Fabrizio Pineda
situado más allá de la experiencia misma?” (Id. 38). Esta pregunta ya manifiesta una cierta medida de lo ‘real’: lo real es aquello que podemos explicar indicando la causa y ésta no puede ser otra cosa que un fenómeno físico —de lo contrario, sería ilusorio. Que nuestros actos tengan antecedentes causales no es suficiente para establecer la dicotomía que supone la pregunta entre experiencia válida e ilusoria. Sin embargo, Searle parte de la idea de que existe una reducción causal de lo mental a lo cerebral, es decir, si la conciencia es una característica biológica superior del cerebro, tendríamos que aceptar, con Searle, que el comportamiento de las neuronas es causalmente constitutivo de la conciencia. Así, que la conciencia pueda mover el cuerpo significa “que las estructuras neuronales mueven mi cuerpo, pero mueven mi cuerpo tal como lo hacen debido al estado consciente en que se hallan” (Id. 44). Con ello, la conclusión obvia sería asumir que la conciencia “no tiene ningún poder causal más allá de los poderes de las estructuras neuronales (y otras estructuras neurobiológicas)” (Id. 46). Habría entonces que distinguir dos planos: el de la libertad y la experiencia de los intervalos y el de los procesos neurobiológicos que se explican en términos deterministas. Searle diría que el problema del libre albedrío es saber si los procesos del intervalo se realizan en el sistema neurobiológico determinista. De esta manera, modifica la disyunción inicial planteándola enteramente en términos neurobiológicos y reduciendo lo mental a procesos cerebrales. Claramente, aceptamos lo que pasa en la consciencia debe pasar en el cerebro, ello no tiene nada de extraordinario; lo curioso es la transformación que Searle realiza de una disyunción experiencial y de dificultades descriptivas a una disyunción estrictamente neurobiológica. A partir de aquí, el dilema se desarrolla en estos términos: ¿cuáles son las consecuencias de asumir como lo existente los procesos causalistas del cerebro? Y ¿cuáles las de asumir como lo existente la sensación, con correspondencia en el cerebro, de intervalo? La primera pregunta deriva, según Searle, en el epifenomenismo. Al aceptar que el estado cerebral es causalmente suficiente para determinar los estados subsiguientes tendríamos que aceptar que nuestra experiencia del libre albedrío no es más que ilusoria. Esto es, que la experiencia de la libertad no desempeña ningún papel causal ni función explicativa de nuestro comportamiento. El epifenomenismo consistiría en reconocer que “la insuficiencia causal de las experiencias del intervalo y el esfuerzo por superar dicha insuficiencia adoptando decisiones no es un aspecto causalmente pertinente para determinar lo que de hecho ocurre” (2005 63). Nuestras decisiones estarían prefijadas por los estados cerebrales, aun si pensáramos que hemos decidido entre auténticas alternativas. La respuesta a la segunda pregunta se plantea en términos de que la ausencia de condiciones causalmente suficientes en el nivel mental debe corresponder
[46]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 43-55
a una idéntica ausencia de condiciones causalmente suficientes en el nivel cerebral. Pero tal y como describimos los procesos cerebrales encontramos que no hay en ellos intervalos. Así, pues, sería necesario establecer tres condiciones para lograr la descripción de dicha correspondencia, a saber: 1) que la conciencia funcione causalmente como motor del cuerpo; 2) que el cerebro cause y sustente la existencia de un yo consciente capaz de tomar decisiones y actuar (el yo sería una especie de campo unificado de conciencia con la capacidad de deliberar, emprender y llevar a cabo acciones); y 3) que tanto el yo consciente como los procesos cerebrales se expliquen racionalmente por las razones de la acción del agente. Estas condiciones tienen como motivo explicar cómo podría ser neurobiológicamente real el intervalo —cómo incorporar el indeterminismo racional en la descripción del funcionamiento del cerebro. Searle acude entonces al indeterminismo cuántico como la única forma de indeterminismo indiscutiblemente aceptada como hecho natural. Afirma que la segunda pregunta deriva no así en una respuesta como en una ampliación de problemas, pues además del problema del libre albedrío requeriría la resolución de los problemas de la conciencia (el yo consciente) y del indeterminismo cuántico. “Ahora nos encontramos con que, para resolver el primero hemos de resolver el segundo e invocar uno de los aspectos más misteriosos del tercero para resolver los dos primeros” (2005 88). De esta manera, el dilema queda planteado así: al asumir que todo lo mental tiene una correspondencia en los procesos cerebrales, encontramos que surge una disyunción entre la experiencia consciente del intervalo por la cual creemos en el libre albedrío y la descripción neurobiológica de los procesos cerebrales en términos de condiciones causalmente suficientes. Quedarnos con la descripción determinista de los procesos cerebrales implica aceptar que el libre albedrío no es más que un epifenómeno. Asumir la experiencia consciente del intervalo, implica resolver las condiciones de su correspondencia en el plano de los procesos cerebrales (la existencia neurobiológica del intervalo, la incidencia de un yo consciente y el papel central en los procesos cerebrales de un indeterminismo cuántico). Por ende, según estas implicaciones, quedamos ante una disyuntiva aun más problemática entre el epifenomenismo y los misterios del indeterminismo cuántico en el cerebro.
Carácter pragmático de lo mental y la realidad Puede generarse una confusión con la idea del argumento pragmático. Éste no consiste meramente en afirmar que aún si el epifenomenismo es cierto, nuestra vida diaria e interacción social, como seres racionales, requiere mantener la
[47]
Un argumento pragmático para el concepto de lo mental - Fabrizio Pineda
ilusión. Esta es la idea de Searle cuando en el texto señalado anteriormente afirma que la experiencia del libre albedrío es tan fuerte que incluso aquellos de nosotros que piensan que es una ilusión ven que en la práctica no podemos actuar sobre la base de que es una ilusión […] uno no puede renunciar a ejercer su libre albedrío, pues la propia renuncia sólo nos resulta inteligible como tal si la hacemos como un acto de libre albedrío. […] No podemos pensar haciendo abstracción de nuestro libre albedrío (2005 34). Con ello sólo se esta haciendo una concesión a la pragmática de la vida cotidiana, pero se está omitiendo la importancia y efectos de esta condición pragmática de la vida para la comprensión de lo mental. Davidson en su texto “Sucesos mentales” reconoce esta aparente contradicción entre aceptar vivir en un mundo causalmente determinado y la ‘anomalía’ de lo mental que escapa a las explicaciones nomológicas. En esta sección deseo tomar en consideración algunas de las ideas que Davidson presenta para disipar esta aparente contradicción. La propuesta de Davidson es llamada por él como monismo anómalo: “El monismo anómalo se parece al materialismo en su afirmación de que todos los sucesos son físicos, pero rechaza la tesis, considerada generalmente esencial al materialismo, de que los fenómenos mentales admiten explicaciones exclusivamente físicas” (1995 271). Esta posición acepta que las características mentales dependen de alguna manera de las características físicas, lo que equivale a decir que “un objeto no puede alterarse en algún aspecto mental sin que se altere en algún aspecto físico” (Id. 272). La idea central es que lo mental y lo físico o neurobiológico no pueden ser explicados en el mismo plano descriptivo debido a la naturaleza de cada uno. Cuando vemos el cerebro como fenómeno físico, podemos hablar de causalidad en tanto establecemos relaciones entre sucesos individuales. Esta causalidad permite instanciar leyes en el lenguaje que posibiliten la predicción de sucesos. Pero eso no quiere decir otra cosa sino que “el principio de interacción causal trata con los sucesos en extensión y por tanto es ciego a la dicotomía físico–mental” (Id. 273). Mientras que la anomalía de lo mental concierne a los sucesos descritos como mentales, “porque los sucesos son mentales sólo si así se describen” (Ibid). Ello no implica que no pueda haber causalidad entre sucesos mentales, pero las descripciones de lo mental que incluyan causalidad no puede ser sino un enunciado causal singular verdadero, mas no uno que recoja relaciones de causa y efecto que permitan instanciar una ley. Además, aun si puede haber enunciados coextensivos a lo mental y lo físico, no hay razones para pensar que siempre se puedan identificar las mismas causas para los mismos efectos entre sucesos mentales. Ello lleva a Davidson a afirmar la
[48]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 43-55
tesis de que “lo mental es nomológicamente irreductible: puede hacer enunciados generales verdaderos que relacionen lo mental y lo físico, enunciados que tengan la forma lógica de una ley; pero no son legaliformes” (Id. 274) en un sentido fuerte. Las razones de ello es que lo mental está relacionado con la manera en que atribuimos inteligiblemente actitudes proposicionales a un agente, a saber, atribuir una creencia a un agente “sólo es posible en el marco de una ‘teoría’ de sus creencias, deseos, intenciones y decisiones” (1995 280). Las creencias particulares sólo tienen sentido en tanto son coherentes con otras creencias, preferencias, intenciones, expectativas, miedos, esperanzas, etc. Cuando conocemos a una persona, su conducta verbal y sus acciones nos son comprensibles por la coherencia de la teoría que tenemos acerca de las personas en determinados contextos. Esta coherencia de las creencias es lo que impide la existencia de leyes psicofísicas estrictas, pues muestra los compromisos dispares de los esquemas físico y mental: en la realidad física el cambio físico se explica mediante leyes y condiciones descritas físicamente; en lo mental la atribución de actitudes proposicionales responde al trasfondo de razones, creencias e intenciones del individuo. Por ello, afirma Davidson, “no puede haber conexiones estrechas entre las áreas si cada una mantiene fidelidad a su propia fuente de evidencia” (Id. 282). No hay forma de establecer leyes estrictas cuando los conceptos de creencia y deseo se ajustan constantemente según la evidencia —esto es, el trato con los otros— se va acumulando. Así, pues, mientras la teoría física aporta un sistema comprehensivo cerrado que garantiza descripciones únicas del patrón de un suceso físico, los sucesos mentales, expresados en actitudes proposicionales, escapan a tal esquema de descripción porque constituye primeramente un sistema abierto que se modula tanto por sucesos mentales como físicos. Si encuentro que un suceso mental causa un suceso físico, y deseo describir esta relación en términos físicos, debo tomar el suceso mental como particular e identificable en una zona del cerebro; ello no instancia una ley pero permite hacer ese tipo de descripción. Pero si lo tomo sólo como suceso mental mi explicación ya no es suficiente si recurre a términos físicos ni la causalidad puede ser estricta, pues sólo será inteligible si lo pongo en relación con otros sucesos mentales. Explicamos, por ejemplo, las acciones libres del hombre apelando a sus deseos, hábitos, conocimiento y percepciones. Tales explicaciones de la conducta intencional operan en un esquema conceptual fuera del alcance directo de las leyes físicas al describir la causa y el efecto, la razón y la acción, como aspectos del retrato de un agente humano (1995 284). Ante esto podría decirse que sólo se está mostrando la complejidad de la ilusión de lo mental, pero que aun no se establece por qué deberíamos asumir
[49]
Un argumento pragmático para el concepto de lo mental - Fabrizio Pineda
que ello provee una explicación de lo mental que no deba poder reducirse a una explicación física. El problema radica en que gran parte de la realidad de la vida de las personas esta constituida por estas posibilidades pragmáticas de descripción de lo mental, y ello no debe tomarse a la ligera. De hecho, la red de creencias no sólo describe el funcionamiento y las posibilidades de atribuir actitudes proposicionales, sino que, por esto mismo, constituye un plano de realidad que, de manera integral y global, no puede tampoco reducirse a una descripción física. Curiosamente, este hecho es ilustrado por el mismo Searle en su texto Mente, lenguaje y sociedad. Aunque sigue afirmando su tesis de que la mente es esencialmente un fenómeno biológico, reconoce el potencial de sus características fundamentales: la conciencia y la intencionalidad. Estas características son fundamentales de la naturaleza de lo mental, no porque estén aisladas de lo físico sino porque son esencialmente constitutivas de un plano pragmático de realidad o, en sus términos, un plano institucional de realidad. La ontología de lo social y de lo institucional como realidad objetiva, de las condiciones pragmáticas de comunicación e interacción entre agentes racionales, se explica a través de las capacidades de estas características generalmente tomadas como ontológicamente subjetivas. En el plano de la realidad pragmática o institucional caben todo tipo de funciones y objetos. Por ejemplo, una silla, desde un punto de vista físico, no es más que una masa y una configuración molecular determinada que existe con independencia del agente; pero ello no ‘hace’ la silla. Ésta es ante todo el resultado de interacciones entre los diversos agentes que la diseñaron, la fabricaron, la vendieron, la compraron y la utilizaron como silla, es decir, su definición y existencia en el mundo social depende del observador o agente. Para que esto sea posible, Searle identifica tres condiciones: 1) Existe una intencionalidad colectiva que no se reduce a la intencionalidad individual (sumada a ésta la creencia en la intención de las otras personas), pues aunque esté en mi cabeza siempre puedo tener la actitud proposicional ‘tenemos la intención de’, de la cual puedo pasar a derivar mi intención individual. “El requisito de que toda intencionalidad resida en las cabezas de agentes individuales […] no exige que toda intencionalidad se exprese en la primera persona del singular. No hay nada que nos impida tener en la cabeza intencionalidad del tipo, por ejemplo, ‘creemos’, ‘tenemos la intención de’, etc.” (2001 110). En las prácticas cotidianas es normal encontrar intencionalidad colectiva siempre que haya gente cooperando, pues es el fundamento de todas las actividades sociales. 2) En este plano también encontramos la asignación de función, por ejemplo, utilizar un objeto como herramienta para alcanzar un fin; “toda función es relativa al observador […] Sólo existe en relación con los observadores o
[50]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 43-55
agentes que les asignan la función” (2001 112). De hecho, la asignación de función siempre presupone una noción de propósito o teleología que adscribe algo más que meras relaciones causales y se conecta de diversas maneras con múltiples creencias e intenciones; por ejemplo, decir que el corazón tiene la función de bombear sangre sólo tiene sentido porque consideramos valiosa la creencia en la supervivencia y la salud. 3) También encontramos normas constitutivas, es decir, normas que no sólo regulan la acción sino que su cumplimiento constituye el tipo de actividad que regula; aunque hay normas que regulan acciones preexistentes —conducir en una vía—, otro tipo de normas llevan a la existencia de un tipo de acción. Este es un efecto pragmático de construcción de realidad que es distintivo del mundo institucional frente a los fenómenos del mundo físico o natural, pues “los hechos institucionales sólo existen dentro de sistemas de normas de ese tipo” (2001 113). A partir de estas tres condiciones, puede comprenderse cómo es posible que lo mental instituya un plano de realidad distinto y cómo este plano no puede reducirse a una explicación física y, en consecuencia, por qué pensar lo mental en estos términos no es meramente una ilusión. El resultado de la realización de estas tres condiciones es la posibilidad de asignar una “función de estatus”, y el paso de la física a la aceptación colectiva está siempre mediada por esta función. Las estructuras institucionales en la vida cotidiana de los individuos no desempeñan su función en virtud de sus características físicas; siempre requieren la aceptación colectiva que nace de su función de estatus. Un claro ejemplo es el dinero: “el paso del dinero mercancía al papel moneda es el paso de la asignación de una función en virtud de la estructura física a un caso puro de función de estatus” (Id. 117). Claramente no se trata de que si no hubiera una condición física podríamos vivir de mero estatus, pero la primera no es suficiente para comprender la realidad de la segunda. Más aun, el propósito de la estructura institucional es crear y establecer condiciones para controlar los hechos en bruto. Podría decirse entonces que el mundo pragmático o institucional de la vida de las personas, fundamentado en las capacidades de lo mental de crear realidad entre las mismas, hace que la naturaleza de esta misma realidad pragmática sea esencialmente holista en su relación con el mundo físico en que se establece. Por ello, no es suficiente afirmar que lo mental es meramente ilusorio. El punto de equívoco está en asumir que el plano de realidad en el que puedo comprender lo mental es el plano de lo físico o neurobiológico. Cuando hago este desplazamiento ya estoy introduciendo en las premisas las consecuencias dilemáticas que me obligarían a asumir la ilusión de lo mental o la incapacidad de su explicación indeterminista. La realidad de lo mental no es meramente una conciencia e intencionalidad aislada y ontológicamente subjetiva; lo que
[51]
Un argumento pragmático para el concepto de lo mental - Fabrizio Pineda
no implica que sea metafísica e inabarcable, sino esencialmente pragmática y generadora de realidad en el mundo de la interacción social. Y ello hace de lo mental tan epistémicamente objetivo como el mundo físico, sólo que uno y otro sólo pueden ser inteligibles en el plano de realidad que les corresponde.
Ampliación del concepto de lo mental Todavía no hemos dicho de manera positiva qué es lo mental. Nuevamente Davidson parece ofrecernos la manera de dar una respuesta tentativa. En su texto Subjetivo, intersubjetivo, objetivo Davidson afirma que lo característico de un animal racional es tener actitudes proposicionales como creencias, deseos, intenciones y demás. Ello en virtud de que por la naturaleza de las actitudes proposicionales tener una significa siempre tener un amplio complemento cohesionado. De esta manera, la tesis de Davidson es que “solamente cuando podemos ubicar los pensamientos dentro de una densa red de creencias relacionadas, identificamos pensamientos, hacemos distinciones entre ellos y los describimos según lo que son” (2003 145). Podríamos decir que el ‘lugar’ del pensamiento no está en una mera posición subjetiva sino en el normal ejercicio de tener y atribuir actitudes proposicionales. Esto lo podemos ver en todo lo que implica este concepto. Una creencia tiene siempre un contenido proposicional, tal que tener una creencia sobre un gato significa que dominamos los conceptos involucrados en este juicio o creencia. Pero a la vez significa que somos conscientes de la posibilidad de aplicar erróneamente ese concepto —creer o juzgar que algo es un gato cuando no lo es. Al comprender que las creencias se individúan e identifican por sus relaciones con otras creencias, comprendemos también que estas relaciones apoyan y dan el contenido de las creencias. Por ende, es necesario que exista un grado mínimo de consistencia entre creencias para que sea posible identificar los contenidos de las mismas. Cuando esta consistencia falla, podemos llegar a la conclusión de que una o un conjunto de mis creencias ha sido aplicado erróneamente. Es connatural a lo mental el ajustar constantemente un grado de consistencia que define su red de creencias. Además de relaciones entre creencias, también Davidson señala las relaciones entre creencias y actitudes evaluativas: deseos, intenciones, convicciones morales. Todas estas también son actitudes proposicionales. Estas actitudes evaluativas sirven para asignar funciones y establecer rumbos de acción: “las creencias y los deseos conspiran para causar, racionalizar y explicar las acciones intencionales. Actuamos intencionalmente por razones, y nuestras
[52]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 43-55
razones siempre incluyen tanto valores como creencias” (2003 179). A partir de nuestras creencias podemos pasar a evaluarlas y a evaluar nuestras acciones, individuales o de conjunto, tal que se podría afirmar, con Davidson, que sin ellas no habría lugar para las demás actitudes proposicionales y, por ende, para el proceso de ajustamiento de la consistencia en la red de las mismas, es decir, la racionalidad. Pues de esta manera podemos establecer una creencia sobre las creencias; el concepto de creencia permite pasar a dominar las demás actitudes proposicionales. Así, pues, dentro de ‘lo mental’ también está el concepto de creencia y con ello el de la evaluación de las creencias. Lo cual, además, supone la posibilidad de falsear una creencia, esto es, supone que “tener el concepto de creencia es tener el concepto de verdad objetiva” (Id. 153). Pero no hay forma de elaborar esta densa y ascendente red de actitudes proposicionales que definen lo mental, si no estuviera incorporada la posibilidad de la comunicación lingüística de las creencias. Falsear una creencia necesariamente implica la posibilidad de contrastar su contenido proposicional. Ello no sería posible sin la comunicación, es decir, sin la posibilidad de compartir el mundo en que vivo con otras personas que puedan llegar a entender mis juicios: [P]ara poder estar en desacuerdo debo abrigar las mismas proposiciones, que traten de lo mismo, y tener el mismo concepto de verdad. La comunicación depende de que cada uno de quienes se comunican tengan, y piensen correctamente que el otro tiene, el concepto de un mundo compartido, un mundo intersubjetivo (2003 154). Con ello, parte de la constitución de lo mental radica en esta relación intersubjetiva que Davidson denomina triangulación: “cada criatura aprende a correlacionar las reacciones de las otras con los cambios o los objetos del mundo a los cuales también ella reacciona” (2003 183). Según este autor, esta triangulación explica la objetividad del pensamiento. No tendría sentido afirmar que el pensamiento tienen un contenido que es verdadero o falso independientemente del pensamiento o del sujeto sin la interacción. Sólo cuando las reacciones sociales son compartidas se hace asequible la objetividad del contenido de las creencias. Por ello, el lenguaje, en su capacidad de asignación de funciones de estatus, es esencial a lo mental y a la posibilidad de crear y ajustar la red de creencias en un mundo socialmente compartido. Estas consideraciones nos permiten reiterar que la naturaleza de lo mental es necesariamente holista. No se puede considerar lo mental desde un punto de vista meramente subjetivo. Este no es el plano de su realidad. Lo mental es un fenómeno esencialmente intersubjetivo. En este sentido, el concepto de lo mental es ampliado al punto de encontrar que el plano de realidad de lo mental es
[53]
Un argumento pragmático para el concepto de lo mental - Fabrizio Pineda
precisamente el plano de su realización en el mundo de la pragmática entre seres racionales: personas que tienen creencias, las evalúan, actúan intencionalmente, las contrastan en la comunicación y ajustan su red de creencias por su interacción con otros y con el mundo. La posibilidad de asignar funciones de estatus puede ser revertida para identificar que lo mental también es un fenómeno pragmático y social —por lo menos, hasta donde podemos comprenderlo. Ello no lo hace una ilusión, sino una realidad en el mundo de nuestra vida cotidiana. De hecho, según Davidson, si no hay creencias sin tener muchas creencias, ni deseos sin creencias, ni intenciones sin las anteriores, hemos de asumir que, conceptualmente, “las propias acciones pertenecen al reino de lo mental, puesto que un comportamiento cuenta como una acción solamente si hay alguna descripción en la cual es intencional, y por ello se puede explicar como algo que se hace por una razón” (2003 180). Por ende, el ámbito de los aspectos mentales es comprendido mediante esta ampliación de los aspectos mentales de la vida comunitaria de los individuos y que no se presentan sino de manera holista. Cuando Searle identificaba en el dilema inicial una línea en la acción, estaba desestimando el holismo de lo mental. Ello porque pretendía comprender lo mental en términos del lenguaje de la física; pero esto sólo puede llevar al planteamiento de un falso dilema, dadas la amplitud y naturaleza divergente de los medios de comprensión y descripción de lo mental ante lo físico. Describir un proceso neurobiológico no es dar cuenta de un proceso mental. De esta manera, deseo concluir afirmando que lo mental es esencialmente holista, no sólo en su descripción sino en su constitución y, por ello, en sus capacidades de constituir un plano pragmático de realidad que, a su vez, es el mismo plano de realidad de lo mental. Decir que algo es social es, desde este punto de vista, decir que es mental; y decir que lo mental es intersubjetivo —que se establece en un plano pragmático— no es otra cosa que decir que es nuestra capacidad de crear realidad y actuar en el mundo para controlar el espacio de lo físico. Pretender explicar o comprender lo mental en términos físicos no es sino una imposibilidad conceptual dados nuestros actuales medios de conocimiento de la realidad natural y nuestras capacidades de creación de realidad en un nivel pragmático.
Trabajos citados Davidson, Donald. “Sucesos mentales”. Ensayos sobre acciones y sucesos. Trad. O. Hansberg, J. A. Robles & M. Valdés. Barcelona: Crítica, 1995. 263–287. —. Subjetivo, intersubjetivo, objetivo. Trad. O. Fernández. Madrid: Cátedra, 2003.
[54]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 43-55
Searle, John. “Libre albedrío y neurobiología: una relación problemática”. Libertad y neurobiología: reflexiones sobre el libre albedrío, el lenguaje y el poder político. Trad. Miguel Candel. Barcelona: Paidós Ibérica, 2005. 25–87. —. Mente, lenguaje y sociedad: la filosofía en el mundo real. Trad. Jesús Alborés. Madrid: Alianza, 2001.
[55]
Pregrados Administración de Empresas Artes Plásticas Biología Diseño Industrial Enfermería Filosofía ** Formación Musical Ingeniería Ambiental *** Ingeniería de Sistemas * Ingeniería Electrónica Ingeniería Industrial Instrumentación Quirúrgica Licenciatura en Educación Bilingüe con énfasis en la Enseñanza del Inglés
Licenciatura en Pedagogía Infantil Medicina*** Odontología*** Optometría Psicología * ***
Postgrados Doctorado Maestrías Especializaciones Cursos Libres en Artes Artes Escénicas Artes Plásticas Música Cursos certificados en Diseño Educación Continuada Diplomados Seminarios Congresos Talleres Colegio Bilingüe Centro de Lenguas Curso Básico Preuniversitario Curso Pre-ICFES
* Horario diurno / nocturno ** Programa nuevo *** Acreditación de Alta Calidad
Informes Línea de Atención al Aspirante 6489000 ext. 170, Línea Gratis 018000113033 atencionalusuario@unbosque.edu.co Calle 134 No. 7b - 83 Edificio El Bosque - 1er piso - Bogotá D.C.
Inscripciones en línea
www.unbosque.edu.co Reg snies 10571, 8120, 12333, 15555, 1778, 53049, 7113, 7772, 4952, 17492, 7777, 53071, 13222, 13143, 1779, 1780, 52725, 2692. Personería Jurídica Resolución No. 11153 del 4 de agosto de 1978 expedida por el M.E.N.
Diferenciación y explicación causal en los escritos biológicos de Aristóteles Alejandro Farieta1
Resumen En sus textos biológicos, Aristóteles no parece seguir su propio modelo científico expuesto en sus obras sobre teoría de la epistêmē en los Analíticos Posteriores. Para solucionar este problema ofrece en este texto una interpretación del modelo científico aristotélico que se ajuste más a su práctica científica en los textos biológicos, apelando a dos momentos en la epistêmē: uno investigativo, en el cual se recogen observaciones y se realiza un primer y básico trabajo de análisis en el cual se registran diferenciaciones básicas entre los objetos observados; y un segundo momento, más expositivo, en el cual se presentan, a partir de los principios propios de cada epistêmē, las observaciones que hacen parte de la epistêmē desarrollada, trabajo basado principalmente en explicaciones causales que den cuenta de las diferenciaciones registradas en el primer momento. Para concluir, se probará que a pesar de esta distinción entre dos momentos del quehacer científico, se trata de dos momentos conceptualmente —pero no temporalmente— distinguibles, pues en la práctica ambos pueden darse a la par. Palabras clave: Aristóteles, biología, epistemología, explicación causal, diferenciación
Abstract Aristotle, in their biological texts, doesn’t seem to follow his own scientific model exposed in his works about epistêmē theory in the Posterior Analytics. To solve this problem, in this text it’s offered an interpretation of the Aristotelian scientific model that better can fit into his scientific practice on the biological texts, appealing to two stages in the epistêmē: the first, investigative, in which observations are collected and a first and basic job o analysis is carried out, in which basic differentiations between the observed objects are registered; and the second, more expositive, in which are presented, from the proper principles of each epistêmē, the observations that takes part of the epistêmē developed, work based mainly in causal explanations that expound the differentiations registered in the first moment. To conclude, it will be proved that, despite this distinction between two moments in the scientific work, the distinction is between two conceptually —but not temporarily— distinguishable moments, since in the practice both can occur at the same time. Keywords: Aristotle, biology, epistemology, causal explanation, differentiation
1
Candidato a Doctor en Filosofía – Universidad Nacional de Colombia. Profesor Universidad El Bosque / Universidad Pedagógica Nacional – Bogotá, Colombia. Correo electrónico: a.farieta@ gmail.com.
Diferenciación y explicación causal en los escritos biológicos de Aristóteles - Alejandro Farieta
Una de las grandes discusiones acerca de los tratados biológicos de Aristóteles tiene que ver con la manera como en dichos tratados el Estagirita aplica la metodología que ha expuesto en los Analíticos Posteriores (APo.)2 , texto en el cual aparece expuesta la manera según la cual debe desarrollarse una epistêmē 3 . En pocas palabras, una epistêmē debe partir de unos principios, a partir de los cuales, y por medio de estrictas deducciones, se alcancen las conclusiones propias de la epistêmē, conclusiones que Aristóteles llamará —y que se conocerán en la historia de la filosofía y de la ciencia— teoremas. Estos serán entonces los elementos fundamentales de la epistêmē: principios —ya se trate de definiciones o de axiomas—, demostraciones y teoremas o corolarios. Sin embargo, en los escritos biológicos no aparecen estos elementos. Esta incongruencia que existe entre la teoría científica aristotélica y su práctica ha sido notada en repetidas ocasiones por los intérpretes. Gotthelf reseña dos aspectos importantes que son clásicamente sujetos a crítica con respecto a la cientificidad —en los mismos términos aristotélicos— de los tratados biológicos, especialmente entre APo. y un breve pero muy importante tratado aristotélico, llamado Sobre las partes de los animales (PA): “The absence of explicit syllogisms and of an explicit axiomatic structure is the basis of the twofold discrepancy between the APo. theory and the PA practice” (Gotthelf 1987)4 . Los puntos importantes son básicamente dos: (1) los escritos biológicos no presentan rigurosamente una cadena de demostraciones, tal como se 2 Utilizaré las siguientes abreviaturas para los títulos de las obras aristotélicas: APo. (Analytica Posteriora) Analíticos posteriores APr. (Analytica Priora) Analíticos primeros DA (de Anima) Acerca del alma DC (de Caelo) Acerca del cielo GA (de Generatione Animalium) Generación de los animales HA (Historia Animalium) Investigación de los animales IA (de Incessu Animalium) Marcha de los animales PA (de Partibus Animalium) Partes de los animales Resp. (de Respiratione) Acerca de la respiración 3
Es difícil traducir con completa precisión el término griego epistêmē. Clásicamente se han utilizado expresiones como ‘ciencia’, ‘conocimiento’ o ‘conocimiento científico’. Barnes ha propuesto, para la lengua inglesa, utilizar la expresión ‘understanding’ (Barnes 1993 82), intentando marcar la diferencia que hay entre esta expresión y la más amplia y más vaga de ‘knowledge’. Sin embargo, utilizar el término ‘entendimiento’ podría suponer que se trata de una facultad mental más que de un proceso —lo cual parece estar más cerca de la posición de Aristóteles—. Dadas estas dificultades, prefiero simplemente mantener la expresión griega.
4
Esta crítica bien podría hacerse en general a los tratados en donde se hace práctica científica, más que teoría de las características que debe cumplir cualquier epistêmē —como, e.g. DA o DC entre otros—.
[58]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 57-66
pretende establecer que es el procedimiento correcto de una epistêmē en APo. (2) No hay una axiomática clara en los escritos biológicos, pues no aparecen claros ni las definiciones ni los principios de los que parte. Varias estrategias se pueden utilizar para resolver este problema. La primera de ellas sería encontrar en los escritos biológicos estos elementos, a saber, principios y demostraciones, para así mostrar que realmente se está llevando a cabo el desarrollo científico propuesto en APo.5 , de esta manera, se haría coherente el fundamento teórico del conocimiento científico que se plantea en los APo. y el desarrollo de éste que se lleva a cabo en los escritos biológicos. Esta estrategia puede resultar problemática por distintos aspectos, el primero de ellos es que sería tratar de forzar demasiado el texto de los escritos biológicos para que tuviera una claridad y una sistematicidad que obviamente no tiene; por otra parte, sería muy ingenuo y problemático creer que lo único que se propone en APo. es una teoría según la cual la epistêmē debe ser solamente una cadena de demostraciones científicas con base en ciertos principios propios de cada ciencia. Una segunda estrategia, tal vez más provechosa y más enriquecedora filosóficamente que la anterior, es tratar de reinterpretar el concepto aristotélico de epistêmē, y darle un carácter mucho más amplio, de manera que no se reduzca a una mera axiomatización. De esta manera, —y es el objetivo de este trabajo— es posible encontrar en los APo. elementos a través de los cuales se pueden dar buenas explicaciones, más que meras cadenas de demostraciones. En este sentido, si queremos hacer ciencia natural —o cualquier epistêmē, en general—, lo que debemos hacer es explicar. Según un buen número de intérpretes, el texto crucial para entender la relación entre los escritos biológicos aristotélicos y APo. es el primer libro de PA el cual, según Lennox, “was intentionally written to answer the question of how the Analytics model of science is to apply to Aristotle’s paradigm natural substances, animals” (Lennox 1994 99). El principal elemento metodológico que aparece en PA i es el concepto de diaíresis (diferenciación). Este elemento aparece como una reforma de la propuesta platónica del método de la dicotomía de los diálogos tardíos — particularmente del Sofista y el Político—, método con el cual Platón pretendía hacer una clasificación de todos los ‘seres’ u objetos existentes. Para explicar brevemente la dicotomía platónica, tomemos un ejemplo: intentemos hacer una clasificación de los animales; para ello, Platón distinguía entre los de los ápodos y los que tienen patas. Luego los que tienen dos patas y los que tienen 5
Esta es, entre otras, la estrategia de Gotthelf (1987), quien trata de mostrar los diferentes ‘principios’ que aparecen, particularmente en PA ii-iv.
[59]
Diferenciación y explicación causal en los escritos biológicos de Aristóteles - Alejandro Farieta
más; luego los que tienen cuatro y los que tienen más, y así sucesivamente; luego los de dos patas se clasificaban en los que tienen plumas y los que no, y así hasta llegar a las infimae species, o las clases más determinadas de seres —tal vez algo similar a lo que se llama en la clasificación taxonómica moderna la ‘especie’, o tal vez la ‘subespecie’—. Esta taxonomía platónica resultante de su método dicotómico se basaba fundamentalmente en el principio del tercero excluido: o algo tenía cierta propiedad o no la tenía, y así hasta haber colocado a cada uno de los seres en su respectivo lugar en la escala. Aristóteles retoma el espíritu de este método de clasificación —particularmente en lo que respecta a los seres vivos— pero hace algunos cambios considerables, de los cuales el fundamental es no establecer simples dicotomías, como hacía Platón, sino dividir en tantas especies como sea necesario en el proceso de diferenciación. De esta manera, no se distinguirán los que tienen plumas de los que no tienen, sino los que tienen plumas de los que tienen piel, los que tienen escamas y tantos otros como especies haya del género o la clase de animales que se esté intentando diferenciar; esta es justamente la propuesta de PA i 2-4. La pregunta que surge a continuación es, ¿qué se dice en los APo. con respecto a la diaíresis? Si este es el método que Aristóteles sigue, explícitamente, en los tratados biológicos —o por lo menos en PA—, encontrar puntos de contacto entre este método y su teoría científica en APo. ayudaría sustancialmente a resolver el problema que hemos mencionado. El aporte más significativo con respecto a esta pregunta ha sido hecho por Ferejohn, quien trata de demostrar que en la teoría expuesta en APo. hay dos momentos en la construcción de la epistêmē: el primero, que es un trabajo previo a la demostración, en el cual se establecen definiciones y otros principios; y el segundo, en el cual sí comienzan a aparecer las demostraciones (Ferejohn 1982 385). De esta manera, la epistêmē en su primero momento se encarga de establecer definiciones, fundamentalmente a partir del reconocimiento de diferencias. Dice el Estagirita: Cuando uno trata algo global, conviene dividir el género en las primeras cosas indivisibles en especie […] y a continuación intenta tomar así las definiciones de ellas […] y después de ello, una vez admitido qué es el género […] observar las afecciones propias a través de las primeras [propiedades] comunes (APo. 96b15–22). A partir de este pasaje concluye Ferejohn “Aristotle is making the strong claim that the breakdown of a genus into its infimae species by Platonic division (or something much like it) is not simply a useful aid, but an indispensable prerequisite to the construction of demonstrative syllogisms concerning that genus” (Ferejohn 1982 384).
[60]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 57-66
Siguiendo esta misma línea, Lennox (1991) trata de demostrar que Aristóteles llama historía a este estado pre-demostrativo de la investigación científica, y que tal información pre-demostrativa aparece consignada en el tratado biológico de mayor extensión: la Investigación sobre los animales, y de allí su nombre latino, Historia Animalium (HA). El pasaje fundamental para apoyar esta interpretación es el siguiente:
Si se toma lo que se da en relación con cada cosa, es ya competencia nuestra exponer cumplidamente las demostraciones. En efecto, si no se deja de lado en las descripciones (historíai) nada de lo que se da verdaderamente en las cosas, estaremos en condiciones, acerca de todo aquello de lo que hay demostración, de encontrar y probar esa demostración, y hacer evidente aquello de que no es natural que haya demostración (APr. 46a22-27). Ahora bien, tenemos evidencia textual para apoyar el hecho de que Aristóteles llame historía a los textos que conforman HA, y por lo tanto podemos afirmar que los
datos allí recogidos simplemente son ese estado pre-demostrativo, en el cual se establecen las diferencias entre los animales, para luego, a partir de estas observaciones y descripciones, mostrar las causas que dan lugar a estas diferencias. Este sería el caso de cada uno de los tratados biológicos específicos (HA 491a7-14; PA 646a8-12; IA 704b910). Así las cosas, tenemos una teoría de la explicación científica que se encarga, en un primer momento, de recoger observaciones y establecer diferencias entre cada una de las clases del objeto de estudio, y luego de buscar las causas por medio de las cuales podemos explicar dichas diferencias, o, en palabras del propio Lennox:
Aristotle’s guiding question in his zoology seems to be, Why do all and only the animals have this feature? His answer seems to require starting with the differentiae and asking how widely a given differentae extends in relation to others —that is, he seeks to identify groups relative to some difference and not to identify the difference relative to a pre-established group. This method succeeds in identifying animals with commensurately universal differentiae, the first step toward causal accounts in the explanatory model proposed in the Posterior Analytics (Lennox 1991 65). Vemos así cómo estos autores dan una cierta coherencia entre la teoría científica de los APo. y su práctica científica en los escritos biológicos acudiendo a una distinción fundamental entre dos momentos de la investigación: uno, inicial, en el cual se hace un gran barrido lleno de observaciones y de diferencias entre los elementos observados —al cual pertenecería HA—, y luego se hace una explicación pormenorizada de dichas diferencias, ya con un nivel de especialización mucho mayor que el mero establecimiento de distinciones — allí entrarían textos como PA, MA, IA, GA, etc.—.
[61]
Diferenciación y explicación causal en los escritos biológicos de Aristóteles - Alejandro Farieta
Hay dos aspectos que me parecen un tanto problemáticos de esta caracterización de los textos biológicos con respecto a su relación con los APo. El primero tiene que ver con la distinción entre dos momentos en la investigación a los cuales corresponderían los textos de Aristóteles, en el primero de los cuales solamente se harían divisiones o distinciones, ¿pero acaso no aparecen cierto tipo de ‘explicaciones causales’ en HA, las cuales no tienen que ver simplemente con divisiones o distinciones? El segundo punto que quiero problematizar, el cual quizás aclare mejor el primero, es que no es claro que, según Aristóteles, los dos momentos de la epistêmē sean necesariamente el uno posterior al otro; es decir, no creo que tengamos un momento T1 en el cual nos encargamos de registrar todo tipo de observaciones y de establecer diferencias, y luego un momento T2 en el cual sí nos dediquemos a buscar explicaciones. Por el contrario, la propuesta del presente texto es que si bien estos dos momentos son teóricamente diferenciables, no son diferenciables temporalmente. Veamos en detalle cada una de estas propuestas. En HA podemos encontrar no solamente un sinnúmero de observaciones, a través de las cuales se establecen diferencias entre unos animales y otros. También podemos hallar un buen número de registros que podríamos caracterizar no como meras observaciones sino como explicaciones. Quisiera tomar algunos ejemplos: [a] Los animales están en guerra unos con otros cuando ocupan los mismos lugares y cuando sus medios de subsistencia proceden del mismo sitio. En efecto, si la comida es escasa, incluso los animales de la misma especie combaten entre sí (HA 608b18-22). [b] Los peces grandes son enemigos de los pequeños, porque el grande se come al pequeño. Y esto es lo que sucede con los peces del mar (HA 610b17-19). [c] Muchos otros cuadrúpedos actúan sagazmente para procurar remedio a sus males (HA 612a1-2). [d] Cuando una yegua muere, las que pacían juntamente con ella crían al potrillo de la muerta. Y es que de una manera general, el sentimiento maternal parece estar por naturaleza desarrollado en la especie equina. He aquí una prueba: a menudo sucede que las yeguas estériles quitan los potrillos a sus madres y los cuidan con ternura; pero como no tiene leche, los echan a perder (HA 611a10-14).
[62]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 57-66
[e] De los animales salvajes, unos están siempre en guerra entre sí, y otros, como ocurre entre los hombres, solo ocasionalmente (HA 610a3-5). [f] Así pues, las relaciones de amistad y las luchas entre los animales citados vienen determinadas por la comida y por el género de vida (HA 610a34-35). Tenemos aquí no solamente una serie de observaciones, sino que sin duda alguna el propósito de Aristóteles es también explicar ciertas conductas de los animales. En [a] tenemos una clara relación entre el hecho de que haya guerra y una de sus posibles causas: la falta de alimento; lo que resalta Aristóteles es que siempre que falta alimento hay guerra entre los animales. El caso de [b] es bastante similar: se muestra el comportamiento de cierto tipo de animales: los peces grandes que se comen a los pequeños; de esta manera se explica por qué son “enemigos”. [c] es un caso típico de explicación teleológica: un animal hace una cosa para conseguir otra. En [d] tenemos lo que podríamos llamar una generalización: en los quinos está bastante desarrollado el sentimiento maternal; a partir de esto se explica por qué una yegua adopta fácilmente a un potro que ha quedado huérfano. El caso de [e] y [f], bastante similares, son ciertas conclusiones generales que saca Aristóteles de alguna de las observaciones que ha mencionado anteriormente. Es preciso aclarar que la muestra puede resultar poco representativa, aunque sin querer excusar esta falta de exhaustividad para con el resto del libro, parece suficiente para señalar que el objetivo de HA no puede ser solamente registrar observaciones y resaltar diferencias. No se puede negar que dichas cosas suceden aquí, pero tampoco se puede negar que el nivel de abstracción con el que Aristóteles reseña el comportamiento animal es lo suficientemente amplio como para decir que aquí también está buscando dar cierto tipo de explicaciones. Por otra parte, también es preciso acarar que si bien las explicaciones que se encuentran en textos como PA son de un nivel de complejidad mucho mayor que las que se encuentran en HA, pues, como ya ha señalado Balme (1987 90), es posible encontrar un cierto tipo de recuento muy rápido y muy críptico en HA y luego, en otro tratado, encontrar la explicación mucho más completa (cf. HA 492b8; Resp. 473a19)6 . Sin embargo, esto es diferente: una 6
Balme concluye, a partir de este tipo de relaciones entre diálogos, que HA fue escrito como el último de los tratados biológicos. Sin embargo, de ser así, ¿cómo explicamos las supuestas referencias que hay a este tratado en los demás textos? Por otra parte, la discusión cronológica entre estos textos se ha basado demasiado en el hecho de que se considere primero un estado pre-demostrativo de la investigación científica, y luego sí el
[63]
Diferenciación y explicación causal en los escritos biológicos de Aristóteles - Alejandro Farieta
cosa es hablar del nivel de complejidad de la explicación, y otra cosa es señalar que en un texto no se pretende dar ningún tipo de explicación. La segunda crítica importante que aparece, al relacionar de esta manera los dos momentos en la investigación científica, tiene que ver con el hecho de que se considere uno temporalmente anterior al otro. Podemos determinar que en ciertos casos Aristóteles muestra que hay anterioridad del conocimiento empírico con respecto del conocimiento de universales, pero esto no quiere decir que tal anterioridad sea estrictamente temporal, sino que, más bien, se debe estar pasando constantemente de un lado a otro. Esto puede ocurrir cuando, al estar buscando la causa de algo, dicha causa no la encontramos con las observaciones que hemos acumulado ya, sino que tenemos que volver a observar para encontrar aquello que causa lo que queremos explicar. Voy a tomar un ejemplo bastante paradigmático: cuando Aristóteles en APo ii, 16 trata de explicar la anterioridad de la causa con respecto al efecto, señala que tanto la causa como el efecto pueden suceder al mismo tiempo, el ejemplo es el del árbol que pierde sus hojas. Reconstruyamos los dos tipos de argumentos que emplea Aristóteles: (1a)
Todos los árboles que tienen hojas anchas las pierden
(1b)
La viña tiene hojas anchas
(1c)
La viña pierde sus hojas
Pero por otro lado podemos construir un argumento bastante similar concluyendo algo diferente: (2a)
Todo los árboles que pierden sus hojas las tienen anchas
(2b)
La viña pierde sus hojas
(2c)
La viña tiene hojas anchas
Obviamente concluimos dos cosas diferentes, pero el asunto es ¿cuál de las dos conclusiones es por naturaleza anterior a la otra? La propuesta de Aristóteles, en este caso, es tratar de encontrar la razón por la cual podemos afirmar la primera premisa. La propuesta de Aristóteles la podemos reconstruir si colocamos un término medio entre los dos términos de la primera premisa; tendríamos así el siguiente argumento: desarrollo cabal de dicha ciencia. Como se intentará probar más adelante, esta distinción no necesariamente debe ser asumida como temporal, y por lo tanto no sirve como evidencia contundente para decidir qué tratado fue escrito primero.
[64]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 57-66
(3a)
Todos los árboles que tienen hojas anchas coagulan la sábila
(3b)
Al coagularse la sábila se pierden las hojas
(3c)
Todos los árboles que tienen hojas anchas pierden sus hojas.
La moraleja que podemos tomar de este ejemplo es la siguiente: cuando la causa que podemos proponer de aquello que se pretende explicar —en este caso que la viña pierde sus hojas—puede servir igualmente para demostrar aquello que nos sirve para explicar —que en este caso sería que la viña tiene hojas anchas—, entonces el procedimiento a seguir es regresar a la observación, para encontrar una causa adecuada para la premisa, que es, al parecer, la que no ha quedado bien definida y que se puede explicar mejor. Un pasaje bastante oportuno para apoyar esta interpretación de regreso a la observación lo encontramos en APo ii, 13, en el cual se afirma lo siguiente: Es preciso investigar, en primer lugar, considerando las cosas semejantes e indiferenciadas, qué tienen todas ellas de idéntico; a continuación hay que considerar a su vez otras distintas que están en el mismo género que aquellas y son idénticas entre sí en especie pero distintas de aquellas otras. Cuando en éstas se establece qué tienen todas de idéntico, y de igual manera [se procede] en las otras, hay que observar, a su vez, si hay algo idéntico en las cosas así consideradas, hasta llegar a un único enunciado; pues éste será la definición de la cosa (APo. 97b6-13). Queda pues, bastante claro, cómo es la observación lo que en últimas sirve como elemento fundamental para dar explicaciones, y si no se han dado explicaciones satisfactorias, se ha de volver a ella, pues una investigación, aunque tenga dos momentos claramente diferenciados —uno en el cual se recoge sistemáticamente un buen número de observaciones, y se hagan las respectivas diferenciaciones, y otro en el cual se busquen explicaciones para estas diferenciaciones— no por un momentos de la investigación es temporalmente anterior al segundo, pues en una investigación, al hacer falta información para poder dar explicaciones satisfactorias, puede ser preciso volver a observar para encontrar nuevos elementos que sirvan para aclarar aquello que se pretende explicar. ¿Qué sucede, entonces, entre HA y los tratados especializados —como PA, IA, etc.—? Lo que podemos concluir es, entonces, no que HA es un tratado en el que se registran ciertas observaciones y se establecen un cierto tipo de diferenciaciones y semejanzas entre animales, sino que además se pretende dar un buen número de explicaciones, aunque estas resultan precarias, y se quedan cortas para poder dar cuenta de muchas características particulares de los
[65]
Diferenciación y explicación causal en los escritos biológicos de Aristóteles - Alejandro Farieta
animales. La diferencia entre HA y los otros, siguiendo las palabras del Estagirita, no es una diferencia entre tipos distintos de trabajo investigativo, sino una diferencia entre los niveles de profundidad a la hora de dar explicaciones. Trabajos citados Aristóteles. Analytica Priora et Posteriora. Ed. W. David Ross. Oxford: Oxonii e Typographeo Clarendoniano, 1964. —. “De Incessu Animalium”. Aristotelis Opera. Ed. Immanuel Bekker. Berlin: Reimer, 1831. 704-714. —. “De Partibus Animalium”. Aristotelis Opera. Ed. Immanuel Bekker. Berlin: Reimer, 1831. 639-697. —. “De Respiratione”. Aristotelis Opera. Ed. Immanuel Bekker. Berlin: Reimer, 1831. 470-480. —. Historia Animalium. Ed. David M. Balme. Cambridge: Cambridge University Press, 2002. Balme, David M. “The Place of Biology in Aristotle’s Philosophy”. Gotthelf & Lennox. 90-119. Barnes, Jonathan. Aristotle’s Posterior Analytics, Translated with Commentary. 2ª ed. Oxford: Oxford University Press, 1993. Ferejohn, Michael. “Definition and the two stages of Aristotelian Demonstration”. Review of Metaphysics 36.2 (1982): 375-395. Gotthelf, Allan. “First Principles in Aristotle’s Parts of Animals”. Gotthelf & Lennox. 90-119. Gotthelf, Allan & James G. Lennox, eds. Philosophical issues in Aristotle’s Biology. Cambridge: Cambridge University Press, 1987. Lennox, James G. “Between Data and Demonstration: the Analytics and the Historia Animalium”. En Science and Philosophy in Classical Greece, editado por Allan Bowen, 261-295. New York: Garland, 1991. —. “Putting Philosophy of Science to the Test: the Case of Aristotle’s Biology”. PSA: Proceedings of the Biennial Meeting of the Philosophy of Science Association (The University of Chicago Press) II: Symposia and Invited Papers (1994): 239-247.
[66]
Una defensa de la teoría searleana de los nombres propios Marcela del Pilar Gómez1
Resumen John Searle propuso una versión del descriptivismo que suele llamarse ‘teoría del racimo’ como respuesta a los problemas que se le presentan a las dos posturas tradicionales en teoría de la referencia. En el presente texto pretendo mostrar que la crítica más importante a esta teoría, la que presenta Saul Kripke en Naming and Necessity, no es efectiva contra la teoría searleana, en gran medida debido a que la teoría de Searle no se ajusta a la descripción que hace Kripke de las teorías del racimo. Para cumplir con tal objetivo, expondré la teoría searleana de los nombres propios y el análisis de la referencia como acto de habla para, después, presentar las críticas que hace Kripke a las teorías del racimo y examinar su efectividad contra la teoría de Searle. Finalmente, presentaré, a partir de la teoría de la Intencionalidad de Searle, respuesta a las críticas de Kripke que sobrevivan el análisis previo. Palabras clave: referencia, nombres propios, actos de habla, Searle, Kripke, Intencionalidad
Abstract John Searle proposed a version of descriptivism, usually called “cluster theory” as a response to the problems that faces the two traditional ways on reference theory. This paper is intended to show that the most important critic to this theory, which was made by Saul Kripe in Naming and Necessity, isn’t effective against the Searlean theory, because of the Searle’s theory doesn’t fit the Kripkean description of the cluster theory. To achieve this goal, I expose the Searlean proper names theory and the reference as speech act analysis to then present the Kripke’s critics to the cluster theories and consider its effectiveness against the Searle’s theory. Finally, I show, from the Searle’s Intentionality theory, a reply to the Kripke’s surviving critics to the previous analysis. Keywords: reference, proper names, speech acts, Searle, Kripke, Intentionality
1
Filósofa – Universidad Nacional de Colombia. Correo electrónico: marceladelpi@gmail.com
Una defensa de la teoría searleana de los nombres propios - Marcela del Pilar Gómez
En términos muy generales, puede decirse que uno de los problemas más ampliamente discutiros en filosofía del lenguaje es el de la relación de las palabras con el mundo. Un aspecto importante de tal cuestión es el problema de la referencia de los nombres propios —esto es, el problema de la explicación de la relación de un nombre propio con su portador—, puesto que se considera que éstos son los términos del lenguaje que tienen el contacto más directo con el mundo. El problema de la referencia de los nombres propios se reduce, en últimas, a la pregunta por el sentido de los mismos, esto es, la pregunta por si la relación de un nombre propio con su portador está mediada por un sentido. Según se responda afirmativa o negativamente a la pregunta por el sentido, hay dos posiciones que pueden adoptarse con respecto a la referencia y el sentido de nombres propios: o bien se asume que los nombres propios refieren directamente, i. e. que no tienen un sentido; o bien se asume que la referencia de nombres propios es mediada por el sentido del nombre2 . La primera postura descansa fundamentalmente sobre una intuición del sentido común: los nombres propios tienen denotación, pero no connotación, es decir, la relación entre un nombre propio y su portador es tal que el nombre es algo así como un rótulo que se le pone al portador, sin que tenga que representarlo o informar algo sobre él. Dicho de otra forma, una teoría de la referencia directa sostiene que el significado de un nombre propio es su referencia, la cual no está mediada por un sentido. Aun cuando parece plausible que los nombres propios hagan referencia directamente, sostener esta tesis deja a una teoría que la suscriba en una situación tal que no parece poder resolver ciertos problemas, a saber, dar cuenta satisfactoriamente del significado de enunciados existenciales y de enunciados de identidad. Por un lado, dado que es claro que la existencia no es un predicado, dicho de otra forma, un enunciado existencial expresa que un concepto es instanciado, para que un enunciado como ‘Aristóteles existe’ sea significativo, parece indispensable que el nombre tenga algún contenido conceptual. Ahora bien, si una teoría de la referencia directa rechaza que el nombre pueda tener contenido conceptual, se ve conducida a comprometerse con que la existencia de los portadores de los nombres propios es necesaria, puesto que parece inaceptable que un nombre, concebido como una etiqueta sin contenido conceptual o descriptivo, pueda usarse significativamente sin que exista el objeto al cual refiere. Por otro lado, dado que para una teoría de la referencia directa el significado de un nombre es su portado, i. e. su referencia, los enunciado de identidad resultan ser siempre triviales. Tal como señala Frege ([1892] 2
Cabe anotar que, aunque en adelante solo hablaré de teorías descriptivistas, es decir, que asumen que el sentido de un nombre propio es una descripción definida, el sentido de un nombre no necesariamente ha de ser entendido en términos de descripciones.
[68]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 67-86
2005): para un teoría de la referencia directa si a y b refieren al mismo objeto, el significado de a y b es el mismo; de forma que el enunciado a=b es equivalente al enunciado a=a, el cual es un enunciado trivial ya que no expresa nada más que el hecho de que un objeto es idéntico a sí mismo. Ahora bien, una teoría descriptivista de la referencia de los nombres propios — es decir, una teoría que sostenga que los nombres propios tienen algún contenido descriptivo que permita identificar la referencia del nombre, i. e. un sentido— vincula un nombre propio con una descripción identificadora de su referencia, de forma que la referencia del nombre es el objeto que cumple con la descripción. Una teoría de este tipo logra solucionar los problemas que una teoría de la referencia directa deja sin resolver: los enunciados existenciales —dado que afirman que hay un objeto que cumple el contenido conceptual asociado con el nombre— son verdaderos o falsos en virtud de la existencia de un objeto que satisfaga la descripción vinculada con el nombre; los enunciados de identidad son informativos en tanto que relacionan, ya no los objetos, sino los contenidos descriptivos asociados a los nombres, es decir, según una teoría de este tipo, un enunciado de identidad expresa que dos contenidos descriptivos, que pueden ser distintos en significado, son satisfechos por el mismo objeto, lo cual no es trivial. A pesar de que una teoría descriptivista consigue fácilmente dar cuenta del significado de los enunciados de identidad y de los enunciados existenciales, parece implausible que los nombres propios sean equivalentes a descripciones definidas, puesto que esto parece implicar que ciertos hechos o propiedades contingentes acerca del portador del nombre, tendrían que considerarse, más bien, como necesarios. Por ejemplo, aun cuando es que claro Aristóteles hubiera podido no escribir la Metafísica, si el sentido de ‘Aristóteles’ fuera ‘el autor de la Metafísica’, decir ‘Aristóteles pudo no haber escrito la Metafísica’ sería una contradicción. Como respuesta a los problemas que se le presentan a las dos posturas tradicionales John Searle presentó una versión del descriptivismo que suele llamarse ‘teoría del racimo’3. En el presente texto pretendo mostrar que la crítica más famosa a las teorías del racimo, la que presenta Saul Kripke en Naming and Necessity no es efectiva contra la teoría searleana, en gran medida debido a que la teoría de Searle no se ajusta a la descripción que hace Kripke de las teorías del racimo. Para cumplir con tal objetivo, (I) expondré la teoría searleana de los nombres propios y el análisis de la referencia como acto de habla para, después, (II) presentar las críticas que hace Kripke a las teorías del racimo y examinar su efectividad contra la teoría de Searle. Finalmente, (Ш) presentaré, a partir de 3
Searle llama a su teoría ‘teoría del ropero’ mientras Kripke usa la expresión ‘cluster theory’, que literalmente significa ‘teoría del racimo’ o ‘teoría del cúmulo’. En este texto se usarán las tres expresiones indistintamente.
[69]
Una defensa de la teoría searleana de los nombres propios - Marcela del Pilar Gómez
la teoría de la Intencionalidad de Searle, respuesta a las críticas de Kripke que sobrevivan el análisis hecho en (ii).
I En “Proper Names” y “Nombres propios y descripciones” John Searle presenta su propuesta de solución al problema de la referencia de los nombres propios, la cual asume un cierto compromiso con el descriptivismo, pero pretende sortear los problemas que se le presentan a éste. La estrategia de Searle consiste en transformar la pregunta por el sentido de los nombres propios en la pregunta “«¿Los nombres propios implican predicados descriptivos?» o simplemente «¿Hay proposiciones que contengan un nombre propio como sujeto y una expresión descriptiva como predicado analítico?»” (Searle [1967] 2005 109). Esta nueva cuestión tiene una versión débil y una versión fuerte: la primera (i) es la pregunta por si en efecto hay tales predicados descriptivos vinculados analíticamente a un nombre; la segunda (ii) es la pregunta por si, de haberlos, algunos de ellos son identificadores. Ahora bien, según Searle, el uso de un nombre presupone un criterio de identidad, es decir, el uso de un nombre en distintas ocasiones supone que el objeto es el mismo en todas ellas y que puede ser reconocido como tal por los hablantes; de forma que, concluye Searle, el hablante tiene que estar en capacidad de identificar el portador del nombre, es decir, debe poder responder a la pregunta “«¿En virtud de qué el objeto en el tiempo t, al que se hace referencia mediante el nombre n, es idéntico al objeto al que se hace referencia mediante el mismo nombre en el tiempo t’?». Para decirlo de un modo más simple «¿El objeto en el tiempo t es el mismo qué que el objeto en la ocasión t’?»” (Searle [1967] 2005 110). La respuesta a esta pregunta es un predicado general descriptivo —montaña, por ejemplo—, el cual proporciona el criterio de identidad requerido para el uso del nombre: el Everest es una montaña y cualquier cosa que no sea una montaña no podría ser el Everest. La respuesta a i es entonces que el nombre —‘Everest’ en el ejemplo— sí está analíticamente vinculado con un predicado general descriptivo —‘montaña’—. La respuesta afirmativa a (i) deja aún sin contestar la cuestión (ii), puesto que se ha establecido que el nombre está vinculado analíticamente con un predicado general descriptivo, lo cual no implica de ninguna manera que el predicado sea identificador. Para ponerlo en otros términos, necesariamente el Everest es una montaña, pero el predicado ‘montaña’ no describe identificadoramente al Everest. Para responder a (ii) Searle señala dos elementos del uso y la enseñanza (y el aprendizaje) del uso de los nombres propios que parecen ser claves, puesto que sugieren una estrecha conexión entre la capacidad de
[70]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 67-86
usar un nombre y el conocimiento de características del objeto suficientes para distinguirlo de otros objetos: el primero es que el uso de un nombre se aprende en virtud de especificar características del portador que lo distingan de otros objetos, bien sea por ostensión o por descripción; la segunda es que cualquiera que use un nombre propio debe estar en capacidad de responder a la pregunta ‘¿de quién o qué estás hablando?’. La respuesta de un hablante a esta pregunta, según Searle, es usualmente una presentación ostensiva del objeto o un conjunto de descripciones de éste. Tal conjunto de descripciones —que incluye todos los hechos establecidos y esenciales sobre el objeto— constituye la descripción identificadora del portador del nombre, es decir, es posible que ninguna de ellas aisladamente sea suficiente para identificar el objeto, pero la totalidad de ellas sí lo es. Ahora bien, ¿cuál es entonces la relación entre un nombre y el conjunto identificador de descripciones del portador del mismo? La relación, según Searle, es tal que el conjunto de descripciones constituye el respaldo descriptivo en virtud del cual, y solo en virtud del cual, es posible usar y enseñar el nombre, de forma que es posible negar alguna de las descripciones del conjunto, pero no tiene sentido negarlas todas, puesto que al hacerlo desaparecen las condiciones de uso del nombre. Un ejemplo puede servir para ver lo que se ha dicho hasta ahora sobre (ii). Supóngase que se le pregunta a un hablante de quién habla cuando usa el nombre ‘Aristóteles’. Su respuesta, dado que no puede hacer una presentación ostensiva de Aristóteles, expresará los hechos que considera establecidos y esenciales sobre él: Aristóteles era un griego, un filósofo, discípulo de Platón, tutor de Alejandro Magno, autor de la Metafísica, autor de la Ética a Nicómaco, fundador del Liceo de Atenas, y posiblemente algunos otros. Algunas de estas descripciones son exclusivas de Aristóteles y otras no, pero el conjunto de ellas lo describe identificadoramente. Ahora bien, podría descubrirse que, por ejemplo, Aristóteles no escribió la Metafísica, pero no tendría sentido decir que Aristóteles no hizo ningunas de las cosas que se le atribuyen, puesto que, como ya se dijo, se perderían las condiciones de uso del nombre. Dicho de otra forma, es condición necesaria de que un objeto sea Aristóteles que cumpla alguna de las descripciones que constituyen el sustento descriptivo del nombre. Así las cosas, Searle responde afirmativamente a (ii): el nombre está vinculado analíticamente, no con una sola descripción, sino con la disyunción identificadora de descripciones del objeto. Al respecto dice Searle: “[…] si se prueba que no es verdadera de algún objeto independientemente localizado ninguna de las descripciones que los usuarios del nombre de ese objeto creen que son verdaderas de ese objeto, entonces no hay ningún objeto idéntico al portador del nombre. Es una condición necesaria para que un objeto sea Aristóteles que satisfaga al menos una de estas descripciones. Éste es otro modo de decir que
[71]
Una defensa de la teoría searleana de los nombres propios - Marcela del Pilar Gómez
la disyunción de estas descripciones está analíticamente relacionada con el nombre «Aristóteles» […]” (Searle [1967] 2005 111). Aunque Searle afirma que la relación entre un nombre y la disyunción de las descripciones asociadas es analítica, también afirma que la relación es laxa. Pero, ¿de qué forma una relación analítica puede ser laxa? La relación es analítica, cómo se ha visto, porque es una condición necesaria de que un objeto sea el portador del nombre que satisfaga al menos una de las descripciones de la disyunción, la relación es laxa porque, en palabras de Searle: “Aunque ningún elemento particular de estas descripciones está analíticamente ligado con el nombre «Aristóteles», algún subconjunto indefinido de ellas lo está” (Searle [1967] 2005 111 énfasis mío). Esto quiere decir que la relación es laxa porque, aunque se asume que los nombres propios sí tienen un sentido éste es, sin embargo, impreciso, en tanto que las características que contituyen la identidad del portador del nombre lo son, es decir, no están exactamente especificadas. En la laxitud reside, según Searle, la conveniencia del uso de los nombres propios: si los críterios de identidad de los portadores de los nombres propios fueran rígidos y precisos, entonces un nombre propio sería equivalente al conjunto de descripciones asociadas a él4 y cada uso del nombre implicaría las cualidades espefíficadas; gracias a la laxitud, el uso de un nombre propio permite hacer referencia sin comprometerse o establecer propiedades del portador del nombre. Así, los nombres funcionan no como descripciones, sino como roperos donde éstas se cuelgan. Como ya se mencionó, la teoría de Searle se presenta como una respuesta a la pregunta por el sentido de los nombres propios. Vale la pena, para concluir, ver cómo logra la teoría del ropero vérselas con los problemas que aquejan a las teorías tradicionales: explicar el significado de enunciados existenciales y de identidad, y la necesidad de los hecho o propiedades atribuidas al portador del nombre. Con respecto al significado de los enunciados existenciales y de identidad, la solución de la teoría searleana es bastante parecida a la de las teorías descriptivistas tradicionales. En primer lugar, los enunciados existenciales, dado el conjunto de descripciones asociado, son verdaderos o falsos dependiendo de la existencia de un objeto que cumpla con la disyunción de las descripciones, de la manera como se ha indicado anteriormente. Los enunciado de identidad que involucren nombres propios, como ‘El Everest es el Chomolungma’ establece que el respaldo descriptivos de ambos nombres es verdadero 4
De la misma manera como una teoría descriptivista, como las descritas anteriormente, que sostengan que el sentido del nombre es una descripción, se ve conducida a considerar como necesarios ciertos hechos o propiedades contingentes del portador del nombre, si el nombre fuese equivalente al conjunto de descripciones asociadas, la teoría se vería conducida a considerarlas necesarias.
[72]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 67-86
del mismo objeto; que el enunciado sea trivial o no depende de cuáles sean tales contenidos descriptivos. La teoría del ropero también sortea el problema mencionado relacionado con la contingencia de las propiedades, puesto que, gracias a la laxitud, el nombre, a pesar de estar ligado analíticamente a una disyunción de descripciones, no lo está con ninguna de ellas por separado, de forma que ya no es una contradicción negar del portador del nombre alguna de las propiedades o hechos atribuidos. En Actos de habla Searle hace una exposición detallada de la referencia como acto de habla y sus mecanismos. Creo que en esta exposición pueden encontrarse algunas claves para comprender mejor la teoría de Searle sobre los nombres propios y su consecuente compromiso con el descriptivismo. Según esta exposición, hay tres axiomas de la referencia como acto de habla: 1. Axioma de la existencia. Cualquier cosa a la que se haga referencia debe existir 2. Axioma de identidad. Si un predicado es verdadero de un objeto, es verdadero de lo que sea idéntico a ese objeto, independientemente de las expresiones que se usen para hacer referencia a ese objeto (Searle [1969] 2007 85). Estos dos axiomas hacen parte de la discusión tradicional sobre la referencia, Searle agrega un tercer axioma: 3. Axioma de identificación. Si un hablante refiere a un objeto, entonces él identifica o es capaz, si se le pide, de identificar para el oyente ese objeto separadamente de todos los demás objetos. Que puede ser reformulado de la siguiente manera: 3a. Principio de identificación. Una condición necesaria para la realización con éxito de una referencia definida consiste en que, o bien la emisión de esa expresión debe comunicar al oyente una descripción verdadera de, o un hecho sobre, uno y sólo un objeto, o si la emisión no comunica tal hecho el hablante debe ser capaz de sustituirla por una expresión cuya emisión lo comunique. La introducción del axioma y del principio de identificación constituye un claro compromiso de Searle con el descriptivismo. Searle argumenta a favor de la introducción del axioma y el principio de identificación. Quisiera detenerme en esta argumentación, puesto que considero que es bastante útil para
[73]
Una defensa de la teoría searleana de los nombres propios - Marcela del Pilar Gómez
comprender las raíces del compromiso searleano con el descriptivismo. Para empezar, vale la pena tener en cuenta la distinción que traza Searle entre referencia completamente consumada y referencia exitosa. Una referencia completamente consumada es aquella en la que, de manera no ambigua, se identifica un objeto para el oyente. Una referencia exitosa es aquella en la que, aun cuando para el oyente la referencia no sea identificada sin ambigüedad, el hablante está en condiciones de hacerlo si se le pide. La referencia completamente consumada garantiza que la selección o identificación que el hablante hace de un objeto es transmitida al oyente. La pregunta relevante es, entonces, ¿cuáles son las condiciones necesarias para que la emisión de una expresión constituya una referencia completamente consumada? Según el análisis de Searle, las condiciones necesarias de una referencia completamente consumada son dos: (i) debe existir uno y sólo un objeto al que se aplica la emisión de la expresión por parte del hablante y (ii) debe dársele al oyente medios suficientes para identificar el objeto a partir de la emisión de la expresión por parte del hablante (Searle [1969] 2007 90). Para que la condición (i) sea satisfecha deben satisfacerse dos cosas: (ia) debe existir al menos un objeto al que se aplica la emisión de la expresión del hablante y (ib) no debe existir más de un objeto al que se aplica la emisión de la expresión del hablante. La condición (ib) es, según la interpretación se Searle5, satisfecha siempre que el hablante intente referir a un único objeto, independientemente de que haya más de un objeto al que la emisión pueda aplicarse. Para que se cumpla la condición (ii) el oyente debe estar en una situación tal que sea capaz, a partir de la expresión emitida por el hablante, de identificar el objeto del que se está hablando, esto es, una situación en la que no haya, para el oyente, duda o ambigüedad sobre el objeto del que se le está hablando. Para que esto sea posible, el hablante debe estar en condiciones de proporcionar respuestas no ambiguas, si se le pregunta de qué o quién está hablando. Si el hablante no está en condiciones de responder sin ambigüedad a tales preguntas, no identifica un objeto para el oyente, lo cual es condición necesaria de una referencia completamente consumada6. Ahora bien, ¿qué tipo de respuestas —por parte del hablante— son admisibles para tales preguntas? Las respuestas admisibles son 5
La condición (i), sin consideraciones adicionales, corresponde al análisis de Russell de las descripciones definidas. Según el análisis de Russell, las condiciones de satisfacción de una descripción definida son dos: primera, existe al menos un objeto que cumple con la descripción, segunda, no existe más de un objeto que cumple con la descripción.
6
Vale la pena aclarar que el énfasis está puesto en el hablante —antes que en la expresión utilizada— porque, en el marco de la teoría de actos de habla, es tan importante la emisión como el hecho de que el hablante, con la emisión, intente hacer que el oyente reconozca lo que le quiere decir, en este caso, identificar un objeto.
[74]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 67-86
presentaciones ostensivas, descripciones definidas o mezclas de estas. Según lo anterior, la satisfacción de la condición (ii) depende de la capacidad del hablante de proporcionar una expresión, de alguno de esos tres tipos, que sea satisfecha de manera singularizadora por el objeto al que intenta referirse. Ahora bien, hasta ahora sólo se ha explicado cuales son las implicaciones del axioma y del principio de identificación, mostrando que es condición necesaria de una referencia completamente consumada que se cumpla el principio de identificación. Con ello, sin embargo, no parece estar completamente justificada su introducción. Así las cosas, Searle intenta mostrar que el axioma de identificación es un corolario del axioma de existencia; en caso de lograrlo, al axioma de identificación debería quedar plenamente justificado. En primer lugar, cabe anotar que Searle señala que el principio de identificación es un caso especial del principio de expresabilidad7, es decir, siempre que un hablante intenta referirse a un objeto particular debe ser capaz de decir exactamente cuál es el objeto al que se refiere. En segundo lugar, el axioma de identificación se sigue —según el análisis de Searle— del axioma de existencia, puesto que es condición necesaria de que haya uno y solo un objeto al que se aplique la emisión de una expresión por parte del hablante que el hablante pueda identificar el objeto. Esto en virtud de que, en este análisis, la existencia de un único objeto al que se aplica la emisión de un hablante es equivalente al hecho de que el hablante intenta referirse a un único objeto; y es condición necesaria de que el hablante intente referirse a un único objeto que sea capaz de identificarlo. Llegados a este punto tenemos, por un lado, la teoría de Searle sobre los nombres propios y, por otro lado, el análisis de la referencia como acto de habla. Queda, entonces, ver cómo encajan las dos piezas. Según la teoría de los nombres propios cualquier nombre propio está vinculado analíticamente con una disyunción de descripciones; según la teoría de actos de habla es condición necesaria de una referencia completamente consumada que el hablante sea capaz identificar el objeto al que intenta referirse. Así las cosas, asumiendo el análisis de la referencia como acto de habla que he presentado, es claro que para que el uso de un nombre propio constituya un caso de referencia completamente consumada es necesario que el hablante esté en capacidad de identificar el objeto al que se refiere.
7
El principio de expresabilidad reza que cualquier cosa que pueda querer decirse significativamente puede decirse.
[75]
Una defensa de la teoría searleana de los nombres propios - Marcela del Pilar Gómez
II En Naming and Necessity, Kripke hace una crítica a lo que llama ‘teorías del racimo’ o ‘teorías del cúmulo’, término en el que cabe la teoría de Searle. Para presentar sus críticas, Kripke reconstruye la teoría como basada en seis tesis: 1. A cada nombre o expresión designadora ‘X’ le corresponde un cúmulo de propiedades, a saber, la familia de aquellas propiedades φ tales que A cree ‘φX’. 2. A cree que una de las propiedades, o algunas tomadas conjuntamente, selecciona únicamente un individuo. 3. Si la mayor parte, o una mayoría ponderada de las φ’s son satisfechas por un único objeto y, entonces y es el referente de ‘X’. 4. Si la votación no produce un único objeto, ‘X’ no refiere8. 5. El enunciado ‘si X existe, entonces X tiene la mayoría de las propiedades φ’ es conocido a priori por el hablante. 6. El enunciado ‘si X existe, entonces X tiene la mayoría de las propiedades φ’ es necesario (en el idiolecto del hablante). Kripke busca mostrar que las tesis no pueden ser sostenidas sin violar un requisito de no–circularidad (C): para cualquier teoría exitosa, la explicación no debe ser circular. En particular, las propiedades que son usadas en la votación no deben involucrar la noción de referencia de una manera que sea, en últimas, imposible de eliminar (Kripke 72). La tesis 1 es aceptada por ser una constatación. La tesis (2) es equivocada según Kripke por varias razones. En primer lugar, es común el caso en el que un hablante no puede especificar propiedades que seleccionen un único objeto o en el que el hablante no cree que, dentro de las propiedades que cree que son satisfechas por X, algunas lo identifique unívocamente. Es decir, en muchos casos un hablante solo puede dar una descripción 8
El término ‘votación’ surge de una analogía que hace Kripke entre las propiedades φ y los miembros de una corporación, algunos de los cuales tienen voz y voto, mientras otros tienen voz, pero no voto. Similarmente, algunas de las propiedades son las relevantes que otras, algunas, incluso, pueden ser irrelevantes.
[76]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 67-86
indefinida del objeto sobre el que habla, sin dejar de creer que está hablando de un único objeto y sin llegar a creer que sólo hay un objeto que cumpla con la descripción. Por ejemplo, lo único que muchos hablantes podrían decir sobre Richard Feynman es que fue un físico, de ahí no se sigue, sin embargo, ni que crean que hubo un solo físico, ni que no intenten hacer referencia a un único objeto. En segundo lugar, la tesis (2) es errada, según Kripke, puesto que en muchos casos parece llevar a la violación de la cláusula de no–circularidad: por ejemplo, si ‘Einstein’ es equivalente a ‘el que descubrió la teoría de la relatividad’, dado que lo único que muchos hablantes podrían decir sobre la teoría de la relatividad es ‘la teoría de Einstein’. La tesis (3) es equivocada porque es posible un caso en el que la mayoría de las propiedades φ sean satisfechas por un objeto distinto del objeto que el hablante cree que las satisface, y aun así el referente de ‘X’ sea el objeto que el hablante cree y no el otro. Dicho de otra forma, sea x el objeto que el hablante cree que satisface las φ, sea y un objeto distinto de x, es posible que sea y, y no x, el objeto que satisface las propiedades φ, y aun así, el referente de ‘X’ sea x. El ejemplo de Kripke es el siguiente: supónganse que un hablante cree que Gödel fue el hombre que probó la incompletitud de la aritmética, así, el objeto que cumple con la propiedad ‘el que probó la incompletitud de la aritmética’ debería ser el referente de ‘Gödel’. Ahora bien, supóngase que no fue Gödel sino otra persona, Smith en el ejemplo, quien probó la incompletitud de la aritmética, pero que, de alguna manera, la prueba se le atribuyó a Gödel. De ser así, sería Smith quien satisfaría la descripción ‘el que probó la incompletitud de la aritmética’. ¿Diríamos aún que cuando el hablante emite ‘Gödel’ refiere a aquel que cumple la descripción, i. e. Smith? Parece inaceptable responder afirmativamente a esta pregunta, es decir, aun cuando es Smith el que cumple con la descripción ‘el que probó la incompletitud de la aritmética’ —que se supone es la descripción que selecciona el referente del nombre ‘Gödel’— ‘Gödel’ debería referir a Gödel, puesto que, de hecho, el hablante quiere referir a Gödel. La tesis (4) es incorrecta, básicamente por razones que ya se han expuesto. Esta tesis afirma que si la votación no arroja un único objeto, entonces el nombre no refiere, es decir, si no hay un único objeto que cumpla con la mayoría, o la mayoría ponderada si se quiere, de las propiedades φ que el hablante cree que seleccionan un único objeto, entonces el nombre no refiere. Así las cosas, puede estar mal por dos razones: o bien porque la mayoría de las φ’s seleccionan múltiples objetos, o bien porque no seleccionan ninguno. La primera situación es discutida en la crítica a la tesis (2) con el ejemplo de Feynman, en la cual se arguye que es posible que las creencias del hablante que correspondan a ‘X’ no seleccionen un único objeto y que, sin embargo, con ‘X’ a un único objeto. La
[77]
Una defensa de la teoría searleana de los nombres propios - Marcela del Pilar Gómez
segunda situación es en la que las creencias del hablante no seleccionan ningún objeto: si, por ejemplo, hubiese pasado inadvertido un error en la prueba de la incompletitud de la aritmética y ésta fuese completa, entonces la incompletitud de la aritmética no habría sido probada. En ese caso, no habría un objeto que cumpliera la descripción ‘el que probó la incompletitud de la aritmética’ ¿se diría entonces que ‘Gödel’ no refiere? Kripke sostiene que, aún en un caso como ese ‘Gödel’ refiere a Gödel. La tesis (6) es rechazada por Kripke arguyendo que conduce a asumir cierto compromiso con el determinismo. Según él, dado que ‘necesario’ es un término metafísico, que el enunciado ‘si X existe, entonces X cumple la mayorías de las propiedades φ’ sea necesario implica que las propiedades son necesarias de forma tal que el objeto que cumple las propiedades φ no podría no cumplirlas. Dicho de otra forma, la tesis (6) conlleva el mismo problema que las teorías descriptivistas tradicionales: un hecho o propiedad acerca del portador del nombre, que debería ser contingente, pasa a ser considerado como necesario. Una vez vistas las críticas de Kripke a las teorías del cúmulo, vale la pena examinar, en primer lugar, si las seis tesis recogen adecuadamente la teoría del ropero de Searle, pues de eso depende, en gran medida, qué tan contundentes resulten las críticas contra ésta. La tesis (1) —a cada nombre o expresión designadora ‘X’ le corresponde un cúmulo de propiedades, a saber, la familia de propiedades φ tales que A cree ‘φX’— parece bastante aceptable dentro de la teoría de Searle. Como se dijo en la sección anterior, en la teoría del ropero, las condiciones de uso de un nombre están dadas por el conjunto de descripciones asociadas a él (Searle [1967] 2005 111). Adicionalmente, según la teoría de actos de habla, tal respaldo descriptivo —en virtud del cual se usa el nombre— depende de las capacidades del hablante de identificar el objeto al que intenta referirse, es decir, de las descripciones que el hablante asocie con el objeto (Searle [1969] 2007 94). Parece claro, entonces, que la tesis (1) sí hace parte de la teoría de Searle. La tesis (2) afirma que el hablante cree que una de las propiedades o algunas en conjunto seleccionan un único individuo. En la teoría searleana sobre la referencia es claro que el hablante debe estar en condiciones de proporcionar descripciones que identifiquen el objeto al que intenta referirse. Tales descripciones constituyen la información que el hablante posee acerca del portador del nombre. Además, el hablante asume que con su emisión hace referencia a un único objeto: en palabras de Searle: “[…]una condición necesaria de que haya uno y sólo un objeto al que se aplique la emisión por parte del hablante, uno y sólo un objeto al que él intente hacer referencia, es que el hablante sea capaz de identificar ese objeto” (Searle [1969] 2007 95). En otra parte, agrega que “[…] la referencia existe en virtud de hechos sobre el objeto que son conocidos por
[78]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 67-86
el hablante, hechos que valen de manera singularizadora del objeto al que se hace referencia” (Searle [1969] 2007 99 énfasis mío). Esta tesis parece, en principio, ser suscrita por la teoría del ropero, sin embargo, vale la pena recordar que la referencia es un acto de habla, es decir, hacer referencia es dominar una práctica, de manera que no sólo es importante lo que el hablante cree, sino también lo que el hablante intenta y es capaz de hacer. Dicho de otra forma, no se trata solamente de que el hablante crea que una de las propiedades, o algunas tomadas conjuntamente, selecciona únicamente un individuo, sino, y ante todo, de que el hablante pueda identificar, para el oyente, el objeto al cuál intenta referirse, para lo cual como miembro de una comunidad, puede echar mano del acervo de conocimientos que esta posee sobre el portador del nombre. Es decir, puede hacer referencia aún sin creer que sus creencias sobre el portador del nombre lo seleccionan unívocamente, basta con que esté en una situación que le permita transmitirle a oyente de qué o quién está hablando. Así las cosas, resulta muy discutible que la tesis (2) haga parte de la teoría del ropero. La tesis (3) —si la mayor parte, o una mayoría ponderada de las φ’s son satisfechas por un único objeto y, entonces y es el referente de ‘X’—, a primera vista, parece hacer parte de la teoría del ropero, pero no es tan claro, puesto que la teoría no afirma exactamente que si un objeto cumple la mayoría de las descripciones, entonces es el portador del nombre. Más bien afirma que si un objeto es el portador del nombre, entonces debe cumplir una mayoría no especificada de las descripciones. Sin embargo, si la teoría del ropero pretende explicar cómo se fija la referencia de un nombre a partir de descripciones, entonces debe asumir la tesis (3). Por otra parte, dada la laxitud de la que habla la teoría del ropero, la teoría no se compromete con que las descripciones que cumple el portador del nombre deban ponderarse, puesto que el conjunto de descripciones es indeterminado. Sin embargo, parece razonable asumir que las propiedades sean ponderadas, tal como lo hace Kripke. La tesis (4) es claramente suscrita por la teoría del ropero, puesto que la teoría sí afirma que si ningún objeto cumple con al menos una de las descripciones asociadas con el nombre, entonces no hay un objeto que sea el portador del nombre (Searle [1967] 2005 111). Para examinar las tesis (5) y (6) vale la pena recordar las distinciones hechas por Kripke sobre los términos ‘a priori’ y ‘necesario’. Según tal distinción, ‘a priori’ es un término epistemológico y ‘necesario’ es un término metafísico. Así las cosas, la tesis (5) —el enunciado ‘si X existe, entonces X cumple la mayoría de las propiedades φ’ es conocido a priori por el hablante—, dado que involucra el términos ‘a priori’, debe tener implicaciones epistemológicas, es decir, esta tesis está relacionada con lo que el hablante sabe o debe saber para hacer referencia. La tesis (6) —el enunciado ‘si X existe, entonces X cumple la
[79]
Una defensa de la teoría searleana de los nombres propios - Marcela del Pilar Gómez
mayorías de las propiedades φ’ es necesario (en el idiolecto del hablante) —, debe tener, entonces, implicaciones metafísicas. Searle, por su parte, no parece distinguir entre los términos mencionados, más bien, parece usarlos en sentido tradicional, en el cual son más o menos sinónimos. Así las cosas, cabe preguntar si Searle asume ambas tesis o sólo alguna de ellas. La afirmación de Searle que según Kripke revela la tesis (6) es la siguiente: Supongamos que nos ponemos de acuerdo en deshacernos de ‘Aristóteles’ y usar, digamos, ‘el maestro de Alejandro’, entonces es una verdad necesaria que el hombre al que nos referimos es el maestro de Alejandro —no obstante, es una verdad contingente que Aristóteles alguna vez se dedicó a la pedagogía, aunque sugiero que es un hecho necesario que Aristóteles tiene la suma lógica, la disyunción inclusiva de las propiedades que comúnmente se le atribuyen. (Searle 1958, citado en Kripke [1972] 1980 74) Ahora bien, teniendo en cuenta lo expuesto sobre la teoría del ropero, es más o menos claro que es un hecho necesario que Aristóteles tenga la suma lógica de las propiedades que se le atribuyen, en el sentido de que es una condición de que un objeto sea Aristóteles que cumpla alguna de tales propiedades. Dicho de otra forma, la teoría del ropero no se compromete con que el portador del nombre cumpla necesariamente con alguna de las propiedades atribuidas (necesidad de re), sino con que necesariamente el portador del nombre cumple alguna de las descripciones atribuidas (necesidad de dicto). Interpretando la tesis (6) como hablando de necesidad de dicto y no de re, no conduce al determinismo; de forma que si la crítica se limita a decir —y parece que así es— que la tesis debe ser rechazada por conducir al determinismo, entonces se queda sin fundamento. Dicho sea de paso, la teoría searleana tampoco parece suscribir la tesis (6), aun interpretada la necesidad como de dicto, puesto que afirma no que si X existe, entonces cumple con la mayoría de las φ, sino que X cumple al menos una de las φ, de forma que se reduce a los casos relevantes de la tesis (4). Así las cosas, parece que sólo las tesis (3) y (4) son suscritas por la teoría del ropero y son blanco de las críticas kripkeanas. Queda entonces por examinar cómo las críticas a estas tesis afectan a la teoría searleana. El argumento de Kripke contra la tesis (3) está basado en el contraejemplo de la situación en la que fuese Schmidt y no Gödel quien demostró la incompletitud de la aritmética. Hay dos aspectos de la teoría de Searle que el argumento parece pasar por alto: que el nombre no es equivalente a una descripción sino a un conjunto indefinido de estas y la laxitud. El argumento asume que si se descubre que no fue Gödel, sino Schmidt el que demostró la incompletitud de la aritmética, entonces la teoría se ve obligada a decir que ‘Gödel’ refiere a Schmidt y
[80]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 67-86
no a Gödel, puesto que la descripción identificadora relevante asociada con el nombre es ‘el que demostró la incompletitud de la aritmética’. Esto se sigue de asociar con ‘Gödel’ únicamente la descripción ‘el que probó la incompletitud de la aritmética’. Si, como exige la teoría del ropero, se asocia con el nombre un conjunto identificador de descripciones —aun cuando una de las descripciones aislada pueda ser identificadora— que además es impreciso, en el sentido que ya se dijo, entonces puede descubrirse que alguna de las descripciones es falsa del portador del nombre sin que el objeto pierda tal estatus. Hay dos razones para esto: primero, que es el conjunto —que vale la pena recordar, es la disyunción de las descripciones—, y no la descripción, el que fija la referencia; y segundo porque el conjunto no está precisamente defino, es decir pueden agregarse o quitarse descripciones sin que eso conlleve un cambio de referencia; excepto en el caso límite en el cuál todas las descripciones resulten ser falsas. Vale la pena ver, a continuación, como puede responderse de manera más contundente a estas críticas a partir de un trabajo posterior de Searle.
III Se considera que en Intencionalidad Searle continúa el análisis sobre el lenguaje adelantado en trabajos anteriores como Actos de habla y Expression and Meaning, llevándolo ahora a un análisis sobre la mente. Así las cosas, el análisis de los actos de habla y, en particular, el de la referencia se basa ahora en el concepto de Intencionalidad. Así las cosas, Searle se enfrenta a las críticas que se han presentado a su teoría inicial sobre los nombres propios, y hace su propia crítica a la teoría causal de los nombres, valiéndose de los conceptos de la teoría de la Intencionalidad.9 Empecemos con una caracterización general de los estados Intencionales. La Intencionalidad es una característica de los estados mentales, en virtud de la cual algunos de ellos se dirigen a, o son sobre, objetos o estados de cosas en el mundo (Searle [1983] 1992 17). Así las cosas, la característica fundamental de la Intencionalidad es la direccionalidad, lo cual quiere decir que los estados Intencionales son, primordialmente, dirigidos a algo. Por ejemplo, las creencias son siempre Intencionales, en tanto que son siempre creencias de que algo es el caso, es decir, no tiene sentido decir ‘tengo una creencia, pero no es una creencia sobre algo’. Hay algunos estados típicamente Intencionales, como creencia, temor, deseo, amor, odio; otros estados pueden tener instancias Intencionales, sin ser primordialmente Intencionales, por ejemplo, la ansiedad, 9
Siguiendo el uso de Searle, usaré ‘Intencional’, ‘Intencionalidad’, para hablar de la propiedad de los estados mentales, distinguiéndolo de ‘intencional’, en el sentido de ‘con la intención o el propósito de…’.
[81]
Una defensa de la teoría searleana de los nombres propios - Marcela del Pilar Gómez
la felicidad, la depresión, es decir, uno puede experimentar felicidad no dirigida, o puede sentirse feliz porque algo ha ocurrido (felicidad dirigida, Intencional). Por otra parte, la Intencionalidad es una forma de representación. Sin embargo, el término ‘representación’ debe ser entendido en un sentido que no tiene nada que ver con figura. Para entender en qué sentido un estado Intencional es representacional hace falta tener en cuenta varias distinciones y nociones que Searle introduce. En primer lugar, está la distinción entre contenido representativo o Intencional y modo psicológico. Se dice que un estado Intencional consta de un contenido representativo o contenido Intencional y de un modo psicológico en el que se tiene el contenido representativo. El contenido Intencional puede ser, o no, proposicional. Algunos modos, como la creencia, exigen que el contenido representativo sea proposicional, mientras otros, como el amor el odio, no. En segundo lugar está la noción de dirección de ajuste, que puede ser entendida, de manera muy gruesa, como la cuestión de quién —entre el contenido Intencional y el mundo— tiene la responsabilidad de encajar. Las creencias, por ejemplo, tienen dirección de ajuste mente–a–mundo, en tanto que si son falsas, entonces son ellas las que fallan en ajustarse al mundo, de forma que el fallo puede solucionarse simplemente modificando la creencia. Las intenciones o los deseos son de dirección de ajuste mundo–a–mente, puesto que si no son satisfechos, de alguna manera, es el mundo el que falla en ajustarse, ya que no se puede corregir la situación cambiando la intención o el deseo, el deseo o la intención no son incorrectos en el mismo sentido en el que las creencias pueden serlo. Finalmente, está la noción de condiciones de satisfacción o condiciones de éxito de un estado Intencional. Las condiciones de satisfacción de un estado Intencional son las situaciones que hacen que el estado Intencional sea satisfecho; es decir, un creencia es satisfecha si las cosas en el mundo son como se cree que son, un deseo es satisfecho si se cumple, una intención es satisfecha si se lleva a cabo. Las condiciones de satisfacción son internas al contenido Intencional, es decir, un estado Intencional es el estado que es justamente en virtud de que sus condiciones de satisfacción sean las que son y no otras. Por ejemplo, un deseo es el deseo que es porque lo satisfarían ciertos estados de cosas y no otros. Vistas estas nociones queda preparado el terreno para comprender cómo los estados Intencionales son representacionales, recuérdese que esto no debe interpretarse como que los estados Intencionales son figuras. Al respecto de en qué sentido los estados Intencionales son representacionales dice Searle: Decir que una creencia es una representación es simplemente decir que tiene un contenido proposicional y un modo psicológico, que su contenido proposicional determina un conjunto de condiciones de satisfacción
[82]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 67-86
bajo ciertos aspectos, que su modo psicológico determina una dirección de ajuste de su contenido proposicional (Searle [1983] 1992 27). Dicho de otra forma, un estado Intencional, con una dirección de ajuste es una representación de sus condiciones de satisfacción. Las condiciones de satisfacción de un estado Intencional están dadas por su posición en una Red de estados Intencionales y con respecto a un Trasfondo de supuesto preintencionales, que no son ellos mismos estados Intencionales ni hacen parte de las condiciones de satisfacción de estados Intencionales. Para terminar esta caracterización general de los estados Intencionales hace falta hablar brevemente de la noción de causación intencional. La causación intencional no es —como sí lo es la causalidad o causación tradicionalmente entendida— regularidad. En términos muy generales la causación Intencional es una relación en la que uno de los términos debe ser un estado Intencional que causa o es causado por sus condiciones de satisfacción. Donde por ‘causar’ se entiende sencillamente ‘hacer que algo suceda’. Así las cosas, por ejemplo, si alguien tiene sed (el deseo de beber), su sed causa —Intencionalmente hablando— que, por ejemplo sostenga un vaso en su mano, puesto que sostener el vaso hace parte de las condiciones de satisfacción del deseo de beber. A la luz de las consideraciones sobre la Intencionalidad Searle reformula el problema del sentido de los nombres propios. Así, la cuestión deja de ser si los nombres propios hacen o no referencia mediante un sentido, para ser: “¿Hacen referencia los nombres propios estableciendo condiciones de satisfacción internas de un modo que sea consistentes con la explicación general de la Intencionalidad que he estado proporcionando, o hacen referencia los nombres propios en virtud de alguna relación causa externa?” (Searle [1983] 1992 238). Las alternativas parecen ser, entonces, o bien el internalismo que suscribe el descriptivismo, o bien el externalismo de la llamada teoría causal de los nombres, dicho de otra forma, la pregunta ahora es si la referencia tiene éxito en virtud de que el objeto al que se hace referencia se ajusta a algún contenido Intencional asociado, o si la referencia se logra gracias a hechos en el mundo independientemente de cómo esos hechos se representan en la mente. Searle, por supuesto, quiere mantenerse en una postura internalista, de forma que proporciona una explicación de la referencia en términos de la Intencionalidad, pero también, pretende mostrar que la teoría causa descansa sobre esta. Searle se mantiene en su posición inicial sobre el sentido de los nombres propios, pero incluye, además, elementos de la Intencionalidad. Así, ahora Searle considera que no hace falta que se asocien descripciones identificadoras con los nombres propios, basta con que se asocie contenido Intencional con
[83]
Una defensa de la teoría searleana de los nombres propios - Marcela del Pilar Gómez
Red y Trasfondo suficientes para identificar al portador del nombre. El contenido Intencional, vale la pena recordarlo, no es necesariamente proposicional. El análisis a la luz de la Intencionalidad también abre la posibilidad de hacer referencias parásitas, esto es, casos en los que lo único que el hablante podría decir sobre el objeto al cual se refiere con ‘N’ es que es el objeto llamado N en su comunidad de hablantes. La referencia es parásita porque tal uso del nombre depende de que otros hablantes asocien con el nombre contenidos Intencionales distintos de ‘ser llamado N’. Recordemos que según la teoría causal de los nombres, al menos en la versión kripkeana, hay un bautizo inicial, en el cual se fija la referencia del nombre por ostensión o por descripción. En adelante, quien usa el nombre debe solamente cumplir con un requisito para que referir exitosamente: usar el nombre con la intención de hacer referencia al mismo objeto que la persona de quien lo oyó. Según Searle, en el bautizo se involucra un contenido Intencional. Si la referencia del nombre se fija por descripción, es claro que hay involucrado un contenido Intencional. Si la referencia se fija por ostensión, entonces, dado que se involucra la percepción, también puede explicarse Intencionalmente10.Por otra parte, la Intencionalidad se cuela en la teoría causal kripkeana por el requisito de que el hablante haga uso del nombre con la intención de referir al mismo objeto que la persona de la que oyó el nombre. Se tiene, según Searle, un contenido Intencional asociado con un nombre ‘N’: ‘N es el objeto al que hizo referencia la persona de la que se aprendió el nombre’. Esto, sin embargo, no hace que la explicación de la referencia que hace la teoría causal sea internalista, puesto que la teoría considera que la cadena de comunicación es primordial con respecto al contenido Intencional al que pueda haber lugar. Para Searle, sin embargo, la cadena de comunicación no es más que una forma de caracterizar la referencia parásita que se mencionó anteriormente. En la cadena causal de comunicación los usos del nombre posteriores al bautizo inicial son parásitos de éste, puesto que lo que garantiza el éxito de la referencia es la intención de referir al objeto al que refería la persona de la que se aprendió el nombre. Dicho de otra forma, la cadena causal logra dar cuenta de la cómo puede hacerse referencia de manera exitosa porque apela a los contenidos y estados Intencionales de los hablantes que hacen parte de la cadena, aunque el estado Intencional sea simplemente la intención de referir al mismo objeto al que se refería la persona de la que se aprendió el nombre. Finalmente, tras haber visto la crítica a la teoría causal de los nombres, veamos cuáles son los elementos que la Intencionalidad agrega al análisis de la referencia y Para una explicación detallada puede verse el segundo capítulo de Intencionalidad (Searle [1983] 1992), titulado ‘La Intencionalidad e la percepción’.
10
[84]
Revista Colombiana de Filosofía de la Ciencia • Vol. IX ∙ No. 19 Suplemento • 2009 • Págs. 67-86
cómo el nuevo enfoque contribuye a solucionar los problemas que habían quedado abiertos para la teoría del ropero con las críticas de Kripke. Ya aparecieron un par de ellos: las referencias parásitas y los contenidos Intencionales no proposicionales —no descriptivos— que pueden estar asociados con un nombre. De la misma manera como en la teoría del ropero no se consideraba que las descripciones fuesen definiciones de los nombres a los que estaban asociadas, en el nuevo enfoque no se considera que los contenidos Intencionales sean definiciones de los nombres, aunque puedan aparecer en enunciados en los que se use el nombre. Otro aspecto importante que introduce la Intencionalidad es que es un sistema de representación (una Red y un Trasfondo) lo que determinan qué cuenta como un objeto y, consecuentemente, como objeto al que se pueda hacer referencia. Recordemos ahora la crítica kripkeana a las teorías del cúmulo. Habíamos visto que las tesis (3) — si la mayor parte, o una mayoría ponderada de las φ’s son satisfechas por un único objeto y, entonces y es el referente de ‘X’— y (4) — Si la votación no produce un único objeto, ‘X’ no refiere— parecían ser suscritas por la teoría del ropero, de forma que Searle tendría que vérselas con las críticas. Searle responder a la crítica a la tesis (3) arguyendo que, según se ha dicho, un contenido Intencional hace parte de una Red, de forma que el hablante debe tener más contenido Intencional asociado a ‘Gödel’ que solamente ‘el que probó la incompletitud de la aritmética’, en el peor de lo casos usa el nombre haciendo referencia parásita, lo cual, como ya se ha dicho, de todas formas garantiza el éxito de la referencia (Searle [1983] 1992 255). Searle no responde exactamente a las críticas planteadas a la tesis (4), pero la clave de la solución puede estar en la introducción de la relatividad de los criterios de reificación. Es decir, si los criterios de reificación, de individuación y de identidad de objetos son relativos a una Red y a un Trasfondo, si no hay un objeto dentro del sistema de representación relevante que satisfaga los contenidos Intencionales asociados con el nombre, es correcto decir que, con respecto a esa Red y ese Trasfondo, el objeto al que se haría referencia con el nombre no existe.11
Trabajos citados Frege, Gottlob. “Sobre sentido y referencia”. [1892] 2005. Valdés Villanueva. 29–49. Kripke, Saul. Naming and Necessity. Oxford: Basil Blackwell Ltd, [1972] 1980. Al respecto pueden ser iluminadores los comentarios de Searle contra el contraejemplo de Donellan (Searle [1983] 1992, 256–257).
11
[85]
Una defensa de la teoría searleana de los nombres propios - Marcela del Pilar Gómez
Searle, John. Actos de habla. Trad. Luis M. Valdés Villanueva. Madrid: Cátedra, [1969] 2007. —. Intencionalidad. Un ensayo en la filosofía de la mente. Trad. Enrique Ujaldón Benítez. Madrid: Tecnos, [1983] 1992. —. “Nombres propios y descripciones”. [1967] 2005. Valdés Villanueva. 105–114. —. “Proper Names”. Mind 67.266 (1958): 166–173. Valdés Villanueva, Luis M., ed. La búsqueda del significado. Madrid: Tecnos, 2005.
[86]
Información para los autores
La Revista Colombiana de Filosofía de la Ciencia es una publicación académica del Departamento de Humanidades de la Universidad El Bosque, dedicada a principalmente a la filosofía de la ciencia y a sus campos afines (epistemología, lógica, ciencias cognitivas, filosofía de la tecnología, filosofía del lenguaje) y, en general, a los temas y problemas que ponen en diálogo a la filosofía con la ciencias, ya se trate de ciencias puras, aplicadas, sociales o humanas. En ocasiones se editan números monográficos sobre autores o temas puntuales. La revista recibe contribuciones en forma de artículos originales y reseñas de libros en español, portugués, francés e inglés. Las colaboraciones aceptadas serán publicadas en riguroso orden de aceptación, salvo en el caso de los números monográficos. Las colaboraciones recibidas serán estudiadas por el comité editorial para su posible publicación, verificando que se ajusten a las áreas propias de la revista; posteriormente a su recepción serán evaluadas por un árbitro de manera anónima y el autor recibirá una respuesta en un lapso no mayor a 60 días. Se entiende que los autores autorizan a la revista la publicación de los textos aceptados en formato impreso y digital. Todas las contribuciones han de ser enviadas en formato doc, docx, o rtf por correo electrónico a la dirección revistafilosofiaciencia@unbosque.edu.co, y han de cumplir con las siguientes condiciones:
Artículos • El texto ha de ser original e inédito y no se ha de encontrar en proceso de evaluación para su publicación por ninguna otra revista académica. • Se ha de enviar el artículo en un archivo, en versión anónima y cuidando que las notas a pie de página, agradecimientos o referencias internas en el texto no revelen la identidad de su autor. En un archivo aparte se ha de enviar el título del artículo, el nombre del autor, su afiliación institucional y sus datos de contacto (dirección de correspondencia, correo electrónico y teléfono).
Información para los autores
• El artículo debe venir precedido de un resumen en su idioma original que no exceda las 100 palabras, y 5 palabras clave. Se han de incluir también las traducciones al inglés del título del artículo, el resumen y las palabras clave. • La bibliografía completa ha de estar al final del artículo y ha de cumplir con el sistema MLA de citación para el área de filosofía (http://www. mla.org/style). • Las referencias bibliográficas han de incorporarse al texto y no en las notas al pie de página (las notas a pie de página han de restringirse así a aquellas que contengan información sustantiva), de la siguiente manera: (Autor, página). En caso de que haya más de una obra el autor en la bibliografía, se ha de agregar el año de la obra: (Autor, año, página). • Las citas textuales de más de cinco líneas han de ubicarse en párrafo aparte con sangría de 0,5 cms. a margen derecho e izquierdo, y no han de estar entrecomilladas. Las citas de extensión menor no requieren párrafo aparte y han de venir entrecomilladas. • La extensión máxima de los artículos es de 10.000 palabras.
Reseñas bibliográficas • Se recibirán únicamente reseñas sobre libros publicados recientemente (cuya fecha de publicación no exceda los últimos dos años). • Las reseñas han de cumplir con las mismas condiciones para la citación, notas al pie y referencias bibliográficas ya especificadas para los artículos. • La extensión máxima de las reseñas es 2.500 palabras. Los autores de artículos y reseñas que sean publicados en la revista recibirán dos ejemplares de la misma.
[88]
ISSN 0124 - 4620
Revista Colombiana de
FILOSOFÍA DE LA CIENCIA
Revista Colombiana de
FILOSOFÍA DE LA CIENCIA
Vol. X ∙ No. 20 - 21 • 2010 • ISSN 0124 - 4620
Contenido
Revista Colombiana de Filosofìa de la Ciencia
Vol. IX ∙ No. 19 • 2009 • ISSN 0124 - 4620
Sets and Pluralities Gustavo Fernández Díez ¿Probabilidad cuántica o espacio–tiempo relativista? Rafael Andrés Alemañ Berenguer Un argumento pragmático para el concepto de lo mental Fabrizio Pineda Diferenciación y explicación causal en los escritos biológicos de Aristóteles Alejandro Farieta Una defensa de la teoría searleana de los nombres propios Marcela del Pilar Gómez
http://www.uelbosque.edu.co/ Vol. IX ∙ No. 19 • 2009
Por una Cultura de la Vida, su Calidad y su Sentido