Anais do V Simpรณsio Internacional Principia
Universidade Federal de Santa Catarina Reitor: Álvaro Toubes Prata Departamento de Filosofia Chefe: Léo A. Staudt Programa de Pós-Graduação em Filosofia Coordenador: Darlei Dall’Agnol NEL – Núcleo de Epistemologia e Lógica Coordenador: Cezar A. Mortari NECL – Núcleo de Estudos sobre Conhecimento e Linguagem Coordenador: Luiz Henrique de A. Dutra Principia – Revista Internacional de Epistemologia Editor responsável: Luiz Henrique de A. Dutra Editor assistente: Cezar A. Mortari
V Simpósio Internacional Principia A Filosofia de Bas van Fraassen 10 Anos de Principia
Comissão organizadora Luiz Henrique de A. Dutra Cezar A. Mortari Otávio Bueno Sara Albieri
Comissão científica Michel Ghins Alberto Cupani Hugh Lacey Harvey Brown Gustavo Caponi
www.cfh.ufsc.br/∼necl/5sip.html necl@cfh.ufsc.br
RUMOS DA EPISTEMOLOGIA, VOL. 9
Cezar A. Mortari Luiz Henrique de A. Dutra (orgs.)
Anais do V Simpósio Internacional Principia
NEL – Núcleo de Epistemologia e Lógica Universidade Federal de Santa Catarina Florianópolis, 2009
© 2009, NEL – Núcleo de Epistemologia e Lógica, UFSC ISBN: 978-85-87253-10-1 (papel) 978-85-87253-11-8 (e-book) UFSC, Centro de Filosofia e Ciências Humanas, NEL Caixa Postal 476 Bloco D, 2o¯ andar, sala 209 Florianópolis, SC, 88010-970 (48) 3721-8612 nel@cfh.ufsc.br www.cfh.ufsc.br/∼nel
FICHA CATALOGRÁFICA (Catalogação na fonte pela Biblioteca Universitária da Universidade Federal de Santa Catarina)
S612a Simpósio Internacional Principia (5. : 2007 : Florianópolis, SC) Anais V Simpósio Internacional Principia ; Cezar A. Mortari, Luiz Henrique de A. Dutra (orgs.) – Florianópolis : NEL/UFSC, 2009. 435 p. – (Rumos da epistemologia ; v.9) Tema : A filosofia de Bas van Fraassen : 10 anos de Principia
1. Van Fraassen, Bas C. 2. Epistemologia. 3. Lógica. 4. Ética. 5. Filosofia – História. I. Mortari, Cezar A. II. Dutra, Luiz Henrique de A. III. Título. CDU: 1
Reservados todos os direitos de reprodução total ou parcial por NEL – Núcleo de Epistemologia e Lógica, UFSC. Impresso no Brasil
Apresentação
Os textos reunidos neste volume foram apresentados no V Simpósio Internacional Principia, realizado em agosto de 2007 em Florianópolis, tendo sido promovido pelo Núcleo de Epistemologia e Lógica, NEL, pela revista Principia e pelo Grupo de Estudos sobre Conhecimento e Linguagem, GECL, da Universidade Federal de Santa Catarina. O evento contou com apoio financeiro da própria UFSC e da CAPES. Alguns textos também apresentados no simpósio foram publicados na revista Principia, em virtude dos assuntos sobre os quais tratavam. O simpósio teve como tema principal a filosofia de Bas C. van Fraassen. Entretanto, como nos outros eventos da série, foram acolhidos também trabalhos que não versavam sobre o tema principal do simpósio. Estes trabalhos são das mais variadas áreas filosóficas e de diversos temas. Não havendo forma de reuni-los em um volume com identidade mais definida, optamos por publicar esses textos num volume de anais. Na medida do possível, os textos foram agrupados em seções temáticas. Os organizadores do evento e deste volume de anais agradecem aos participantes que enviaram seus textos e tiveram a paciência necessária para aguardar a publicação. Agradecem também às instituições que deram apoio financeiro ao evento e às pessoas que participaram de sua preparação e realização, assim como deste volume de anais.
Florianópolis, setembro de 2009. Cezar Mortari Luiz Henrique Dutra
coleção
RUMOS DA EPISTEMOLOGIA
Editor: Luiz Henrique de A. Dutra
Conselho Editorial: Alberto O. Cupani Cezar A. Mortari Décio Krause Gustavo A. Caponi José A. Angotti Luiz Henrique A. Dutra Marco A. Franciotti Sara Albieri
Núcleo de Epistemologia e Lógica Universidade Federal de Santa Catarina nel@cfh.ufsc.br (48) 3721-8612
www.cfh.ufsc.br/∼nel fax: (48) 3721-9751
Criado pela portaria 480/PRPG/96, de 2 de outubro de 1996, o NEL tem por objetivo integrar grupos de pesquisa nos campos da lógica, teoria do conhecimento, filosofia da cicia, história da ciência e outras áreas afins, na própria UFSC ou em outras universidades. Um primeiro resultado expressivo de sua atuação é a revista Principia, que iniciou em julho de 1997 e já tem doze volumes publicados, possuindo corpo editorial internacional. Principia aceita artigos inéditos, além de resenhas e notas, sobre temas de epistemologia e filosofia da ciência, em português, espanhol, francês e inglês. A Coleção Rumos da Epistemologia é publicada desde 1999, e aceita textos inéditos, coletâneas e monografias, nas mesmas línguas acima mencionadas.
S UMÁRIO
I – E PISTEMOLOGIA A LBERTO C UPANI A Propósito da Base Tecnológica do Conhecimento Científico
13
A LEJANDRO C ASSINI ¿Son Necesarios los Modelos para Identificar a las Teorías?
23
FABRINA M OREIRA S ILVA Epistemologia como História Conceitual: a Formação do Conceito de Ideologia Científica em Georges Canguilhem
38
F LÁVIO M IGUEL DE O LIVEIRA Z IMMERMANN Hume e os Acadêmicos Modernos
44
G ELSON L ISTON O Fisicalismo de Neurath e os Limites do Empirismo
53
G USTAVO C APONI Las Constricciones Desenvolvimientales como Causas Remotas de los Procesos Evolutivos
68
G USTAVO R ODRIGUES R OCHA Realismo e Anti-realismo: o que podemos aprender a partir da história do spin
75
J ANAÍNA R ODRIGUES G ERALDINI Configurações Arqueológicas das Ciências Humanas
83
K ARLA C HEDIAK O Papel da Evolução Biológica na Compreensão da Representação em Fred Dretske
88
M ARIELA D ESTÉFANO El Requisito de Generalidad y El Sistema Subpersonal de Procesamiento Linguístico: más conceptos de los que creíamos
96
N ÉLIDA G ENTILE Adecuación Empírica y Compromisos Metafísicos
108
O SVALDO P ESSOA J R . Scientific Progress as expressed by Tree Diagrams of Possible Histories
114
O SWALDO M ELO S OUZA F ILHO Analogia entre a Termodinâmica Geral e a Física Aristotélica
123
8
R AQUEL S APUNARU Determinismo, Indeterminismo e Teoria Quântica em Popper
133
S OFIA I NÊS A LBORNOZ S TEIN A Ontologia Analítica: Críticas e Perspectivas
141
T HIAGO M ONTEIRO C HAVES Bas van Fraassen e o Problema da Inferência para a Melhor Explicação
149
II – L ÓGICA A NTÔNIO M ARIANO N OGUEIRA C OELHO Um Conflito entre Ontologia e Lógica: Quine a favor de V = L e contra iω
161
B RUNO VAZ A Concepção de Demonstração em Euclides e Hilbert
165
C EZAR A. M ORTARI Bissimulações para Lógicas Modais Restritas
173
H ÉRCULES DE A RAUJO F EITOSA M AURI C UNHA DO N ASCIMENTO M ARIA C LAUDIA C ABRINI G RÁCIO A Propositional Version of the Logic of the Plausible
184
J ORGE A LBERTO M OLINA Sobre a Distinção entre Demonstração e Argumentação
196
M ARIANA M ATULOVIC Um Sistema de Tablôs para a Lógica do Muito
207
WAGNER DE C AMPOS S ANZ Que é Harmonia para Regras de Introdução/Eliminação?
224
III – É TICA E F ILOSOFIA P OLÍTICA A LCINO E DUARDO B ONELLA Valor da Vida Humana e Anencefalia
231
A LESSANDRO P INZANI Identidade Coletiva, Culturas e Secessão
240
A NTONIO F REDERICO S ATURNINO B RAGA Pode Rawls Tachar o Utilitarismo de Doutrina (abrangente) do Bem?
259
C HARLES F ELDHAUS Habermas, Eugenia Liberal e Justiça Social
273
9
É DISON M ARTINHO DA S ILVA D IFANTE A Felicidade e o Sentimento de Prazer e Desprazer em Kant
281
E RICK C. DE L IMA Normatividade a Partir de Socialização e Individualização: Proximidades entre Hegel e Habermas
286
G IOVANNE B RESSAN S CHIAVON A Razão do Direito em Habermas
306
J OEL T HIAGO K LEIN A Relação entre Dever e Inclinação na Primeira Seção da “Fundamentação da metafísica dos costumes”
319
M ARCO A NTONIO O LIVEIRA DE A ZEVEDO Sobre a Possibilidade de uma Teoria Moral Baseada em Direitos
326
M ARIA C ECÍLIA M ARINGONI DE C ARVALHO Quem são os Membros da Comunidade Moral? Peter Singer, a Senciência e as Razões Utilitaristas
343
M ILENE C ONSENSO T ONETTO A Co-originariedade do Direito à Liberdade e do Direito à Igualdade em Kant
356
PAULO C ÉSAR DE O LIVEIRA PATRICIA DE C ARVALHO Habermas: da Crítica ao “Cientismo” à Ética da Ação Comunicativa
366
IV – H ISTÓRIA DA F ILOSOFIA A GUINALDO A MARAL A Influência Heideggeriana na Visão de Gadamer de Compreensão e Linguagem, com Contribuições de F. Schleiermacher
375
C ARLOS D IÓGENES C. T OURINHO O Problema da Intencionalidade: da Objetividade Imanente em F. Brentano à Consciência Transcendental na Fenomenologia de E. Husserl
382
É RICO A NDRADE M. DE O LIVEIRA Nota sobre o Conceito de Movimento no Le Monde e nos Principes de la Philosophie: continuidade ou ruptura?
392
F. F ELIPE DE A. FARIA A Plenitude Cuvieriana
409
10
R OMMEL LUZ F. B ARBOSA Transcendência Crítica sem Ideal “Transcendental”: sobre a questão da crítica, em Foucault
417
TAÍS S ILVA P EREIRA Algumas Considerações sobre o Papel da Autenticidade na Esfera Pública em Charles Taylor
427
I EPISTEMOLOGIA
A P ROPÓSITO DA B ASE T ECNOLÓGICA DO C ONHECIMENTO C IENTÍFICO A LBERTO C UPANI Universidade Federal de Santa Catarina/CNPq
cupani@cfh.ufsc.br
É certamente difícil entender o desenvolvimento da ciência, particularmente a moderna, sem levar em consideração o papel da tecnologia. Aparelhos e técnicas, geralmente originários dos ofícios e da indústria, tiveram amiúde decisiva importância em suscitar ou resolver problemas científicos, e até gerar áreas de pesquisa, como no conhecido caso da relação entre a máquina de vapor e a termodinâmica. O historiador Derek de Sola Price enfatizou essa importância, sobre tudo nas mudanças científicas revolucionárias. Analisando o aperfeiçoamento e uso do telescópio por Galileu, Price sustentou que esse instrumento não foi apenas um meio de testar idéias, mas um veículo de “conhecimento revelador” acerca do mundo. Conforme este autor, a tecnologia contribui para a ciência mediante a revelação artificial da realidade, tão importante quanto as idéias ou a percepção “natural” (Price 1984: 108). No entanto, a posição de Price dista de ser a regra. Geralmente se pensa na tecnologia como um recurso que auxilia ou possibilita o conhecimento propriamente dito, não como um fator com relevância epistemológica própria. Essa circunstância dá particular interesse às idéias de Davis Baird, tal como expostas em seu livro ThingKnowledge. A Philosophy of Scientific Instruments (2004).1 Na opinião de Baird, o papel do pensamento e da linguagem tem sido sobreestimado, na tradição filosófica ocidental, com relação ao papel da ação e do uso de instrumentos para a obtenção do conhecimento. Do mesmo modo que a teoria, sustenta nosso autor, os instrumentos são portadores de conhecimento (knowledge bearers) e não meramente auxiliares dele. Os instrumentos são artefatos fabricados com habilidade (crafted), sendo centrais, para seu desenvolvimento e uso, o pensamento e a comunicação visual e táctil (e não necessariamente a linguagem). “Uma dimensão essencial da instrumentação, argumenta Baird, vive fora da linguagem”. Assim como lemos e interpretamos textos, precisamos de técnicas para compreender e melhorar os instrumentos, e a cultura dos textos é impotente para entender a natureza material da instrumentação e da tecnologia. Por tal motivo, o propósito do livro é mostrar a urgência de uma diferente epistemologia, de uma concepção materialista do conhecimento, pois a epistemologia habitual, ligada à noção de conhecimento como “crença verdadeira justificada”, é impotente para compreender o caráter epistêmico dos artefatos. Para Baird, Os filósofos e historiadores se exprimem em palavras, não em coisas, e assim não é surpreendente que aqueles que têm um virtual monopólio sobre dizer (palavras!) o que o conhecimento científico é, o caracterizem em termos da classe de conhecimento com que eles estão familiarizados — palavras. (Baird 2004: 7)2 Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 13–22.
14
Alberto Cupani
Mas também os aparelhos encarnam conhecimento, aponta Baird, um conhecimento que nem sempre pode ser apreciado tão somente mediante palavras e pensamentos. Baird ilustra esse fato com a história do motor eletromagnético de Faraday, do qual o inventor fez cópias reduzidas e enviou a colegas, além de publicar artigos sobre a sua descoberta/invenção. O desempenho observado do aparelho de Faraday não requer qualquer interpretação. Ao passo que havia considerável desacordo sobre a explicação desse fenômeno, ninguém contestava o que o aparelho fazia: ele exibia (e ainda exibe) movimento rotatório como conseqüência de uma adequada combinação de elementos elétricos e magnéticos. (Baird 2004: 3)
Podemos compreender o motor de Faraday lendo suas notas e examinando o motor. Existe, segundo Baird, um “espaço de trabalho” para o conhecimento na materialidade do aparelho. Esse espaço depende amiúde, porém nem sempre, da teoria (que de resto, pode ser falsa). Inúmeras vezes, na história da ciência e da tecnologia, os aparelhos foram entendidos em função de uma teorização que, posteriormente, foi considerada errada. E também, o avanço da teoria amiúde seguiu o avanço instrumental (2004: 10). Por isso, segundo Baird, nenhuma explicação unitária do conhecimento serviria à ciência e à tecnologia. Em particular (e como veremos melhor depois), uma epistemologia puramente subjetiva, limitada às crenças de sujeitos, é insuficiente. Precisamos de uma epistemologia objetiva, porque o conhecimento, tanto no que tange a teorias como a artefatos, é algo público (2004: 16). Se os instrumentos são portadores de conhecimento, isso não ocorre sempre do mesmo modo. Baird propõe distinguir entre três tipos de artefatos epistemicamente significativos, três classes de “conhecimento-coisa” ou “conhecimento coisificado” (thing-konwledge). Existem, por um lado, os artefatos que representam (representing things), ou seja, os modelos; por outro, os artefatos que mostram o conhecimento em ação (working knowledge); por fim, temos os artefatos que sintetizam conhecimento (encapsulate knowledge). Baird ilustra inicialmente o primeiro tipo com os planetários (orreries)3 dos séculos XVIII e XIX. Trata-se de estruturas metálicas que simulam a posição respectiva do sol e os planetas, bem como o deslocamento destes últimos nas suas órbitas. Seguindo N. Goodman (em Languages of Art), Baird afirma que os planetários são modelos porque não são verbais nem constituem casos ou exemplos de eventos genéricos. Esses modelos cumprem a mesma função que as teorias, pois explicam os fenômenos celestes, permitem predizer e são confirmáveis ou refutáveis tanto pela evidência empírica quanto pela teoria (2004: 35ss). A sua relação com o pensamento — continua Baird — é conforme a concepção semântica das teorias, com a diferença de que “com os modelos conceituais, a teoria especifica um modelo ou classe de modelos. Com os modelos materiais, os modelos especificam ou talvez melhor apontam para a teoria” (2004: 37). Cabe reparar que, enquanto os modelos teóricos não precisam se parecer com os seus objetos, com os modelos materiais isso é comum. Mais importante é que
A propósito da base tecnológica do conhecimento científico
15
os modelos materiais são manipuláveis, o que é importante quando a “manipulação” conceitual não é possível. Outros casos de artefatos que representam a realidade, analisados por Baird, são o modelo reduzido da roda de água do engenheiro John Smeaton no século XVIII (que permitiu aumentar a eficiência do artefato) e o modelo helicoidal da molécula de DNA, devido a J. Watson e F. Crick. Com relação ao primeiro, Baird observa que Smeaton, “sem ser perturbado por uma teoria enganadora [a teoria de Antoine Parent, prevalecente à época], e bem informado pela sua experiência prática com rodas de água, estava em melhores condições para representá-las em um modelo material que Parent em equações” (2004: 31). Já com relação ao modelo “de bolas e varas” de Watson e Crick, Baird observa que “aqui, o modelo é conhecimento”. Tanto o é, que foi “brincando” com a estrutura física que estavam montando que os hoje famosos cientistas foram resolvendo os problemas teóricos (2004: 33). Quando faltavam a Watson e Crick razões pelas que os átomos ‘deveriam’ ser de um modo ou de um outro, os modelos lhes davam espaço para explorar possibilidades ‘sem razão’, o que equivale a dizer, sem razão proposicional, mas com a razão fornecida pelo espaço de modelagem material. (2004: 33)
Para além da sua utilidade em resolver problemas teóricos específicos, Baird acredita que este tipo de artefatos é relevante para a própria epistemologia. A habilidade para modificar manualmente, por assim dizer, os modelos materiais é importante porque fornece um diferente ponto de entrada em nosso aparelho cognitivo. Manipulações conceituais fornecem uma entrada; as manipulações materiais, [fornecem] uma segunda entrada independente. Admitindo que os modelos, e mais geralmente, os instrumentos, têm status epistêmico, ampliamos a nossa capacidade de fazer que nosso aparelho cognitivo se relacione com o mundo. (2004: 40)
Ao segundo tipo de artefatos epistemologicamente significativos pertencem os que mostram “conhecimento em ação” ou “conhecimento operante” (working knowledge), como a bomba de ar e o ciclotrão. Os fenômenos que esses artefatos produzem são reais e independem de se dispor de uma explicação teórica que de resto, caso existir, pode se revelar posteriormente falsa. Trata-se de fenômenos que constituem casos de atividade material (material agency) e não podem ser diminuídos por, ou reduzidos a, uma explicação teórica (2004: 44). Baird ilustra mais especificamente este tipo de artefatos mediante o “pulse glass”, um dispositivo para o qual B. Franklin chamou a atenção e que foi objeto de debates durante o século XIX.4 O aparelho contribuiu para a ciência, argumenta Baird, de três maneiras: produzindo um fato instrumentalmente estruturado, uma certeza técnica (o fenômeno pode ser produzido regularmente) e a base para um posterior desenvolvimento instrumental (o pulse glass foi estudado por J. Watt, o aperfeiçoador da máquina de vapor). A relevância epistemológica do artefato é comentada assim por Baird:
16
Alberto Cupani
Chamo ‘operante’ este tipo de conhecimento. É uma forma de conhecimento material diferente do modelo de conhecimento antes discutido. Subjetivamente, a pessoa que tem um ‘conhecimento operante’ tem conhecimento suficiente para fazer algo. Objetivamente, um dispositivo que porta conhecimento operante opera regularmente. Apresenta um fenômeno que pode ser usado para realizar algo. Esta forma de conhecimento material, em contraste com o conhecimento modelo, não é representacional, antes apela para noções pragmatistas de conhecimento como ação efetiva. (2004: 45)
Da mesma maneira, no caso da bomba de ar, “o mecanismo pneumático permite que a atividade material se apresente em si mesma, porém sob controle artificial”. Somos “admitidos no laboratório da Natureza”, não pela guia da teoria nem mediante palavras, mas pela eficácia da nossa capacidade de fazer coisas. O que vale para a bomba de ar, vale a fortiori para o ciclotrão, que nos permite “experimentar alguns dos mais profundos secretos do cosmos”, argumenta Baird. Não apenas isso: o ciclotrão “é um lugar (site) para o desenvolvimento de conhecimento material em uma variedade de frentes, incluindo sistemas de vazio, eletrônica de rádio freqüência e controle de raios de íons, entre outras coisas” (2004: 55). Os aperfeiçoamentos e adaptações dos instrumentos fazem com que os mesmos se acumulem. De igual modo se acumulam as técnicas a eles ligadas, na forma de receitas. Comentando um livro de tais receitas, Baird comenta: A classe de informação preservada em livros como Building Scientific Apparatus, é diferente da classe de informação codificada em teorias científicas ou dados experimentais. Esses livros, e revistas como a Review of Scientific Instruments registram e preservam um acervo de técnicas para produzir certos efeitos que, de fato, têm sido importantes para fazer coisas . . . (2004: 65–6)
O terceiro tipo de aparelhos analisado por Baird é o daqueles que sintetizam (“encapsulam”) conhecimento. Trata-se dos aparelhos que medem algo, desde uma régua até um espectrômetro. O instrumento “interage com um espécime [de alguma classe] gerando um sinal que, adequadamente transformado, pode ser entendido como informação acerca desse espécime” (2004: 68). Um termômetro é um fácil exemplo. Esses artefatos combinam diversos tipos de conhecimento: Eles encapsulam na sua forma material não apenas o conhecimento-modelo e o conhecimento operante, mas também, em muitos casos, conhecimento teorético e substitutivos funcionais de habilidades humanas. Na sua forma material, os instrumentos de medição integram todas essas diferentes classes de conhecimento em um dispositivo que é ao mesmo tempo tanto um caso de conhecimento materialmente encapsulado como uma fonte de informação sobre o mundo. (2004: 116)5
Um instrumento desses (“habilidoso”, skilled) não é, comenta Baird, meramente a realização material de conhecimento proposicional. Ele reúne idéias e realidades materiais, as quais não se comportam do mesmo modo (nem podem ser manipuladas do mesmo modo).
A propósito da base tecnológica do conhecimento científico
17
* Conforme Baird, é da maior importância reconhecer como conhecimento (digamos, corporificado), e não apenas como auxiliares do conhecimento, os artefatos antes mencionados. Ao incluirmos em nossa visão do saber humano o “conhecimento coisificado”, modificamos a nossa compreensão da história e das relações entre ciência e tecnologia. A mudança de percepção aqui proposta não é fácil, comenta Baird, pois a materialidade dos instrumentos passa despercebida até para os analistas da tecnologia, quando os caracterizam como “portadores de informação” e resultados de idéias. É significativo, acrescenta, que a materialidade dos artefatos seja percebida (admitida) tão somente ao fabricá-los ou quando quebram. “Porém, crenças acerca de artefatos não são elas próprias os artefatos”, corrige nosso autor (2004: 148). E o engajamento direto com os materiais é um dos componentes do progresso em nosso conhecimento do mundo. Por isso, conclui Baird, o desenho de artefatos não consiste apenas em lidar com idéias, mas cobre “o mútuo emprego do material e do proposicional”, bem como “formas híbridas” tais como gráficos, simulações por computador e modelos materiais. Além do mais, a “coisicidade” (thing-y-ness) dos aparelhos ensina lições que não se podem extrair do trato com idéias. A primeira delas, que nenhum dispositivo funciona sem problemas (“Podemos imaginar um parafuso perfeito, porém não podemos fabricá-lo”). Os instrumentos não funcionam bem, ou de igual modo, em qualquer meio. O comportamento específico dos materiais não pode ser sempre previsto teoricamente. O espaço e o tempo introduzem dificuldades adicionais, não experimentadas pelas idéias: o dispositivo deve caber (problemas de forma e dimensão) e deve durar (“As idéias podem ou não ser atemporais. As ligas de metal, em seu estado de liquefação, certamente não o são”). Igualmente alheias à esfera teórica são as questões relativas à segurança (riscos) e ergonomia (o modo físico de se lidar com o aparelho) (2004: 152–65). Particularmente importante, segundo Baird, é a transformação dos aparelhos e instrumentos em “caixas-pretas” (black boxes), no sentido utilizado por B. Latour, isto é, designando a circunstância de que o aparelho, ao funcionar eficientemente, “se torna invisível pelo próprio sucesso”.6 Mas, diferentemente do sociólogo francês, quem vê nesse fenômeno algo que leva a mistificar a ciência e a tecnologia, Baird vê aqui algo positivo. O conhecimento “encapsulado” no aparelho é “destacado” de seu contexto de origem e fica à disposição como instrumento de novas descobertas e invenções (adaptado, todavia, às suas circunstâncias de aplicação). Trata-se de uma certa mecanização da ciência, sem a qual seus avanços (e até suas revoluções) não seriam concebíveis.7 * O conhecimento que encarnam os artefatos é, para nosso autor, tão objetivo quanto o conhecimento encarnado em teorias.8 A função que desempenha o aparelho é, para
18
Alberto Cupani
Baird, o equivalente da verdade teórica. Trata-se de uma “verdade material”, no sentido em que se fala, por exemplo, de uma “verdadeira roda” quando ela funciona como se espera (2004: 122). Um artefato é portador de conhecimento quando desempenha com sucesso uma função.9 E assim como a verdade é um ideal regulativo a que tendem as teorias, a regularidade e confiabilidade é o ideal regulativo na construção de instrumentos. O paralelismo se estende à forma de trabalhar em ambos os casos: O conhecimento, expresso em proposições, fornece alimento para posteriores reflexões teóricas. Estes recursos — sentenças com conteúdo — são manipulados lingüística, lógica e matematicamente. Os teóricos são ‘ferreiros de conceitos’, se vocês querem, conectando, justapondo, generalizando e derivando novo material proposicional a partir de um dado material proposicional. Não mundo material, funções são manipuladas (. . . ) Uma verdade material é substituída por uma outra que serve à mesma função. (. . . ) Os ‘instrumentistas’ são ‘ferreiros de funções’, desenvolvendo, substituindo, expandindo e conectando novas funções instrumentais a partir de funções dadas. (2004: 123)
De resto, ambos os tipos de conhecimento: teórico e material, estão intervinculados na produção e funcionamento dos aparelhos: A justificação de verdades materiais (. . . ) é questão de desenvolver e apresentar evidência material, teorética e experimental que conecte o comportamento de uma nova reivindicação material de conhecimento com outras reivindicações materiais e lingüísticas de conhecimento. Em alguns casos, um fenômeno é suficientemente convincente por si mesmo (. . . ) Não obstante, e de maneira típica, é importante conectar os fenômenos que um instrumento exibe com outro conhecimento instrumental, experimental e/ou teorético . . . (2004: 126)
Baird compartilha da posição de Popper no que diz respeito a não reduzir a Epistemologia ao estudo da subjetividade humana (Popper 1972). Na sua opinião, Popper estava certo ao reivindicar o caráter objetivo do conhecimento, na medida em que ele é público. No entanto, Baird prefere uma versão “menos extrema” da Epistemologia Objetiva que a popperiana: ambos os tipos de conhecimento são reais e devem ser enfocados pela Epistemologia. O conhecimento em sentido subjetivo (crenças, mas também habilidades) ajuda a compreender o conhecimento objetivo (verdade de uma teoria; funcionamento de um aparelho) e vice-versa. As crenças e habilidades individuais são, no máximo, “candidatas” a conhecimento, porém seu reconhecimento provém da comunidade científica e tecnológica que age e reage sobre objetos públicos (um problema ou teoria formulados; uma máquina operando). Junto com o “Mundo 3” de teorias, problemas e argumentos, argumenta Baird, temos ‘um mundo material de conhecimento’ (dispositivos, máquinas, instrumentos) que interage com os mundos 1 (material) e 2 (psíquico) de Popper.10 Além do mais, para Baird conhecimento, teórico e material, não se apóia, como defende Popper, em uma “base empírica convencional”. Essa maneira de argumentar guarda as conotações de uma concepção demasiado teórica do conhecimento, em que o papel da experimentação
A propósito da base tecnológica do conhecimento científico
19
não é suficientemente apreciado. Colhendo sugestões de autores como A. Pickering (The Mangle of Practice) e D. Gooding (Experiment and the Making of Meaning), Baird chama a atenção sobre a bem denominada questão de “como os experimentos terminam” (P. Galison). E eles (seja relativos a enunciados, seja relativos a máquinas) terminam quando se consegue uma “consiliência” (Hacking 1992) entre diversos fatores: questões, enunciados, teorias, habilidades, materiais, instrumentos, dados . . . (2004: 134). Nessa espécie de harmonização, Baird faz questão de frisar a menor plasticidade dos elementos materiais em comparação com os elementos teóricos. Enquanto me sinto cômodo pensando que muito do conteúdo grosso modo proposicional da ciência e da tecnologia (. . . ) é um recurso plástico, me sinto menos cômodo com a suposta plasticidade de (ao menos parte) do conteúdo material da ciência e a tecnologia. O motor eletromagnético de Faraday (. . . ) não era um recurso plástico, mas uma âncora empírica num mar de confusão teórica. O modo como falamos, exatamente, do seu conhecimento operante, desde as mais básicas ‘explicações fenomenológicas’ até as mais profundas explicações teoréticas, é uma arena de considerável espaço de manobra. Mas o fenômeno em si não irá desaparecer [por isso]. Pode acabar resultando não interessante e/ou não importante, talvez (como o pulse glass). Mas até esse fenômeno não importante não irá desaparecer. (2004: 135)
Essa convicção leva Baird a criticar as posições céticas dos sociólogos com relação ao discurso sobre “conhecimento” científico. Para nosso autor, a importância da crítica sociológica reside em que ela conduz a examinar melhor a epistemologia da ciência e a tecnologia (2004: 114).11 Mas sua certeza do caráter objetivo do conhecimento “material” (resistência dos materiais, persistência de fenômenos produzidos por aparelhos), bem como a intervinculação entre as formas materiais e teóricas de conhecimento, o leva a evitar esse ceticismo e considerar reais nosso conhecimento do mundo e seu aperfeiçoamento. * Acredito que Baird fez uma importante contribuição à epistemologia da ciência (e até à epistemologia geral) ao defender que existem formas de conhecimento materializado. Vejo como seu principal mérito fomentar uma visão de conjunto da capacidade humana de conhecimento, em que suas diversas dimensões (perceptiva, teórica, lingüística, prática) são apreciadas em seu operar conjunto. A constante remissão a exemplos de fabricação e uso de instrumentos, e sua relação com a formulação e teste de teorias, torna a exposição de Baird bastante convincente. Por outra parte, e contrariamente ao que se poderia esperar de um estudioso que enfatiza a importância dos artefatos na produção do conhecimento, Baird nos põe em guarda contra o excesso de confiança na informação obtida mediante instrumentos. Ele a denomina “objetividade instrumental”, uma noção que se refere tanto aos resultados como ao método utilizado. Trata-se da objetividade alcançada mediante
20
Alberto Cupani
o uso de dispositivos (geralmente, para medir) que suprimem fatores “subjetivos”, eliminando supostamente a influência de sentimentos, preconceitos e ideologias na obtenção da informação. Sobre tudo, essa objetividade permite minimizar a ação do juízo humano. Baird exprime seu temor de que esse culto de uma certa objetividade ponha em perigo a adequada captação da realidade pesquisada. Utilizando-se de exemplos tomados de diversos campos (ultra-sonografia, química analítica, testes de aptidão escolar), nosso autor faz ver que a disponibilidade de dados aparentemente rigorosos não dispensa a intervenção humana no processo de conhecimento; que objetividade é uma coisa, e rigor é outra. Para começar, os instrumentos “objetivos” foram concebidos e construídos por seres humanos, a cujas idéias e intenções aqueles instrumentos estão vinculados. Além do mais, os métodos objetivos não deixam de ter às vezes resultados não objetivos, ou até erros, com os quais se deve lidar. Mais importante ainda é que este tipo de objetividade está ligada à dis-capacitação (deskilling) do operador (cuja tarefa se reduz a: apertar um botão, registrar um resultado numérico, etc.), para quem o aparelho se torna numa “caixa preta”, à padronização dos dados12 e ao cálculo da relação custo-benefício ao apreciar a eficiência do procedimento. A questão da objetividade extrapola assim o âmbito da ciência e a tecnologia para se converter em uma questão de economia e política. Há uma variedade de elementos que constituem este ideal [de objetividade]. Sustento que os dois elementos mais centrais dizem respeito a minimizar o juízo humano e à [relação] custo-eficiência. Métodos instrumentalmente objetivos devem ser simples de utilizar — exigindo um mínimo de juízo humano — e os resultados devem ser simples de interpretar — requerendo também um mínimo de juízo humano. Essa simplicidade acarreta um custo: os instrumentos desenvolvidos são usualmente caros. Mas essa despesa pode ser compensada pela capacidade dos instrumentos de realizar muitas análises em um dado período de tempo. Isto pode reduzir o custo por análise empurrando fora do mercado, ao mesmo tempo, os laboratórios que realizam um pequeno número de análises. Isso homogeneíza nosso pensamento e concentra poder. É significativo que aqueles dois elementos centrais estejam intervinculados, porque o juízo humano é sumamente caro: fazendo com que um pessoal menos treinado realize as análises, os métodos de objetividade instrumental diminuem o custo do trabalho de análise. (Baird 2004: 193)
A adoção deste tipo de atitude vai provocando uma mudança na nossa experiência, argumenta Baird, pois se apela cada vez mais para “análises objetivas”, tanto para compreender o mundo quanto para agir nele. (. . . ) É uma experiência qualitativamente diferente dar a luz com um conjunto de monitores eletrônicos. É uma experiência qualitativamente diferente ensinar e ser ensinado quando [certas] avaliações dos estudantes — ‘instrumentos de pesquisa da satisfação do cliente’ — são utilizadas para avaliar o ensino. É uma experiência qualitativamente diferente fabricar aço ‘pelos números’ — números produzidos por instrumentação analítica. A objetividade instrumental de ‘apertar o botão’ mudou o nosso mundo . . . (2004: 193)
A propósito da base tecnológica do conhecimento científico
21
Baird observa também que as universidades não se têm interessado em pesquisar os aspectos problemáticos da objetividade instrumental, e o resultado é que o desenvolvimento e aperfeiçoamento dos aparelhos que a ela servem ficou por conta dos laboratórios industriais, acentuando-se assim seu caráter comercial (2004: 200). Por tudo isso, a confiança neste tipo de objetividade esquece que “questões de validade repousam ultimamente no juízo humano”. O alerta de Baird pode ser reforçado com uma contribuição da sociologia da tecnologia. Pinch e Bijker (1987) salientam que a forma e o funcionamento de um artefato não resultam da evolução linear de um projeto inicial, mas são produtos de um complexo jogo de fatores técnicos, econômicos, culturais e políticos.13 Isso implica que, no caso de dispositivos que nos auxiliam a entender o mundo, o que se considera como sua eficiência não pode ser apreciada apenas em termos de informação mais ou menos confiável por critérios epistemológicos. Com outras palavras: trata-se de informação procurada, possibilitada, formulada, limitada, permitida, financiada, etc. por fatores sociais. Tudo isso não implica que seu valor como referência à realidade pesquisada seja nulo (como acertadamente opina Baird), porém nos impede de confiarmos demasiadamente nos dados que parecem isentos de subjetividade.14
Referências Baird, D. 2004. Thing Knowledge. A Philosophy of Scientific Instruments. Berkeley/Los Angeles: University of California Press. De Solla Price, D. 1984. Notes Towards a Philosophy of the Science/Technology Interaction. In R. Laudan (ed.) The Nature of Technological Knowledg. Are Models of Scientific Change Relevant? Dordrecht/London: D. Reidel, pp. 105-14. Galison, P. 1987. How Experiments End. Chicago: University of Chicago Press. Gooding, D. 1990. Experiment and the Making of Meaning. Dordrecht: Kluwer. Goodman, N. 1968. Languages of Art: An Approach to a Theory of Symbols. New York: BobsMerrill. Hacking, I. 1992. The Self-Vindication of the Laboratory Sciences. In A. Pickering (ed.) Science as Practice and Culture, Chicago: University of Chicago Press, pp. 29–64. Latour, B. 1987. Science in Action: How to Follow Scientists and Engineers through Society. Cambridge, Mass: Harvard University Press. Pickering, A. 1995 The Mangle of Practice: Time, Agency and Science. Chicago: University of Chicago Press. Pinch, T. J. e Bijker, W. E. 1987. The Social Construction of Facts and Artifacts: or How the Sociology of Science and the Sociology of Technology Might Benefit Each Other. In Bijker, W. E.; Hughes, T.; Pinch, T.: The Social Construction of Technological Systems. Cambridge: The MIT Press. Popper, K. 1972. Objective Knowledge: An Evolutionary Approach. Oxford: Oxford University Press.
22
Alberto Cupani
Notas 1 Baird é professor de filosofia na Unversidade de South Carolina, EUA, tendo publicado um livro sobre
lógica indutiva e um outro sobre filosofia da química, além da obra aqui comentada. 2 Esse “preconceito textual” (text bias) existiria, segundo Baird, desde Platão e poderia ser detectado até em autores que aparentemente o criticam, como Latour e Woolgar (Laboratory Life) e D. Gooding (Experiment and the Making of Meaning). 3 Assim denominados por causa do conde de Orrery, para quem foi construído um dos primeiros destes aparelhos (Baird 2004: 21). 4 Trata-se de um tubo de vidro formando ângulos retos em cada um dos extremos, que terminam em esferas também de vidro. O tubo contém água ou álcool até a metade ou dois terços de sua capacidade, sendo praticado o vácuo no resto. Apertando uma das esferas com a mão, o líquido é levado a ebulição. 5 Note-se que, no que tange a habilidades, as que o aparelho incorpora são, de algum modo subtraídas ao usuário humano. Se por um lado isso facilita a utilização de tais aparelhos (a pessoa não precisa possuir as habilidades que o aparelho encarna), por outro pode conduzir a menosprezar as habilidades pessoais. Baird faz por isso uma crítica ao que denomina predomínio da “objetividade instrumental” na ciência e a tecnologia (cap. 9). 6 Latour, B. 1987, p. 304, citado por Baird. 7 Baird analisa em particular a transformação da química analítica em meados do século XX, passando de decompor substâncias a fazer a identificação física dos seus componentes, mediante o uso do espectro-fotômetro (v. Baird 2004, cap. 5). De resto, e como conseqüência do crescente condicionamento tecnológico, a ciência e a tecnologia do século XX tornaram-se assim, cada vez mais, “disciplinas dedicadas à caracterização e ao controle” (p. 116). 8 Para Baird, são sinais dessa objetividade poder ser destacado do seu contexto de descoberta, ser eficaz (confiável) e duradouro, e estabelecer uma conexão com o mundo em que a “voz” deste último tem sempre a prioridade (p. 120). 9 Baird esclarece que utiliza uma noção matemática (e não biológica) de função: “O que queremos é um dispositivo — um artefato — que associe de maneira confiável insumos e produtos [inputs and outputs] (p. 125). 10 Para sublinhar a importância do conhecimento material(izado), Baird corrige o experimento mental de Popper e imagina que, se ocorresse uma catástrofe em que bibliotecas forem preservadas, mas não as máquinas, instrumentos e a nossa capacidade de usa-los e aprender deles, o retorno da civilização seria mais difícil do que Popper sugere (Baird 2004: 138–41). 11 Baird alude especificamente ás idéias de Pickering (1995). 12 Vinculada ao uso da estatística (p. 194). 13 Os autores ilustram isso com a história da evolução da bicicleta. 14 A presente comunicação é resultado parcial da pesquisa “Ciência e controle da Natureza: A dimensão cognitiva da tecnologia”, financiada pelo CNPq.
¿S ON N ECESARIOS LOS M ODELOS PARA I DENTIFICAR A LAS T EORÍAS ? U NA C RÍTICA DE LA C ONCEPCIÓN S EMÁNTICA A LEJANDRO C ASSINI CONICET/Universidad de Buenos Aires
alepafrac@yahoo.com.ar
1. Introducción En su breve y lúcida historia de la filosofía de la ciencia en el siglo XX, C. Ulises Moulines caracteriza a la etapa más reciente de esta disciplina, aquella que, según él, comienza en la década de 1970, como una “fase modelista”. Esto constituye, sin dudas, una exageración, ya que existen numerosos desarrollos de la filosofía de la ciencia reciente, por ejemplo, vinculados con temas como el descubrimiento, la confirmación y la explicación de teorías, que no hacen uso de la noción de modelo. Los modelos científicos, según creo, han sido sobrevalorados por algunos filósofos de la ciencia recientes. Con todo, la afirmación de Moulines es un buen ejemplo de cómo el concepto de modelo a llegado a extenderse y a volverse dominante en muchas áreas de la filosofía de la ciencia durante al menos las últimas tres décadas. Entre aquellos desarrollos más significativos que apelan a la noción de modelo, la llamada concepción semántica de las teorías ocupa un lugar preeminente. Aunque aún se encuentra lejos de haber obtenido la aprobación unánime de los filósofos contemporáneos de la ciencia, ha alcanzado ya el estado de un nuevo consenso, por cuanto ha reemplazado casi totalmente a la concepción clásica, elaborada por el empirismo lógico en la primera mitad del siglo XX. En tal sentido, puede decirse que actualmente la concepción semántica constituye el análisis standard de la estructura de las teorías científicas. En este trabajo quiero arriesgarme a criticar esta concepción de las teorías y, por tanto, a oponerme a la difundida idea de que es un hecho establecido que ésta tiene ventajas evidentes sobre otras concepciones rivales. Para comenzar, quisiera expresar claramente cuáles tesis intentaré defender aquí y cuáles no. Ante todo, no defenderé la concepción clásica de las teorías tal como fue desarrollada por los empiristas lógicos. Esta venerable elucidación de la estructura de las teorías se ha mostrado insostenible desde hace ya mucho tiempo y en la actualidad no constituye siquiera un candidato viable como alternativa al enfoque semántico. Presentaré, en cambio, un enfoque de la estructura de las teorías, al que llamaré concepción proposicional, el cual no es otra cosa que una versión de la concepción clásica despojada de todos sus aspectos cuestionables. No sostendré que el enfoque proposicional es la mejor elucidación de la estructura de las teorías científicas, ni tampoco argumentaré que resulta superior a la concepción semántica en todos los respectos posibles. Hay tres tesis positivas que, sin embargo, quiero defender en este trabajo. En primer lugar, sostendré que la concepción proposicional de Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 23–37.
24
Alejandro Cassini
las teorías está libre de todos los defectos y dificultades de la concepción clásica, que, con toda justicia, han criticado los partidarios de la concepción semántica. En segundo lugar, trataré de probar que la concepción semántica no tiene ventajas evidentes sobre la concepción proposicional tal como la he de presentar aquí. Finalmente, intentaré mostrar que la concepción proposicional tiene al menos alguna ventaja sobre la concepción semántica en tanto reconstrucción racional de las teorías científicas tal como de hecho las formulan los científicos.
2. La concepción clásica La concepción clásica de las teorías científicas es fundamentalmente una reconstrucción racional de la estructura de las teorías empíricas. La desarrollaron de manera lenta y gradual los filósofos vinculados al empirismo lógico desde la década de 1920. Su formulación definitiva se completó a fines de la década de 1950, gracias a las obras de Hempel y, sobre todo, de Carnap.1 Las obras de los filósofos de la ciencia de la generación inmediatamente posterior al empirismo lógico solían denominarla “concepción heredada” o “concepción standard de las teorías”2 , pero, dado el paso del tiempo y los desarrollos que siguieron, estas expresiones han quedado anticuadas o se han vuelto equívocas, por lo que es mejor evitarlas. Aquí no me ocuparé de la historia de la concepción clásica, sino de los rasgos fundamentales de su estructura. De acuerdo con la concepción clásica, una teoría, en sentido amplio, es un conjunto de oraciones cerrado respecto de la relación de consecuencia lógica. Esta caracterización, sin embargo, es demasiado general y no permite distinguir entre teorías formales y teorías empíricas, una distinción tan importante para el empirismo lógico. Una teoría empírica es la clausura lógica de la unión de dos conjuntos disjuntos de oraciones: un conjunto de axiomas A, y un conjunto de reglas de correspondencia C (en símbolos, T = C n(A ∪C ), donde C n es el operador de consecuencia lógica). La concepción clásica es tan bien conocida que no necesito exponerla con detalle.3 Según ella, los axiomas de una teoría empírica son oraciones puramente teóricas, es decir, formadas por términos descriptivos o no lógicos de carácter teórico (o no observacional, que viene a ser lo mismo). La clausura deductiva de este conjunto de axiomas constituye una teoría o sistema formal puramente sintáctico o no interpretado, ya que los términos teóricos no tienen significado por sí mismos. Por su parte, las reglas de correspondencia son oraciones mixtas, esto es, oraciones cuyo vocabulario no lógico contiene, de una manera no trivial, al menos un término teórico y al menos un término observacional. Estas reglas son esencialmente reglas semánticas que tienen como función principal la de conferir significado a los postulados teóricos de una teoría. Originalmente, las reglas de correspondencia se concibieron como definiciones explícitas de los términos teóricos, pero pronto Carnap advirtió que esta idea era insostenible.4 Concibió, entonces, la noción de interpretación parcial, de acuerdo con la cual las reglas de correspondencia son meras definiciones parciales del significado de los términos teóricos y, en consecuencia, proveen sólo una interpretación
¿Son Necesarios los Modelos para Identificar a las Teorías?
25
parcial de dicho significado, que permanece siempre abierto. Podemos, entonces, resumir la concepción clásica diciendo que una teoría empírica es un sistema axiomático formal parcialmente interpretado por medio de un conjunto finito de reglas de correspondencia. Esta concepción de las teorías fue objeto de numerosas críticas durante las décadas de 1960 y 1970, y, como resultado de ello, hace ya tiempo que ha sido abandonada por la mayoría de los filósofos de la ciencia. Ya no es más la concepción standard de las teorías. No es mi propósito revisar aquí todas las críticas dirigidas a la concepción clásica desde diferentes puntos de vista.5 Sólo consideraré algunas de las principales críticas que los filósofos de la tradición semanticista le han dirigido. En lo esencial, pueden reducirse a las siguientes cuatro. Primero, los semanticistas han afirmado que la concepción clásica es un enfoque puramente sintáctico de las teorías, y, como tal, es incapaz de capturar la verdadera naturaleza semántica de las teorías empíricas de la ciencia. Desde mi punto de vista, esta afirmación es lisa y llanamente errónea. Según la concepción clásica, toda teoría empírica debe estar formada por un sistema sintáctico de axiomas junto con un conjunto de reglas interpretativas de correspondencia. La clausura deductiva de un conjunto de axiomas no interpretados no es una teoría empírica, sino un sistema axiomático puramente formal, es decir, una teoría lógica carente de todo contenido empírico. Así pues, la concepción clásica es, desde el comienzo una concepción semántica de las teorías empíricas. Segundo, los semanticistas han sostenido que, para la concepción clásica, una teoría es una entidad lingüística y que, por esa razón, está indisolublemente ligada a un lenguaje determinado en el cual se la formula. De este hecho se sigue que un simple cambio en el lenguaje en el que está formulada una teoría implica un cambio de teoría, cosa que resulta obviamente absurda. Por otra parte, según los semanticistas, es evidente que una misma teoría puede formularse en diferentes lenguajes sin perder su identidad. Esta crítica, como veremos, es correcta en tanto las teorías se conciban como conjuntos de oraciones, que siempre son oraciones de un determinado lenguaje. Tercero, los semanticistas han argumentado que, como consecuencia de su carácter lingüístico, la concepción clásica no puede distinguir entre una teoría y sus diferentes formulaciones, todas ellas lógicamente equivalentes. Para muchos semanticistas, este es el defecto principal de la concepción clásica.6 Esta crítica es correcta, al menos en parte. Ante todo, para la concepción clásica una teoría, tal como la he definido antes, no es una entidad lingüística, sino una entidad abstracta. Es un conjunto de oraciones y no un simple agregado o colección de oraciones. No obstante, es cierto que la identidad de cada oración depende del lenguaje en el que se encuentra formulada. En consecuencia, un cambio del lenguaje de una teoría producirá como resultado un nuevo conjunto de oraciones y, por tanto, otra teoría diferente. Cuarto y último, los semanticistas han señalado que, según la concepción clásica, las teorías son entidades rígidas que no pueden experimentar ningún cambio sin per-
26
Alejandro Cassini
der su identidad. En contraste con ello, afirman que la historia de la ciencia muestra que las teorías científicas son frecuentemente modificadas; experimentan toda clase de revisiones y cambios y, sin embargo, son capaces de mantener su identidad. La primera de estas afirmaciones es indudablemente verdadera. Si las teorías son conjuntos de oraciones, entonces, son inmodificables. En efecto, un conjunto de oraciones, como cualquier otro conjunto, está determinado por sus elementos, por lo que su identidad se pierde cuando se cambia algún elemento. Así, si agregáramos o quitáramos una sola oración a una teoría dada, estaríamos cambiando la teoría misma. Por consiguiente, el dictum según el cual todo cambio en una teoría es un cambio de teoría resulta verdadero respecto de la concepción clásica de las teorías. En cuanto a la segunda afirmación, que las teorías cambian manteniendo su identidad, argumentaré en la próxima sección que hay buenas razones para pensar que es falsa y que, por tanto, la rigidez de las teorías no es un defecto que deba remediarse. Como dije al comienzo de esta sección, creo que la concepción clásica no es más un candidato serio para proporcionar un análisis plausible de la estructura de las teorías empíricas. Con todo, las críticas que me parecen fatales para esta concepción no son las que le han hecho los semanticistas. El problema principal del enfoque clásico es que, después de muchos intentos, nadie fue capaz de esclarecer las nociones de definición parcial e interpretación parcial. La oscuridad de estas nociones arruina el concepto mismo de regla de correspondencia, y, privada de las reglas de correspondencia, la concepción clásica colapsa, ya que se vuelve incapaz de distinguir entre teorías formales y teorías empíricas, y, en última instancia, entre ciencias formales y fácticas. Retrospectivamente podríamos decir que la raíz del problema se encontraba en una teoría del significado insostenible, teoría en realidad nunca formulada de manera explícita, pero presupuesta en la distinción entre términos teóricos y observacionales. Con el derrumbe de esta dicotomía lingüística, ya a comienzos de la década de 1960, la concepción clásica se volvió insostenible.7
3. La concepción semántica La llamada concepción semántica de las teorías empíricas la desarrollaron desde fines de la década de 1950 Patrick Suppes y muchos otros filósofos de la ciencia, como Joseph Sneed y Bas Van Fraassen. Hacia mediados de la década de 1970 ya se había establecido como la principal alternativa a la decadente concepción clásica. Existen numerosas variedades del enfoque semántico de las teorías, pero no intentaré examinarlos aquí.8 Me limitaré a caracterizar ciertos rasgos generales que son comunes a todas las variedades semanticistas, y luego señalaré dónde se encuentran los principales desacuerdos entre ellos. Todos los filósofos semanticistas están de acuerdo en que las teorías no son entidades lingüísticas y también en que los recursos de un determinado lenguaje no son los instrumentos apropiados para individuar a las teorías. Según ellos, las teorías empíricas se caracterizan mejor en términos de modelos porque aquello que determina
¿Son Necesarios los Modelos para Identificar a las Teorías?
27
la identidad de una teoría es una clase de modelos y no una clase de oraciones. Consecuentemente, proponen definir a las teorías como familias de modelos. Frederick Suppe lamenta que la riqueza de la concepción semántica a menudo se reduzca a una única expresión como “las teorías son colecciones de modelos” (Suppe 2000, p. 111). Señala que se trata de un enfoque mucho más complejo y sofisticado que lo que sugiere esa expresión. Esto es indudablemente cierto de cualquiera de las versiones de la concepción semántica en particular, entre ellas la del propio Suppe. Sin embargo, no resulta fácil hallar un conjunto sustantivo de características comunes a todas las diferentes concepciones semánticas. Pienso que el siguiente enunciado captura el núcleo fundamental de toda concepción semántica de las teorías científicas: La concepción semántica: una teoría empírica es una colección de modelos M que satisfacen ciertas condiciones C y están relacionados entre sí por una relación R. Procedamos ahora a esclarecer cada uno de los componentes de esta definición. En primer lugar, una teoría no es un conjunto de modelos, sino una colección de modelos, donde el término colección debe tomarse en un sentido intuitivo, no conjuntista. En segundo lugar, no todo modelo, en cualquier sentido que se emplee el término, es un modelo científico o un posible modelo de una teoría. Sólo son modelos de una teoría aquellos que satisfacen ciertas condiciones, que cada variedad de la concepción semántica debe establecer como necesarias. En tercer lugar, no toda colección de modelos que cumple con dichas condiciones es un modelo de una y la misma teoría. Los modelos de cada teoría deben estar relacionados por alguna relación bien definida. En el fondo, las distintas variedades de la concepción semántica resultan de las diferentes maneras de concebir M , C y R. Esto equivale a decir que los semanticistas están en desacuerdo acerca de qué es un modelo, acerca de qué es lo que convierte a un modelo en un modelo de una teoría y acerca de qué tipo de relación conecta entre sí a los diferentes modelos de una teoría determinada. El segundo rasgo común a todas las concepciones semánticas es que los modelos se conciben como representaciones de los fenómenos (donde “fenómeno” debe entenderse en un sentido muy amplio como cualquier porción selecta de la realidad o de la experiencia). Aunque no necesariamente toda parte o elemento de un modelo científico representa algún fenómeno, los semanticistas siempre sostuvieron que todos los modelos de una teoría dada son modelos representacionales porque tienen al menos algún componente con carácter representativo. Podemos formular esa tesis de la siguiente manera: La tesis representacionista: Todo modelo M de una teoría dada contiene al menos un submodelo M s (donde M s ⊆ M ) que representa algún conjunto selecto de fenómenos. Creo que todos los semanticistas estarían de acuerdo sobre esta tesis general tal como la he formulado. No hace falta decir que no existe acuerdo alguno entre ellos
28
Alejandro Cassini
acerca de cómo los modelos representan y, sobre todo, acerca de qué es una representación en general. Las dos maneras fundamentales de representación que propusieron los semanticistas son el isomorfismo entre estructuras (o bien el homomorfismo u otros morfismos) y la semejanza entre modelos y sistemas reales. De acuerdo con la primera concepción, sostenida por Suppes, Sneed y los estructuralistas, y Van Fraassen, entre otros, los modelos de una teoría tienen alguna relación de morfismo con los modelos de datos (que también pueden concebirse como estructuras conjuntistas) y de esta manera representan los fenómenos. Según este enfoque, la representación es esencialmente un morfismo entre modelos o estructuras conjuntistas. De acuerdo con la segunda concepción, sostenida principalmente por Giere, los modelos tienen una relación de semejanza con los sistemas reales que representan, de modo que la relación entre modelos y realidad puede establecerse de un modo directo (aunque también, por cierto, a través de modelos de datos). Para este enfoque, la representación es una relación de semejanza entre modelos abstractos y sistemas reales concretos. Ambas maneras de concebir la representación científica han sido sometidas a severas críticas9 . Me parece evidente que hasta el momento no tenemos una teoría satisfactoria de la representación científica, ni de los modelos científicos en general. Creo que la tesis representacionista es lógicamente independiente de la concepción semántica de las teorías, tal como la he definido antes. Es un hecho puramente accidental que todos los semanticistas que he mencionado sean también representacionistas. Por supuesto, es posible establecer por definición que todos los modelos de cualquier teoría empírica son representaciones de los fenómenos, esto es, que llamaremos “modelos” sólo a los modelos representacionales. No me parece que esta sea una estrategia muy atractiva, pero, en cualquier caso, no puede aceptarse sin alguna justificación. En principio, está lejos de ser evidente que todos los modelos que emplean los científicos sean modelos representacionales. Por otra parte, si la intención de representar los fenómenos por parte del usuario se admite como una condición necesaria, aunque no suficiente, de toda representación, creo que, como nos lo muestra la historia de la ciencia reciente, muchos modelos científicos se construyen sin ninguna intención de representar. Se los emplea de una manera puramente instrumental para dar cuenta de los fenómenos y efectuar predicciones en determinados dominios bien acotados. Po último, todavía no poseemos ningún criterio general para distinguir las representaciones adecuadas de las inadecuadas, ni a éstas de los modelos que no representan. Intuitivamente, parece plausible pensar que el modelo de la doble hélice del ADN es una representación adecuada de la estructura de esta molécula, mientras que el modelo de la triple hélice no lo es. Pero en otros casos la situación no es clara. Si, por ejemplo, intentáramos emplear un reloj como modelo de la estructura de la molécula de ADN ¿estaríamos usando una representación inadecuada, o un modelo que no representa, o ningún modelo en absoluto? La respuesta, por supuesto, depende de qué se entienda por “representación”. Pero es obvio que si la mera intención de representar algo fuera suficiente para producir un modelo re-
¿Son Necesarios los Modelos para Identificar a las Teorías?
29
presentativo, entonces, cualquier objeto podría representar a cualquier otro, lo cual volvería trivial a la noción misma de representación. No intentaré abordar aquí el problema de si la búsqueda de una teoría general de la representación científica es una empresa viable. Sólo quiero hacer una observación de carácter escéptico acerca de tal empresa. El concepto de representación tiene una larga historia en la tradición filosófica que comienza en la Edad Media. En la filosofía actual ha sido extensamente discutido en los dominios de la filosofía de la mente y de la filosofía del lenguaje, entre otras disciplinas, y, me atrevo a decir, con magros resultados en todos los casos. Todavía no tenemos un análisis satisfactorio de las nociones de representación mental y representación lingüística, y mucho menos, del concepto de representación en general. Creo que sin disponer de una teoría general de la representación no podemos esperar mucho de una teoría de la representación científica. Hasta el momento, los filósofos de la ciencia se han limitado a usar el concepto de representación como un primitivo no analizado, o a proponer elucidaciones vagas, cuando no directamente circulares.10 La concepción semántica de las teorías se ha definido siempre en oposición a la concepción clásica. Como ya he señalado, muchas de las críticas que los semanticistas dirigieron a la concepción clásica no me parecen acertadas. Ante todo, la concepción clásica no es puramente sintáctica, como todavía se afirma con frecuencia. Recientemente, Suppe ha reconocido este hecho.11 En realidad, debería decirse que es una concepción esencialmente semántica de las teorías empíricas porque, como ya dijimos, un sistema axiomático puramente sintáctico es una teoría formal, pero no una teoría empírica. Por cierto, todo sistema semántico, esto es, interpretado, tiene una sintaxis definida, pero no se sigue de allí que sea algo así como un sistema “parcialmente sintáctico”. Lo que es característico de la concepción clásica es el hecho de especificar separadamente la sintaxis y la semántica de una teoría por medio de dos conjuntos disjuntos de oraciones, pero ello no implica que estas dos dimensiones sean independientes o autónomas. Como consecuencia de todo esto, la oposición entre una supuesta concepción sintáctica de las teorías y una concepción semántica no captura ninguna diferencia esencial respecto de la concepción clásica. Es conveniente abandonar completamente este modo de hablar, como lo ha sugerido Giere, y llamar a la concepción semántica “enfoque modelo-teórico de las teorías empíricas”.12 Igualmente, es incorrecto llamar “enunciativa” y “axiomática” a la concepción clásica de las teorías y proclamar que la concepción modelística o semántica es “no enunciativa” y “no axiomática”.13 Es un hecho trivialmente verdadero que todo modelo de una teoría se presenta en un determinado lenguaje y, casi siempre, mediante una lista de axiomas o esquemas de axiomas. Cuando presentan una teoría, reconstruida según los cánones de cada versión semántica, los semanticistas no hacen otra cosa que ofrecer una lista de axiomas formulados en un lenguaje determinado.14 Y, en verdad, no hay otra manera de hacerlo. Simplemente, la teoría presentada no debe identificarse con ese particular conjunto de axiomas en ese particular lenguaje. En ese punto, los semanticistas están en lo correcto. Sin embargo, no se sigue de allí que la teoría deba identificarse con la clase de los modelos que satisfa-
30
Alejandro Cassini
cen esos axiomas, como se verá enseguida. Por otra parte, las teorías, según muchas concepciones semánticas, tienen un componente lingüístico o enunciativo. Éste está formado por las oraciones que afirman que un modelo de determinada teoría se aplica a un cierto dominio de fenómenos, o bien que un determinado modelo es semejante a un cierto sistema real. Giere las denomina “hipótesis teóricas”, mientras que los estructuralistas las llaman “afirmaciones empíricas”.15 Si atendemos, entonces, a las formulaciones de una teoría, la concepción semántica es tan enunciativa y axiomática como la concepción clásica. Con todo, no se trata de concepciones equivalentes. La diferencia fundamental entre ellas se encuentra en la manera de identificar o individuar a las teorías. El núcleo válido de la crítica semanticista a la concepción clásica radica en la afirmación de que ésta última no es capaz de distinguir entre una teoría, que es una entidad abstracta, y sus diferentes formulaciones, que son entidades lingüísticas. Este hecho tiene la desafortunada consecuencia de identificar a una determinada teoría con alguna de sus formulaciones, por ejemplo, con una cierta base axiomática, históricamente contingente. Esto es ciertamente el resultado de una manera equivocada de identificar a las teorías. Dado que es un hecho indiscutible que una misma teoría admite axiomatizaciones diferentes, que pueden expresarse en distintos lenguajes, formalizados o no, cualquier enfoque viable de las teorías científicas debe proporcionar los medios para distinguir una teoría de sus distintas formulaciones lingüísticas. En la próxima sección presentaré una concepción de las teorías, alternativa a la concepción semántica, que permite hacer esta distinción y, a la vez, está libre de los problemas y oscuridades que aquejan a la concepción clásica.
4. La concepción proposicional La concepción de las teorías que quiero defender aquí es la que llamaré proposicional. No es más que la noción usual de teoría que se emplea en lógica, pero formulada en términos de proposiciones en vez de oraciones o enunciados. De acuerdo con esta concepción, una teoría es simplemente un conjunto de proposiciones cerrado respecto de la relación de consecuencia lógica. Las proposiciones no son entidades lingüísticas, sino entidades abstractas portadoras de significado y de valor de verdad. Por supuesto, las proposiciones se expresan lingüísticamente mediante oraciones de un determinado lenguaje. Decimos que dos oraciones diferentes expresan la misma proposición si y sólo si son lógicamente equivalentes. La relación de consecuencia lógica es una relación semántica entre proposiciones, que establece que si una proposición ϕ es consecuencia lógica de un conjunto Γ de proposiciones, entonces, no es posible que todas las proposiciones de Γ sean verdaderas, y ϕ sea falsa.16 La relación de consecuencia lógica establece un orden parcial entre las proposiciones de una teoría. Una teoría puede estar axiomatizada o no, pero, por razones de simplicidad, consideraré sólo el caso de las teorías finitamente axiomatizables. Así, diré que una teoría
¿Son Necesarios los Modelos para Identificar a las Teorías?
31
es el conjunto de todas las consecuencias lógicas de un conjunto finito de proposiciones, convencionalmente llamados axiomas, el cual es un subconjunto propio del conjunto de las proposiciones de la teoría. Una misma teoría admite diferentes axiomatizaciones mediante diferentes bases axiomáticas. Decimos que A 1 y A 2 son dos bases axiomáticas para la teoría T si y sólo si sus clausuras lógicas son idénticas a T (en símbolos: C n(A 1 ) = T = C n(A 2 )). Distinguiré ahora una teoría de sus formulaciones. Una formulación de una teoría es un conjunto de oraciones que expresa esa teoría. Decimos, entonces, que T1 y T2 son dos formulaciones de una teoría T si y sólo si expresan las mismas proposiciones, esto es, si son lógicamente equivalentes. Si quisiéramos evitar el compromiso ontológico con entidades abstractas como las proposiciones, podríamos definir a una teoría como la clase de equivalencia de todas sus formulaciones, tal como lo hiciera Quine.17 En cualquier caso, las clases de equivalencia también son entidades abstractas, de modo que no se advierte ganancia alguna en esta estrategia: debemos aceptar conjuntos o proposiciones (las cuales, a su vez, pueden definirse en términos de conjuntos, esto es, como conjuntos de mundos posibles). Soy perfectamente consciente de que, en la práctica, determinar que dos conjuntos diferentes de oraciones, por ejemplo dos bases axiomáticas, son dos formulaciones de una misma teoría no es una tarea sencilla. Si las formulaciones están expresadas en lenguajes distintos, uno puede verse envuelto en problemas muy complejos de traducción y en cuestiones sutiles de identificación de significados. Con todo, la distinción entre teoría y formulaciones que he presentado es una distinción de principio que se basa en definiciones claras y precisas, independientemente de lo difícil que de hecho pueda resultar la identificación de las diferentes formulaciones de una teoría dada. Una teoría, de acuerdo con el enfoque proposicional, no necesita estar formalizada ni presentada en algún tipo específico de lenguaje. En principio, una misma teoría se puede formular en distintos lenguajes y mediante diversos recursos lógicos y matemáticos. La elección de un lenguaje determinado es una cuestión fundamentalmente pragmática, basada en consideraciones de simplicidad o utilidad para un fin específico. Sea cual fuere el lenguaje que se elija para formular una teoría, no es necesario hacer ninguna distinción, en el vocabulario de dicha teoría, entre términos teóricos y observacionales. Tampoco se requiere ninguna distinción entre postulados teóricos y reglas de correspondencia, como en la concepción clásica. Una teoría no es una entidad lingüística ni un sistema puramente sintáctico, sino un conjunto de proposiciones significativas formuladas en un lenguaje interpretado. Las teorías no requieren estar axiomatizadas. Si son axiomatizables, su axiomatización efectiva es la manera más simple y conveniente de presentarlas. La concepción proposicional no identifica a una teoría con alguna de sus posibles axiomatizaciones en un lenguaje determinado. Ninguna base axiomática es privilegiada desde el punto de vista lógico: una misma teoría se puede presentar mediante bases axiomáticas muy diferentes, cuya elección también depende de factores pragmáticos. Una teoría se identifica
32
Alejandro Cassini
siempre como el conjunto de todas las consecuencias lógicas de un conjunto dado de axiomas, pero cualquier otro conjunto de axiomas que tenga las mismas consecuencias identifica a la misma teoría. Hay dos objeciones importantes que se han presentado contra la idea de concebir a las teorías como la clausura lógica de un conjunto de axiomas.18 La primera afirma que apelar a las consecuencias lógicas de un conjunto de axiomas no es suficiente para identificar una teoría, puesto que un conjunto de axiomas A 1 junto con sus consecuencias lógicas es un conjunto diferente de otro conjunto de axiomas A 2 junto con sus consecuencias lógicas, aunque éstas sean idénticas a las primeras. Esto es, los conjuntos 〈A 1 ,C n(A 1 )〉 y 〈A 2 ,C n(A 2 )〉 son conjuntos diferentes, aun cuando C n(A 1 ) = C n(A 2 ). Mi respuesta a este argumento es que se basa en una representación simbólica inadecuada de las teorías axiomatizadas. Una teoría T axiomatizada mediante la base axiomática A debe representarse exclusivamente como el conjunto de las consecuencias de A (es decir, T = C n(A)) y no como el par ordenado 〈A,C n(A)〉. La segunda objeción es que la definición habitual de consecuencia lógica emplea el concepto mismo de modelo. Según esta definición, una oración ϕ, formulada en un lenguaje L, es consecuencia lógica de un conjunto Γ de oraciones de L si y sólo si ϕ es verdadera en todo modelo de Γ. Por consiguiente, hablar del conjunto de todas las consecuencias lógicas de un conjunto de axiomas A no es más que una manera disfrazada o indirecta de hablar de la clase de todos los modelos de A. Mi respuesta a esta objeción tiene dos partes. En primer lugar, si la noción de consecuencia lógica sólo pudiera definirse empleando el concepto de modelo, esto no nos forzaría a identificar a las teorías con una colección de modelos. En segundo lugar, si bien la caracterización de la relación de consecuencia lógica en términos de modelos es simple y elegante, no es en modo alguno la única posible. Hay muchas otras definiciones de esta relación, como la que presenté al comienzo de esta sección, que no hacen uso de la noción de modelo.19 Por tanto, el argumento no puede aplicarse a otras caracterizaciones de consecuencia lógica. Mi balance provisional hasta aquí es que la concepción proposicional de las teorías no se ve afectada por tres de las cuatro críticas semanticistas a la concepción clásica que señalé antes: no es un enfoque sintáctico, no concibe a las teorías como entidades lingüísticas, ni es incapaz de distinguir entre una teoría y sus diferentes formulaciones. Nos queda por tratar sólo el problema de la rigidez de las teorías. Un conjunto de proposiciones, como cualquier otro conjunto, está determinado por sus elementos y no puede ser modificado, en el sentido de que no se le pueden agregar o quitar elementos sin afectar su identidad. En consecuencia, según la concepción proposicional, las teorías son entidades rígidas y bien definidas, y no pueden modificarse sin perder su identidad. Sin duda, es posible modificar la formulación de una teoría sin cambiar a la teoría misma, por ejemplo, cambiando el lenguaje en el que se la expresa, o reemplazando su base axiomática por otra lógicamente equivalente. Estos son casos de simple reformulación de la teoría. No obstante, todo cambio que implique agregar o quitar proposiciones de una teoría, o ambas cosas, resulta un
¿Son Necesarios los Modelos para Identificar a las Teorías?
33
cambio de teoría. ¿Es este rasgo un defecto de la concepción proposicional? Según mi opinión, no lo es necesariamente. Algunos partidarios de la concepción semántica, como Giere, han sostenido que las teorías científicas no son entidades bien definidas y que este hecho hace que las teorías sean flexibles, es decir, permite agregar o quitar modelos de una teoría determinada sin afectar su identidad (Giere 1988, p. 86). Sin embargo, parece evidente que una teoría no puede mantener su identidad si se cambian todos sus modelos, o incluso la gran mayoría de ellos. Para poder dar cuenta de la flexibilidad de las teorías es necesario introducir alguna distinción entre modelos centrales y modelos periféricos de la teoría. Así, una teoría se mantiene idéntica en la medida en que sólo se le agreguen o quiten modelos periféricos. Si se cambia algún modelo central, se produce un cambio de teoría. De esta manera, la teoría se vuelve rígida respecto de los modelos centrales y sólo es flexible respecto de sus modelos periféricos. En la concepción estructuralista, por su parte, se distingue entre el núcleo teórico, que contiene las leyes fundamentales de la teoría, y las aplicaciones pretendidas de la teoría. La identidad de una teoría, en este caso, se mantiene si se cambian las aplicaciones, pero no el núcleo.20 Si no distingue ninguna parte nuclear e inmodificable de la teoría, entonces, no es posible diferenciar entre un cambio en una teoría determinada y un cambio de teoría. Si el núcleo de la teoría no fuera rígido, el problema vuelve a reproducirse. Se advierte, entonces, que un algún tipo de rigidez de la teoría, aunque sólo sea de un núcleo específico de modelos, es indispensable incluso dentro de la concepción semántica. En la concepción proposicional de las teorías no es posible hacer una distinción entre núcleo y periferia dentro de una teoría, pues, todos los axiomas de cada formulación, si son independientes, resultan esenciales para determinar a la teoría misma. Por tanto, la totalidad de la teoría es rígida y no puede modificarse sin producir un cambio de teoría. Así, a diferencia de lo que ocurre en la concepción semántica, en la concepción proposicional no pueden distinguirse los cambios en una teoría (salvo que sean reformulaciones) de los cambios de teoría. No obstante, esta rigidez, en mi opinión, resulta bastante razonable cuando se presta atención a las implicaciones del cambio de teoría en la concepción proposicional. Una teoría es siempre un conjunto infinito de proposiciones al que no se le pueden agregar ni quitar proposiciones aisladas, ni tampoco conjuntos finitos de proposiciones. Esta es una consecuencia inevitable de la clausura deductiva de las teorías. Así pues, cada vez que agregamos o quitamos una proposición de una teoría dada, estamos agregando o quitando a la vez todas sus consecuencias lógicas, junto con todas las consecuencias lógicas que dicha proposición tiene en conjunción con las restantes proposiciones de la teoría. Este hecho es particularmente evidente cuando se trata de una teoría axiomatizada, donde sólo es posible modificarla agregando, quitando o reemplazando al menos un axioma. En suma, sólo se puede cambiar una teoría agregando o quitando (o ambas cosas) conjuntos infinitos de proposiciones. Por consiguiente, dos teorías diferentes siempre deben tener un número infinito de proposiciones que no son comunes a las
34
Alejandro Cassini
dos (esto es, si T 6= T ∗ , entonces, T ∼ T ∗ , o T ∗ ∼ T , o ambos, son conjuntos infinitos). Me parece que este hecho hace más razonable pensar que todo cambio en una teoría es a la vez un cambio de teoría.
5. Conclusiones La concepción proposicional de las teorías, que aquí presenté de manera sumamente esquemática, está libre de las principales dificultades que los semanticistasatribuyen a la concepción clásica. No es una concepción sintáctica de las teorías; no las concibe como entidades lingüísticas, sino como entidades abstractas; distingue entre una teoría y sus diferentes formulaciones, sin identificar a una teoría con una determinada formulación axiomática en un lenguaje determinado. Según la concepción proposicional, las teorías son entidades bien definidas y perfectamente rígidas, como lo es cualquier conjunto: admiten diferentes formulaciones, pero no pueden preservar su identidad cuando se les quitan o agregan proposiciones. La concepción semántica resuelve efectivamente algunas de los problemas de la concepción clásica, pero no me parece que tenga ventajas evidentes sobre la concepción proposicional que he presentado. Una comparación detallada entre la concepción semántica y la concepción proposicional de las teorías es una tarea extensa, que todavía está por hacerse. Se podría preguntar, sin embargo, si la concepción proposicional tiene alguna ventaja evidente sobre la concepción semántica, como ha hecho Van Fraassen.21 Encuentro al menos la siguiente. En la concepción proposicional es perfectamente posible que una teoría sea lógicamente inconsistente, o bien que sea consistente, pero no tenga modelos. Según la concepción semántica, ninguna de las dos cosas podría ocurrir. Si el concepto de modelo se entiende en el significado habitual que tiene en la teoría de modelos (como una estructura en la que son verdaderas todas las proposiciones de una teoría), es evidente que las teorías inconsistentes no tienen modelos. Así, para todas las concepciones semánticas que emplean este concepto de modelo, como la de Suppes, los estructuralistas o la de Van Fraassen, la consistencia resulta una condición necesaria para toda teoría. Dado que las teorías son colecciones de modelos, no puede existir algo así como una teoría inconsistente. Esto ciertamente no resulta compatible con el uso y la práctica de los científicos, sobre todo en matemáticas, pero también en física teórica, donde el problema de la consistencia de las teorías se considera particularmente importante y donde es habitual hablar de teorías inconsistentes. Los semanticistas podrían replicar que una teoría no es solamente una colección de modelos, sino que también contiene afirmaciones empíricas o hipótesis teóricas, las cuales, puesto que son oraciones, pueden ser inconsistentes. Sin embargo, el argumento todavía se aplica si poseer una colección de modelos es una condición necesaria de toda teoría. Y efectivamente lo es, ya que las afirmaciones empíricas y las hipótesis teóricas son oraciones que especifican la relación entre los modelos de la teoría y los fenómenos. De modo que una teoría que no tiene modelos tampoco puede contener afirmaciones empíricas o hipótesis teóricas.
¿Son Necesarios los Modelos para Identificar a las Teorías?
35
Las teorías inconsistentes no tienen modelos, pero si una teoría es consistente no se sigue que siempre los tenga. Para las teorías de primer orden es verdadera la equivalencia entre consistencia y satisfacibilidad, ya que toda teoría consistente de primer orden tiene al menos un modelo (lo cual no implica, por supuesto, que siempre podamos conocerlo). En cambio, esta equivalencia no se mantiene para las teorías formuladas en lenguajes de segundo orden o de orden superior. Existen teorías de orden superior que no tienen modelos, y se puede probar que no los tienen, aunque sean consistentes. La concepción semántica no puede acomodar esta clase de teorías. En conclusión, no parece que sea razonable hacer de la consistencia una condición necesaria de toda teoría, ni excluir a priori las teorías consistentes que no tienen modelos, aunque se trate de teorías puramente formales o matemáticas. La concepción proposicional no tiene ninguno de estos dos problemas. Aquí se advierte que la concepción proposicional y la concepción semántica no son equivalentes. En la concepción proposicional una teoría puede ser consistente o inconsistente y tener o no tener modelos, sin que por ello deje de ser una teoría. Por esta razón, me parece más satisfactoria, al menos respecto de estos aspectos, que la concepción semántica.
Bibliografía Balzer, W. 1997. Teorías empíricas: modelos, estructuras y ejemplos. Madrid: Alianza. Balzer, W., Moulines, C. U. y Sneed, J. 1987. An Architectonic for Science. Dordrecht: Reidel. Braithwaite, R. B. 1953. Scientific Explanation. Cambridge: Cambridge University Press. Carnap, R. 1936–1937. Testability and Meaning. Philosophy of Science 3: 420–68 y 4: 1–40. —–. 1956. The Methodological Character of Theoretical Concepts. En: Feigl, H. and Scriven, M. (eds.) Minnesota Studies in the Philosophy of Science. Vol II, Minnesota: University of Minnesota Press, pp. 38–76. Da Costa, N. C. A. y French, S. 2003. Science and Partial Truth: A Unitary Approach to Models and Scientific Reasoning. New York: Oxford University Press. Díez, J. A. y Moulines, C. U. 1997. Fundamentos de filosofía de la ciencia. Barcelona: Ariel. Frigg, R. 2006. Scientific Representation and the Semantic View of Theories. Theoria (España) 55: 49–65. Giere, R. 1988. Explaining Science: A Cognitive Approach. Chicago: University of Chicago Press. —–. 1997. Understanding Scientific Reasoning. Fourth Edition. New York: Harcourt Brace. —–. 1999. Science Without Laws. Chicago: University of Chicago Press. —–. 2000. Theories. En: Newton-Smith, W. (ed.), A Companion to the Philosophy of Science. London: Blackwell, pp. 515–24. —–. 2006. Scientific Perspectivism. Chicago: University of Chicago Press. Hanson, N. R. 1958. Patterns of Discovery. Cambridge: Cambridge University Press. Hempel, C. G. 1952. Fundamentals of Concept Formation in Empirical Science. Chicago: University of Chicago Press. McKinsey, J. J.; Sugar, A. C.; Suppes, P. 1953. Axiomatic Foundations of Classical Particle Mechanics. Journal of Rational Mechanics and Analysis 2: 253–72. Moulines, C. U. 2006. La philosophie des sciences: L’invention d’une discipline. Paris: Éditions Rue d’ Ulm.
36
Alejandro Cassini
Putnam, H. 1962. What Theories Are Not. En: Nagel, E., Suppes, P. y Tarski, A. (eds.) Logic, Methodology, and Philosophy of Science: Proceedings of the 1960 International Congress. Stanford: University of Stanford Press, pp. 240–51. Quine, W. V. O. 1975. On Empirically Equivalent Systems of the World. Erkenntnis 9: 313–28. Shapiro, S. 2005. Logical Consequence, Proof Theory, and Model Theory. En: Shapiro, S. (ed.) The Oxford Handbook of Philosophy of Mathematics and Logic. New York: Oxford University Press, pp. 651–70. Sneed, J. 1971. The Logical Structure of Mathematical Physics. Dordrecht: Reidel. Stegmüller, W. 1970. Theorie und Erfahrung. Heidelberg: Springer-Verlag. —–. 1973. Theorienstruktur und Theoriendynamik. Heidelberg: Springer-Verlag. —–. 1979 The Structuralist View of Theories. Berlin: Springer-Verlag. Suppe, F. (ed.) 1977. The Structure of Scientific Theories. Second Edition. Urbana-Chicago: University of Illinois Press. Suppe, F. 1989. Scientific Realism and the Semantic Conception of Theories. Urbana-Chicago: University of Illinois Press. —–. 2000. Understanding Scientific Theories: An Assessment of Developments, 1969-1998. Philosophy of Science 67: S102–S115. Suppes, P. 1957. Introduction to Logic. New York: Van Nostrand. —–. 2002. Representation and Invariance of Scientific Structures. Stanford: CSLI Publications. Van Fraassen, B. C. 1980. The Scientific Image. Oxford: Clarendon Press. —–. 1989. Laws and Simmetry. Oxford: Clarendon Press.
Notas 1 Véase, entre otros, los trabajos clásicos de Hempel (1952) y Carnap (1956). La elaboración más detalla-
da de la concepción clásica posiblemente sea el libro de Braithwaite (1953). 2 El ejemplo más conocido es el libro de Suppe (1977) (cuya primera edición es de 1974), que acuñó la expresión “Received View of theories”. 3 La exposición más complete del desarrollo histórico y de la estructura lógica de la concepción clásica se encuentra en Suppe 1977, pp. 6–61. 4 Carnap 1936–1937 es el lugar clásico para la discusión de esta cuestión. 5 Véase Suppe 1977, pp. 38–77, para una crítica detallada del concepto de interpretación parcial y de la teoría del significado asociada con él. 6 Van Fraassen, por ejemplo, expresa esta idea en los siguientes términos: “En toda tragedia, sospechamos que un error crucial se cometió en el comienzo mismo. El error, según pienso, fue confundir una teoría con la formulación de una teoría en un lenguaje en particular” (Van Fraassen 1989, p. 221). 7 Hanson 1958 y Putnam 1962 son dos de las críticas pioneras a la distinción teórico-observacional. Suppe 1989, pp. 38–54 resume bien las críticas al concepto de interpretación parcial. 8 Véase, por ejemplo, Suppe 2000, para una descripción breve de las diferentes concepciones semánticas. La llamada familia semanticista incluye, entre otros, la axiomatización mediante predicados conjuntistas de Suppes (Suppes 1957 y 2002); la concepción estructuralista de Sneed y sus seguidores (Sneed 1971; Stegmüller 1973 y 1979; Balzer, Moulines y Sneed 1987); el enfoque de espacios de estado de Van Fraaseen y Suppe (Van Fraassen 1980 y 1989; Suppe 1989); la concepción modelística informal de Giere (Giere 1988, 1999 y 2006) y la concepción de estructuras parciales de Da Costa y French (Da Costa y French 2003). Una comparación entre las diferentes concepciones semanticistas está más allá de los límites de este trabajo. 9 Véase Frigg 2006, para un análisis crítico de estos modos de representación y otras referencias sobre el tema.
¿Son Necesarios los Modelos para Identificar a las Teorías?
37
10 Así, por ejemplo, Suppes escribe que “. . . una representación de algo es una imagen, modelo o repro-
ducción de esa cosa” (Suppes 2002, p. 51). Ciertamente, esta definición no ayuda mucho a comprender en qué consiste el carácter representativo de un modelo. 11 Al respecto dice que “la Concepción Heredada tiene un componente semántico y no es totalmente sintáctica” (Suppe 2000, pp. 103–4). Uno se pregunta cómo una teoría podría ser “parcialmente” sintáctica. 12 Giere lo expresa de esta manera: “De hecho, uno puede abandonar la distinción entre [los enfoques] ‘sintáctico’ y ‘semántico’ como un desecho de un viejo debate. La distinción importante es entre un enfoque que toma a los modelos como fundamentales versus uno que toma a los enunciados, en particular a las leyes, como fundamentales.” (Giere 2000, p. 523, subrayado por el autor). 13 Stegmüller 1973 y 1979, y los estructuralistas han puesto especial énfasis en estas oposiciones. 14 Véase, entre otros, Mc Kinsey, Sugar y Suppes 1953; Suppes 1957 y 2002; y Balzer 1997. 15 Véase, por ejemplo, Giere 1988, p. 80; 1996, p. 25; 1999, p. 179. Giere reconoce explícitamente que su concepción de las teorías es heterogénea, pues, incluye elementos no lingüísticos (“una población de modelos”) y lingüísticos (“un conjunto de hipótesis teóricas”). Las afirmaciones empíricas de los estructuralistas relacionan los modelos de la teoría con los modelos de datos (véase Balzer 1997, p. 293). Como toda oración, las hipótesis teóricas y las afirmaciones empíricas pueden ser verdaderas o falsas, y, en general, estarán más o menos confirmadas por los datos disponibles. 16 Esta es sólo una de las definiciones posibles del concepto de consecuencia lógica, pero resulta suficiente para los fines del presente análisis. 17 Quine 1975, p. 318–21. Quine ha sido más sensible a las sutilezas del lenguaje que lo que yo lo he sido aquí. Su definición de la formulación de una teoría es la siguiente: “dos formulaciones expresan la misma teoría si son empíricamente equivalentes y hay una reinterpretación de sus predicados que transforma una teoría en lógicamente equivalente en la otra.” (p. 320). “La teoría expresada por una formulación dada es la clase de todas las formulaciones que son empíricamente equivalentes a esa formulación y pueden transformarse en lógicamente equivalentes a ella o viceversa mediante una reinterpretación de sus predicados.” (p. 321). Para los fines de este trabajo me resulta suficiente la afirmación de que la teoría expresada por una determinada formulación es la clase de todas las formulaciones que son lógicamente equivalentes a ella. 18 Se encuentran claramente resumidas en Díez y Moulines 1997, pp. 319-320. 19 Véase, por ejemplo, Shapiro, 2005, para un análisis de seis caracterizaciones diferentes de la noción de consecuencia lógica, en ninguna de las cuales se emplea el término modelo. Es evidente que no hay un único concepto de consecuencia. 20 Para mayores detalles sobre este punto véase Balzer, Moulines y Sneed 1987. 21 En una comunicación personal.
E PISTEMOLOGIA COMO H ISTÓRIA C ONCEITUAL : A F ORMAÇÃO DO C ONCEITO DE I DEOLOGIA C IENTÍFICA EM G EORGES C ANGUILHEM FABRINA M OREIRA S ILVA Universidade de São Paulo
fabrina@usp.br
Georges Canguilhem, epistemólogo francês do século XX, nomeado Diretor do Instituto de História da Ciência na Universidade de Sorbonne em 1955, destaca-se no campo da filosofia e da história das ciências, segundo P. Bourdieu, “por reagir contra a imagem ao mesmo tempo fascinante e rechaçada do intelectual total que se fazia presente em todas as frentes de pensamento” (Bourdieu 2005, p. 45). Ao dar continuidade à obra de Gaston Bachelard, sobre o qual ofereceu uma apresentação admirável (ver Canguilhem 1970), Canguilhem “a dintingué et reuni l’histoire e l’epistémologie. À ce titre, il a réalisé une partie de la synthèse projetée par Gaston Bachelard, dont il n’a cesse de se réclamer” (Debru 2004, p. 82). Ao mesmo tempo em que Canguilhem recorre frequentemente à Bachelard, ele também o ultrapassa no sentido de convergir para questões que não pertencem ao campo da ciência tradicional, como a ideologia e as práticas sociais. O desafio consiste justamente em entender qual o papel da Ideologia científica na construção das ciências, enquanto que para a filosofia da ciência tradicional, a ideologia é um obstáculo que deve ser superado pelo conhecimento científico, não pertencendo, portanto, ao campo científico. Com uma dupla formação em medicina e filosofia, Canguilhem adquiriu uma competência interdisciplinar, no qual se encontra em uma situação privilegiada dentro do campo da filosofia das ciências da vida. E, assim como Bachelard, Canguilhem faz uma epistemologia regional, que tem como princípio a inexistência de critérios de racionalidades válidos para todas as ciências, e que, portanto, exige uma investigação minuciosa de várias ‘regiões’ de cientificidade, procurando explicitar os fundamentos de setores particulares do saber, que no seu caso é a fisiologia, a biologia, a anatomia e a patologia. No olhar do epistemólogo francês para estas ciências, estão incorporados conceitos bachelardianos como obstáculo epistemológico, corte epistemológico, ciência caduca, ciência sancionada e recorrência, que lhe servem de filtro para compreender a historicidade da ciência. Para Canguilhem, uma obra de Bachelard se destaca esta do Racionalismo Aplicado, que contém em síntese, mais precisamente na conclusão deste livro, os conceitos centrais da sua epistemologia. Com efeito, Canguilhem retoma uma discussão já iniciada pelo seu mestre, que é a freqüente posição tradicional que ocupa os historiadores das ciências em considerar o objeto da história das ciências como um objeto da ciência. Essa visão de historiador constitui um modelo cuja história das ciências tem a função de “microscópio Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 38–43.
Epistemologia como história conceitual
39
mental”1 na prática da historiografia científica. Ou seja, é uma problemática, exposta através da discussão diretamente sobre a pergunta: em que exatamente a história das ciências é história? Como o foi no caso da conferência na cidade de Montreal em 1966. Nessa pergunta estão tácitas outras questões que remetem à história das ciências, sendo que uma delas é a definição do critério de classificação usado para selecionar o que está inscrita dentro da “categoria”2 história das ciências. Segundo Canguilhem, uma prática comum dos historiadores inscritos no modelo empirista, é considerar que a relação da ciência aos objetos das quais elas são ciência, “doit être importe et transplante de la science dans l’histoire” (Canguilhem 1970, p. 12). Admitir o mesmo critério usado para definir o que é ciência, para definir o que é história da ciência, “trata-se, na verdade, de um problema epistemológico respeitante ao modo permanente da constituição dos conhecimentos científicos na história” (Canguilhem 1977, p. 32). Compreender a constituição dos conhecimentos científicos na história não significa aplicar o critério de cientificidade usado tradicionalmente pelos filósofos da ciência, e então separar o que é ciência do que não é ciência atemporalmente. Não cabe à história das ciência julgar a cientificidade dos objetos históricos, mais sim, a história das ciências para Canguilhem, junto com a epistemologia, teria a função de compreender a ciência como um processo histórico, na medida em que as constituições de conceitos científicos pertencem ao tempo da história geral do homem. Considerar o objeto da história das ciências como um objeto natural da ciência, seria para Canguilhem ce qui revient à considérer des concepts, des discours et des gestes spéculatifs ou expérimentaux comme pouvant être déplacés et replacés dans un espace intellectuel où la réversibilité des relations a été obtenue par l’oubli de l’aspect historique de l’objet don til est traité. (Canguilhem 1970, p. 21)
Assim, para Canguilhem, a história das ciências concerne une activité axiologique, la recherche de la véritá. C’est au niveau des questions, des méthodes, des concepts que l’ativité scientifique apparaît comme telle. C’est porquoi le temps de l’histoire des sciences ne saurait être um filet lateral du cours general du temps. (Canguilhem 1970, p. 19)
Na verdade, essa confusão de objetos encontra-se presente nas discussões de Bachelard, quando ele opõe a história caduca e a história sancionada, à história dos fatos de experimentação ou de conceitualização científica, apreciados no seu relato aos valores científicos recentes. Segundo Canguilhem, sem a epistemologia seria impossível de discernir os dois tipos de histórias, denominadas caduca e sancionada. Entretanto, este discernimento seria possível somente por aquele que portasse suficiente capital científico capaz de julgar a atualidade de tal ou tal conhecimento, dentro do campo científico. Neste sentido,
40
Fabrina Moreira Silva
praticar uma ciência é para o epistemólogo o mesmo que imitar a prática do cientista, por meio de uma familiarização estudiosa com os textos originais, no qual o produtor se explicou sobre a sua conduta. (Canguilhem 1977, p. 17)
Canguilhem reconhece que é natural o interesse do cientista, pela ciência na sua história, porém, “o interesse do epistemólogo é um interesse de vocação.” (Canguilhem 1977, p. 18) Vocação essa, que é gerada pelo caráter inovador do espírito científico contemporâneo, onde segundo Bachelard, “a ciência suscita um mundo, não mais por um impulso mágico, imanente à realidade, mas antes por um impulso racional, imanente ao espírito” (Bachelard 1990, p. 19). A vocação científica do epistemólogo representa um comprometimento com a constante atualização dos conceitos, tantos os novos, que são criados ou virão a ser, como os que deixaram e deixarão de ter validade científica, por motivos constantes de retificações. A dinâmica do processo de constituição das ciências obriga os cientistas e os historiadores das ciências a se renovarem constantemente no sistema conceitual no qual estão inscritos. Porém, como nas práticas cientificas necessitam-se de uma constante atualização dos conceitos, “a história das ciências é vítima de uma classificação que ela aceita como fato de saber, tendo em vista que o problema é o de saber de que fato procede essa mesma história” (Canguilhem 1977, p. 26). Ao ter consciência desse problema, o historiador teria que questionar de que história é feita a história das ciências, na intenção de “faire comprendre dans quelle mesure des notions ou attitudes ou des méthodes dépasséesont été, à leur époque, un dépassement” (Canguilhem 1970, p. 14), pois, a história das ciências não é um progresso das ciências invertido. A história das ciências é feito do esforço em pesquisar e compreender o que foi a criação de um conceito no momento em que ele foi criado e, tão importante como, expor os motivos da sua destruição posterior. Segundo Canguilhem, o conceito tem um papel importante na história das ciências, pois um conceito é uma denominação e uma definição, é um nome dotado de um sentido capaz de interpretar as observações e as experiências, portanto, é através do conceito que o discurso expressa a racionalidade que o caracteriza. A importância reconhecida ao conceito como expressão da norma de verdade do discurso científico, “trata uma ciência em sua história não como uma articulação dos fatos de verdade, mas como uma purificação elaborada de normas de verificação” (Canguilhem 1977, p. 44). Assim, a história epistemológica que tematiza as interrelações conceituais, não se limita ao interior de uma ciência, ela deve relacionar os conceitos com as práticas sociais e políticas. Dans la mesure où elle s’aplique à l’objet ci-dessus delimite, n’a pás seulement rapport à um group de science sans cohésion intrinsèque mais aussi à non-science, à ideologie, à la pratique politique et sociale. (Canguilhem 1970, p. 18)
Porém, considerar uma relação contínua entre ideologia e ciência fere ao princípio básico de seu mestre, a ruptura entre o senso comum e a ciência. Assim, até que
Epistemologia como história conceitual
41
ponto Canguilhem permanece dentro da teoria de Bachelard? Encontram-se em Bachelard dois sentidos interrelacionais da expressão ruptura. Em primeiro lugar ela designa a descontinuidade existente, em qualquer momento da história, entre a racionalidade científica e o conhecimento comum, cotidiano. E em segundo lugar, mesmo depois do seu nascimento, o progresso que a caracteriza essencialmente, se realiza por rupturas sucessivas. O aspecto da concórdia, concernente à categoria do progresso descontínuo da ciência bachelardiana, Canguilhem afirma que é pela elaboração progressiva da compreensão de um conceito científico que a história das ciências deve ser uma história das filiações conceituais, mas essa filiação tem um estatuto de descontinuidade, de forma que “le sens des ruptures et des filiations historiques ne peut pas venir à l’historien des sciences d’ailleurs que de son contact avec la science fraîche” (Canguilhem 1970, p. 20). Desta forma, confirma-se a presença do conceito de ruptura bachelardiano, na categoria de progresso do Canguilhem. Porém, o ponto de discórdia consiste no primeiro sentido de ruptura,3 pois, para Canguilhem a “ideologia científica seria ao mesmo tempo obstáculo e, por vezes, condição de possibilidade da constituição da ciência” (Canguilhem 1977, p. 36). Com efeito, Canguilhem não exclui o senso comum do processo de constituição da ciência, mas observa que a ideologia científica possui características conceituais própria. A ideologia científica funciona de forma dupla, tanto ela pode estar dentro do campo da ciência e vir a ser uma ideologia científica por se tornar uma ciência caduca, obsoleta, ou ela pode nascer em um campo que não pertença ao campo científico e ocupar-se de um campo paralelo que busca imitar e deseja pertencer ao campo científico. Entretanto, Canguilhem adverte que “é preciso distinguir o conteúdo da função” (Canguilhem 1977, p. 35) de uma ideologia. O conteúdo se adquire com a descrição justa da situação, sem alteração e sem quiasma (Canguilhem 1977, p. 35), e a função é a ilusão no sentido marxista de alienação. Por isso, a ideologia científica se distingue do conceito marxista por se ocupar somente do conteúdo. Uma vez definido o conteúdo da ideologia científica, Canguilhem se propõe a examinar a gênese de uma ideologia científica do séc. XIX: o evolucionismo. Essa escolha consiste justamente no fato de que esse exemplo abrangerá tanto a esfera non-científica de uma ideologia científica, como também mostrar que “quando uma ciência vem ocupar um lugar que a ideologia parecia indicar, não é na região que se esperava” (Canguilhem 1977, p. 37). Vejamos melhor este caso. Segundo Canguilhem, o autor Herbert Spencer “crê poder formular uma lei mecânica do progresso universal, por evolução do simples para o complexo, através de sucessivas diferenciações” (Canguilhem 1977, p. 39), declarando expressamente que obteve esta lei da evolução dos princípios de embriologia de Karl-Ernest von Baer (1828). A publicação da Origem das espécies (1859) confirma a convicção de Spencer de que o seu sistema de evolução generalizada se desenvolve sobre o mesmo plano de validade científica que a biologia darwiniana. O desejo de Spencer em validar a sua sociologia nos métodos das ciências natu-
Fabrina Moreira Silva
42
rais, não alcançou o sucesso pretendido inicialmente. A afinidade entre os embriologistas e Darwin ligava-se de antemão ao fato de que este tinha percebido em embriologia da época um aspecto característico da nova dimensão segundo ao qual o próprio Darwin se esforçava por compreender a constituição do mundo vivo. Esta nova dimensão era o tempo e a história. (Canguilhem 1977, p. 95)
Porém, segundo Canguilhem, a teoria científica da evolução não ficou pelo darwinismo, mas o darwinismo é um momento integrado da história da constituição da ciência da evolução. Ao passo que a ideologia evolucionista é um resíduo inoperante da história das ciências humanas do séc. XIX. (Canguilhem 1977, p. 40)
A escolha da ideologia evolucionista proporciona esclarecer como se forma uma ideologia, cuja origem é uma não-ciência. A preferência de Canguilhem por falar em não-ciência no lugar de anti-ciência ou falsa ciência, consiste no fato de que na “ideologia científica há uma ambição explícita de ser ciência, à imitação de qualquer modelo de ciência já constituída.” (Canguilhem 1977, p. 36) A ideologia científica não é uma falsa ciência, para Canguilhem, na “falsa ciência não existe estado pré-científico” (Canguilhem 1977, p. 36), pois, é próprio de uma falsa ciência nunca descobrir o que é falso. Assim, este exemplo revela as bases pré-científicas de uma ideologia científica. Canguilhem conclui assim, através do exemplo da evolução e de outros exemplos que não foram citados aqui, a necessidade de uma teoria da história das ciências que esclareça a sua prática. Uma história das ciências que trata uma ciência na sua história como uma purificação elaborada através de normas de verificação não pode deixar de cuidar também das ideologias científicas. O que Bachelard distinguia como história das ciências caduca e sancionada deve, por sua vez ser entrelaçado. A sanção de verdade ou de objetividade já comporta em si a condenação do caduco. Mas se o que mais tarde se tornará caduco não começar por se sujeitar às sanções, a verificação não terá oportunidade de fazer aparecer a verdade. (Canguilhem 1977, p. 41)
Desta forma, a ideologia científica faz parte do processo de constituição da ciência e a história das ciências não pode negar esse papel. Considerar a história como um processo é privilegiar uma história da constituição dos conceitos. Assim,a história conceitual como epistemologia histórica, realiza-se dentro de uma perspectiva filosófica que traz à história das ciência um novo estatuto, este de integrar a ideologia científica, no processo de constituição da ciência, proposto por G. Canguilhem.
Bibliografia Bachelard, G. 1990. Materialismo Racional. Rio de Janeiro: Edições 70.
Epistemologia como história conceitual
43
—–. 1977. Racionalismo Aplicado. Rio de Janeiro: Zahar. Bourdieu, P. 2005. Esboço de auto-análise. São Paulo: Companhia das Letras. Canguilhem, G. 1970. Études d’histoire et de philosophie des scinces. Paris: Vrin. —–. 1977. Ideologia e racionalidade nas ciências da vida. São Paulo: Edições 70. Debru, C. 2004. Georges Canguilhem, science et non-science. Paris: Editions Rue d’Ulm. Machado, R. 1981. Ciência e saber: a trajetória da arqueologia de Foucault. 2.ed. Rio de Janeiro: Graal.
Notas 1 Canguilhem “definiu o papel da história das ciências como o de ‘microscópio mental’, tendo por efeito
revelador de introduzir atraso e desistência na exposição habitual do saber científico, pela menção das dificuldades encontradas e na propagação deste conhecimento.” (Canguilhem 1970, p. 12) 2 No início do texto L’objet de l’histoire des sciences, Canguilhem adverte que: “Considérée sous l’aspect qu’elle offre dans le Recueil des Actes d’um Congrès, l’histoire des science peut passer pour une rubrique plutôt que pour une discipline ou um concept. Une rubrique s’enfle ou se distend presque indéfiniment puisqu’elle n’est qu’une étiquette, au lieu qu’um concept, parce qu’il enferme une norme opéatoire ou judicatoire, ne peut varier dans son extension sans rectificacion de as compréhension.” (Canguilhem 1970, p. 9) [Trad. Autor: Considerada sobre o aspecto que ela oferece na Compilação das Atas de um Congresso, a história das ciências pode passar por uma categoria antes que uma disciplina ou um conceito. Uma categoria se incha ou se estende quase indefinidamente, uma vez que apenas é só um rótulo em vez de conceito, por conter uma norma operatória ou judicatória, não podendo variar na sua extensão sem retificação da sua compreensão. É assim que por debaixo de uma categoria “história da ciência” podem ser inscritos tanto uma descrição de um roteiro recentemente reencontrado, como uma análise temática da constituição de uma teoria física.] 3 Bachelard afirma em seu livro Materialismo Racional que “domínios de pensamentos que rompem nitidamente com conhecimento vulgar e esta ruptura é manifestada sempre em forma de progresso científico.” (Bachelard 1990, p. 121)
H UME E OS A CADÊMICOS M ODERNOS F LÁVIO M IGUEL DE O LIVEIRA Z IMMERMANN Universidade de São Paulo
flaviozim@yahoo.com.br
Segundo Richard Popkin em sua “História do ceticismo de Erasmo a Spinoza”, uma das principais armas contra o ceticismo pós-cartesiano foi a moderação nas proposições filosóficas, que ele denominou de ceticismo construtivo ou mitigado. Por esta espécie de ceticismo, Popkin entende “uma teoria que possa aceitar a força total do ataque cético à possibilidade do conhecimento humano, no sentido de verdades necessárias sobre a natureza da realidade, e no entanto admitir a possibilidade de conhecimento em um grau inferior, como verdades convincentes ou prováveis acerca das aparências” (Popkin 2000, p. 211). Entre os autores desta corrente filosófica Popkin cita Mersenne e Gassendi. Neste trabalho mostraremos que além destes filósofos, Pierre-Daniel Huet e Simon Foucher, podem entrar nesta categoria, que geralmente é definida também de ceticismo acadêmico,1 promovendo em seguida uma comparação com as críticas de David Hume, também adversário do ceticismo pirrônico e partidário do ceticismo mitigado. Huet foi um autor muito influente e respeitado em seu tempo. De acordo com suas memórias, durante vários anos pertenceu de corpo e alma ao cartesianismo, mas depois passou a ser um dos maiores críticos deste sistema e de seus seguidores. A obra dedicada a atacar os sistemas dogmáticos tradicionais e a exaltar a crítica ao conhecimento humano é o “Tratado filosófico da fraqueza do espírito humano”. Na primeira parte deste tratado, Huet apresenta treze razões para comprovar que a verdade não pode ser conhecida com perfeita certeza pelo entendimento humano. De forma semelhante aos tropos de Sexto Empírico, os argumentos de Huet procuram enfatizar a insuficiência de nossa capacidade cognitiva para conhecer com clareza e distinção, antes que provar a inexistência da verdade e que esta não se encontre em lugar oculto de nós. Uma de suas mais importantes provas é a de que o homem não pode saber se a imagem que parte do objeto exterior corresponde a sua verdadeira imagem, uma vez que o nosso entendimento não tem meios de compará-la com o próprio objeto em questão (Huet 1741, p. 33). E ainda que essa imagem possa ser confrontada com a original, não pode representar todas as suas propriedades, tanto internas quanto externas, pois é preciso considerar o meio pelo qual ela passa até chegar aos sentidos, que é variável. Huet cita alguns exemplos de variações do meio externo: a cor de um objeto que se vê a tarde é diferente da que se vê ao meio-dia, o remo quando mergulhado na água parece estar quebrado ao olhar e as casas parecem tremer quando observadas através da fumaça. Ainda que essas imagens não sofressem alteração do meio externo, restaria ainda a suspeita de infidelidade dos nossos próprios sentidos e das disposições do nosso Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 44–52.
Hume e os Acadêmicos Modernos
45
comportamento. Se nossos sentidos não estão sãos, julgamos as coisas de forma diferente do que quando atuam em seu estado normal e na velhice rejeitamos muitas coisas de que gostávamos na infância. Os corpos dos homens também são dessemelhantes, e isso pode fazer com que eles concebam os objetos de modo diferente. Ora, se os cérebros seguem o tamanho de suas cabeças, os que têm o crânio redondo julgarão diferentemente do que os que têm longo (Huet 1741, p. 46). Pierre Gassendi, cientista experimental e filósofo de grande erudição, também ocupou-se seriamente destes problemas no segundo livro das “Dissertações em forma de paradoxos contra os aristotélicos”. No livro II, Dissertação VI, a fim de aumentar a discussão com a filosofia aristotélica, não só as provas dos céticos contra a confiança nos sentidos e na razão são apresentadas, como também as possíveis objeções e respostas a elas. Embora Gassendi tenha aceitado o adágio aristotélico de que “não há nada no entendimento que não tenha passado antes pelos sentidos”, e que é sempre preciso apelar ao juízo dos sentidos para resolver qualquer questão que possa comportar alguma falsidade, é duvidoso que as coisas se apresentem a nós como são em si mesmas (Gassendi 1959, p. 388, 436). Consultando o próprio Aristóteles, Gassendi lembra do famoso exemplo da torre, que tem o formato superior quadrado, mas parece redondo quando visto de longe, e do bastão, também apresentado por Huet, que quando mergulhado uma parte na água, parece estar quebrado ao olhar. O filósofo e teólogo Marin Mersenne, que se apresentou como crítico do ceticismo pirrônico, quando trata dos casos da torre e do bastão na água na voz da sua personagem cristã, oferece uma resposta a esta objeção. Sempre que objetos parecerem diferentes conforme sua distância ou o meio em que se encontram, poderemos conhecer o seu verdadeiro formato de alguma forma, aplicando uma regra ou instrumento para o caso em questão, no livro “A verdade das ciências contra os céticos e pirrônicos” (Mersenne 1625, p. 147). Embora os olhos possam se enganar quando julgam que o bastão na água não seja reto, a razão faz a devida correção, utilizando-se das regras da dióptrica (Mersenne 1625, p. 222). Argumentos semelhantes são apresentados contra casos semelhantes. O estudo da ótica também pode ser conveniente para entendermos porque algumas cores se parecem diferenciadas a nós conforme o meio externo em que se apresentam. Mas Gassendi teria ainda outra objeção cética. Pois ainda que tenhamos o raciocínio completamente são para medir e julgar, existem muitas pessoas com natureza e temperamento mental bem diferente dos que julgam fazer bom uso do raciocínio. Tais são os alienados e pessoas de disposições físicas consideradas defeituosas pela maior parte da humanidade pois, embora sejam minoria, não significa que percebem de modo menos verídico que a maioria, desde que existem pessoas com deficiência visual que, em certas ocasiões, vêem coisas mais nitidamente do que aquelas que são tidas como normais (Gassendi 1959, p. 460)). Ora, não podem essas pessoas perceberem muitas coisas que a maioria não percebe? Da mesma forma, Huet nota que os objetos que aparecem ao espírito no sonho e na loucura são tão convincentes quanto os que aparecem na vigília. As fibras do
46
Flávio Miguel de Oliveira Zimmermann
cérebro são tão violentamente agitadas pela doença e pelo sonho, que o cérebro reconhece diversas impressões, e o entendimento pensa ter sensações que os órgãos dos sentidos não tiveram (Huet 1741, p. 80). Contra a objeção de frenéticos que imaginam sentir dores, ver fantasmas e coisas semelhantes, Mersenne responde que é falta de juízo apresentar a opinião dos que nos levam a desacreditar na verdade, pois quando o espírito está livre de obscuridades e reflete sobre os sonhos e fantasmas da imaginação pode julgar o quanto não são verdadeiros (Mersenne 1625, p. 145). Além disso, o que nos importa se a imaginação de cegos e surdos seja diferente da nossa, uma vez que não podem discernir cores e sons? Isso não significa que nossos órgãos não sejam apropriados para discernir os objetos exteriores. Pois, ainda que jamais pudéssemos ver o sol e a terra, eles subsistiriam assim mesmo (Mersenne 1625, p. 142). Mersenne persiste, por meio da sua personagem cristã, na falta de eficácia dos argumentos céticos. Mesmo que outras pessoas ou outros animais pensem e vejam de forma diferente da nossa, não implica que não possamos conhecer algo e ter ciência. Sua outra personagem contra o cético nos diálogos, o alquimista, mostra que, mesmo embora uns achem o mel doce e outros amargo e os bichos considerem bom o que julgamos ser mal, os objetos dos sentidos são reais e não imaginários (Mersenne 1625, p. 43). O alquimista, provavelmente o representante de Bacon nos diálogos, acrescenta que a sua ciência experimental é invariável e, portanto, conhece as coisas passageiras de modo infalível (Mersenne 1625, p. 47). Essa afirmação, contudo, não poderia ter a aprovação do cristão, isto é, de Mersenne, que reprova o desígnio de Bacon no capítulo XVI, ao advertir que não podemos penetrar na natureza interna dos indivíduos e das coisas, já que nossos sentidos captam apenas a imagem externa dos fenômenos (Mersenne 1625, p. 212). As réplicas de Mersenne não parecem ter a finalidade de tirar completamente o cético de cena, mas apenas indicar que podemos conhecer alguma verdade e que o conhecimento superficial do mundo exterior não impede que possamos desenvolver alguma ciência. Podemos fazer suposições como Ptolomeu e Copérnico e adotar milhares de concepções dos fenômenos observando as ações da natureza, mas sem se referir à natureza secreta das coisas, pois para Mersenne não é necessário conhecer todas as essências do objeto em questão para saber algo (1625, p. 13–5, 213). Gassendi, embora tenha concluído nas Dissertations que “procurar a verdade não é mais que perseguir pássaros ao vôo” (Gassendi 1959, p. 502), na sua última obra, Syntagma Philosophicum, argumenta de forma semelhante a Mersenne em alguns tópicos contra o cético. Quando se ocupa da questão sobre as diferentes percepções que temos do mesmo objeto em momentos distintos em razão da sua distância ou o meio em que se encontra, chama a atenção para se levar em consideração o efeito da luz que atua sobre nós e os objetos simultaneamente. A torre parece grande de perto e pequena de longe para nós porque quanto mais raios alcançam os nossos olhos, mais partes do objeto são descritas.2 Da mesma forma, quando vista de perto, a torre aparece com o cume quadrado porque os raios que vêm das superfícies próximas
Hume e os Acadêmicos Modernos
47
são numerosos e fazem os olhos perceberem suas diferenças nos intervalos e parece redondo à distância porque retratam as partes que são separadas como se os seus intervalos fossem suprimidos (Gassendi 1972, p. 343–4). Gassendi admite não duvidar das verdades manifestas, que são conhecidas por si, como “é dia”, “o fogo é quente” e todas as aparências externas que se impõem automaticamente aos nossos olhos. Ora, se o pirrônico consente nas aparências e se o acadêmico aceita o probabilismo, não podem negar que usam algum critério para conhecer o mundo exterior (Gassendi 1972, p. 289–94). A confiança e o assentimento aos sentidos são a prova gassendiana contra o cético que afirma não ter nenhum critério para conhecer alguma coisa. Da mesma forma, após ter alcançado o nível extremo da dúvida com relação às suas próprias faculdades, e embora tenha se esforçado para mostrar que o homem é desprovido dos meios para conhecer a verdade com perfeita clareza e evidência, Huet reconhece no livro II do seu tratado cético, que se pode conhecer a verdade de alguma forma e que ela encontra-se fora de nós. Ele apenas indica que falta ao homem os meios necessários para adquiri-la. Na falta desse conhecimento absoluto das coisas, o filósofo propõe que adotemos as verossimilhanças e probabilidades no decorrer da vida, a exemplo dos acadêmicos; o que se apresentar contrário à probabilidade, deve ser rejeitado como falso (Huet 1741, p. 205). O critério que o permite distinguir o que é provável do que não é, é diferente da regra dos dogmáticos, que intenta distinguir o verdadeiro do falso. Pois a regra de probabilidade não nos oferece uma marca certa e evidente da verdade, apenas uma aparência externa do grau de verossimilhança que se encontra em um determinado objeto, útil aos nossos propósitos (Huet 1741, p. 251–3). Por exemplo, os astrônomos criam hipóteses sobre globos celestes que podem ser falsas e até mesmo destruíremse umas às outras, mas cada um se serve utilmente da sua hipótese para explicar e predizer os astros. Da mesma forma, em qualquer investigação ou experimento devese supor o objeto a ser conhecido como verdadeiro, até que se possa conhecer realmente o que se procura. É desta forma que progredimos para Huet, sugerindo e arriscando hipóteses e conjecturas, e não nos abstendo da prática. Um viajante que não sabe qual caminho tomar não pode parar na encruzilhada em que se encontra, metaforiza (Huet 1741, p. 245). Além da razão prática, Huet apresenta a fé como um dom dado por Deus para suplantar a fraqueza da razão. Ao reconhecê-la, o homem conhece as coisas mais certamente, embora ainda não perfeitamente, como Deus conhece. Sem o conhecimento celeste, contudo, resta-nos a certeza humana, que Huet denomina de “soberano grau de certeza”. Por meio dela, adquirimos conhecimentos evidentes, tais como os primeiros princípios (por exemplo, que o todo é maior que suas partes), os axiomas da geometria, certezas de natureza física e moral, como a de que em Roma existiu um imperador chamado Augusto e que o fogo esquenta. Por divergir de certos pressupostos da dúvida pirrônica, embora sem oferecer um meio para que a verdade absoluta possa estar ao alcance do ser humano, o método
48
Flávio Miguel de Oliveira Zimmermann
huetiano apresenta-se como uma proposta moderada nos discursos, procurando se aproximar somente do que possa levá-lo ao caminho da verdade. Certamente o propósito de seguir a verossimilhança e de adotar a o método probabilístico nas investigações o aproxima mais do acadêmico do que do pirrônico, embora o autor tenha negado a diferença entre as seitas e procurado aperfeiçoar o procedimento dos antigos em alguns aspectos. O abade Simon Foucher, procura conduzir-se por um rumo semelhante, julgando necessário voltar-se aos primeiros princípios no campo da filosofia e seguir apenas as verdades evidentes a maneira dos geômetras. Desta forma poderemos ao menos distinguir o que sabemos do que não sabemos, defende o autor das “Dissertações sobre a procura da verdade, contendo a história e os princípios da filosofia dos acadêmicos”, no livro I, cap. 1. O autor divide as escolas dos filósofos da seguinte forma: os dogmáticos positivos ou dogmatistas, que se conduzem pela verossimilhança em matéria de ciência e afirmam sobre todas as coisas, seguindo a autoridade da sua seita; os dogmáticos negativos, que dizem que nada se pode saber e os dogmáticos ou acadêmicos, que se pronunciam sobre algum assunto e formam dogmas por si mesmos (Foucher 1693, p. 178–82). Os acadêmicos, como se percebe, não fazem parte da mesma classe dos céticos, uma vez que admitem algumas verdades (Foucher 1693, p. 175). O autor não nega que conhecemos algumas coisas, e conseqüentemente, que conhecemos a verdade em geral, como por exemplo, que dois e três são maiores que quatro e que o quadrado da hipotenusa de um triângulo retângulo é igual aos quadrados dos dois outros lados, mas ainda nos falta um meio de conceber distintamente um critério de verdade que possa ser reconhecido por todos os homens. Foucher é otimista em encontrar este critério, pois julga que a idéia geral de verdade se encontra em nosso espírito, embora ela não se mostre em toda sua pureza, pois se confunde freqüentemente com a verossimilhança e se perde nas contradições e volubilidade do nosso entendimento, na falsa erudição e nos fantasmas dos sentidos (Foucher 1693, pp. 132–5). A filosofia acadêmica sustentada por Foucher duvida das informações apresentadas pelos órgãos dos sentidos, embora reconheça dogmas nas demonstrações puramente especulativas. Este modo de pensar, porém, não se deve propriamente aos acadêmicos, “mas às primeiras verdades que Deus escreveu em todos os espíritos com sinais de luz” (Foucher 1693, p. 04). Por esta razão, Foucher, assim como Huet, entende que a filosofia não deve se submeter a nenhum mestre em particular, nem mesmo a Platão, que foi o criador da academia, mas mostra a necessidade de se procurar reflexões mais consideráveis que as de Platão, Sexto Empírico e outros (Foucher 1693, p. 111). A proposta moderada de ceticismo de Huet e Foucher tem afinidades com a de David Hume. Assim como Foucher, Hume não encontra argumentos racionais capazes de provar a existência do mundo exterior. Seus argumentos questionam as causas que nos levam a crer na existência dos corpos, embora não encontre razões para du-
Hume e os Acadêmicos Modernos
49
vidar efetivamente que os corpos existam fora de nós (Hume 1978, p. 187). E ainda os homens sejam levados por um instinto natural a supor um universo exterior independente das suas percepções, nada se encontra em suas mentes senão uma imagem de algum objeto que recebem por meio das sensações, não havendo nesta operação qualquer contato imediato entre a mente e o objeto (Hume 1975, p. 152). Apesar disso, Hume observa que, embora não possa defender a razão pela razão, o cético subsiste raciocinando e crendo, e mesmo sem argumentos filosóficos suficientes, continua a sustentar a sua existência e a dos corpos externos (Hume 1978, p. 187). Pois o cético que duvida efetivamente da realidade externa não pode propiciar nenhum bem à sociedade nem a si próprio. E, embora possa momentaneamente perder-se em raciocínios abstrusos, o primeiro acontecimento da vida o deixará igual aos demais mortais, determinado a agir, raciocinar e crer, tendo que encarar suas dúvidas anteriores como nada mais que simples passatempo (Hume 1975, p. 159–60). Este recurso impede que a filosofia de Hume se entregue à depressão cética causada pela incapacidade da razão de resolver o problema por si só. Apesar da fraqueza da razão, Hume, assim como Huet, entende que abandonála é mais prejudicial do que aceitá-la para conduzir a boa investigação. E da mesma forma que Mersenne e Gassendi, Hume propõe-se a derrotar argumentos céticos superficiais ou populares fazendo o uso adequado do raciocínio. Contra objeções que pretendem destruir a credibilidade das aparências dos objetos que se apresentam de forma diferente a nós a uma certa distância e da aparente distorção do remo mergulhado na água ele julga ser possível corrigir os erros pela razão e considerações do meio para que se tornem critérios apropriados de verdade e falsidade (Hume 1975, p. 151). Quanto às opiniões contraditórias em diferentes épocas e nações, das nossas variações de juízo na saúde, na doença, na mocidade ou na idade avançada não é necessário tanta inquietação, tendo em vista que nós constantemente raciocinamos e utilizamos crenças sobre os mais variados tópicos da vida comum (1975, p. 158). Foucher entende que é preciso corrigir nossos sentidos e perceber pela luz da razão as coisas insensíveis que os nossos olhos não descobrem (Foucher 1693, p. 428– 9). A razão natural, dada por Deus, quando bem utilizada pode nos oferecer alguns indícios de verdade, conclui também o padre Mersenne. Embora tenhamos um conhecimento ínfimo, tanto das coisas divinas quanto terrenas, a nossa luz universal pode nos conceder algumas certezas evidentes em si, como no caso da matemática e geometria. Essa luz, aperfeiçoada pelo estudo e meditação, só poderá ser completada quando nos unirmos à luz sobrenatural da glória eterna (Mersenne 1625, p. 193–4). Assim como Mersenne, Gassendi não julga razoável duvidar das inferências da geometria. O cético no máximo questiona se esse conhecimento abstrato existe na realidade (Gassendi 1972, p. 340), e Hume diz que as relações entre as idéias, isto é, proposições matemáticas e geométricas são descobertas pela simples operação do pensamento, independentemente de existirem ou não na natureza (Hume 1975, p. 25). A confiança de Hume no conhecimento claro e manifesto das operações simples da matemática, bem como na evidência do que aparece aos sentidos não nos per-
50
Flávio Miguel de Oliveira Zimmermann
mite considerá-lo cético de natureza pirrônica. Pois enquanto o pirrônico não ousa afirmar dogmaticamente que o que lhe aparece é verdadeiro,3 Hume não considera tarefa útil para a filosofia perguntar se há ou não corpos fora de nós (Hume 1978, p. 187). Gassendi, mesmo nas Dissertations (Gassendi 1959, p. 436, 498, 504) acredita na construção da ciência sobre as aparências externas dos fenômenos e na teoria da probabilidade. A questão que o incomoda diz respeito apenas à natureza das coisas. No Syntagma, considera uma bênção se, não podendo entrar nos “santuários internos da natureza”, puder ter acesso ao menos aos “altares externos” (Gassendi 1972, p. 327). O ceticismo moderado de Huet também não parte do princípio de que sejamos ignorantes de tudo, como se fôssemos “troncos de árvores” (Huet 1741, p. 204), mas que podemos nos guiar pela certeza soberana, donde podemos tirar as razões mais sólidas de que somos capazes, embora sem conhecer a verdade em seu estado puro por causa de nossa fraqueza natural (Huet 1741, p. 20–1). Hume era um apreciador da leitura de Huet e do ceticismo acadêmico. Na “carta de um cavalheiro a seu amigo em Edimburgo”, o autor fala dos céticos Sócrates e Cícero e comenta sobre Huet, o “erudito bispo de Avranches”, um celebrado religioso e um dos responsáveis pelo reaparecimento da doutrina dos céticos e pirrônicos, e nos “Diálogos sobre a religião natural”, Hume o considera um homem de vasta erudição que, além de ter escrito uma demonstração do cristianismo, compôs um tratado que incorpora todas as “astúcias do mais atrevido e deslavado pirronismo” (Hume 1993, p. 13). Embora panegírica, a interpretação de Hume parece levar em conta apenas o ceticismo de Huet contido na primeira parte do Traité, provavelmente para defenderse da acusação de seu próprio pirronismo, no caso da Letter, ou para polemizar com o seu adversário, no caso dos Dialogues, que aparece na fala de Cleanto. Nas seções V e XII da “Investigação”, Hume também adota a posição de cético mitigado e acadêmico, encontrando no academicismo uma filosofia que não se ajusta à paixão desordenada, às decisões apressadas e às afirmações dogmáticas. Este ceticismo atenuado é útil, modesto, reservado em suas opiniões e limitado aos assuntos que se adaptam ao entendimento humano, evitando o que é remoto e extraordinário. Suas dúvidas indiscriminadas são corrigidas pelo senso comum e reflexão, os preconceitos infundidos pela educação e opinião precipitada são ajustados pela mente e as exageradas pretensões e credulidade supersticiosa são contrárias às suas aspirações. A natureza é mais forte do que qualquer princípio, diz Hume, e nos impõe normas sobre seu próprio funcionamento, escondendo-nos, porém, a origem de suas operações. Se nos limitarmos ao que ela nos oferece, poderemos promover o avanço da nossa ciência. Ultrapassá-la não nos trará nenhuma vantagem. Esse empreendimento, atribuído ao cético extravagante, só se desenvolve nas escolas e em ambientes restritos, onde seus argumentos são difíceis ou impossíveis de se refutar ou devem ser encarados como simples passatempo aos que tendem a se ocupar dessa forma (Hume 1975, p. 159–60). O verdadeiro filósofo, por outro lado, é aquele que encontra tranqüilidade no ceticismo moderado (Hume 1978, p. 224), e não perde a esperança
Hume e os Acadêmicos Modernos
51
em encontrar a verdade, mesmo que esta se esconda em lugar muito profundo de nós (Hume 1975, p. 12). Com essa decisão, assemelha-se a Huet e Foucher, que admitem verdades convincentes ou prováveis acerca das aparências ou das conclusões racionais, embora reconheçam que as verdades necessárias acerca da natureza e da realidade continuem em questão. Mersenne, que julgou suficiente para nós conhecer as coisas do modo como nos são apresentadas, parece também ter se afastado tanto do cético pirrônico, que rejeita qualquer tipo de certeza, como também negou-se a resolver o problema com uma solução definitiva contra o cético. Este procedimento do ceticismo “atenuado” agradou, finalmente, a Gassendi, que decidiu tomar o caminho médio (via media) entre os céticos e dogmáticos, pois enquanto os primeiros pensam que nenhum critério pode ser aceito na investigação, os decorrentes deles não podem apresentar um critério apropriado para determinar tudo o que existe na natureza (Gassendi 1972, p. 326).
Referências Empiricus, S. 1976. Outlines of Pyrrhonism. Cambridge: The Loeb Cassical. V.1. Foucher, S. 1693. Dissertations sur la Recherche de la vérité, contenant l’histoire et les principes de la philosophie des académiciens. Paris: Royale. Gassendi, P. 1959. Dissertations en forme de paradoxes contre les aristotéliciens. Paris: J. Vrin. —–. 1972. The selected works of Pierre Gassendi. Edited and translated by Craig B. Brush. New York: Johnson Reprint Corp. Huet, P.-D. 1741. Traité Philosophique de la Foiblesse de l’Esprit Humain. Londres: J. Nourse. Hume, D. 1993. A letter from a gentleman to his friend in Edinburgh. 2. ed. Imprenta Indianapolis: Hackett Pub. Co. —–. 1978. A Treatise of Human Nature, Edit. Selby-Bigge, rev. P. H. Nidditch. Oxford: Clarendon. —–. 1993. Dialogues Concerning Natural Religion and the Natural History of Religion. Oxford: Oxford University Press. —–. 1975. Enquiries Concerning Human Understanding and Concerning the Principles of Morals. Edit. Selby-Bigge, rev. P. H. Nidditch. Oxford: Clarendon. Mersenne, M. 1625. La vérité des sciences contre les septiques ou Pyrrhoniens. Paris: Toussainct du Bray. Popkin, R. 2000. A História do Ceticismo de Erasmo a Espinosa. Trad. Danilo Marcondes de Souza Filho. Rio de Janeiro: Francisco Alves.
Notas 1 O termo deriva da academia de Platão, mas não resgataremos aqui suas origens e desdobramentos,
apenas lembrar que geralmente atribui-se a esta doutrina uma dúvida mais moderada do que a pirrônica, uma vez que seus defensores adotam o critério de verossimilhança e probabilidade para conduzir a investigação (desenvolvido principalmente por Arcesilau e Carnéades). Sobre a adoção do critério de probabilidade pelos acadêmicos ver por exemplo os “Acadêmicos” II, 32 de Cícero e Hipotiposes Pirrônicas I, 33 de Sexto Empírico.
52
Flávio Miguel de Oliveira Zimmermann
2 Gassendi era simpatizante da teoria atômica de Epicuro. Na física, explica que quando a luz passa por
um prisma, ela é refletida na proporção do número de átomos que encontra no vidro (conforme nota de Craig Brush). Para o caso da torre, a mesma explicação pode ser dada. 3 Ver cap. VII, “Does the Sceptic Dogmatize?”, do livro I de “Outlines of Pyrrhonism” de Sexto Empírico.
O F ISICALISMO DE N EURATH E OS L IMITES DO E MPIRISMO G ELSON L ISTON Universidade Estadual de Londrina/Fundação Araucária
gelson@uel.br
Introdução A posição fisicalista, falibilista e antifundacionalista de Neurath não é reducionista. Para ele, o importante é que a linguagem,1 na qual a ciência unificada é expressa, permita fazer predições sobre qualquer tipo de evento que ocorre na natureza (concepção enciclopédica da ciência unificada), sem, contudo, ter de ser reduzida a algum tipo de nível de objetos, por exemplo a objetos autopsicológicos ou físicos, como é o caso do sistema construcional fenomenalista / fisicalista de Carnap. Tampouco Neurath se refere a objetos no sentido carnapiano, pois o que realmente interessa, em seu modo de tratar a ciência unificada, são as leis que possibilitam predizer algum tipo de fenômeno cientificamente relevante. Apenas as predições devem ser redutíveis a enunciados2 de observação. Para Neurath, um sistema fundacionalista reducionista representa uma concepção pseudo-racionalista de ciência. Para ele, toda sentença observacional tem uma referência espaço-temporal e está sujeita à revisão. Com isso, Neurath se opõe à idéia de sentenças de grau zero que possam servir de fundamento para a ciência. Assim, podemos afirmar que Neurath antecipa a crítica de Quine ao dogma reducionista do empirismo, ou seja, sobre a redutibilidade do sistema carnapiano às sentenças protocolares, à teoria verificacionista do significado e à idéia de primazia epistêmica. Para Neurath, qualquer investigação empírica enfrenta o caos e a ordem. O objetivo é estabelecer algum tipo de ordem, mas não somente de fora, a partir de princípios a priori (lógica da ciência), tampouco a partir de um conjunto de enunciados com status epistemológico privilegiado. Diante da multiplicidade de possibilidades teóricas, as decisões práticas são fundamentais, e elas não podem ser justificadas por razões lógicas. A racionalidade científica, se houver, deve ser demonstrada pela própria prática científica. Contamos com o conhecimento passado como instrumento de investigação, dependente de condições históricas e sociais (cf. Neurath 1930, p. 46). Enfim, de acordo com nossa leitura, Neurath antecipou muitas das críticas ao positivismo lógico, que posteriormente tornaram-se mais e mais contundentes. Deste modo, seu holismo fisicalista representa a autocrítica do positivismo lógico, um conflito travado contra uma perspectiva de reconstrução lógica fundacionalista do conhecimento científico. Se a unidade fisicalista for alcançada de forma bem sucedida, então podemos afirmar que encontramos correlações funcionais entre leis e fenômenos em estruturas no espaço e no tempo.3 Criar condições para a unificação da ciência, com todas as suas leis, é a tarefa da concepção científica do mundo. Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 53–67.
54
Gelson Liston
Um sistema de leis, a partir do qual eventos ou processos são deduzidos, em outros termos, a ciência unificada, pode ser total ou parcialmente modificada quando os resultados obtidos forem contraditos pela experiência ou observação. (. . . ) Em um sentido, a ciência unificada é física em seus mais amplos aspectos; uma malha de leis que expressam suas conexões espaço-temporais, nós a chamamos: Fisicalismo. (Neurath 1931a, p. 49)
A partir da possibilidade de fazer predições sobre estados de coisas testáveis, a ciência empírica pode ser caracterizada e chamada de ciência unificada. As predições são enunciados sobre objetos espaço-temporais. Por esse motivo, Neurath chama de unidade fisicalista da ciência (cf. Neurath 1931c, p. 325). Deste modo, o fisicalismo de Neurath não mantém a tese reducionista de que todos os enunciados científicos podem e devem ser reduzidos (traduzidos) em enunciados fisicalistas, mas que tais enunciados permitem um controle espaço-temporal sistemático através da observação e de articulações lógicas. Os enunciados que não permitem tal controle são metafísicos. Para os que mantêm uma atitude científica, todos os enunciados significam predições; todos os enunciados repousam em um plano individual, e podem ser combinados como partes que compõem uma máquina. O fisicalismo não reconhece ‘profundidades’; tudo está na superfície. (Neurath 1931c, p. 326)
O modo pelo qual Neurath pensa a unidade lingüística da ciência unificada sem reducionismo é sustentado pela idéia de que não é necessária, e tampouco possível, a redução dos sistemas de leis a uma única linguagem tida como ideal, no caso, a linguagem fisicalista, mas que esta linguagem sirva para fazer predições sobre qualquer evento (científico) da natureza. Para Neurath, a linguagem fisicalista da ciência unificada não está divorciada da linguagem ordinária. Não podemos contar com uma linguagem ideal, mas podemos trabalhar na ‘purificação’ da linguagem ordinária, eliminando gradualmente os componentes metafísicos, mesmo sabendo que “conglomerações lingüísticas vagas sempre permanecem de um modo ou de outro como componentes do barco”. Também podemos entender a metáfora náutica de Neurath como uma crítica à idéia de conhecimento científico enquanto um sistema ideal, completo e auto-suficiente (cf. 1959a, p. 201). O que esses sistemas de leis, de diversas áreas, têm em comum é uma espécie de jargão universal [universal slang] que possibilita a comunicação, sem a necessidade de tradução, mesmo que qualquer termo da linguagem ordinária fisicalista possa ser substituído por termos da linguagem da ciência avançada, e esta, por sua vez, possa ser formulada, ou explicada com o auxílio da outra. No jargão universal, não existem sentenças irrevisáveis. A criação de um jargão universal é uma das tarefas da ciência unificada, e nisso Neurath reconhece o valor do trabalho de Carnap na construção da sintaxe lógica da linguagem, mas defende que a linguagem unificada deva acompanhar o constante desenvolvimento da ciência, sendo, portanto, não apenas sintática, mas também pragmática, ou seja, devido ao seu caráter histórico, a linguagem está sujeita a
O Fisicalismo de Neurath e os Limites do Empirismo
55
mudanças. Deste modo, os enunciados protocolares, no que se refere à possibilidade de revisão, estão na mesma situação dos demais enunciados científicos. Os enunciados protocolares possuem grande estabilidade, mas são sempre passíveis de revisão. Quanto à análise lógica, devemos reconhecer o seu valor na construção de um framework mais consistente para as ciências, e isso facilita a unificação; a análise lógica torna o jargão universal mais efetivo. Contudo, a análise lógica não é suficiente na construção de qualquer sistema, tampouco na delimitação precisa entre ciência e metafísica (cf. Cirera 1994, p. 143–4). Com isso, Neurath apresenta sua posição em relação à linguagem fisicalista e aos fundamentos da ciência unificada, com a tese de que não há nada que possa gozar de uma posição absoluta e conclusiva, pois qualquer enunciado, mesmo as sentenças protocolares, que são sentenças factuais como quaisquer outras, é passível de revisão. Esta parece ser a mensagem de Neurath em sua famosa metáfora do barco e evidencia sua oposição à postura de Carnap em relação aos enunciados protocolares, que, segundo este, não requerem verificação (isso já em sua fase fisicalista). Sobre esta questão, Neurath (1959a, p. 203) afirma que “qualquer lei e qualquer sentença fisicalista da ciência unificada ou de uma de suas subciências está sujeita a mudanças. E o mesmo se mantém para as sentenças protocolares”. A tarefa da ciência unificada é estabelecer correlações entre as leis de diversas áreas a fim de alcançar predições bem sucedidas. Quanto mais bem sucedido for o estabelecimento destas correlações, maior será a capacidade preditiva da ciência. Isto é o que justifica, na prática, o interesse na ciência unificada. Certamente, uma variedade de leis pode ser diferenciada uma das outras: por exemplo, leis químicas, biológicas ou sociológicas. Entretanto, não se pode afirmar que uma predição de um processo individual concreto depende apenas de um tipo definido de leis. (Neurath 1931d, p. 66)
Assim, uma das tarefas da concepção científica do mundo, além da eliminação gradual dos elementos metafísicos, é criar condições favoráveis para a efetivação de um sistema fisicalista unificador, no qual apenas eventos espaço-temporalmente controlados pelo sucesso preditivo sejam cientificamente considerados. Um enunciado é científico se for a descrição de um evento com tais características. Assim, “o fisicalismo é a unidade da ciência” (1931c, p. 361). De acordo com esta concepção, Neurath tenta mostrar que a eliminação da metafísica não se dá por uma questão de significado, mas como resultado de uma decisão: a decisão de aceitar a tese fisicalista — a tese da unidade da ciência (cf. Cirera 1994, p. 119). Segundo Cirera, a decisão de adotar o fisicalismo se justifica mediante o objetivo de construção da ciência unificada, cuja expressão deve ser entendida em dois sentidos: De um lado, defender a ciência unificada é simplesmente defender a tese do fisicalismo, ou seja, a ciência está unificada de tal forma que tudo pode ser expresso em uma linguagem única, a linguagem da física. (. . . ) Por outro lado, a ciência unificada é vista enquanto uma tarefa a ser construída, uma atividade de transformação social e de realização científica cooperativa. (1994, p. 119)
Gelson Liston
56
A Enciclopédia Internacional da Ciência Unificada foi, de acordo com o segundo sentido, uma tentativa de realização deste objetivo por meio de um processo constante de educação científica.
1. O Coerentismo de Neurath Neurath entende que a ciência unificada deva ser construída em um sistema consistente de protocolos e leis. Esta é a posição coerentista que ele assume para seu sistema, de modo que a verdade ou falsidade de uma sentença se torne apenas uma questão de expediente. Na ciência unificada, tentamos construir um sistema não-contraditório de sentenças protocolares e não-protocolares (inclusive as leis). Quando uma nova sentença nos é apresentada, nós a comparamos com o sistema que dispomos, e determinamos se ela entra ou não em conflito com este sistema. Se a sentença conflitar com o sistema, podemos rejeitá-la como desnecessária (ou falsa) (. . . ). Por outro lado, alguém pode aceitá-la e mudar o sistema de modo que este permaneça consistente após sua inclusão. A sentença pode então ser chamada “verdadeira”. (Neurath 1959a, p. 203)
Entretanto, a decisão de aceitar o novo enunciado, rejeitando o sistema, é, para Neurath (1931, p. 53), mais difícil e não pode ser tomada sem uma certa hesitação. Mas “não há outro conceito de ‘verdade’ para a ciência”. “A definição ‘correto’ e ‘incorreto’ aqui proposta, abandona a definição usualmente aceita no Círculo de Viena que recorre a ‘significado’ e ‘verificação’” (Neurath 1931d, p. 66). Oberdan (1996, p. 269) apresenta o fisicalismo como uma oposição oficial de Neurath, Carnap e Hempel à epistemologia fundacionalista e à teoria correspondentista da verdade do Círculo de Viena (Schlick, Waismann, Wittgenstein). Assim, o fisicalismo propõe o falibilismo, e este se apresenta como uma concepção oposta ao fundacionalismo e ao correspondentismo. Sobre isso, dois comentários devem ser feitos, no que diz respeito à posição de Carnap: a) a posição fisicalista inicial (1932) é fundacionalista; além disso, o fisicalismo é uma possibilidade alternativa do sistema construcional desenvolvido no Aufbau; b) o correspondentismo nunca foi abandonado. Bem, se com Neurath podemos afirmar que nenhuma sentença dispõe de uma posição definitiva na ciência unificada, também podemos, de igual modo, afirmar que qualquer sentença pode ser acomodada a algum sistema da ciência unificada. Este sistema, assim como uma máquina, para lembrarmos de outra metáfora de Neurath, pode ser reconstruído e cientificamente justificado.4 Tais sentenças são comparadas entre si em um sistema previamente aceito, e afirmar que uma nova sentença é correta significa dizer que tal sentença pode ser incorporada na totalidade desse sistema sem gerar conflito (inconsistência) (cf. 1959b, p. 291). Todavia, temos aqui uma posição de Neurath que nos parece intrigante, na medida em que ela sugere que a ciência unificada estaria fundamentada numa teoria coerentista em que a verdade
O Fisicalismo de Neurath e os Limites do Empirismo
57
confunde-se com a aceitabilidade de um determinado sistema, tornando difícil a defesa do próprio empirismo. Na verdade, a posição de Neurath pode ser vista como uma autocrítica ao empirismo, pois a relação entre enunciados e fatos implica uma concepção metafísica, embora a teoria correspondentista não implique, necessariamente, este tipo de relação, pois quando Carnap se refere ao conteúdo objetivo das sentenças sintéticas, enfatizando seu caráter não-convencional, e menciona a importância da primeira operação no teste de enunciados sintéticos, ele fala da confrontação entre enunciados e observações factuais. Neurath expressa sua crítica do seguinte modo: Enunciados são comparados com enunciados, não com ‘experiências’, nem com o ‘mundo’, nem com qualquer outra coisa. Todas essas duplicações sem sentido pertencem, mais ou menos, a uma metafísica refinada e, portanto, devem ser rejeitadas. Cada novo enunciado é confrontado com a totalidade dos enunciados existentes que, até o momento, estão harmonizados uns com os outros. Um enunciado é chamado correto, se ele puder ser incorporado nesta totalidade. Se não puder ser incorporado, é rejeitado como incorreto. (Neurath 1931d, p. 66)
A concepção anticorrespondentista de Neurath nos deixa uma outra questão: que razões teríamos para revisar um sistema e então aceitar uma nova sentença como verdadeira ou correta? As razões parecem ser apenas de ordem pragmática ou instrumental: aumentar o poder preditivo do sistema. Assim, o objetivo é alcançar um sistema autoconsistente que seja um instrumento para fazer predições bem sucedidas (cf. 1959b, p. 286). Portanto, o coerentismo não é apenas consistência interna (lógica), mas também capacidade preditiva (empírica). O que, de fato, resta de problemático é o critério a ser utilizado para a escolha de um determinado sistema ou, ainda, de uma determinada sentença que não seja circular: utilizar a noção de verdade (correção) para definir a coerência, e a noção de coerência para definir a de verdade. O que nos parece é que algum tipo de recurso externo (correspondência) tem que ser admitido. Este problema surge não pelo fato de Neurath ser um coerentista, mas por defender uma posição anticorrespondentista. Em nossa análise, uma posição não exclui, necessariamente, a outra. Podemos, por exemplo, afirmar, sem problemas, que Carnap defende o correspondentismo, sem ser um anticoerentista. Estamos pressupondo, com base num questionamento de Susan Haack,5 que uma teoria (coerentista/correspondentista) não exclui, necessariamente, a outra. O ponto interessante deste raciocínio é a crítica de Neurath ao atomismo lógico6 e à idéia de uma linguagem ideal que, de certa forma, está relacionada com a teoria correspondentista. Além disso, não podemos testar uma sentença isoladamente, porquanto que não é possível confrontar uma sentença com algum fato. Isto se deve basicamente à complexidade dos fenômenos e à dependência teórica da experiência. Contudo, não se resolve tal problema afirmando que a verdade de uma sentença depende da verdade (consistência) das demais, em um sistema organizado.
Gelson Liston
58
Ao comentar sobre os trabalhos de Neurath, Uebel vê nestes uma antecipação da epistemologia naturalizada muito mais do que uma forma de coerentismo (relacionado, principalmente, com a metáfora do barco). A posição de Uebel (1992, p. 304) é a de que Neurath rejeita a teoria correspondentista da verdade; mas, ao invés de propor uma teoria alternativa da verdade, ele teria encaminhado o debate para uma teoria da aceitação. Como Neurath identifica a aceitação de um sistema, ou de um enunciado, a partir da noção de verdade como ausência de contradição, então não vemos problemas em identificar a aceitação com a coerência. Contudo, precisamos nos posicionar sobre a teoria coerentista de Neurath a fim de saber se esta é uma teoria definicional ou criterial da verdade para, então, podermos manter a posição de que o coerentismo de Neurath é, sim, uma teoria da verdade, uma teoria alternativa ao correspondentismo. Uma definição de verdade apresenta o significado do termo ‘verdadeiro’. Um critério de verdade apresenta um teste por meio do qual podemos afirmar se um enunciado é ‘verdadeiro’ ou ‘falso’. A questão que nos preocupa neste momento é saber se a teoria coerentista de Neurath é criterial ou definicional. Como Neurath faz referência à aceitação ou rejeição de um enunciado tendo como referência (também poderíamos dizer teste) a consistência7 deste com um sistema previamente aceito, estamos inclinados a afirmar que seu coerentismo é criterial, já que a relação entre enunciados é um teste que incide na aceitação ou rejeição de enunciados, ou do próprio sistema.
2. Os Limites do Convencionalismo Desta forma, estaria Neurath se distanciando da epistemologia enquanto justificação das cognições, ou propondo uma alternativa ao fundacionalismo, afirmando que os enunciados protocolares são falíveis como quaisquer outros enunciados científicos e que, portanto, a coerência do sistema torna-se a base de escolha para a aceitação ou não de novos enunciados? Esta, por exemplo, é a posição de Schlick (1934, p. 69), que, ao discutir a questão do critério de verdade como o problema do fundamento de todo o conhecimento, reconhece (e critica) em Neurath a teoria coerentista da verdade: A introdução do termo “enunciados factuais” certamente ocorreu, de início, com a intenção de designar com ele certas proposições, à luz de cuja verdade — à guisa de critério — se possa aferir a verdade de todas as outras afirmações. Segundo opinião descrita, ter-se-ia constatado que este critério é tão relativo como todos os critérios da física. E essa opinião, justamente com suas conseqüências, tem sido exaltada como abolição do último resíduo de “absolutismo” nos arraiais da filosofia. Que critérios nos restam então para discernir a verdade? Uma vez que não pode ocorrer que todas as afirmações da ciência devam orientar-se segundo enunciados factuais bem determinados, mas antes deve ser assim que todas as proposições devem orientar-se segundo todas — sendo que cada uma delas é considerada em princípio como reformável —, segue-se que a verdade só pode consistir na concordância das proposições entre si.
O Fisicalismo de Neurath e os Limites do Empirismo
59
Esta doutrina — que é, por exemplo, explicitamente formulada por O. Neurath no mencionado contexto — é suficientemente conhecida na história da filosofia recente. Na Inglaterra, costuma-se designar a mencionada tese como “coherence theory of truth”, sendo contraposta à “correspondence theory”, mais antiga, impondo-se observar que o termo teoria é aqui inadequado, pois observações sobre a natureza da verdade têm um caráter inteiramente distinto de teorias científicas, que sempre se compõem de um sistema de hipóteses. A oposição entre as duas teses mencionadas é, via de regra, concebida nos seguintes termos: segundo uma delas, a tradicional, a verdade de uma proposição consiste na sua conformidade com os fatos, ao passo que, segundo a outra — a doutrina do “contexto” -, a verdade reside na concordância da proposição com o sistema dos demais enunciados.
A posição de Schlick é contrária à posição de Neurath em relação aos sistemas sintéticos que, segundo ele, além da coerência interna, necessitam da “coerência com afirmações bem específicas e especiais”, pois “quem toma a sério a coerência como único critério da verdade, deve considerar as lendas poéticas tão verdadeiras quanto um relato histórico ou as proposições de um manual de química8 ” (1934, p. 70–1). Contudo, a crítica de Neurath à teoria correspondentista aponta para o fato de que não apenas essa relação entre linguagem e mundo não é possível, assim como o conhecimento não pode ter como base percepções subjetivas, ou uma linguagem fenomenológica. Para Neurath, só há uma linguagem para a ciência unificada, e “essa linguagem reconhece apenas enunciados com dados espaço-temporais definidos”. “A comparação de enunciados com outras entidades é metafísica” (1931, p. 54–5) (cf. 1959b, p. 291). Segundo Rutte (1991, p. 176), Neurath duvida da possibilidade de um conhecimento imediato, pois “ele dá a impressão de pensar que o conhecimento sempre tem o caráter de enunciados, e enunciados nunca são imediatos, mas implicam hipóteses e teorias de todo o tipo. Percepções não podem servir como uma ponte para esta comparação”. De acordo com essa posição, não há observação neutra,9 pois todas as sentenças de observação estão teoricamente contaminadas. Embora Schlick aceite que todas as proposições da ciência não passam de hipóteses com relação ao valor de verdade, de modo que o fundamento inabalável do conhecimento não pode ser afirmado, ele reconhece a necessidade de pontos de referência, dados pelas constatações (afirmações empíricas), a partir dos quais o conhecimento é estruturado e confrontado. São as constatações, observações privadas, imediatas e, portanto, estritamente irrevisáveis, que possibilitam o contato, por assim dizer, entre proposições e realidade, sendo, desse modo, as únicas proposições sintéticas que não são hipóteses por não fazerem parte do sistema científico de linguagem, ocupando, portanto, algum tipo de status privilegiado. Schlick defende a possibilidade de comparar proposições com fatos (entidades não-lingüísticas) em seu conhecido exemplo da catedral; para comparar o enunciado ‘Esta catedral tem duas torres’, com a ‘realidade’, basta olhar para a catedral. Segundo Schlick, essa comparação é suficiente para o convencimento de que o enunciado é
60
Gelson Liston
verdadeiro ou falso e que não há nem um envolvimento metafísico neste processo de conhecimento. Portanto, Schlick aceita a crítica, mas se defende do comprometimento metafísico: “eu tenho comparado proposições com fatos; deste modo, não tenho nenhuma razão para afirmar que isso não possa ser feito”. Schlick apresenta o exemplo da catedral e conclui: “certamente, você não pode afirmar que este é um processo impossível e que há uma detestável metafísica nele envolvida” (“Facts and Proposition”[1935], Philosophical Papers, vol. 2, p. 400), in Coffa 1995, p. 369. Para Schlick, essa posição representa uma forma de assegurar a função da experiência no conhecimento científico, enquanto que o coerentismo de Neurath representa o abandonando do empirismo e a relativização do conceito de verdade, rumo a um convencionalismo sem limites. Mesmo que problemática e aparentemente contraditória, a posição de Schlick sobre a relação entre enunciados e fatos tem uma importância fundamental nessa discussão, por evidenciar a função da experiência na aceitação de enunciados científicos, pois não apenas Neurath, mas também Carnap, em sua fase sintática, não discutem claramente esta questão. No caso de Carnap, trata-se da identificação da filosofia da ciência com a sintaxe lógica e da distinção entre o modo material e o modo formal de falar (cf. Carnap, The Logical Syntax of Language (1934)). No modo formal de falar, que é o mais correto, a ‘verdade’ é sintática, não semântica. Posteriormente ele reconhece esta limitação e inclui a pragmática e a semântica, possibilitando uma melhor análise dos conceitos de ‘verdade’ e ‘confirmação’. O conceito ‘verdade’ é interpretado de forma atemporal, enquanto que o conceito ‘confirmação’ pode ter duas interpretações: uma interpretação pragmática, que define o grau de confirmação de um enunciado com base na observação que é, portanto, temporal; e uma interpretação semântica, que define a confirmação de um enunciado em relação a outros enunciados de evidência, sendo, deste modo, atemporal (cf. Carnap 1949, p. 119). Uma das preocupações de Schlick era que o convencionalismo da base empírica, aliado a uma teoria coerentista da verdade, levasse a uma posição relativista. Para Karl Popper, a teoria coerentista de Neurath implica um falibilismo holístico sem limites, representando, portanto, um perigo para o empirismo. Popper, também um defensor do falibilismo metodológico, restringe o convencionalismo apenas à base empírica, e não ao sistema teórico como um todo: A doutrina de Neurath, de acordo com a qual as sentenças protocolares não são invioláveis, corresponde, a meu ver, a notável avanço. Contudo, desconsidera a substituição das percepções por enunciados-percepção, - mera tradução para o modo formal de expressão — a doutrina de que as sentenças protocolares admitem revisão é seu único progresso relativamente à teoria (de Fries) acerca da imediatidade do conhecimento perceptivo.10 Trata-se de um passo na direção certa; mas que a nada conduz, se não for acompanhado de outro passo: faz-se necessário um conjunto de regras para limitar a arbitrariedade na “rejeição” (ou “aceitação”) de uma sentença protocolar. Neurath não nos apresenta essas regras e, assim, involuntariamente, compromete o empirismo. Com efeito, sem essas regras, os enunciados empíricos deixam de ser distinguíveis de qualquer outra
O Fisicalismo de Neurath e os Limites do Empirismo
61
espécie de enunciado. Se a todos se permitir (como se permite, segundo Neurath) simplesmente “rejeitar” uma sentença protocolar que se mostre inconveniente, qualquer sistema torna-se defensável. Dessa maneira torna-se possível salvar qualquer sistema, à semelhança do convencionalismo. (. . . ) Neurath evita uma forma de dogmatismo; porém abre caminho para que qualquer sistema arbitrário tenha pretensões a “Ciência empírica”. (Popper 1972, p. 103–4)
A crítica de Popper à falta de limites do convencionalismo, devastadora em intenção, esclarece a diferença de sua posição convencionalista para a posição holística de Neurath, mas não deixa de ser problemática do ponto de vista puramente lógico, pois a base de teste de uma teoria é convencional e, portanto, são as convenções que decidem a escolha entre sistemas teóricos. Além disso, devemos mencionar a importância que Neurath atribui ao sucesso preditivo,11 de modo que seu convencionalismo é limitado pela prática científica, e não por uma atitude irresponsável e arbitrária da consistência pela consistência. O objetivo pragmático da investigação científica exige que um sistema (empírico), além de ser consistente, seja um instrumento de predições bem sucedidas (relação inferencial do coerentismo), e estas predições podem então ser testadas por outros enunciados de observação (cf. Neurath 1931b, p. 53 e 1935b, pp. 116–7). Para Neurath (1959b, p. 285), “a possibilidade da ciência é demonstrada pela existência da ciência. (. . . ) O sistema da ciência unificada é utilizado para fazer predições bem sucedidas”. Sobre isso, uma reflexão de Neurath, analisando algumas dificuldades na formulação de predições em sociologia, pode nos auxiliar na compreensão deste caso, atenuando a crítica. É evidente que não contamos com um modelo de predição ideal para uma ciência como a sociologia, mas também não podemos comparála a uma ficção metafísica nos moldes do demônio de Laplace, pelo simples fato de que uma ficção não está, em princípio, sujeita a qualquer teste empírico, tampouco é abrangente (cf. Neurath, in Cohen 1973, p. 404). Dentre as dificuldades de predições nas ciências sociais, está o fato de que elas podem alterar o comportamento social, dificultando o controle. Um exemplo citado por Neurath são as predições na política econômica, que podem alterar o comportamento do mercado. Isso não acontece em ciências como a física e a química. Estas dificuldades, porém, não impedem a construção de explicações científicas. Todavia, certas regularidades (constantes, ou freqüentes) observadas estão envolvidas. Mesmo que a incerteza seja uma característica das explicações científicas, ela é muito mais acentuada no caso das ciências humanas. Neste ponto, Neurath e Carnap estão de acordo que as diferenças entre as ciências (ou ramos da ciência) expressam apenas um grau de dificuldade que, de modo algum, impede a aplicação do método experimental. O mesmo, por exemplo, acontece, embora por razões diferentes, com a astronomia. Além disso, a coerência exigida por Neurath não está restrita aos enunciados teóricos; ela implica também os enunciados protocolares hipoteticamente aceitos.
62
Gelson Liston
Em sua resposta, Neurath (1934) reafirma a posição falibilista de que todos os enunciados empíricos são selecionados convencionalmente e que, em princípio, podem ser alterados. Aceitar isso não implica um relativismo radical, como afirmam Russell (1995, p. 148) e Schlick (1934, p. 71), nem o abandono do empirismo, seguindo a crítica de Popper. Simplesmente não podemos identificar decisões metodológicas com decisões arbitrárias. Se aceitarmos tal identificação em Neurath, então todo o projeto de unificação da ciência está comprometido. E mais, seria um completo contra-senso o constante uso que Neurath faz da expressão ‘empirismo científico’ ou ‘racionalismo empírico’, referindo-se a um novo sistema, com pretensões de unidade científica, ou seja, que tipo de unidade científica teríamos se cada pesquisador, em sua área de atuação, arbitrasse as regras de cientificidade? Com isso, Neurath critica a posição de Schlick sobre a possibilidade das constatações por se tratar de metafísica. Sobre a falta de um critério empírico de decisão entre sistemas de enunciados, Neurath afirma que Schlick não deu a devida atenção aos enunciados protocolares fisicalistas, com localização espaço-temporal, e a função destes enquanto ‘enunciados de controle’ (os enunciados protocolares funcionam como enunciados de teste para um determinado sistema (cf. Neurath 1935b, p. 123) e são enunciados de grande estabilidade (cf. Neurath 1936e, p. 164)). Sobre tais enunciados, Neurath (1936d, p. 151) afirma: “aumentamos a estabilidade de nossos enunciados de controle, quando, em última instância, nos referimos a ‘enunciados de observação”’. A questão é que Schlick não aceita a proposta de confrontar enunciados com enunciados (ademais, as constatações são enunciados de observação sacrossantos. Mas é possível, na ciência empírica, estabelecer a verdade objetiva de algum enunciado científico, sem a referência de uma estrutura lingüística?). O mesmo vale para a crítica de Russell de que a proposta de Neurath significaria o completo abandono do empirismo, uma vez que a verdade poderia ser determinada pela polícia: Afirmar: “A é um fato empírico” é, de acordo com Neurath e Hempel, dizer: “a proposição ‘A ocorre’ é consistente com um certo conjunto de proposições aceitas”. Em um círculo cultural diferente, outro conjunto de proposições pode ser aceito; devido a este fato, Neurath está exilado. Ele percebe que a vida prática logo será reduzida à ambigüidades, e que nós podemos ser influenciados pela opinião de nossos vizinhos. Em outros termos, verdades empíricas podem ser determinadas pela polícia. Esta doutrina, de forma evidente, representa o completo abandono do empirismo. Portanto, a verdadeira essência é que apenas as experiências podem determinar a verdade ou falsidade das proposições não-tautológicas. (Russell 1995, p. 148)
Para Russell, enunciados protocolares (proposições básicas) “são subclasses de premissas epistemológicas, causadas, tão imediatamente quanto possível, por experiências perceptivas” (Russell 1995, p. 137). Tais enunciados são conhecidos, independentemente de qualquer inferência feita a partir de outros enunciados. De acordo com Russell (1995 p. 138), um enunciado protocolar possui duas propriedades fundamentais:
O Fisicalismo de Neurath e os Limites do Empirismo
63
(1) Ele deve ser causado por alguma ocorrência sensível; (2) Ele deve ser de tal forma que nenhum outro enunciado básico possa contradizêlo. Segundo Russell, estes enunciados — e aqui se localiza o ponto de desacordo com a posição holista falibilista de Neurath — encontram na percepção imediata a evidência de que são verdadeiros. Além disso, para Russell, não há como construir conhecimento empírico a partir de uma construção lingüística auto-suficiente. Discorda, portanto, da tese central de Neurath de que ‘enunciados são comparados com enunciados, não com a experiência’. Na tentativa de evitar uma metafísica perniciosa, a teoria de Neurath torna-se ultra-empírica (Russell 1995, p. 149). Em outro artigo (1936d), Neurath novamente critica as posições de Schlick e Popper, e o mesmo vale para Russell. Nunca podemos afirmar que certas fórmulas são ‘inabaláveis’, ‘definitivamente livres de contradições’, ‘absolutamente verdadeiras’, nem que são ‘aproximações’ gradativas, como se houvesse algo determinado ou determinável. (Neurath 1936d, p. 145)
Assim como Schlick, Carnap também defende que a coerência, embora necessária, não é suficiente para um sistema que pretende qualquer tipo de conhecimento a posteriori; pois, do ponto de vista formal, não há qualquer diferença entre um sistema científico e um conto de fadas. Contudo, a discussão sobre protocolos e definição de verdade na década de 30 representa a disputa entre a epistemologia falibilista de Neurath e Carnap12 e a epistemologia fundacionalista de Schlick. No caso de Carnap, é importante notar a influência da análise metalingüística, transformando os problemas filosóficos em questões de linguagem e, no caso das sentenças básicas, em questões sintáticas sobre a função epistemológica. Portanto, temos uma alteração da concepção carnapiana, motivada pela aplicação do princípio de tolerância na análise dos enunciados protocolares. Este processo representa o abandono das pretensões de construir o conhecimento sobre uma base segura e incorrigível, rumo a uma interpretação falibilista e anti-fundacionalista do conhecimento em todo seu processo.
3. Conclusão Na visão de Neurath, na ciência unificada, o que há de mais importante são as leis e a utilização que fazemos delas para predições de eventos. Deste modo, num sistema consistente, assim concebido, todas as leis podem, sob certas circunstâncias, manter relações entre si, possibilitando predições bem sucedidas por meio de induções fisicalistas. É esta correlação de um sistema unificado de leis com eventos físicos que define o fisicalismo (cf. 1959b, p. 286). Assim, os diferentes ramos da ciência compartilham de um mesmo método, de observação e experimento, sem um acesso epistemológico privilegiado.
64
Gelson Liston
Se algo pode ser expresso em uma estrutura espaço-temporal, então há a possibilidade de predição e controle científico. Essa é a idéia de uma concepção científica do mundo. É dessa forma, segundo Neurath, que devemos entender não só as ciências naturais, mas também as ciências humanas. Para isso, é fundamental assumirmos a tese de que todo nosso conhecimento está sujeito a erros. Contamos apenas com hipóteses cuja variação de controle se resume a uma questão de grau. Assim, podemos integrar os vários ramos da ciência, sem o ideal de uma unificação por redução e sem o abandono do empirismo. Neurath defende a unidade da ciência enquanto um trabalho cooperativo que se desenvolve gradualmente, aumentando a integração13 na busca de melhores resultados para a ciência e, conseqüentemente, para a vida. O que possibilita a integração entre as ciências (disciplinas) é o uso de uma linguagem científica universal. Desta forma, Neurath afirma a importância da unificação da ciência enquanto uma atitude científica universal capaz de reunir diversas áreas do conhecimento científico a partir de uma posição empírica, com o auxílio formal da análise lógica da linguagem científica.14 Essa atitude, que envolve conteúdo empírico e conexões lógicas consistentes, promovendo a integração das ciências, é o objetivo da ciência unificada. As dificuldades de análise conceitual, incluindo diferentes ramos da ciência, ou mesmo no interior de uma determinada ciência, serão superadas pela unificação da linguagem científica, a base da ciência unificada. Mesmo que dificuldades dessa natureza sempre apareçam, o importante é manter uma atitude científica crítica, mas tolerante; pois, afirma Neurath (1938, p. 23), “questões abertas e incompletas surgem em todas as partes deste trabalho, mas o enciclopedismo mantém, todavia, que a integração das ciências é uma parte inevitável da atividade científica humana”. Assim, a Enciclopédia Internacional da Ciência Unificada estabelece seus objetivos com base na cooperação científica, tendo como fundamento o empirismo científico e a unidade metodológica. Deste modo, as dificuldades que surgem devido a um número cada vez maior de especializações em determinados ramos da atividade científica podem ser minimizadas e, de certa forma, superadas, sem, contudo, a exigência de uma tradução radical, difícil e desnecessária, pois a base lingüística é fisicalista, e esta, por sua vez, é suficiente para promover a integração do conhecimento científico.
Referências Bibliográficas Ayer, A. J. 1952. Language, Truth and Logic. New York: Dover Publication. —–. 1959. Logical Positivism. New York: The Free Press. —–. 1959a. Editor’s Introduction. In: Ayer 1959. —–. 1959b. Verification and Experience. In: Ayer 1959. Carnap, R. 1932. The Unity of Science. Bristol: Thoemmes Press. —–. 1932a. On Protocol Sentences. Noús 21 (1987): 457–70.
O Fisicalismo de Neurath e os Limites do Empirismo
65
—–. 1949 [1936]. Truth and Confirmation. In: Feigl, H. and Sellars, W. (eds.): Reading in Philosophical Analysis. New York: Appleton-Century-Crofts. —–. 1934. The Logical Syntax of Language. New Jersey: Littlefield, Adams & Company. Cirera, R. 1994. Carnap and the Vienna Circle: Empiricism and Logical Syntax. Amsterdam, Atlanta: Rodopi. Coffa, J. A. 1995. The Semantic Tradition from Kant to Carnap. Cambridge: Cambridge University. Cohen, R. S. and Neurath, M. (eds.) 1973. Empiricism and Sociology. Boston: D. Reidel Publishing Company. Giere, R. N. and Richardson, A. W. (eds.) 1996. Origins of Logical Empiricism. Minnesota Studies in the Philosophy of Science. Minneapolis: University of Minnesota Press. Haack, S. 1995. Evidence and Inquiry. Oxford: Blackwell. —–. 1998. Filosofia das Lógicas. São Paulo: Unesp. Kornblith, H. (org.) 1994a. Naturalizing Epistemology. Cambridge, Massachusetts: The MIT Press. Neurath, O. 1973. On The Psychology of Decision. In: Neurath 1983. —–. 1916. On The Classification of Systems of Hypotheses. In: Neurath 1983. —–. 1930. Ways of The Scientific World-Conception. In: Neurath 1983. —–. 1931a. Physicalism: The Philosophy of The Viennese Circle. In: Neurath 1983. —–. 1931b. Physicalism. In: Neurath 1983. —–. 1931c. Empirical Sociology. In: Neurath 1973. —–. 1931d. Sociology in The Framework of Physicalism. In: Neurath 1983. —–. 1934. “Radical Physicalism and The ‘Real World”’. In: Neurath 1983. —–. 1935a. Pseudorationalism of Falsification. In: Neurath 1983. —–. 1935b. The Unity of Science as a Task. In: Neurath 1983. —–. 1936a. Individual Science, Unified Science, Pseudorationalism. In: Neurath 1983. —–. 1936c. An International Encyclopedia of Unified Science. In: Neurath 1983. —–. 1936d. Encyclopedia as ‘Model’. In: Neurath 1983. —–. 1936e. Physicalism and The Investigation of Knowledge. In: Neurath 1983. —–. 1937b. Unified Science and Its Encyclopedia. In: Neurath 1983. —–. 1937e. The New Encyclopedia of Scientific Empiricism. In: Neurath 1983. —–. 1937/38a. The Departmentalization of Unified Science. In: Neurath 1983. —–. 1939/40. The Social Science and Unified Science. In: Neurath 1983. —–. 1941. Universal Jargon and Terminology. In: Neurath 1983. —–. 1946a. The Orchestration of Science by The Encyclopedism of Logical Empiricism. In: Neurath 1983. —–. 1946b. ‘Prediction and Induction. In: Neurath 1983. —–. 1959a. Protocol Sentences. In.: Ayer 1959. —–. 1959b. “Sociology and Physicalism”. In: Ayer 1959. —–. 1931. Physicalism. In: Sarkar 1996. —–. 1938. Unified Science as Encyclopedic Integration. In: International Encyclopedia of Unified Science. Chicago: University of Chicago. —–. 1973. Empiricism And Sociology. Ed. by Robert S. Cohen & Marie Neurath, (Vienna Circle Collection, vol. 1). Dordrecht: Reidel. —–. Philosophical Papers 1913-1946. Ed. and transl. by Robert S. Cohen & Marie Neurath, (Vienna Circle Collection vol. 16). Dordrecht: Reidel, 1983. Oberdan, T. 1993. Protocols, Truth and Convention. Amsterdam, Atlanta: Editions Rodopi.
66
Gelson Liston
—–. 1996. “Postscript to Protocols: Reflections on Empiricism”. In: Giere and Richardson 1996. Popper, K. R. 1995. The Logic of Scientific Discovery. London and New York: Routledge. —–. 1972. A Lógica da Pesquisa Científica. São Paulo: Cultrix. Russell, B. 1995 [1940]. An Inquiry into Meaning and Truth. London and New york: Routledge. —–. 1996 [1918]. The Philosophy of Logical Atomism. Chicago and La Salle: Open Court. Rutte, H. 1991. On Neurath’s Empiricism and his Critique of Empiricism. In: Uebel, 1991. Schlick, M. 1930. The Turning Point in Philosophy. In: Ayer, 1959. —–. 1988 [1932]. Positivismo e Realismo. São Paulo: Abril Cultural, Os Pensadores. —–. 1988 [1934]. O Fundamento do Conhecimento. São Paulo: Abril Cultural, Os Pensadores. Uebel, T. 1992. Overcoming Logical Positivism From Within. Amsterdam, Atlanta: Editions Rodopi B. V. —–. (ed.). 1991. Rediscovering the Forgotten Vienna Circle. Austrian Studies on Otto Neurath and the Vienna Circle (Boston Studies in the Philosophy of Science). Dordrecht: Kluwer. Zolo, D. 1989. Reflexive Epistemology: The Philosophical Legacy of Otto Neurath. London: Kluwer Academic Publisher.
Notas 1 Para Neurath, a linguagem unificada é a linguagem das predições (cf. 1959b, p. 291). 2 Neste artigo, não trataremos da discussão sobre os portadores de verdade, de modo que proposições,
sentenças e enunciados serão, indistintamente, tomados como verdadeiros ou falsos. 3 Para Neurath, isso explica a possibilidade de estudar a sociologia (assim como a psicologia e a política econômica) enquanto uma parte da estrutura física, com eventos espaço-temporalmente definidos; com enunciados empiricamente controlados, ou seja, testados pelo sucesso preditivo, como qualquer outra ciência (biologia, física. . . ). 4 A justificação de um sistema científico é dada pela ausência de contradição deste com as sentenças de observação (protocolos). Contudo, tal sistema tem que ser preditivamente útil. Disso se segue a grande importância que Neurath atribuía às leis. 5 Susan Haack (1998, p. 130) questiona “se as teorias da coerência e da correspondência precisam ser encaradas como rivais entre as quais se é obrigado a escolher, ou como suplementando-se mutuamente”. 6 Estamos nos referindo à idéia de uma congruência estrutural entre proposição e fato. 7 Como veremos mais adiante, além da consistência, uma teoria científica deve contar com a amplitude ou abrangência. Além disso, a aceitação de um novo enunciado ou a revisão do sistema precisa, de alguma forma, de uma justificação mais robusta, que vá além da simples consistência. Neurath apresenta uma importante razão que justificaria qualquer uma das opções: aumentar o poder preditivo do sistema. 8 A crítica de Schlick será examinada nas páginas seguintes, onde apresentaremos a função da relação inferencial do coerentismo de Neurath. 9 Isso indica a inexistência do ‘empirismo ingênuo’ no positivismo lógico. 10 Não podemos deixar de mencionar, neste momento, que a identificação que Popper faz das sentenças protocolares de Neurath e Carnap com o chamado psicologismo da base empírica — “a doutrina de acordo com a qual enunciados podem encontrar justificação não apenas em enunciados, mas também na experiência perceptiva” (Popper 1972, p. 100) — é um equívoco no que se refere à concepção de Neurath. 11 “Na estrutura da ciência unificada, todos os tipos de classificações de enunciados são possíveis. Decidimos, por exemplo, se certos enunciados são ‘enunciados de realidade’, ‘enunciados de alucinações’, ou ‘mentiras’, de acordo com o grau com que estes enunciados podem ser utilizados para deduzir conclusões acerca de eventos físicos além do simples movimento labial” (Neurath 1931d, p. 66). 12 No caso de Carnap, a partir de 1934.
O Fisicalismo de Neurath e os Limites do Empirismo
67
13 Este era um dos objetivos da Enciclopédia Internacional da Ciência Unificada. “Se alguém fala de
uma ‘concepção’ científica do mundo, em contradição a uma ‘visão’ filosófica do mundo, ‘mundo’ não está indicando um todo definido, mas um contínuo desenvolvimento na esfera da ciência. Esta concepção é deduzida a partir do trabalho científico individual, com o desejo de ser incorporado à ciência unificada. Isso é diferente na filosofia tradicional, que alcança suas conclusões sobre o ‘mundo’ a partir de considerações fundamentais” (Neurath 1930, p. 32). 14 “O que caracteriza a moderna concepção científica do mundo é a interconexão de fatos empíricos individuais em uma estrutura de toda a seqüência de eventos e no tratamento lógico uniforme de toda sucessão de pensamento, a fim de criar uma ciência unificada que possa servir, com sucesso, em atividades de transformação” (Neurath 1930, p. 42).
L AS C ONSTRICCIONES D ESENVOLVIMIENTALES COMO C AUSAS R EMOTAS DE LOS P ROCESOS E VOLUTIVOS G USTAVO C APONI Universidade Federal de Santa Catarina
caponi@cfh.ufsc.br
Visto desde la perspectiva de la teoría clásica de la evolución, y definido en su forma más general, un hecho evolutivo es siempre un cambio, o una sucesión acumulativa de cambios, en la frecuencia de dos, o más, formas o variantes alternativas al interior de una población; y, bajo ese mismo punto de vista, puede decirse que la condición de posibilidad de ese hecho es la existencia de por lo menos dos más formas alternativas para algún rasgo morfológico, funcional o comportamental. Dándose siempre por supuesto, claro, que esas variaciones son hereditariamente trasmisibles. Así, si hacemos abstracción de esas otras fuerzas del cambio evolutivo que son la deriva genética, la mutación y la migración, y sólo pensamos en la selección natural, es obvio que para que ésta pueda ser citada como factor de cambio, o aun como factor de estabilidad, debe cumplirse la condición de que existan alternativas sobre las que ella pueda operar. O dicho de un modo más general: para que una fuerza del cambio evolutivo pueda operar deben existir variaciones de un rasgo o característica cuyas frecuencias relativas puedan ser alteradas o preservadas; y esto vale tanto para la selección natural como para los otras posibles fuerzas evolutivas, con excepción, claro, de la propia mutación. Pero pensemos ahora en una situación no contemplada en el caso anterior: pensemos en el caso de una característica, o conjunto de características, cuya frecuencia al interior de la población, o conjunto de poblaciones, se mantiene siempre invariante; es decir: nunca surge, en ninguna generación, cualquier mínimo desvío en relación a ella. Tal podría ser el caso, por ejemplo, del numero de segmentos en alguna especie o género particular de ciempiés. En este caso, es obvio, la selección no tiene nada que hacer: no hay alternativas cuya frecuencia alterar o mantener. Tal vez ella estuvo involucrada en el proceso que llevo a esa situación: podría ser un caso de lo que Waddington llamó selección natural canalizadora (cfr. Maynard Smith et al. 1985, p. 270). Pero, sea cual sea la causa de ese estado de cosas, lo cierto es una vez llegado a ese punto, para ese rasgo particular, no hay proceso selectivo posible; a no ser, claro, que por mutación se cree una nueva variante. Pero, mientras eso no ocurra, lo cierto es que, para esa característica específica, ya no hay materia prima de variación sobre la cual la selección pueda actuar; y, por lo tanto, no hay fenómeno evolutivo a explicar. Si no hay forma alternativa para un rasgo; entonces, su permanencia no tiene por qué ser explicada (cfr. Amundson 2001, p. 318). Una vez instalada, se dirá, la permanencia de esa constancia morfológica no precisa de ninguna explicación porque allí Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 68–74.
Las constricciones desenvolvimientales como causas remotas de los procesos evolutivos
69
no puede ocurrir ninguna divergencia: no hay alternativas cuya frecuencia relativa debamos explicar; y, en ese sentido, no hay fenómeno evolutivo posible. Lo que hay es sólo un fenómeno hereditario: un asunto para la teoría que explique la transmisión de las características orgánicas de padres para hijos; pero no se trata de nada que represente un fenómeno a ser explicado por las fuerzas de cambio previstas por la propia teoría de la evolución. Esto puede parecer extraño, pero es lo que se desprende de considerar al fenómeno evolutivo como alteración o preservación de las frecuencias relativas de formas alternativas al interior de una población; y es así es como la teoría neodarwiniana de la evolución trata a los resultados de los procesos evolutivos pasados que hoy limitan el margen de maniobra de la selección natural (cfr. Amundson 2005, pp. 228–9). Ellos aparecen como meros constraints o constricciones cuya permanencia no constituye un asunto a ser discutido por la propia teoría. Si en el pasado de una población esa constricción no existía, la teoría podrá explicar cómo fue que la selección natural y otros factores del cambio evolutivo acabaron por producirla; pero una vez instalada, la permanencia de esa limitación escapará al campo de aplicación de la teoría. Ella, al final de cuentas, es una teoría del cambio entendido precisamente como una opción entre dos, o más, alternativas efectivamente presentes en una población. Desde esa perspectiva, todo cambio evolutivo de gran escala deberá ser entendido como una suma de esas opciones producidas por la selección natural; y es por eso que para el darwinismo la variabilidad de todas las poblaciones es un presupuesto central, un dato poblacional primitivo. Sin esa variabilidad, sin esa oferta de alternativas, no hay fenómeno evolutivo posible; y decir esto es lo mismo que repetir aquello sobre lo cual Darwin (1859, p.127) y Wallace (1891, p. 158) tanto insistieron: la variación es condición de la evolución (Sterelny 2000, S373). O para decirlo de otro modo: no habiendo alelos cuya eficacia biológica pueda cambiar, no hay alteración o constancia posible de sus frecuencias relativas que merezca explicación. Un rasgo que no varía no puede evolucionar porque la evolución no es otra cosa que la preservación o alteración de la proporción de las variantes de un rasgo al interior de una población. Allí ni siquiera la estabilidad de la población merece ser explicada porque no había ningún cambio que pudiese ocurrir; y es por eso que puede decirse que, en ese caso, no se cumplen las condiciones de posibilidad del fenómeno evolutivo tan claramente explicitadas por el Principio de Hardy-Weinberg. El grado cero del fenómeno evolutivo al que éste tácitamente alude es un estado en donde ya existen variantes alternativas en una determinada proporción que podría ser alterada; y por eso tampoco puede confundirse esa situación con el efecto de la selección natural estabilizadora o con la mutua neutralización de diversas fuerzas de cambio. Cuando hablamos de un rasgo invariante estamos hablando de aquello a lo que Darwin (1859, p. 206) aludía con la expresión Unidad de Tipo; y esa Unidad de Tipo no se explica por ninguna fuerza que, por definición, actúe, preservando o alterando, la frecuencia de variantes alternativas. La Unidad de Tipo simplemente se explica por
70
Gustavo Caponi
comunidad de descendencia; es decir: como el arrastre hereditario de una forma ancestral resultante de procesos evolutivos anteriores pero que ahora, en la medida en que permanezca invariante, quedará excluida de esos procesos (cfr. Sterelny & Griffiths 1999; Amundson 2005, p. 206). Para ella no habrá fenómeno evolutivo posible; y es por eso que puede decirse que, bajo la perspectiva del darwinismo ortodoxo, la Unidad de Tipo, la ausencia de variantes alternativas, es solo un factor limitante y no un factor positivamente actuante en la evolución (cfr. Amundson 2001, p. 318 y 2005, p. 8). Claro, esa discriminación entre un puro límite y factor positivamente actuante no es en absoluto neutral: ella está comprometida con el presupuesto de que los hechos evolutivos son desvíos o divergencias a partir a partir de una forma o estado inicial. Nadie puede negar, sin embargo, que esas constricciones o limitaciones a las que nos estamos refiriendo inciden de hecho en el curso de la evolución. Ésta, en definitiva, tendrá que tomar los caminos que esas constricciones no le prohíban o aquellas que éstas le propongan. Por lo tanto, la pregunta por qué es lo que determina que esas constricciones se establezcan y la pregunta por qué es lo que determina que en algunas circunstancias esas constricciones sean abolidas, puede resultar altamente relevante para entender la senda y la secuencia de los procesos evolutivos. El darwinismo clásico siempre nos llevó a preguntarnos por el por qué de la divergencia; pero también puede ser interesante que nos preguntemos por aquello que determina y establece el espacio de las divergencias posibles (cfr. Amundson 2001, p. 317). Y no se trata solamente de una interrogación por los factores que limitan el cambio sino también de una pregunta por los factores que abren o crean nuevas alternativas de cambio. Se trata, en síntesis, de la pregunta por aquellos factores que determinan, obturando o abriendo, las trayectorias posibles de los fenómenos evolutivos. Muchos de esos factores tienen que ver con constricciones puramente físicas: lo biológicamente posible está siempre antes determinado por lo físicamente posible. Otras son constricciones de índole fisiológica que pueden recordarnos a las leyes de coexistencia de los órganos postuladas por Cuvier: hasta donde sabemos la evolución nunca podría producir un animal de sangre caliente con respiración branquial. Pero estas constricciones son puramente negativas: nos informan sólo sobre lo que nunca podría ocurrir y nos dicen muy poco sobre las sendas posibles de la evolución. No parece ocurrir lo mismo, sin embargo, con las constricciones desenvolvimientales (“developmental constraints”) que hoy ocupan a la Biología Evolucionaria Desenvolvimiental: en ese caso se trata de factores cuyo estudio podría contribuir a explicar la dirección y la secuencia de los cambios evolutivos (Hall 1992, p. 77; Wilkins 2002, p. 383). Los constraints desenvolvimientales serían constraints positivos y no meramente negativos o limitantes: serían genuinas fuerzas evolutivas que, concomitantemente con otros factores como la selección natural, irían pautando el curso de la evolución (Sterelny 2000, S374; Gould 2002, p. 1028; Wilkins 2002, p. 384). Para entender esas constricciones debemos pensar en lo siguiente: toda innovación evolutiva posible, toda variación que pueda ofrecerse al escrutinio de la selec-
Las constricciones desenvolvimientales como causas remotas de los procesos evolutivos
71
ción natural, tiene que poder corporizarse antes en una alteración ontogenética viable (Amundson 2001, p. 314; Schwenk & Wagner 2003, p. 59). Para que una variación fenotípica surja y pueda entrar en competencia darwiniana con otras, algo en el proceso de la ontogénesis tiene que ser atrofiado o hipertrofiado, agregado o suprimido, transpuesto o deformado, postergado o anticipado; y es ahí en donde encuentra su relevancia aquello que Ron Amundson (2005, p. 176) ha llamado Principio de Completud Causal: “Para producir una modificación en la forma adulta, la evolución debe modificar el proceso embriológico responsable por esa forma. Por eso, para comprender la evolución es necesario comprender el desarrollo”. Pero, sea cual sea la índole de esa alteración, ella tiene que cumplir con dos requisitos fundamentales: en primer lugar ella tiene que ser accesible para el sistema en desarrollo (Maynard Smith 1985, p. 269; Raff 2000, p. 78), es decir, tiene que tratarse de una alteración pasible de ser producida en y por ese mismo proceso ontogénetico (cfr. Arthur 1997, p. 48; Azkonobieta 2005, p. 118); y, en segundo lugar, ella tiene que ser tal que, ni aborte ese proceso, ni genere un monstruo totalmente inviable (Amundson 2001, p. 320). Además de física o fisiológicamente posible, un cambio evolutivo tiene que ser ontogenéticamente posible (cfr. a, 2005, p. 231; Azkonobieta 2005, p. 118): la ontogénesis puede o no recapitular a la filogénesis; pero con seguridad la limita y la orienta (cfr. Hall 1992, p. 11; Wilkins 2002, p. 384). La limita estableciendo cuáles modificaciones son viables y cuáles no; pero al hacer eso también la orienta: si un rasgo A puede cambiar a la forma A’ o a la forma A”, pero la viabilidad de A’depende de que simultáneamente a ella se dé otra serie compleja de cambios en otros rasgos y la viabilidad de A” no depende de esa coincidencia feliz; entonces éste será un cambio más probable que aquél. Para la evolución, para decirlo de algún modo, el estado A” será más accesible que el estado A’; y esto puede explicar que A” se dé, y no A’, aun cuando nosotros pudiésemos imaginar que éste sería darwinianamente más eficaz que aquél. Una innovación puede ser muy útil pero si es muy difícil de ser incorporada al proceso de desarrollo; entonces es muy posible que ella nunca ocurra y que en su lugar ocurra otra innovación, tal vez un poco menos eficaz en términos adaptativos, pero que exige una reformulación menor y menos improbable de la ontogénesis. La selección natural, ya lo sabemos, siempre opera sobre una oferta previa de alternativas viables (si no fuesen viables no podrían entrar en competición y no cabría hablar de selección natural); y el estudio de las constricciones ontogenéticas puede permitirnos explicar la composición de esa oferta (Amundson 1998, p. 108 y 2001, p. 326). Una constricción desenvolvimiental, tal como ya fue definida en el consensus paper organizado por Maynard Smith, Dick Burian y Stuart Kauffman en 1985, sería justamente “un sesgo en la producción de variantes fenotípicas o una limitación de la variabilidad fenotípica, causada por la estructura, carácter, composición, o dinámica del sistema desenvolvimiental”(Maynard Smith et al. 1985, p. 266); y ese sesgo, obviamente, definiría el margen de juego de la selección natural. En cierta forma esto parece lo de siempre: la variación propone y la selección natural dispone; pero és-
72
Gustavo Caponi
ta sólo dispone dentro de un abanico restricto de alternativas que aquélla insiste en proponer (cfr. Arthur 2004, p. 131 y p. 195). Decir, entonces, que la selección natural es la única fuerza que, en ese caso, está guiando la evolución sería como creer que cuando optamos entre uno de los dos únicos caminos posibles para llegar a otra ciudad, somos nosotros los que estamos trazando la ruta. O peor: sería como creer que cuando el voto popular consagra uno entre dos candidatos a presidentes, son los ciudadanos los que están pautando el destino de la república. No se trata, claro, de decretar que Brian Goodwin tenga razón. No se trata de afirmar que la selección natural no sea más que una ilusión semejante a navegar en un barquito de Disneylandia (cfr. Dennett 2000, p. 338). Se trata de aceptar la posibilidad de que la evolución, a la manera de los barcos del Mississippi de Mark Twain, deba restringirse a ciertos canales fuera de los cuales la propia navegación se hace imposible. Pero, además de permitirnos explicar la oferta de variaciones que pueden darse en una determinada población, el estudio de los procesos de desarrollo también puede permitirnos entender la secuencia de las innovaciones evolutivas. La ontogénesis es un proceso necesariamente secuencial: una estructura solo surge cuando existen otras estructuras previas que le sirven de base; y el estudio de esas etapas puede permitirnos determinar cuáles fueron los pasos que siguió la propia evolución. Si en la ontogénesis, un órgano A surge por la diferenciación de las células que componen el tejido de un órgano B ya parcialmente conformado; entonces, podemos inferir que A es una innovación evolutiva posterior a B. La filogénesis puede hacer muchas cosas con A y con B; pero si las células de A son una especialización de las células de B, ella necesariamente tuvo que producir a B antes que a A. La ontogénesis, lo vemos otra vez, pauta y ordena los pasos de la filogénesis (Hall 1992, p. 11; Amundson 2005, p. 90). De modo semejante, si descubrimos que en el desarrollo de los animales segmentados, el surgimiento y la separación de estos segmentos es anterior a su diferenciación morfológica y funcional; podremos concluir que la evolución primero produjo seres modulares, fragmentando o repitiendo una estructura preexistente, y luego comenzó a trabajar esos segmentos por separado. Y será el propio estudio del desarrollo el que nos permitirá saber si lo que hubo fue la fragmentación o la repetición de una estructura preexistente. La selección natural, claro, habrá de ser siempre el tribunal que juzgará la conveniencia y la oportunidad de cada una de esas innovaciones; pero ella no podrá alterar su secuencia. En síntesis: la selección natural, y las otras fuerzas evolutivas, operan siempre sobre un menú limitado de alternativas y de lo que se trata es de saber cómo se configura y se altera ese menú que, forzosamente, empuja a la evolución en unas direcciones y no en otras. La variación posible de la información hereditaria puede ser isotrópica como Wallace (1891, p. 158) quería; pero, de hecho, la oferta de alternativas a ser seleccionadas ciertamente no lo es (Arthur 1997, p. 251 y 2004, p. 90). Entre la variación genética y la selección natural parece estar operando otro filtro: aquél que discrimi-
Las constricciones desenvolvimientales como causas remotas de los procesos evolutivos
73
na entre alteraciones viables y alteraciones no viables de la ontogénesis. De lo que se trata es de comprender cómo es que ese filtro funciona (Arthur 1997, p. 218 y 2004, p. 122); y de eso se están ocupando los investigadores que trabajan en Evo-Devo. Pero, si lo que nos interesa es una caracterización epistemológica general de la naturaleza de esos filtros, creo que la propuesta que al respecto ha hecho Wallace Arthur está particularmente bien encaminada. Para caracterizar ese filtro al que acabo de aludir, este autor nos propone volver al concepto de selección interna propuesto por Lancelot Law Whyte en la primera mitad de los años sesenta (Arthur 2000, p. 54; 2004, p. 121). Según Whyte (1965, pp. 7–8) la selección interna o desenvolvimiental (“developmental”) podría definirse de dos formas complementarias: una sería como “selección interna de mutantes a nivel molecular, cromosómico y celular en función de su compatibilidad con la coordinación interna de un organismo”; y la otra sería como “restricción de las direcciones hipotéticamente posibles del cambio evolutivo por factores organizacionales internos”. En el primer caso, me atrevo decir, la selección desenvolvimiental parece tomada como una causa próxima que actúa en los procesos ontogenéticos individuales abortando o revirtiendo modificaciones inviables; y en el segundo caso ella parece considerada como una causa remota que actuaría sobre la evolución filética. Así, del mismo modo en que la selección natural darwiniana puede ser considerada como el efecto transgeneracional de ciertos factores ecológicos que actúan sobre una población; la selección desenvolvimiental; en cuanto que fuerza evolutiva, puede ser considerada como el efecto filogenético de factores organizacionales que actúan sobre los procesos ontogenéticos. Pero, si las poblaciones, o grupos de poblaciones, son el medio en donde se propaga la causalidad evolutiva clásica, las constricciones desenvolvimientales pueden ser descriptas como actuando sobre todos los órdenes taxonómicos que compartan un mismo plano corporal; y, en este sentido, ellas pueden ser pensados como causas remotas de un nivel superior a las causas de cambio previstas en la teoría de la selección natural.
Referencias Amundson, R. 1998. Two concepts of constraint: adaptationism and the challenge from developmental biology. In Hull, D. & Ruse. M. (eds.) The Philosophy of Biology. Oxford: Oxford University Press: 93–116. —–. 2001. Adaptation and Development: on the lack of a common ground. In Orzack, S. & Sober, E. (eds.) Adaptationism and Optimality. Cambridge: Cambridge University Press: 303–34. —–. 2005. The Changing Role of the Embryo in Evolutionary Thought. Cambridge: Cambridge University Press. Arthur, W. 1997. The origin of animal body plans. Cambridge: Cambridge University Press. —–. 2000. The concept of developmental reprogramming and the quest for an inclusive theory of evolutionary mechanisms. Evolution & Development 2(1): 49–57. —. 2004. Biased Embryos and Evolution. Cambridge: Cambridge University Press.
74
Gustavo Caponi
Azkonobieta, T. 2005. Evolución, desarrollo y (auto)organización. Un estudio sobre los principios filosóficos de la Evo-Devo. San Sebastián: Universidad del País Vasco [Tesis Doctoral]. Darwin, C. 1859. On the origin of species. London: Murray. Dennett, D. 2000. With a little help form my friends. In D. Ross; A. Brook; D. Thompson (eds.) Dennett’s Philosophy. Cambridge: MIT Press: 327–88. Gould, S. 2002. The Structure of Evolutionary Theory. Cambridge: Harvard University Press. Hall, B. 1992. Evolutionary Developmental Biology. London: Chapman & Hall. Maynard Smith, J.; Burian, R.; Kauffman, S.; Alberch, P.; Campbell, B.; Goodwin, B.; Lande, R.; Raup, D.; Wolpert, L. 1985. Developmental Constraints and Evolution. The Quarterly Review of Biology 60(3): 265–87. Raff, R. 2000. Evo-devo: the evolution of a new discipline. Nature Reviews Genetics 1: 74–9. Schwnenk, K. & Wagner, G. 2003. Constraint. In Hall, B. & Olson, W. (eds.) Keywords and Concepts in Evolutionary Developmental Biology. Cambridge: Harvard University Press: 52–60. Sterelny, K. 2000. Development, Evolution, and Adaptation. Philosophy of Science 67 (Proceedings, Part II): S369–S387. Sterelny, K. & Griffiths, P. 1999. Sex and Death. Chicago: The Chicago University Press. Wallace, A. R. 1891. Creation by law. In Wallace, A. Natural Selection and Tropical Nature. London: Macmillan: p. 141–66 Wilkins, A. 2002. The evolution of developmental pathway. Sunderland: Sinauer. Whyte, L. 1965. Internal Factors in Evolution. New York: Braziller.
R EALISMO E A NTI - REALISMO : O QUE PODEMOS APRENDER A PARTIR DA HISTÓRIA DO SPIN
G USTAVO R ODRIGUES R OCHA Fundação Educacional do Vale do Jequitinhonha – UEMG
grr2001@hotmail.com
A formulação de questões filosóficas a respeito da natureza da realidade, ou seja, das suas entidades e propriedades fundamentais, ou a respeito das condições de possibilidade deste discurso pertence, geralmente, ao domínio da ontologia ou da metafísica, ou, colocando de outra forma, à concepção realista do conhecimento científico. Alternativamente, há a via anti-realista que, ao abandonar por completo a formulação destas questões, e até mesmo considerá-las irrelevantes, centra-se no papel que os experimentos e a tecnologia, por um lado, e as teorias e as crenças, por outro, desempenham na construção de um discurso, ou de uma rede de significados, capaz de prover uma “realidade” operacional às entidades e propriedades físicas. O objetivo deste trabalho é mostrar como que a história do spin, considerado uma destas propriedades fundamentais da matéria, pode contribuir para este debate entre realismo e anti-realismo. Para tanto, vamos confrontar a perspectiva do trabalho de Margaret Morrison, “History and Metaphysics: On the Reality of Spin” (Morrison 2001, p. 425–49), o qual é bastante centrado na história teórica do spin, com o empirismo construtivo de van Fraassen apresentado na sua obra A Imagem Científica (van Fraassen 1980). Assim, primeiramente vamos introduzir os elementos chaves da história do spin e, em seguida, apontar algumas nuanças sobre como a sua “realidade” foi estabelecida. A explicação do espectro atômico através da teoria de Bohr exigiu uma tripla quantização expressa pelos números quânticos n (principal), l (azimutal) e m (magnético), todos associados à órbita do elétron. Contudo, já no início da década de 20 estes três números quânticos não eram mais suficientes. Os estudos sobre o efeito Zeeman1 revelaram que havia mais componentes do que aquelas que os três números quânticos podiam explicar, como nos relata Tomonaga, no seu livro The Story of Spin: Como vocês sabem, Bohr publicou uma teoria para o espectro do átomo de hidrogênio em 1913. Segundo a sua teoria, o termo espectral do átomo de hidrogênio pode ser dado pelo número quântico principal n, o número quântico subordinado l , e o número quântico magnético m. (. . . ) Logo se descobriu, contudo, que os termos determinados por l e m não são únicos, mas compostos de vários níveis muito próximos, ou seja, eles possuem uma estrutura múltipla. Por exemplo, os termos dos átomos alcalinos, exceto para os termos S, são todos compostos por dois níveis muito próximos. (. . . )2 Assim, se há uma multiplicidade nos termos do espectro, está claro que os números quânticos n, l e m são insuficientes para se explicar todos os níveis. Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 75–82.
76
Gustavo Rodrigues Rocha
Foi então que Sommerfeld introduziu o quarto número quântico j , em 1920, e usou os quatro números n, l , m e j . Ele chamou este número extra de número quântico interno. (Tomonaga 1997, p. 1–3).
Entre 1922 e 1925, como nos mostra Tomonaga, três teorias concorrentes surgiram a fim de se introduzir os “números quânticos internos” e se explicar o efeito Zeeman. Estas teorias foram elaboradas por Sommerfeld, Landé, e Pauli. Cada um deles introduziu “números quânticos internos” diferentes. O quarto número quântico foi chamado de “número quântico interno” justamente pelo fato de não se poder construir uma imagem associada a ele para se explicar o desdobramento excedente das linhas espectrais. Contudo, em 1925, dois físicos holandeses, Samuel Goudsmit (1902-1978) e George Uhlenbeck (1900-1988), fizeram uma proposta ousada. Eles sugeriram que o número quântico adicional, ao invés de ser descrito pela órbita do elétron, poderia ser descrito pelo próprio elétron. O elétron, até então, era visto como um ponto caracterizado somente pela sua massa e pela sua carga elétrica. Porém, os físicos holandeses sugeriram que pensássemos o elétron como um pequeno corpo eletricamente carregado rodando ao redor do próprio eixo. O nome “spin”, que significa giro em inglês, teria surgido desta idéia de se caracterizar a natureza do quarto número quântico. Assim, como qualquer carga em movimento rotacional, o elétron deveria possuir um certo momento angular e um certo momento magnético. As diferentes orientações na rotação do elétron, ou, como se diria, os seus diferentes “spins”, com relação ao plano de sua órbita seriam responsáveis pelas diferentes componentes adicionais na linha do espectro. Surpreendentemente, observou-se que a proposta funcionava e que, ao atribuir ao elétron um certo momento angular e um certo momento magnético, poderia se explicar todas as linhas adicionais encontradas experimentalmente. Porém, não demorou muito para se descobrir a impropriedade de se conceber o spin em termos clássicos, ou seja, como resultado de uma pequena esfera girante carregada. Ehrenfest, por exemplo, observou que a combinação dos números quânticos com esta imagem clássica do elétron seria incompatível com a relatividade restrita. Pois, caso assumíssemos que o elétron é um objeto extenso, e, ainda assim, mantivéssemos as relações entre os momentos magnéticos orbital e de spin do elétron e os seus respectivos fatores gs , seríamos levados a concluir que a velocidade de rotação do elétron é cerca de dez vezes maior que a velocidade da luz. Além disto, Kronig mostrou, posteriormente, que a fórmula da estrutura fina do hidrogênio, encontrada através deste tratamento clássico do elétron, seria duas vezes o valor dado pela observação. Goudsmit e Uhlenbeck não derivaram esta fórmula e, portanto, não tomaram conhecimento deste problema. Heisenberg, logo depois, enviou uma carta aos físicos holandeses apontando o mesmo problema. Várias tentativas foram feitas no sentido de se livrar destas dificuldades. Contudo, somente em 1928, quando Dirac publicou seu famoso artigo The Quantum Theory of the Electron, o problema recebeu uma nova orientação. A mecânica quântica até
Realismo e Anti-realismo
77
aproximadamente esta época havia sido bem sucedida em diversas aplicações, como, por exemplo, a espectroscopia. Entretanto, a teoria apresentava várias questões em aberto, sendo uma delas a sua relação com a teoria da relatividade restrita. Para que a mecânica quântica fosse mesmo uma teoria fundamental do microcosmo ela deveria ser consistente também com a teoria da relatividade restrita. O próprio Schrödinger já havia elaborado uma versão relativística da sua equação de onda. Oskar Klein, Walter Gordon e vários outros físicos também fizeram o mesmo por volta de 1926 e 1927. Todavia, esta equação, conhecida como equação Klein-Gordon, não resultou no valor correto para a estrutura fina do hidrogênio. No seu artigo, Dirac, além de chegar ao valor correto para a estrutura fina, apresenta uma equação de onda relativística para o elétron que, sem introduzir previamente o seu valor de spin, o incorpora automaticamente de maneira dedutiva. A teoria de Dirac foi rapidamente aceita e, além de ter sido uma bela vitória para a teoria da relatividade, colocou o spin do elétron dentro de uma sólida estrutura teórica ao evidenciar a sua relação com a relatividade. Assim, uma vez introduzido estes elementos básicos da história do spin, desejamos agora evidenciar como a sua “realidade” foi estabelecida por etapas, através de diferentes atores e por diferentes razões. Nos orientaremos a partir de agora pelo trabalho de Margaret Morrison. A natureza física do spin é ainda pouco entendida, muito embora hoje não se negue que esta seja uma propriedade “real” do elétron e de outras partículas elementares. A conexão entre o spin e a teoria da relatividade, por exemplo, parece um pouco ambígua. Dirac afirmou que ele havia mostrado que o spin era uma conseqüência da relatividade, porém, isto parece pouco provável se levarmos em consideração que existem partículas relativísticas com spin igual a zero. Por isto esta conexão é ainda motivo de muitos debates (embora não seja incomum encontrarmos livros didáticos referindo ao spin como uma conseqüência da teoria da relatividade). No seu trabalho supracitado Margaret Morrison aponta diversos fatores que foram responsáveis pela aceitação do spin como uma propriedade “real” do elétron. Através da história teórica do spin a autora nos mostra como o seu status ontológico se desenvolveu ao longo do tempo. Não houve um momento decisivo marcando o nascimento do spin ou estabelecendo a sua aceitação. Bohr, por exemplo, foi convencido da realidade do spin, segundo Margaret, devido à sua convicção mais geral a respeito da relação entre a física clássica e a teoria quântica. Em 1926, Bohr e Uhlenbeck publicaram um artigo na Nature no qual Bohr afirmava que a hipótese do spin abria “uma perspectiva muito promissora de entendermos mais extensivamente as propriedades dos elementos por meio de modelos mecânicos, pelo menos na maneira qualitativa característica das aplicações do princípio de correspondência” (Morrison 2001, p. 435). O spin era uma idéia clássica apresentada no esquema teórico da mecânica quântica que resolvia problemas quânticos. Para Bohr isto representava o exemplo perfeito de como as físicas clássica e quântica poderiam se fundir através do princípio de correspondência. No caso de Heisenberg a situação foi diferente. Depois de ter sido persuadido por Bohr e ter falhado na tentativa de se obter
78
Gustavo Rodrigues Rocha
através da mecânica quântica a estrutura complexa do espectro, Heisenberg se resignou à hipótese do spin. Para ele a hipótese do spin se apresentava como a melhor base para a aplicação das idéias quânticas ao problema do espectro atômico. Assim, para Bohr, foi ultimamente a conexão com a teoria quântica que mudou o status do spin de um instrumento de cálculo para uma propriedade real, enquanto para Heisenberg, foi o sucesso experimental em explicar a estrutura complexa do espectro. Seria um erro dizer que Heisenberg abraçou a realidade do spin da mesma maneira que Bohr. O último entendeu o spin como tendo conexões teóricas profundas que explicavam o que era significante sobre o princípio de correspondência. Heisenberg por outro lado viu a sua utilidade instrumental, uma utilidade que se traduziu na sua aceitação como real (Morrison 2001, p. 436).
Já para Pauli, a sua objeção contra o spin era tanto o seu caráter clássico quanto o seu conflito com a relatividade. Ele nunca aceitou completamente a idéia dinâmica de um elétron em rotação e para ele nenhuma explicação sobre a natureza fundamental do spin tinha sido dada. O seu argumento contra a hipótese do spin era que, uma vez que os refinamentos relativísticos eram feitos, ela se mostrava incompatível com a experiência. Contudo, Thomas mostrou, em 1926, que as duas teorias não eram incompatíveis e, assim, Pauli se tornou mais simpático à idéia do spin. Porém, embora o trabalho de Thomas tenha sido importante para a aceitação do spin por parte de Pauli, foi, segundo Margaret, a sua convicção de que o spin era essencialmente uma propriedade da mecânica quântica que o levou a aceitar a sua validade sem uma imagem dinâmica satisfatória. Assim, foi uma atitude filosófica sobre a natureza teórica da mecânica quântica que permitiu Pauli a finalmente aceitar o spin como algo “real”. Para Pauli a realidade do spin estava intimamente ligada ao seu status como um fenômeno puramente quântico. Assim, por volta de 1926 parecia não haver dúvida de que o spin era real apesar da questão problemática a respeito da sua natureza física. O que é filosoficamente interessante sobre esta história até esta época é não somente as diferentes atitudes a respeito da “realidade” do spin, mas também o fato de ter sido possível aceitar algo como real sem o tipo de entendimento teórico típico da maioria das entidades clássicas. Mesmo para aqueles que atualmente interpretam a mecânica quântica com uma teoria instrumentalista ou como um mecanismo de cálculo, é difícil negar que propriedades como o spin são características essenciais e reais das partículas elementares, características que somente fazem sentido nos termos da mecânica quântica (Morrison 2001, p. 439).
Embora a relação entre o spin e a relatividade tenha voltado à tona através do trabalho de Dirac de 1928 e recebido, assim, um maior esclarecimento teórico, não se obteve, com isto, um melhor entendimento a respeito da sua natureza física. Não obstante, para Dirac, a realidade do spin se tornou evidente quando a sua equação de onda relativística o elevou de uma hipótese ad hoc a uma propriedade que emerge naturalmente da ligação da física com a matemática. Deste modo, podemos concluir
Realismo e Anti-realismo
79
que diferentes fatores foram responsáveis para se entender o spin enquanto uma propriedade real do elétron e que, além disto, os problemas conceituais ao redor da sua natureza física não foram, na década de 20, assim como continuam não sendo agora, suficientes para abalar a convicção de que o spin é uma característica fundamental do elétron e das outras partículas elementares. Finalmente, apresentados estes pontos a respeito da história da aceitabilidade do spin como uma propriedade “real” da matéria, podemos avançar, conforme delineado no início, e defrontarmos esta história com o arcabouço conceitual do empirismo construtivo de Van Fraassen. Segundo este autor, a aceitação de uma teoria envolve, como crença, apenas que ela seja empiricamente adequada, entendendo, com isto, que ela salve os fenômenos, ou seja, que tal teoria possua pelo menos um modelo tal que todos os fenômenos reais a ele se ajustem. Para entendermos o que se pretende dizer com “modelo” citamos o próprio autor: Apresentar uma teoria é especificar uma família de estruturas, seus modelos; e, em segundo lugar, especificar certas partes desses modelos (as subestruturas empíricas) como candidatos à representação direta dos fenômenos observáveis. As estruturas que podem ser descritas em relatos experimentais e de medição podemos chamar de aparências; a teoria é empiricamente adequada se possui algum modelo tal que todas as aparências sejam isomórficas a subestruturas empíricas daquele modelo. (van Fraassen 1980, p. 122)
Deste modo, Van Fraassen distingue os fenômenos das aparências. Tal distinção fica clara quando nos remetemos ao exemplo da Astronomia. As aparências, como acabamos de citar, são as estruturas que podem ser descritas em relatos experimentais e de medição. O que seria, no caso da Astronomia, o exemplo da medição dos movimentos retrógrados dos planetas. Os fenômenos, por outro lado, seriam os mecanismos reais que se ajustam aos modelos das teorias. O que seria, neste caso, o modelo heliocêntrico de Copérnico. A fim de ilustrar estas noções cruciais do empirismo construtivo, Van Fraassen se utiliza, em A Imagem Científica, do caso da mecânica newtoniana (van Fraassen 1980, pp. 89-94). Baseando-se neste exemplo, vamos tentar fazer o mesmo, a partir de agora, com a história do spin. Assim, primeiramente, devemos nos perguntar quais seriam, neste caso, os fenômenos que desejamos salvar. Podemos responder a esta pergunta escolhendo dois exemplos preeminentes: o efeito Zeeman, ou seja, a medida do desdobramento das linhas espectrais de um conjunto de átomos submetidos a um campo magnético externo uniforme, e a experiência de Stern-Gerlach, a saber, a constatação de duas componentes discretas numa placa detectora após o envio de um feixe de átomos através de um campo magnético não uniforme. Em segundo lugar, devemos deixar claro qual é a teoria que esperamos que salve estes fenômenos. Acredito que podemos expressar esta teoria da seguinte maneira: o elétron tem um momento de dipolo magnético intrínseco que é uma conseqüência
80
Gustavo Rodrigues Rocha
da existência de um momento angular intrínseco, o qual denominamos spin e associamos ao número quântico j . Aqui surge, aparentemente, a primeira dificuldade na aplicação, ao nosso exemplo, dos conceitos do empirismo construtivo. Com isto, estou me referindo à impossibilidade de se fazer, no nosso caso, a mesma distinção entre fenômenos e aparências que fizemos no exemplo da Astronomia. Como vimos, nem o modelo do elétron como um pequeno corpo eletricamente carregado girando ao redor do próprio eixo nem nenhum outro modelo foi capaz de retratar um mecanismo consistente que se ajuste de maneira biunívoca às aparências descritas pelos relatos experimentais e de medição. Dizemos, contudo, que a dificuldade é aparente por que, segundo o empirismo construtivo de Van Fraassen, embora as teorias científicas devam ser interpretadas literalmente, ou seja, devemos de fato conceber um mecanismo causal por detrás das aparências, não é objetivo da ciência representar tal mecanismo, mas tão somente salvar as aparências. Portanto, muito embora a idéia de objetividade esteja presente, esta é uma concepção claramente anti-realista, pois nela não se exige que uma teoria seja verdadeira para que ela seja aceita. Assim, no nosso exemplo, e, como Van Fraassen parece enfatizar, na maioria dos exemplos da física do século XX, salvar os fenômenos é o mesmo que salvar as aparências. Finalmente, para salvar as aparências, devemos especificar uma família de estruturas, ou seja, modelos, de forma a podermos escolher, entre estes modelos, aquele cujas subestruturas empíricas sejam isomórficas a todas as aparências. A partir deste ponto nos parece que, de fato, surgem algumas dificuldades em conciliar, de uma forma harmoniosa, os conceitos mencionamos até agora com os tópicos da história do spin levantados por Morrison. Esperávamos, a partir destes conceitos, que a aceitação da teoria do spin envolvesse, como crença, tão somente que ela fosse empiricamente adequada, entendendo, com isto, que tal teoria possuísse pelo menos um modelo tal que todos os fenômenos reais a ele se ajustassem. Contudo, se tornou difícil entender esta historia sob esta ótica. Em primeiro lugar, não houve, na aceitação do spin, uma escolha, por parte dos cientistas envolvidos, por um único modelo. Cada autor, motivado por um ou mais modelos diferentes, aceitou, de forma realista ou não, o spin como uma propriedade fundamental do elétron. Em segundo lugar, tampouco os modelos escolhidos tiveram adequação empírica com todos os fenômenos. O modelo do elétron girante, por exemplo, é incompatível com a relatividade restrita e, além disto, leva a um valor para o momento angular de rotação que não é nem sequer razoável. Também o modelo, baseado em considerações semânticas ao redor da equação de Dirac, que entende o spin como um efeito relativístico, é, igualmente, empiricamente inadequado, uma vez que, como mencionamos, há partículas relativísticas com spin nulo. Finalmente, como último exemplo, lembramos do modelo adotado por Bohr, para quem o spin foi considerado um exemplo paradigmático do seu princípio de correspondência. Como sabemos, quase todos os físicos que adotaram explicitamente a interpretação de Bohr ou tiveram uma certa convivência com ele ou foram visitantes do seu instituto em Co-
Realismo e Anti-realismo
81
penhague. Ainda assim, nem mesmo todos os estudantes de Bohr se converteram à sua filosofia, como é o caso de Christian Møller, que permaneceu no instituto de 1926 a 1932 sem deixar nenhum traço dos argumentos do princípio de correspondência nos seus trabalhos. Contudo, todos estes modelos foram suficientemente apelativos para que, a despeito de suas inadequações empíricas, houvesse uma concordância quase unânime, em curto espaço de tempo, a respeito da “realidade” do spin. Portanto, podemos concluir esta exposição resumindo em três pontos o que pudemos aprender sobre a discussão entre realismo e anti-realismo a partir da história do spin. 1◦ ) O ideal realista que espera que uma teoria científica seja um relato sobre o que realmente existe, ou seja, que uma teoria cientifica seja verdadeira ou falsa e o critério de decisão seja externo à atividade científica é inadequado ao nosso objeto de estudo. Além do mais, e pela mesma razão, também pareceu inadequada, neste caso, a separação entre fenômenos e aparências. Contudo, o abandono do realismo não significa o abandono do ideal de objetividade. O positivismo lógico e o convencionalismo, por exemplo, são alternativas ao realismo, como nos lembra van Fraassen no seu primeiro capítulo, que não abandonam, como fazem, por outro lado, algumas abordagens sociológicas e construtivistas, o ideal de objetividade. Além do mais, uma atitude anti-realista também não precisa abandonar, como já fazem o positivismo lógico e o convencionalismo, uma interpretação literal das teorias científicas. O empirismo construtivo é um exemplo de posição anti-realista que entende que as teorias científicas devem ser literalmente interpretadas. Para tanto, o empirismo construtivo se utiliza do conceito de adequação empírica, sobre o qual faremos agora algumas observações, o que nos levará aos dois últimos pontos. 2◦ ) O ideal de adequação empírica, para comportar o presente caso, precisaria, como notamos, ser um pouco enfraquecido. A teoria deveria poder ser empiricamente adequada mesmo se nem todas as aparências fossem isomórficas às subestruturas empíricas de um de seus modelos. Como vimos, nenhum dos modelos que levaram os cientistas mencionados a aceitarem a teoria do spin foram totalmente isomórficos com as aparências. O problema, neste caso, seria que, se assim fosse, correríamos o risco de ter que aceitar outros critérios, além da adequação empírica, envolvidos na aceitação de uma teoria. 3◦ ) A idéia de adequação empírica, para comportar o presente caso, não poderia ser entendida de maneira unívoca, mas precisaria comportar uma multiplicidade de sentidos. Para Bohr, por exemplo, adequação empírica significaria uma conexão entre os conceitos ordinários da física clássica com aqueles da teoria quântica. Este era, para Bohr, o papel do princípio de correspondência e, como nos mostra Margaret Morrison, foi baseado neste modelo que ele aceitou a teoria do spin. Por outro lado, no caso do Heisenberg, adequação empírica seria algo mais próximo do que ordinariamente se entende, ou seja, para ele a teoria do spin era simplesmente a melhor base para a aplicação das idéias quânticas ao problema do espectro atômico.
82
Gustavo Rodrigues Rocha
Para finalizar, gostaria de enfatizar que estas são apenas reflexões iniciais, e, portanto, não conclusivas, que têm me incitado a um estudo e a uma análise mais pormenorizada tanto do empirismo construtivo quanto do objeto histórico em questão.
Referências Morrison, M. 2001. History and Metaphysics: On the Reality of Spin. In Buchwald, J. Z. & Warwick, A. (eds) Histories of the Electron – The Birth of Microphysics. Cambridge: The MIT Press, p. 425–49. Tomonaga, S. 1997. The Story of Spin. Chicago: The University of Chicago Press. van Fraassen, B. C. 1980. A Imagem Científica. São Paulo: Editora Unesp.
Notas 1 O efeito Zeeman é o desdobramento das linhas centrais espectrais dos átomos ao serem submetidos a
um forte campo magnético. 2 O chamado termo S corresponde ao l = 0.
C ONFIGURAÇÕES A RQUEOLÓGICAS DAS C IÊNCIAS H UMANAS J ANAÍNA R ODRIGUES G ERALDINI Universidade Federal de Santa Catarina
jgeraldini@yahoo.com.br
Através da arqueologia do saber, Foucault aborda o processo de construção histórica das epistemes, perguntando-se ‘o que torna possível determinado saber’ (Motta 2005). Focalizando múltiplas transformações que ocorrem no campo do saber através de análises de textos jurídicos, documentos filosóficos, literários e científicos, este autor estuda o conjunto de saberes, procurando regularidades discursivas que perpassem os diferentes discursos de uma época. Assim, constrói-se uma nova periodização epistêmica do saber ocidental onde o tempo do saber, ou o tempo do discurso, não está disposto da mesma forma que o tempo vivido, mas apresenta descontinuidades e transformações específicas (Foucault 2005). Pensando o século XIX como uma episteme que se configura no campo do saber, surge nesta época uma nova forma de se perceber e pensar que inaugura o homem como objeto do saber (Foucault 1987; 1999). Na episteme moderna, o homem nasce num duplo movimento, compondo um ser empírico e transcendental. Empírico no sentido de se dar ao conhecimento, de se permitir enquanto um objeto de estudo, experimentado e analisado como tal. Transcendental no sentido de ser aquele que produz o conhecimento sobre si próprio através de um movimento de afastamento do seu objeto para ser o sujeito que detém este saber. O homem moderno do conhecimento é chamado por Foucault (1999) de ‘duploempírico-transcendental’. A duplicidade encontrada por este autor nesta nova constituição do saber diz respeito a duas formas de análises que surgem a partir do século XIX, ambas compreendendo, como o próprio nome revela, aspectos empíricos e transcendentais. A primeira quer desvendar a natureza do conhecimento humano através dos conteúdos empíricos da mesma. Pode-se dizer que se trata das análises voltadas para a função desempenhada pelos órgãos do corpo, e para as adaptações do mesmo, caracterizando-se, assim, ‘uma espécie de análise estética transcendental’ do corpo do homem. Aqui, o homem é objeto do saber. A outra análise refere-se à historicidade do conhecimento humano, que tanto pode constituir o saber empírico quanto ditar suas formas. Compreende-se, com isso, que existem condições históricas, sociais e econômicas que o atravessam e são formadas a partir das relações estabelecidas pelos homens. Em outras palavras, trata-se de ‘uma espécie de dialética transcendental’, cuja base é dada através dos estudos das ilusões da humanidade. Aqui, o homem é o sujeito que fabrica o conhecimento sobre si mesmo. Surge, assim, o homem enquanto um ser que tem sua existência pautada na vida, no trabalho e na linguagem. Ele é objeto de estudo operado pelas investigações do seu Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 83–87.
84
Janaína Rodrigues Geraldini
organismo, dos objetos e das palavras que fabrica. Ele próprio é um ser vivo, um instrumento de produção e um veículo para as palavras que pronuncia (Foucault 1999). O homem surge na biologia, na economia política e na filologia enquanto invenção recente desses saberes, como um objeto que tem um corpo físico com estrutura e funcionamento que devem ser explorados; como um ser que trabalha, sendo as condições que circulam neste espaço pensadas como constitutivas dele próprio; como um ser que se constitui também através da fala, sendo a linguagem parte desta busca por entender qual homem é esse. Além de considerar que a episteme moderna constrói um novo modelo de pensamento pautado na cientificidade, é importante destacar uma outra característica marcante deste período, que servirá também como base para a formação das ciências humanas: a filosofia moderna que é caracterizada enquanto antropologia analítica (Machado 1981). Antropologia, no sentido de inaugurar a problemática do homem, sendo ele próprio o sujeito que legisla e constitui o objeto. Analítica, pela repetição feita a partir da identidade e diferença entre o empírico e o transcendental. Com o estudo do sujeito de Kant, a filosofia sai da metafísica da representação operada por Descartes e pelos Ideólogos, e traz o tema do transcendental para a modernidade. A partir da analítica kantiana, surgem a analítica positivista com Comte, as reflexões dialéticas com Hegel, e a fenomenologia de Husserl (Machado 1981). Na modernidade, os domínios empíricos dialogam com as reflexões filosóficas sobre a subjetividade e o ser humano (Foucault 1999). Tanto os contextos empíricos quanto os filosóficos encontram-se no mesmo processo de formação do saber. Foucault (1999) aponta a configuração epistemológica da modernidade como sendo composta pelo triedro dos saberes. Esta figura tem três dimensões onde cada plano é ocupado pelas ciências empíricas (biologia, análise das literaturas e dos mitos, e filologia), pelas ciências dedutivas (matemática e física), e pelas reflexões filosóficas. Estas dimensões encontram-se definidas entre si num plano comum. Assim, existe um plano de aplicação das matemáticas nas ciências da vida, da linguagem, da produção e das riquezas, bem como um plano dedutível na biologia, na lingüística e na economia. O plano comum da reflexão filosófica com as ciências exatas, por sua vez, define-se através da formalização do pensamento e, com relação à biologia, à lingüística e à economia, este campo comum diz respeito às formas da vida, às formas simbólicas e do homem alienado, respectivamente. Para este autor, as ciências humanas não encontram um espaço para se situar neste triedro, sendo disciplinas de fronteira — já que as faces dessa figura estão todas preenchidas pelas três dimensões acima citadas. Por elas não terem um lugar próprio, estas disciplinas formam-se nas imediações, nas relações com outros campos de saberes: “o espaço que lhes resta é o das confluências e dos interstícios, permanecendo espremidas entre as filosofias, as ciências empíricas e uma região de matematização” (Prado Filho 2005, p. 81). Em síntese, pode-se dizer que as ciências humanas são excluídas deste triedro no sentido de não se encontrarem em nenhuma destas três dimensões e, ainda, em
Configurações Arqueológicas das Ciências Humanas
85
nenhum dos planos comuns delineados entre as ciências dedutivas, empíricas e filosóficas. No entanto, para Foucault (1999) as ciências humanas podem ser incluídas no triedro se considerarmos o volume definido por suas três dimensões. Explicando melhor, ao relacioná-las com as outras formas de saber, ocorrem possibilidades no âmbito epistemológico para as ciências humanas tais como: ter “o projeto (. . . ) de se conferirem ou (. . . ) de utilizarem (. . . ) uma formalização matemática”; proceder “segundo modelos ou conceitos tomados à biologia, à economia e às ciências da linguagem”; endereçar-se “a esse modo de ser do homem que a filosofia busca pensar ao nível da finitude radical, enquanto elas pretendem percorrê-lo em suas manifestações empíricas” (Foucault 1999, p. 480). O homem, enquanto objeto das ciências humanas, está ligado à biologia, à filologia e à economia. Assim, ele vive, fala e produz, e é instituído como o homem das ciências humanas, ou seja, um ser vivo que constitui através da linguagem seu universo simbólico, e que produz, consome e se vê, ele próprio, como objeto de troca. É neste sentido que podemos dizer que as ciências humanas reduplicam os conceitos das ciências empíricas e filosóficas, transferindo conceitos e métodos inclusive das ciências dedutivas, a fim de se constituírem e se firmarem enquanto disciplinas. As ciências humanas são constituídas em termos das representações feitas pelo homem. Neste sentido, não basta analisar somente as características constituintes no homem no âmbito da vida, da linguagem ou da economia, é preciso incluir as representações. Na episteme moderna, quando se diz que o homem é representado através da sua vida, das palavras que ele fala e do trabalho que executa, se quer dizer que o homem enquanto ser, enquanto objeto deste novo saber, estará sempre vinculado (representado) aos aspectos que o constituem enquanto homem. Em outras palavras, não se pode constituir uma ciência do homem sem considerar algum destes três aspectos (vida, trabalho e linguagem) como intrínsecos do ser do homem. O homem elabora representações sobre sua vida, vive através destas representações e ainda é capaz de representar tal vida. Pensando ainda sobre as representações, um estudo sobre fonética, semântica ou origem das palavras não diz respeito às ciências humanas. Mas, a partir do momento que se passa a investigar “como os indivíduos ou os grupos se representam as palavras, utilizam sua forma e seu sentido, compõem discursos reais, mostram e escondem neles o que pensam (. . . )” (Foucault 1999, p. 488), pode-se, então, constituir uma ciência humana. Ao considerar produção, distribuição e consumo de bens como características próprias do homem, assim como o acúmulo de capital, custos de produção, busca de lucro, etc. não se pode dizer que tais conhecimentos referem-se às ciências humanas. Por outro lado, “só haverá ciência do homem se nos dirigirmos à maneira como os indivíduos ou os grupos se representam seus parceiros na produção e na troca, o modo como esclarecem, ou ignoram, ou mascaram esse funcionamento e a posição que aí ocupam (. . . )” (Foucault 1999, p. 487). Assim, a matriz psicológica pode ser encontrada nos estudos das representações referentes ao ser vivo funcional, fisiológico e neuromotor. Da mesma forma a matriz
86
Janaína Rodrigues Geraldini
que abrange mitos, literaturas e analisa os vestígios verbais e escritos deixados pelo homem sobre si e sobre sua cultura pode ser encontrada no estudo das representações feitas sobre leis e formas de uma determinada linguagem. Finalmente, a matriz sociológica pode ser situada naquele espaço em que as representações sociais são feitas através do trabalho, da produção e do consumo dos grupos e dos indivíduos, bem como através dos rituais e crenças em que se baseiam esta sociedade. Diante das análises históricas acerca da formação das ciências humanas na esfera do saber moderno, o percurso arqueológico nos permite inferir sobre dois aspectos. O primeiro deles diz respeito à multiplicidade de saberes que fazem parte das ciências humanas. O entrecruzamento que ocorre no processo de constituição dessas ciências, onde não é possível delimitar rigorosamente suas fronteiras, implica no atravessamento de diferentes métodos, técnicas, conceitos e objetos, não demarcando um espaço único, mas uma multiplicidade em sua composição. Não podemos falar em uma unidade dentro da psicologia, sociologia, ou antropologia. As ciências humanas, ao transitarem por outros espaços, são fabricadas de diferentes formas, inauguram novas abordagens e objetos, aproximam-se ou se afastam de acordo com diferentes posturas e práticas, transferindo e reduplicando conceitos de diferentes áreas, desde o início de sua formação. Com isso é possível perceber não um progresso dessas ciências, ou uma evolução na compreensão acerca do homem ao longo do tempo, mas uma composição de espaços e discussões múltiplos, dinâmicos e não estanques. Um outro aspecto que a análise arqueológica pode levantar refere-se à desconstrução dos essencialismos, das verdades universais, tomando a produção de conhecimento acerca do homem como construção histórica. Apesar de não estender nossa discussão para outros momentos históricos, e apesar de ter como foco de análise a formação das ciências humanas, entendemos que nossa trajetória possibilita interrogar sobre aquilo que se afirma verdadeiro, formar um pensamento crítico que percebe o conhecimento como fabricado pelo homem, passível de erros, que se modifica através das culturas, das práticas sociais, e da própria história, numa fluidez temporal de seres e saberes.
Referências Foucault, M. 1987. A arqueologia do saber. Trad. Luiz Felipe Baeta Neves. 3. ed. Rio de Janeiro: Forense Universitária. —–. 1999. As palavras e as coisas: uma arqueologia das ciências humanas. Trad. Salma Tannus Muchail. 8. ed. São Paulo: Martins Fontes. —–. 2005. Michel Foucault explica seu último livro. In: Arqueologia das ciências e história dos sistemas de pensamento / Michel Foucault. Coleção Ditos & Escritos Vol. II. Trad. Elisa Monteiro. 2. ed. Rio de Janeiro: Forense Universitária. Machado, R. 1981. Ciência e saber: a trajetória da arqueologia de Michel Foucault. Rio de Janeiro: Edições Graal. Motta, M. B. da. 2005. Apresentação. In: Arqueologia das ciências e história dos sistemas de pensamento / Michel Foucault. Coleção Ditos & Escritos Vol. II. Trad. Elisa Monteiro. 2. ed.
Configurações Arqueológicas das Ciências Humanas
87
Rio de Janeiro: Forense Universitária. Prado Filho, K. 2005. Para uma arqueologia da psicologia (ou: para pensar uma psicologia em outras bases). In: Guareschi, N. M. F.; Hüning, S. M. (orgs.) 2005. Foucault e a psicologia. Porto Alegre: Abrapso Sul.
O PAPEL DA E VOLUÇÃO B IOLÓGICA NA C OMPREENSÃO DA R EPRESENTAÇÃO EM F RED D RETSKE K ARLA C HEDIAK Universidade do Estado do Rio de Janeiro
kachediak@yahoo.com.br
1. Introdução A importância e o papel da evolução na compreensão da geração de crenças é um ponto bastante controverso nas análises filosóficas de cunho naturalista. Entre os autores que tratam contemporaneamente do tema da cognição de modo naturalista, levando em conta o conhecimento da ciência, não há praticamente dúvida de que a mente evoluiu, havendo, porém, bastante discussão sobre até que ponto a própria evolução é relevante para o fenômeno da produção de crenças e de conhecimento. As posições discordantes em relação a essa questão não são observadas apenas na consideração de diferentes autores, como por exemplo, Dretske, Dennett, Millikan, Fodor, mas também no interior de uma única abordagem. Alguns autores consideram que Dretske não manteve uma única posição sobre o assunto. Cummins, por exemplo, observa que Dretske, em seu artigo The explanatory role of content, teria conferido à seleção natural um papel causal, associado ao conteúdo semântico, na explicação do comportamento instintivo de animais, tendo, no entanto, em sua obra Explaining behavior rejeitado explicitamente essa perspectiva (Cummins 1991, p. 104). Nesse artigo, analisaremos o papel explanatório da teoria da evolução na compreensão naturalizada da representação em Fred Dretske.
2. Representação e informação Dretske defende uma teoria representacional naturalista da mente e sustenta que toda representação é formada a partir da combinação do conceito de função, compreendido de modo teleológico, com a teoria da informação. Pode-se ver a unidade desses elementos na própria enunciação da representação, que diz: um sistema (ou um estado) S representa a propriedade P se e somente se S tem a função de indicar, ou seja, de prover informação sobre P relativa a certo domínio de objetos (1995b, p. 4). Desse modo, não existe representação sem função, embora haja informação sem função. A fumaça de uma chaminé, por exemplo, carrega informação sobre a velocidade do vento, embora essa não seja sua função. Essa definição de representação não se aplica apenas às atividades mentais, pois não há apenas representações mentais. As representações mentais são naturais, mas também existem representações não naturais. Os artefatos, por exemplo, têm o poder Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 88–95.
O Papel da Evolução Biológica na Compreensão da Representação em Fred Dretske
89
de representar algo e esse poder deriva daqueles que os criaram e os utilizam, ou seja, esse poder deriva de agentes intencionais, humanos, que possuem mente. A fim de naturalizar a mente, Dretske acredita poder encontrar na natureza formas originais de representação, naturais, não derivadas, que, de algum modo, fornecem base para a compreensão naturalista da mente. Isso é feito recorrendo-se ao conceito de função natural, que significa que um elemento de certo sistema possui a tarefa de carregar informação sobre algo que lhe é externo. A função própria de toda representação é, segundo o autor, a indicação, a veiculação de informação. O conceito de função que Dretske incorpora à sua reflexão sobre a representação origina-se da análise feita por Godfrey-Smith em seu artigo, de 1994, sobre a história moderna da teoria de função. Dretske afirma que não defende uma teoria própria de função natural por ser suficiente que haja teorias fortes afirmando a existência das funções naturais, uma vez que essas são requeridas para sustentar a tese da existência de representações naturais: desde que haja funções naturais — qualquer que possa ser sua correta interpretação — isso é o suficiente para meu projeto naturalista. No entanto, vou assumir neste trabalho que as funções naturais são sempre adquiridas por meio de um processo histórico como a seleção natural (para os sistemas) e o aprendizado (para os estados) (Dretske 1995b, p. 170).
Desse modo, existem funções que são adquiridas naturalmente e se distinguem das funções convencionais por serem independentes das intenções ou propósitos de um agente humano. O conceito de função natural aplica-se a órgãos, como coração e rim, mas do mesmo modo que dizemos que o coração tem a função de bombear o sangue, podemos dizer que os sentidos têm a função de prover informação sobre o ambiente. Há, para Dretske, duas fontes de função natural, o processo filogenético e o ontogenético. O primeiro responde pela formação dos comportamentos instintivos e o segundo pelo aprendizado, através da experiência individual. Em ambos os casos, o processo de aquisição de conhecimento é de natureza histórica, e o que deve ser explicado, é o comportamento.
3. A causa do comportamento A explicação do comportamento remete à causa estruturante (structuring cause) que explica por que C (representação) → (causa) M (movimento), enquanto a explicação da ocorrência de M (o output) remete à causa disparadora (triggering cause). Como bem sintetiza Cummins: se C s causam M s em S porque a ocorrência dos C s em S covariam com a ocorrência de F s (no ambiente ou em outro lugar de S), então, de acordo com Dretske, (1) em S, C s têm a função de indicar F s, e (2) C s são representações em S de F s, e podemos dizer (3) que nós temos uma conexão entre C e M porque C tem o conteúdo semântico que tem (Cummins 1991, p. 104).
90
Karla Chediak
O importante é notar que o conteúdo semântico tem papel causal na explicação do comportamento C → M . Ele adquire esse papel quando é a causa estruturante, ou seja, quando é o conteúdo semântico que nos permite compreender a conexão existente entre C e M num certo sistema S e isso ocorre por causa da função indicadora de C . M é uma resposta a F , causada por C , porque C indica F . O processo filogenético é responsável pelo comportamento instintivo ou inato, ou seja, não adquirido por meio de aprendizagem. Presente em plantas e em animais, a sua estrutura é mais ou menos simples, segundo o modelo de Dretske. Plantas e animais desenvolveram mecanismos de indicação, ou seja, de detecção de estados de coisas do ambiente informacionalmente relevantes para a sua sobrevivência e reprodução. Por exemplo, algumas plantas carnívoras possuem pêlos sensitivos na face interna de suas folhas modificadas. Ao detectarem a presença de um inseto se movimentando, elas se fecham, prendendo-o. A causa disparadora de M (fechamento das folhas) é o movimento do inseto, porém o que está em questão é a causa estruturante. É ela que explica por que a presença do inseto causa o fechamento da folha, por que C → M . Como se trata de um processo filogenético gerando função, é natural que se considere que a evolução por seleção natural responda pela causa estruturante. É o fato de C (representação interna da presença do inseto) indicar F (inseto comestível) que fez com que esse mecanismo (C → M ) tenha sido selecionado e fixado ao longo de gerações. Como observa Dretske, não foi M (fechamento das folhas) que foi selecionado, já que M só é interessante na presença de F , o que foi selecionado foi C → M , em que C indica F : Porque M é benéfico para a planta quando ocorre em condições F (e geralmente não em outras condições) que foi dado a alguns indicadores de F a tarefa de produzir M . É este fato sobre C que explica, via seleção natural, o seu papel atual no controle do movimento da folha, do mesmo modo que o fato correspondente sobre a fita bi-metálica no termostato explica, via propósito de seus planejadores, seu papel causal na regulação da fornalha (Dretske 1995a, p. 91).
Tudo parece indicar que a seleção natural responde pela causa estruturante, uma vez que seu papel é análogo ao do planejador que concebeu o termostato, que é certamente a causa estruturante do instrumento. O processo que ocorre na planta carnívora é semelhante ao que ocorre com os animais e o exemplo que Dretske fornece é o da mariposa que desenvolveu mecanismos para evitar o morcego. O seu sistema auditivo, diz-nos ele, foi projetado a partir de sua relação com o seu principal predador, o morcego, pois ele capta a freqüência de onda emitida por esse animal. Também aqui parece razoável considerar que a seleção natural responda pela causa estruturante do comportamento da mariposa de evitar o morcego. Como observa Cummins, em seu artigo Mental Meaning in Psychological Explanation, é essa a posição que Dretske assume : Como poderia o conteúdo de C entrar na explicação da conexão entre C e M em S? Parece haver uma única possibilidade: organismos com uma conexão entre C e M foram selecionados porque C indica (ou indicou em algum momento)
O Papel da Evolução Biológica na Compreensão da Representação em Fred Dretske
91
F e a capacidade de responder a F com M conferiu uma vantagem seletiva aos ancestrais de S. Dretske pensou que esse tipo de explicação selecionista deveria ser vista como um caso da explicação causal do comportamento por meio do conteúdo. Em Explaining Behavior, no entanto, ele rejeita essa visão. (Cummins 1991, p. 104).
De fato, em seu artigo Explanatory Role of Content, Dretske defende que sua idéia central é a de que estados internos adquirem controle de movimentos, gerando comportamentos, graças às suas qualidades representacionais, ou seja, em virtude do que significam, da informação que eles contêm sobre as circunstâncias externas. Pode-se recorrer às representações para explicar o comportamento, porque o seu conteúdo semântico possui poder causal. E assinala que, excluindo-se os casos que envolvem agentes humanos, há dois modos de o conteúdo adquirir poder causal: pelo processo evolutivo, em que o comportamento se fixa nas populações e por meio de aprendizado, que ocorre nos indivíduos. Diz ele: “A seleção natural desempenha, nos mecanismos cognitivos dos organismos, o papel que nós desempenhamos nos mecanismos de controle de um termostato” (Dretske 1987, p. 41). Em outra passagem ele nos esclarece sobre qual é o papel que nos é atribuído no caso do termostato: “no caso do termostato, esta eficácia é alcançada por meio de intermediários causais (agentes humanos) que projetam (design), constroem e instalam tais dispositivos com vários propósitos, crenças e intenções” (Dretske 1987, p. 40). Fica claro através dessas passagens que Dretske atribuiu à evolução, particularmente à seleção natural, um papel relevante nas explicações dos comportamentos inatos, ainda que ele reconheça, já nesse artigo, que não é possível recorrer à evolução quando se trata de explicar a arquitetura funcional do organismo individual. No entanto, em Explaining Behavior, Dretske recusa-se a atribuir papel relevante à evolução na explicação dos comportamentos inatos, como bem assinalou Cummins. Nesse texto, Dretske nos diz que o processo evolutivo falha ao explicar os sistemas de controle para o comportamento inato nos animais, ou seja, falha ao explicar porque C → M . O que é requerido (. . . ) é que as propriedades indicadoras da estrutura figurem na explicação de suas propriedades causais, que o que ela diz (sobre ocorrências externas) ajude a explicar o que ela faz (na produção do output). Isso é o que falta no caso dos reflexos, tropismos e outros comportamentos instintivos. O sentido [meaning], embora esteja lá, não está relevantemente engajado na produção do output. (Dretske 1995a, p. 94).
A evolução produziu vários sistemas com a função de indicar, ou seja, de representar as condições internas e externas ao organismo, como temperatura, pressão, movimento. Esses indicadores estão relacionados com diversos sistemas de regulação do equilíbrio da fisiologia e é provável que se tenham fixado graças aos benefícios trazidos ao organismo. O comportamento instintivo seria semelhante, pois, tanto em um quanto em outro, o conteúdo da representação não assume um papel importante
92
Karla Chediak
na explicação de por que este organismo se comporta da forma que o faz. Tanto na função fisiológica — como, por exemplo, o controle da taxa de açúcar no sangue — quanto no comportamento instintivo, é o programa genético que explica por que ele se comporta da forma que faz. É ele que parece responder pela causa estruturante (ou talvez não haja causa estruturante): o que explica a coordenação entre M e E neste animal — ademais, em qualquer animal — não é o fato de que exista algo no animal que signifique M (em um ambiente atual alterado pode não haver nada no animal que tenha esse sentido), mas o programa genético (Dretske 1991, p. 206).
De fato, toda representação, seja ela natural seja convencional, possuiu conteúdo semântico. O que Dretske argumenta é que, nos comportamentos naturais instintivos, embora haja representação, portanto, conteúdo semântico, esse é irrelevante para explicar o comportamento. A razão por que certo comportamento se fixou evolutivamente pode desaparecer e ainda assim a planta ou o animal continuará comportando-se do mesmo modo. Organismos com fototropismo positivo dirigem-se para a luz, independentemente do que isso significa. Em geral, numa situação natural, esse comportamento significa algo benéfico, local de alimento ou de reprodução, refúgio de predador, mas mesmo que isso mude, ele vai continuar se comportando do mesmo modo, pois o que está determinando o seu comportamento é o plano genético a que está submetido e não o conteúdo da representação: Se através de um capricho recente da natureza (recente o suficiente para que as pressões seletivas não tenham tempo de operar) a ocorrência de C nas mariposas não sinalizem a aproximação de um morcego faminto, mas de um macho receptivo, C ainda produziria M — ainda produziria as mesmas manobras de vôo de fuga. O que C indica nas mariposas de hoje nada tem a ver com a explicação sobre os movimentos que ajudou a produzir (Dretske 1995a, p. 93).
Dretske não ignora o papel da evolução na formação das estruturas que têm função. É ela que responde por que a estrutura X , com sentido M que causa E existe neste animal: “Certamente, as propriedades extrínsecas das estruturas (a informação que elas carregam) fazem diferença no mundo” (Dretske 1991, p. 207). Porém, isso não seria o bastante para dar-lhe o poder de explicar o comportamento do animal por meio do conteúdo, ou seja, por meio de crenças. Neste sentido, o comportamento instintivo produz função natural, sistemas de indicação, representação, mas não gera crenças. Se todo comportamento possui causa estruturante, que remete a razões, e causa disparadora, que remete a uma descrição física do que provocou o movimento, no comportamento instintivo a causa estruturante seria dada por uma explicação do desenvolvimento e não por explicação seletiva. A argumentação de Dretske é de que a seleção natural apenas seleciona entre variáveis disponíveis, não respondendo pela criação de nada. Ela não explica o comportamento (C → M ), por não ser a responsável pelo seu aparecimento, não podendo, por isso, ser a causa estruturante:
O Papel da Evolução Biológica na Compreensão da Representação em Fred Dretske
93
A explicação de por que este C está causando este M , por que a mariposa está executando manobras evasivas, nada tem a ver com isto que C indica sobre o ambiente da mariposa. A explicação repousa nos genes da mariposa (Dretske 1995a, p. 92).
O argumento de Dretske está baseado na análise que Cummins faz no seu artigo — Functional analysis (1975). Nesse artigo, Cummins critica o conceito teleológico de função e o papel que seus defensores atribuem à seleção natural. Para ele, explicar a presença de um órgão, como o coração dos vertebrados, apelando para a função que ele exerce é apelar para fatores que não são causalmente relevantes para a sua presença (Cummins 1975, p. 748). Ele segue dizendo que aparentemente é razoável considerar que a seleção natural forneça a ligação entre a função de algo (órgão ou comportamento) em um organismo e sua presença nesse organismo, pelo fato de que ele, por causa da função que exerce, contribuiu para a sobrevivência e reprodução desses organismos. Para Cummins, isso não é uma boa interpretação da teoria evolutiva, pois a incorporação de algo em um organismo depende de seu plano “genético” e as alterações nesse plano devem-se às mutações. Se há alteração no plano, ela será herdada a despeito da função e do valor dessa alteração para a sobrevivência e reprodução. O papel da seleção natural será apenas o de aumentar ou diminuir o número de organismos com a alteração dentro da população, porque elas fornecem alguma vantagem em termos de sobrevivência e reprodução aos seus possuidores, mas ela não tem nenhum poder de ação sobre o plano: as características dos organismos responsáveis pelo seu sucesso relativo são determinadas por seus planos genéticos e as características desses planos são inteiramente independentes do sucesso relativo dos organismos que a possuem (Cummins 1975, p. 750).
No processo evolutivo, o aparecimento de fatores inovadores fixados biologicamente deve-se às mutações e às recombinações genéticas. Desse modo, o processo evolutivo como um todo é criativo, mas não a seleção natural. As variações surgem sem levar em conta as necessidades dos organismos e, neste sentido, são aleatórias. A origem de uma função é dada pelo processo de fixação do traço na população, através das gerações. Durante esse processo de fixação do comportamento, de fato, um traço X , porque possuía o conteúdo M , conectou-se causalmente com E . Se não fosse assim, ele não teria sido selecionado, portanto, a conexão entre M e E não teria se fixado. Porém, uma vez fixado geneticamente, ela não é mais modificável e, por isso, a conexão entre M e E pode deixar de existir que o organismo vai se comportar do mesmo modo. No entanto, embora o conteúdo semântico não seja suficientemente relevante para explicar o comportamento instintivo dos organismos atuais, ele foi relevante para que o comportamento se fixasse: podemos supor que os organismos de hoje, cujo X causa E , possuem um X interno que causa E , não porque seu X interno (seja tipo [type] ou exemplar individual [token]) signifique M (eles podem não significar M ), mas porque um X correspondente em seus ancestrais significou M . (Dretske 1991, p. 206)
94
Karla Chediak
É necessário, portanto, recorrer-se ao conteúdo semântico para explicar a fixação evolutiva de certo comportamento e, uma vez fixado, ele passa a estar inscrito no processo de desenvolvimento do organismo, associado ao programa genético. Tudo leva a crer que é esse programa que responde pela causa estruturante do comportamento dos organismos atuais, embora Dretske não seja claro com relação a esse ponto.
4. Discussão O problema está em como justificar a afirmação de que, embora não se possa recorrer ao conteúdo semântico de X para explicar o comportamento instintivo dos organismos atuais, pode-se recorrer a um correspondente de X presente em seus ancestrais remotos que significou M para explicar a fixação de certo comportamento. Parece-me ser um problema considerar que o conteúdo semântico só foi relevante para o comportamento dos ancestrais dos animais atuais. Seria preciso mostrar por que esses organismos estavam em uma situação diferente da dos atuais. Se o conteúdo semântico só é relevante para explicar os comportamentos que envolvem aprendizado, então, não poderia ter sido relevante para explicar o comportamento dos ancestrais dos animais atuais. Esses animais não estavam em uma situação biológica distinta dos atuais, também eles se comportavam de acordo com o seu programa genético. Desse modo, se a causa estruturante do comportamento dos organismos atuais é dada pelo seu programa de desenvolvimento, o mesmo teria de ocorrer com os seus ancestrais. Sua causa estruturante não poderia ser diferente da causa estruturante do comportamento dos animais atuais. Porém Dretske afirma que: “um X correspondente, nos seus ancestrais, significou [meant] M ” (Dretske 1991, p. 206). Quer dizer que se pode recorrer ao conteúdo semântico para explicar o comportamento instintivo dos indivíduos que viveram no passado. Dretske parece considerar que o conteúdo semântico foi relevante durante o tempo em que a seleção esteve atuando para fixar o traço, mas ainda assim, é, sem dúvida, difícil delimitar esse tempo e determinar a partir de quando ele deixou de ser relevante. Além disso, em geral, quando se admite que a seleção natural responde pela existência de traços funcionalmente relevantes nos organismos, admite-se também que a manutenção desses traços é, possivelmente, também fruto da ação da seleção. Aceita-se que a perda da função tenderia a provocar o desaparecimento ou a diminuição do traço. Desse modo, é difícil se compreender como o conteúdo semântico possa ter tido um papel relevante para os ancestrais dos animais atuais e não tem mais para os organismos atuais. Parece-me que uma forma de resolver esse problema pode ser encontrada em uma nota de Naturalizing the mind, onde Dretske observa, ao discutir o papel criador da seleção natural, que a seleção natural não torna o pescoço da girafa mais longo, mas torna os pescoços das girafas mais longos, admitindo, portanto, num certo sentido seu papel criador, pois ela responde pela criação do tipo (type) (Dretske 1995, p. 186, nota 21). Ao explicar por que as girafas têm pescoço longo, poder-se-ia res-
O Papel da Evolução Biológica na Compreensão da Representação em Fred Dretske
95
ponder recorrendo à função que ele cumpre para os organismos que o possuem. No caso da representação, o que é selecionado é o sistema capaz de carregar informação útil para o organismo. Uma vez selecionado, ele passa a ter uma função de indicar e uma vez que tem a função de indicar, ele representa algo. Da mesma maneira que no caso do pescoço da girafa pode-se recorrer à função para explicar por que são do jeito que são, poder-se-ia também recorrer ao conteúdo semântico (fator identificador da representação) para explicar por que há aquele “tipo” de representação em tais organismos. O que não se pode é recorrer ao conteúdo semântico quando se trata de explicar a representação que ocorre no comportamento instintivo de um indivíduo (token). Desse modo, Dretske considera que a evolução é relevante para a fixação do comportamento instintivo, que fica registrado no programa genético, mas não o é quando se considera somente o comportamento isolado de um organismo específico. Por isso, não seria adequado falar de crenças quando se trata dessa forma de comportamento. Embora o conteúdo semântico esteja presente e responda pela constituição de um “tipo” nos comportamentos instintivos, ele não tem papel causal independente, porque não pode ser destacado do suporte biológico ao qual está associado. Isso faz toda a diferença entre o comportamento instintivo e o aprendizado, impedindo que se fale de crenças ao lidarmos com este tipo de comportamento, pois só há crenças quando o conteúdo semântico da representação adquire um poder causal independente e autônomo, que o torna capaz de explicar por que C → M e não apenas M : “Tudo o que se consegue com uma explicação via seleção natural é por que há hoje tantas máquinas sintáticas [syntactic engines] de certo tipo — o tipo no qual algo que significa M causa E ” (Dretske 1991, p. 207). No entanto, ela não é capaz de separar o elemento sintático do semântico e dar a esse último um papel relevante e autônomo na explicação do comportamento.
Referências Cummings, R. 1975. Functional analysis.The Journal of Philosophy 72: 741–65. —–. 1991. The role of mental meaning in psychological explanation. In McLaughlin, B. (ed.) Dretske and his critics. Cambridge: Basil Blackwell, pp. 102–17. Drestske, F. Dretske’s replies. 1991. In McLaughlin, B. (ed.) Dretske and his critics. Cambridge: Basil Blackwell, pp. 180–221. —–. 1995a. Explaining Behavior. Reasons in a world of causes. Cambridge: MIT Press. —–. 1995b. Naturalizing the mind. Cambridge: MIT Press. —–. 2000. Perception, knowledge and belief. Selected essays. Cambridge: Cambridge University Press. —–. 1988. In Merrill, D. D. & Grimm, R. H. (eds.) Contents of thought. Tucson: University of Arizona Press, pp. 17–36. Godfrey-Smith, P. 1994. A modern history theory of function. Noûs 28(3): 344–62.
E L R EQUISITO DE G ENERALIDAD Y E L S ISTEMA S UBPERSONAL DE P ROCESAMIENTO L INGUÍSTICO : MÁS CONCEPTOS DE LOS QUE CREÍAMOS
M ARIELA D ESTÉFANO Universidad de Buenos Aires/CONICET
mariela.destefano@gmail.com
El requisito de generalidad es una propuesta acerca de cómo están estructurados nuestros pensamientos (Evans 1982). Según este requisito, los pensamientos están estructurados no por estar compuestos por distintos símbolos atómicos de un lenguaje del pensamiento, sino por ser el resultado del ejercicio de distintas habilidades conceptuales. Así, si a un sujeto se le atribuye el pensamiento que a es F , entonces, debe tener los recursos conceptuales para tener el pensamiento que a es G, para cualquier propiedad de ser G de la cual tiene una concepción. (Evans 1982, p. 104)
Por ejemplo, los pensamientos ‘María es feliz’ y ‘Juan es austero’ están estructurados en el sentido de que involucran la habilidad de pensar MARÍA, FELIZ, JUAN y AUSTERO,1 y nos compromete con la habilidad de pensar “María es austera” y “Juan es feliz”. Parte de lo que significa poseer un concepto es tener este complejo de habilidades, esta capacidad de combinarlo con otros conceptos. En este sentido, el requisito de generalidad es una propuesta acerca de qué es poseer un concepto. En otros trabajos he intentado mostrar que fenómenos propios del procesamiento de la información lingüística, como el priming semántico, la rapidez en el reconocimiento oral de las palabras, y otros, se explicarían sosteniendo que el mecanismo que procesa la información lingüística en las etapas tempranas posee conceptos (Destéfano 2006). Si el requisito de generalidad es una propuesta acerca de qué es poseer conceptos y si considero que el sistema subpersonal de procesamiento temprano de la información lingüística posee conceptos, entonces sería interesante estudiar si el requisito de generalidad se aplica a los estados subpersonales del procesamiento temprano de la información lingüística.2 Sostener que el mecanismo que procesa la información lingüística en las etapas tempranas posee conceptos, en el sentido en que el requisito de generalidad lo establece, de alguna manera, es defender la idea de que este mecanismo tiene conceptos en el sentido en que filósofos como Evans (1982) o Peacocke (1992) han venido sosteniendo. Para ellos poseer un concepto es tener ciertas capacidades mentales y esto es algo que no todos los filósofos estarían dispuestos a afirmar.3 A pesar de críticas como las de Fodor (1999), creo que esta perspectiva es atrayente. Lo es en tanto que rescata la idea de que para evaluar la posesión de conceptos ha de atenderse a una cierta clase de saber-cómo, lo cual sería fructífero para la investigación cognitiva porque permitiría testear empíricamente la posesión de conceptos a partir del desempeño cognitivo concreto. Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 96–107.
El Requisito de Generalidad y El Sistema Subpersonal de Procesamiento Linguístico
97
En la primera parte de este trabajo intento mostrar que la posibilidad de aplicar el requisito de generalidad a los estados subpersonales del procesamiento temprano de la información lingüística está abierta. Esta posibilidad está abierta dado que el requisito sería neutral respecto de la distinción personal-subpersonal, en el sentido de que podría aplicarse tanto a estados y procesos personales como a estados y procesos subpersonales. Como el requisito de generalidad establece que poseer un concepto, en parte, es ejercer ciertas habilidades conceptuales, para defender que su aplicación es indiferente a que los estados y procesos sean personales o subpersonales será útil analizar nociones como “habilidad” (Ryle 1949) y “capacidad cognitiva” (Cummins 1983). En la segunda parte del trabajo me ocupo de argumentar contra dos posibles objeciones a la idea de que el requisito de generalidad pueda aplicarse a los estados subpersonales del procesamiento temprano de la información lingüística. La primera objeción hace referencia a que el requisito de generalidad es constitutivo de los estados personales de actitud proposicional y no así de los estados subpersonales del procesamiento de la información (Evans 1982). De esta manera el sistema de procesamiento lingüístico no poseería conceptos y sus contenidos serían no conceptuales. En respuesta a ello intentaré mostrar no sólo que esta idea es insuficiente para cerrar la posibilidad de que el requisito de generalidad pueda aplicarse a los estados subpersonales del procesamiento lingüístico, sino también que hay razones para creer que esta idea es incorrecta. La segunda objeción alude a que el requisito de generalidad solamente tiene valor cuando los conceptos combinados se aplican apropiadamente de acuerdo a cómo es el mundo (Evans 1982; Peacocke 1992; Strawson 1963). Como la aplicación apropiada de conceptos es llevada a cabo por el sujeto, en tanto sistema cognitivo global, de manera conciente, podría considerarse que la posesión de conceptos sólo es un fenómeno del nivel personal. Así, el requisito sólo admitiría la posesión de conceptos personales (involucrados, más específicamente, en las actitudes proposicionales) cerrando la posibilidad de que haya conceptos en los sistemas subpersonales de procesamiento de la información. En respuesta a ello intentaré mostrar que la aplicación del requisito de generalidad no ve restringida su aplicación a los casos donde los conceptos están correctamente combinados, razón por la cual no sería correcto afirmar que el requisito sólo admitiría la posesión de conceptos en el nivel personal. I Según el requisito de generalidad, parte de lo que significa poseer un concepto es tener ciertas habilidades conceptuales, más específicamente, es tener la capacidad de combinarlo con otros conceptos. En lo que sigue intentaré mostrar que estas habilidades conceptuales pueden ejercerse tanto por una persona, en tanto sistema cognitivo global, como por un sistema subpersonal de procesamiento de la información. De esta manera mostraría que el requisito de generalidad es neutral respecto de quién
Mariela Destéfano
98
o qué posee estas habilidades conceptuales. Si el requisito es neutral en este sentido, no habría problema en aplicarlo a los estados subpersonales del procesamiento de la información lingüística. I.1 En primer lugar intentaré mostrar que siguiendo el análisis conceptual que Ryle hizo de la noción de “habilidad”, no quedaría excluida la idea de que tanto las personas como los sistemas subpersonales de procesamiento de la información ejercen habilidades conceptuales. Mi planteo es conceptual dado que sólo pretendo exponer la “geografía lógica” (Ryle 1949, p. 14) de conceptos como el de habilidad y extraer consecuencias a partir de ello. Según Ryle, las habilidades, sean conceptuales o no, son propiedades disposicionales. Una propiedad disposicional no se encuentra en un estado particular, sino que es susceptible de encontrarse en un estado particular cuando se da determinada condición (Ryle 1949, p. 41). Por ejemplo, que algo sea frágil no consiste en que está actualmente roto, sino que consiste en que, si fuese sometido a golpes o forcejeos, se romperá. En el caso específico de la posesión de conceptos, tener un concepto es desempeñarse en ciertas habilidades conceptuales, y si se acepta que las habilidades son disposiciones, entonces tener un concepto no es un asunto de lo que efectivamente se hace, sino de lo que se es capaz de hacer con ese concepto (Fodor 1998, p. 19). Por lo visto las disposiciones son propiedades que pueden actualizarse bajo determinadas condiciones. Es cierto que para cada disposición hay actualizaciones que parecen ser típicas. Parece que la manera típica en que se actualiza la fragilidad de un objeto es rompiéndose cuando se lo somete a golpes. Pero quizá haya maneras menos típicas de actualización de la disposición de ser frágil. Someter a un objeto a determinadas condiciones de calor que traigan como consecuencia una alteración en su estructura, tal vez sea una manera de actualizar su fragilidad. Tal como sostiene Ryle, los filósofos caen en la trampa de suponer que las disposiciones poseen actualizaciones uniformes cuando, en realidad, las actualizaciones pueden presentarse en una amplia e ilimitada variedad de formas (Ryle 1949, p. 41–2). Las habilidades, particularmente las habilidades conceptuales, en tanto disposiciones son susceptibles de múltiples actualizaciones. La manifestación típica de una habilidad conceptual es aquella donde el sujeto, a raíz de ciertas necesidades del pensamiento, combina determinados conceptos. En este caso es la persona la que ejercita dicha habilidad conceptual y, en este sentido, es la persona la que posee los conceptos en cuestión. Pero la actualización típica de la habilidad conceptual no excluye otras actualizaciones menos típicas pero igualmente posibles. La manifestación menos típica de una habilidad conceptual sería aquella donde un sistema de cómputo de la información (como el lenguaje), bajo ciertas condiciones de procesamiento, realizara combinaciones de conceptos. En este caso es el sistema subpersonal el que ejercita la habilidad conceptual y así, es el sistema subpersonal el que posee los conceptos. No hay nada
El Requisito de Generalidad y El Sistema Subpersonal de Procesamiento Linguístico
99
en la noción de habilidad en tanto disposición que excluya este tipo de actualizaciones. Pero ¿qué quiere decir, con mayor exactitud, que un sistema subpersonal de procesamiento de la información ejerce habilidades conceptuales? El análisis de la noción de habilidad no alcanza para aclarar este punto. En lo que sigue intentaré hacerlo. He dicho que las habilidades son propiedades disposicionales. Los enunciados que refieren a propiedades disposicionales son enunciados disposicionales. Ryle entiende que los enunciados disposicionales son autorizaciones para las inferencias (Ryle 1949, p. 107–11). Esto quiere decir que un enunciado disposicional en sí mismo no nos informa acerca de nada en el mundo, sino que funciona como una licencia para pasar inferencialmente de un ítem a otro. Por ejemplo, el enunciado disposicional “Este objeto es frágil” constituye una licencia para afirmar que “Si pongo el objeto en un lavarropas, se rompe”, “Si se rompe en el lavarropas, este último también puede sufrir daños”, etc. En este sentido, un enunciado disposicional es como una regla que rige ciertas transiciones inferenciales. Creo que la idea de que un sistema subpersonal de procesamiento ejerce habilidades conceptuales debería entenderse en el sentido de que tiene ciertas reglas que guían las transiciones inferenciales.4 Parte de esas reglas podría ser la que permite realizar combinaciones de ítems. Cuando el sistema realiza transiciones inferenciales, utiliza esta regla, y en este sentido, se podría decir que, en parte, el sistema está ejerciendo habilidades conceptuales, esto es, posee conceptos. I.2 En segundo lugar, teniendo en cuenta que las habilidades conceptuales son capacidades cognitivas, intentaré mostrar que adoptando ciertos aspectos de la noción de capacidad cognitiva propuesta por Cummins (1983), no quedaría excluida la idea de que tanto las personas como los sistemas subpersonales de procesamiento de la información tienen capacidades cognitivas conceptuales. Una capacidad cognitiva se especifica a través de una ley que conecta ciertos outputs a la luz de ciertos inputs (Cummins 1983, p. 53). Si se tiene en cuenta que las capacidades cognitivas son susceptibles de ser caracterizadas inferencialmente, entonces la ley que conecta los inputs con los outputs es una regla de inferencia, y la conexión se da en el sentido de que el output se infiere a partir del input de una manera especificada por la regla (Cummins 1983, p. 53–4). Ahora bien, Cummins hace la distinción entre capacidades cognitivas y capacidades cognitivas* sosteniendo que mientras que las primeras son inteligentes, las segundas, en cambio, no son inteligentes (Cummins 1983, p. 57– 8). Una capacidad cognitiva susceptible de caracterización inferencial es inteligente porque la transición inferencial que lleva de los inputs a los outputs involucra una elección fundamentada (informed choice) (Cummins 1983, p. 57). En otras palabras, la conexión entre inputs y outputs se da por un proceso transformacional que ha sido elegido. Una capacidad cognitiva* susceptible de caracterización inferencial no es
100
Mariela Destéfano
inteligente porque la transición inferencial que lleva de los inputs a los outputs no involucra elección alguna (Cummins 1983, p. 57). La conexión entre inputs y outputs se da por un proceso transformacional “tonto” en el sentido de que no es el producto de una elección deliberada. Teniendo en cuenta esta distinción, las personas tienen capacidades cognitivas y los sistemas subpersonales de procesamiento de la información tienen capacidades cognitivas*. Las personas son las que conectan inferencialmente los inputs con los outputs de manera inteligente a partir de sus elecciones. En cambio, los sistemas subpersonales de procesamiento de la información conectan inferencialmente los inputs con los outputs de manera “tonta” sin atender a elección alguna. Sin embargo, esta distinción no influye en la idea de que una capacidad cognitiva, sea inteligente o no, es un proceso inferencial, razón por la cual podría pensarse que tanto las personas como los sistemas subpersonales de procesamiento de la información ejercen capacidades cognitivas, entre ellas, la posesión de conceptos. He defendido la idea de que las habilidades combinatorias pueden ser ejercidas tanto por una persona, en tanto sistema cognitivo global, como por un sistema subpersonal de procesamiento de simplemente haciendo análisis conceptual. Sin embargo, podría pensarse que la tarea de la psicología, de hecho, es ocuparse de la explicación del fenómeno de que las personas tienen ciertas habilidades (conceptuales o no), dejando a un lado la explicación de si los sistemas subpersonales de procesamiento tienen habilidades (conceptuales o no). Para muchos sería anti-intuitivo que entre los explananda de la psicología se hiciera referencia a fenómenos relacionados con mecanismos computacionales subpersonales. Pero creo que esta observación es propia de un interlocutor poco atento. No es cierto que las habilidades (conceptuales o no) de los sistemas de procesamiento no puedan ser fenómenos susceptibles de explicación psicológica. Cuando hablo de psicología me refiero, específicamente, a la psicología cognitiva computacional, la cual se ocupa de dar cuenta de los procesos mentales que subyacen a las capacidades cognitivas (Skidelsky 2003, p. 40). Tal como lo afirma Fodor, las mismas herramientas conceptuales empleadas por una ciencia determinan la clase de fenómenos que dicha ciencia tiene la misión de explicar (Fodor 1968, p. 37). Los fenómenos que caen dentro del dominio explicativo de una teoría se especifican haciendo referencia al mismo entramado conceptual de la teoría en cuestión. En este sentido, si la psicología cognitiva computacional se enfoca en los mecanismos mentales de procesamiento de la información, entonces el mismo aparato teórico de la psicología cognitiva permitiría que entre los fenómenos que ella tenga que explicar se incluyan las habilidades propias del procesamiento subpersonal de la información. Creo que esta aclaración es importante porque tengo la intención de que mi propuesta tenga relevancia en el campo empírico de la investigación psicológica. Hasta aquí he intentado mostrar que si el requisito de generalidad es neutral respecto de la distinción personal-subpersonal, en el sentido de que las habilidades combinatorias que se requieren para que se cumpla el requisito pueden ser ejercidas tanto por una persona, en tanto sistema cognitivo global, como por un sistema
El Requisito de Generalidad y El Sistema Subpersonal de Procesamiento Linguístico
101
subpersonal de procesamiento de la información, entonces no habría problema en aplicarlo a los estados subpersonales del procesamiento temprano de la información lingüística. II En este apartado me propongo dar respuesta a dos objeciones que obstaculizan la conclusión de que no habría problema en aplicar el requisito de generalidad a los estados subpersonales del procesamiento temprano de la información lingüística. II.1 La primera objeción afirma que el requisito de generalidad, tal como lo presenta Evans, es constitutivo de los estados personales de actitud proposicional y no así de los estados subpersonales del procesamiento de la información (Evans 1982, p. 104). De esta manera, el sistema subpersonal de procesamiento lingüístico no poseería conceptos y sus contenidos serían no conceptuales. Podría preguntarse por qué Evans sostiene esta tesis. Dado que Evans es bastante escueto en sus razones, creo que se puede encontrar la pista de la respuesta en el análisis que hace Davies (1989) del requisito de generalidad. Davies sostiene que es factible que el requisito de generalidad sea extensivo a los estados de un sistema subpersonal de procesamiento. Mientras que el requisito sería constitutivo de los estados de actitud proposicional, los estados subpersonales de procesamiento de la información podrían satisfacerlo de manera contingente (Davies 1989, p. 148). Esto quiere decir que es posible imaginar sistemas de procesamiento donde sus estados puedan combinarse entres sí de acuerdo a dicho principio. Esta es una posibilidad que tienen los sistemas, pero no es necesario que todos los sistemas de procesamiento satisfagan el requisito. El punto que tanto Davies como Evans intentan subrayar es que el requisito se aplica de manera esencial a los estados personales de actitud proposicional y no así a los estados subpersonales de procesamiento de la información. Teniendo en cuenta esto, parecería que Evans no aplica este principio a los estados subpersonales de un sistema de procesamiento porque cuando aborda la noción de sistema de procesamiento siempre está pensando en el sistema perceptivo (Evans 1982) y es cierto que este sistema no satisface, ni aún contingentemente, el requisito de generalidad. Por ejemplo, la representación de la distancia y la velocidad sólo pueden combinarse con la representación de un sonido percibido y no así con la representación de una luz percibida (Evans 1982, p. 104). Las combinaciones representacionales en el sistema perceptivo están altamente restringidas. Sin embargo, esto no sucede en el sistema de procesamiento lingüístico. Sean los ítems mentales PEZ, DONCELLA y TENEDOR, el sistema de procesamiento de la información lingüística en sus etapas tempranas tiene la capacidad de combinarlos entre sí. No hay restricciones que impidan combinar el ítem PEZ con el ítem DONCELLA, o el ítem DONCELLA con el ítem TENEDOR, por ejemplo. En este sentido los estados subpersonales del
102
Mariela Destéfano
procesamiento lingüístico satisfarían contingentemente el requisito de generalidad. Es decir que este es un sistema donde el requisito se haría efectivo no necesariamente, sino que por una cuestión de hecho. Por lo expuesto creo que aunque, con Evans y Davies, se sostenga que el requisito de generalidad es constitutivo de los estados personales de actitud proposicional y no así de los estados subpersonales del procesamiento de la información, ello no es suficiente para cerrar la posibilidad de que el requisito de generalidad pueda aplicarse (aunque, de manera contingente) a los estados subpersonales del procesamiento temprano de la información lingüística. Con todo, creo que no es correcto el criterio según el cual el requisito de generalidad es constitutivo de los estados personales de actitud proposicional y no así de los estados subpersonales del procesamiento de la información. Filósofos como Richards (1994) proponen argumentos en contra de la idea de que todos los estados de creencia deban satisfacer el requisito de generalidad. Hay muchos tipos de creencia y algunas de ellas se conforman al modelo oracional, no en el sentido de que su estructura es lingüística, sino en el sentido fuerte de que están lingüísticamente realizadas. Sea Juan un sujeto que domina el español y el inglés, supóngase que Juan posee el concepto l realizado lingüísticamente en español pero no lo posee realizado lingüísticamente en inglés y, a su vez, posee el concepto Z realizado lingüísticamente en inglés pero no lo posee realizado lingüísticamente en español. Lo cierto es que aunque Juan tenga los conceptos l y Z, como se realizan en lenguajes distintos no puede tener la creencia lingüísticamente realizada de que algunos l son Z (Richard 1994, p. 312–3). El hecho de que estos dos conceptos que posee el sujeto no puedan ser combinados, mostraría que las creencias lingüísticamente realizadas no siempre satisfacen el requisito de generalidad. Con Richard se hace evidente que el requisito no se cumple de manera esencial en todos los tipos de creencias. Entonces, el criterio de Evans, según el cual el requisito es constitutivo de los estados personales de actitud proposicional como las creencias, y no es constitutivo de los estados subpersonales del procesamiento de la información, no es correcto. Quizá se pudiera aceptar, en defensa de Evans, que el requisito se cumple, de manera constitutiva, en algunas creencias, pero que sigue sin cumplirse de manera constitutiva en los estados subpersonales de procesamiento. Pero si se cumple en algunas creencias ya no es un requisito esencial de los estados personales de actitud proposicional, sino que se da contingentemente en ciertos estados personales de actitud proposicional (quizá en la mayoría de ellos). Así, el requisito se cumpliría tan contingentemente en los estados personales de actitud proposicional como en los estados subpersonales del procesamiento de la información. Es una cuestión empírica a resolver qué estados, personales o subpersonales, responden a dicho principio. La manera en que los humanos estamos hechos parece mostrar que el requisito no se cumple en el caso de ciertos estados personales de creencia y en los estados subpersonales del procesamiento de la información perceptiva. Asimismo, la manera en que estamos hechos parece mostrar que de hecho, el requisito se cumple en otros estados personales de actitud proposicional y en los estados subpersonales del pro-
El Requisito de Generalidad y El Sistema Subpersonal de Procesamiento Linguístico
103
cesamiento temprano de la información lingüística. Resumiendo, el cumplimiento del requisito no parece ser esencial a los contenidos conceptuales de cualquier área de la cognición. Su cumplimiento depende de la manera en que estamos hechos. Y es por la manera en que estamos hechos que el requisito se aplica a los estados subpersonales del procesamiento temprano de la información lingüística. II.2 La segunda objeción sostiene que el requisito de generalidad solamente tiene valor cuando los conceptos combinados se aplican apropiadamente de acuerdo a cómo es el mundo (Evans 1982; Peacocke 1992; Strawson 1963). ¿El requisito de generalidad admite combinaciones de conceptos tales como la del pensamiento “César es un número primo”? Hay un número de filósofos de la mente que responderían a esta pregunta de manera negativa. Ello se debe a que consideran que el requisito de generalidad se aplica a una serie limitada de pensamientos (Camp 2004, p. 4). Solamente se aplica a los pensamientos cuyos conceptos son combinados respetando sus aplicaciones apropiadas. El concepto NÚMERO PRIMO puede combinarse con el concepto NUMERO 5 respetando la aplicación apropiada del mismo porque dicha combinación entra en el “campo de significatividad” del concepto NÚMERO PRIMO (Camp 2004,p. 4). El concepto NÚMERO PRIMO puede combinarse con el de CÉSAR, pero no respeta la aplicación apropiada del mismo, dado que dicha combinación no entra en el campo de significatividad del concepto NÚMERO PRIMO. Parecería que la aplicación apropiada de conceptos es una condición que restringe las combinaciones conceptuales que caen bajo el requisito de generalidad. Desde esta perspectiva, la aplicación apropiada de conceptos nos compromete con un cierto conocimiento de los objetos referidos por esos conceptos. Nos compromete con el conocimiento de qué es lo que diferencia a un objeto de otro, y nos compromete con el conocimiento de que el objeto “de hecho” posee esas propiedades diferenciadoras (Evans 1982, p. 106–8; Peacocke 1992, p. 231–4). Esta perspectiva liga la aplicación apropiada de conceptos con alguna noción de identificación y reidentificación de objetos (Lievres 2005, p. 172). El concepto NÚMERO PRIMO se aplica apropiadamente al concepto NÚMERO 5 y se aplica de manera inapropiada al concepto CESAR porque el objeto referido por NÚMERO PRIMO se identifica y reidentifica de tal manera que admite relacionarse, en la realidad, con los objetos referidos por NÚMERO 5 y no admite relacionarse, en la realidad, con objetos referidos por CESAR. En este sentido, la tarea conceptual de determinar el campo de significación de un objeto está estrechamente ligada con la tarea metafísica de determinar cómo están divididos los objetos en la realidad (Camp 2004, p. 7). Ahora bien, aplicar apropiadamente un concepto parece ser una actividad personal. Como la aplicación apropiada de conceptos se lleva a cabo por el sujeto, en tanto sistema cognitivo global, de manera conciente, esta habilidad pertenecería al nivel personal. Así, el requisito de generalidad sólo se aplicaría a las actitudes proposicionales y no a los estados de procesamiento de la información tanteen virtud de
104
Mariela Destéfano
que las actitudes proposicionales son representaciones prototípicamente personales y los estados de procesamiento de la información son subpersonales. De modo que se podría pensar que el requisito sólo admitiría la posesión de conceptos personales involucrados en las actitudes proposicionales. En respuesta a esto, creo que es errado sostener que este requisito se aplica solamente a los pensamientos cuyos conceptos se combinan respetando sus aplicaciones apropiadas. A mi entender, el requisito de generalidad se aplica a cualquier combinación conceptual. Si este requisito se aplicara solamente a las combinaciones de conceptos apropiadamente aplicados y dijimos que desde esta perspectiva los conceptos están correctamente aplicados a partir de cómo son los objetos descritos por esos conceptos (es decir, respetando las partes en que están divididas las cosas en el mundo), entonces como la aplicación apropiada de conceptos descansa en cuestiones metafísicas, el requisito de generalidad también descansaría en cuestiones metafísicas. Sin embargo, en lo que sigue intentaré mostrar que el requisito de generalidad no puede descansar en cuestiones metafísicas, razón por la cual no se aplica solamente a los pensamientos donde se combinan conceptos apropiadamente aplicados. En primer lugar, el requisito de generalidad expresa la propiedad de la sistematicidad de los pensamientos (Camp 2004, p. 1). Los pensamientos son sistemáticos porque la habilidad para tener cualesquiera de ellos implica la habilidad para tener muchos otros pensamientos que están relacionados (Fodor 1998, p. 48–9). Si una mente puede pensar que “Juan ama a María”, también puede pensar que “María ama a Juan” (Fodor 1998, p. 139). Asimismo si una mente puede pensar que “María es feliz” y “Juan es austero”, también puede pensar que “María es austera” y “Juan es feliz”. El requisito de generalidad hace referencia a las mismas habilidades conceptuales involucradas en la sistematicidad. Es cierto que existe una diferencia entre el requisito y la sistematicidad. El primero es una propuesta conceptual acerca de cómo deben estar estructurados nuestros pensamientos. Evans entiende que es un principio ideal al cual los sistemas de pensamiento sólo se ajustan de manera aproximada (Evans 1982, p. 105). El segundo, en cambio, está planteado como un hecho empírico acerca de los pensamientos de las mentes humanas. Parece conceptualmente posible que haya mentes que aún pensando que “Juan ama a María” no tengan la capacidad de pensar que “María ama a Juan”. Sin embargo, tener la habilidad de pensar el segundo pensamiento a partir del primero es un rasgo de la vida mental de los humanos (Fodor 1998, p. 49). Esta diferencia no elimina el hecho de que el principio exprese la propiedad de sistematicidad. En segundo lugar, la sistematicidad es una propiedad sintáctica del pensamiento (Fodor y Pylyshyn 1988, p. 120). Tal como sostiene Fodor: “la sistematicidad es una de las (muy pocas) propiedades organizacionales de la mente a la que nuestra ciencia cognitiva actualmente le da algún sentido” (Fodor 1998, p. 140). Es una propiedad sintáctica en tanto que es formal, se expide solamente acerca de la estructura de los pensamientos. Es cierto que los pensamientos no están sistemáticamente estructurados de manera arbitraria desde un punto de vista semántico (Fodor y Pylyshyn 1988,
El Requisito de Generalidad y El Sistema Subpersonal de Procesamiento Linguístico
105
p. 124). La capacidad para pensar “María es feliz” y “Juan es austero” está conectada con la capacidad para tener otros pensamientos, como “María es austera” y “Juan es feliz”, porque están semánticamente relacionados en el sentido de que estos conceptos contribuyen con el mismo contenido en los pensamientos en los que participan. No podría afirmarse que la capacidad para pensar “María es feliz” y “Juan es austero” está relacionada con la habilidad para pensar “Dos más dos es cuatro”. Esto es así porque los contenidos de pensamientos como “María es austera” y “Juan es feliz” no son los mismos que los de pensamientos como “Dos más dos es cuatro”, razón por la cual “María es austera” y “Juan es feliz” no están semánticamente relacionados con “Dos más dos es cuatro”. Parecería que la sistematicidad implica más que meras combinaciones sintácticas (Werning 2005, p. 300). Implica que esas combinaciones sintácticas sean sensibles al contenido que es combinado. Pero aunque se acepte que la sistematicidad es una propiedad formal que tiene ciertas restricciones semánticas, ello no tiene por qué llevar a pensar que también tiene restricciones metafísicas. La sistematicidad no se ve afectada por el hecho de que los contenidos combinados sintácticamente hagan referencia a individuos, propiedades, u otra categoría metafísica. Según Fodor y McLaughglin estas cuestiones “abstrusas” no son relevantes para la sistematicidad (Fodor y McLaughlin 1990, p. 219). Las propiedades formales de la mente, como la sistematicidad, no tienen por qué acomodarse a las partes en las que está dividido el mundo. Las combinaciones sintácticas no tienen que tener ninguna correspondencia con cómo es la realidad. Los mecanismos combinatorios que subyacen a los pensamientos no se desenvuelven mejor si respetan cómo es el mundo. Con esa idea, ilusiones ópticas como las estudiadas por Muller-Lyer, al no corresponderse con cómo es la realidad, serían el resultado de mecanismos psicológicos que funcionan mal y, sin embargo, son el producto del sistema visual cuando opera de manera normal (Jackendoff 1991, p. 416–7). En este sentido, las constricciones metafísicas acerca de cómo es el mundo no tienen ningún papel en la estructuración de los pensamientos. El requisito de generalidad es un principio acerca de la sintaxis de los pensamientos. Al dar cuenta de la estructura de los pensamientos este requisito es pertinente para la forma de ciertas representaciones. Por lo que expuse no es obvio que un principio acerca de la sintaxis de los pensamientos se vea compelido por restricciones metafísicas acerca de cómo es el mundo. Esto no quiere decir que los pensamientos no tengan ningún tipo de efecto en el mundo o que el mundo no afecte nuestros pensamientos. Las propiedades sintácticas tienen eficacia causal porque son propiedades físicas de segundo orden (es decir, son propiedades de propiedades físicas). Si los pensamientos son sistemáticos y la sistematicidad es una propiedad sintáctica, entonces los pensamientos tienen poder causal en el mundo. Sin embargo, tener eficacia causal no es lo mismo que acomodarse a las partes en que está dividida la realidad. Si estoy en lo cierto y se puede liberar el requisito de generalidad de la condición de significatividad, la cual opera en el nivel personal, quedaría abierta la posibilidad
Mariela Destéfano
106
de que el requisito se cumpla en los sistemas subpersonales de procesamiento (como el lenguaje) con lo cual, se abriría la posibilidad de que dichos sistemas, en parte, posean conceptos. III El análisis de nociones como “habilidad” y “capacidad cognitiva” me ha permitido concluir que el requisito de generalidad es neutral respecto de la distinción personalsubpersonal, razón por la cual podría aplicarse a los estados subpersonales del procesamiento temprano de la información lingüística. Ninguna de las dos objeciones presentadas parece poder invalidar esta conclusión. Como el requisito de generalidad es una propuesta acerca de qué es poseer conceptos, este trabajo abriría la posibilidad de afirmar que el mecanismo que procesa información lingüística, en sus etapas tempranas, tiene conceptos. Pero mi estrategia argumentativa no es suficiente. Habría que estudiar qué otros requisitos deberían satisfacer los estados subpersonales del procesamiento temprano de la información lingüística para poder afirmar con mayor solidez que poseen conceptos. En la literatura filosófica se han propuesto varios principios que caracterizan la posesión de conceptos. Esta capacidad no sólo está ligada al requisito de generalidad, sino que también puede estar ligada al requisito de distancia o a la posibilidad del error (Danón 2007). Para evitar que el tema de la posesión de conceptos a nivel subpersonal se transforme en una mera disputa terminológica acerca de qué es poseer conceptos habría que pensar cuáles de los principios propuestos por los filósofos habría que tomar en cuenta. Desde esta perspectiva, entiendo que el requisito de generalidad es impostergable. Esto es así, porque, tal como mencioné, el cumplimiento de este requisito permitiría testear empíricamente la posesión de conceptos a partir del desempeño cognitivo concreto.
Bibliografia Bermudez, J. L. 1995. Nonconceptual Content: From Perceptual Experience to Subpersonal Computational States. Mind & Language 10(4): 333–69. Camp, E. 2004. The Generality Constraint: Nonsense and Categorial Restrictions. Philosophical Quarterly 54(2): 209–31. Cummins, R. 1983. The Nature of Psychological Explanation. Cambridge, MA: MIT Press. Danon, L. 2007. Habilidades identificatorias y conceptos en animales sin lenguaje. (manuscrito) Davies, M. 1989. Tacit Knowledge and Subdoxastic States. En George, A. (ed.) Reflections on Chomky. Oxford: Blackwell. Dennett, D. 1969. Content and Consciousness. London: Routledge & Kegan Paul. Destéfano, M. 2006 Estados subpersonales con contenido conceptual y lenguaje. La rapidez y la eficacia en los procesos de comprensión oral de las palabras. (manuscrito de tesis de licenciatura) Evans, G. 1982. Varieties of Reference. Oxford: OUP.
El Requisito de Generalidad y El Sistema Subpersonal de Procesamiento Linguístico
107
Fodor, J. 1968. La explicación psicológica. Introducción a la filosofía de la psicología. Madrid: Cátedra. —–. 1998. Conceptos. Barcelona: Gedisa Fodor, J. y McLaughlin, B. P. 1990. Connectionism and the Problem of Systematicity: Why Smolensky’s Solution doesn’t Work. En McDonald, C. & McDonald, G. (eds.) 1995. Connectionism. Cambridge, Mass.: Blackwell, p. 199–222. Fodor, J. y Pylyshyn, Z. W. 1988. Connectionism and Cognitive Architecture: a Critical Analysis. en McDonald, C. & McDonald, G. (eds.) 1995. Connectionism. Cambridge, Mass.: Blackwell, p. 90–163. Frege, G. 1892. Sobre el sentido y la denotación. En Moro Simpson, T. (ed.) 1973. Semántica filosófica: problemas y discusiones. Buenos Aires: Siglo XXI, p. 3–27. Jackendoff, R. 1991. The Problem of Reality. Noûs 25: 411–33. Lievers, M. 2005. The Structure of Thoughts. en Werning, M., Machery, E. & Schurz G. (eds.) The Compositionality of Meaning and Content. vol. I. Frankfurt: Ontos Verlag, p. 169–88. Peacocke, C. 1992. A Study of Concepts. Cambridge, MA: MIT Press. Richards, M. 1994. What Isn’t a Belief. Philosophical Topics 22: 291–318. Ryle, G. 1949. El concepto de lo mental. Buenos Aires: Paidós. Skidelsky, L. 2003. Representaciones mentales ¿eslabón entre el individuo y el mundo?. (manuscrito doctoral) Strawson, P. F. 1963. Individuals: An Essay in Descriptive Metaphysics. Garden City, NJ: Anchor Books. Werning, M. 2005. Right and Wrong Reasons for Compositionality. En Werning, M., Machery, E. & Schurz G. (eds.) The Compositionality of Meaning and Content. vol. I. Frankfurt: Ontos Verlag, p. 285–309.
Notas 1 Utilizaré la tipografía mayúscula para indicar que se trata de conceptos. 2 Aunque la distinción personal-subpersonal originariamente hace referencia a distintos niveles de ex-
plicación (Dennett 1969), existen desarrollos que tienden a entenderla ontológicamente, en el sentido de que existen representaciones y procesos mentales pertenecientes al nivel personal y subpersonal (Peacocke 1992; Bermúdez 1995). En términos generales, las representaciones y procesos personales son propios de la persona en tanto sistema cognitivo global y el contenido de los estados personales es accesible al sujeto que lo posee. Las representaciones y procesos subpersonales, en cambio, son los que poseen los sistemas de procesamientos de la información y ambos son inaccesibles al sujeto. 3 Poseer conceptos también puede entenderse como tener particulares mentales, en tanto elementos constituyentes del contenido de un estado mental (Fodor 1999) o como aprehender un sentido, concebido como aquello que se capta cuando se comprende una expresión (Frege 1892). 4 La noción de proceso inferencial es lo suficientemente amplia como para abarcar tanto transiciones lógicas como algorítmicos computacionales.
A DECUACIÓN E MPÍRICA Y C OMPROMISOS M ETAFÍSICOS N ÉLIDA G ENTILE Universidad de Buenos Aires
nelgen@filo.uba.ar
1. Introducción En The Scientific Image (1980), Bas van Fraassen presenta su visión de la ciencia como una alternativa al realismo científico. Conforme a su caracterización, el realismo científico puede describirse bajo la tesis de que “las teorías científicas procuran ofrecernos un relato literalmente verdadero de cómo es el mundo; y la aceptación de una teoría científica conlleva la creencia de que ella es verdadera” (van Fraassen 1980, p. 8). En contra de esta posición, van Fraassen formula su propuesta antirrealista a la que denomina empirismo constructivo: “La ciencia se propone ofrecernos teorías que son empíricamente adecuadas; y la aceptación de una teoría involucra solamente la creencia de que ella es empíricamente adecuada” (van Fraassen 1980, p. 12). Van Fraassen no niega, por cierto, que las teorías tengan valor de verdad, esto es, no las considera como meros instrumentos o formulaciones metafóricas; por lo contrario, sostiene que el lenguaje de la ciencia debe interpretarse de manera literal. Pero el reconocimiento por parte de van Fraassen del sentido literal de las teorías científicas no lo conduce a asumir que aceptar una teoría equivale a comprometerse con su verdad en lo que atañe a las porciones inobservables del mundo. En efecto, el empirista constructivo se mantiene agnóstico respecto de cualquier compromiso ontológico que vaya más allá de los fenómenos observables. De manera que la aceptación de una teoría se restringe solamente a la creencia de que es empíricamente adecuada, esto es, que lo que dice acerca de las cosas y sucesos observables en el mundo es verdadero, que “salva los fenómenos”. En la medida en que se muestra agnóstico respecto de las creencias que van más allá de lo que sería posible confrontar directamente con la experiencia si se dieran las circunstancias apropiadas, el empirismo constructivo de van Fraassen pretende brindar una visión de la ciencia depurada de todo componente metafísico: “¡Adios a la metafísica!” como expresa el slogan que formula en algunos de sus textos (van Fraassen 1991, p. 480). En lo que sigue se procura demostrar que a pesar de su reticente actitud respecto de cualquier aspecto que trascienda el mundo de lo observable, van Fraassen no puede evitar la presencia de fisuras en los límites que traza para dejar fuera la metafísica. Más específicamente, se sostiene que en su intento de restringir el objetivo de la ciencia a la búsqueda de teorías que sean sólo empíricamente adecuadas, acaba asumiendo un compromiso más fuerte que el que conlleva el reconocimiento de la prosecución de la verdad: el empirismo constructivo no consigue desvincularse completamente de una platónica ontología poblada de entidades abstractas. Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 108–113.
Adecuación empírica y compromisos metafísicos
109
2. Enfoque semántico y adecuación empírica Van Fraassen caracteriza la adecuación empírica, el concepto que introduce frente a la imposibilidad de establecer la verdad de las teorías científicas, en el marco de una presentación no axiomática de las teorías. De acuerdo con la “concepción heredada” (received view) desarrollada por los empiristas lógicos y sus continuadores, las teorías propias de las ciencias fácticas son sistemas axiomatizados, de tal manera que los axiomas correspondientes a cada teoría pueden reconocerse por sus características sintácticas. En contraste con esa perspectiva sintáctica, van Fraassen apoya el enfoque semántico introducido por Patrick Suppes. Conforme a esta propuesta, una teoría se presenta directamente como una clase de modelos, sin atender a aspectos tales como la axiomatización de la teoría dentro de un lenguaje formal. En la terminología de van Fraassen, tales modelos son estructuras matemáticas “llamadas ‘modelos de una teoría dada’ sólo en virtud de pertenecer a la clase definida de los modelos de esa teoría” (van Fraassen 1989, p. 366n). Asimismo, los modelos son concebidos como representaciones de una variedad de mundos que serían posibles de acuerdo con la teoría; mientras que el mundo real, a su turno, se identifica con uno de esos posibles mundos (van Fraassen 1989, p. 226). En términos de la síntesis expresada por Ronald Giere, de acuerdo con la concepción semántica, una teoría consiste de a) una definición teórica que caracteriza determinada clase de sistemas y b) una hipótesis teórica que afirma que ciertas clases de sistemas reales son miembros de esa clase. De ese modo, para quienes adoptan la concepción semántica, el contenido empírico de la teoría corresponde a la especificación de ciertas partes de estos modelos, las subestructuras empíricas, que ofician como candidatos para la representación de los fenómenos observables (van Fraassen 1980, p. 64). La diferencia entre esta concepción y la versión tradicional de las teorías científicas se manifiesta también, entonces, en cuanto a la cuestión del contenido empírico de las teorías. Pues, mientras en la concepción sintáctica el contenido empírico de una teoría se cristaliza en un conjunto de las consecuencias lógicas de sus axiomas, a saber, el subconjunto formado por aquellas oraciones que se deducen de los axiomas y pueden formularse en un “lenguaje observacional”, los partidarios del enfoque semántico se verían liberados de las complicaciones que origina el problema del significado de los términos teóricos. Cualquier alusión al lenguaje puede considerarse ajena en la medida en que el contenido empírico de la teoría aparece ahora como una propiedad vinculada con los modelos considerados como entes matemáticos y no como entidades lingüísticas. De modo consecuente, el concepto de adecuación empírica característico de la concepción heredada queda ahora redefinido de manera muy simple: “la teoría es empíricamente adecuada si tiene algún modelo tal que todas la apariencias sean isomórficas con las subestructuras empíricas de ese modelo” (van Fraassen 1980, p. 64). Las apariencias, los fenómenos, el mundo observable, se identifican con las estructuras o modelos del mundo que pueden ser discernibles a través de registros expe-
110
Nélida Gentile
rimentales e informes de medición. Por lo tanto, aceptar una teoría implica sólo la creencia de que lo que dice acerca de los fenómenos es correcto. Pero cabe subrayar que la expresión “todas las apariencias” no refiere solamente a aquellas realmente observadas sino más bien a las que serían en principio observables. De acuerdo con van Fraassen, que una entidad sea observable no implica que estén actualmente dadas las condiciones para observarla: “X es observable si hay circunstancias tales que, si X está presente ante nosotros bajo esas circunstancias, entonces lo observamos” (van Fraassen 1980, p. 16). De este modo, la adecuación empírica abarca no sólo la totalidad de los fenómenos presentes y pasados sino también los futuros; va necesariamente más allá de lo que podemos conocer en un momento dado, pues no todos los resultados de las mediciones están incorporados y nunca podrán estarlo, ya que no podemos medir todo lo que podría ser medido (van Fraassen 1980, p. 69). Aun así, van Fraassen enfatiza que la exigencia de la adecuación empírica es mucho más débil que la exigencia de la verdad, y restringirnos a la aceptación de las teorías nos libra de la metafísica.
3. Entidades abstractas y compromisos ontológicos Hemos visto que, de acuerdo con las explícitas afirmaciones de van Fraassen, la noción de adecuación empírica nos permite alejarnos de la metafísica y atenernos solamente a lo que es directamente confrontable con la experiencia. Pero, si bien ha dejado atrás las complicaciones inherentes a la concepción lingüística, el costo que ha decidido pagar es su reemplazo por la entronización de ciertas estructuras abstractas. Podemos preguntarnos, pues, si la actitud de van Fraassen resulta totalmente coherente o sí, por el contrario, el empirismo constructivo no puede evitar traspasar los límites que demarcan el mundo constituido por lo que es directamente observable. A fin de responder este interrogante, será conveniente que analicemos brevemente las distintas posiciones que históricamente se han ofrecido en relación con el estatus de las entidades matemáticas y veamos cuáles son sus consecuencias para la evaluación de la postura de van Fraassen. El siglo XX ha sido escenario del desarrollo de tres concepciones clásicas en torno de la fundamentación de la matemática: el logicismo, el intuicionismo y el formalismo. Cada una de estas doctrinas reedita de algún modo, como señala Quine, las típicas posturas medievales a propósito del problema de los universales, a saber, el realismo, el conceptualismo y el nominalismo. Asimismo, si analizamos estas doctrinas a la luz del criterio de compromiso ontológico formulado por Quine, esto es, que “ser es ser el valor de una variable”, puede observarse que el desacuerdo entre las distintas posiciones reside de modo explícito en el tipo de entidades que se admiten como objetos de referencia de las variables ligadas (Quine 1948, p. 33). De acuerdo con la doctrina del realismo, los universales existen independientemente de la mente, tienen existencia real. En su forma absoluta o extrema, cuyo máximo exponente encontraríamos en la filosofía de Platón, los universales son inde-
Adecuación empírica y compromisos metafísicos
111
pendientes de los individuos que los ejemplifican, esto es, se trata de universales ante rem. La moderna manifestación del realismo en el ámbito de la matemática, el logicismo representado por Frege, Russell, Whitehead y Church, se manifiesta por medio de la utilización de variables ligadas para referirse a entidades abstractas tales como números, clases, infinitos actuales, y demás. El conceptualismo, por su lado, sostiene que los universales o entidades abstractas no son cosas reales; existen sólo en tanto conceptos de la mente.1 Su representante más reciente en la fundamentación de la matemática es el intuicionismo suscripto, entre otros, por Poincaré, Brouwer y Weyl. No se puede garantizar la existencia de entidades matemáticas a menos que se sepa cómo se construyen: a la manera de Kant, las verdades de la aritmética y con ellas las de la matemática toda constituyen verdades sintéticas a priori derivadas de la intuición, una aprehensión de la mente de lo que ella misma ha construido. El nominalismo, por otra parte, sólo atribuye existencia real a los individuos; los universales no son conceptos sino simplemente nombres (nomina) o vocablos (voces) que poseen únicamente un estatus lógico: son el requisito necesario del pensamiento y la comunicación. En el reino de las matemáticas, el formalismo comparte con el intuicionismo la actitud de rechazo hacia la demanda de universales característica del logicismo. Pero en contra del intuicionista, el formalista ni siquiera los admite como entidades producidas por la mente. El formalismo concibe las matemáticas como un mero sistema puramente sintáctico, un juego de notaciones sin significación.
4. ¿Adiós a la metafísica? Retomemos ahora el criterio quineano de compromiso ontológico y pasemos luego a examinar la noción de adecuación empírica tal como la formula van Fraassen en términos de la visión semántica de las teorías. Si “ser es ser el valor de una variable”, entonces –como afirma Quine– al decir que hay números primos entre 1000 y 1010 nos estamos comprometiendo con una ontología que contiene números; cuando decimos que hay centauros estamos obligados a sostener una ontología que contiene centauros; y cuando decimos que algunas especies zoológicas son capaces de reproducirse entre sí nos vemos obligados a reconocer como entidades las especies mismas por más abstractas que éstas sean (Quine 1948, p. 28–32). Hemos visto que —de acuerdo con van Fraassen— una teoría es empíricamente adecuada si tiene algún modelo tal que todas la apariencias son isomórficas con las subestructuras empíricas de ese modelo. En este caso, el dominio de valores de las variables que pueden figurar en el alcance del cuantificador existencial son los modelos teóricos y las correspondientes subestructuras empíricas de los modelos. Luego, la afirmación de que una teoría es empíricamente adecuada no parece dejar lugar para evitar el compromiso con las entidades abstractas. En su defensa y a fin de morigerar sus compromisos, el empirista constructivo quizá podría argüir que sólo está obligado a reconocer una ontología de subestructu-
112
Nélida Gentile
ras empíricas, las estructuras que son isomórficas con los fenómenos. Esta parece ser, por otra parte, la tesis que van Fraassen defiende en uno de sus últimos trabajos. En efecto, en “Structure: its Shadow and Substance” (2006), aboga en favor de un enfoque al que denomina “un estructuralismo empirista”. La clave de su nueva postura reside en su intento de dar cuenta de ciertos aspectos que juzga acertados de la posición de Worrall, la idea de que a pesar de los cambios conceptuales la ciencia exhibe una acumulación del conocimiento. Según van Fraassen, intuitivamente diríamos que los fenómenos parecen tener tanto cualidades intrínsecas como una estructura matemática. Pero mientras la naturaleza de las cualidades intrínsecas que se atribuyen a los fenómenos depende de cada teoría y varían por tanto de una a otra, las leyes de bajo nivel, aquellas expresadas por medio de ecuaciones simples y que describen precisamente la estructura fenoménica perduran, al menos como casos límite, en las teorías sucesoras. Así, los colores, para citar uno de los ejemplos ofrecidos por van Fraassen, fueron primeramente concebidos por Newton como cualidades de los rayos de luz y más tarde en términos de longitud de onda. Hubo en este caso un importante cambio conceptual; sin embargo, las leyes de reflexión y refracción de la óptica geométrica son descripciones matemáticas simples de ciertos aspectos de los fenómenos que se mantienen en el pasaje de una teoría a otra. Es la estructura superficial de la ciencia, la estructura fenoménica, la que se mantiene estable frente al contenido teórico que se altera rápidamente (van Fraassen 2006, p. 304). Admitamos, por mor de la discusión, que las subestructuras empíricas son estructuras matemáticas de bajo nivel, ecuaciones relativamente simples, isomórficas con la estructura del mundo observable. Sin embargo —como el propio van Fraassen lo reconoce— siguen siendo estructuras matemáticas que, aun cuando son isomórficas con las apariencias no se identifican estrictamente con ellas (van Fraassen 2006, p. 304). Y si a esta situación agregamos que lo único que podemos conocer de los fenómenos es su estructura, vía isomofismo con los modelos empíricos de la teoría, entonces el mundo revelado por la ciencia ha quedado poblado de una plétora de estructuras matemáticas que comprometen al empirista constructivo con una metafísica platonizante de entidades abstractas. Podría replicarse, por cierto, que el recurso de apelar a entidades abstractas no lleva a comprometerse ontológicamente con ellas. En otros términos, podría no aceptarse el criterio ontológico de Quine y asumir, como lo hace van Fraassen respecto de las entidades teóricas postuladas por las teorías científicas, una actitud agnóstica, esto es, aceptar el lenguaje de las matemáticas sin admitir que las entidades abstractas existen. No obstante, en este caso, más que adoptar una posición agnóstica, el empirista constructivo sucumbiría, en un escepticismo radical. Pues, en la medida en que las estructuras empíricas constituyen subestructuras de los modelos teóricos que definen la clase de modelos de la teoría, si se suspende el juicio con respecto a la existencia de los modelos teóricos, entonces debe suspenderse el juicio, también, en relación con los submodelos que describen los fenómenos. A fin de eludir la necesidad de optar entre el platonismo o el escepticismo, el sim-
Adecuación empírica y compromisos metafísicos
113
patizante del empirismo constructivo podría imaginar que su fundador defiende una posición ficcionalista respecto del lenguaje de las matemáticas, una postura cercana, en algún sentido, al formalismo. Pero esta interpretación parece incompatible con la concepción semántica de las teorías, a menos que se considere que los modelos y submodelos son meras inscripciones, conjuntos de manchas de tinta trazadas sobre un papel. Y si algún otro ferviente devoto ensayara la posibilidad de conciliar el particular empirismo de van Fraassen con el moderno intuicionismo, podríamos replicar que dada la fuerte ligazón que esta posición mantiene con el apriorismo kantiano resulta difícil imaginar cómo podría compatibilizarse con la postura del empirista constructivo. Las razones que ofrece van Fraassen a favor del enfoque semántico, y en consecuencia de su necesidad de hablar de modelos, son de naturaleza pragmática: la diferencia con otros enfoques –sostiene– es una cuestión de actitud, orientación y tácticas más bien que de doctrinas o tesis (van Fraassen 1989, p. 217). Pero, por otro lado, en su explícito propósito de hacer justicia a la afirmación de Worrall respecto de que la ciencia exhibe una acumulación de conocimiento, van Fraassen ha hecho una concesión al realista al incorporar en su empirismo el componente estructural. Así, el estructuralismo empirista que ahora nos presenta parece conducirlo, aun sin reconocerlo, a postergar su intención de despedirse de la metafísica.
Bibliografía Ladyman, J. 2000. What’s Really Wrong with Constructive Empiricism?: Van Fraassen and the Metaphysics of Modality. The British Journal for the Philosophy of Science 51: 837–56. McMullin, E. 2003. Van Fraassen Unappreceated Realism. Philosophy of Science 70(3): 455–78. Rosen, G. 1994. What is Constructive Empiricism? Philosophical Studies 74: 143–78. van Fraassen, B. C. 1980. The Scientific Image. Oxford: Oxford University Press. —–. 1989. Laws and Simmetry. Oxford: Oxford University Press. —–. 2001. Constructive Empiricism Now. Philosophical Studies 106: 151–70. —–. 2003. On Mac Mullin’s Appreceation of Realism concerning the Sciences. Philosophy of Science 71(1): 479–92. —–. 2006. Structure: its Shadow and Substance. The British Journal for the Philosophy of Science 57(2): 275–307.
Notas 1 En el debate acerca de los universales el conceptualismo adopta una variedad de matices de modo
que a veces se lo caracteriza como una forma de realismo moderado y en otras ocasiones se lo identifica con el nominalismo. Asimismo, los neoescolásticos ubican la concepción Kant y algunos neokantianos como Cassirer dentro del conceptualismo. Pareciera que es a posiciones de este último tipo a las que Quine alude cuando establece una correspondencia con el intuicionismo en matemáticas.
S CIENTIFIC P ROGRESS AS EXPRESSED BY T REE D IAGRAMS OF P OSSIBLE H ISTORIES O SVALDO P ESSOA J R . University of São Paulo
opessoa@usp.br
1. Two Modern Views on Scientific Progress Almost everyone agrees that there is progress in science: theories explain larger domains of reality with increasing precision, resulting in a constant appearance of new technological applications. But what is the nature of this progress? Karl Popper (1963, pp. 231–3) assumes that, as time goes by, scientific theories increasingly approximate a true description of the world. In his convergent realism, in which scientific theories steadily increase their degree of verisimilitude, there is an unchanging reality which acts as an “attractor” for the evolution of science. The real natural world serves as a pre-fixed aim towards which science is directed. In contrast to this view, Thomas Kuhn compares the progress of scientific ideas with the evolution of biological organisms. [The] resolution of revolutions is the selection by conflict within the scientific community of the fittest way to practice future science. [. . . ] And the entire process may have occurred, as we now suppose biological evolution did, without benefit of a set goal, a permanent fixed scientific truth, of which each stage in the development of scientific knowledge is a better exemplar (Kuhn 1962, pp. 172–3).
Even if Kuhn’s particular analogy with natural selection is considered unsatisfactory, there remains the interesting idea that there might be progress in science even if this does not happen in a prefixed direction. He returned to this notion in his “Reflections on my Critics” (Kuhn 1970, p. 264). A scientific revolution is the moment in which progress in science is highly sensitive to external influences, but in the long run the new paradigm is clearly superior to the former, according to usual criteria, such as precision of predictions and number of solved problems. So, in a sense, Kuhn is not a relativist in his notion of progress, since he conceives that the successor theory is superior in many aspects to the predecessor. On the other hand, he is close to relativism, since for him what makes a theory better than another is not its proximity to truth, as in Popper, but the fact that it is considered by the scientific community a better “tool for the practice of normal science”. This relativism would apply to transitions between paradigms, but not within a paradigm, during the normal science activity of puzzle solution.
Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 114–122.
Scientific Progress as expressed by Tree Diagrams of Possible Histories
115
2. Possible Histories of the Universe One way of clarifying the concept of “progress without an attractor” (without a prefixed truth towards which science would converge), defended by Kuhn, is to consider possible histories of science (Pessoa 2001, 2005). Let us suppose that on a certain date, say 1800, one hundred copies of the universe were created, and that the evolution of these different worlds were not deterministic, so that the history of each Earth would follow a different path. We would therefore have a hundred possible scenarios, one consisting of our actual history (which in fact occurred in our universe) and 99 “counterfactual” histories (i.e., possible histories that did not occur). One might ask how long it would take, in the different worlds, for the molecular structure of DNA to be discovered, for example, and which paths would be followed. It is plausible to assume that the times would be different, and that there would be more than one basic path. Notice that we are assuming that the discovery of DNA would sooner or later take place in every one of the worlds, except maybe in a world destroyed by a world war. Now, although we feel safe to say that the discovery of DNA would happen in all copies made in 1800 (except for a cataclysm), the analogous question about what biological theories would have been developed in these universes is more complicated. Theories involve sets of explicit and implicit theses, the formulation of which depends on slight changes in language, in perspective, etc. Such theories would account for objective facts which are possibly the same in all universes, but the theories themselves could be different from world to world, to a greater or lesser extent. What constrains should be imposed on the abstract generation of possible universes? How should one “build” possible worlds? First of all, we are not considering “logically possible” worlds, as is usually done in metaphysical and semantical discussions, but what might be called “causally possible” worlds. Consider a time t 0 , such as this present instant, and consider all the future possibilities of the universe. A scientist may decide to pursue a line of investigation, or he might choose another. A certain lottery ticket might be drawn, or maybe another. An earthquake might happen in ten minutes, or in ten days. Assuming, for the sake of the argument, that the future is to a certain degree “open”, i.e. that the precise evolution of the whole universe is not strictly deterministic, then it is meaningful to say that there are many different future “causally possible” scenarios of the world. A possible history (which includes counterfactual histories as well as the actual one) is simply an evolution of the universe that, at some time t 0 of the past (of our actual world), was a future causally possible scenario. As a consequence of this definition, any counterfactual history must be indexed by a certain time t 0 (of our actual history), when it was a future possibility. One “recipe” for constructing possible histories is to suppose that at the index time t 0 the universe is slightly “shaken” with a certain dispersion ∆S. For this pur-
116
Osvaldo Pessoa Jr.
pose one could invoke a ?tychist demon? from the pantheon of demigods used in the philosophy of physics (the most famous of which are the Laplace and the Maxwell demons). To make matters simple, one could suppose that the universe evolves in a deterministic way, while it is not shaken. With this situation, we won?t have much problem with Leibniz?s principle of the identity of indiscernibles, since each copy of the universe produced by shaking is supposed to be slightly different from the other. We would thus have a moment of stochasticity when creating possible universes, which would be followed by a period of deterministic evolution.1
Figure 1: Representation of six possible histories of the universe, which would evolve deterministically in time t, starting from slightly different initial conditions. Fig. 1 represents this situation qualitatively, for six possible histories of the universe. One might suppose, due to the notion of “sensibility to initial conditions” present in chaos theory, that the various universes which start out in slightly different states might end up diverging radically. If one also imposes the restriction of reversibility, two different possible histories would never evolve so as to converge to an exact same state. If the universe were completely deterministic, it would follow that our future is not open, and strictly speaking there would be only one possible history of the universe and of science. Our analysis of counterfactual histories would therefore lose its ontological import, and would only express our ignorance concerning the details of the evolution of science. On the other hand, if the universe were truly indeterministic, then not only would possible histories have ontological import, but our “shaking procedure” (which would have the effect of a randomizing oracle in deterministic computations) could be applied at different moments of time. One consequence of this would be that a precise state of the universe could be attained by more than one possible histories.
3. Possible Histories of Science In the previous section, we considered the evolution of the universe in microscopic detail, and considered a set of possible histories arising at a certain time t 0 by “shak-
Scientific Progress as expressed by Tree Diagrams of Possible Histories
117
ing” the universe to a certain degree ∆S of dispersion. Small differences in microscopic detail in general would not lead to immediately noticeable differences at a macroscopic level. As an illustration, consider the effects a very small earthquake might have in the lives of people living in a certain city. The daily routine would be changed a little, but there would be no immediate effects on the progress of science. But a boy who would become an important scientist might, because of the earthquake, have arrived late in science class, and received a reprimand from the teacher, and this could ultimately influence his decision later in life to become a musician instead of a scientist. If the boy’s name were Albert Einstein, what consequences would that have for the development of science? In this example, the effects of the earthquake would in most cases not affect Einstein’s career choice, but in a smaller number of possible worlds it might. Fig. 2 compares the evolution of six possible universes with the “coarse grained” evolution of science in these six worlds (the latter “supervenes” on the former). In most of the worlds considered, Einstein might have arrived at the theory of general relativity, but in the world in which he chose to become a musician, he would not. What would be the consequences for physics of this scenario in which Einstein becomes a violinist?
Figure 2: (a) Six possible universes generated in 1890. It is assumed that Einstein becomes a musician in on of them. (b) Possible histories of science, that supervene on the possible universes. In five of these, Newtonian theory of gravitation is replaced by general relativity, but in the sixth, a nonrelativistic Machian theory supersedes Newtonian theory. It is plausible to suppose that the seminal ideas of Einstein’s three great papers of 1905 would have appeared within a few years, possibly by other paths. The principles of the special theory of relativity were being studied by Lorentz and Poincaré; the theory of Brownian motion could have arisen with Smoluchowski; and the realization that light has a granular aspect had already been suggested by J. J. Thomson
118
Osvaldo Pessoa Jr.
in 1904, and the concept of the quantum of light could have probably arisen before 1922, which is roughly the date that Einstein’s theory was actually accepted. However, there is a certain consensus among cosmologists that the general theory of relativity, concluded in 1916, would not have appeared so quickly in a world in which Einstein had not become a physicist. It is plausible to speculate that, in this case, it would take around half a century for general relativity to be formulated. What would have happened in this period of time? Would Newtonian theory of gravity remain the best available theory? Probably not: at the turn from the 19th to the 20th centuries, many physicists were exploring nonrelativistic “Machian theories” (see Barbour & Pfister 1995), which introduces a velocity-dependent gravitational potential and implements Mach’s idea that only relative distances should be used in mechanics (no absolute space). Such theories have a larger explanatory power than classical theory, and probably would have been used to account for different effects, such as the advance of Mercury’s perihelion, until the appearance of the general theory of relativity or another equivalent theory. Counterfactual conjectures, such as the one just given, are seen with suspicion by historians of science, but they are just another way of stating causal claims. In the present example, one could say that the appearance of general relativity in 1916 had, as a necessary condition, Einstein’s genius and his profound understanding of the principle of relativity.
4. Conceptions of Progress expressed in Trees of Possible Histories In the previous section, we described a bifurcation of possible histories of science, obtained after “shaking” the universe at a certain time. Possible histories of science would initially follow the same path, but then most of the worlds would diverge, one after the other, from the main branch. In such diagrams, the horizontal axis represents qualitatively different theories or different formulations of theories (see further discussion in section 5). The notion of a bifurcation of possible histories (Fig. 3a) is consistent with both the views of Popper and Kuhn, in spite of the differences in their overall view of scientific progress. The distinction between these views is expressed in a direct way with tree diagrams of the possible evolution of science, The “objectivist” view is characterized by the claim that there is a convergence of scientific theories in most of the possible histories of science (Fig. 3b). This includes Popper’s realist conception, but it is a broader view than realism, as will be discussed in section 8. Kuhn’s conception of evolution as the selection of the fittest theory is represented, in Fig. 3c, as an “open” tree of possible histories of science. As stressed by Kuhn (1970, p. 264), there is progress if one considers different points of a same branch, but in principle science could follow diverging paths in different possible worlds.
Scientific Progress as expressed by Tree Diagrams of Possible Histories
119
Figure 3: Trees of possible histories of science. (a) The pattern of bifurcation of Fig. 2 is consistent with different views on the progress of science. (b) Objectivist views of scientific progress, such as Popper’s, would claim that possible histories of science end up converging. (c) Kuhn’s view is that the possible histories diverge, lacking an “attractor”. With such tree diagrams, one may express different views on the progress of science. Fig. 4, for example, would be a situation in which the initial bifurcation places the scientific field in a definitive paradigm. An illustration of this possibility could be a choice between an atomistic view of the physical world or an oscillatory (wavemotion) view. Needham (1962, pp. 3–14) has claimed that within the ancient Taoist worldview in China the oscillatory paradigm was dominant, and not the atomistic one, prevalent in Europe. If we assume that modern science could have arisen within the oscillatory paradigm (this is just an illustration, I wouldn’t want to commit myself to this hypothesis), we could imagine that DNA could be conceived not as a bunch of atoms, but as a set of resonant oscillations. Fig. 4 represents the view that there would be convergence of possible histories only within each paradigm.
Figure 4: Alternative hybrid model for the progress of science, with convergence of possible histories only within each general paradigm.
120
Osvaldo Pessoa Jr.
5. Distance between Scientific Theories In the trees of possible histories of science (Fig. 3), the horizontal axes represent qualitatively the distance between theories. If at a certain time two possible worlds arrive at very different theories (such as a nonrelativist Machian theory and general relativity), their branches will be represented far apart; but if the theories in the two worlds are similar, then their branches will be put close together. But how should one measure quantitatively the distance between theories? One suggestion would be to compare the empirical adequacy of the theories, i.e. the extension and precision with which each theory predicts the experimental data. But that is not what we want to capture, since different theories, built in different ways, could end up accounting for the same set of data. A better solution would be to compare the theses that compose each theory. If they share many theses, then they would be close, if not, then they would be distant. If the theories are axiomatized, then one might compare their postulates. If they are analyzed according to Lakatos’ (1979) methodology of scientific research programmes, then one could compare the theses in each hard core and protection belt, giving greater weight to the first. However, such a comparison might be difficult for two theories that are considered incommensurable. The problem of comparing the distance between theories is difficult and interesting, and will be left open. The semantical approach to scientific theories chooses to define a “theory” as the associated class of models, so that a same theory may have many different formulations. Thus, in the language of the semantical conception, our concern is to define not only the distance between different theories but also the distance between different formulations of theories. One should also remark that science doesn’t consist only of theories, but also of instruments, experiments, data, laws, explanations, and any other class of advances. Each of these aspects is important for science, and for each of them one could ask whether the different possible histories of science are more or less similar.
6. Possible Paths The history of science only happens once on Earth, so we have no direct access to counterfactual histories. However, within our actual history, scientists work in competition, following similar or distinct paths in the search of laws, in the construction of instruments, or the attainment of any other advance. Darwin and Wallace followed similar paths towards the independent discovery of the principle of natural selection, Heisenberg and Schrödinger followed dissimilar paths to reach quantum mechanics. Paths towards discovery may happen in a complete way in independent discoveries, or they may be aborted by a certain research group when another group makes the discovery. Hindsight allows the historian to conjecture about possible paths that
Scientific Progress as expressed by Tree Diagrams of Possible Histories
121
were initiated but remained incomplete in the past, or even about possible paths that were not even initiated. Each actual or counterfactual path can be considered part of a possible history of science. Thus, the study of actual independent paths is a valuable step towards conjecturing possible histories, besides being an interesting topic of study in itself.
7. Degree of Dispersion of Possible Histories or of Paths When one postulates possible paths or possible histories of science, how wide should the range of possibilities be taken? For example, if one starts with the actual situation of biology in 1830, one could imagine possibilities that are closer to factual history, or possibilities that are farther removed from actuality (such as the situation in which Mendelian genetics would be accepted before the theory of natural selection). This distinction reflects what might be called the “degree of dispersion” or “degree of fluctuation” ∆H of possible histories of science. Such a concept would not apply directly to a single possible history (which, by itself, has null dispersion), but to a set of them, and should be connected to the dispersion ∆S of possible universes. On the other hand, one might consider the degree of dispersion of paths ∆P within a history of science. In our actual history, such a dispersion might depend on political divisions, which tend to isolate research communities (such as the division between science in the Soviet Union and in the West), and on other social and institutional factors. If well defined, the dispersion of paths ∆P may be measurable in actual history.
8. Objectivist Theories The analysis of scientific progress terms of possible histories has led to the definition of an objectivist point of view, that conceives of possible histories of science as converging in the future, in opposition to the relativist position of Kuhn, which would admit an open tree of possible histories. Objective views might be formulated as stating that there is an “attractor” for the progress of science, but there are different possibilities for such an attractor. Scientific realism argues that such an attractor is constituted by the existence of an unchanging reality which science attempts to represent. Different varieties of realism disagree on the exact relation between theory and reality. Strong forms of realism conceive of science as mirroring nature in a faithful way, while weaker forms postulate only a one to one (or many to one) relation between reality and theory (see example in Pessoa 2006, pp. 177–9). Objectivism is also consistent with the notion that science converges not because of the unchanging nature of reality, but because of the way that knowledge is constructed. This might include Kant’s objective constructivism and Poincaré’s conventionalism, in which scientists choose the simplest of conventions. An analogy with
122
Osvaldo Pessoa Jr.
this mode of constructivism may be drawn with the notion of convergent evolution in biology, a tendency for living beings to occupy specific ecological niches (Pessoa 2006, pp. 175–7). We hope to have shown that the general consideration of possible histories of science can help to clarify different points of view in the philosophy of science.
References Barbour, J. B. & Pfister, H. (eds.) 1995. Mach’s Principle. Einstein Studies 6. Boston: Birkhäuser. Kuhn, T. S. 1962. The Structure of Scientific Revolutions. Chicago: University of Chicago Press. —–. 1970. Reflections on my Critics. In Lakatos, I. & Musgrave, A. (eds.) Criticism and the Growth of Knowledge. Cambridge: Cambridge University Press, p. 231–78. Lakatos, I. 1970. Falsification and the Methodology of Scientific Research Programmes. In Lakatos, I. & Musgrave, A. (eds.) Criticism and the Growth of Knowledge. Cambridge: Cambridge University Press, p. 91–196. Needham, J. 1962. Science and Civilization in China, vol. 4: “Physics and Physical Technology”, part I: “Physics”, in collaboration with W. Ling & K.G. Robinson. Cambridge: Cambridge University Press. Pessoa Jr., O. 2001. Counterfactual Histories: The Beginning of Quantum Physics. Philosophy of Science 68 (Proceedings): S519–S530. —–. 2005. Causal Models in the History of Science. Croatian Journal of Philosophy 5: 263–74. —–. 2006. Progresso Científico visto da Perspectiva das Histórias Contrafactuais. In Stein, S. I. A. & Kuiava, E. A. (eds.). Linguagem, Ciência e Valores: sobre as representações humanas do mundo. Caxias do Sul: Educs, p. 165–81. Popper, K. R. 1963. Conjectures and Refutations. London: Routledge and Kegan Paul.
Notas 1 The problem of whether the universe is deterministic or not is an open question. In general, given an
indeterministic model of a physical system, it is always possible to construct an equivalent deterministic model, introducing hidden parameters (this is also valid for quantum mechanics, as David Bohm showed in 1952). This equivalence allows that systems that are usually treated as stochastic be reformulated in a deterministic way, if this brings any advantage for the analysis or any satisfaction to our intuition. This is what we have chosen to do here.
O P ROGRAMA M ETAFÍSICO DE P IERRE D UHEM : A NALOGIA ENTRE A T ERMODINÂMICA G ERAL E A F ÍSICA A RISTOTÉLICA O SWALDO M ELO S OUZA F ILHO Academia da Força Aérea –Pirassununga-SP
melosf.oswaldo@gmail.com
Um dos mais interessantes e surpreendentes resultados da reflexão filosófica de Pierre Duhem, em que concorre a sua experiência como filósofo e historiador da ciência e físico teórico,1 é a analogia entre a Termodinâmica Geral ou Energética e a Física Aristotélica. Afora o aspecto filosófico e metodológico no qual ele procura aproximar o seu ponto de vista com o de Aristóteles,2 Duhem aponta uma semelhança ou paralelismo, não desprezível, entre a física peripatética e a Termodinâmica Geral. Esta semelhança, mais apropriadamente uma analogia, é anunciada por ele, pela primeira vez, no seu ensaio de 1896, intitulado “L’Évolution des Théories Physiques” e publicado no Revue des Questions Scientifiques. Diz Duhem (1896, p. 498) nesse ensaio: Esta ciência [a Termodinâmica Geral ou Energética], cuja construção parece ser a grande obra dos físicos do século XIX, como a construção da dinâmica foi a grande construção dos físicos do século XVIII, é verdadeiramente a Física na qual Aristóteles esboçou as grandes linhas; mas é a física de Aristóteles desenvolvida e aperfeiçoada pelos esforços dos experimentadores e dos geômetras, esforços continuados sem descanso desde perto de trezentos séculos.
A base principal de comparação reside em uma das mais importantes características da Energética, responsável por defini-la como a “Física da Qualidade”. Essa característica encontra-se na noção, fornecida pela experiência, de “qualidades primeiras”.3 As qualidades primeiras são umas espécies de âncora empírica que, uma vez representadas simbolicamente por meio de grandezas matemáticas, fornecem os elementos básicos na constituição das leis experimentais e hipóteses teóricas da concepção duhemiana de teoria física e justificam a sua designação de “Física da Qualidade” que a torna próxima da Física aristotélica. Em outra passagem do “L’Évolution des Théories Physiques” diz ainda Duhem (1896, p. 497–8) sobre isso: Mas convém que esta ciência, mais ampla que a antiga mecânica, cesse de ser consagrada somente ao estudo do movimento local, para abarcar as leis gerais de toda transformação das coisas materiais, as leis do movimento físico entendido no sentido amplo de Aristóteles; convém que ela trate não somente de mudança de lugar no espaço, mas também de todo movimento de alteração, de geração e de corrupção. Ora, esta ciência não está mais para ser criada; as grandes linhas estão desde já marcadas; elas estão sendo traçadas pelos físicos desse século que, buscando reduzir o calor ao movimento, foram conduzidos a condensar os ramos Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 123–132.
124
Oswaldo Melo Souza Filho
mais diversos da física em uma ciência única que eles denominaram a Termodinâmica, que Rankine, afirmando pela primeira vez seu novo papel, denominou Energética.
Assim, a Física da Qualidade é muito mais ainda um programa de pesquisa que pretende indicar os rumos a serem seguidos pela física teórica. No seu livro de 1903, L’Évolution de la Mécanique, Duhem reafirma o paralelo entre a Termodinâmica Geral, entendida como Física da Qualidade, e a Física aristotélica, colocando-a como um modelo de teoria física capaz de evitar as “quimeras” e as “complicações” das teorias reducionistas de tipo mecanicista. Diz Duhem (1992, p. 197–8) sobre isso: Tentar reduzir à figura e ao movimento todas as propriedades dos corpos parece um empreendimento quimérico, seja porque tal redução será obtida ao preço de complicações que apavoram a imaginação, seja mesmo porque ela estará em contradição com a natureza das coisas materiais. Somos então obrigados a aceitar em nossa Física outra coisa que os elementos puramente quantitativos de que trata o geômetra, de admitir que a matéria têm qualidades; ao risco de nos censurar o retorno às virtudes ocultas, somos forçados a considerar como uma qualidade primeira e irredutível esta pela qual um corpo é aquecido, ou iluminado, ou eletrizado, ou imantado; em uma palavra, renunciando às tentativas renovadas sem interrupção desde Descartes, convém vincular nossas teorias às noções mais essenciais da Física peripatética. [grifo nosso]
Este paralelismo entre a Termodinâmica Geral e a Física aristotélica é apresentado, com maiores detalhes, por Duhem no ensaio de 1905, intitulado “Physique de croyant”. Nesse ensaio ele discute e questiona com bastante rigor a natureza e o alcance dessa apreensão das similaridades, ou analogias, entre uma teoria física moderna e uma teoria física antiga. Duhem (1989c, p. 144, 149) deixa claro que essa analogia é resultado não do método positivo (experimental ou matemático) utilizado pelos cientistas, mas sim da metafísica. Portanto, é como metafísico e não como físico que Duhem se pronuncia a esse respeito, reafirmando no ”Physique de croyant” as principais teses filosóficas contidas em seus trabalhos anteriores tais como o “Physique et Metaphysique” e o “L’École Anglaise”, ambos de 1893. Sendo assim, é no contexto do “essencialismo metafísico duhemiano” (ver nota 2) que se pode apreciar o alcance e a natureza da analogia entre a Termodinâmica Geral e a Física aristotélica. Há três aspectos desse essencialismo que são fundamentais nesta apreciação feita por Duhem no “Physique de croyant”. O primeiro, é o que caracteriza o objeto da metafísica como legítimo tanto quanto o da física. Esta legitimidade é garantida pela tese ontológica (Duhem 1989b, p. 42) apresentada no “Physique et Metaphysique” e que afirma existir uma essência das coisas materiais, causa eficiente dos fenômenos. Duhem desenvolve a partir daí uma concepção de investigação metafísica que permite ao filósofo, legitimamente, empreender a construção de um sistema metafísico,
O Programa Metafísico de Pierre Duhem
125
chamado de “cosmologia” (Duhem 1989b, p. 42) ou “filosofia da natureza” (Duhem 1989c, p. 147): o estudo da essência das coisas materiais ou da natureza da matéria bruta, causa dos fenômenos e razão de ser das leis físicas. O segundo aspecto é o conceito de classificação natural, tal como desenvolvido no La Théorie Physique de 1903. Neste livro (Duhem 1981, p. 35), o conceito de classificação natural possui duas características fundamentais: a primeira, é seu caráter ontológico, pois, dizer que a teoria física tende a ser uma classificação natural é equivalente a afirmar que a ordem lógica da teoria reflete uma ordem ontológica fundamental; a segunda, é a sua historicidade, implícita na afirmação sobre a tendência objetiva da teoria física tornar-se uma classificação natural, isto é, em aproximar-se da forma perfeita e ideal cuja verificação só é possível em um contexto histórico de sucessão de teorias físicas, vistas no seu aspecto matemático-representacional. Esta tendência independe das decisões metodológicas dos físicos. O terceiro aspecto é o conceito de teoria ideal e perfeita enquanto uma teoria única e coerentemente ordenada, conforme exposto no ”L’École Anglaise” como um princípio axiológico de tendência à perfeição (Duhem 1989d, p. 79). Este princípio axiológico de perfeição da ciência operacionaliza, em um nível metodológico, a aproximação da teoria física em direção à ordem ontológica fundamental,4 mediante a construção de uma teoria física única de caráter axiomático. Estes três aspectos fundamentam o realismo metafísico e convergente de Duhem que dá plausibilidade à analogia. Analisemos o sentido dessa plausibilidade. Antes de qualquer coisa, cabe ressaltar uma distinção muito importante que não fica muito clara na discussão realizada por Duhem (1989c, p. 144–9) na seção 8 do “Physique de Croyant”. Por um lado, temos a convergência entre a teoria física ideal e perfeita e a explicação metafísica que se justifica plenamente no âmbito do essencialismo metafísico duhemiano. Sendo assim, “deve existir analogia”, diz Duhem (1989c, p. 147), “entre a explicação metafísica do mundo inanimado e a teoria física perfeita, que tendesse ao estado de classificação natural”. Nessa citação, Duhem atribui ao termo analogia um sentido metafísico, justificável pelas teses de seu essencialismo. “É certo que uma explicação metafísica completa da natureza das coisas materiais nos forneceria, ipso facto, a mais perfeita das teorias físicas”, diz Duhem (1989b, p. 48) no “Physique et Metaphysique”. Por outro lado, Duhem (1989c, p. 147) admite no “Physique de Croyant” que “ninguém possui, nem jamais possuirá a teoria física perfeita”. Certamente, a teoria física perfeita é uma teoria física ideal que se justifica por meio de argumentos axiológicos e ontológicos. Porém, como lidar com a questão de buscar analogias entre uma teoria física real, necessariamente “imperfeita” e “provisória” (Duhem 1989c, p. 147), e uma doutrina cosmológica, necessariamente hipotética como todo sistema metafísico (Duhem 1989b, p. 77)? É nesse ponto que podemos entender o outro sentido em que o termo analogia é empregado e que nos esclarecerá acerca do alcance e natureza da similaridade entre a Termodinâmica Geral e a Física peripatética. Assim, a distinção, por nós referida no início, é entre esses dois sentidos do termo analogia: o primeiro, enquanto parte constitutiva das teses metafísicas e, conseqüentemente, justificado por elas como um
126
Oswaldo Melo Souza Filho
horizonte ideal; o segundo, enquanto atividade do cosmólogo envolvendo a avaliação de uma teoria física atual e um sistema metafísico e cujo resultado, “permanece sempre problemático em alto grau e nunca se impõe à razão de maneira inexpugnável” (Duhem 1989b, p. 77). O primeiro sentido do termo analogia torna possível o exercício do segundo, pois fundamentalmente afirma que uma teoria física, não sendo um simples sistema de símbolos criados de forma arbitrária e artificial, mas tendo a classificação natural das leis experimentais como forma limite, se corresponde cada vez mais com o sistema metafísico que se propõe a organizar a essência do mundo inanimado. Enquanto atividade do cosmólogo, ou metafísico, a busca de analogias é coerente com a precedência epistemológica da física perante a metafísica, pois “é graças a essa analogia que os sistemas da física teórica podem vir em auxílio do progresso da cosmologia” e também “pode sugerir ao filósofo todo um conjunto de interpretações” (Duhem 1989c, p. 146). Duhem aponta duas limitações dessa investigação e, para enfrentá-las, sugere as respectivas prescrições metodológicas que ele se refere como “precauções” (Duhem 1989c, p. 148). A primeira limitação refere-se à incapacidade demonstrativa da analogia, conseqüência de serem as proposições, respectivamente, da cosmologia e da física teórica, concernentes a termos de natureza diferente. Portanto, os juízos da cosmologia não podem provar, como verdadeiros ou falsos, os teoremas da física teórica e viceversa. A segunda limitação consiste no fato de que é a teoria física ideal que guarda analogia com o sistema metafísico e não a teoria física tal como é praticada pelos físicos. Ora, mas ninguém tem nem terá posse da teoria física ideal e perfeita, entendida, no quadro da prática do físico teórico, como um conceito regulador. Isso obriga, então, que se tome uma determinada teoria física, tal como é professada efetivamente pelos físicos, e, à base de uma hipótese5 sobre suas partes essenciais, fazê-la desempenhar o papel da teoria física ideal. Só desse modo pode-se efetuar a analogia. Portanto, deve-se necessariamente penetrar em um terreno de conjecturas no qual o metafísico deverá, “contentar-se com pressentimentos não analisáveis sugeridos pelo espírito de finesse [grifo nosso], que o espírito geométrico se declarará incapaz de justificar.” (Duhem 1989c, p. 147) Vejamos agora as respectivas prescrições metodológicas sugeridas por Duhem (1989c, p. 147) no “Physique de Croyant” com “extrema prudência” e “extrema precaução” para se invocar essa analogia. Do mesmo modo que as limitações, as prescrições são também duas, a saber: 1a¯ ) “conhecer exata e minuciosamente” a teoria física a ser posta em analogia com um determinado sistema metafísico; 2a¯ ) conhecer a evolução das teorias físicas, ou seja, conhecer não só as teorias físicas atuais, mas também as passadas.
O Programa Metafísico de Pierre Duhem
127
A primeira prescrição procura evitar o “conhecimento vago e superficial” que, “se deixará lograr por semelhanças de detalhes, por aproximações acidentais, e mesmo por assonâncias de palavras, que tomará como marcas de uma analogia real e profunda.” (Duhem 1989c, p. 148) A segunda prescrição mostra como Duhem vê no contexto histórico uma fonte de sugestões capaz não só de guiá-lo na escolha efetiva de hipóteses, mas também no discernimento da tendência evolutiva da física teórica. O espírito de finesse, que diz Duhem, no “Physique de Croyant” (1989c, p. 147), ser suscetível de sugerir “pressentimentos não analisáveis”, nutre-se no conhecimento histórico e, através dele, pode, muito melhor do que aqueles que não o tomam em consideração, prognosticar acerca dos rumos da teoria física. Diz ele (1989c, p. 148) sobre isso: Não se trata, pois, para o filósofo, de comparar à sua cosmologia a física tal como ela é, congelando, de alguma forma, a ciência em um instante preciso de sua evolução, mas de apreciar a tendência da teoria, de adivinhar o fim para o qual ela se dirige. Ora, nada pode guiá-lo seguramente nesta adivinhação da rota que seguirá a física, a não ser o conhecimento do caminho que ela já percorreu. (. . . ) Assim, a história da física nos deixa suspeitar alguns traços da teoria ideal à qual tende o progresso científico, da classificação natural que será como uma imagem da cosmologia.
Essa teoria, sobre a qual convergem “todas as tendências legítimas e fecundas das teorias anteriores” (Duhem 1989c, p. 151), é a Termodinâmica Geral que, sem ser a teoria física ideal, é a que melhor dela se aproxima, segundo Duhem. É nesse conjunto de considerações que Duhem efetiva a analogia da Termodinâmica Geral com a Física peripatética; uma analogia que “é tanto mais surpreendente quanto menos visada, mais marcante pelo fato de que os criadores da termodinâmica eram estranhos à filosofia de Aristóteles.” (Duhem 1989c, p. 151) Antes de proceder à apreciação das similaridades apresentadas por Duhem entre a Energética e a Física de Aristóteles,6 gostaríamos de enfatizar que essa analogia é efetuada por ele tomando da primeira “indicações apenas esquematizadas” (1989c, p. 150), e da segunda, as suas “doutrinas essenciais” (1989c, p. 151). Portanto, Duhem (1989c, p. 147) não dissimula, nem tenta diminuir o caráter altamente hipotético e a imensa fragilidade desse exercício, uma vez que ele se põe a realizar duas ordens de interpretação: uma relativa à Termodinâmica Geral como próxima da teoria física ideal, e a outra relativa à Física peripatética como a cosmologia que reflete a realidade ontológica fundamental. É nessa base que Duhem estabelece quatro analogias entre essas duas doutrinas. A primeira analogia é aquela que proporcionou a identificação da Termodinâmica Geral como Física da Qualidade com a Física aristotélica, anunciada por Duhem desde 1896. Tanto a Termodinâmica Geral como a Física de Aristóteles concedem à noção de quantidade e qualidade uma igual importância: a primeira, representando igualmente por meio de símbolos numéricos as diversas grandezas das quantidades e
128
Oswaldo Melo Souza Filho
as diversas intensidades das qualidades e a segunda considerando igualmente as categorias de qualidade e quantidade. Os símbolos numéricos da Termodinâmica Geral se correspondem com as noções físicas dos fatos observados e as categorias aristotélicas de quantidade e qualidade se correspondem com os atributos da substância. Assim, a Termodinâmica Geral, enquanto teoria física, permanece dentro de sua atribuição de estudar os fenômenos e a Física aristotélica, enquanto cosmologia, procura estudar a essência das coisas materiais. A segunda analogia é relativa ao conceito de movimento. A noção de movimento na Energética é uma concepção de alteração geral das grandezas qualitativas ou quantitativas que representam as propriedades dos fenômenos físicos tais como a mudança de lugar no espaço, a variação de temperatura, a mudança de estado elétrico, de imantação, concentração etc. A Termodinâmica Geral não concebe nenhum programa que vise reduzir, a priori, uma forma de movimento à outra ou ao movimento local especificamente. Do mesmo modo, a Física peripatética não concebe nenhum reducionismo de uma forma de movimento a outra, tratando as diferentes formas do movimento geral como uma modificação dos atributos de uma substância. A terceira analogia abarca uma outra ordem de transformações, mais profunda do que aquela tratada pelo conceito de movimento. No que diz respeito à Termodinâmica Geral essa transformação penetra os compostos químicos básicos, e, no que diz respeito à Física aristotélica ela atinge a substância e não só os seus atributos. Aristóteles fala de um tipo de transformação, denominada geração, que cria uma nova substância; ao mesmo tempo, ocorre uma outra transformação, designada corrupção, que aniquila uma substância já existente. Em uma das mais importantes partes da Termodinâmica Geral, a Mecânica Química, atual Físico-Química, representa-se simbolicamente diversos corpos ou compostos, dotados de massa, que podem ser criados ou aniquilados em uma reação química. Sobre isso, Duhem (1989c, p. 151) diz ainda no “Physique de Croyant” que “no seio da massa do corpo composto, as massas dos componentes não subsistem senão em potência.” Acerca da noção aristotélica de potência, Duhem não acrescenta qualquer outra informação no texto para que possamos apreciar melhor a sua interpretação e a própria analogia. A quarta e última analogia é das mais interessantes, envolvendo os conceitos termodinâmicos de equilíbrio estável e entropia. A Termodinâmica Geral concebe a condição de um sistema físico, chamada de estado do sistema, como caracterizada pelos valores assumidos pelas grandezas macroscópicas, tais como pressão, temperatura, massa, etc. Um estado de equilíbrio do sistema é aquele no qual nenhuma mudança ocorre em suas grandezas. Um estado de equilíbrio estável é aquele que uma vez o corpo seja retirado desse estado, a ele sempre retorna. Tomando-se um sistema físico qualquer, isolado, pode-se associar a ele uma grandeza chamada entropia. O estado de equilíbrio estável desse sistema corresponde ao máximo valor da entropia. É isso exatamente o que estabelece a segunda lei da Ter-
O Programa Metafísico de Pierre Duhem
129
modinâmica, ou princípio de Carnot e Clausius como Duhem a denomina: em um sistema isolado os fenômenos sempre ocorrem no sentido do crescimento da entropia, conduzindo-o, portanto, a seu estado de equilíbrio (Duhem 1989c, p. 154). Para comparar com a Termodinâmica Geral, Duhem (1989c, p. 152–3) toma da Física aristotélica a teoria do lugar natural dos elementos. Segundo Aristóteles existem cinco elementos na natureza que se podem colocar na seguinte ordem, indo do mais pesado ao mais leve: terra, água, ar e fogo. O quinto elemento não tem peso e forma as esferas celestes e os astros. As esferas celestes são dispostas em círculos concêntricos indo da esfera mais externa, que envolve as estrelas, até a de menor raio, que envolve a Lua, passando pelas esferas de Saturno, Júpiter, Sol, Mercúrio, Marte e Vênus. O elemento éter não pode ser gerado nem corrompido, permitindo-se somente o movimento circular das esferas que carregam consigo os astros correspondentes. Abaixo da esfera da Lua, no chamado mundo sublunar, ocorrem as transformações de geração e corrupção, indicativos da transformação, uns nos outros, dos quatro elementos. Para cada um deles, além das qualidades características, há um lugar natural onde aí permanecem em repouso, podendo ser somente retirados daí por uma força. Tão logo essa força cesse, o elemento retorna, por movimento natural, ao seu lugar natural. A terra, o elemento mais pesado, tende sempre para o centro do universo aristotélico. O fogo, o mais leve dos elementos, dirige-se violentamente para fora desse centro em direção à concavidade da esfera lunar, e aí permanece. O ar situa-se abaixo do fogo e a água abaixo do ar e acima da terra. Segundo Duhem (1989c, p. 153), a física aristotélica afirma que todo ser tende à sua perfeição e é nesse lugar natural que a forma substancial de cada elemento atinge a sua perfeição. Qual a analogia, perguntamo-nos, entre a teoria do lugar natural da Física aristotélica e as noções de equilíbrio estável e entropia da Termodinâmica Geral? Como Duhem (1989c, p. 147) mesmo admitiu “onde o pensador vê uma analogia, um outro, mais vivamente tocado pelos contrastes dos termos comparados que por suas semelhanças, pode perfeitamente ver uma oposição.” Sendo assim, levado muito mais pelo desejo de persuasão do que pela pretensão de convencer pelo espírito lógico, Duhem empreende uma interpretação dos termos da Física aristotélica, adequando-a aos termos da Energética. Diz ele então, referindo-se à Física peripatética: Encontramos a afirmação de que se pode conceber um estado em que a ordem do universo seria perfeita; que esse estado seria, para o mundo, um estado de equilíbrio, e ainda mais, um estado de equilíbrio estável. Retirado desse estado, o mundo tende a voltar a ele, e todos os movimentos naturais, todos os que se produzem entre os corpos sem nenhuma intervenção de um motor animado, são produzidos por essa causa. Todos eles tem por objeto conduzir o universo a esse estado de equilíbrio ideal, de modo que essa causa final é, ao mesmo tempo, sua causa eficiente. (Duhem 1989c, p. 153–4)
Fica claro que o conceito de lugar natural na Física peripatética desempenha o
130
Oswaldo Melo Souza Filho
mesmo papel que o conceito de equilíbrio estável na Termodinâmica Geral, e, embora não o diga explicitamente, podemos depreender do texto acima citado que Duhem associou a tendência à perfeição dos seres de Aristóteles ao princípio de crescimento da entropia da Energética. É digno de nota, a esse respeito, o trabalho de Katalin Martinás (1991, p. 285–303), apresentado recentemente em uma conferência sobre história e filosofia da Termodinâmica, analisando as similaridades entre a Física aristotélica e a moderna Termodinâmica dos Processos Irreversíveis. Nesse ensaio a autora mostra em várias tabelas (ver Martinás 1991, p. 289, 290, 294–8) essa similaridade sugerindo interpretar a física aristotélica como uma “fenomenologia geral” ou ainda como uma “termodinâmica antiga”. Cabe notar que Martinás não menciona em sua bibliografia o “Physique de croyant” de Duhem. Em compensação cita o L’Évolution de la Mécanique que é suficiente para Martinás (1991, p. 287) apontar a profunda relação da Física da Qualidade ou Nova Mecânica duhemiana e a Física aristotélica. São fundamentais os pontos de coincidência do ensaio de Martinás com a análise de Duhem no “Physique de croyant”. Assim, Martinás (1991, p. 290) estabelece, no que diz respeito às variáveis de estado, a correspondência das noções aristotélicas de quantidade e qualidade com as de variáveis extensivas e intensivas; a correspondência do conceito de lugar natural com o de estado de equilíbrio da Termodinâmica (Martinás 1991, p. 290); e, finalmente, a noção aristotélica de movimento em direção ao lugar natural correspondendo ao processo termodinâmico que almeja contrabalançar distribuições não homogêneas (Martinás 1991, p. 294). Nessa última analogia Duhem (1989c, p. 154) no “Physique de Croyant” fala simplesmente em crescimento da entropia. Outras similaridades apontadas por Martinás confirmam a “adivinhação infinitamente delicada e aleatória” (1989c, p. 150) de Duhem a respeito dos rumos, não da física teórica como um todo, mas da Termodinâmica fenomenológica como uma teoria geral dos sistemas irreversíveis.7 Sem dúvida, a Termodinâmica Geral de Duhem pode ser considerada como um antecedente da moderna Termodinâmica dos Processos Irreversíveis (ver de Groot e Mazur 1984, p. 1 e Glansdorff 1987, p. 658). No entanto, cumpre-nos assinalar que — por almejar um escopo dos mais amplos, contido no problema geral da estabilidade e equilíbrio dos sistemas físicos e por apresentar uma base matemática das mais avançadas, representada pelos trabalhos em equações diferenciais de Poincaré, Liapounov e Hadamard - Duhem orientava a sua Termodinâmica Geral em um sentido que mais se aproximava da perspectiva formal contida atualmente na teoria matemática dos sistemas dinâmicos (Thom 1985, p.27; Ruelle 1993, p.63; Abraham e Marsden 1978, p. XIX).
O Programa Metafísico de Pierre Duhem
131
Referências Abraham, R. e Marsden, J. E. 1978. Foundations of Mechanics. Reading, Mass.: The Benjamin/ Cummings Publishing Company, Inc. Casimir, H. B. G. 1945. On Onsager’s Principle of Microscopic reversibility. Reviews of Modern Physics 17(2–3): 343–50. De Groot, S. R. e Mazur, P. 1984. Non-Equilibrium Thermodynamics. New York: Dover Publications, Inc. Duhem, P. 1896. L’Évolution des théories physiques du XVIIe siècle jusqu’à nos jour. Revue des Questions Scientifiques, 2e série, t.V, : 462–99. —–. 1917. Notice sur le titres et travaux scientifiques de Pierre Duhem redigée par lui-même lors de sa candidature à l’Academie des Sciences (mai 1913). Mémoires de la Société des Sciences Physiques et Naturelles des Bordeaux, 7e sér., Tome I, Paris: Gauthier-Villars, pp.71– 169. —–. 1954. The Aim and Structure of Physical Theory. Princeton, N.J.: Princeton University Press. —–. 1980. The Evolution of Mechanics. Netherlands: Sijthoff & Noordhoff. [L’Évolution de la Mécanique. Paris: A. Joanin, 1903.] —–. 1981. La Théorie Physique: son objet sa structure. da 2a edição francesa de 1914 (Paris: Marcel Riviè & Cie), revista e aumentada, Paris: J. Vrin; 1906, Paris: Chevalier et Rivière. —–. 1989a, Algumas Reflexões sobre as Teorias Físicas. Ciência e Filosofia 4: 13–37. FFLCHUSP. [Quelques réflexions au sujet des théories physiques. Revue des Questions Scientifiques, t.I, XXXI, pp. 139–77, 1982]. —–. 1989b. Física e Metafísica. Ciência e Filosofia 4: 41–59. FFLCHUSP. [Physique et Metaphysique. Revue des Questions Scientifiques, t.II, XXXIV, pp. 55–83, 1893.] —–. 1989c. Física do Crente. Ciência e Filosofia 4: 121–54. FFLCHUSP. [Physique de Croyant. Annales de Philosophie chrétienne, t.I, pp. 44–67 e pp. 133–59, 1905.] —–. 1989d. A Escola Inglesa e as Teorias Físicas. Ciência e Filosofia 4: 63–84. FFLCHUSP. [L’École Anglaise et les Théories Physiques. Revue des Questions Scientifiques, t.II, XXXIV, pp. 345– 78, 1893.]. —–. 1992. L’Évolution de la Mécanique. Paris: J. Vrin. 1903, A. Joanin, Paris. Eckart, C. 1940. The Thermodynamics of Irreversible Processes. I. The Simple Fluid. Physical Review 58: 267–69; II. Fluid Mixtures, idem, p. 269–75; III. Relativistic Theory of the Simple Fluid, idem, p. 919–24. Glansdorff, P. 1987. Irreversibility in Macroscopic Physics: From Carnot Cycle to Dissipative Structures. Foundations of Physics 17(7): 653–66. Martinás, K. 1991. Aristotelian Thermodynamics. In Thermodynamics: History and Philosophy (Veszprém, Hungary, 23-28 july, 1990), Eds. K. Martinás, L. Ropolyi & P. Szegedi, World Scientific, p. 285–303. Meixner, J. 1941. Zur Thermodynamik der Thermodiffusion. Annalen der Physik 39(5): 333–56. Onsager, L. 1931. Reciprocal Relations in Irreversible Processes, I. Physical Review 37: 405–26; II. Physical Review 38: 2265–79. Prigogine, I. 1947. Etude Thermodynamique des Phénomenès Irreversibles. Liège: Desoer. Ruelle, D. 1993. Acaso e Caos. São Paulo: Editora UNESP. Souza Filho, O. M. 1996. Os Princípios da Termodinâmica e a Teoria da Ciência em Pierre Duhem, Tese de Doutorado defendida junto ao Departamento de Filosofia da FFLCH-USP. Não publicado.
132
Oswaldo Melo Souza Filho
Thom, R. 1985. Parábolas e Catástrofes. Lisboa: Publicações Dom Quixote.
Notas 1 O empenho filosófico de Duhem é inteiramente voltado para justificar o seu projeto científico. Acres-
centaríamos que o mesmo sucede com o seu programa historiográfico. Desse modo, a construção da Termodinâmica Geral ou Energética é a atividade central de Duhem. Convidado a ocupar a cadeira de História da Ciência na Universidade de Paris em 1913, Duhem recusou-a alegando ser um físico teórico: “não quero entrar em Paris pela porta dos fundos”, disse ele (Duhem 1917), em uma resposta indignada com o não reconhecimento de sua atividade principal. 2 É no “Physique et Metaphysique” de 1893 que Duhem (1989b, p. 51) mostra a concordância entre suas teses ontológicas e epistemológicas, constitutivas do que denominamos “essencialismo metafísico duhemiano” (Souza Filho 1996, p. 62), e a filosofia aristotélica. 3 As qualidades primeiras representam propriedades dos fenômenos físicos, podendo aparecer na forma de propriedades qualitativas (calor, eletrização, magnetização, iluminação, etc.) ou quantitativas (força, distância, tempo etc.). Essas propriedades que constituem as qualidades primeiras não se reduzem, a priori, umas às outras, e nem significa que novas propriedades, qualitativas ou quantitativas, não possam ser acrescentadas a estas. 4 “Ora, se sabemos poucas coisas sobre as relações que possuem entre si as substâncias materiais, isso se deve a pelo menos duas verdades das quais estamos seguros; a saber, que essas relações não são nem indeterminadas, nem contraditórias; (. . . ) ao fazer desaparecer as incoerências da teoria, teremos alguma chance de aproximá-la dessa ordem, de torná-la mais natural e, portanto, mais perfeita.” (Duhem 1989d, p. 79) 5 “Ora, para quem conhece somente o que é, como é difícil adivinhar o que deve ser!”, diz Duhem (1989c, p. 147) no “Physique de Croyant” sobre o caráter altamente especulativo dessa hipótese. Todavia, se por um lado, Duhem reconhece a dificuldade de adivinhar qual deve ser a teoria física ideal, por outro, ele não tem dúvidas em admitir, com toda suspeição que isso possa acarretar, que a Energética ou Termodinâmica Geral aproxima-se desse ideal de perfeição. 6 Não é nosso objetivo avaliar a interpretação duhemiana da Física de Aristóteles, mas tão somente expô-la e situá-la no quadro de sua filosofia da ciência. Observamos que Duhem (1989c, p. 152) menciona os livros que contém a Física aristotélica — Physica, De Generatione et Corruptione, De Caelo e os Meteoros — sem, no entanto, preocupar-se em detalhar a sua análise associando as teorias aristotélicas ao texto respectivo. 7 Sobretudo a partir dos trabalhos de L. Onsager (1931), C. Eckart (1940), J. Meixner (1941), H. B. G. Casimir (1945) e de I. Prigogine (1947) os conceitos termodinâmicos foram desenvolvidos e aprimorados para descrever mais adequadamente os processos irreversíveis. O conceito de produção de entropia como o produto das afinidades ou forças generalizadas, relacionadas com a não uniformidade do sistema, pelo fluxo, relacionada com a derivada de um parâmetro extensivo, aprofunda o quadro das analogias estabelecidas por Duhem e que foi explorada por Martinás.
D ETERMINISMO, I NDETERMINISMO E T EORIA Q UÂNTICA EM P OPPER R AQUEL S APUNARU Pontifícia Universidade Católica–RJ
raquel.anna@ig.com.br
Logo na primeira edição da Lógica da Pesquisa Científica, de 1934, e, posteriormente, em sua Autobiografia Intelectual, de 1975, Karl Popper confrontou uma interpretação freqüentista contra uma interpretação subjetivista da probabilidade. A primeira, formulada por Richard Von Mises, afirmava, resumidamente, que se pudéssemos repetir ou observar um experimento um grande número de vezes e registrar quantas vezes um evento A ocorreria, então, a probabilidade de A, P (A), seria igual ao número de vezes em que A ocorre dividido pelo número total de repetições do experimento (Nagel 1969, p. 19–26). Na segunda, a probabilidade era interpretada como uma medida de grau de convicção ou como uma quantificação de um ponto de vista particular (Popper 1974, p. 161) e isto denotava que não seria preciso que um experimento fosse não-repetitivo para considerar sua probabilidade de ocorrer subjetivista. Em linhas gerais, a interpretação subjetivista alegava que uma proposição verdadeira seria redutível ao sentimento de aprovação, e uma proposição falsa, ao sentimento de desaprovação. Explicando de outro modo, o verdadeiro ou o falso, dependeria da mente. No entanto, para a interpretação objetivista, o conhecimento poderia ser caracterizado como algo acerca de uma realidade independente da mente, que se exprimiu através de juízos que continham proposições verdadeiras e estas proposições seriam verdadeiras, e não falsas, porque representariam com precisão uma realidade. Por fim, Popper se decidiu, neste primeiro momento, pela interpretação freqüentista e justificou sua escolha afirmando (Popper 1974, p. 166–9): A probabilidade criou-me problemas, assim como o trabalho, levando-me a estudo agradável e estimulante. O problema fundamental, examinado na Lógica da Pesquisa Científica, era o de prova de enunciados probabilísticos da Física. Esse problema era um desafio importante para minhas concepções gerais acerca da Epistemologia e eu o resolvi com o auxílio de uma idéia que fazia parte integral dessa epistemologia e não, penso, de uma idéia ad hoc. (. . . ) Na Lógica da Pesquisa Científica, eu sublinharia que havia muitas interpretações possíveis para a noção de probabilidade, ressaltando que somente uma teoria das freqüências (como a proposta por Von Mises) seria aceitável nas Ciências Físicas. (. . . ) (Popper 1977, p. 107–8)
Posteriormente, aventarei, de modo sucinto, a interpretação da propensão substituta de Popper da interpretação objetiva de probabilidade em termos de freqüência. Esta interpretação, criada por Popper, seria uma nova interpretação objetiva, fortemente relacionada com a teoria freqüentista anteriormente mencionada: nas palavras do próprio autor, ela seria “(. . . ) uma teoria de probabilidades, em termos de Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 133–140.
134
Raquel Sapunaru
teoria freqüencial (modificada)” (Popper 1974, p. 164). Por enquanto, vale lembrar a letra de Popper sobre a interpretação objetiva das teorias, idéia que acompanhou o filósofo por toda sua vida: “Manifesto, assim, a fé que tenho numa interpretação objetiva, acima de tudo por acreditar que somente uma teoria objetiva é capaz de explicar a aplicação dos cálculos de probabilidades em ciência empírica.” (Popper 1974, p. 164). Historicamente falando, o interesse de Popper na questão da probabilidade advinha de duas fontes distintas, a saber: (1) dos problemas da Física, mais especificamente da Teoria Quântica em plena ascensão e (2) de sua crítica à tese do Círculo de Viena de que a verificação das teorias científicas poderia ser medida via cálculo de probabilidades.1 Lembro que para Popper o verificacionismo não seria o bom método de ajuizar teorias e, portanto, nosso filósofo estaria amarrado à crítica ao uso do cálculo da probabilidade para asseverar sua tese falseacionista: segundo Popper a falsificação deveria substituir a verificação enquanto critério de cientificidade de teorias. Na letra do autor: Todavia, para poder abordar, em toda a sua generalidade, o problema dos enunciados probabilísticos, era preciso desenvolver um sistema axiomático para o cálculo da probabilidade. Isso era também necessário para outro propósito – o de estabelecer minha tese, proposta na Lógica da Pesquisa Científica, de que a corroboração não é uma probabilidade, no sentido do cálculo de probabilidades. Em outras palavras, era preciso desenvolver o sistema axiomático para estabelecer que certos aspectos intuitivos da corroboração tornavam impossível identifica-la com a probabilidade, tal como esta aparece no cálculo de probabilidades. (Popper 1977, p. 108)
Complementando, decididamente, o filósofo não acreditava no verificacionismo do Círculo de Viena, pois, como seguidor da corrente realista do pensamento, nos disse que: “Nossas falsificações, deste modo, indicam os pontos onde nós tocamos a realidade, como ela seria.” (Popper 2002, p. 156) Deste modo, percebo que Popper estava ciente do fato que era preciso desenvolver um sistema axiomático para o cálculo da probabilidade para provar que sua teoria falseacionista, ou tese corroborativa, não era uma probabilidade no sentido usual do cálculo de probabilidades. Concomitantemente, Popper, como feroz crítico da disseminação do positivismo entre os físicos, estava muito interessado em alguns problemas de interpretação da então emergente Teoria Quântica. Nesta linha de ação, o filósofo criticou duramente Werner Heisenberg pela defesa das relações que levam certos limites à medição de certas grandezas físicas, o que em outras palavras, na explanação do físico José Leite Lopes, seria: “Heisenberg propõe que a teoria só introduza grandezas ou variáveis construídas a partir de dados experimentais e assim capazes de serem fisicamente observadas.” (Lopes 1993, p. 13). Essas relações, conhecidas como Relações de Heisenberg mostram, de fato, que é impossível localizar uma partícula quântica num ponto preciso do espaço com o momentum definido ou medir, simultaneamente, a energia e o tempo de sua duração.
Determinismo, Indeterminismo e Teoria Quântica em Popper
135
Em outras palavras, é impossível traçar a trajetória bem determinada de uma partícula quântica. Estas partículas são corpúsculo e onda, simultaneamente, diferentes das partículas mecânicas que são somente corpúsculos. Para completar, as ondas da Mecânica Quântica também são diferentes das ondas da Mecânica Clássica: essas são ondas de probabilidade de achar a partícula, ou melhor, as ondas que nos permite calcular a realização de um estado final a partir de um estado inicial (Lopes 1993, p. 13). Popper afirmou que as relações de Heisenberg, assim como a interpretação estatística da função de onda da Teoria Quântica proposta por Max Born expressavam somente uma dispersão estatística de um conjunto de dados experimentais. Esta visão, apesar de compatível com a teoria freqüentista da probabilidade defendida por Popper, inicialmente, era diferente da posição da Escola de Copenhague, para a qual indeterminismo quântico não significaria jamais acaso ou imprecisão, mas era algo fundamental, inerente à natureza. Contudo, Popper não tinha esta visão do indeterminismo quântico: para o filósofo este indeterminismo seria sinônimo de utilitarismo. Acredito que o indeterminismo popperiano com relação às teorias físicas teria tomado seu maior vulto, não logo de início quando o filósofo começou a se interessar pelas interpretações dos problemas da Teoria Quântica, mas somente a partir da segunda metade da década de 50, quando Popper começou a perceber a verdadeira dimensão da Mecânica Quântica. Em sua Autobiografia Intelectual, Popper nos diz que: A luz começou a fazer-se quando percebi a importância da interpretação estatística da teoria, devida a Born. De início, a interpretação de Born desagradou-me: a interpretação original de Schrödinger me parecia mais apropriada, quer sobre um ângulo estético, quer na condição de explicação do assunto. Ao notar, porém, que a interpretação de Schrödinger não era sustentável e que a de Born era bem sucedida, perfilhei esta última e não compreendia como alguém que aceitasse as idéias de Born podia defender a interpretação que Heisenberg atribuía às suas fórmulas de indeterminação. (Popper 1977, p. 108)
De acordo com o filósofo era evidente que se a Teoria Quântica teria que ser, a fortiori, interpretada estatisticamente, as fórmulas de Heisenberg teriam que ser entendidas como funções de ondas ou relações de espalhamento como queria Born. Ressalto que Born formulou a bem aceita interpretação da densidade da probabilidade da equação de Schrödinger na Mecânica Quântica (Lopes 1993, p. 14) e esta interpretação estava em perfeita sintonia com o conjunto do pensamento popperiano, pois se tratava de um pensamento objetivo que imprimia uma quase realidade à Mecânica Quântica, ao contrário das visões de Heisenberg e Niels Bohr. Segundo Popper: Essa interpretação encara o princípio da incerteza como um limite imposto a nosso conhecimento; por conseguinte ela é subjetiva. A outra interpretação possível, objetiva, assevera ser inadmissível, ou incorreto, ou metafísico atribuir à
136
Raquel Sapunaru
partícula algo como uma ‘posição cum momentum’ ou uma ‘trajetória’ claramente definida: a partícula simplesmente não tem ‘trajetória’, mas apenas ou uma posição exata, combinada com um momento inexato, ou um momento exato, combinado com uma posição inexata. (Popper 1974, p. 243)
Todavia, a interpretação aludida por Popper, a freqüentista de Von Mises, não resolvia totalmente uma questão-chave: saber se as relações de Heisenberg tinham significado quando aplicadas a fenômenos singulares.2 Esta questão Popper só reconheceu quando formulou a já mencionada interpretação das propensões. Grosso modo, as teorias freqüentista e da propensão normalmente afirmavam que se pode aplicar o conceito de probabilidade de modo cientificamente objetivo apenas a eventos ou classes de objetos, diferentemente das teorias subjetiva e lógica. Lembro que na teoria subjetiva a probabilidade é um grau de crença e na lógica ela mede uma relação entre duas proposições de uma linguagem objeto; e mais ainda, tratando-se da Teoria Quântica, subjetividade não significa necessariamente falta de objetividade: às vezes, o que está em jogo, não é o grau de crença, mas sim, a falta de conhecimento do estado do sistema. Esta interpretação, em particular, é chamada de interpretação epistêmica.3 Popper propôs, então, a interpretação probabilística da propensão, segundo a qual seria possível quantificar o grau com o qual certas condições geradoras teriam a propensão de produzir um evento que pertencesse a uma seqüência cuja freqüência seria determinável por essas condições geradoras. Na interpretação probabilística da propensão, diferentemente da freqüentista, termos teóricos como condições e disposições são definidos a priori, apesar de o resultado depender do arranjo experimental correspondente. A probabilidade como propensão indicaria uma tendência na natureza de que determinado acontecimento ocorresse seguindo-se a determinadas causas físicas. Trata-se de uma probabilidade que é relativa ao tempo, pois à medida que o tempo no qual o evento previsto para ocorrer se aproxima, a probabilidade de sua ocorrência pode mudar, aumentando ou diminuindo a propensão do mesmo ocorrer. Mesmo que, na década de 30, Popper tenha assumido um papel de destaque nos meios filosóficos analíticos, principalmente devido às suas pertinentes críticas ao positivismo lógico do Círculo de Viena, infelizmente, o mesmo não ocorreu em relação aos acalorados debates sobre a interpretação da Teoria Quântica. Em sua Autobiografia Intelectual, o filósofo admite ter ficado assaz desencorajado com o erro que cometera ao julgar precipitada e indevidamente a interpretação indeterminista da Mecânica Quântica de Heisenberg e Bohr, e confessa: No que diz respeito à Física Quântica, senti-me assaz desencorajado por vários anos. Não conseguia esquecer o erro do meu experimento conceptual. Hoje, todavia, embora ache natural lamentar qualquer engano, penso que atribuí demasiada importância a essa falha. (Popper 1977, p. 101–2)
Porém, Popper reavaliou na sua Autobiografia Intelectual os erros cometidos na Lógica da Pesquisa Científica e em outros textos, escritos principalmente ao longo
Determinismo, Indeterminismo e Teoria Quântica em Popper
137
dos anos 50, como, por exemplo, afirma: “O instrumentalismo é adotado por Bohr e Heisenberg somente para se livrarem das dificuldades especiais que a teoria quântica tem.” (Popper 2002, p. 153) Nessa autocrítica, Popper chegou a conclusões interessantes, a saber: (1) sobre o determinismo e o indeterminismo, não haveria nada na Mecânica Quântica que depusesse contra o determinismo, pois, ela seria uma teoria estatística e não-determinista. Recordo que a equação de Schrödinger é uma equação diferencial e, portanto, uma vez resolvida, ela fornece os possíveis estados futuros e suas probabilidades. Isto pode ser chamado de determinismo quântico, que difere do determinismo clássico produtor de certezas ao invés de probabilidades. Indo um pouco mais além: não haveria nada que provasse também que o determinismo tivesse uma base sólida na Física e a teoria newtoniana, já refutada seria a maior prova disso e (2) sobre a probabilidade, no que tange a Mecânica Quântica, esta deveria ser, tout court, física, objetiva e realista; e mais ainda: passível de provas estatísticas, aplicáveis aos casos singulares e relativas aos experimentos (Popper 1977, p. 101–2). A dureza desta autocrítica pode ser percebida nas palavras de Popper escritas a respeito de um encontro com o físico Bohr: Isso me levou a cogitar da “compreensão”. Bohr afirmava, de certa maneira, que a Mecânica Quântica era apenas em parte compreensível e, mesmo assim, só através da Física clássica. Parte da compreensão era alcançada por via do clássico “modelo de partículas” e por via do clássico “modelo ondulatório”; os dois modelos eram incompatíveis e constituíam o que Bohr chamava de complementaridade. Não havia esperanças de chegar a uma compreensão mais completa ou mais direta da teoria; exigia-se “renúncia” a qualquer tentativa de compreensão mais cabal. (Popper 1977, p. 101)
No entanto, ao olhar mais cuidadosamente, numa perspectiva histórica, o contexto no qual Popper cometeu os erros de interpretação citados, isto é, nos anos 4050, concluo que o desconforto de Popper expressava também algo de obscuro com relação aos aspectos político-intelectuais daquela época. Argumento que a Escola de Copenhague, por falta de teorias concorrentes fortes, tomou conta, de modo ditatorial, da inteligência que sustentava a Teoria Quântica, impondo a complementaridade como uma espécie de mandamento divino. A seu turno, nos anos 20-30, quando ainda havia opositores de calibre grosso, a então emergente Teoria Quântica, em fase de consolidação, como Einstein, de Broglie, entre outros, Popper aliou-se abertamente a estes físicos, cujas interpretações realistas e deterministas encontravam-se em perfeita harmonia com sua filosofia. Em 1956, provavelmente um pouco antes de perceber seus erros de interpretação com relação à Teoria Quântica, Popper criticou severamente os dogmas interpretativos de Bohr nas seguintes passagens: Então, a filosofia instrumentalista fez uso de hipóteses ad hoc em vez de fornecer uma saída para as contradições que ameaçavam a teoria [quântica]. Esta filosofia tem sido usada de maneira defensiva — para resgatar a teoria existente; e o princípio da complementaridade tem (eu acredito que por esta razão) permanecido completamente estéril com relação à física. Em vinte e sete anos, esta
138
Raquel Sapunaru
teoria não produziu nada além de discussões filosóficas, e alguns argumentos para a confusão dos críticos (especialmente Einstein). (Popper 2002, p. 135) Se teorias são meros instrumentos nós não precisamos descartar nenhuma teoria em particular, mesmo que nós acreditemos que nenhuma interpretação física consistente dos formalismos desta teoria em questão exista. Resumindo, podemos dizer que o instrumentalismo é incapaz de dar conta da importância da ciência pura que testa severamente até a mais remota implicação de suas teorias, pois ele [o instrumentalismo] é incapaz de dar conta do puro interesse científico no que é verdadeiro ou falso. Em contraste com a mais alta atitude crítica requisitada pela ciência pura, a atitude do instrumentalismo (como o da ciência aplicada) é complacente com o sucesso das aplicações. Logo, ele [o instrumentalismo] pode ser responsável pela recente estagnação da teoria quântica. (Popper 2002, p. 152–3)
Finalizando, compreender o processo científico que induziu à transformação do panorama da discussão sobre os fundamentos e a interpretação da Teoria Quântica será sempre um desafio para os filósofos e historiadores da ciência, principalmente, se eles analisarem este período sob a luz da epistemologia popperiana. As preocupações com esta teoria, somada a interpretação da Teoria das Probabilidades, acompanharam quase toda a vida político-intelectual de Popper e, muitas vezes, os historiadores e filósofos da ciência a tomaram como o mesmo evento: um belo fruto de sua visão científica absolutamente original, porém compatível com o discurso científico da época. Em face do que procurei mostrar anteriormente, fica claro que foram as exigências de interpretação da Teoria Quântica que levaram Popper à formulação da interpretação probabilística da propensão. Como argumentei ao longo deste trabalho, Popper foi um dos mais proeminentes protagonistas, entre os anos 30 e 50 do século XX, nos debates sobre as interpretações da Teoria Quântica. Sem dúvida, foi Popper que legitimou estes debates como debates de cunho científico-filosófico. Seu realismo aliado a um grande prestígio nos meios filosóficos contribuiu para o desenvolvimento de uma visão realista da Mecânica Quântica, mesmo que inicialmente Popper tenha encarado esta nova e estranha visão da Física como puro utilitarismo. Em suas próprias palavras: Eu acredito que os físicos irão brevemente dar-se conta de que o princípio da complementaridade é ad hoc e (o que é mais importante) que sua única função é evitar críticas e prevenir discussões sobre interpretações físicas; embora a crítica e as discussões sejam urgentes e fundamentais para reformular qualquer teoria. Eles [os físicos] irão em breve acreditar que o instrumentalismo lhes está sendo imposto pela estrutura da física teórica contemporânea. (Popper 2002, p. 153)
Contudo, a história nos mostra o retumbante sucesso da Teoria Quântica que, num primeiro momento, fora mal interpretada por Popper. Esta interpretação equivocada lhe custou uma dolorosa autocrítica. Porém, a principal contribuição científico-filosófica genuinamente popperiana para o debate sobre a Teoria Quântica e pela qual prefiro me referir a este brilhante filósofo, foi tanto a recusa da interpretação
Determinismo, Indeterminismo e Teoria Quântica em Popper
139
freqüentista quanto da interpretação subjetivista como possíveis de serem utilizadas nas Ciências Físicas para os enunciados probabilísticos, mesmo que sua proposta estivesse mais próxima da interpretação freqüentista. Na busca de uma alternativa que realmente respondesse à altura as demandas da Teoria Quântica, Popper propôs a adoção da interpretação em termos de propensões para estes enunciados probabilísticos. Destarte, considerando o fato de que as disputas sobre a interpretação da Teoria Quântica ainda não estão totalmente decididas, a simples existência de uma possibilidade interpretativa não deve, de modo algum, ser desprezada. Não posso também ignorar o fato que a interpretação em termos de propensões de Popper teria sido, no mínimo, muito útil para fins heurísticos.4
Referências Hume, D. 2000. Tratado da Natureza Humana. São Paulo: Unesp. Lopes, J. L. 1993. A Estrutura Quântica da Matéria. Rio de Janeiro: UFRJ. Monnerat, M. S. R. 2003. Possibilidades Discursivas do e – um conector coringa. Linguagem em (Dis)curso, p. 185–204. Disponível em: http://www3.unisul.br/ paginas/ensino/pos/linguagem/0401/v4n1.pdf. Último acesso: 4 de julho de 2007. Nagel, E. 1969. Principles of the Theory of Probability. Chicago: The University of Chicago Press. Popper, K. R. 1977. Autobiografia Intelectual. São Paulo: Cultrix e Edusp. —–. 1974. A Lógica da Pesquisa Científica. São Paulo: Pensamento e Cultrix. —–. 2002a. Three Views Concerning Human Knowledge. In: Popper, K. R. (ed.) Conjectures and Refutations. Londres: Routledge, p. 130–60. —–. 2002b. Truth, Rationality, and the Growth of Knowledge. In: Popper, K. R. (ed.) Conjectures and Refutations. Londres: Routledge, p. 291–338.
Notas 1 Neste artigo não me aprofundarei na análise da questão verificação x falsificação de teorias neste texto.
Contudo, ressalto que para Popper quanto maior o conteúdo empírico, maior a testabilidade da teoria. Sobre esta afirmação, Popper exemplificou: “Seja a a sentença ‘Choverá na sexta-feira’; b a sentença ‘O tempo estará bom no sábado’; e ab a sentença ‘Choverá na sexta-feira e o tempo estará bom no sábado’: é obvio que o conteúdo informativo da última sentença, a conjunção ab, será maior que sua componente a e também que sua componente b. E também a probabilidade de ab (ou, o que dá no mesmo, a probabilidade de ab ser verdadeira) será menor que cada um de seus componentes.” (. . . ) “C t (a) ≤ C t (ab) ≥ C t (b) contrasta com a lei correspondente do cálculo de probabilidade, p(a) ≥ p(ab) ≤ p(b) (. . . )? (Popper 2002, p. 295). 2 A teoria freqüentista de Von Mises diz que se pode chegar à probabilidade de um dado atributo ocorrer em uma classe de indivíduos, por exemplo, a proporção de gatos que morrem de Aids felina, mas não de um evento singular, ou seja, a probabilidade do gato de meu vizinho morrer de Aids felina. 3 Na interpretação epistêmica, a negação significa literalmente que aquilo que está sendo negado não é conhecido ou não é acreditado. A interpretação epistêmica tem a vantagem de poder ser combinada muito simplesmente com a negação clássica para formalizar sentenças como “o contrário não pode ser
140
Raquel Sapunaru
mostrado”, onde “contrário” é a negação classica e “que não pode ser mostrado” é a interpretação epistêmica da negação por falha. Ver: Monnerat, “Possibilidades Discursivas do e – um conector coringa”. 2003, p. 185-204. Disponível em: http://www3.unisul.br/paginas/ensino/pos/linguagem/0401/v4 n1.pdf. Último acesso: 4 de julho de 2007. 4 Dedico esse artigo aos professores Penha Maria Cardozo Dias do Intituto de Física-UFRJ e Carlos Alberto Gomes dos Santos do Departamento de Filosofia – PUC-Rio.
A O NTOLOGIA A NALÍTICA : C RÍTICAS E P ERSPECTIVAS S OFIA I NÊS A LBORNOZ S TEIN Universidade de Caxias do Sul/CNPq
siastein@mac.com
. . . nonsense can come in the same form as wisdom. Form is nowhere near enough. Empirical Stance, p. 16
1. Introdução Conforme van Fraassen (The Empirical Stance, 2002), o artigo de Van Quine “On What there is” seria o texto inaugural da ontologia analítica. A proposta de Quine seria ainda um projeto metafísico de extensão da ciência por meio do esclarecimento lógico dos compromissos ontológicos assumidos pelas ciências. Nessa empreitada, os seguidores de Quine teriam sucumbido, assim van Fraassen, aos apelos da metafísica tradicional. Não é necessário afirmar, como o fizeram os positivistas, que o discurso não verificável ou não falseável não tenha sentido para criticar a ontologia analítica. Mesmo supondo a impossibilidade de distinção entre metafísica e ciência por meio de critérios rigorosos de verificação ou falsificação, ainda restam, para além dos critérios lógicos de consistência, critérios relacionados à evidência empírica e à utilidade que permitem, sim, fazer distinção entre ciência e metafísica (cf. Van Fraassen 2002, p. 12–3). Mesmo os critérios, portanto, de “extensão significante” da ciência não estabelecem para a ontologia analítica um espaço do discurso justificável em termos epistemológicos. As explicações da ciência não são as mesmas da metafísica. Assim também as conseqüências do estabelecimento de crenças falsas na ciência são distintas do estabelecimento de crenças falsas na metafísica. O mesmo ocorre em relação às crenças verdadeiras. As crenças verdadeiras da ciência trazem ganhos, propiciam, por exemplo, segurança, alimento, abrigo, comunicação. E os riscos dessas mesmas crenças também fazem a diferença: podem destruir, envenenar, etc. Em relação à metafísica: “O maior risco é precisamente o de adquirir crenças falsas” (2002, p. 15), pois, segundo van Fraassen, não podemos afirmar que os benefícios trazidos pela metafísica compensem as ilusões às quais somos submetidos, já que a metafísica não parece propriamente trazer qualquer benefício. A racionalidade da argumentação metafísica não garante a relevância do discurso. Uma definição possível de filosofia seria a daquele empreendimento pelo qual nós, todo século, interpretamo-nos novamente. É lamentável, segundo van Fraassen, que esta empresa resulte em um jogo de “meras formas”. Parte do credo empirista de van Fraassen é sua afirmação de que não devemos perder de vista a percepção que Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 141–148.
Sofia Inês Albornoz Stein
142
temos de que o mundo tem uma “significação crucial” para nós. Segundo o autor, a metafísica analítica teria perdido de vista justamente o que há de mais importante para nós e se tornado um exercício meramente formal. A construção racional metafísica do mundo, mesmo que possa servir de explicação por vezes do próprio mundo real, por inclusive seu processo de elaboração apresentar analogias com a maneira como os cientistas elaboram teorias, pode provocar estragos em nossa compreensão do mundo, pois não está submetida, diz van Fraassen, à mesma “seleção natural” à qual as teorias científicas estão. A partir da descrição feita por van Fraassen de sua posição empirista em filosofia, que seria uma posição empirista “renovada”, e a partir de sua crítica à metafísica (em especial à ontologia analítica) e ao positivismo, questionaremos a pertinência de uma investigação ontológica como a de Quine, que busca explicar a maneira como são estabelecidos objetos nas ciências naturais. Para tanto, abordaremos a questão de até que ponto a proposta ontológica quiniana incide na elaboração de discursos metafísicos e até que ponto a sua proposta pode resgatar, se levarmos em consideração o que diz van Fraassen, sua posição ontológica da suspeita de ser um mero “jogo de palavras” ou “faz de conta”.
2. Posição empirista de van Fraassen 2.1. Estruturalismo A crítica de van Fraassen à perspectiva ontológica de Quine certamente está relacionada à sua visão estruturalista da conhecimento científico. Como lemos em “Structuralism(s) about science”, conferência de van Fraassen apresentada na Joint Session of the Aristotelian Society em julho de 2007 em Bristol, van Fraassen afirma que seria possível pensar em uma linguagem científica que apenas faria descrições de eventos e não de objetos. Porém, para van Fraassen, é mais interessante para um empirista como ele enfocar na metodologia científica e não na ontologia. O estruturalismo de van Fraassen não depende da afirmação de que a ciência postula entidades. Diz ele: A auto-orientação de um usuário com respeito a um modelo científico é ela mesma um evento, que pode ser localizado no mundo retratado pela ciência. Esta retratação tomaria a forma de representação por meio de uma estrutura matemática, e poderia ser, em princípio, perfeitamente acurada, não excluindo nenhum detalhe relevante concernente aos fatos. (2007, p. 52)
A estrutura, no entanto, tem de ser suplementada por um conteúdo empírico para evitar o problema da indiscernabilidade de estruturas idênticas de objetos ou eventos. Van Fraassen concorda, pois, com Reichenbach em que é possível, metodologicamente, escolher ou uma linguagem sobre objetos ou uma linguagem sobre eventos. Lemos:
A Ontologia Analítica: Críticas e Perspectivas
143
Reichenbach (1956) apresenta um exemplo seminal de como essa questão [acerca das descrições equivalentes] pode ser transposta da ontologia para a metodologia. Em um nível muito fundamental de objetos substanciais persistentes versus estruturas de eventos, ele oferece uma dualidade entre duas formas de discurso que são aproximadamente, apesar de não completamente, tradutíveis entre si, porém podem oferecer representações diferentes, ainda que adequadas, da natureza. (p. 57)
E conclui que seria uma melhor opção para o filósofo empirista transpor, como o faz Reichenbach, a questão acerca das alternativas descritivas de um nível ontológico para um nível metodológico (pragmático). Ou seja, descrever utilizando uma linguagem que fala de objetos ou uma que fala de eventos seria melhor abordada pelo empirista se fosse abordada como uma questão metodológica. 2.2. Empirismo construtivo A visão empirista-pragmática de van Fraassen pode ser resumida pelo seguinte parágrafo: Essa teoria delineia uma imagem do mundo. Porém a ciência ela mesma designa certas áreas nessa imagem como observáveis. O cientista, ao aceitar a teoria, está afirmando que a imagem é acurada nessas áreas. Isto é, de acordo com o antirealista, a única virtude que diz respeito à relação da teoria com o mundo. Quaisquer outras virtudes a serem afirmadas dirão ou respeito à estrutura interna da teoria (como à consistência lógica) ou serão pragmáticas, isto é, relacionadas exclusivamente com preocupações humanas. (1980, p. 57)
E continua: “. . . eu considero aquilo que é observável como uma questão independente de teoria (theory-independent)” (1980, p. 57). Para van Fraassen, uma teoria: a. especifica uma família de estruturas; b. seus modelos; c. especifica partes desses modelos (as sub-estruturas empíricas), que representam diretamente o fenômeno observável; d. é empiricamente adequada se as aparências, estruturas descritas em relatos experimentais e medições, são isomórficas a sub-estruturas empíricas do modelo. (1980, p. 64). Segundo, portanto, van Fraassen, uma teoria não corresponde àquilo descrito pelos empiristas lógicos, ou seja, não corresponde ou não pode ser reconstruída por um conjunto de axiomas e um dicionário parcial que relacione o jargão teórico ao fenômeno observado que é relatado (1980, p. 64).1
Sofia Inês Albornoz Stein
144
2.3. Naturalismo epistemológico Além do estruturalismo em relação à ciência, Van Fraassen (2002) sustenta que o pragmatismo e o existencialismo apontam para uma direção correta na área da epistemologia. Devemos, segundo ele, abandonar as ‘falsas esperanças’ da epistemologia tradicional e nos abrir para “uma nova visão da razão” (2002, p. 110). Essa nova visão passa pela valorização do papel das emoções na análise do desenvolvimento científico e pela análise da deliberação subjetiva, relacionada a valores assumidos pelo cientista. E, por causa de sua visão da epistemologia como uma filosofia não estritamente racional, mas parte de um desenvolvimento histórico humano do qual participam decisões concernentes a valores e opiniões, van Fraassen critica também a proposta naturalista de Quine. Para van Fraassen, o principal problema da epistemologia naturalizada é o de que ela falha em nos apresentar uma visão do conhecimento que seja invariante frente a revoluções conceituais e científicas que devemos esperar que ocorram também na epistemologia (agora científica). Os epistemólogos naturalistas, que fazem o que Van Fraassen chama de epistemologia objetificante, segundo Van Fraassen: . . . supõem que buscar epistemologia em descrições científicas do mundo atualmente aceitas seja ser racional, científico ou intelectualmente respeitável. (. . . ) isto é realmente a única coisa a fazer se você pensa que, por exemplo, a epistemologia tenha que ser ciência cognitiva — se você supõe que o projeto da epistemologia seja o de escrever uma teoria da cognição. (2002, p. 80)
Van Fraassen se opõe à tentativa de explicar o conhecimento desde uma perspectiva psicologista ou naturalizada. O empirismo aceitável tem que registrar algo de invariante na história do conhecimento. A epistemologia deve registrar o ‘empreendimento do conhecimento’, sem elaborar propriamente uma ‘teoria’ sobre ele (2002, p. 82). Não pode depender apenas de conhecimentos científicos/empíricos falíveis.
3. Ontologia em Willard Quine Na filosofia de Quine, a ontologia está diretamente relacionada a questões de ordem semântica. É a análise do discurso que permite a Quine desenvolver uma posição ontológica. Logo, para ele, não podemos, de um ponto de vista exterior à análise do discurso, perguntar quais são os objetos científicos. Sua tese da inescrutabilidade da referência, que ele considera equivalente à tese da relatividade ontológica, sustenta que não é possível estabelecer, de um ponto de vista exterior ao discurso, a quais objetos termos, palavras, fazem referência, ou qual é exatamente a referência de termos presentes em frases. Apesar disso, segundo Quine, assumimos compromissos ontológicos por meio de nossa linguagem, do uso que dela fazemos, sem que, com isso, estejam, de um ponto de vista exterior a esse uso, a partir de critérios empíricos, por exemplo, estabelecidos com quais objetos exatamente nos comprometemos. Alguém
A Ontologia Analítica: Críticas e Perspectivas
145
poderia, segundo exemplo de Quine, ter presente em sua ontologia ‘gatos’, ou poderia ter presentes ‘totalidades de cosmos menos gatos’, e ambas seriam empiricamente indistinguíveis: Nós estabelecemos que duas ontologias, se explicitamente correlatas uma à outra, são empiricamente iguais; não há razão empírica para escolher uma em detrimento à outra. O que é empiricamente significante em uma ontologia é justamente sua contribuição com pontos neutros à estrutura da teoria. (1990, p. 33)
Logo, exterior ao discurso significa, em parte, de um ponto de vista empírico. De um ponto de vista empírico, não há razões para distinguir entre ‘gatos’ e ‘totalidades de cosmos menos gatos’ se efetuarmos de forma competente a reinterpretação de predicados: se traduzirmos todas as frases que contêm o primeiro predicado em frases que contêm o segundo, adaptando, ao mesmo tempo, o restante da linguagem, à nova formulação predicativa. Assim, para Quine, a experiência não é um motivo determinante na escolha que podemos fazer entre duas estruturas teóricas com compromissos ontológicos diversos. Quando predicamos, assim Quine, iniciamos a postulação de objetos. E é a sobreposição de predicações (funções sentenciais), cujas variáveis estão todas ligadas pelo mesmo quantificador existencial, que postula, na linguagem, um objeto. A chamada por Quine relatividade ontológica sugere que podemos, enquanto filósofos, reinterpretar ontologias, podemos traduzir predicados, por exemplo, sobre objetos físicos, em predicados que falam de números. Isso significa, para Quine, que, de um ponto de vista exterior ao discurso, não é possível estabelecer com quais objetos os falantes se comprometem. Podemos, sim, determinar com quais objetos eles se comprometem durante o discurso, determinando a quais variáveis de funções sentenciais (predicados) eles assentiriam em ligar por meio do quantificador existencial.
4. Crítica a Quine No apêndice A de Atitude Empírica, van Fraassen conclui: . . . se o mundo existe não está estabelecido pelo sucesso ou aceitação da cosmologia física, exceto relativamente a certos pontos de vista filosóficos. O corolário perturbador para a ontologia analítica é o de que não há nunca um simples trazer à luz de compromissos ontológicos de nossas teorias. Na melhor das hipóteses, ela o faz relativamente a algumas perspectivas filosóficas mais básicas que são consideradas corretas. Compromissos ontológicos da ciência existem somente aos olhos do observador [contemplador] filosófico. (2002, p. 200)
Van Fraassen, a partir de sua perspectiva empirista própria, compreende a perspectiva ontológica de Quine como metafísica. Por quê? Quine, pelo menos aparentemente, parece estar se restringindo, na sua análise ontológica, que inclui descrição de exemplos científicos, o estabelecimento de critérios ontológicos, de identidade de
146
Sofia Inês Albornoz Stein
objetos e para compromissos ontológicos, a um nível de análise semântica: (a) da linguagem científica; (b) do discurso científico; (c) dos conceitos científicos. O que leva van Fraassen a afirmar o caráter metafísico da ontologia de Quine? Van Fraassen acredita que o critério de compromisso ontológico de Quine, um critério lógico-semântico, não seja tão inocente quanto algumas interpretações fazem crer. Quine não estaria, assim como van Fraassen, apenas apresentando um critério para identificar afirmações da ciência acerca de objetos; ele estaria afirmando que, de fato, “existiriam para a comunidade científica” aqueles objetos dos quais “se fala” em enunciados aparentemente existenciais. Logo, Quine estaria fazendo afirmações semelhantes aos dos realistas metafísicos. O refúgio em um âmbito de análise lógico-semântica não evitaria a ‘queda’ de Quine em um discurso metafísico. Estranhamente, Quine, assim como Carnap nos anos 1950, quer evitar, ele próprio, o compromisso filosófico com posições metafísicas. Pelo contrário, a restrição à análise apenas lógico-semântica pretende manter-se nos limites estabelecidos à filosofia pela filosofia analítica e, eventualmente, à epistemologia naturalizada. Carnap (1950) também afirmou, ao liberar o discurso científico de ‘restrições’ de ordem filosófica, que a ciência tem a liberdade de escolher seus objetos; e isto significava para ele ‘permitir’, desde um ponto de vista filosófico, o “discurso sobre qualquer tipo de objetos”, desde que úteis (pragmaticamente relevantes) para determinados âmbitos da ciência. De forma semelhante, como reconhece Quine em sua correspondência com Carnap, Quine, nos anos 1950, afirma ser desnecessário estipular restrições ontológicas para a ciência (a não ser a necessidade de critérios rigorosos de identidade). As ciências teriam a liberdade de escolher, desde sua perspectiva lógico-semântica, “seus objetos”, isto é, a filosofia não estabeleceria restrições a afirmações de existência de objetos nas ciências, como o fizeram os nominalistas e alguns filósofos analíticos (como Nelson Goodman e Bertrand Russell); cada ciência poderia afirmar a existência daqueles objetos que considerasse importantes para suas práticas e conhecimentos. O filósofo da linguagem poderia, sim, tentar identificar os objetos estabelecidos pelas ciências por meio de análises lingüísticas, observando (no caso de Quine, que é um behaviorista) a prática discursiva dos cientistas. Quando os cientistas concordarem em afirmar a existência de certos objetos, poder-se-ia dizer, desde um ponto de vista filosófico, que eles estão comprometidos com aquelas entidades que são os “valores das variáveis” da quantificação existencial. Isso é metafísica?
5. Conclusão Van Fraassen critica, por um lado, a tentativa de Quine de estabelecer um critério ontológico, e, por outro lado, de sustentar uma postura naturalista na epistemologia. Quine, portanto, não poderia simplesmente afirmar, em sua defesa, que sua descrição do modo como discursa a ciência sobre seus objetos corresponde ao modo como a ciência ‘funciona’ (desde uma perspectiva, ela própria, científica). Pois, segundo van Fraassen, não seria apropriado descrever o conhecimento científico por meio de teorias, elas próprias, científicas.
A Ontologia Analítica: Críticas e Perspectivas
147
O que resta a Quine? Primeiramente, é importante frisar que o critério de compromisso ontológico de Quine: a. é lingüístico; b. afirma que é apresentado, por parte de quem enuncia, por meio de certas estruturas lingüísticas, um “compromisso com a existência de entidades”; c. porém esse critério de compromisso ontológico não é necessariamente metafísico, pois afirma uma existência empírica (não real em sentido forte), para uma certa teoria. Essa afirmação de existência é comparável, eu diria, à afirmação de existência de sub-estruturas empíricas. Os ‘fatos’ de van Fraassen são comparáveis aos fatos materiais (facts of the matter) de Quine. Ambos se mantêm nos limites do empirismo. A questão central é, no final das contas, se a filosofia teria algo a dizer acerca dos objetos científicos além daquilo que diz a própria ciência, as próprias teorias científicas. Podemos defender Quine dos ataques de van Fraassen afirmando: 1. Que seu critério de compromisso ontológico é lógico-semântico e não pretende afirmar a realidade metafísica dos objetos postulados pela ciência; 2. Que a proposta de uma epistemologia naturalizada ainda poderia ser sustentada mesmo que tenhamos consciência da finitude de suas explicações de conhecimento. (Cf. argumento de van Fraassen 2002, p. 79). Van Fraassen tampouco estaria atingindo Quine ao criticar a separação feita pelos empiristas lógicos entre objetos teóricos e observáveis, pois Quine afirma que “o que importa para quaisquer objetos, concretos ou abstratos, não é o que eles são, mas como eles contribuem para nossa teoria global do mundo enquanto pontos [nós] neutros na sua estrutura lógica.” (1995, p. 74–5), ou “O que é empiricamente significante em uma ontologia é somente sua contribuição de pontos [nodes] neutros à estrutura da teoria.” (1990, p. 33). Creio que a filosofia ainda teria a contribuir para a discussão acerca das estruturas e dos objetos científicos, esclarecendo justamente em que consistem, de um ponto de vista meta-científico, essas estruturas e objetos, que classificação pode ser feita deles e quais as propriedades gerais atribuíveis a eles. Também pode auxiliar no esclarecimento da evolução científica e da inovação conceitual e referencial no interior das ciências. Isso não significa a sustentação de posições metafísicas (realistas ou não). Pode significar, por vezes, a teorização acerca daquilo que seria necessário à reflexão sobre teorias e suas estruturas ou objetos, porém seria, então, uma metafísica transcendental (crítica), uma reflexão mais sobre as condições de possibilidade e os limites do conhecimento que de ‘acréscimo’ ao que já é dito pelas ciências. O próprio van Fraasen afirma (2007): “ao empirismo hoje deveria também ser cara a crítica de Kant, e não deveria deixar-se envolver pelas Ilusões da Razão que Kant desmascara.” (p.53).2
148
Sofia Inês Albornoz Stein
Referências Carnap, R. 1950. Empiricism, semantics, and ontology. Revue Intern. De Phil., 4: 208–28. Quine, W. V. O. 1961. On what there is. In From a logical point of view: nine logico-philosophical essays. 2.ed. Cambridge, Massachusetts: Harvard University Press, p. 1–19. —–. 1990. Pursuit of Truth. Cambridge e London, Harvard University Press. —–. 1995. From stimulus to science. Cambridge, Massaschusetts: Harvard University Press. Reichenbach, H. 1956. The Direction of Time. Berkeley: University of California Press. van Fraassen, B. 1980. The Scientific Image. Oxford: Claredon Press. —–. 2002. The Empirical Stance. New Haven e London: Yale University Press. —–. 2007. Structuralism(s) about Science: some common problems. The Aristotelian Society, Suplementary Volume LXXXI: 45–61.
Notas 1 Na introdução à A Imagem Científica, van Fraassen afirma “Os positivistas lógicos, e seus herdeiros,
foram muito longe nessa tentativa em transformar problemas filosóficos em problemas sobre a linguagem. Em alguns casos, sua orientação lingüística teve efeitos desastrosos na filosofia da ciência.” (1980, p. 4). E mais adiante continua: “. . . mesmo se a observabilidade não tem nada a ver com a existência (é, de fato, muito antropocêntrica para tanto), pode ainda ter muito a ver com a atitude epistêmica própria em relação à ciência.” (1980, p. 19). Em outra passagem, van Fraassen afirma: “. . . uma tentativa de estabelecer uma linha conceitual entre os fenômenos e o trans-fenomenal por meio de uma distinção de vocabulário teve sempre que ser visto como muito simples para ser bom.” (1980, p. 56). Porém, parece concordar com Carnap (1951), quando afirma que “para encontrar os limites do que é observável no mundo descrito pela teoria ‘T’, nós temos que investigar em ‘T’ ela própria e nas teorias utilizadas como auxiliares no teste e na aplicação de ‘T’.” (1980, p. 57). 2 Este artigo é resultado parcial de pesquisa financiada pelo CNPq (2006-2007).
B AS VAN F RAASSEN E O P ROBLEMA DA I NFERÊNCIA PARA A M ELHOR E XPLICAÇÃO T HIAGO M ONTEIRO C HAVES Universidade Federal de Minas Gerais
thiagochaves@yahoo.com.br
O principal argumento em que se baseia a chamada defesa explicacionista do realismo científico é uma espécie de redução ao absurdo: se as teorias de que dispõe a ciência são meros instrumentos conceituais, como explicar então seu sucesso de incorporação de novos fenômenos? O realismo científico seria assim a melhor explicação para fenômenos como o sucesso explicativo das teorias científicas. Mas deve esse tipo de argumento fazer de nós todos realistas científicos? A defesa explicacionista do realismo responde essa questão afirmativamente, e a razão para isso seria dizer que o tipo de inferência usado no argumento acima, a inferência abdutiva (Peirce) ou inferência para a melhor explicação (Gilbert Harman) (daqui em diante IME), representa um cânone de racionalidade. Ou seja, se usamos esse tipo de inferência na própria prática científica, assim como na vida comum, não há razões para não o usarmos em argumentos filosóficos. Podemos dizer assim que a defesa explicacionista é uma espécie de meta-abdução: ela faz uso do método mesmo usado na ciência para explicar seu estatuto cognitivo. O objetivo de van Fraassen em The Scientific Image é fornecer uma interpretação empirista da ciência. Dessa forma ele terá que mostrar que há uma outra opção além do realismo. Mas para dizer isso, é preciso mostrar antes que, ao contrário do que a defesa explicacionista diz, nós não somos obrigados racionalmente a acreditar na tese realista. O modo para se fazer isso é justamente atacar as pretensões epistêmicas do modelo da IME. O objetivo deste artigo será o de analisar as críticas de van Fraassen à IME, mostrando sua coerência. Iniciaremos com uma resposta às críticas de Psillos (1996) a um possível ceticismo seletivo ad hoc na postura de van Fraassen. Feito isso mostraremos que a idéia mesma de um modelo inferencial para a IME é ambígua, devido ao caráter contextual determinante para a avaliação da “melhor explicação”, ou seja, a competição entre explicações se dá sempre relativa a outras considerações de pano de fundo. Por fim faremos algumas considerações acerca da possibilidade de um modelo não-ampliativo, bayesiano, para a IME.
1. As críticas a van Fraassen: duas formas de IME, uma realista e outra empirista? Alguns filósofos como Psillos (1996)1 têm acusado van Fraassen de um certo tipo de ceticismo seletivo. Ou seja, van Fraassen aceitaria como legítimos processos inferenciais, a partir de virtudes como poder explicativo, em contextos ordinários ou contextos científicos em que figuram somente entidades e processos observáveis; embora Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 149–158.
150
Thiago Monteiro Chaves
julgasse ilegítimo o uso desses mesmos padrões inferenciais em contextos científicos em que figurassem entidades inobserváveis. A pergunta seria pelo porquê dessa restrição um tanto quanto ad hoc. A passagem que inspira as críticas de Psillos é a seguinte: Argumenta-se que seguimos esta regra [a IME] em todos os casos “ordinários”. . . E com certeza há muitos casos “ordinários” a serem considerados: ouço um arranhar na parede, o sapateado de pequenos pés à meia noite, meu queijo desaparece — e infiro que um camundongo veio morar comigo. Não acho apenas que estes sinais aparentes da presença de um camundongo vão continuar, nem apenas que todos os fenômenos observáveis vão ser como se houvesse um camundongo; mas que realmente há um camundongo. (. . . ) O realista científico é simplesmente alguém que segue consistentemente as regras de inferência que todos nós seguimos nos contextos mais ordinários? (. . . ) Pois o camundongo é uma coisa observável: portanto, “há um camundongo no lambri” e “todos os fenômenos observáveis indicam que haveria um camundongo no lambri” são inteiramente equivalentes, cada uma delas [das duas proposições] implica a outra. (van Fraassen 2006, p. 46–8)
Psillos conclui dessa passagem que van Fraassen aceita a IME como regra de inferência em contextos em que a adequação empírica de uma hipótese coincide com sua verdade, ou seja, quando as entidades a que se refere a hipótese são observáveis. Mas essa equivalência entre adequação empírica e verdade só pode ocorrer quando a experiência é atual,2 ou seja, “todos os fenômenos são como se houvesse um camundongo” e “há um camundongo” somente são equivalentes quando não há nenhum processo inferencial ampliativo, quando os fenômenos referidos são justamente a experiência mesma do camundongo! Nesse exemplo dado por van Fraassen há claramente um passo inferencial ampliativo. Isso se torna claro quando pensamos em hipóteses diferentes para os fenômenos observados (que não são a experiência mesma do camundongo!), e Psillos fornece uma boa hipótese: meu gato Tom poderia ter percebido que eu iria colocá-lo na rua, e começou a realizar todos aqueles fenômenos (o barulho no lambri, o desaparecimento do queijo . . . ) para que eu pensasse que se tratava de um rato, e o mantivesse na casa. Segundo Psillos, eu concluo pela existência do rato porque essa hipótese é melhor qua explicação para os fenômenos observados do que a hipótese sobre meu gato Tom (Psillos 1999, p. 214). Assim, a partir dessa passagem, Psillos conclui que van Fraassen aceitaria tacitamente a IME como regra de inferência em contextos ordinários (ou contextos científicos em que figuram somente entidades observáveis). De fato, o erro de van Fraassen seria supor que, pelo fato de o camundongo ser uma coisa observável, então “há um camundongo no lambri” e “todos os fenômenos observáveis são como se houvesse um camundongo no lambri” são totalmente equivalentes, um implica o outro. Acontece que o primeiro acarreta o segundo, mas o contrário não se dá. É preciso, para derivar a primeira proposição da segunda, um passo inferencial, e esse passo seria fornecido pela regra da IME.
Bas van Fraassen e o problema da inferência para a melhor explicação
151
No entanto, como já argumentado por van Fraassen e colaboradores (Ladyman et al. 1997), essa passagem de The Scientific Image não deve ser compreendida dessa forma. Anteriormente à passagem citada, o argumento que van Fraassen combatia consistia no seguinte: se é o caso que seguimos a IME em contextos ordinários e científicos, então somos compelidos racionalmente a aceitar o realismo científico. Pois se a IME é uma regra de inferência, e o realismo é a melhor explicação para os fenômenos da atividade científica, então devemos inferir a tese realista como verdadeira. Uma das formas que van Fraassen rebate esse argumento consiste justamente em atacar a primeira premissa “se é o caso que seguimos esta regra [a IME] em contextos ordinários . . . ”. O que significa dizer que seguimos essa regra? Uma possibilidade seria dizer que essa é uma hipótese psicológica acerca do comportamento inferencial de pessoas tidas como racionais. Poderíamos então fazer uma pesquisa estatística, que coletaria dados acerca do uso ou não da IME por pessoas racionais. Bem, antes de se dar ao trabalho, van Fraassen lança uma outra hipótese psicológica acerca do comportamento inferencial das pessoas: elas seguem não a IME, mas a *IME, que consiste justamente em inferir a adequação empírica da melhor explicação (van Fraassen 1980, p. 21). Há dois pontos importantes nesse argumento. O primeiro consiste em mostrar o fato de que as práticas inferenciais ordinárias prima facie não lhes fornecem a elas mesmas um estatuto normativo. O segundo consiste no fato de que os ditos casos ordinários não favorecem a hipótese da IME contra a *IME, pois, como no exemplo do camundongo, “há um camundongo no lambri” e “todos os fenômenos observáveis são como se houvesse um camundongo no lambri” são totalmente equivalentes, um implica o outro. Acredito que a primeira consideração não levanta problemas, mas a segunda sim. Como vimos, essa equivalência é falsa. No entanto a pergunta legítima aqui seria se isso invalida o argumento de van Fraassen. É claro que a hipótese do gato Tom é alternativa à hipótese da existência do camundongo; mas dado o que sabemos sobre camundongos (van Fraassen 1980, p. 20–1), inferimos a partir daqueles fenômenos a existência de um. Perceba que essa “inferência” é condicionada a um conhecimento de fundo. Os eventos como barulho no lambri, o desaparecimento do queijo, são condições suficientes para a crença na existência do camundongo, dado o que sabemos sobre camundongos. O que devemos perceber aqui é que talvez não haja nesse caso um processo inferencial ampliativo, mas um grau de crença condicionado à evidência (uma probabilidade posterior).3 Discutiremos esse ponto mais adiante. A discussão se a IME representa um padrão normativo de inferência é uma questão séria para a epistemologia, e deve ser respondida. Mas simplesmente apontando para práticas inferenciais ordinárias não solucionaremos o problema. É esse o ponto de van Fraassen na passagem citada. Se há a possibilidade de uma hipótese alternativa à IME, então devemos fazer um estudo de caso. Não tenho nada a dizer aqui se a epistemologia deva se naturalizar ou não, mas a acusação de um ceticismo seletivo à critica de van Fraassen à IME parece decorrer imediatamente da desconsideração dessa questão.
Thiago Monteiro Chaves
152
2. Um modelo inferencial para a IME Se quisermos pensar em um modelo inferencial para a IME, devemos mostrar nesse modelo como se dá a inferência da verdade ou verdade aproximada da melhor explicação. Em seu artigo inaugural de 1965, Gilbert Harman diz que essa inferência se dá a partir do fato de uma explicação ser a melhor dentre suas alternativas (Harman 1965, p. 89). Temos então que o modelo inferencial da IME parte de uma premissa comparativa. Podemos escrevê-lo como: O fenômeno E é observado H , H 0 , H 00 , H 000 . . . explicam E H é a melhor explicação para E Logo H é verdadeira (ou ao menos aproximadamente verdadeira). Devemos entender “aproximadamente verdadeiro” aqui como muito provável. O processo inferencial da IME se localiza então na passagem do fato de uma hipótese ser a melhor explicação de um fenômeno para o aumento de sua probabilidade. Há duas coisas importantes para serem consideradas nesse modelo. A primeira é que ele é ampliativo, no sentido em que ele nos permite formar novas crenças. A segunda é que, por ser ampliativo, a conclusão pode ser anulada. Isso se daria também ao descobrirmos novas hipóteses que abalariam a premissa que contém a comparação e a candidata à “melhor explicação”. Esse fato coloca dificuldades para um modelo topicamente neutro (que despreza o contexto) para a IME (tal como o apresentado acima). Se as considerações acerca da comparação entre hipóteses dependem fundamentalmente das hipóteses que pudemos formular (ou seja, do contexto de descoberta), a conclusão da verdade (ou do aumento da probabilidade) da hipótese em questão é condicionada a uma variável indeterminada, pois justamente essas outras hipóteses ainda não foram formuladas. É esse o ponto que os argumentos presentes em Laws and Symmetry pretendem capturar (os chamados “argumento da bad lot”, e o “argumento da indiferença”) (van Fraassen 1989, p. 142–3; 146). No entanto alguém poderia argumentar, como o faz novamente Psillos (Psillos 1999, p. 212–27), que é o caráter mesmo ampliativo da IME que a torna irresistível como processo inferencial que nos permite formar novas crenças. Nesse caso, se o próprio empirista construtivo abrisse mão de processos inferenciais ampliativos, como ele justificaria sua crença na adequação empírica de uma teoria? Pois aquilo que é observável pode ainda não ter sido observado (lembremos: a experiência somente nos informa daquilo que é observável e atual, ao restante chegamos através de inferências). Esse é o problema de Hume. Mas novamente esse tipo de argumento não fornece o estatuto epistêmico que o realista pretende dar à IME, pois, novamente, simplesmente listar práticas inferenciais prima facie não lhes garante um estatuto normativo.
Bas van Fraassen e o problema da inferência para a melhor explicação
153
Um outro aspecto ambíguo no modelo acima é a consideração da probabilidade da hipótese inferida. Essa consideração é feita a partir somente do fato de ela ser a melhor explicação? Não é difícil imaginar que considerações acerca das crenças de pano de fundo ajudarão a determinar esse valor.4 Mas onde figuram esses outros fatores no modelo acima? A idéia de um modelo inferencial para a IME parece ser sabotada de início pelo caráter extremamente contextual envolvido na análise de explicações. Mas há ainda uma saída para a IME. Talvez a idéia de um modelo inferencial seja ingênua. Como observa Peter Lipton, a idéia por trás da IME é o fato de que considerações explanatórias guiam nossas inferências (Lipton 2000; 2001; 2004). Nessa próxima seção faremos algumas considerações acerca da possibilidade de enquadrarmos a IME num modelo bayesiano de ajuste de crenças. Concluiremos que as críticas de van Fraassen a essa possibilidade são coerentes, bastando olhar para sua teoria pragmática da explicação.
3. IME como regra para ajuste de crenças Uma outra forma de pensarmos num modelo para a IME é a idéia de que considerações explanatórias acerca de uma hipótese podem guiar a crença em sua verdade. Um dos problemas encontrados no modelo inferencial discutido acima é a questão de como podemos avaliar a probabilidade da melhor explicação. Dado um evento E , H seria uma melhor explicação que H 0 se: P r ob(H ) > P r ob(H 0 ) ou P r ob(E /H ) > P r ob(E /H 0 )
(likelihood de H maior que de H 0 )
No primeiro caso, analisamos a probabilidade inicial de H. No segundo caso analisamos o quanto de probabilidade H confere à evidência E (a likelihood de H ). Um modo de determinarmos essas quantidades seria interpretarmos as probabilidades como probabilidades pessoais, ou graus de crença, conforme os bayesianos (van Fraassen 1980, p. 22). Bayesianos vêem o cálculo de probabilidades como uma extensão da lógica. Assim, da mesma forma que uma pessoa se diz irracional por não ajustar suas crenças utilizando-se de regras de inferência como um modus tollens, por exemplo, ela também se diz irracional se não ajustar suas crenças de acordo com o cálculo de probabilidades. O teorema de bayes se mostra assim como um recipiente lógico (normativo) para essa coerência. Se quisermos um modelo de ajuste de crenças para a IME, esse modelo deve então estar de acordo com o modelo bayesiano. Em Laws and Symmetry, van Fraassen lança um argumento técnico que mostra que se alguém segue a IME como regra para ajuste de crenças, esse alguém se vê susceptível a uma espécie de dutch bookie. Um dutch bookie é uma espécie de teorema
Thiago Monteiro Chaves
154
que, partindo da teoria das probabilidades pessoais baseada em jogos de azar (Ramsey, de Finneti), prova que uma pessoa que não segue o cálculo de probabilidades no ajuste de suas crenças é susceptível, a partir de um conjunto de apostas aparentemente justas, a uma perda inexorável (um saldo sempre negativo). Muitas têm sido as críticas ao modo como van Fraassen encaixa a IME no modelo bayesiano. Longe de pretender a uma análise aprofundada desse tema, tentarei argumentar antes de tudo que a crítica de van Fraassen é coerente, partindo de sua teoria pragmática da explicação (van Fraassen 1980, cap. 5). 3.1. Explicações são respostas a questões ‘por que?’ Van Fraassen entende por explicação uma resposta a uma pergunta do tipo por que . . . ?. Há dois fatores contextuais que determinam essa resposta: (a) a relação de relevância entre a resposta e a pergunta, e (b) a classe de contraste implicitada pela pergunta. Podemos escrever o seguinte modelo para sua teoria: Q = (P, X , R) A é uma resposta para Q se A mantém relação R com P e X em que Q é a pergunta; P o tema da pergunta (o fato a que ela se refere); X a classe de contraste, R a relação de relevância; e A uma resposta a Q. A relação de relevância e a classe de contraste, que determinarão a pergunta, são especificadas no contexto de enunciação, considerando-se a intenção do locutor e fatos brutos do contexto (como crenças de fundo, ambiente perceptivo . . . ). O ponto que quero ressaltar para nossa defesa da crítica de van Fraassen à IME é que uma resposta para uma questão Q selecionará fatores salientes de uma descrição causal já existente como pano de fundo (pertencente a teorias aceitas ou outras crenças de pano de fundo). Chamemos K o conjunto de teorias aceitas mais crenças de pano de fundo. K fornecerá o conjunto de descrições das quais a resposta selecionará uma, apontado para fatores salientes dessa descrição. Nesse sentido, uma explicação, enquanto resposta a uma questão, é um uso de uma descrição, e não uma virtude irredutível, uma relação irredutível entre hipótese e evidência. Mas como avaliar qual é a resposta mais adequada? Qual a melhor descrição para o evento em questão? Em primeiro lugar deve-se preencher o quesito da relevância (e isso se dá contextualmente). Em segundo lugar, deve-se avaliar a resposta ela mesma e em comparação a outras possíveis respostas: se é provável, se favorece o tema da questão, se é mais provável que e se favorece mais o tema da questão que outras possíveis respostas. Perceba que, assim como no modelo da IME, há um passo comparativo aqui. Mas o que eu quero ressaltar é que aquilo que torna ou não uma resposta em uma boa resposta, ou, uma explicação em uma boa explicação, é uma análise da resposta qua descrição. As informações de pano de fundo fornecerão as probabilidades dessas descrições. O link a que Lipton se refere entre poder explicativo e probabilidade se inverte nessa nossa
Bas van Fraassen e o problema da inferência para a melhor explicação
155
análise: são as considerações das probabilidades das respostas (explicações) que as tornam boas ou más respostas, e não o contrário. Esse breve esboço da teoria da explicação de van Fraassen nos será útil adiante. Passemos agora para a análise de sua crítica à IME enquanto regra para mudança de crenças. 3.2. A IME como regra que leva à incoerência Voltemos agora ao ataque de van Fraassen à IME (van Fraassen 1989, cap. 7). O modo como van Fraassen encaixa a IME no modelo bayesiano tem sido vítima de muitos ataques. Ele consiste em dar bônus à probabilidade posterior de uma hipótese dado que essa hipótese é tida como a “melhor explicação”. Ou seja, após um agente (o bayesiano Pedro) condicionar a probabilidade de uma hipótese à evidência utilizando-se do teorema de bayes, ele aumenta sua probabilidade posterior utilizando-se da IME. Essa estratégia causa uma incoerência no conjunto de crenças desse agente. Podemos pensar em uma descrição extremamente simplificada de seu argumento. Imagine que tenhamos duas hipóteses para explicar o fenômeno descrito por e, e que a hipótese h é tida como a “melhor explicação” para e. Então: P (h) × P (e/h) (condicionalização) P (h) × P (e/h) + P (∼ h) × P (e/ ∼ h) P (h/e) + IME = P (h/e) ∗ (bônus para P (h/e), visto que P (h/e) =
h é a melhor explicação para e) Alguém que siga essa regra estará sujeito a um dutch bookie diacrônico, ou seja, uma série de apostas ao longo do tempo em que o prejuízo será certo desde o princípio. Como diria van Fraassen, alguém que use da IME como regra para mudança de crenças sabota suas possibilidades de vindicação desde o início.5 O dutch bookie é diacrônico porque envolve o processo de condicionalização da nova evidência (o conjunto de apostas é feito ao longo do tempo em que novas evidências surgem), e embora as apostas tomadas individualmente pareçam justas no tempo t em que elas são oferecidas, tomadas em conjunto elas garantem um saldo negativo. A IME violaria assim um modo normativo (um cânone de racionalidade) de atualização de crenças frente a novas evidências, expresso pelo princípio de condicionalização “P atual (X ) = P anterior (X condicionada à evidência total E )”.6 Muitas têm sido as criticas ao modo como van Fraassen enquadra a IME ao modelo bayesiano. Psillos e Kvanvig entendem sua estratégia como algo retórico, que pretende antes de tudo induzir o interlocutor (alguém simpático à IME) a pensar na IME num modelo bayesiano, e em seguida utilizar de uma maneira específica que leva à incoerência (Psillos 2003; Kvanvig 1994). No entanto, como vimos acima, quando há solicitação de explicação, devemos separar dois tipos de desideratos: um por informação e outro por informação verdadeira. O link que se dá entre considerações explanatórias e probabilidade (nos termos de Lipton, entre loveliness e likeli-
156
Thiago Monteiro Chaves
ness) se dá justamente porque sempre queremos informações relevantes e verdadeiras. Mas o que bloqueia a trivialidade dessa distinção é o fato de que, após termos em mãos a informação relevante, devemos confirmá-la, e isso se dá num outro momento, ou seja, não há uma inferência que tem a informação relevante como premissa e sua confirmação como conclusão. Vimos como van Fraassen articula uma teoria pragmática da explicação. Há duas distinções que podem agora ser feitas e que, acredito, deixarão claro o ponto que quero ressaltar. Podemos pensar em duas virtudes para uma explicação: uma informacional e outra confirmacional. A primeira diz respeito ao tanto de esclarecimento que a resposta A fornece à questão Q. Isso será medido se A satisfizer os critérios, dados no contexto, de relevância. Mas dada a resposta A, deveremos analisar se ela é verdadeira ou não. Mas esse segundo passo já não tem nada a ver com o primeiro, no sentido de que, dada a resposta A que o locutor da questão Q desejava, a sua confirmação ou não já não estabelece link inferencial com seu valor informativo. Temos então que explicações apresentam virtudes informacionais (satisfazem o desejo por informação); sua confirmação ou não já é um aspecto da análise mesma da descrição selecionada pela explicação dada. Tendo em vista essas duas distinções, podemos dizer que o modo como van Fraassen enquadra a IME no modelo bayesiano é coerente, pois alguém que entenda que virtudes informacionais sejam também confirmacionais, ao julgar que uma hipótese H apresenta mais informação que H 0 , ou é mais simples que H 0 (poderíamos aqui traçar vários aspectos que podem fazer com que uma hipótese contribua mais para a compreensão do explanandum em questão, ou seja, os fatores que fazem com que ela seja a melhor explicação7 ), ao descobrir que uma hipótese é a melhor explicação, ele deve aumentar sua probabilidade. A incoerência causada no argumento esboçado acima se dá justamente pela confusão entre o que faz uma hipótese ser explicativa e o que confirma essa hipótese — aumenta sua probabilidade de ser verdadeira (no caso acima, a evidência). É esse o modo como compreendo a idéia de Peter Lipton de que, no modelo da IME, tem-se que as considerações explanatórias são anteriores à inferência. Na abordagem que privilegio, considerações explanatórias são anteriores à aceitação, pois esta última se dá a partir da avaliação confirmacional da hipótese — que figura na “análise das respostas” possíveis. Porém, como tentamos mostrar, considerações informacionais não interferem de forma inferencial nas confirmacionais. Mais uma vez, o link a que Lipton se refere entre loveliness e likeliness não se dá através de uma inferência que tem a primeira como premissa e a segunda como conclusão; mas se dá somente no momento em que o desejo por informação vem acompanhado com o desejo por informação verdadeira. As críticas ao argumento de van Fraassen se baseiam na idéia de que, se queremos enquadrar a IME ao modelo bayesiano, então devemos fazer isso de um modo em que a IME faça parte desse modelo, e não seja algo “fora” ou “adicional” a ele. Haveria duas formas de se fazer isso: ou considerações explanatórias figurariam na escolha das probabilidades iniciais (priors probabilities), ou na likelihood da hipótese can-
Bas van Fraassen e o problema da inferência para a melhor explicação
157
didata à melhor explicação. A segunda opção se mostra mais problemática, devido ao problema da falácia da probabilidade de base. Suponhamos, por exemplo, que eu chegue em casa e perceba que todas as minhas coisas estão reviradas e alguns de meus pertences desapareceram (chamemos de evidência e). Então eu formulo duas hipóteses: (a) H = um ladrão esteve em minha casa (b) H 0 = um amigo me pregou um susto Se pensarmos que a melhor explicação é a de maior likelihood, então H seria a melhor explicação se P (e/H ) > P (e/H 0 ). No entanto essa análise negligencia a probabilidade de base, ou seja, a probabilidade inicial de H e H 0 . Se eu morar em um condomínio de segurança máxima, por exemplo, então P (H ) será muito baixa, ou se eu só tiver amigos muito sérios, P (H 0 ) será também baixa, e nesses casos a probabilidade posterior de H ou H 0 , dado E , serão baixas mesmo se suas likelihoods forem altas. Se a melhor explicação para e for assim a hipótese de maior likelihood, justamente a melhor explicação poderá ter assim uma probabilidade posterior baixa!8 Considerações explanatórias deveriam então figurar na escolha das probabilidades iniciais. Há um último ponto que quero comentar aqui. Uma coisa é dizermos que a IME possa ser um constrangimento nas probabilidades iniciais. Isso seria algo difícil de provar, mas ainda há uma chance. . . Outra coisa é dizer que considerações explanatórias sugerem, mas não constrangem, a escolha das probabilidades iniciais. Esse seria um modo gentil de terminarmos o debate entre o valor epistêmico da IME. E é justamente essa a postura de van Fraassen. Termino citando o nosso filósofo: Alguém que mantenha uma crença por tê-la achado explanatória não se torna irracional. Ele se torna irracional, no entanto, se começa a adotar isso como uma regra, e nos vê como racionalmente compelidos a ela. (van Fraassen 1989, p. 142)
Bibliografia Churchland, P. M. 1985. The ontological Status of Observables: In Praise of the Superempirical Virtues. In Churchland, P. & Hooker [INICIAIS?] (orgs.) Images of Science: Essays on realism and empiricism, with a reply from Bas C. van Fraassen. Chicago: The University of Chicago Press, p. 35–47. Earman, J. 1992. Bayes or Bust? A Critical Examination of Bayesian Confirmation Theory. Cambridge, MA: MIT Press. Harman, G. 1965. The Inference to the Best Explanation Philosophical Review 74(1): 88–95. Kvanvig, J. L. 1994. A Critique of van Fraassen’s Voluntarist Epistemology Synthese 98(2): 325– 48. Ladyman, J; Douven, I; Horsten, L; And Van Fraassen. 1997. A Defense of Van Fraassen’s Critique of Abductive Inference: Reply to Psillos. Philosophical Quarterly 47: 305-321. Lipton, P. 2000. Inference to the Best Explanation. In Newton-Smith, W. H. (ed.) A Companion to the Philosophy of Science. Oxford: Blackwell, p. 184–93.
158
Thiago Monteiro Chaves
—–. 2001. Is Explanation a Guide to Inference?. In Hon, G. and Rackover, S. (eds.) Explanation: Theoretical Approaches and applications. Dordrecht: Kluwer, p. 93–120. —–. 2004 Inference to the best explanation. London: Routledge. Niiniluoto, I. 1999. Defending abduction. Philosophy of Science 66 (Proceedings): S436–S451. Psillos, S. 1996. On van Fraassen’s Critique of Abductive Reasoning. The Philosophical Quarterly 46: 31–47. —–. 1999. Scientific Realism: How Science Tracks Truth. London: Routledge. —–. 2003. Inference to the Best Explanation and Bayesianism. In Stadler, F. (ed.) Vienna Circle Institute Yearbook, Vol. 10. Dordrecht: Kluwer. Van Fraassen, B. C. 1980. The Scientific Image. Oxford: Clarendon Press. —–. 1989. Laws and Symmetry. Oxford: Clarendon Press. —–. 2006. A Imagem Científica. Tradução de Luiz Henrique de Araújo Dutra. São Paulo: Editora Unesp.
Notas 1 Paul Churchland faz uma crítica semelhante à de Psillos em Churchland, 1985. 2 Em outras palavras, nós só sabemos diretamente que aquilo que já foi ou está sendo observado é de
tal maneira — “a experiência pode nos dar informações somente daquilo que é observável e atual” (van Fraassen 1989, p. 253). 3 Refiro-me aqui ao problema da descrição de inferências ampliativas. As críticas de van Fraassen à IME atacam não só suas pretensões normativas, mas também descritivas. 4 É difícil de imaginar, por exemplo, onde figuraria nesse modelo inferencial a likelihood da hipótese — o quanto de probabilidade uma hipótese confere à evidência — P (E /H ). 5 Cf. o no self-sabotage principle (van Fraassen 1989, p. 157). 6 Para uma exposição crítica do uso do argumento do dutch bookie para justificação do princípio de condicionalização ver Earman 1992. 7 G. Harman lista alguns fatores em seu artigo de 1965. 8 Se P (h/e) = P (h) × P (e/h)/P (e), então a probabilidade posterior pode equivaler a um valor baixo se também esse for o caso para P (h).
II LÓGICA
U M C ONFLITO ENTRE O NTOLOGIA E L ÓGICA : Q UINE A FAVOR DE V = L E C ONTRA iω A NTÔNIO M ARIANO N OGUEIRA C OELHO Universidade Federal de Santa Catarina
acoelho@cfh.ufsc.br
Consideremos as seguintes operações sobre conjuntos: F 1 (x, y) = o par não ordenado cujos elementos são x e y. F 2 (x, y) = o produto cartesiano de x e y. F 3 (x, y) = o conjunto dos pares ordenados 〈u, v〉 tais que u é elemento de x e v é elemento de y e u é elemento de v. F 4 (x, y) = a diferença x − y. F 5 (x, y) = a união de x. F 6 (x, y) = o conjunto das primeiras componentes dos pares ordenados que porventura sejam elementos de x. F 7 (x, y) = o conjunto das triplas ordenadas 〈u, v, w〉 tais que 〈u, w, v〉 seja elemento de x. F 8 (x, y) = o conjunto das triplas ordenadas 〈u, v, w〉 tais que 〈v, w, u〉 seja elemento de x. Sejam agora ω o conjunto dos números naturais e M um conjunto qualquer. Façamos W0 = M Wn+1 = Wn ∪ {F i (x, y) : x ∈ Wn , y ∈ Wn , i = 1, 2, . . . , 8} para n ∈ ω S Seja W = n∈ω Wn W é dito o fecho de Gödel de M e é denotado por cl(M ) Podemos definir def(X ), o conjunto dos conjuntos definíveis a partir de X , da seguinte maneira: def(X ) = cl(X ∪ {X }) ∩ P (X ),
(onde P (X ) é o conjunto das partes de X ) Com isso definimos a chamada hierarquia construtível. L0 = 0 L α+1 = def(L α ) L α = ∪β<α L β , se α é um ordinal limite.
Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 161–164.
Antônio Mariano Nogueira Coelho
162
S Seja On a classe dos ordinais. Fazemos L = α∈On L α . A classe L é o chamado universo construtível e seus elementos são ditos conjuntos construtíveis. Seja V = {x : x = x} a classe universal. O enunciado V = L (i.e., todo conjunto é construtível) é o chamado axioma da construtividade. A classe L é modelo de ZF e do axioma da construtividade. Além disso, trabalhando em ZF podemos mostrar que V = L implica o axioma da escolha e a hipótese generalizada do contínuo. Foi justamente para mostrar a consistência desses dois últimos enunciados com vários sistemas de teoria dos conjuntos que Gödel desenvolveu, nos anos 30 do século passado, a noção de conjunto construtível. Como na passagem de L α para L α+1 usamos apenas a parte definível do conjunto das partes de L α , podemos entender o universo construtível como uma restrição da ontologia geral da teoria dos conjuntos ZF. Formalmente dizemos que L é um modelo interno. Os números i são especificados da seguinte maneira:
1) i0 = ℵ0 2) iα+1 = cardinal do conjunto das partes de iα 3) iγ = sup{iα : α < γ} para γ limite Essa definição faz sentido em ZFC. Além disso, a hipótese generalizada do contínuo equivale a dizer que iα = ℵα para todo ordinal α. Quine, em uma réplica a Parsons, escreveu que Pure mathematics, in my view, is firmly imbedded as an integral part of our system of the world. Thus my view of pure mathematics is oriented strictly to application in empirical science. Parsons has remarked, against this attitude, that pure mathematics extravagantly exceeds the needs of application. It does indeed, but I see these excesses as a simplistic matter of rounding out. We have a modest example of the process already in the irrational numbers: no measurement could be too accurate to be accommodated by a[n] [ir]rational number, but we admit the extras to simplify our computations and generalizations. Higher set theory is more of the same. I recognize indenumerable infinites only because they are forced on me by the simplest known systematizations of more welcome matters. Magnitudes in excess of such demands, e.g., iω or inaccessible numbers, I look upon only as mathematical recreation and without ontological rights. Sets that are compatible with ‘V = L’ in the sense of Gödel’s monograph afford a convenient cut-off. (Quine 1986, p. 400)
Essa passagem mostra que Quine, em um certo sentido, aceita a teoria ZF+V = L e, no entanto, nega direitos ontológicos a iω cuja existência pode ser demonstrada nessa teoria. É a esse conflito entre Ontologia e Lógica (notado, por exemplo, por Penelope Maddy em seu Naturalism in Mathematics, p. 106), que o título deste trabalho se refere. Tal conflito, considerado em si mesmo, torna a posição de Quine menos plausível. Para superar esta queda de plausibilidade, deveríamos apresentar um quadro teórico que pudesse acomodar, sistematicamente, a atitude de subordinar a concessão de direitos ontológicos à participação nos domínios da matemática aplicada.
Um Conflito entre Ontologia e Lógica
163
O naturalismo quineano simplesmente decreta esta subordinação, mas, por si só não a acomoda de forma sistemática. Sugeriremos, a seguir, um caminho para enfrentar este problema. Seja T uma teoria de primeira ordem. Se T possui um modelo infinito, então T não é categórica. Assim, ZFC e ZF+V = L, se consistentes, não são categóricas. Entretanto, acreditamos, nos domínios da matemática aplicada tudo se passa como se ZFC e ZF+V = L fossem categóricas. A existência de modelos não isomorfos dessas teorias não se manifesta nas aplicações. Muito diferente, por exemplo, é a situação da teoria dos grupos. Nessas condições diríamos que ZFC e ZF+V = L são pragmaticamente categóricas. Se T é uma teoria pragmaticamente categórica e M é um modelo de T que de algum modo aparece nas aplicações, dizemos que, a menos de isomorfismo, M é o modelo pragmático de T . Dentre os elementos do universo de M chamemos de reais aqueles que aparecem nas aplicações e de ideais os restantes. Essa divisão dos objetos do domínio de M em reais e ideais, claro, é relativa às aplicações da teoria T feitas em um certo período de tempo. Para evitar esta dependência temporal explícita, poderíamos relativizar a divisão a uma dada teoria científica, ou, mais precisamente, a uma dada formulação de uma dada teoria científica. Assim, sendo, por exemplo, T a teoria ZF+V = L e sendo o domínio M o universo construtível L (falemos de modelo, aqui, num sentido menos estrito, que engloba classes próprias) diríamos que esse ou aquele elemento de L é real ou ideal com respeito, por exemplo, à mecânica quântica, tal como formulada por Mackey em seu livro Mathematical Foundations of Quantum Mechanics. Um dos aspectos estranhos da negação quineana de direitos ontológicos a iω é ela estar, em parte, baseada,como mostra a citação acima, em considerações sobre cardinalidade. Isso é estranho porque a noção de cardinalidade não é absoluta, mas esse aspecto deixa de ser relevante quando passamos a trabalhar com algo que é, essencialmente, o modelo pragmático de ZF+V = L. Em ZF+V=L a cardinalidade do conjunto dos números reais é ℵ1 . O conjunto dos números reais, claro, aparece nas formulações usuais de várias teorias científicas importantes (é irrelevante, para os nossos propósitos, que as necessidades matemáticas dessas teorias científicas possam ser atendidas por teorias formais bem mais fracas que ZFC). Assim, ℵ1 seria um elemento real de L com respeito a tais formulações dessas teorias científicas. Já iω (isto é, ℵω, visto que em L vale a hipótese generalizada do contínuo) por não aparecer, tanto quanto saibamos, nas formulações usuais de teorias científicas importantes, seria um elemento ideal de L relativamente a essas formulações. Por fim, dado o universo de um modelo, os elementos desse universo que fossem reais com respeito a alguma formulação usual de teoria científica relevante, teriam direitos ontológicos, os demais não. Esse é um esboço de sistematização da posição quineana. Com certeza ele é insuficiente para explicar de modo satisfatório essa posição. A acomodação sistemática a que nos referimos acima seguramente não é nele
164
Antônio Mariano Nogueira Coelho
alcançaada. Há, contudo, uma perspectiva de detalhar substancialmente esse esboço, por meio do uso da noção de verdade pragmática, cujas aplicações à filosofia da ciência vêm sendo desenvolvidas nos últimos anos por Newton C. A. da Costa, Steven French e Otávio A. S. Bueno (ver, por exemplo, O conhecimento científico, de da Costa, Science and Partial Truth: A Unitary Approach to Models and Scientific Reasoning, de da Costa e French, e The Logic of Pragmatic Truth, de da Costa, Bueno e French.). A idéia seria especificar, rigorosamente, a noção de teoria formal pragmaticamente categórica, com base na noção de teoria científica pragmaticamente verdadeira. Outros aspectos potencialmente relevantes para uma filosofia da matemática aplicada talvez possam ser estudados sob esse mesmo ponto de vista. Por exemplo, uma teoria formal T seria pragmaticamente completa, relativamente a uma certa formulação de teoria científica, precisamente quando para toda sentença S da linguagem de T , que aparece nessa formulação, tivermos que S é teorema de T ou a negação de S é teorema de T . A próxima etapa no desenvolvimento da pesquisa esboçada neste trabalho seria fazer o detalhamento a que nos referimos acima.
Referências da Costa, N. C. A., Bueno, O. e French, S. 1998. The Logic of Pragmatic Truth. Journal of Philosophical Logic 27: 603–20. da Costa, N. C. A. e French, S. 2003. Science and Partial Truth: A Unitary Approach to Models and Scientific Reasoning. (Oxford Studies in Philosophy of Science). Oxford: Oxford University Press. da Costa, N. C. A. 1999. O conhecimento científico. 2a¯ ed. São Paulo: Discurso Editorial. Hahn, L. e Schilpp, P. 1986. The Philosophy of W. V. Quine. Open Court. Mackey, G. W. 2004[196]. Mathematical Foundations of Quantum Mechanics. New York: Dover. Maddy, P. 1997. Naturalism in Mathematics. Oxford: Clarendon Press. Quine, W. V. 1986. Reply to Parsons. In Hahn e Schilpp 1986, p. 396–403.
A C ONCEPÇÃO DE D EMONSTRAÇÃO EM E UCLIDES E H ILBERT B RUNO VAZ Pontifícia Universidade Católica–RJ
brunorvaz@yahoo.com.br
Tido ao longo dos séculos como um dos primeiros modelos de sistema dedutivo rigoroso, a obra de Euclides representa a primeira tentativa de se sistematizar o conhecimento de geometria com base em um número reduzido de proposições das quais as demais deveriam ser deduzidas. Não obstante a reputação do método apresentado nos Elementos, o surgimento das assim chamadas geometrias não-euclidianas, juntamente com as transformações na matemática e na lógica durante o século XIX e a reconstrução formal do sistema euclidiano apresentada por Hilbert em fins deste século, levaram muitos estudiosos a levantar suspeitas quanto ao rigor das demonstrações ali presentes. Foram apontadas supostas falhas nas deduções, causadas muitas vezes pelo recurso a evidências que só se faziam sensíveis mediante a contemplação dos diagramas utilizados nas provas, não estando explícitas nos axiomas da teoria. Tais aspectos, vale lembrar, não eram bem vistos numa época em que a exigência de rigor e de explicitação de quaisquer recursos utilizados nas demonstrações estavam na ordem do dia. A principal fonte das apontadas falhas residia, segundo os críticos, no uso dos diagramas nas demonstrações. O objetivo deste trabalho é analisar as críticas ao rigor das demonstrações euclidianas, e tentar defendê-lo daquelas que talvez não se justificariam se fosse adotado um ponto de vista mais condizente com os propósitos de Euclides, e menos com a concepção formal de demonstração. Para isso, será feita em um primeiro momento uma apresentação das principais características do método euclidiano, bem como uma análise das principais críticas que são dirigidas a ele. Será apresentada em seguida o que se julga aqui ser a fonte de muitas destas críticas, a saber, a concepção formal de demonstração, de acordo com a qual uma demonstração consiste em uma seqüência finita de fórmulas tais que cada uma delas seja ou um axioma ou se siga dos axiomas por meio de regras válidas de inferência. Tal concepção tem suas origens no formalismo hilbertiano, muito embora Hilbert nunca tenha sustentado que as provas sintáticas fossem as únicas que poderiam ser aceitas como legítimas. Vinculada a este tópico, a quarta parte desta apresentação será dedicada a apresentar, em traços gerais, a reconstrução formal da geometria levada a cabo por Hilbert. Por fim, a título de conclusão, será feita uma comparação entre os métodos de Hilbert e de Euclides, a fim de ressaltar que as diferenças de paradigma, de objetivos e de métodos entre ambos tornam inadequada uma equiparação de seus trabalhos.
1. O Método Euclidiano De acordo com a interpretação de Beppo Levi, o objetivo de Euclides era fundar o edifício da geometria sobre bases evidentes e pouco numerosas, provenientes mais Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 165–172.
166
Bruno Vaz
da análise racional do assunto que propriamente de artifícios empíricos ou instrumentais. A finalidade de tal método seria escapar de armadilhas às quais o método empírico de se fazer geometria poderia levar. Isto, no entanto, observa Levi, é algo que se deduz do conjunto da obra e do contexto no qual ela se insere, uma vez que não se vêem explicitados, em nenhum lugar no texto euclidiano, princípios diretores ou objetivos da obra (Levi 2001, p. 89). Os princípios a partir dos quais serão efetuadas as demonstrações das proposições dos Elementos são as definições, os postulados e as noções comuns. Na edição usual do texto euclidiano (Heath 1956), são apresentadas primeiramente definições, que explicitam o modo como serão considerados os objetos a serem estudados, e que reaparecem no começo dos livros conforme surge a necessidade de se falar de novos objetos. Elas caracterizam os elementos fundamentais da geometria tais como ponto, linha, reta, superfície, e assim por diante. Temos como exemplos de definições: Def. 1: “Ponto é aquilo que não tem partes”; Def. 20: “Das figuras de três lados, um triângulo equilátero é aquela que possui seus três lados iguais, um triângulo isósceles é a que possui dois de seus lados iguais, e um triângulo escaleno é a que possui todos os lados desiguais”. O primeiro tipo de definição, bem como muitos outros que aparecem nos Elementos, como observa Lisa Shabel, têm sido considerados inúteis e de caráter não-matemático (Shabel 2003, p. 13). Todavia, é preciso lembrar que, ao contrário do que acontece na reconstrução formal da geometria, Euclides não fornece um sistema desinterpretado, cujos termos fundamentais são definidos pelo contexto de interpretação em que se inserem. Deste modo, não se pode alegar que as definições de Euclides são inúteis sem antes procurar ver o motivo que leva Euclides a formulá-las tal como ele o faz. De acordo com a interpretação de Shabel, as definições apontam para outros termos fundamentais, tais como parte e todo, que são usados para definir, de fato, estes termos que uma interpretação apressada e influenciada pela concepção formal de demonstração tomaria como primitivos. Este ponto de vista será fundamental, como se verá adiante, para salvaguardar o uso das figuras nas demonstrações dos Elementos. No Livro I, depois das definições, são enunciados em sua totalidade os cinco postulados. Estes formam as bases para as construções posteriores — embora nada indique que eles possuam algum tipo de primazia sobre as definições e noções comuns. Os cinco postulados são os seguintes: Post. 1: “Traçar uma linha reta de um ponto qualquer ao outro ponto qualquer”; Post. 2: “Prolongar continuamente uma linha reta a partir de uma linha reta finita dada”; Post. 3: “Descrever um círculo a partir de um ponto qualquer e com qualquer raio”; Post. 4: “Que todos os ângulos retos são iguais”; Post 5: “Que, se uma linha reta que corta outras duas linhas retas faz com estas ângulos internos do mesmo lado menores que dois retos, estas duas retas, se prolongadas continuamente, se encontrarão no lado cujos ângulos têm soma menor que dois retos”. Estes postulados devem ser aceitos como evidentes não em virtude de alguma evidência empírica, mas sim da evidência fornecida pela própria natureza dos conceitos previamente definidos.
A Concepção de Demonstração em Euclides e Hilbert
167
Como se pode perceber, há uma disparidade entre alguns postulados com relação ao modo como são enunciados. Vê-se que alguns são formulados como comandos, ordens, e outros possuem um caráter descritivo, explanatório. Estas diferenças se fazem notar também nas proposições demonstradas a partir deles. Aquelas que se assemelham a comandos são chamadas problemas, e as proposições descritivas são chamadas teoremas. A primeira proposição do primeiro livro é um exemplo de problema (Prop. I,1: “Construir um triângulo eqüilátero sobre uma linha reta finita dada”); e a sexta proposição do mesmo livro é um exemplo de teorema (Prop. I,6: “Se em um triângulo dois ângulos são iguais entre si, então os lados opostos aos ângulos iguais também serão iguais entre si”). Os três primeiros postulados são de caráter prescritivo, e garantem as operações que são admitidas como válidas nas demonstrações. Os dois postulados restantes, objeto de polêmicas entre os comentadores, são descritivos, e parecem fornecer uma espécie de parâmetro para as construções efetuadas. O postulado 4 é muitas vezes tido como ilegítimo, e não é raro vê-lo equiparado às noções comuns. No entanto, uma interpretação mais cuidadosa revela que ali talvez esteja expressa uma unidade de medida, bem como uma garantia de que os ângulos formados por retas perpendiculares não variam. Depois das definições e dos postulados, são elencadas as noções comuns, que se ocupam basicamente da noção de identidade, bem como da relação parte/todo entre os objetos da geometria. Estas também devem ser aceitas sem demonstração, e sua evidência é ainda mais basilar que a dos postulados. Deve-se tomar cuidado, entretanto, para não considerá-las como sendo os axiomas da teoria, no sentido aristotélico do termo (ou seja, como princípios comuns a todas as ciências), uma vez que elas devem ser interpretadas no contexto particular em que são apresentadas, ou seja, em conjunção com as definições e os postulados, bem como devem estar presentes quando se trata de recorrer aos diagramas para se chegar a um determinado resultado. De outro modo, corre-se o risco de interpretar erroneamente o texto euclidiano (Shabel 2003, p. 21). É a noção comum que diz que “O todo é maior que a parte” (N.C.5) que garante que um ângulo que somado a outro resulta um terceiro é menor que este, por ser parte própria dele; ou, utilizando-se o diagrama, que um ângulo que esteja contido em outro é menor que este. É a partir das definições, postulados e noções comuns que se demonstrará as demais proposições dos Elementos, os teoremas e os problemas. Como ocorre com os postulados, aqui há uma divisão entre proposições prescritivas (problemas) e proposições descritivas (teoremas). As demonstrações são construções (talvez se utilizando de régua e compasso, ou apenas cordas) feitas a partir do que é permitido pelos postulados ou por outras proposições já demonstradas na teoria. A demonstração da primeira proposição do primeiro livro (Prop. I,1: “Construir um triângulo eqüilátero a partir de uma linha reta finita dada”) dá-se do seguinte modo. Dado o segmento de reta AB, o primeiro passo é descrever um círculo com centro em A e raio AB, com base no que permite o postulado 3. Do mesmo modo, o
168
Bruno Vaz
passo seguinte é descrever outro círculo, de igual raio, mas agora com centro em B. Denominando-se o ponto de intersecção deste dois círculos C, pede-se que se trace duas linhas retas, ligando primeiramente C a A, e em seguida a B, de acordo com o postulado 1. Como, de acordo com a definição I,15 todos os pontos da circunferência de um círculo eqüidistam do seu centro, pode-se concluir que AC é igual a AB, e, do mesmo modo, BC é igual a AB. Pela primeira noção comum, sabe-se que coisas que são iguais a uma terceira são iguais entre si, e conclui-se, portanto, que AB, AC e BC são iguais entre si. Assim, de acordo com a definição 20 acima exposta, que diz que um triângulo eqüilátero possui todos seus lados iguais entre si, a construção requerida foi efetuada. Como se verá no que segue, as demonstrações presentes no texto euclidiano são mais simples, embora mais intuitivas, que aquelas que serão vistas em Hilbert. Como se pretende mostrar, isto se deve mais a questões contextuais e históricas do que a uma suposta falta de rigor por parte de Euclides.
2. Críticas ao Método Euclidiano Não obstante a reputação alcançada pelo método euclidiano, muitas são as críticas que ele recebeu desde os primeiros comentadores. Com as transformações ocorridas na lógica e na matemática do século XIX, contudo, as críticas se tornaram mais severas. A exigência de que num sistema axiomatizado toda inferência fosse justificada com base em assunções explícitas nos axiomas fez com que muitas das demonstrações dos elementos tivessem sua legitimidade questionada. No que segue serão expostos alguns dos casos mais conhecidos A primeira proposição do primeiro livro, que pede que se construa um triângulo a partir de uma linha reta finita dada, já contém, segundo os críticos, uma falha. Nada garante, dizem eles, que os círculos traçados a partir das extremidades da linha dada se encontrem no ponto onde o diagrama sugere que eles se encontram. Há de se ressaltar, todavia, que neste livro Euclides se restringe à geometria plana, o que por si só garante que a intersecção das linhas existe (o problema da continuidade da linha, vale lembrar, não constituía uma preocupação à época de Euclides). Além do mais, a definição I.3, que diz que as extremidades de uma linha são pontos, garante que a linha formada a partir da intersecção dos círculos começa (ou termina) em um ponto; e este é justamente o referido ponto de intersecção. Mais complicado, no entanto, é o caso da proposição I.4, conhecida como o primeiro critério de identidade de triângulos (ou “lado-ângulo-lado”). As críticas dirigem-se geralmente a um suposto recurso ao transporte rígido de um triângulo sobre o outro a fim de provar congruência. Cabe lembrar que o transporte rígido ou o método de superposição seriam sim injustificáveis com base no que permitem os postulados, definições e noções comuns. No entanto, uma análise mais cuidadosa revelará que existem problemas na demonstração, embora eles não estejam relacionados ao suposto uso de tais métodos.
A Concepção de Demonstração em Euclides e Hilbert
169
O teorema em questão diz que sempre que dois triângulos tiverem dois lados congruentes, e os ângulos compreendidos entre eles também congruentes, então os triângulos serão congruentes. Para prová-lo, é necessário que se prove a congruência dos lados não mencionados, bem como dos dois ângulos remanescentes em cada triângulo, e por fim a congruência dos dois triângulos como um todo. Para isso Euclides pede que se “aplique” um triângulo sobre o outro de modo que suas partes congruentes coincidam, para então averiguar se o restante de cada triângulo é também coincidente com o outro. Ora, até aqui não há realmente um problema, uma vez que os postulados e as proposições já demonstradas permitem que se construam retas, círculos, e triângulos. Isto permitiria, inclusive, que se construísse um triângulo sobre o outro (a fim de, com recurso legítimo às informações fornecidas pelo diagrama, se possa ver se um é parte do outro, ou se são da mesma magnitude). O problema apenas surge porque a operação requer que se construa também um ângulo sobre o ângulo dado, e isto, até a proposição I.23, não é ainda permitido. A maior parte das críticas que são dirigidas às demonstrações euclidianas referese ao seguinte: os axiomas não são exaustivos com relação ao estabelecimento do que é lícito de ser usado nas demonstrações, deixando falhas que são compensadas pelo recurso à evidência visual fornecida pela figura. Há, deste ponto de vista, dois aspectos condenáveis nas demonstrações de Euclides: por um lado o uso de assunções não explícitas (Greenberg 1972, p.57), e por outro o uso de figuras como auxiliares nos procedimentos de prova (Efímov 1984, p. 12). É preciso ter em mente, no entanto, que os propósitos e métodos utilizados por ele na sua obra podem diferir do que seria conveniente nos dias de hoje. Em nenhum lugar é afirmado que o recurso às figuras deve ser evitado; e, uma vez que se compreende isso, se pode ver que muitas das assunções não-explicitadas na verdade estão explícitas nos próprios diagramas! Com isso se poderia ver que as alegadas falhas no método euclidiano são de número bem menor do que se costuma supor. A falta de rigor, à luz desta interpretação esclarecedora encontrada na referida obra de Shabel, parece assim ser uma alegação improcedente. Se a obra for vista na sua totalidade, com a devida ênfase a todos seus elementos por vezes negligenciados (definições, noções comuns e diagramas), ver-se-á também que se trata de demonstrações suficientemente rigorosas para os objetivos a que se propõe. As críticas a Euclides parecem se originar de uma concepção de demonstração que surge apenas num contexto de fundamentação das teorias matemáticas, no qual a exigência por rigor se fazia cada vez mais presente. De acordo com a concepção formal de demonstração, uma demonstração genuína é uma seqüência de fórmulas logicamente estruturada, a partir de certos princípios explicitados de antemão. Uma demonstração, de acordo com esta concepção, deve ser formalizável, checável e convincente. Salvo talvez pelo primeiro item, não se pode dizer que as demonstrações de Euclides não atendam estes requisitos: são perfeitamente convincentes (até mesmo por valerem-se de métodos mais “diretos”), checáveis, e em algum sentido também pas-
170
Bruno Vaz
síveis de formalização (num sentido amplo do termo, uma vez que os diagramas não são instâncias, mas sim representações da forma dos objetos de estudo). A seguir será apresentada a reconstrução da geometria euclidiana levada a cabo por Hilbert, para que, finalmente, se possa comparar seus métodos com os de Euclides.
3. A Reconstrução Formal da Geometria Euclidiana A concepção de demonstração acima exposta, que parece ter origens no formalismo de Hilbert, não é defendida por ele em nenhum momento. Com efeito, Hilbert parece não negar os poderes do método euclidiano no que diz respeito ao convencimento do leitor. Sua formalização da geometria não parece pretender se sobrepor aos métodos tradicionais, mas sim apresentar, com o rigor requerido à época, um sistema de axiomas completo e o mais simples possível (Hilbert 1980, p. 2). A fim de evitar problemas que parecem surgir da evidência visual que as figuras fornecem, Hilbert propõe que se descarte totalmente o recurso às mesmas no processo de demonstração (embora elas também apareçam como auxiliares nos Grundlagen der Geometrie), e que se construa as demonstrações de uma maneira puramente sintática. Em uma reconstrução da geometria nestes moldes, todo recurso utilizado nas demonstrações deve ter sua contrapartida sintática claramente explicitada. Assim, na reconstrução formal toda proposição deveria ser traduzida em linguagem formal, e toda demonstração seria assim uma seqüência de fórmulas desinterpretadas. O recurso a figuras, que em Euclides formava parte do processo de compreensão das demonstrações, torna-se então totalmente vetado, ou pelo menos supérfluo. A geometria é assim transformada em uma estrutura de fórmulas tal que pudesse se aplicar a qualquer conjunto de entidades que satisfizessem os axiomas. A releitura formal dos Elementos tem como finalidade não propriamente corrigir Euclides, mas sim garantir a confiabilidade de seu método por meio de uma rigorização do mesmo. É neste espírito que ele aponta para a necessidade de uma investigação rigorosa, e de caráter axiomático, a respeito do conteúdo conceitual das figuras geométricas — as quais não são vistas por ele como instâncias particulares, mas sim como “fórmulas gráficas” (Hilbert [1900], p. 1100). A redução das provas euclidianas a seqüências de fórmulas desinterpretadas não implicava, assim, uma tese acerca da superioridade das demonstrações de caráter puramente sintático sobre as demonstrações usuais na prática matemática. Tal redução formava parte de uma estratégia metodológica, dirigida a uma meta-teoria, e não à prática matemática propriamente dita. Embora o próprio Hilbert não sustente nenhuma tese a respeito da superioridade das provas sintáticas, mas apenas as utilize como um recurso metodológico para demonstrar a consistência de um sistema formal, muitas vezes se associa a ele a concepção padrão de demonstração. Tal concepção o levaria a rejeitar como ilegítima boa parte da prática matemática, uma vez que não são comuns na prática matemá-
A Concepção de Demonstração em Euclides e Hilbert
171
tica provas de tamanho rigor demonstrativo. Como vimos, no entanto, a consideração das demonstrações como seqüência de signos desprovidos de significado está relacionada ao estudo de demonstrações no âmbito da metamatemática, embora seja verdade que ele chegou a cogitar, em princípio, a possibilidade de uma formalização completa da teoria. A estratégia de Hilbert para a releitura dos Elementos incluía uma reinterpretação das proposições classificadas como problemas em termos de teoremas, o mesmo valendo para os postulados formulados em termos prescritivos. Assim, da proposição que pedia que se prolongasse uma linha reta a partir de uma linha reta dada, surge a proposição que afirma a existência do prolongamento da reta (I,1: “Para quaisquer dois pontos A e B, existe uma reta que contém os pontos A e B”). Como critério para esta atribuição de existência basta que as notas características do objeto em questão não sejam contraditórias. Uma vez transformadas as proposições da geometria em fórmulas que podem se aplicar a quaisquer objetos que satisfaçam os axiomas — quer sejam eles os objetos da geometria ou mesmo mesas, cadeiras ou canecas de cerveja — as demonstrações se darão por meio da passagem de umas fórmulas a outras obedecendo determinadas regras combinatórias. Deste modo, fica garantido que nenhuma proposição poderá ser extraída por algum recurso externo às próprias fórmulas já expressas, uma vez que umas sempre devem se seguir de outras já demonstradas ou então dos axiomas da teoria. Em suma, tudo deve ser passível de ser expresso em uma fórmula linear e constituída por caracteres especiais. O primeiro critério de igualdade de triângulos, que em Euclides era teorema, passa a ser postulado. Isto levanta suspeitas quanto às vantagens do método formalista para a prática matemática propriamente dita, uma vez que em Euclides pelo menos foi esboçada uma demonstração para este resultado. Termos como ponto, reta e plano são tomados como primitivos, e os postulados são reagrupados de um modo diferente do que acontecia em Euclides. Há em Hilbert oito postulados de incidência, quatro de ordem, cinco de congruência, um sobre as paralelas e dois de continuidade. O número expressivo de postulados se destina a suprir as evidências que em Euclides se faziam notar pela natureza dos conceitos envolvidos, ou mesmo pela evidência visual fornecida pelas figuras. Como se vê, o que em Euclides era problemático não é solucionado por Hilbert, uma vez que a proposição em questão é simplesmente tomada como aceite sem demonstração. Seus objetivos também são sensivelmente diferentes, como se verá a seguir.
4. Considerações Finais Vale ressaltar que não se está buscando aqui negar a importância da formalização da geometria no desenvolvimento de alguns de seus ramos. Apenas se pretende defender que, no fragmento que ora se analisa, a saber, a geometria plana, ambos os métodos são adequados.
172
Bruno Vaz
Enquanto Euclides procurava apresentar de modo sistematizado os objetos da geometria, a fim de evitar os problemas de se proceder empiricamente nesta ciência, Hilbert procura garantir a confiabilidade dos métodos da geometria clássica via teste de consistência. Para isso, propõe a formalização da teoria, o que garante o afastamento de elementos de caráter subjetivo, intuitivos, da fundamentação da mesma, bem como facilita o estudo das demonstrações desde uma perspectiva meta-teórica. Outra diferença jaz na escolha dos termos deixados como primitivos: em Euclides tais termos são parte, todo, extremidade e outros temos similares; em Hilbert os termos primitivos são do tipo ponto, reta e plano. Em Euclides o recurso aos diagramas forma parte essencial da teoria, ao passo que em Hilbert eles são evitados a todo custo. Para finalizar, pode-se formular a diferença básica entre ambos do seguinte modo: enquanto Hilbert está interessado em meios de fundamentar solidamente a geometria, Euclides parece pretender apenas apresentar a geometria e seus objetos de maneira sucinta e rigorosa, mas sem dispensar o que pode ser visto como seu objeto ou recurso didático essencial: os diagramas.
Referências Efímov, N. V. 1984. Geometría Superior. Moscou: MIR. Greenberg, M. J. 1972. Euclidean and Non-Euclidean Geometries – Development and History. San Francisco: W. H. Freeman Company. Heath, T. 1956. Euclid — The Thirteen Books of the ‘Elements’. New York: Dover. Hilbert, D. [1900]. From Mathematical Problems. In Ewald, W. From Kant to Hilbert: a Sourcebook in the Foundations of Mathematics, vol. II. Oxford: Oxford University Press, 2005. —–. 1980. Foundations of Geometry. La Salle, Ilinois: Open Court. Levi, B. 2001. Leyendo a Euclides. Buenos Aires: Zorzal. Shabel, L. 2003. Euclid: Mathematics in Kant’s Critical Philosophy – Reflections on Mathematical Practice. London and New York: Routledge.
B ISSIMULAÇÕES PARA L ÓGICAS M ODAIS R ESTRITAS C EZAR A. M ORTARI Universidade Federal de Santa Catarina
cmortari@cfh.ufsc.br
1. Introdução Lógicas modais restritas são obtidas a partir de sistemas usuais por meio de restrições no que diz respeito ao grau modal de fórmulas em aplicações das regras de inferência; por exemplo, o emprego da regra de necessitação fica restrito a fórmulas cujo grau modal seja no máximo um certo número natural n. Um modelo para uma lógica restrita, no caso geral, é uma seqüência 〈U , N ,Q, T, R, S,V, n〉, em que U é um universo de mundos composto de três subconjuntos dois a dois disjuntos: N , um conjunto de mundos normais, Q, um conjunto de mundos não-normais, e T , um conjunto de mundos que atribuem valores arbitrários a fórmulas modalizadas. Como em modelos relacionais, R ⊆ N ×U é uma relação de acessibilidade e, como na semântica de vizinhanças, S uma função que atribui a cada mundo não-normal um conjunto de proposições (entendidas como subconjuntos de U ). Finalmente, V é uma valoração e n um número natural. O presente trabalho busca investigar métodos de construção de modelos (como uniões disjuntas, submodelos gerados etc.) e, em particular, definir bissimulações entre modelos para lógicas restritas. Um primeiro obstáculo é que mesmo uma união disjunta de modelos pode não preservar a verdade de uma fórmula α em mundos não-normais. Por exemplo, S pode associar a um mundo x ∈ Q o conjunto de todos os mundos em que certa fórmula α é verdadeira. Tomando-se a união de dois modelos quaisquer, mesmo com universos disjuntos, o conjunto-verdade de α pode incluir mundos dos dois modelos — e pode não pertencer aos conjuntos associados por S a x. De maneira análoga, submodelos não preservam em geral a verdade de fórmulas modalizadas em mundos não-normais. Para resolver esse problema, introduzimos uma modificação nas estruturas subjacentes aos modelos, dando um toque relacional à semântica de vizinhanças. Primeiro, a relação de acessibilidade R não é apenas um subconjunto de N ×U , mas de N ∪ Q × U . Em segundo lugar, S passa a associar a cada x ∈ Q não um conjunto de elementos de P (U ), mas um conjunto de conjuntos de mundos acessíveis a x. Ou seja, as proposições necessárias, do ponto de vista de um mundo não-normal x, são obtidas apenas a partir dos mundos acessíveis a x. Consideraremos neste trabalho apenas estruturas em que não se coloca nenhuma restrição tanto sobre a relação de acessibilidade R quanto sobre a função S, ficando portanto no caso mais geral. Demonstramos, em primeiro lugar, que as lógicas restritas [E]n , investigadas em trabalho anterior (cf. Mortari 2007) são determinadas pelas classes apropriadas de estruturas assim redefinidas. Em segundo lugar, definimos Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 173–183.
Cezar A. Mortari
174
uniões de modelos, submodelos gerados, morfismos e bissimulações para as lógicas consideradas, mostrando que essas operações preservam a verdade modal com respeito aos mundos dos modelos.
2. Preliminares Usaremos uma linguagem básica consistendo em um conjunto Φ de variáveis proposicionais, a constante proposicional ⊥, e os operadores primitivos → e . Os demais operadores ¬, ∧, ∨, ↔ e ♦, bem como a constante >, são definidos da maneira usual. Variáveis proposicionais isoladas e ⊥ são fórmulas atômicas. Uma fórmula α será denominada uma fórmula básica sse (i) α é atômica, ou (ii) para alguma fórmula β, α = β. Definição 2.1. O grau modal µ de uma fórmula é definido como segue: (i) µ(p) = 0, para toda p ∈ Φ; (ii) µ(⊥) = 0; (iii) µ(α → β) = max[µ(α), µ(β)]; (iv) µ( α) = µ(α) + 1. Uma noção importante para caracterizar lógicas modais restritas é a de uma ntautologia. Se α é uma tautologia e µ(α) ≤ n, para 0 ≤ n ≤ ω, dizemos que α é uma tautologia de grau n, ou n-tautologia. É claro, dizer que α é uma tautologia de grau ω não significa que µ(α) seja ω, pois toda fórmula tem um grau modal finito. Assim, por tautologia de grau ω queremos apenas significar uma tautologia de qualquer grau modal. Para os propósitos deste artigo, entenderemos por uma lógica um conjunto de fórmulas que inclui o conjunto PL de todas as tautologias (de qualquer grau) e que é fechado sob modus ponens. Obvimente, PL é uma lógica. Uma lógica modal é dita clássica restrita se é fechada sob a seguinte regra de inferência: (REn )
α↔β
α ↔ β
, se α ↔ β é uma n-tautologia, para 0 ≤ n ≤ ω.
A menor lógica modal restrita é [E]0 , obtida a partir a lógica modal clássica E restringindo-se REn ao grau 0.
3. Semântica Definição 3.1. Uma estrutura (frame) F é uma sequência 〈U , N ,Q, T, R, S〉, em que U é um conjunto não-vazio de mundos (ou estados), e N , Q e T são subconjuntos de U , dois a dois disjuntos, tal que N ∪ Q ∪ T = U e N ∪ Q 6= ;. R é uma relação binária em
Bissimulações para lógicas modais restritas
175
N ∪ Q ×U . Agora, para todo x ∈ U , seja R x = {y ∈ U : R x y}, isto é, R x é o conjunto de todos os mundos acessíveis a x. Finalmente, S associa a cada x ∈ Q um conjunto de subconjuntos de R x , ou seja, S(x) ⊆ P (R x ). Na definição acima, N é um conjunto de mundos normais, Q um conjunto de mundos não-normais, e T um conjunto de mundos “arbitrários”, ou seja, nos quais uma fórmula α recebe um valor qualquer. Por uma valoração V em um conjunto U entenderemos uma função do conjunto de todas as fórmulas básicas em P (U ). Note-se que não apenas fórmulas atômicas têm valor em uma valoração, mas também fórmulas da forma α. Definição 3.2. Seja F = 〈U , N ,Q, T, R, S〉 uma estrutura. Então M = 〈F,V, n〉 é um nmodelo, em que V é uma valoração e 0 ≤ n ≤ ω. Temos a definição usual de verdade em um mundo de um modelo, exceto no que diz respeito a fórmulas modalizadas, onde a verdade de α dependerá de se um mundo é normal, não-normal ou arbitrário, e também do grau modal de α: Definição 3.3. Seja M = 〈U , N ,Q, T, R, S,V, n〉 um modelo, e x um mundo em M. Então: (a)
M, x p sse x ∈ V (p), para p ∈ Φ;
(b)
M, x 1 ⊥;
(c)
M, x α → β sse M, x 1 α ou M, x β;
(d)
M, x α sse para cada y tal que Rx y, M, y α, se x ∈ N e µ(α) ≤ n, e
(e)
M, x α sse kαkM x ∈ S(x), se x ∈ Q e µ(α) ≤ n, e
(f )
M, x α sse x ∈ V ( α), se x ∈ T ou µ(α) > n.
Na definição acima, kαkM x = {y ∈ R x | M, y α}, o conjunto-verdade de α com M relação aos mundos em R x . Alternativamente, temos: kαkM x = kαk ∩R x . Quando estiver claro a partir do contexto de que modelo se trata e não houver risco de confusão, escreveremos simplesmente kαkx . Uma fórmula é verdadeira em um n-modelo sse é verdadeira em todo mundo distinguido do modelo. Para os propósitos deste artigo, estaremos considerando distinguidos todos os mundos não-arbitrários, ou seja, D = N ∪Q. Assim:
M α sse M, x α, para todo x ∈ D. Onde K é uma classe de modelos, escrevemos K α para indicar que α é válida nessa classe (isto é, verdadeira em todo modelo da classe). Demonstramos primeiramente os lemas a seguir: Lema 3.4. Seja Cn a classe de todos os n-modelos. Então: (i) se α é uma consequência tautológica de α1 , . . . , αm (m ≥ 0), e Cn α1 , . . . , Cn αm , então Cn α;
Cezar A. Mortari
176
(ii) se α ↔ β é uma n-tautologia, então Cn α ↔ β. Demonstração. (i) A prova é imediata, uma vez que toda tautologia (não importa seu grau modal) é verdadeira em todo mundo de um modelo e modus ponens preserva a validade. (ii) Suponhamos que α ↔ β seja uma n-tautologia. Assim, α and β são tautologicamente equivalentes, e, para qualquer n-modelo M em Cn , e qualquer x no universo M do modelo, kαkM x = kβkx . Suponhamos que x ∈ N . Temos que x α sse para todo y tal que R x y, y α sse (visto que α e β são tautologicamente equivalentes) para todo y tal que R x y, y β sse x β. M Por outro lado, para todo x ∈ Q, kαkM x ∈ S(x) sse kβkx ∈ S(x). Ora, visto que µ(α ↔ β) ≤ n, M, x α iff M, x β, do que se segue que Cn α ↔ β. (Obviamente, se µ(α ↔ β) > n poderíamos ter que x α e x 1 β, uma vez que pode ser o caso que V (α) 6= V (β).) Isso mostra imediatamente que [E]n é correta com respeito à classe de todos os n-modelos, para 0 ≤ n ≤ ω. Demonstramos completude usando modelos canônicos. Onde Λ é uma lógica, seja SΛ o conjunto de todos os conjuntos maximais consistentes de fórmulas em Λ. Em particular, SPL é o conjunto de todos os conjuntos maximais consistentes de fórmulas da lógica proposicional clássica. Seja |α|Λ = {Γ ∈ SΛ ∪ SPL : α ∈ Γ}. (Não havendo risco de confusão, escreveremos simplesmente |α|.) Definição 3.5. Seja Γ um MCS. Então: (a)
ε n (Γ) = {α : α ∈ Γ e µ(α) ≤ n};
(b)
|α|ΓΛ = {∆ ∈ SΛ ∪ SPL : ε n (Γ) ⊆ ∆ e α ∈ ∆}.
Definição 3.6. Seja Λ uma lógica modal restrita, para algum n, 0 ≤ n ≤ ω. Dizemos que MΛ = 〈UΛ , NΛ ,Q Λ , TΛ , R Λ , S Λ ,VΛ , n〉 é um n-modelo canônico para Λ sse satisfaz as seguintes condições: (i) UΛ = SΛ ∪ SPL ; (ii) NΛ = {x ∈ SΛ : > ∈ x}; (iii) Q Λ = {x ∈ SΛ : > ∉ x}; (iv) TΛ = SPL ; (v) R Λ = {〈Γ, ∆〉 ∈ (NΛ ∪Q Λ ) ×UΛ : ε n (Γ) ⊆ ∆}; (vi) |α|ΓΛ ∈ S Λ (Γ) sse α ∈ Γ, para todo Γ ∈ Q Λ e toda α tal que µ(α) ≤ n; (vii) VΛ (α) = |α|Λ , para toda fórmula básica α.
Bissimulações para lógicas modais restritas
177
Lema 3.7. Seja M um n-modelo canônico para uma lógica restrita Λ. Então, para cada fórmula α e cada Γ ∈ UΛ , M, Γ α sse α ∈ Γ. Demonstração. Por indução em fórmulas. Seja Γ algum elemento de UΛ . (a) α = p, para algum p ∈ Φ. Por definição, Γ p sse Γ ∈ VΛ (p) sse Γ ∈ |p|Λ . Pela definição de |p|Λ , Γ é um conjunto em |p|Λ iff p ∈ Γ. (b) α = ⊥. Por definição, Γ 1 ⊥. E visto que todo elemento de U é um conjunto consistente, ⊥ ∉ Γ. (c) α = β → γ. Por definição, Γ β → γ sse Γ 1 β ou Γ γ. Pela hipótese de indução, Γ 1 β sse β ∉ Γ, e Γ γ sse γ ∈ Γ. Ora, β ∉ Γ ou γ ∈ Γ sse β → γ ∈ Γ. Assim, Γ β → γ sse β → γ ∈ Γ. (d) α = β. Temos três casos: (i) Suponhamos que µ(β) ≤ n e que Γ ∈ NΛ . Temos que Γ 1 β sse existe algum ∆ ∈ UΛ tal que ΓR Λ ∆ e ∆ 1 β sse (pela hipótese de indução) β ∉ ∆ sse (visto que ε n (Γ) ⊆ ∆) β ∉ Γ. (ii) Suponhamos que µ(β) ≤ n e que Γ ∈ Q Λ . Por definição, Γ β iff kβkM ∈ S Λ (Γ). Pela hipótese de indução, para todo ∆ ∈ U temos que ∆ β sse β ∈ ∆; ou seja, kβkM = |β|Λ . Assim, kβkM ∈ S Λ (Γ) sse |β|Λ ∈ S Λ (Γ). Ora, pela definição de S Λ , e dado que µ(β) ≤ n, |β|Λ ∈ S Λ (Γ) sse β ∈ Γ. Portanto, Γ β sse β ∈ Γ. (iii) Suponhamos agora que µ(β) > n ou que Γ ∈ TΛ . Por definição, Γ β sse Γ ∈ VΛ ( β) sse Γ ∈ | β|Λ sse β ∈ Γ. Desse lema segue-se imediatamente que: Teorema 3.1 (Completude). Para 0 ≤ n ≤ ω, se Cn α então `[E]n α. Demonstração. Suponhamos que 0[E]n α. Assim, 0[E]n ¬¬α, e segue-se que {¬α} é consistente. Podemos facilmente demonstrar (Lema de Lindenbaum) que existe um [E]n -MCS Γ tal que {¬α} ⊆ Γ, isto é, ¬α ∈ Γ, e α ∉ Γ. Dado que Γ é um [E]n -MCS, Γ um mundo em um n-modelo canônico M[E]n para [E]n ; em particular, Γ ∈ D [E]n . Pelo lema anterior, M[E]n , Γ 1[E]n α. Assim, existe um modelo em que α é falsa, e 1Cn α. É imediato que [E]n é determinada pela classe de todos os n-modelos, 0 ≤ n ≤ ω.
4. Uniões disjuntas Nesta seção definiremos a união disjunta de uma família de n-modelos, e mostraremos que a verdade de uma fórmula em mundo é preservada por essa operação. Definição 4.1. Sejam Mi = 〈Ui , Ni ,Q i , Ti , R i , S i ,Vi , n〉 (i ∈ I ) n-modelos tais que os universos Ui não tenham elementos em comum. A união disjunta dos modelos Mi U é a estrutura Mi = 〈U , N ,Q, T, R, S,V, n〉, em que U , N , Q e T são as uniões dos conjuntos Ui , Ni , Q i e Ti , respectivamente; R é a união das relações R i ; S é a união S dos S i ; e finalmente, para cada fórmula básica α, V (α) = i ∈I Vi (α).
Cezar A. Mortari
178
Proposição 4.2. Seja Mi , i ∈ I , uma família de n-modelos cujos universos sejam dois a dois disjuntos. Então, para cada fórmula α, cada i ∈ I , e cada x ∈ Mi , temos que
Mi , x α sse
]
Mi , x α.
Demonstração. Seja i algum índice, x um elemento de Mi e α uma fórmula. (i) α = p, para alguma variável p. Ora, Mi , x p sse x ∈ Vi (p) sse x ∈ V (p) (por definiU ção de V ) sse Mi , x p. U (ii) α = ⊥. Trivialmente, Mi , x 1 ⊥ e Mi , x 1 ⊥. (iii) α = β → γ. Mi , x β → γ sse Mi , x 1 β ou Mi , x γ sse (hipótese de indução) U U U Mi , x 1 β ou Mi , x γ sse Mi , x β → γ. (iv) α = β. Suponhamos primeiro que µ(α) ≤ n. Temos três casos a considerar: (a) x ∈ Ni . Suponhamos que Mi , x 1 α. Por definição, deve haver algum y ∈ Ui tal U que R i x y e Mi , y 1 β. Pela hipótese de indução, Mi , y 1 β. Pela definição de união U U disjunta, R x y, logo, Mi , x 1 α. Suponhamos agora que Mi , x 1 α para algum x U em Mi . Ora, deve haver algum y ∈ U tal que R x y e Mi , y 1 β. Por definição de R, para algum j ∈ I , temos que ter R j x y. Dado que os universos são disjuntos, segue-se que j = i . Mas então y está também em Mi e, pela hipótese de indução, Mi , y 1 β. Segue-se que Mi , x 1 α. M
(b) x ∈ Q i . Por definição, Mi , x α sse kβkx i ∈ S i (x). Pela hipótese de indução, para U cada y em Mi , Mi , y β sse Mi , y β. Podemos facilmente demonstrar, pois os U Mi Mi ; assim, = kβk universos dos modelos M são dois a dois disjuntos, que kβk i x x U U Mi Mi kβkx ∈ S i (x) sse kβkx ∈ S(x). Portanto, Mi , x α sse Mi , x α. (c) x ∈ Ti . Ora, Mi , x α sse x ∈ Vi ( α) sse x ∈ V ( α) (por definição de V ) sse U Mi , x α. Se µ(α) > n, a prova é como em (c) acima.
5. Homorfismos Definição 5.1. Sejam M = 〈U , N ,Q, T, R, S,V, n〉 e M0 = 〈U 0 , N 0 ,Q 0 , T 0 , R 0 , S 0 ,V 0 , n〉 nmodelos. Um homomorfismo forte f de M em M0 (notação: f : M → M0 ) é uma função de U em U 0 tal que, para cada x ∈ U : (a)
x ∈ N sse f (x) ∈ N 0 ;
(b)
x ∈ Q sse f (x) ∈ Q 0 ;
(c)
x ∈ T sse f (x) ∈ T 0 ;
(d)
para cada fórmula básica α, x ∈ V (α) sse f (x) ∈ V 0 (α);
(e)
para cada y ∈ U , Rx y sse R 0 f (x) f (y);
(f )
para cada X ⊆ U , X ∈ S(x) sse f (X ) ∈ S 0 ( f (x)).
Bissimulações para lógicas modais restritas
179
Naturalmente, f (X ) = {y 0 ∈ U 0 : y 0 = f (x), para algum x ∈ X }. Um isomorfismo de M em M0 é um homomorfismo forte bijetivo. Diremos também que um homomorfismo f : M → M0 é de imagem fechada sse, para todo x 0 , todo y 0 em M0 , se R 0 x 0 y 0 então existe y em M tal que y 0 = f (y). (Note-se que um homomorfismo sobrejetivo é um caso particular de um homomorfismo de imagem fechada.) Definição 5.2. Sejam M e M0 n-modelos, e x e x 0 mundos em M e M0 , respectivamente. Dizemos que: (a)
x e x 0 são modalmente equivalentes sse {α | M, x α} = {α | M0 , x 0 α};
(b)
M e M0 são modalmente equivalentes sse {α | M α} = {α | M0 α}.
Proposição 5.3. Sejam M e M0 n-modelos. Então: (1)
para cada x ∈ U , cada x 0 ∈ U 0 , se há um homomorfismo forte de imagem fechada f : M → M0 com f (x) = x 0 , então x e x 0 são modalmente equivalentes;
(2)
se M e M0 são isomórficos, então são modalmente equivalentes.
Demonstração. (1) Por indução em fórmulas. (i) Se α é alguma variável p, então x p sse x ∈ V (p) sse f (x) ∈ V 0 (p) sse x 0 ∈ V 0 (p) sse x 0 p. (ii) Temos tanto x 1 ⊥ quanto x 0 1 ⊥; logo, x ⊥ sse x 0 ⊥. (iii) Seja α = β → γ. x β → γ sse x 1 β ou x γ sse (hipótese de indução) x 0 1 β ou x 0 γ sse x 0 β → γ. (iv) Seja α = β. (a) Sejam µ(α) ≤ n e x ∈ N . Suponhamos, primeiro, que x 1 β. Pela definição de verdade, há um y tal que Rx y e y 1 β. Seja y 0 = f (y); pela hipótese de indução, y 0 1 β. Agora, pela definição de homomorfismo forte, R x y sse R 0 x 0 y 0 , assim x 0 1 β. Suponhamos agora que x 0 1 β. Segue-se disso que há algum y 0 tal que R 0 x 0 y 0 e y 0 1 β. Por hipótese, o homomorfismo f é de imagem fechada; assim, existe y em M tal que y 0 = f (y). Pela definição de homomorfismo forte, segue-se que R x y e, pela hipótese de indução, que y 1 β. Em consequência, x 1 β. (b) Sejam µ(α) ≤ n e x ∈ Q. Temos que x β sse kβkx ∈ S(x). Pela hipótese de indução, os mundos em U e U 0 relacionados por f são modalmente equivalentes com respeito a β, assim, para cada y, y ∈ kβkx sse y 0 ∈ f (kβkx ). Uma vez que (definição de homomorfismo), para cada X ⊆ U , X ∈ S(x) sse f (X ) ∈ S 0 ( f (x)), temos que kβkx ∈ S(x) sse f (kβkx ) ∈ S 0 (x 0 ). Precisamos mostrar que f (kβkx ) = kβkx 0 . Suponhamos que z 0 ∈ f (kβkx ). Então há z ∈ U tal que f (z) = z 0 , R xz e z β. Pela hipótese de indução, z 0 β e, pela definição de homomorfismo forte, R 0 x 0 z 0 , do que se segue que z 0 ∈ kβkx 0 . Suponhamos agora que z 0 ∈ kβkx 0 . Então z 0 β e R 0 x 0 z 0 . Como f é de imagem fechada e x 0 ∈ I m( f ), z 0 ∈ I m( f ) e, assim, existe z ∈ U tal que f (z) = z 0 . Pela definição de homomorfismo forte, Rxz e, pela hipótese de indução, z β. Segue-se que z ∈ kβkx , logo, z 0 ∈ f (kβkx ).
Cezar A. Mortari
180
Assim, f (kβkx ) = kβkx 0 e x β sse x 0 β. (c) Seja µ(α) > n ou x ∈ T . Temos que x β sse x ∈ V ( β). Por definição, x ∈ V ( β) sse x 0 ∈ V 0 ( β) sse x 0 β. (2) Segue-se de (1). Se o homomorfismo não for de imagem fechada, as coisas não funcionarão com mundos não-normais, pois poderíamos ter mundos acessíveis a x 0 em que β é verdadeira, mas que não são imagem de nenhum mundo em M. Definição 5.4. Sejam M = 〈U , N ,Q, T, R, S,V, n〉 e M0 = 〈U 0 , N 0 ,Q 0 , T 0 , R 0 , S 0 ,V 0 , n〉 nmodelos. Um morfismo limitado f de M em M0 é uma função de U em U 0 tal que, para cada x ∈ U : (a)
se x ∈ N então f (x) ∈ N 0 ;
(b)
se x ∈ Q então f (x) ∈ Q 0 ;
(c)
se x ∈ T então f (x) ∈ T 0 ;
(d)
para cada fórmula básica α, x ∈ V (α) sse f (x) ∈ V 0 (α);
(e)
para cada y ∈ U , se Rx y então R 0 f (x) f (y);
(f )
para cada y 0 ∈ U 0 , se R 0 f (x)y 0 então há y ∈ U tal que R x y e f (y) = y 0 ;
(g)
para cada X ⊆ U , se X ∈ S(x) então f (X ) ∈ S 0 ( f (x));
(h)
para cada Y 0 ⊆ U 0 , se Y 0 ∈ S 0 ( f (x)) então há um Y ⊆ U tal que Y ∈ S(x) e f (Y ) = Y 0.
Proposição 5.5. Sejam M e M0 dois n-modelos tal que f : M → M0 seja um morfismo limitado de imagem fechada. Então, para cada x in M, x e f (x) são modalmente equivalentes. Demonstração. Por indução em fórmulas. Consideraremos apenas o caso em que α = β. (a) Sejam µ(β) ≤ n e x ∈ N . Se x 1 β, há algum y tal que R x y e y 1 β. Pela hipótese de indução, f (x) 1 β. Ora (definição de morfismo limitado), se R x y então R 0 f (x) f (y), assim, f (x) 1 β. Suponhamos agora que f (x) 1 β, então há y 0 tal que R 0 f (x)y 0 e y 0 1 β. Ora (definição de morfismo limitado), se R 0 f (x)y 0 então há um y ∈ U tal que R x y e f (y) = y 0 . Pela hipótese de indução, f (y) 1 β sse y 1 β, logo, x 1 β. (b) Sejam µ(β) ≤ n e x ∈ Q. Suponhamos que x β; então kβkx ∈ S(x). Pela definição de morfismo limitado, se kβkx ∈ S(x) então f (kβkx ) ∈ S 0 ( f (x)). Precisamos mostrar que kβk f (x) = f (kβkx ). Suponhamos que z 0 ∈ f (kβkx ). Então há z ∈ U tal que f (z) = z 0 , R xz e z β. Pela hipótese de indução, z 0 β e, pela definição de morfismo limitado, R 0 f (x) f (z), do que se segue que z 0 ∈ kβk f (x) .
Bissimulações para lógicas modais restritas
181
Suponhamos agora que z 0 ∈ kβk f (x) . Então z 0 β e R 0 f (x)z 0 . Pela definição de morfismo limitado, há z ∈ U tal que Rxz e f (z) = z 0 . Pela hipótese de indução, z β. Segue-se que z ∈ kβkx , logo, z 0 ∈ f (kβkx ). Para a outra direção, suponhamos agora que f (x) β; então kβk f (x) ∈ S 0 ( f (x)). Pela definição de morfismo limitado, há um Y ⊆ U tal que Y ∈ S(x) e f (Y ) = kβk f (x) . Precisamos mostar que Y = kβkx . Seja z ∈ kβkx . Então Rxz, z β e, pela definição de morfismo limitado, temos que R 0 f (x) f (z). Pela hipótese de indução, z β sse f (z) β. Assim, f (z) ∈ f (kβkx ) e z ∈Y. Suponhamos agora que z ∈ Y . Então f (z) ∈ kβk f (x) , R 0 f (x) f (z), f (z) β. Pela hipótese de indução, z β. Pela definição de morfismo limitado, R xz. Assim, z ∈ kβkx . Portanto, Y = kβkx . Visto que Y ∈ S(x), x β. (c) Sejam µ(β) > n ou x ∈ T . Temos que x β sse x ∈ V ( β). Por definição, x ∈ V ( β) sse f (x) ∈ V 0 ( β) sse f (x) β.
6. Bissimulações Nesta última seção, definiremos bissimulações entre modelos, e mostraremos que modelos bissimilares são modalmente equivalentes, ainda que, por exemplo, possam não ser isomórficos. Definição 6.1. Sejam M = 〈U , N ,Q, T, R, S,V, n〉 e M0 = 〈U 0 , N 0 ,Q 0 , T 0 , R 0 , S 0 ,V 0 , n〉 nmodelos. Z ⊆ U ×U 0 é uma bissimulação entre M e M0 se, para todo x ∈ U , x 0 ∈ U 0 : (a)
se x ∈ N e Z xx 0 então x 0 ∈ N 0 ;
(b)
se x ∈ Q e Z xx 0 então x 0 ∈ Q 0 ;
(c)
se x ∈ T e Z xx 0 então x 0 ∈ T 0 ;
(d)
para toda fórmula básica α, se Z xx 0 então x ∈ V (α) sse x 0 ∈ V 0 (α);
(e)
se Z xx 0 e Rx y então há y 0 ∈ U 0 tal que Z y y 0 e R 0 x 0 y 0 ;
(f)
se Z xx 0 e R 0 x 0 y 0 então há y ∈ U tal que Z y y 0 e R x y;
(g)
para cada X ⊆ U , se X ∈ S(x) e Z xx 0 , então Z (X ) ∈ S 0 (x 0 ) (em que Z (X ) = {y 0 ∈ U 0 : para algum x ∈ X , Z x y});
(h)
para cada X 0 ⊆ U 0 , se Z xx 0 e X 0 ∈ S 0 (x 0 ) então há X ⊆ U tal que X ∈ S(x) e Z ∗ (X 0 ) = X (em que Z ∗ (X 0 ) = {x ∈ U : para algum y 0 ∈ X 0 , Z x y}).
Proposição 6.2. Sejam M e M0 dois n-modelos. Então, para cada x ∈ U e cada x 0 ∈ U 0 , se x e x 0 são bissimilares então são modalmente equivalentes. Demonstração. Prova por indução em α. Se α é alguma variável p, a prova é imediata pela cláusula (d) da definição de bissimulação. Casos booleanos seguem-se pela hipótese de indução. Seja então α = β.
Cezar A. Mortari
182
(a) µ(β) ≤ n e x ∈ N . Suponhamos que x 1 β, então há algum y tal que R x y e y 1 β. Uma vez que Z xx 0 , há (pela definição de bissimulação) y 0 ∈ U 0 tal que Z y y 0 e R 0 x 0 y 0 . Pela hipótese de indução, y 0 1 β e, uma vez que R 0 x 0 y 0 , segue-se que x 0 1 β. Suponhamos agora que x 0 1 β, então há y 0 tal que R 0 x 0 y 0 e y 0 1 β. Ora (definição de bissimulação), visto que Z xx 0 , há algum y ∈ U tal que Z y y 0 e R x y. Pela hipótese de indução, y 1 β; logo, x 1 β. (b) µ(β) ≤ n e x ∈ Q. Suponhamos que x β; então kβkx ∈ S(x). Pela definição de bissimulação, se kβkx ∈ S(x) então Z (kβkx ) ∈ S 0 (x 0 ). Precisamos mostrar que kβkx 0 = Z (kβkx ). Se y 0 ∈ kβkx 0 , y 0 β e R 0 x 0 y 0 . Uma vez que Z xx 0 , há (item (f) da definição de bissimulação) um y ∈ U tal que Rx y e Z y y 0 . Visto que y 0 β, pela hipótese de indução temos que y β e y ∈ kβkx . Como Z y y 0 , y 0 ∈ Z (kβkx ). Suponhamos que y 0 ∈ Z (kβkx ). Pela definição de estrutura, se Z (kβkx ) ∈ S 0 (x 0 ) então R 0 x 0 y 0 . Temos também que Z y y 0 , para algum y ∈ kβkx . Então y β, e, pela hipótese de indução, y 0 β. Logo, y 0 ∈ kβkx 0 . Assim, kβkx 0 = Z (kβkx ) e, como kβkx 0 ∈ S 0 (x 0 ), x 0 β. Suponhamos agora que x 0 β; então kβkx 0 ∈ S 0 (x 0 ). Pela condição (h) da definição de bissimulação, há X ⊆ U tal que X ∈ S(x) e Z ∗ (kβkx 0 ) = X . Precisamos mostrar que X = kβkx . Suponhamos que y ∈ kβkx . Assim, Rx y e y β. Uma vez que Z xx 0 , pela cláusula (e) da definição de bissimulação há y 0 ∈ U 0 tal que Z y y 0 e R 0 x 0 y 0 . Assim, y 0 β e y 0 ∈ kβkx 0 . Mas então y ∈ Z ∗ (kβkx 0 ), y ∈ X . Suponhamos agora que y ∈ X , isto é, y ∈ Z ∗ (kβkx 0 ). Por construção, temos que há algum y 0 ∈ kβkx 0 tal que Z y y 0 , e, claro, R 0 x 0 y 0 . Mas então y 0 β e, pela hipótese de indução, y β. Pela definição de estrutura, se X ∈ S(x) então R x y. Nesse caso, segue-se que y ∈ kβkx . Finalmente, temos então que kβkx ∈ S(x) e que x β. (c) µ(β) > n ou x ∈ T . Temos que x β sse x ∈ V ( β). Por definição, se Z xx 0 , então x ∈ V ( β) sse x 0 ∈ V 0 ( β) sse x 0 β. Para um exemplo de modelos que são bissimilares (mas não isomórficos), consideremos a figura a seguir (adaptada de Blackburn et al. 2001): N1 z }| {
Q1 z }| {
T1 z}|{
N2 z }| {
t
t
p
1
-t q
M1
2
q
q
5
-t p
t q@
@ @dt R t p@ p @ Rct @
a
-t p@ @ R 4t @
T2 z}|{
b
3
0
Q2 z }| {
q
e
-t q
f
-t
M2
p
Bissimulações para lógicas modais restritas
183
Temos aqui um modelo M1 = 〈N1 ,Q 1 , T1 , R 1 , S 1 ,V1 〉 e um modelo M2 = 〈N2 ,Q 2 , T2 , R 2 , S 2 ,V2 〉. As relações de acessibilidade são indicadas pelas setas no diagrama. As valorações são tais que p é verdadeira em alguns mundos e q em outros, o que também está indicado na figura. Finalmente, digamos que S 1 (2) = {{3, 4}} e S 1 (3) = S 1 (4) = ;, e que S 2 (d ) = {{e}} e S 2 (e) = ;. Consideremos agora a seguinte relação Z entre os universos dos dois modelos: © ª Z = 〈0, a〉, 〈1, b〉, 〈1, c〉, 〈2, d 〉, 〈3, e〉, 〈4, e〉, 〈5, f 〉 .
Podemos facilmente ver que Z satisfaz os requisitos da definição 6.1 e é uma bissimulação; assim, os mundos nos dois modelos são modalmente equivalentes — mesmo que, por exemplo, o número de mundos normais e não-normais seja diferente.
Referências Blackburn, P.; de Rijke, M; Venema, Y. 2001. Modal Logic. Cambridge: Cambridge University Press. Mortari, C. A. 2007. Restricted Classical Modal Logics. Logic Journal of the IGPL 15(5–6): 741– 57.
A P ROPOSITIONAL V ERSION OF THE L OGIC OF THE P LAUSIBLE H ÉRCULES DE A RAUJO F EITOSA M AURI C UNHA DO N ASCIMENTO M ARIA C LAUDIA C ABRINI G RÁCIO São Paulo State University - UNESP
haf@fc.unesp.br
Introduction The Logic of the Plausible is a particularization of Modulated Logics. In its syntactical context, each Modulated Logic is characterized by the inclusion of a new quantifier that is not expressible from the usual first-order quantifiers (universal and existential), but that formalizes some quantifier from natural language. In the semantic context, this new quantifier is interpreted by an extension of the first-order structure, in order to contemplates characteristics of that quantifier in natural language. As particular case, the Logic of the Plausible is destined to represent propositions of the type “for a significant part”. These propositions can be considered as expressing a type of inductive statement, the plausible statements, based on favorable evidences. For this purpose, the quantifier P is introduced in the first-order language, such that a sentence “P xϕ(x)” means “for a significant part of x, holds ϕ(x)” or “there is sufficient x such that ϕ(x)”. The quantifier P is interpreted into a pseudo-topological space which is a derived concept from the usual definition of topological space. Grácio (1999) argues that this mathematical structure captures the plausibility notion. This paper introduces a new modal propositional logic interpreted into an algebraic model that extents a Boolean algebra with a new modal operator associated to the pseudo-topological spaces. We use as model the same mathematical structure of the Logic of Plausible, but now a modal operator instead of a generalized quantifier is caracterized by that structure. Thus, we introduce the Propositional Logic of the Plausible, denoted by L (∇), whose extends the Classical Propositional Logic.
1. The logic of the plausible In this system, the expression “for a significant part of” means that there is a set with enough favorable evidences, but this set is not necessarily large. It is considered that this type of sentence represents plausible statements from a knowledge base. Grácio (1999) considered that any sentence “for a significant part of x, ϕ(x)” should be equivalent to “ϕ(x) is ubiquitous”, meaning that it is possible to find elements satisfying ϕ in almost everywhere, although the set of evidences is not large in relation to the universe. Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 184–195.
A propositional version of the logic of the plausible
185
As an example, in the set of real numbers, R, let R(x) be the unary predicative symbol standing for “x is a rational number”. It is possible to assert that “a significant part of real numbers has the property R”, that is, “R(x) is true for a significant part of real numbers” or, equivalently, that “rational numbers are ubiquitous in R”, since in any open neighborhood of a real number we always find rational numbers. However, the set of rational numbers is not large (concerning the cardinality of R). This ubiquity notion suggests the formalization of plausibility. The plausible sentences generated by statements of the type “for a significant part of x, ϕ(x)” do not require the notion of a large set of evidences, however they provide a set of statements that are inferred from the set of evidences and it composes the knowledge base for next decision takings. This way, independent of the adopted parameter of largeness and regardless the certainty degree that we have about some statements, there is a collection from which we perform the inferences, taking into account just favorable experiences or evidences and which we call plausible sentences. On the one hand, those statements express a more “vague” form of inductive reasoning. On the other hand, we can consider that sentences of this kind “sufficient x such that ϕ(x)” represent assertions closer to those used in statistical inferences where the set of evidences (sample) is considered sufficient to establish the inference, although this set is not necessarily large relative to the universe. So, the plausible concept is not related to the cardinality of the set of evidences (confirmation), but it is associated to the “sufficiency” notion attributed to the statement, provided by the amount of evidence that the context shows us satisfactory for the query. For example, based on naive looking, we can state the following plausible sentences about human beings: “a significant part of people likes flowers”; “a significant part of people likes coffee”; “a significant part of people likes sport” “a significant part of people does not like wars”. Based on this set of statements, we can deduce that “a significant part of people likes flowers or likes coffee”; or still that “a significant part of people likes coffee, likes sports and does not like wars”. Let L be the first-order classical logic with equality. Logic of the Plausible, L (P ), is constituted from L in the following way. The axioms of L (P ) are all those of L augmented by the following axioms for the new quantifier P , the quantifier of the plausible: (A1 ) (P xϕ(x) ∧ P xψ(x)) → P x(ϕ(x) ∧ ψ(x)) (A2 ) (P xϕ(x) ∧ P xψ(x)) → P x(ϕ(x) ∨ ψ(x)) (A3 ) ∀xϕ(x) → P xϕ(x) (A4 ) P xϕ(x) → ∃xϕ(x) (A5 ) (∀x)(ϕ(x) ↔ ψ(x)) → (P xϕ(x) ↔ P xψ(x)) (A6 ) P xϕ(x) → P yϕ(y), when y is free for x in ϕ(x).
H. A. Feitosa, M. C. do Nascimento, M. C. Cabrini Grácio
186
The axioms A1 to A4 are specific of Logic of the Plausible and the other two axioms have only the role of making possible the logical adequacy with the correspondent model. Intuitively, these axioms assert the following: (A 1 ) If ϕ is plausible and ψ is plausible, then ϕ ∧ ψ is plausible; (A2 ) If ϕ is plausible and ψ is plausible, then ϕ ∨ ψ is plausible; (A3 ) If ϕ is valid for every element of the universe, then ϕ is plausible; (A4 ) If ϕ is plausible, there is some element in the universe that satisfies ϕ. The deduction rules of L (P ) are the same of L , namely: • Modus Ponens (MP): ϕ, ϕ → ψ ` ψ • Generalization (Gen): ϕ ` ∀xϕ. The usual syntactic notions for L (P ) as sentence, proof, theorem, deduction, consistency and other ones are defined as in the first-order classical logic. 1.1. Pseudo-topological spaces Grácio’s original inquires (Grácio 1999) looked for mathematical structures that could interpret non-logical quantifiers distinct of ∀ and ∃ and such that they could contemplate aspects of generalization performed in inductive reasoning, that is, that they lead from parts of the domain to some general part, however distinct from all. One example of this motivation can be given by the following sentence: “Brazilian people like soccer”. We know well that it is usual in the daily language, that, in general, this assertion is valid, since Brazilian people that like soccer are everywhere (and then, of course, “a significant part of Brazilian people likes soccer”), however, there are also Brazilian people that do not like soccer. The pseudo-topological concept has been introduced as a model for this condition. First, this concept has been called reduced topological space, but we opt to call it pseudo-topological space from now on, with Grácio’s agreement. A pseudo-topological space (E , Ω) is a pair where E is a non-empty set and Ω ⊆ P (E ) is the set of open elements of (E , Ω), satisfying the following conditions: (pt1) A, B ∈ Ω ⇒ A ∩ B ∈ Ω; (pt2) A, B ∈ Ω ⇒ A ∪ B ∈ Ω; (pt3) E ∈ Ω; (pt4) ; ∉ Ω. A subset of E is closed relative to (E , Ω) when its complement is open relative to (E , Ω). Certainly, no topological space can be a pseudo-topological space concomitantly, because the first one demands ; as an open set, while the second one excludes ; as an open set.
A propositional version of the logic of the plausible
187
Although the definition was made flexible, we have mathematically interesting examples of pseudo-topological spaces. Examples: (a) Let E 6= ; and take Ω = {E }. Certainly ; ∉ Ω, but E ∈ Ω. The (i) and (ii) conditions are trivially satisfied. Then, (E , Ω) is a pseudo-topological space. (b) Let E 6= ;. For a ∈ E , let Ω = {B ⊆ E / a ∈ B }. Then, ; ∉ Ω, but E ∈ Ω. We can easily verify that (E , Ω) is a pseudo-topological space. (c) Let E an infinite set and Ω = {Y C / Y is finite}, that is, Ω is a collection of co-finite subsets of E . Then, (E , Ω) is a pseudo-topological space. Since E is infinite, then ; ∉ Ω and E ∈ Ω. (i) If Y C , Z C ∈ Ω, then Y and Z are finite subsets of E and, therefore, Y ∪ Z is finite too. Thus, Y C ∩ Z C = (Y ∪ Z )C ∈ Ω. (ii) If Y C , Z C ∈ Ω, then Y and Z are finite subsets of E and, thus, Y ∩ Z is finite too. So, Y C ∪ Z C = (Y ∩ Z )C ∈ Ω. (d) Let E a non-enumerable set and Ω = {Y C ⊆ E / Y is enumerable}. So (E , Ω) is a pseudo-topological space. Since E is non-enumerable, then ; ∉ Ω, but E ∈ Ω. (i) If Y C , Z C ∈ Ω, then Y and Z are enumerable and, therefore, Y ∪Z is enumerable too. Thus, Y C ∩ Z C = (Y ∪ Z )C ∈ Ω. (ii) If Y C , Z C ∈ Ω, then Y and Z are enumerable and Y ∩ Z is also enumerable. Thus, Y C ∪ Z C = (Y ∩ Z )C ∈ Ω. (e) The dense and open sets of a topological space (E , τ) determine a pseudo-topology. We must remember that if a set A is dense and if U 6= ; is an open set, then A ∩U 6= ;. Consider in E the following collection of subsets Ω = {U ⊆ E /U is open} and dense in (E , τ). First, observe that ; ∉ Ω, because for every open U 6= ; in (E , τ), we have ; ∩U = ;. (i) Let A, B ∈ Ω. Since A and B are open sets, then A ∩ B is an open too. Besides, as A and B are dense, for every open U 6= ;, we have B ∩U 6= ; and B ∩U is open. Thus, (A ∩ B ) ∩U = A ∩ (B ∩U ) 6= ;, that is, A ∩ B ∈ Ω; (ii) If A, B ∈ Ω, then A ∪ B is open. Besides, A and B are dense and since A, B ⊆ A ∪ B , then A ∪ B is dense too. Thus, A ∪ B ∈ Ω; (iii) Since E is open and dense in (E , τ), we have that E ∈ Ω. Then, Ω is a pseudo-topology. Based on this motivation, Grácio (1999) introduced the pseudo-topological structures — extensions of the first-order structures — as models for the Logic of the Plausible and showed their adequacy (soundness and completeness) for L (P ).
H. A. Feitosa, M. C. do Nascimento, M. C. Cabrini Grácio
188
1.2. The semantics of the logic of the plausible Let A be a first-order classical structure with universe A. A pseudo-topological structure A Ω for L (P ) consists of the usual structure A augmented by a pseudo-topology (A, Ω). The interpretation of relational, functional and individual constant symbols is the same of L into A . In a structure A Ω , the satisfaction of L (P ) is defined, recursively, in usual way, adding the following clause: • let ϕ be a formula whose free variable are contained in {x} ∪ {y 1 , . . . , y n } and a¯ = (a 1 , . . . , a n ) is a sequence in A. Then: ¯ ⇔ {b ∈ A/A Ω Í ϕ[b, a]} ¯ ∈ Ω, A Ω Í P xϕ[x, a] ¯ denotes A Ω Ís ψ, when the free variables of ψ occur in in which, as usual, A Ω Í ψ[a] the set {z 1 , . . . , z n }, s(z i ) = b i and a¯ = (a 1 , . . . , a n ). For a sentence P xψ(x), we have: A Ω Í P xψ(x) if and only if {a ∈ A/A Ω Í ψ(a)} ∈ Ω. Other usual semantic notions such as model, validity, logical consequence, etc., for L (P ), are defined in an analogous way to those of classical logic.
2. A propositional logic of the plausible — L (∇) In order to get the Propositional Logic of the Plausible, L (∇), we extend the classical propositional logic (CPC) endowing the classical language L(¬, →) by a new operator ∇. Formally, we denote the language of Propositional Logic of the Plausible by L(¬, →, ∇). So L (∇) is determined by the following: • Axioms: the classical propositional axioms, plus the following axioms for the operator ∇: (Ax1 ) ∇ϕ ∧ ∇ψ → ∇(ϕ ∧ ψ) (Ax2 ) ∇ϕ ∨ ∇ψ → ∇(ϕ ∨ ψ) (Ax3 ) ∇ϕ → ϕ (Ax4 ) ∇(ϕ ∨ ¬ϕ). • Deduction rules: Modus Ponens and: (R∇) ` ϕ ↔ ψ/ ` ∇ϕ ↔ ∇ψ. Intuitively, (Ax1) to (Ax4) assert:
A propositional version of the logic of the plausible
189
(Ax1 ) If ϕ is plausible and ψ is plausible, then ϕ ∧ ψ is plausible; (Ax2 ) If ϕ is plausible or ψ is plausible, then ϕ ∨ ψ is plausible; (Ax3 ) If ϕ is plausible, ϕ is not impossible; (Ax4 ) Each theorem is plausible. (R∇) The rule determine that when is the case that two propositions are equivalent, then are also equivalent the plausibility of the two propositions. These axioms and the rule (R∇) try to rescue into the propositional context the fundamentals conceptions of the pseudo-topologies, introduced in the set theoretical environment. Proposition 2.1. No contradiction ⊥ is plausible. Proof. By (Ax3 ) we have ∇⊥ → ⊥. But since ¬⊥, then follows that ¬∇⊥. Proposition 2.2. ` ϕ ⇒` ∇ϕ. Proof. 1. 2. 3. 4. 5. 6. 7. 8.
`ϕ ` (ψ ∨ ¬ψ) → ϕ ` ϕ → (ψ ∨ ¬ψ) ` (ψ ∨ ¬ψ) ↔ ϕ ` ∇(ψ ∨ ¬ψ) ↔ ∇ϕ ` ∇(ψ ∨ ¬ψ) → ∇ϕ ` ∇(ψ ∨ ¬ψ) ` ∇ϕ
hypothesis CPC in 1 CPC CPC in 2 and 3 R∇ in 4 CPC in 5 Ax4 MP in 6 and 7.
Proposition 2.3. ` ∇ϕ ∧ ∇ψ → ∇(ϕ ∨ ψ). Proof. 1. 2. 3. 4. 5.
∇ϕ ∧ ∇ψ → ∇ϕ ∇ϕ ∧ ∇ψ → ∇ψ ∇ϕ ∧ ∇ψ → ∇ϕ ∨ ∇ψ ∇ϕ ∨ ∇ψ → ∇(ϕ ∨ ψ) ∇ϕ ∧ ∇ψ → ∇(ϕ ∨ ψ)
CPC CPC CPC in 1 and 2 Ax2 CPC in 3 and 4.
Proposition 2.4. ` ∇ϕ → ∇(ϕ ∨ ψ). Proof. 1. ∇ϕ → ∇ϕ ∨ ∇ψ 2. ∇ϕ ∨ ∇ψ → ∇(ϕ ∨ ψ) 3. ∇ϕ → ∇(ϕ ∨ ψ)
CPC Ax2 CPC in 1 and 2.
190
H. A. Feitosa, M. C. do Nascimento, M. C. Cabrini Grácio
3. The plausible algebra A plausible algebra is a 7-tuple P = (P, 0, 1, ∧, ∨, ∼, #) such that (P, 0, 1, ∧, ∨, ∼) is a Boolean algebra and # is the plausible operator that respects the following conditions: (i) #a ∧ #b ≤ #(a ∧ b) (ii) #a ∨ #b ≤ #(a ∨ b) (iii) #a ≤ a (iv) #1 = 1. An element 0 6= a ∈ P is plausible when #a = a. From item (iii) it follows that #0 = 0. However, by definition 0 is not plausible. We did not include an algebraic axiom relative to (R∇), because in any algebra we always have a = b ⇒ #a = #b. An algebra P is non-degenerate when its universe P has at least two elements. Proposition 3.1. For each plausible algebra P = (P, 1, 0, ∨, ∧, ∼, #) there is a monomorphism h from P into a pseudo-topological space of sets defined in P (P (P )). Proof. By means of Stone’s isomorphism, we know that for each Boolean algebra (P, 0, 1, ∨, ∧, ∼) there is a monomorphism h from P into a subset of P (P ). Denote this Boolean algebra by B = (B, ;, ∪, ∩, C ). Next, we introduce a pseudo-topology Ω in B and extend the isomorphism h to an isomorphism between P and B = (B, ;, B, ∪, ∩, C , Ω), in the following way. For each set a ∈ P we define h(a)# = h(#a) and Ω = {h(a) ∈ B /0 6= a = #a}. We need to show that Ω is a pseudo-topology: (i) By definition h(0) = ; ∉ Ω; (ii) Since 1 = #1 and h(1) = B , then B ∈ Ω; (iii) If h(a), h(b) ∈ Ω, then a 6= 0 6= b, a = #a and b = #b. Besides h(a) ∩ h(b) = h(a ∧ b) and a ∧ b = #a ∧ #b ≤ #(a ∧ b) ≤ a ∧ b, that is, a ∧ b = #(a ∧ b). Thus, h(a) ∩ h(b) = h(a ∧ b) ∈ Ω; (iv) If h(a), h(b) ∈ Ω, then a 6= 0 6= b, a = #a and b = #b. So, #(a ∨ b) ≤ a ∨ b = #a ∨ #b ≤ #(a ∨ b), that is, a ∨ b = #(a ∨ b). Thus, h(a) ∪ h(b) = h(a ∨ b) ∈ Ω. Proposition 3.2. If P = (P, 1, 0, ∨, ∧, ∼, #) is a plausible algebra and a, b ∈ P , then #a ≤ #(a ∨ b). Proof. #a ≤ #a ∨ #b ≤ #(a ∨ b). Proposition 3.3. If P = (P, 1, 0, ∨, ∧, ∼, #) is a plausible algebra and a, b ∈ P , then a ≤ b ⇒ #a ≤ #b. Proof. a ≤ b ⇒ a ∨ b = b ⇒ #(a ∨ b) = #b ⇒ #a ≤ #b.
A propositional version of the logic of the plausible
191
4. The algebraic adequacy We will indicate the set of propositional variables of L (∇) by VarL (∇), the set of its formulas by ForL (∇), and a generic plausible algebra by A . The deduction of the formula ψ from Γ in L (∇) is denoted by Γ ` ψ, and when Γ is empty, ` ψ, the formula ψ is a theorem of L (∇). A formula ψ ∈ ForL (∇) is refutable in Γ when Γ ` ¬ψ holds; otherwise, ψ is irrefutable. A restrict valuation is a function v^ : VarL (∇) → A , that interprets each variable of L (∇) in an element of A . A valuation is a function v : ForL (∇) → A , that extends natural and uniquely v^ as follows: v(p) = v^(p) v(¬ϕ) = ∼ v(ϕ) v(ϕ ∨ ψ) =
v(ϕ) ∨ v(ψ)
v(ϕ → ψ) =
v(ϕ) v(ψ)
v(∇ϕ) = #v(ϕ). As usual, operator symbols of left members represent logical operators and the right ones represent algebraic operators. Let A be a plausible algebra. A valuation v : ForL (∇) → A is a model for a set Γ ⊆ ForL (∇) when v(ϕ) = 1, for each formula ϕ ∈ Γ. In particular, a valuation v : ForL (∇) → A is a model for ϕ ∈ ForL (∇) when v(ϕ) = 1. A formula ϕ is valid in a plausible algebra A when each valuation v : ForL (∇) → A is a model for ϕ. A formula ϕ is plausible-valid, what is denoted by Í ϕ, when it is valid in every plausible algebras. Now let (ForL (∇), ∨, →, ¬, ∇, 0, 1) be the algebra of formulas of L (∇), such that ∨ and → are binary operators, ¬ and ∇ are unary operators, 0 and 1 are constants and ϕ → ψ =df ¬ϕ ∨ ψ. We define the Lindenbaum algebra of L (∇). We define an equivalence relation ∼ by: ϕ ∼ ψ ⇔df ` ϕ → ψ and ` ψ → ϕ. The relation ∼, more than an equivalence, is a congruence, since by rule (R∇): ϕ ∼ ψ ⇔ ` ϕ ↔ ψ ⇒ ` ∇ϕ ↔ ∇ψ ⇔ ∇ϕ ∼ ∇ψ. For each ψ ∈ ForL (∇), we denote the class of equivalence of ψ modulo ∼ by [ψ] = {λ ∈ ForL (∇)/λ ∼ ψ}. The (Lindenbaum) algebra of L (∇), denoted by A (L (∇)), is the quotient algebra defined by A (L (∇)) = (ForL (∇) |∼ , 0, 1, ∨∼ , ¬∼ , ∇∼ ),
H. A. Feitosa, M. C. do Nascimento, M. C. Cabrini Grácio
192
such that: [ϕ] ∨∼ [ψ] = [ϕ ∨ ψ] ¬∼ [ϕ] = [¬ϕ] ∇∼ [ϕ] = [∇ϕ] 0 = [ϕ ∧ ¬ϕ] = [⊥] 1 = [ϕ ∨ ¬ϕ] = [>]. In general, it will not be indicated the index ∼ of operations. Proposition 4.1. In A (L (∇)) it is valid [ϕ] ≤ [ψ] ⇔ ` ϕ → ψ. Proof. [ϕ] ≤ [ψ] ⇔ [ϕ] ∨ [ψ] = [ψ] ⇔ [ϕ ∨ ψ] = [ψ] ⇔ ` ϕ ∨ ψ ↔ ψ ⇔` ϕ → ψ. Proposition 4.2. The algebra A (L (∇)) is a plausible algebra. Proof. Ax1 (∇ϕ ∧ ∇ψ) → ∇(ϕ ∧ ψ) ⇒ [∇ϕ ∧ ∇ψ] ≤ [∇(ϕ ∧ ψ)] ⇒ [∇ϕ] ∧ [∇ψ] ≤ [∇(ϕ ∧ ψ)] ⇒ #[ϕ] ∧ #[ψ] ≤ #[ϕ ∧ ψ]; Ax2 (∇ϕ ∨ ∇ψ) → ∇(ϕ ∨ ψ) ⇒ [∇ϕ ∨ ∇ψ] ≤ [∇(ϕ ∨ ψ)] ⇒ [∇ϕ] ∨ [∇ψ] ≤ [∇(ϕ ∨ ψ)] ⇒ #[ϕ] ∨ #[ψ] ≤ #[ϕ ∨ ψ]; Ax3 ∇ϕ → ϕ ⇒ [∇ϕ] ≤ [ϕ] ⇒ #[ϕ] ≤ [ϕ]; Ax4 ∇(¬ϕ ∨ ϕ) ⇒ [∇(¬ϕ ∨ ϕ)] = 1 ⇒ #[¬ϕ ∨ ϕ] = 1; R∇ {` ϕ ↔ ψ/ ` ∇ϕ ↔ ∇ψ} : [ϕ ↔ ψ] = 1 ⇒ [ϕ] = [ψ] ⇒ #[ϕ] = #[ψ] ⇒ [∇ϕ] = [∇ψ] ⇒ [∇ϕ → ∇ψ] = 1. The algebra A (L (∇)) is the canonical model of L (∇). Corollary 4.3. Let ϕ be a member of ForL (∇). Then ` ϕ iff [ϕ] is the unit 1 in the model of A (L (∇)). The formula ϕ is irrefutable iff [ϕ] 6= 0. Proof. Let ` ϕ. Since A (L (∇)) always has an identity element 1, then: 1. 2. 3. 4.
ϕ ϕ → (ψ → ϕ) ϕ → ((ϕ → ϕ) → ϕ) (ϕ → ϕ) → ϕ
Hypothesis CPC Substitution in 2 MP in 1 and 3
Hence: 1 = [ϕ → ϕ] ≤ [ϕ], that is, [ϕ] = 1. On the other hand, when [ϕ] = 1, then [ϕ → ϕ] ≤ [ϕ], this means that holds ` (ϕ → ϕ) → ϕ. Since ` ϕ → ϕ, it follows, by MP, that ` ϕ. Now, ϕ is irrefutable iff ` ¬ϕ iff [¬ϕ] 6= 1 iff ¬∼ [ϕ] 6= 1 iff [ϕ] 6= 0.
A propositional version of the logic of the plausible
193
From preceding propositions, it results that for each formula ϕ: [ϕ] = 1 iff ` ϕ and [ϕ] = 0 iff ` ¬ϕ. Theorem 4.4 (Soundness). The plausible algebras are correct models for the logic L (∇). Proof. Let A = (A, 0, 1, ∨, ∼, #) be a plausible algebra. It remains to prove that the axioms Ax1 –Ax4 are valid and the rule R∇ preserves validity: Ax1 : v(∇ϕ ∧ ∇ψ → ∇(ϕ ∧ ψ)) = 1, because #v(ϕ) ∧ #v(ψ) ≤ #v(ϕ ∧ ψ). Ax2 : v(∇ϕ ∨ ∇ψ → ∇(ϕ ∨ ψ)) = 1, because #v(ϕ) ∨ #v(ψ) ≤ #v(ϕ ∨ ψ). Ax3 : v(∇ϕ → ϕ) = v(∇ϕ) v(ϕ) = #v(ϕ) v(ϕ) = ∼ #v(ϕ) ∨ v(ϕ) = ∼ #v(ϕ) ∨ (#v(ϕ) ∨ v(ϕ)) = (∼ #v(ϕ) ∨ #v(ϕ)) ∨ v(ϕ) = 1 ∨ v(ϕ) = 1. Ax4 : v(∇(¬ϕ ∨ ϕ)) = #v(¬ϕ ∨ ϕ) = #1 = 1. R∇: v(ϕ ↔ ψ) = 1 ⇒ v(ϕ) = v(ψ) ⇒ #v(ϕ) = #v(ψ) ⇒ v(∇ϕ) = v(∇ψ) ⇒ v(∇ϕ ↔ ∇ψ) = 1. Corollary 4.5. The propositional calculus L (∇) is consistent. Proof. Suppose that L (∇) is not consistent. Then there is ϕ ∈ ForL (∇) such that ` ϕ and ` ¬ϕ. By Soundness Theorem, ϕ and ¬ϕ are valid. Let v be a valuation in a plausible algebra with two elements 2 = {0, 1}. Since ϕ is valid, then v(ϕ) = 1 and v(¬ϕ) = ∼ v(ϕ) = 0. This contradicts the fact that ¬ϕ is valid. Theorem 4.6. Let ϕ be a member of ForL (∇). The following assertions are equivalent: (i)
` ϕ;
(ii)
Í ϕ;
(iii) ϕ is valid in every plausible algebra of a sub-algebra of a pseudo-topological space (E , Ω); (iv)
∗ vA (ϕ) = 1, where v ∗ is the valuation of the canonical model.
Proof. (i) ⇒ (ii): it follows from the Soundness Theorem. (ii) ⇒ (iii): it suffices to observe that there is a plausible algebra of sets of a pseudotopological space (Proposition 3.1). (iii) ⇒ (iv): since every plausible algebra is isomorphic to a sub-algebra of a pseudotopological space (E , Ω) and A (L (∇)) is a plausible algebra, the result follows. (iv) ⇒ (i): if ϕ ∈ ForL (∇) and it is not derivable in L (∇), by Corollary 4.3, [ϕ] do ∗ not coincide with the unity of A (L (∇)), thus v A (ϕ) 6= 1. Therefore ϕ is not a valid formula. Corollary 4.7 (Completeness). For each ϕ ∈ ForL (∇), if ϕ is valid, then ϕ has a demonstration in L (∇).
H. A. Feitosa, M. C. do Nascimento, M. C. Cabrini Grácio
194
5. Consistency and models of Γ Let Γ ⊆ ForL (∇) and B a plausible algebra. A model for Γ is a valuation v : VarL (∇) → B that makes valid all the formulas of Γ, that is, v B (ϕ) = 1, for every ϕ ∈ Γ. As usual, Γ Í ϕ denotes that every model of Γ is also a model of ϕ. Proposition 5.1. Let Γ ⊆ ForL (∇). If Γ ` ϕ, then Γ Í ϕ. Proof. Let v : VarL (∇) → B be a model for Γ. As in Theorem 4.4, rules of L (∇) preserve validity and v B (ψ) = 1, for every ψ ∈ Γ, then v B (ϕ) = 1. Proposition 5.2. Let Γ ⊆ ForL (∇) and B a plausible algebra. If there is a model v : VarL (∇) → B for Γ, then Γ is consistent. Proof. Suppose that Γ is not consistent. Then Γ ` ϕ and Γ ` ¬ϕ and so v B (ϕ) = 1 and v B (¬ϕ) = 1. Since v B (¬ϕ) = 1, it follows that ∼ v B (ϕ) = 1 and, therefore, v B (ϕ) = 0, that is, a contradiction. A model v : VarL (∇) → B is adequate for Γ when: Γ ` ϕ iff Γ Í ϕ. Proposition 5.3. If Γ ⊆ ForL (∇) is consistent, then the canonical valuation is an adequate model to Γ. ∗ ∗ Proof. Considering the canonical valuation: v A : ForL (∇) → A (L (∇)), v A (ϕ) = [ϕ], ∗ ∗ by Corollary 4.3, v A (ϕ) = 1 iff Γ ` ϕ. Therefore we have that v is an adequate model to Γ.
Theorem 5.4 (Adequacy). Given Γ ⊆ ForL (∇), the following conditions are equivalent: (i)
Γ is consistent
(ii)
there is an adequate model to Γ
(iii) there is an adequate model to Γ in a plausible algebra B of a sub-algebra of a pseudo topological space (E , Ω) (iv)
there is a model to Γ.
Proof. (i) ⇒ (ii) It follows of preceding proposition. (ii) ⇒ (iii) Since A (L (∇)) is a plausible algebra and every plausible algebra is isomorphic to a sub-algebra of a pseudo topological space (E , Ω) [Proposition 3.1], then the result follows. (iii) ⇒ (iv) It is an immediate consequence. (vi) ⇒ (i) It results directly by means of Proposition 5.2. Corollary 5.5. Let Γ ∪ {ϕ} ⊆ ForL (∇). If Γ is consistent, the following conditions are equivalent:
A propositional version of the logic of the plausible
(i)
Γ`ϕ
(ii)
ΓÍϕ
195
(iii) every model of Γ in a plausible algebra of a sub-algebra of a pseudo topological space (E , Ω) is a model of ϕ (iv)
∗ (ϕ) = 1, for every canonical valuation v ∗ . vA
References Barwise, J. & Cooper, R. 1981. Generalized quantifiers and natural language. Linguistics and Philosophy 4: 159–219. Bell, J. L. & Machover, M. 1977. A course in mathematical logic. Amsterdam: North-Holland. Ebbinghaus, H. D. 1985. Extended logics: the generalized framework. In Barwise, J. & Feferman, S. (eds.) Model-theoretic logics. Berlin: Springer-Verlag, p. 25–76. Ebbinghaus, H. D.; Flum, J.; Thomas, W. 1984. Mathematical logic. New York: Springer-Verlag. Grácio, M. C. C. 1999. Lógicas moduladas e raciocínio sob incerteza. PhD Thesis (in Portuguese), Institute of Philosophy and Human Sciences, State University of Campinas, Campinas, Brazil. Hamilton, A. G. 1978. Logic for mathematicians. Cambridge: Cambridge University Press. Mendelson, E. 1987. Introduction to mathematical logic. 3. ed. Monterey, CA: Wadsworth & Brooks/Cole Advanced Books & Software. Miraglia, F. 1987. Cálculo proposicional: uma interação da álgebra e da lógica. (Coleção CLE, v. 1) Campinas: UNICAMP/CLE. Nascimento, M. C. & Feitosa, H. A. 2005. As álgebras dos operadores de conseqüência. Revista de Matemática e Estatística (São Paulo) 23(1): 19–30. Rasiowa, H. 1974. An algebraic approach to non-classical logics. Amsterdam: North-Holland. Rasiowa, H. & Sikorski, R. 1968. The mathematics of metamathematics. 2. ed. Waszawa: PWN – Polish Scientific Publishers. Sette, A. M.; Carnielli, W. A.; Veloso, P. 1999. An alternative view of default reasoning and its logic. In Haeusler, E. H. & Pereira, L. C. (eds.) Pratica: Proofs, types and categories. Rio de Janeiro: PUC, p. 127–58. Vickers, S. 1990. Topology via logic. Cambridge: Cambridge University Press. Wójciki, R. 1988. Theory of logical calculi: basic theory of consequence operations. (Synthese Library, v. 199) Dordrecht: Kluwer.
S OBRE A D ISTINÇÃO ENTRE D EMONSTRAÇÃO E A RGUMENTAÇÃO J ORGE A LBERTO M OLINA UNISC/UERGS
molina@unisc.br
Uma distinção É próprio do discurso filosófico o uso de distinções que servem para separar diferentes significados contidos dentro de um mesmo conceito. Como exemplo de esse proceder temos aquelas distinções entre realidade formal e realidade objetiva de uma idéia, entre juízos analíticos e sintéticos, e entre sintéticos a priori e a posteriori, entre verdades de razão e verdades de fato, entre termos gerais e singulares, etc. A primeira sendo uma separação entre dois significados do conceito “ realidade de uma idéia”, a segunda entre dois significados de “juízo” e a terceira entre dois significados de “juízo sintético”, e assim em diante. Houve e há ainda muita polêmica sobre a pertinência de algumas dessas distinções. No século XX, quiçá o exemplo mais conhecido de polêmica gerada por uma distinção filosófica foi produzido pela análise quineana da separação entre enunciados analíticos e enunciados sintéticos no artigo Dois dogmas do Empirismo. Na década dos cinqüenta do século passado o filósofo belga Ch Perelman propôs a distinção entre demonstração ou prova por um lado, e argumentação pelo outro (Perelman 1997, p. 369). Trata-se nesse caso, não de uma distinção ao nível de classes de conceitos, nem ao nível de tipos de enunciados, mas de uma entre dois classes de discursos que visam, ambos, justificar uma determinada afirmação. Ao usar o termo “demonstração” Perelman estava fazendo referência aos raciocínios dedutivos próprios das disciplinas formais como a Matemática e a Lógica. Há contudo uma certa ambigüidade na apresentação do autor belga supracitado pois ele se referia com aquele termo indistintamente ora às provas da Matemática informal ora às provas no seio das teorias matemáticas formalizadas. Mas em qualquer caso o termo “demonstração ” aludia para ele aos raciocínios que encontramos dentro das teorias axiomatizadas. Por outro lado, ao usar o termo “argumentação” Perelman estava fazendo referência ao tipo de raciocínio contido nos textos de Filosofia, de Direito, de Teologia e de Ciências Humanas, e também àqueles discursos orais ou escritos, próprios do âmbito jurídico, aos sermões religiosos, e aos discursos parlamentários. Perelman sublinhou determinadas características que nos permitiriam separar demonstração de argumentação. Essas caracteristicas se referem aos conceitos usados nos dois tipos de raciocínio, às premissas das quais eles partem, aos esquemas inferenciais usados,ao contexto de produção da argumentação e da demonstração e à aceitação das conclusões obtidas através delas. Em primeiro lugar, os conceitos que
Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 196–206.
Sobre a Distinção entre Demonstração e Argumentação
197
ocorrem numa demonstração matemática têm um significado unívoco.1 Esse significado está dado através de sua definição. Essa definição pode ser genética, como no caso da definição de círculo como aquela figura gerada pela rotação de um segmento ao redor de um ponto, ou pode resultar de uma convenção aceita pela comunidade dos matemáticos, como é o caso da definição de número real transcendente como aquele que não pode ser raiz de um polinômio com coeficientes racionais. Temos também o caso das definições impredicativas onde um termo é definido a partir de conceitos que caracterizam uma totalidade da qual o referente pretendido do definiendum faz parte. Mas, seja qualquer o modo como definamos os conceitos da Matemática, o caso é que não enfrentamos com eles situações de ambigüidade. Com razão se afirma que os próprios axiomas das teorias matemáticas limitam a variação do significado dos termos próprios dessas teorias, e até se tem dito que eles mesmos são definições implícitas desses termos.2 No discurso argumentativo a situação é outra, pois seus termos não resultam nem de uma convenção estabelecida por um grupo de especialistas, nem duma construção. Eles são obtidos da linguagem ordinária e, como as situações de emissão daqueles termos são variáveis, acabam adquirindo diferentes significados. Pensemos, por exemplo, em termos como “idéia”, “justiça”, “bem”, “verdade”. Uma razão que mostra que as coisas são assim como as declara Perelman é que no discurso argumentativo é muito comum a estratégia de divisão semântica. Quando Sócrates, no Eutifron disse que o pio é parte do justo, com posterioridade se obriga a separar dois sentidos do termo “justo” : o justo em relação aos homens, e o justo em relação aos deuses (Eutifron, 12 d-e). Quando Descartes quis provar que Deus é o autor da idéia que nós temos dele, distinguiu dois sentidos da expressão “realidade de uma idéia”: realidade formal e realidade objetiva (Descartes 1973, p. 11). Um outro aspecto que sublinha Perelman é que os termos adquirem novos significados no seio de um argumento (Perelman 1997, p. 120–1). Pois um é o signficado do termo “Deus” antes dos argumentos que provam sua existência, outro é seu significado quando aparece na conclusão desses argumentos. Por outro lado, é comum que o discurso argumentativo vise obter como sua conclusão o esclarecimento de um conceito. Assim, em muitos diálogos de Platão a argumentação se endereça, muitas vezes sem sucesso, a obter definições de conceitos como “ justiça” “bem”, “beleza”(Cf. Hipias Maior 286 a). Pelo contrário, numa teoria axiomatizada como as teorias matemáticas ou nas partes axiomatizadas das ciências naturais, as definições são pontos de partida e não o termo de uma busca. Em segundo lugar, a demonstração matemática, como vimos, está inserida dentro de uma determinada disciplina matemática, seja ela Álgebra, Geometria, Análise, Topologia e suas numerosas sub disciplinas. Cada uma delas se apóia num conjunto de axiomas e definições. O matemático prático aceita esses axiomas e os considera como verdades evidentes. É claro que pesquisas posteriores podem mostrar que algum dos axiomas pode ser provado a partir dos outros ou que o conjunto de axiomas pode ser derivado dedutivamente dos axiomas de uma teoria matemática mais básica. Entretanto, ele considerará esses axiomas como se fossem verdades evidentes que
198
Jorge Alberto Molina
não exigem pelo momento, demonstração. A partir desses axiomas, e mediante o uso dos esquemas inferenciais aceitos nas ciências formais chega a conclusões verdadeiras. O argumentador, pelo contrário, não considerará suas premissas como verdades evidentes, mas como proposições verossímeis que permitem obter uma conclusão verossímil. Na verdade, nas disciplinas argumentativas não há axiomas. Obviamente isto é aceito quase na sua generalidade em âmbitos como a Ética e o Direito, e em geral, em todos aqueles casos em que argumentamos para estabelecer juízos de valor. Ainda que o discurso filosófico do racionalismo moderno pretenda também partir de axiomas no intuito de obter, através de demonstrações, certezas filosóficas inabaláveis (Cf. Leibniz GP VII p. 188–9 e GPVII, p. 205), hoje nós estamos dispostos a aceitar que também, na Filosofia, temos que lidar com afirmações mais ou menos verossímeis, como premissas e conclussões de nossos arrazoados. Em terceiro lugar os esquemas inferenciais usados nas demonstrações matemáticas são esquemas logicamente válidos no sentido que eles nos garantem passar de premissas verdadeiras à conclusões verdadeiras, como é o caso do Modus Ponens. Porém, é audacioso afirmar que todos as inferências matemáticas se deixem representar por aqueles esquemas válidos da Lógica de Primeira ordem. O mais provável é que não seja assim (cf. Dummett 1977, p. 398). Mas seja como for a resposta a essa questão, o fato é que o matemático prático vai considerar que todas as inferências que ele faz permitem passar de premissas verdadeiras a uma conclusão verdadeira. No discurso argumentativo esse não é o caso. Vejamos um esquema inferencial típico do discurso argumentativo: o argumento pelo exemplo. No Discurso do Método (AT VI, p. 11–3), Descartes quis mostrar através dos exemplos da construção de casas, de cidades, do estabelecimento de leis, que há mais perfeições nas obras feitas por só uma pessoa que naquelas onde intervém muitas. É claro, que uma conclusão obtida através de exemplos, está sujeita a ser objetada desde que sempre pode se dizer que não se consideraram todas as instâncias, ou que o número de exemplos não é suficiente. Nesse sentido o argumento pelo exemplo está sujeito às mesmas objeções que o raciocínio indutivo.3 Um outro esquema inferencial usado na argumentação é a analogia. Assim por exemplo, Aristóteles critica os filósofos materialistas através do seguinte argumento por analogia: assim como uma cama não se faz sozinha, do mesmo modo o Universo não se fez sozinho, mas deve haver um outro princípio, além da matéria, que tem organizado as coisas (Metafísica A 3 984 a 15-30). Mas a analogia não é um esquema que garanta o trânsito de premissas verdadeiras a conclusões verdadeiras. É suficiente que recordemos a analogia de Kepler entre o número de poliedros regulares e o número de planetas, ou aquela expressa na lei de Bode (Losee 1979, p. 55–62). Em quarto lugar o matemático tenta fazer explícitos todos os seus supostos. Tenta mesmo que não o consiga. Grande parte da pesquisa em fundamentos da Matemática consiste em trazer à luz todos os elementos que intervém numa demonstração matemática. Desde os Elementos de Euclides, até os Grundlagen der Geometrie de Hilbert, isso foi um ideal da exposição matemática. No discurso argumentativo é comum o
Sobre a Distinção entre Demonstração e Argumentação
199
uso do entimema, raciocínio do qual se omitiram algumas premissas. Entimemas e argumentos pelo exemplo, são os raciocínios típicos do discurso retórico (Aristóteles, Retórica I, 1365 b 1-30). Em quinto lugar as condições que rodeiam a exposição de uma demonstração matemática e as de um argumento são diferentes. Reconhecemos duas situações típicas de apresentação de uma demonstração matemática. Uma é a situação didática na qual o mestre força seus discípulos a assentir à conclusão da demonstração. Mas na verdade, não é ele mesmo quem coage seus discípulos mas é a força da evidência que se impõe aos seus alunos. O aluno pode pedir esclarecimento sobre tal e tal ponto. Mas partimos do suposto de que a demonstração prova o que tem que provar. A complexidade da demonstração poderá ser inadequada ao nível de compreensão dos alunos. Entretanto o mestre pode escolher conceitos que estejam no seu nível de compreensão, ou ocasionalmente usar recursos pedagógicos que auxiliem na aprendizagem do aluno mas que propriamente não fazem parte da demonstração, mas do discurso que a apresenta e acompanha. Assim o professor de Cálculo poderá auxiliar na compreensão das demonstrações de certos teoremas usando desenhos ou exemplos físicos A outra situação é aquela na qual a demonstração é apresentada a um grupo de especialistas. Nesse caso as concessões a audiência são menores, pois supõe-se que ela deve estar na posse dos conhecimentos necessários para julgar da demonstração. Pelo contrário no discurso argumentativo a intervenção real ou possível da audiência modifica o desenvolvimento da argumentação mesma. Assim um argumentador sempre tem em vista as possíveis objeções que podem fazer seus adversários. Por isso é tão comum na argumentação o uso da figura retórica chamada prolepsis, o discurso que tenta responder uma possível objeção. Em sexto e último lugar a aceitação das conclusões de uma demonstração matemática é definitiva. Tendo sido uma proposição provada a questão que lhe deu origem se fecha. Podemos generalizar aquela questão e tentar provar uma proposição mais geral que tenha validade sobre outros domínios, além daquele onde ela teve sua origem. Por exemplo, havendo sido já demonstrada por Euclides a decomposição de um número natural em fatores primos e o carácter único dessa decomposição (Euclides, Elementos X, 9), os matemáticos muito tempo depois buscaram generalizar esse resultado para ideais e ideais primos. Mas a questão originária mesma, que era a da possibilidade de decompor de forma única um número natural, se fechou. Na argumentação as conclusões não são definitivas. Por isso é necessário dar às vezes muitos argumentos, uns se apoiando aos outros, para defender uma tese, ao passo que só uma demonstração matemática bem feita basta. Assim nas Meditações Metafísicas de Descartes reconhecemos três provas da existência de Deus, e quantas provas da imortalidade da alma encontramos no Fedon de Platão! Consideremos agora a distinção entre argumentação e demonstração desde uma perspetiva histórica. De fato, a distinção proposta por Perelman entre as duas resulta de sua interpretação de Aristóteles. Aristóteles reconheceu três tipos diferentes de raciocínios (silogismos) na sua terminologia: o silogismo demonstrativo ou científico,
200
Jorge Alberto Molina
cuja forma é objeto de estudo dos Primeiros Analíticos e cujo uso na ciência é normatizado nos Segundos Analíticos, o silogismo dialético, apresentado por Aristóteles nos seus Tópicos e nas Refutações Sofísticas, e o silogismo retórico, tema da obra de Aristóteles cujo título é precisamente Retórica. Esses dois últimos são aqueles que Perelman coloca sob o conceito genérico de argumentação. O Estagirita explicitou sua distinção da forma seguinte: o silogismo demonstrativo é aquele que procede de premissas necessariamente verdadeiras e prova uma conclusão que é também necessariamente verdadeira, o silogismo dialético é aquele que a partir de premissas prováveis chega a uma conclusão também provável, e o silogismo retórico é aquele cujo objetivo consiste em persuadir a outrem da aceitação de uma tese. A diferença entre Analítica e Dialética está dada, segundo Aristóteles, pela natureza das premissas, necessárias na primeira, prováveis na segunda (Tópicos 100 a 18-100 b 18). Entretanto para separar a Dialética da Retórica, Aristóteles usou como critério não a natureza das premissas mas a função do discurso dialético e do discurso retórico : chegar a conclusões prováveis num caso, persuadir no outro (Retórica 1355 b25-35). Há também diferenças entre o contexto de emissão que acompanha esses diferentes silogismos. O silogismo demonstrativo ocorre no ensino de uma ciência por um mestre que força o assentimento de um discípulo ao mostrar-lhe as proposições que decorrem dos primeiros princípios (Refutações Sofísticas 165 b 1-10). O discurso dialético aparece quando uma teses é proposta por um dos participantes de um diálogo e outro participante manifesta seu desacordo com essa tese. Nesse caso o discurso dialético visa resolver uma diferença de opinião através da argumentação. O discurso retórico é aquele que é proferido face a uma assembléia, uma multidão, ou um corpo colegiado qualquer. A classificação aristotélica dos discursos argumentativos e a identificação de suas respectivas situações de emissão, determinaram para a posterioridade a perspectiva a partir da qual devia ser considerada a argumentação.
Objeções e defesa Quando uma distinção entre dois conceitos é proposta existe uma estratégia padronizada para tentar invalidá-la: ou apontar para existência de realidades híbridas que não poderiam se subsumir dentro de nenhum dos dois tipos de conceitos, ou afirmar que a distinção não é exaustiva, que ficam realidades não contempladas pelo dos dois tipos de conceitos. Já Locke nos Ensaios sobre o entendimento humano (Locke 1983, Parte III, Cap. II 15–9) nos apresentava o problema de como classificar uma criança mentalmente deficiente. Nós hesitaríamos em lhe aplicar o conceito de “ animal racional”, teríamos dúvidas sobre se considerá-la homem ou simplesmente animal. O que Locke nos propunha através desse exemplo, é que nós separássemos a essência nominal, dada pela definição de um conceito, da essência real que é a natureza íntima do ser ao qual esse conceito tenta se referir. A essência nominal de homem nos é clara: o homem é um animal racional, mas a sua essência real não nos é conhecida de forma suficiente, e é por isso que nós duvidamos em subsumir uma criança mentalmente
Sobre a Distinção entre Demonstração e Argumentação
201
deficiente sob o conceito de homem. Um outro exemplo, é obtido ao pensar como classificar o ornitorrinco, como ave ou como mamífero. Entretanto aqui, no caso da distinção entre demonstração e argumentação, não estamos lidando com essências reais de entes da Natureza mas com criações conscientes do espírito humano, com raciocínios. Trata-se de classificar raciocínios. Porém ao classificar criações do espírito humano também podemos nos encontrar com realidades híbridas que têm traços de um tipo, e traços do outro. Assim o lingüista não dirá que o inglês é uma língua germânica nem que é uma língua neo-latina. Dirá que ele tem traços dos dois tipos de línguas. Mas aqui, onde estamos tentando classificar raciocínios aceitar realidades híbridas é bem mais difícil que no caso das línguas. Supõe se que,mesmo que os raciocínios sejam em algum sentido criações coletivas, eles são produtos que têm passado por uma avaliação e uma crítica. Mas, o que seria uma realidade híbrida, o que seria um raciocínio justificatório que não possa se encaixar nem como demonstração nem como argumentação? E onde encontrá-lo? O livro de Lakatos A lógica do descobrimento matemático: Provas e refutações nos da, aparentemente, um exemplo dessa realidade: discute-se nesse texto sobre a prova dada por Euler da conjectura de Descartes que afirma que em todo poliedro vale a relação V −F + A = 2, onde F é o número de faces do poliedro, V o seu número de vértices, e A o número de arestas. A demonstração euleriana dessa conjectura foi submetida a avaliação e crítica. Contra exemplos mostraram que essa relação não se satisfazia. Mas o que gerava a grande abundância de contra exemplos era o fato de que o conceito “poliedro” não estava rigorosamente caracterizado. A tentativa de encontrar resposta a esses contra exemplos propiciou importantes desenvolvimentos na Matemática, entre eles uma caracterização clara do conceito de poliedro e a constituição de uma nova disciplina axiomatizada, a Topologia algébrica, dentro da qual se pode provar a relação de Euler–Descartes. Nesse mesmo texto Lakatos nos oferece um outro exemplo: a prova por Cauchy de que toda série convergente de funções contínuas tem como limite uma função continua. Aqui, neste caso, o que não estava suficientemente claro era o conceito de continuidade. Mas o que seriam essas provas cujos conceitos não estão suficientemente definidos e cujas conclusões podem ser contestadas? Como classificá-las? Também a história da Geometria grega nos mostra exemplos de provas que ocorrem em contextos teóricos não axiomatizados e cujas conclusões estão sujeitas a disputa. O historiador húngaro da Geometria grega Árpád Szabó dedicou grande parte de seu trabalho ao estudo das origens da Geometria grega, sobre tudo daquele período onde ela não havia sido ainda axiomatizada (ver Szabó 1977). Estamos nos referindo a geometria grega pré-euclideana. O que as investigações de Szabó mostraram é que na Geometria grega pré-euclidiana encontramos formas de raciocínio que são iguais àquelas usadas na Dialética dos gregos, formas de raciocínio que achamos nos textos dos sofistas e nos diálogos de Platão, como por exemplo, no Menon 82–85 onde se discute o problema de duplicar a área de um quadrado dado. Uma dessas formas de raciocínio geométrico analisada por Szabó, é a regra de redução ao absurdo, que segundo Szabó teria tido sua origem na obra de Zenon.
202
Jorge Alberto Molina
Podemos então considerar que a prova de Euler, a de Cauchy e a construção que duplica a área de um quadrado dado seriam exemplos dessas realidades híbridas que estávamos buscando? O que nós indicaria que isso é assim? A existência desses híbridos matemáticos nos mostrariam que as coisas não são como Perelman as apresenta, que também as conclusões das demonstrações matemáticas poderiam ser contestadas, como o podem ser as de uma argumentação. Mas analisemos com mais profundidade a estrutura e a função desses supostos híbridos. Desde o ponto de vista estrutural vemos o seguinte: nessas provas que estamos considerando, vemos que ocorrem, como já dissemos, conceitos que na época não estavam claramente definidos, como o conceito de “poliedro” ou o conceito de “continuidade”. Aliás esse último conceito, para os matemáticos do século XIX, não diferia em muito do conceito de continuidade tirado da experiência quotidiana. Nesse sentido, pelo seu caráter difuso, aqueles conceitos se assemelhavam a conceitos filosóficos como o conceito de idéia ou de justiça. Na discussão no Menon sobre se a virtude pode ou não pode ser ensinada, que segue à duplicação do quadrado, encontramos ainda outra coisa: ela aparece em forma dialogada. E as expressões que ocorrem nela são próprias dos textos dialéticos (Szabó 1977, p. 254–82). Por sua função o que seriam aquelas demonstrações híbridas? O título da obra de Lakatos supracitada já nos da uma indicação. A idéia de que existe uma lógica da descoberta era comum na Idade Moderna, quando se afirmava que a Lógica consistia de uma ars inveniendi, cuja função é encontrar a verdade, e de uma ars demosntrandi ou judicandi, cuja função é estritamente justificatória. Os filósofos e matemáticos da Idade Moderna acreditaram encontrar um exemplo da ars inveniendi no método de análise da geometria grega, ao qual também Lakatos dedicou vários estudos. Raciocínios como os de Euler e Cauchy, aos quais acima nos referimos, não teriam uma função justificatória, mas heurística. Pela sua estrutura, pelo uso dos conceitos difusos que neles ocorrem, pela forma de exposição não axiomatizada, pelo fato de suas conclusões poderem ser contestadas, se encontram em grande medida próximas da argumentação. Eles não são raciocínios dentro de uma teoria dedutiva axiomatizada, construída nos moldes que Aristóteles indicou nos Segundos Analíticos. Sua função é exploratória. Serviriam para ajudar na construção de uma teoria dedutiva. Sua função não é justificatória mas exploratória, constitutiva. Ao passo que a distinção entre argumentação e demonstração proposta por Perelman, se aplica só a raciocínios cuja função é justificatória. Uma outra objeção a distinção que Perelman propôs é a seguinte. Não é verdade que a Lógica moderna e seus sistemas formais só sirvam para formalizar os raciocínios usados na matemática informal como Perelman afirmou. De fato no século XX temos sido testemunhas do surgimento das Lógicas intensionais ou filosóficas, lógicas que tentam formalizar raciocínios nos quais se fala de possibilidade, necessidade, permitido, proibido etc. Então em principio, face à essa realidade é lícito se perguntar se domínios do saber como o Direito, a Metafísica, ou a Ética, não poderiam quiçá ser expressos mediante demonstrações ou provas formais.4 É coisa bem sabida que dis-
Sobre a Distinção entre Demonstração e Argumentação
203
ciplinas que no início foram, no sentido de Perelman, argumentativas, com o desenvolvimento da ciência, foram submetidas a um tratamento formal. É o caso da Física, basta para verificar isso comparar a Física de Aristóteles como a Física dos Principia de Newton. Mas de fato essa objeção não se dirigiria em si contra a distinção entre argumentação e demonstração, mas contra a idéia de que é possível reservar à argumentação, de uma vez para sempre, um domínio fechado no qual a demonstração não possa entrar. Esse domínio fechado seria o da Filosofia, o da Ética e o do Direito. De fato, não haveria em principio nenhuma ressalva para aceitar que também o Direito e a Metafísica possam ser em grande medida formalizados. Mas o que não podemos aceitar é a ilusão leibniziana, de que todo discurso possa ser formalizado e axiomatizado, de que em todo domínio possamos substituir a disputa pelo cálculo, a argumentação pela demonstração. Quando se trata de discutir se esses sistemas formalizados para o discurso ético ou filosófico, capturam as idéias que estão nos arrazoados intuitivos não formais dessas disciplinas, quando se trata de ver se as provas formais que seriam válidas para esses domínios representariam adequadamente aqueles raciocínios que nós julgamos intuitivamente aceitáveis dentro dessas disciplinas, temos que recorrer ao discurso argumentativo. Pois temos que sair dos sistemas formais mesmos, temos que ir ao meta linguagem. A tentativa leibniziana de um cálculo universal só seria possível se pudermos formalizar toda a linguagem natural, mas essa é uma tarefa impossível (ver Tarski 1969). Poderia também se objetar que em Perelman não haveria lugar para a separação aristotélica entre silogismos dialéticos e silogismos retóricos, pois os dois tipos de raciocínio são subsumidos pelo autor belga debaixo do conceito de argumentação. De fato Perelman quis evitar o uso do termo dialética pelas suas associações com a dialética hegeliana. Nos escritos de Perelman se trata de discutir a dialética de Zenon ou aquela que encontramos nos textos dos sofistas e não a dialética hegeliana. É por isso que Perelman escolheu dar o título de Nova Retórica à suas investigações reunidas no seu Tratado da argumentação. Mas o fato é que tanto Retórica como Dialética usam as mesmas estratégias e esquemas inferenciais, as duas têm a ver com os conceitos da linguagem ordinária, as duas têm um caráter geral, porque tanto o retor como o dialético não são especialistas, eles podem falar de todas as coisas na sua generalidade, da mesma forma que o filósofo. A diferencia entre elas está dada pelo fato de que a Retórica visa a persuasão, e a Dialética visa estabelecer os princípios da ciência, isto é discutir sobre os axiomas, ou obter conclusões verossímeis. Se houver disparidade entre os dois tipos de discurso ela não repousaria na sua estrutura, mas na intenção com a qual eles são proferidos (Retórica I 1355 b 25 e Tópicos I, 1).Desde um ponto de vista estrutural podemos classificar os dois como argumentos e não como demonstrações. Uma outra objeção que poderia ser dirigida contra a distinção proposta por Perelman vem da forma como o autor belga se ocupa do raciocínio científico nas ciências naturais. Segundo Perelman o raciocínio científico nessas disciplinas, também chamado por ele de raciocínio experimental repousaria como a demonstração na evi-
204
Jorge Alberto Molina
dência, mas não na evidência dos axiomas, mas dos fatos (Perelman 1997, p. 152). Uma posição desse tipo é objetável, tendo em conta toda a discussão epistemológica sobre a impossibilidade de separar os fatos das teorias. Sem entrar nessa discussão, o que podemos afirmar é que na fase inicial de uma disciplina científica, como foi esse o caso da Física, da Biologia e da Química, seus resultados são apresentados de uma forma que resultam ser inteligíveis para o leitor cultivado, o mesmo tipo de leitor que lê hoje Filosofia ou Ensaios sociológicos. Reconhecemos nas produções textuais que expressam essa fase inicial de uma ciência as mesmas estruturas argumentativas que identificamos hoje nos textos de Direito e de Ciências Humanas (Bachelard 1996, cap. I, p. 29–36). Ao evoluir uma ciência sua produção textual fica cada vez mais inacessível para o leitor culto. A argumentação é substituída pelos raciocínios experimentais, onde ocorrem termos técnicos próprios do jargão da disciplina, e nos quais muitas vezes se faz uso de ferramentas da Estatística. Esses raciocínios próprios da fase madura de uma disciplina científica poderiam ser reconhecidos como um terceiro tipo de raciocínio justificatório diferente da demonstração e da argumentação.
Um argumento pragmático Fazer distinções envolve sempre tocar a questão filosófica da identidade e da diferença, noções que são relativas. Objetos que sob um aspecto são considerados idênticos, sob outro aspecto podem ser considerados diferentes. Sob uma determinada perspectiva os homens podem ser distinguidos dos chimpanzés, e sob outro considerados idênticos a eles, se os estarmos contrapondo por exemplo a outras famílias de mamíferos como os felinos. Por outro lado, sob determinado aspecto todos os homens podem ser considerados idênticos, por exemplo desde a perspectiva da Biologia, e poderíamos assim falar de uma natureza humana comum, sob outro aspeto, o da cultura eles podem ser considerados diferentes. Identidade e diferença não são noções absolutas, mas relativas ao nível de análise que estamos considerando. Por outro lado, classificações e distinções não podem ser considerados fazendo abstração das finalidades que temos em conta ao fazê-las. Assim os antigos classificavam as plantas segundo seu poder medicinal. O seu interesse era puramente médico (ver Foucault, Cap. II e V1981). Os modernos escolheram outros critérios de classificação, seu interesse era mais teórico. Em grande medida o que justifica uma distinção é que ela serva para os propósitos da atividade que estamos realizando, seja ela curar, teorizar, etc. Qual era então a finalidade que Perelman se propôs ao fazer essa distinção? A sua finalidade era estender o âmbito da racionalidade (Perelman 1997, p. 57–91). O positivismo lógico tentou reduzir a provas formais todas os raciocínios da ciência, e essa concepção está detrás dos programas de axiomatização das diferentes disciplinas científicas. O que não podia ser abordado dessa forma acabou sendo julgado sem sentido (Carnap 1963). Assim não apenas o discurso filosófico, mas também o discurso sobre valores foi julgado como sem sentido. O que Perelman buscava era que nós reconheçamos um outro tipo de racionalidade, diferente daquela da Matemática
Sobre a Distinção entre Demonstração e Argumentação
205
e da ciência experimental. Nós concordamos em que o discurso de um promotor, a alegação de um advogado, o escrito que fundamenta o falho de um juiz são o produto de atividades conduzidas racionalmente. Aliás são produtos que podemos avaliar a partir de parâmetros que, mesmo não tenham a “objetividade” dos parâmetros científicos, julgamos razoáveis. É claro que nós distinguimos entre um bom argumento jurídico, e um mal argumento jurídico, entre um bom ensaio filosófico, e o trabalho escolar de um principiante. Distinguir entre demonstração e argumento permite assim que nos ampliemos o âmbito da racionalidade. Mas por outro lado evitamos assim também dialetizar a ciência. Se o racionalismo moderno e o positivismo lógico, cometeram o erro de acreditar que a única forma de racionalidade era aquela da racionalidade científica, hoje assistimos a um outro erro de diferente sentido. Acreditar que na ciência, não há nada firme , que todas as conclusões podem ser contestadas, que tudo é questão de interpretação. Que não há fatos mas interpretações como afirmava Nietzsche. Há aqui uma incompreensão sobre o papel da argumentação na ciência. A discussão argumentativa de tipo filosófico versa sobre os princípios da ciência, mas uma vez tendo sido estes aceitos, as conclusões na ciência se seguem por via demonstrativa e/ou experimental. O que é assunto de discussão argumentativa é a visão do mundo que norteia a escolha de tais ou tais princípios de uma ciência. Mas as conclusões que se obtêm deles se seguem por via demonstrativa ou experimental e não estão sujeitas às disputas que reconhecemos na Filosofia ou no Direito. Também através da distinção entre demonstração e argumentação podemos colocar limites às tentativas abusivas de usar irrestritamente analogias matemáticas no campo das ciências humanas como se através de conceitos tirados de teorias matemáticas altamente abstratas pudessem ser obtidos esclarecimentos que a argumentação usual não poderia dar.
Referências Aristóteles. 1973. Tópicos: Dos argumentos sofisticos. São Paulo: Abril Cultural. —–. 1990. Metafísica. Edição trilingüe de Valentin García Yebra. Madri: Gredos. —–.1994. Retórica. Tradução Quintína Racionero. Madri: Gredos. Bachelard, G. 1996. A formação do espírito científico. Tradução de Estela dos Santos Abreu. Rio de Janeiro: Contraponto Carnap, R. 1963. Filosofía y Sintaxis Lógica. Traducción de César Molina. México: UNAM. Descartes, R. 1973. Discurso do método. Meditações Metafísicas. Objeções e respostas. As Paixões da Alma. Cartas. São Paulo: Abril. —–. 1987. Discours de la Méthode. (comentaire par E. Gilson) 6 ed. Paris: Vrin. —–. 1996. Oeuvres de Descartes publiées par Ch. Adam et P. Tannery. 11v. Paris: Vrin. Dummett, M. 1977. Elements of Intuitionism. Oxford: Oxford University Press. Euclides. 1956. The thirteen books of the elements. Tradução de Thomas L Heath. New York: Dover.
206
Jorge Alberto Molina
Foucault, M. 1981. As palavras e as coisas: uma arqueologia das ciências humanas. Tradução Salma Tannus. São Paulo: Martins Fontes. Lakatos, I. 1978. A Lógica do descobrimento matemático: provas e refutações. Rio de Janeiro: Zahar. Leibniz, G. W. 1978. Die philosophischen Schriften. Edição de C. I. Gerhardt. 7 vols; Berlin 1875-90; reimpressão Hildesheim: Georg Olms, 1960-1961. Abreviado GP. —–. 1971. Mathematische Schriften. Edição de C. I. Gerhardt Hildesheim: Georg Olms. 7 vols. Abreviado GM. —–. 2003. Frühe Schriften zum Naturrecht. Hamburg: Meiner Locke, J. 1983. Ensaio acerca do entendimento humano. São Paulo: Abril Cultural. Losee, J. 1979. Introdução histórica à filosofia da ciência. Belo Horizonte: Itatiaia. Perelman, Ch. 1997 Retóricas. São Paulo: Martins Fontes. Perelman, Ch. e Olbrechts-Tyteca, L. 1996. Tratado da argumentação. São Paulo: Martins Fontes. Platão. 1968. Menon. Tradução de Alfred Croiset. Paris: Les Belles Lettres. —–. 1993b. Hipias Mayor. Tradução de J. Calonge. Madri: Gredos. —–. 1993a. Eutifron. Tradução J. Calonge. Madrid: Gredos. Szabó, A. 1977. Les débuts des mathématiques grecques. Paris: Vrin. Tarski, A. 1969. Truth and proof. Scientific American 220(6): 63–77.
Notas 1 Perelman afirma: não há demonstração sem univocidade, nem há univocidade sem demonstração
(Perelman 1997, p. 107). 2 Por exemplo Hilbert pensava que os axiomas matemáticos eram definições implícitas de conceitos como ponto, linha,plano (Kambartel 1972, p. 151). 3 Em Retórica 1356 a 30-1356 b25 Aristóteles considera o argumento pelo exemplo o análogo retórica da indução. 4 Na Idade Moderna Leibniz tentou realizar essa empressa. Ver Leibniz 2003, p. 245–301.
U M S ISTEMA DE TABLÔS PARA A L ÓGICA DO M UITO M ARIANA M ATULOVIC Universidade Estadual de São Paulo/Marília
matulovicfadel@yahoo.com.br
1. Introdução A lógica do muito foi introduzida por Grácio, em 1999, em sua tese de doutorado intitulada “Lógicas Moduladas e o raciocínio sob incerteza”. Trata-se de um tipo de lógica modulada que se caracteriza por apresentar em seu ambiente sintático um novo quantificador generalizado, além dos usuais quantificadores clássicos de primeira ordem, ∀ e ∃. Ao desenvolver a Lógica do Muito, Grácio estava preocupada em formalizar sentenças que representassem a noção intuitiva de “muitos indivíduos”. Para tanto, ela inseriu um novo quantificador generalizado G na sintaxe da lógica de primeira ordem, com o seguinte significado: Gxα(x) ≡ “muitos x satisfazem α(x)”. É bastante comum atrelarmos à noção intuitiva de “muitos” a idéia de cardinalidade de um conjunto, ou seja, da quantidade de elementos que satisfazem uma determinada sentença α. No entanto, a concepção de “muitos” para Grácio está desvinculada da cardinalidade, mas está associada somente à noção de um conjunto grande de evidências. Há uma estrutura matemática, nomeada pela autora de Família Fechada Superiormente Própria, que define e justifica a relação intrínseca entre a noção intuitiva de muitos com a de um conjunto grande de evidências. Há três propriedades essenciais na noção de “muitos” que capturam a concepção subjacente a esse conceito e que constituem, como veremos daqui a pouco, a base da definição de famílias fechadas superiormente próprias. São elas: (i) se muitos indivíduos do universo satisfazem a proposição ϕ e ϕ está contida em ψ, então ψ também é satisfeita por muitos indivíduos do universo; (ii) se muitos indivíduos do universo satisfazem a proposição ϕ, então existe alguém que satisfaz ϕ; (iii) o conjunto universo contém muitos indivíduos. (Grácio & Feitosa 2005, p. 6)
1.1. Família fechada superiormente Segundo Grácio, uma família fechada superiormente própria F em um conjunto A é uma coleção de subconjuntos de A que satisfaz as condições seguintes, quando A 0 e A 00 são subconjuntos de A: i) se A 0 ∈ F e A 0 ⊆ A 00 , então A 00 ∈ F ; ii) A ∈ F ; Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 207–223.
Mariana Matulovic
208
iii) ; ∉ F . A seguir, exemplificaremos algumas famílias fechadas superiormente próprias, em virtude do vínculo existente entre essa definição e a noção intuitiva de “muitos”. 1) Consideremos o conjunto A = {a, b, c, d } e a seguinte família F = {A, {a, b}, {a, b, c}, {a, b, d }}. Essa família é fechada superiormente própria em A, ou seja, F possui muitos elementos? Conforme argumentamos, a seguir, essa família F é fechada superiormente própria em A, pois satisfaz as três condições necessárias para isso. F = {A, {a, b}, {a, b, c}, {a, b, d }}; (a)
A ∈ F;
(b)
; ∉ F;
(c)
Se A 0 ∈ F e A 0 ⊆ A 00 , então A 00 ∈ F .
A família F possui esses quatro subconjuntos para analisarmos: A, {a, b}, {a, b, c}, {a, b, d }. O conjunto {a, b} está contido em {a, b, c}, {a, b, d } ou {a, b, c, d }. Todos os três conjuntos que contém {a, b} pertencem à família F . Notemos que, em qualquer subconjunto de F , não ocorre o caso em que X está em F , X ⊆ Y , mas Y não está em F . Diante disso, concluímos que, de fato, F é uma família fechada superiormente própria em A. 2) Dado o conjunto A = {a, b, c, d }, a família F = {A, {a, b}} é fechada superiormente? A resposta é não, pois se considerarmos o conjunto {a, b, c} que contém {a, b}, verificamos que o mesmo não pertence à família F . Logo, F não é uma família fechada superiormente própria em A. 3) Consideremos no universo U = {brasileiras}, as seguintes propriedades: “gostar de sapatos” e “gostar de bolsas” e que “todas as brasileiras que gostam de sapatos, também gostam de bolsas”. Se “muitas brasileiras gostam de sapatos” está numa família fechada superiormente própria, então podemos inferir que “muitas brasileiras gostam de bolsas” também está. 1.2. A sintaxe da lógica do muito — L(G) A linguagem desta lógica é determinada por todos conectivos da lógica clássica de primeira ordem (CQC), acrescida do quantificador G, que representa a noção quantificacional de “muitos”; assim: L(G) = (∧, ∨, ¬, →, ∀, ∃, G). A definição de fórmula é a mesma do CQC, acrescida da seguinte cláusula: para uma variável x, se α é uma fórmula em L(G), então Gxα(x) também o é. As definições de variáveis livres e ligadas, bem como a propriedade de substituição das variáveis livres, são as mesmas da lógica clássica. A única diferença, com relação à definição de variável ligada, é que além dos quantificadores usuais ∀ e ∃, tere-
Um sistema de tablôs para a lógica do muito
209
mos o quantificador generalizado G, isto é, “toda ocorrência de x em Gxα(x) é ligada” (Grácio, p. 82). A lógica do muito, por ser uma lógica complementar à clássica, possui em seu sistema axiomático todos os axiomas clássicos mais os cincos axiomas abaixo referentes ao quantificador G: (Ax0 ) Axiomas da Lógica de Primeira Ordem Clássica; (Ax1 ) ∀x(ϕ(x) → ψ(x)) → (Gxϕ(x) → Gxψ(x)) (Ax2 ) ∀xϕ(x) → Gxϕ(x) (Ax3 ) Gxϕ(x) → ∃xϕ(x) (Ax4 ) ∀x(ϕ(x) ↔ ψ(x)) → (Gxϕ(x) ↔ Gxψ(x)) (Ax5 ) Gxϕ(x) → G yϕ(y), quando y é livre para x em ϕ(x). Desse modo, considerando ϕ e ψ subconjuntos de um universo A e representando por [ϕ] e [ψ] os conjuntos de indivíduos que, respectivamente, satisfazem ϕ e ψ, os axiomas denotam intuitivamente que: (Ax1 ) Se [ϕ] ⊆ [ψ] e [ϕ] tem muitos elementos, então [ψ] também possui muitos elementos. (Ax2 ) Se [ϕ] é satisfeito por todos os indivíduos de um determinado universo, então podemos afirmar que são muitos os indivíduos que satisfazem [ϕ]; (Ax3 ) Se são muitos os indivíduos de [ϕ], então existe pelo menos um indivíduo que satisfaz [ϕ], ou seja, [ϕ] não é vazio; (Ax4 ) Se dois conjuntos são iguais e o conjunto de elementos que satisfaz um deles é grande (possui muitos elementos), então podemos afirmar que o outro conjunto em questão também é corroborado por um conjunto grande de evidências (muitos elementos); (Ax5 ) Se são muitos os indivíduos x em [ϕ], e y é uma variável livre e distinta de x, então podemos substituir x por y, ou seja, são muitos os indivíduos y em [y]. As regras que compões L(G) são: i) Modus Ponens: α, α → β ` β. ii) Generalização: α ` (∀x)α. Grácio apresenta alguns teoremas da L(G). São eles: (1)
Gx(ϕ(x) ∨ ¬ϕ(x)),
(2)
Gxϕ(x) ∧ Gxψ(x) → Gx(ϕ(x) ∨ ψ(x)),
(3)
¬Gx(ϕ(x) ∧ ¬ϕ(x)),
(4)
Gxϕ(x) ∨ Gxψ(x) → Gx(ϕ(x) ∨ ψ(x)).
Mariana Matulovic
210
1.3. A semântica da lógica do muito — L(G) A estrutura semântica da lógica do muito, L(G), é composta por uma estrutura clássica de primeira ordem A, complementada por uma família fechada superiormente própria (F A ) sobre o universo A. Indicamos essa nova estrutura por AF = 〈A, F A 〉, em que AF = (A, {R iA }i ∈I , { f jA } j ∈J , {c kA }k∈K , F A ).1
Em uma estrutura do tipo AF , a satisfação das fórmulas da lógica do muito é definida da seguinte maneira: considere a definição usual do CQC e acrescente a cláusula: “seja ϕ uma fórmula cujo conjunto de variáveis livres esteja contido em {x} ∪ {y 1 , . . . , y n } e considere uma seqüência a = (a 1 , . . . , a n ) em A. Então: AF |= Gxϕ[x, a] 00 see {b ∈ A | AF |= ϕ[b; a]} ∈ F A (Grácio, p. 87). Como A 6= ;, quando x não ocorre livre em ϕ, AF |= Gxϕ[a] see A |= ϕ[a]. Intuitivamente, temos: (G x)ϕ(x) é verdadeira, isto é, [ϕ] é membro de F A see muitos indivíduos de A satisfazem ϕ (em outras palavras, se [ϕ] contém muitos indivíduos). Assim, F A é uma coleção de conjuntos que contêm muitos elementos”(Feitosa & Grácio 2005, p. 7).
Algumas definições tais como sentenças, teoremas, consistência etc., não foram expostas devido à analogia com a lógica de primeira ordem. Por fim, Grácio demonstra, em sua tese, que a lógica do muito é correta e completa, segundo o sistema dedutivo e modelos introduzidos neste capítulo. A seguir, desenvolveremos um sistema dedutivo por tablôs para esse sistema lógico modulado.
2. O método Tabl[L(G)] Como a lógica do muito é não-clássica por ser complementar à lógica clássica de primeira ordem, muitas das propriedades e definições válidas na lógica clássica também o são na lógica do muito. Por isso, não apresentamos as definições de árvores, ramos e tablôs, já que são as mesmas das apresentadas na literatura para o CPC e CQC. No entanto, há alguns aspectos que diferem no sistema de tablôs para a lógica do muito, tais como a cláusula de fechamento e as regras referentes ao quantificador modulado G. Nesses casos, introduzimos os elementos teóricos adequados ao sistema lógico em questão. 2.1. As regras para Tabl[L(G)] Para Tabl[L(G)] são válidas todas as regras estabelecidas para os tablôs do CPC e CQC, mais aquelas próprias do sistema modulado para G. A fundamentação teórica subjacente às novas regras de expansão para o quantificador G está no conceito de família fechada superiormente própria e na noção intuitiva do quantificador ‘muito’. Assim, as regras Tabl[L(G)] são as seguintes: considerando um universo qualquer A, temos:
Um sistema de tablôs para a lógica do muito
Regra G1 :
211
1 Gxϕ(x) 1 ϕ(a), para um novo indivíduo a ∈ A.
Intuitivamente, essa regra nos diz que: se muitos indivíduos satisfazem uma propriedade qualquer ϕ(x), então existe pelo menos um elemento pertencente ao conjunto A para o qual a propriedade ϕ(x) é satisfeita. Regra G2 :
0 Gxϕ(x) 0 ϕ(a), para um novo indivíduo a ∈ A.
Temos que, se o conjunto de evidências que satisfazem uma propriedade não tem muitos indivíduos, então existe pelo menos um elemento do universo de discurso que não apresenta tal característica. Regra G3 :
0 Gx(ϕ(x) ∨ ψ(x)) 0 Gxϕ(x) 0 Gxψ(x)
Essa regra nos diz que, se a união de dois conjuntos não possui muitos elementos, então ambos os conjuntos que determinam a união também não contém muitos elementos, pois se qualquer um deles gozar da propriedade ‘ter muitos elementos’, então a união, pela definição de família fechada superiormente, também terá muitos elementos. Regra G4 :
1 ∀x(ϕ(x) ↔ ψ(x)) 1 ∀x(ϕ(x) → ψ(x)) 1 ∀x(ψ(x) → ϕ(x))
Essa regra é uma fórmula válida do CQC. Como nosso sistema precisa satisfazer todos os teoremas da lógica do muito, necessitamos dela para alcançar tal objetivo. Devido ao fato de essa fórmula, válida classicamente, não integrar as regras dos tablôs clássicos do CQC, foi preciso inseri-la no nosso sistema para torná-lo computacionalmente mais rápido e efetivo. Se não, quando aparecesse uma fórmula desse tipo em uma demonstração, ela seria imediatamente instanciada e não subdividida em duas subfórmulas conforme estamos propondo. Regra G5 :
1 ∀x(ϕ(x) → ψ(x)) 0 Gxϕ(x) 1 Gxψ(x)
Essa regra deve ser analisada com mais detalhes. Observemos o seguinte: se para todos os elementos de um dado universo, o conjunto ϕ(x) está contido em ψ(x), então podemos afirmar que: • 1 Gxϕ(x) ou • 0 Gxϕ(x).
Mariana Matulovic
212
No primeiro caso, se muitos elementos satisfazem o conjunto ϕ(x), pela definição de família fechada superiormente, muitos elementos devem satisfazer ψ(x), já que ϕ(x) está contido em ψ(x). Agora, se é falso que muitos elementos atendem o conjunto ϕ(x), não podemos afirmar nada, efetivamente, a respeito do conjunto ψ(x). Isto é, a definição de família fechada superiormente só é válida quando o conjunto que está contido é fechado superiormente. Agora, nesse caso, 0 Gxϕ(x), o conjunto ψ(x) pode ter muitos elementos ou não. Para que o nosso procedimento seja realmente efetivo, precisamos programar alguns comandos que serão fundamentais ao processo. Inicialmente, o dispositivo tentará aplicar as regras clássicas dos operadores lógicos →, ∧, ∨, ↔ e ∀ sem instanciar as fórmulas. Em seguida, verifica-se se alguma regra específica de Tabl[L(G)] pode ser utilizada. Caso afirmativo, esta deve ser aplicada. Por último, instanciam-se as fórmulas, quando possível e, por fim, analisa-se se o método originou alguma cláusula de fechamento. Expostas as regras de Tabl[L(G)], definiremos as cláusulas de fechamento desse novo sistema. Definição 2.1. Um ramo, em Tabl[L(G)], é fechado quando temos no mesmo ramo uma das seguintes contradições: (i)
α e ¬α (cláusula de fechamento dos tablôs clássicos);
(ii)
Gxα e ¬G yα, nos casos em que y é uma variável livre para x em α(x).
Assim, como na lógica clássica, representamos que um ramo está fechado em Tabl[L(G)] através do símbolo “X”. Vejamos alguns exemplos de deduções de sentenças quantificadas pelo operador G em Tabl[L(G)]. a) Gxϕ(x) ∨ Gxψ(x) → ∃x(ϕ(x) ∨ ψ(x)) i) ii) iii) iv) v) vi) vii) viii) ix)
0 1 0 1 1 0 0 0 0
Gxϕ(x) ∨ Gxψ(x) → ∃x(ϕ(x) ∨ ψ(x)) Gxϕ(x) ∨ Gxψ(x) ∃x(ϕ(x) ∨ ψ(x)) Gxϕ(x) 1 Gxψ(x) 1 ψ(b) ϕ(a) ϕ(a) ∨ ψ(a) 0 ϕ(a) ∨ ψ(a) ϕ(b) ∨ ψ(b) 0 ϕ(b) ∨ ψ(b) ϕ(a) 0 ϕ(b) ψ(a) 0 ψ(b) X X
b) Gx(ϕ(x) ∨ ¬ϕ(x))
(refutação da sentença) (regra do condicional em i) (regra do condicional em i) (regra do CPC em ii) (regra G1 em iv) (regra do CQC em iii) (regra do CQC em iii) (regra do CPC em vi e vii) (regra do CPC em vi e vii) (cl. de fechamento em v e viii; v e ix)
Um sistema de tablôs para a lógica do muito
i) ii) iii) iv) v) vi)
0 0 0 0 1
Gx(ϕ(x) ∨ ¬ϕ(x)) ϕ(a) ∨ ¬ϕ(a)) ϕ(a) ¬ϕ(a) ϕ(a) X
213
(refutação da sentença) (regra G1 em i) (regra do CPC em ii) (regra do CPC em ii) (regra do CPC em iv) (cl. de fechamento em iii e v)
c) Gxϕ(x) ∧ Gxψ(x) → Gx(ϕ(x) ∨ ψ(x)) i) ii) iii) iv) v) vi) vii) viii)
0 1 0 1 1 0 0
Gxϕ(x) ∧ Gxψ(x) → Gx(ϕ(x) ∨ ψ(x)) (refutação da sentença) Gxϕ(x) ∧ Gxψ(x) (regra do condicional em i) Gx(ϕ(x) ∨ ψ(x)) (regra do condicional em i) Gxϕ(x) (regra do CPC em ii) Gxψ(x) (regra do CPC em ii) Gxϕ(x) (regra G3 em iii) Gxψ(x) (regra G3 em iii) X (cláusula de fechamento em iv e vi)
d) ¬Gx(ϕ(x) ∧ ¬ϕ(x)) i) ii) iii) iv) v) vi) vii)
0 1 1 1 1 0
¬Gx(ϕ(x) ∧ ¬ϕ(x)) Gx(ϕ(x) ∧ ¬ϕ(x)) ϕ(a) ∧ ¬ϕ(a) ϕ(a) ¬ϕ(a) ϕ(a) X
(refutação da sentença) (regra do CPC em i) (regra G1 em ii) (regra do CPC em iii) (regra do CPC em iii) (regra do CPC em v) (cláusula de fechamento em iv e vi)
e) Gxϕ(x) ∨ Gxψ(x) → Gx(ϕ(x) ∨ ψ(x)) i) ii) iii) iv) v) vi)
0 1 0 0 0 1
Gxϕ(x) ∨ Gxψ(x) → Gx(ϕ(x) ∨ ψ(x)) Gxϕ(x) ∨ Gxψ(x) Gx(ϕ(x) ∨ ψ(x)) Gxϕ(x) Gxψ(x) Gxϕ(x) 1 Gxψ(x) X X
(refutação da sentença) (regra do condicional em i) (regra do condicional em i) (regra G3 em iii) (regra G3 em iii) (regra do CPC em ii) (cl. de fechamento em iv e vi)
3. Equivalência entre o sistema Tabl[L(G)] e o sistema hilbertiano da lógica do muito A idéia de se avaliar a equivalência entre diferentes sistemas dedutivos, a fim de se verificar quando os mesmos conservam todas as características, definições e propriedades, foi extraída de Silvestrini (2005). Utilizamos algumas definições importantes retiradas do trabalho de Carnielli, Coniglio e Bianconi (2006).
Mariana Matulovic
214
Silvestrini, em sua dissertação intitulada Tableaux e Indução na Lógica do Plausível, apresentou um sistema dedutivo por tablôs para uma lógica modulada, também desenvolvida por Grácio, denominada Lógica do Plausível. Em vez de verificar se o seu sistema dedutivo por tablôs conservava a correção e completude da lógica do plausível, ele optou por demonstrar a equivalência entre o seu sistema de tablôs (TLP) e o sistema hilbertiano proposto por Grácio para a lógica do plausível. Assim, ele garantiu que o sistema TLP preserva a correção e completude para a sua lógica pesquisada. Em suma, Silvestrini (2005) propôs esquematicamente que: Γ `LP ϕ m Γ LP ϕ
⇔
Γ |=LP ϕ
Obs: O símbolo representa a dedução por tablôs e LP a lógica do Plausível. Ao demonstrarmos que Γ ` ϕ ⇔ Γ ϕ, estaremos estabelecendo a equivalência entre as conseqüências lógicas de cada sistema dedutivo abordado e, uma vez que em Grácio (1999, p. 149) está demonstrada a completude do sistema axiomático de L (P ), nosso sistema de tableaux TLP também será correto e completo (Silvestrini 2005, p. 108).
Tal como Silvestrini, demonstraremos a equivalência do nosso sistema Tabl[L(G)] com o sistema hilbertiano de L(G), proposto por Grácio (1999), ou seja: Γ `L(G) ϕ m
⇔
Γ |=L(G) ϕ
Γ Tabl[L(G)] ϕ No entanto, para demonstrarmos essa equivalência, precisaremos de algumas definições apresentadas a seguir. Definição 3.1 (Carnielli; Coniglio; Bianconi 2006, p. 83). Dizemos que Γ deriva ϕ analiticamente se existe um tablô fechado para o conjunto (Γ ∧ ¬ϕ), também representado por (Γ, ¬ϕ). Denotamos tal fato por Γ `T ϕ. Teorema 3.1 (Carnielli; Coniglio; Bianconi 2006, p. 83). Temos as seguintes propriedades: (a)
ϕ `T ϕ;
(b)
Se `T ϕ então Γ `T ϕ;
(c)
Se ϕ ∈ Γ, então Γ `T ϕ;
(d)
Se Γ `T ϕ e Γ ⊆ ∆, então ∆ `T ϕ (Monotonicidade);
(e)
Γ `T ϕ see existe Γ0 ⊆ Γ, Γ0 finito, tal que Γ0 `T ϕ.
Definição 3.2 (Carnielli; Coniglio; Bianconi 2006, p. 86). Seja Γ ⊆ {∨, ¬}. Dizemos que Γ é T-inconsistente (inconsistente por tablôs) se existe um tablô fechado para Γ.
Um sistema de tablôs para a lógica do muito
215
Teorema 3.2 (Carnielli; Coniglio; Bianconi 2006 p. 88 – Introdução ao Corte). Os conjuntos (Γ, ϕ) e (Γ, ¬ϕ) são T-inconsistentes se, e somente se, o conjunto Γ é T-inconsistente. A regra de introdução do corte é válida tanto no CPC como no CQC. Como a utilizaremos para demonstrar um dos principais teoremas dessa dissertação, é necessário que examinemos se a mesma é preservada quando estendemos a lógica de primeira ordem com o quantificador generalizado G. Carnielli, Coniglio e Bianconi (2006) validam essa regra para a lógica proposicional constituída pela linguagem L = {∨, ¬}. De modo análogo, verificaremos que o mesmo vale para L = {∨, ¬, →, ∀, G}. Com o intuito de apresentar uma demonstração mais “limpa” e simples, substituiremos os símbolos dos valores de verdade 0 e 1, pelo sinal (¬) para representar a negação, e a ausência de marcação para representar a afirmação. Assim, ¬Gxϕ(x) significa que não são muitos os indivíduos que satisfazem ϕ(x) e Gxϕ(x) denota que muitos indivíduos satisfazem ϕ(x). No entanto, depois retornaremos à marcação anterior. Demonstração da regra de Introdução ao Corte para L = {∨, ¬, →, ∀, G}: Demonstração. (⇐) Se o conjunto Γ é T-inconsistente, então (Γ, ϕ) e (Γ, ¬ϕ) são Tinconsistentes. Sabemos, por hipótese, que existe um tablô fechado para Γ. Pelo teorema da Monotonicidade, se Γ ⊆ ∆, então ∆ também é fechado por tablô. Dentre as diversas fórmulas contidas em ∆ temos (Γ, ϕ) e (Γ, ¬ϕ). (⇒) Se os conjuntos (Γ, ϕ) e (Γ, ¬ϕ) são T-inconsistentes, então o conjunto Γ é T-inconsistente. Diante do fato de que Carnielli, Coniglio e Bianconi (2006) já demonstraram que a regra do corte é valida para L = {∨, ¬}, ao estendermos essa linguagem com o conectivo clássico condicional, verificaremos que essa regra é válida apenas para o referido conectivo. Em seguida, analisaremos se a regra ainda é preservada quando inserimos, gradativamente, os quantificadores Universal, Existencial e G na estrutura sintática da lógica. (i)
L = {∨, ¬, →, ∀}
Temos: • ϕ ≡ ∀xψ(x) Por hipótese, temos que os conjuntos abaixo são T-inconsistentes: Γ, ∀xψ(x) Γ, ¬∀xψ(x)
¾
são T-inconsistentes
Mariana Matulovic
216
Pela definição 3.3, desde que Γ, ∀xϕ(x) e Γ, ¬∀xϕ(x) são T-inconsistentes então existe um tablô fechado para eles. Assim, ou temos um tablô fechado para Γ e nada precisa ser acrescentado ou o tablô fecha pela inclusão da fórmula quantificada. Assim: (a)
Γ ∀xψ(x) ψ(x), para todo x X
Diante disso, inferimos que ¬ψ(x) ocorre no tablô de Γ, para algum x. (b)
Γ ¬∀xψ(x) ¬ψ(x), x novo no ramo. X
Logo, ψ(x) ∈ Γ, para um x novo no ramo. Como valem (a) e (b), temos no tablô de Γ, em cada ramo, ¬ψ(x) para algum x e ψ(x). Logo, Γ é T-inconsistente. L = {∨, ¬, →, ∀, G}
(ii)
Verificaremos se o mesmo ocorre com L = {∨, ¬, →, ∀, G}. • ϕ ≡ Gxψ(x) Por hipótese, temos que os conjuntos abaixo são T-inconsistentes: Γ, Gxψ(x) Γ, ¬Gxψ(x)
¾
são T-inconsistentes
Como Γ, Gxψ(x) e Γ, ¬Gxψ(x) são T-inconsistente, então podemos concluir pela definição 3.3 que existe um tablô fechado para cada um deles. Assim, ou temos um tablô fechado para Γ e nada precisa ser acrescentado ou o tablô fecha pela inclusão da fórmula quantificada Gxψ(x): (a)
Γ Gxψ(x) X
Como o tablô é fechado, então ocorre no tablô ¬Gxψ(x) ou ¬∃xψ(x) {¬ψ(a), para alguma nova constante a}. (b)
Γ ¬Gxψ(x) X
Diante disso, ocorre no tablô Gxψ(x) ou ∀xψ(x).
Um sistema de tablôs para a lógica do muito
217
Como o nosso objetivo é provar que Γ é T-inconsistente, analisaremos todas as possíveis combinações entre os diferentes tipos de fórmulas que podem estar contidas no tablô de Γ, lembrando que (a) e (b) ocorrem. 1)
¬Gxψ(x) e Gxψ(x). Trivialmente, Γ é T- inconsistente.
2)
¬Gxψ(x) e ∀xψ(x). De ∀xψ(x), temos ψ(a), para todo a, inclusive para o ¬ψ(a), proveniente da instanciação de ¬Gxψ(x). Logo, Γ é T- inconsistente.
3)
¬∃xψ(x) e Gxψ(x): De ¬∃xψ(x), temos ¬ψ(a), para todo a, inclusive para o ψ(a), proveniente da instanciação de Gxψ(x). Portanto, Γ é T- inconsistente
4)
¬∃xψ(x) e ∀xψ(x). Por análise direta, Γ é T-inconsistente.
Com isso, demonstramos que podemos aplicar a regra do corte quando as fórmulas são quantificadas também com o operador generalizado G. Teorema 3.3. Se Γ `L(G) ϕ, então Γ Tabl[L(G)] ϕ. Demonstração. Consideremos o conjunto de premissas {δ1 , δ2 , . . . , δn = ϕ} que deduz ϕ a partir de um conjunto Γ. A idéia subjacente a esta demonstração é a de se construir um tablô fechado para ¬ϕ, por intermédio da indução sobre o comprimento da dedução (k = 1, 2, . . . , n), ou seja, construirmos um tablô fechado quando n = 1 (apenas uma premissa) e continuaremos para n ≥ 1. 1a¯ Parte: O comprimento da dedução é igual a 1, ou seja, n = 1. Nesse caso, δ1 tem que ser uma premissa ou um esquema de axiomas da lógica do muito (L(G)). Analisemos, então, esses dois casos. (i) δ1 é uma premissa. Pela definição 3.2, precisamos verificar se existe um tablô fechado para Γ ∧ ¬ϕ. Como ϕ ∈ Γ, então ϕ ∧ ¬ϕ é uma contradição clássica. (ii) δ1 é um esquema de axiomas. Neste caso, basta construirmos um tablô para (Γ, ¬δ1 ). Desde que o tablô seja fechado, então Γ ϕ1 = δ. Resta-nos, então, verificar que para cada axioma específico da lógica do muito existe um tablô fechado. Assim: δ1 ≡ ∀x(ϕ(x) → ψ(x)) → (Gxϕ(x) → Gxψ(x)) i) ii) iii) iv) v) vi)
0 1 0 1 0 0
∀x(ϕ(x) → ψ(x)) → (Gxϕ(x) → Gxψ(x)) ∀x(ϕ(x) → ψ(x)) Gxϕ(x) → Gxψ(x) Gxϕ(x) Gxψ(x) Gxϕ(x) 1 Gxψ(x) X X
(refutação de δ1 ) (regra do condicional em i) (regra do condicional em i) (regra do condicional em iii) (regra do condicional em iii) (regra G5 em ii) (contradição em iv e vi e v e vi)
Mariana Matulovic
218
Como o tablô para ¬δ1 é fechado, inferimos que Γ δ1 . δ01 ≡ ∀xϕ(x) → Gxϕ(x) i) ii) iii) iv) v) vi)
0 1 0 0 1
∀x(ϕ(x)) → Gx(ϕ(x)) ∀xϕ(x) Gxϕ(x) ϕ(a) ϕ(a) X
(refutação de δ01 ) (regra do condicional em i) (regra do condicional em i) (regra do G2 em iii, para um a ∈ F ) (regra do universal em ii) (contradição em iv e vi)
Como o tablô para ¬δ01 é fechado, podemos inferir que Γ δ01 . δ001 ≡ Gxϕ(x) → ∃xϕ(x) i) ii) iii) iv) v) vi)
0 1 0 1 0
Gxϕ(x) → ∃xϕ(x) Gxϕ(x) ∃xϕ(x) ϕ(a) ϕ(a) X
(refutação de δ001 ) (regra do condicional em i) (regra do condicional em i) (regra do G1 em ii, para um a ∈ F ) (regra do existencial em iii) (contradição em iv e v)
Como o tablô para ¬δ001 é fechado, inferimos que Γ δ001 . δ000 1 ≡ ∀x(ϕ(x) ↔ ψ(x)) → (Gxϕ(x) ↔ Gxψ(x)) i) ii) iii) iv) v) vi) vii) viii) ix)
0 ∀x(ϕ(x) ↔ ψ(x)) → (Gxϕ(x) ↔ Gxψ(x)) 1 ∀x(ϕ(x) ↔ ψ(x)) 0 Gxϕ(x) ↔ Gxψ(x) 1 ∀x(ϕ(x) → ψ(x)) 1 ∀x(ψ(x) → ϕ(x)) 1 Gxϕ(x) 0 Gxϕ(x) 1 Gxψ(x) 0 Gxψ(x) 0 Gxϕ(x) 1 Gxψ(x) 0 Gxϕ(x) 1 Gxψ(x) X X 0 Gxψ(x) 1 Gxϕ(x) X X
(refutação de δ000 1 ) (regra do condicional em i) (regra do condicional em i) (regra G4 em ii) (regra G4 em ii) (regra do bicondic. em iii) (regra do bicondic. em iii) (G5 em iv) 0 Gxψ(x) 1 Gxϕ(x) (G5 - v) X X
000 Como o tablô para ¬δ000 1 é fechado, inferimos que Γ δ1 .
δ0000 1 ≡ Gxϕ(x) → G yϕ(y), quando y é livre para x em ϕ(x). i) 0 Gxϕ(x) → G yϕ(y) ii) 1 Gxϕ(x) iii) 0 G yϕ(y) iv) X
(refutação de δ0000 1 ) (regra do condicional) (regra do condicional) (cl. Fechamento em ii e iii)
Um sistema de tablôs para a lógica do muito
219
0000 Como o tablô para ¬δ0000 1 é fechado, inferimos que Γ δ1 .
2a¯ Parte: Comprimento da dedução é maior que um, ou seja, n > 1. Nesse momento, presumimos a existência de uma prova, no sistema hilbertiano para ϕ(δ1 , . . . , δn = ϕ), a partir de um conjunto Γ com comprimento igual a n, ou seja: δ1 .. n passos (Γ ϕ) . δn ≡ ϕ Pela hipótese da indução, podemos deduzir, por tablôs, qualquer ϕi desde que i < n. Para mostrar que Γ ϕ, devemos “analisar um a um todos os casos que permitiram colocar ϕn (isto é, ϕ) na seqüência” (Carnielli; Coniglio; Bianconi 2006, p. 89). Ou seja: • i = 1. Então, ϕ = δn = δ1 . Neste caso, ϕ é uma única premissa ou um axioma da lógica do muito. Ambas as situações já foram analisadas e comprovadas. • i = n. Nesta circunstância, ϕ = δn , só pode ter sido deduzida a partir da aplicação de alguma regra de inferência. Como no nosso sistema só há duas regras, Modus Ponens e Generalização, então ϕ só pode ser conseqüência do emprego de alguma delas. Analisemos cada uma separadamente. 1) Modus Ponens (MP): pretendemos avaliar: Γ ψ Γ ψ→ϕ Γ ϕ Sabemos que ϕ é obtido de ϕi = ψ e ϕ j = ψ → ϕ (i , j < n) por Modus Ponens. Pela definição 3.1, temos que: (a)
Γ, {¬ψ} é fechado por tablô.
(b)
Γ, {¬(ψ → ϕ)} também é fechado por tablô.
Da definição 3.3, segue que Γ ∧ {¬ψ} e Γ ∧ {¬(ψ → ϕ)} são T-inconsistentes. Agora, aplicando a regra do condicional e De Morgan em (b), obtemos: Γ∧{¬ψ} e Γ∧{¬¬ψ∧ ¬ϕ} são T-inconsistentes, ou seja: ¾ i) Γ ∧ {¬ψ} são T-inconsistentes ii) Γ ∧ {ψ ∧ ¬ϕ)} O teorema 3.2 (d)(Monotonicidade) nos garante que ao adicionarmos fórmulas em uma dedução, a qual é fechada por tablôs, o fechamento é preservado. Aplicandose, então, esse teorema em (i) temos: ¾ i’) Γ ∧ ¬ψ ∧ ¬ϕ são T-inconsistentes ii’) Γ ∧ ψ ∧ ¬ϕ
Mariana Matulovic
220
Diante desse contexto, podemos empregar o teorema 3.4 (Introdução ao corte), isto é: Γ ∧ ¬ψ ∧ ¬ϕ Γ ∧ ψ ∧ ¬ϕ Γ ∧ ¬ϕ
é T-inconsistente é T-inconsistente é T-inconsistente
Assim sendo, (Γ, ¬ϕ) é T-inconsistente, ou seja, Γ ϕ. 2) Generalização: Desejamos avaliar: Γ ψ Γ ∀xψ(x) = ϕ Sabemos que ∀xψ é obtido de ϕi = ψ (i < n) por Generalização. Pela definição 3.1, temos que Γ, {¬ψ} é fechado por tablô. Da definição 3.2, para demonstrarmos que Γ ∀xϕ, basta construirmos um tablô fechado para (Γ, ¬∀xψ). Assim, temos: i) ii) iii) iv)
Γ 0 ∀xψ 0 ψ(c), desde que c seja nova no ramo (aplicação da regra clássica ¬∀) X (Fechamento pela hipótese da indução em i e iii) Portanto, Γ ` ∀xψ, ou seja, Γ ` ϕ. Concluímos, deste modo, que se Γ `L(G) ϕ, então Γ ` Tabl[L(G)] ϕ.
A demonstração do próximo teorema será feita de modo análogo ao de Castro (2004) e Silvestrini (2005). Em sua tese, Castro desenvolveu uma hierarquia de sistemas de tablôs para as lógicas paraconsistente de Da Costa(Cn ). Ele representou esse sistema de tablôs pela sigla TNDCn . Em um dos seus teoremas, Castro demonstrou que para cada fórmula validada em seu sistema de tablôs, existe uma dedução no sistema axiomático de Da Costa, ou seja: Γ `T D NC n S ⇒ Γ `C n S Silvestrini (2005) também aplicou esse estilo para demonstrar que todas as regras que compunham o seu sistema de tablôs para a lógica do Plausível (TLP) possuem uma demonstração no sistema hilbertiano dessa mesma lógica, ou seja, a lógica do Plausível (L(P)). O que estamos propondo demonstrar, nesse momento, é que para cada fórmula validada (conseqüência analítica) pelo sistema TLP, devemos apresentar uma demonstração (dedução) no correspondente sistema axiomático Lτωω (P ) (Silvestrini 2005, p. 115).
Um sistema de tablôs para a lógica do muito
221
Desse modo, utilizaremos o mesmo esquema de demonstração para provarmos o nosso Teorema 3.6, ou seja, verificarmos que cada uma das nossas regras para o sistema de tablôs da lógica do muito, pode ser deduzida no sistema axiomático da referida lógica. Silvestrini compreende o sistema por tablôs “como uma “mecanização exaustiva” do procedimento de prova do reduction ad absurdum do método axiomático” (2005, p. 115, grifo do autor). Diante disso, ele defende que se há, para uma referida fórmula, uma demonstração por tablôs, então podemos construir uma prova por redução ao absurdo no sistema axiomático. Mas isso só será possível quando: i) As condições para inicialização e fechamento do sistema TLP, também são condições válidas, nas provas por absurdo, no correspondente sistema hilbertiano L(P ). ii) Todas as Regras de Expansão de TLP são dedutíveis no sistema hilbertiano L(P ), desse modo, tais regras de TLP passam a ser entendidas como Regras de Dedução no sistema axiomático (Silvestrini 2005, p. 116).
Como optamos por demonstrar que o nosso sistema de tablôs para a lógica do muito é correto e completo por um procedimento análogo ao de Silvestrini, e concordamos com as idéias defendidas pelo autor, então demonstraremos que as regras de tablôs para a lógica do muito podem ser deduzidas no sistema hilbertiano, respeitando as clausulas i) e ii) expostas por Silvestrini adaptadas para o sistema Tabl[L(G)]. Teorema 3.4. Se Γ Tabl[L(G)] ϕ, então Γ `L(G) ϕ. Demonstração. Há dois casos a serem analisados: i) ϕ ∈ Γ, neste caso segue de modo direto que Γ `L(G) ϕ. ii) ϕ ∉ Γ. Neste caso, ϕ deve ser alguma fórmula gerada ou advinda da aplicação de alguma regra do nosso sistema de tablôs. Sendo assim, precisamos verificar se conseguimos deduzir cada uma das fórmulas de Tabl[L(G)] no esquema hilbertiano da lógica do Muito. Observamos que as condições de inicialização e fechamento do sistema por tablôs — Tabl[L(G)] — são as mesmas para as demonstrações por redução ao absurdo, ou seja: (1) iniciamos a demonstração refutando a fórmula inicial; (2) concluímos quando encontramos uma contradição lógica. Dedução das regras do Tablô axiomaticamente. • Regra G 1 : Gxϕ(x) ` ϕ(a), a é nova no ramo. Neste caso, utilizaremos o método direto dedutivo. 1. 2. 3. 4.
Gxϕ(x) Gxϕ(x) → ∃xϕ(x) ∃xϕ(x) ϕ(a)
P Ax3 MP em 1 e 2 CQC em 3.
Mariana Matulovic
222
• Regra G2 : ¬Gxϕ(x) ` ¬ϕ(a), a é novo no ramo. 1. 2. 3. 4.
¬Gxϕ(x) ∀xϕ(x) → Gxϕ(x) ¬∀xϕ(x) ¬ϕ(a)
P Ax2 MT em 1 e 2 CQC.
• Regra G3 : ¬Gx(ϕ(x) ∨ ψ(x)) ` (¬Gxϕ(x) ∧ ¬Gxψ(x)) 1. 2. 3. 4. 5. 6. 7.
¬Gx(ϕ(x) ∨ ψ(x)) ¬(¬Gxϕ(x) ∧ ¬Gxψ(x)) ¬¬Gxϕ(x) ∨ ¬¬Gxψ(x) Gxϕ(x) ∨ Gxψ(x) (Gxϕ(x) ∨ Gxψ(x)) → Gx(ϕ(x) ∨ ψ(x)) Gx(ϕ(x) ∨ ψ(x)) ¬Gx(ϕ(x) ∨ ψ(x)) ∧ Gx(ϕ(x) ∨ ψ(x))
P pp. (redução ao absurdo) CPC CPC Teorema 4 de L(G) MP em 4 e 5 Contradição.
• Regra G4 : É classicamente válida. • Regra G5 : ∀x(ϕ(x) → ψ(x)) ` (¬Gxϕ(x) ∨ Gxψ(x)) 1. 2. 3. 4. 5. 6.
∀x(ϕ(x) → ψ(x)) ¬(¬Gxϕ(x) ∨ Gxψ(x)) ¬(Gxϕ(x) → Gxψ(x)) ∀x(ϕ(x) → ψ(x)) → (Gxϕ(x) → Gxψ(x)) ¬∀x(ϕ(x) → ψ(x)) ∀x(ϕ(x) → ψ(x)) ∧ ¬∀x(ϕ(x) → ψ(x))
P pp. (redução ao absurdo) CPC Ax1 MT em 3 e 4 Contradição.
Assim sendo, demonstramos que tudo que é válido em Tabl[L(G)], também o é na L(G). Diante disso, comprovamos o Teorema 3.6. Ao demonstrarmos os teoremas 3.5 e 3.6, podemos concluir que: Γ `L(G) ϕ m
⇔
Γ |=L(G) ϕ
Γ Tabl[L(G)] ϕ Deste modo, provamos que o sistema de tablôs proposto neste trabalho é equivalente ao sistema axiomático introduzido por Grácio (1999) para a lógica do muito. Em conseqüência disso, podemos garantir a correção e completude de Tabl[L(G)].
Um sistema de tablôs para a lógica do muito
223
Bibliografia Carnielli, W. A.; Coniglio, M. E.; Bianconi, R. 2006. Lógica e aplicações: matemática, ciência da computação e filosofia. Versão preliminar: capítulos 1 a 5. Campinas: Universidade Estadual de Campinas, Unicamp. Disponível em: <http://www.cle.inucamp.br/prof/coniglio/ LIVRO.pdf>. Acesso em: 17.5.2006. Castro, M. A. 2004. Hierarquia de sistemas de dedução natural e de sistemas de tableaux analíticos para os sistemas de Cn de Da Costa. Tese de doutorado (Doutorado em Lógica e Filosofia da Ciência) – Instituto de Filosofia e Ciências Humanas, Universidade Estadual de Campinas. Campinas. D’Ottaviano, I. M. L& Feitosa, H. A. 2003. História da lógica e o surgimento das lógicas nãoclássicas. In Nobre, S. (org.) Coleção História da Matemática para Professores. Rio. Feitosa, H. A.& Grácio, M. C. C. 2005. Lógicas moduladas: implicações em um fragmento da teoria da linguagem natural. Revista Eletrônica Informação e Cognição 4(1): 34–46. —–. Sobre os quantificadores generalizados. Universidade Estadual Paulista: Marília, artigo não-publicado. Grácio, M. C. C. 1999. Lógicas moduladas e raciocínio sob incerteza. Tese de Doutorado (Doutorado em Lógica e Filosofia da Ciência) – Instituto de Filosofia e Ciências Humanas, Universidade Estadual de Campinas. Sette, A. M.; Carnielli, W. A.; Veloso, P. 1999. An alternative view of default reasoning and its logic. In Haeusler, E. H. & Pareira, L. C. (eds.) Pratica: Proofs, types and categories. Rio de Janeiro: PUC, pp. 127–58. Silvestrini, L. H. C. 2005. Tableaux e Indução na Lógica do Plausível. Dissertação de mestrado (Mestrado em Filosofia – Área de Concentração em Epistemologia e Lógica). Marília: Faculdade de Filosofia e Ciências, Unesp. Smullyan, R. M. 1994.First-Order Logic. New York: Dover Publications, Inc. (Republicação do 1a¯ ed. publicada pela Springer-Verlag, New York, 1968.)
Q UE É H ARMONIA PARA R EGRAS DE I NTRODUÇÃO /E LIMINAÇÃO ? WAGNER DE C AMPOS S ANZ Universidade Federal de Goiás
sanz@fchf.ufg.br
1. Introdução O argumento de Prior (1967) dirigido contra a tese de que as regras de introdução e eliminação possam ser tomadas como uma definição para as constantes lógicas é bem conhecido. Ele consiste em apresentar uma regra de introdução e uma regra de eliminação para uma constante fictícia tonk, como a seguir: introdução A i tonk A tonk B
eliminação A tonk B e tonk B
Essas regras não respeitam um princípio elementar de boa construção conhecido no meio-ambiente de Teoria da Prova como Princípio de Inversão. Em termos bem simples, segundo o princípio, para pares de regras de introdução e eliminação corretamente formuladas, uma derivação em que ocorra uma seqüência imediata de introdução-eliminação da mesma constante deve poder ser eliminado da derivação sem que isso desfaça a prova que já tínhamos, justamente o que não ocorre com tonk: A i tonk A tonk B e tonk B A exigência do princípio parece bloquear o problema. A questão mais geral a ser investigada é se ele resolveria de modo mais amplo os problemas de harmonia entre as regras de introdução e eliminação. Para os intuicionistas, o Princípio de Inversão tem importância capital na medida em que vários deles, particularmente Prawitz, considera que as regras de eliminação não são mais do que conseqüência das regras de introdução e sua justificação dependeria do uso do princípio sobre as regras de introdução.
2. Um Estudo de Caso para o Problema da Harmonia Quando a negação estiver caracterizada em um sistema formal intuicionista — seja como primitiva seja como definida (a partir do absurdo) —, poderemos adicionar, por Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 224–227.
Que é Harmonia para Regras de Introdução/Eliminação?
225
definição explícita, o operador de desimplicação: A 6⊂ B ≡d f ∼(B ⊃ A) Alternativamente poderíamos introduzir esse operador lógico por meio das seguintes regras de dedução: introdução Γ, [B ⊃ A]i ∇ ⊥
eliminação Γ, [B ]i ∇ A A 6⊂ B e6⊂ ⊥
i6⊂ A 6⊂ B
Notamos que a regra de introdução não é independente, ela requer que a implicação já tenha sido definida previamente. Contudo, é possível apresentar uma regra de introdução independente (acompanhada das correspondentes regras de eliminação), usando condições um pouco mais abrangentes: Introdução
Eliminações
Γ, [A]i ∇ ⊥ B
Γ ∇ A
A 6⊂ B
i6⊂
A 6⊂ B e6⊂
A 6⊂ B
e6⊂ B
⊥
Desse modo, a desimplicação pode ser caracterizada por dois naipes de regras distintos. Esses dois naipes de regras para a mesma constante são interderiváveis do ponto de vista da lógica clássica. Aliás, o segundo naipe aproxima-se bastante da caracterização que essa constante receberia em termos de tabela de verdade: A V V F F
B V F V F
A 6⊂ B F F V F
Cada um dos naipes de regras possui certa harmonia. Ou seja, qualquer conseqüência das regras de eliminação já deve ser conseqüência das condições exigidas para a introdução da constante. Todavia, poderíamos nos perguntar, já que nos propusemos a examinar esse problema da harmonia entre as introduções e as eliminações, o que aconteceria se tomássemos a regra de introdução de um naipe e a regra de eliminação de outro? Como dizíamos o segundo naipe captura condições que poderíamos dizer mais amplas que as do primeiro naipe. Se tomássemos as regras de eliminação do segundo naipe e a regra de introdução do primeiro naipe, teríamos um par
Wagner de Campos Sanz
226
de regras que não respeitaria o Princípio de Inversão, já que a seqüência introduçãoeliminação de desimplicação a seguir não pode ser removida fazendo apelo somente ao que está dado nas subderivações usadas para a introdução da constante: [B ⊃ A]1 (B ⊃ A) ⊃ ⊥ e⊃ ⊥ i6⊂
Î
e6⊂
Î
A 6⊂ B B Podemos dizer que, nesse caso, as regras de eliminação extraem mais conseqüências do que aquilo que estaria admitido pela regra de introdução. Ou seja, adotando o ponto de vista de muitos intuicionistas contemporâneos, a regra de introdução do primeiro naipe não validaria todas as regras de eliminação do segundo naipe, pois a conclusão não pode ser derivada (intuicionistamente) se o par de regras for removido. Mas há ainda uma segunda alternativa a ser examinada. Será possível adotar a regra de introdução do segundo naipe com a regra de eliminação do primeiro naipe? Ao que parece sim, pois o Princípio de Inversão seria válido para esse caso. Aliás, Bowen (1971) havia considerado a possibilidade de definir a constante de desemplicação de uma forma que é substancialmente equivalente, usando o Cálculo de Seqüentes ao invés de Dedução Natural. Ele mostra que para essa definição vale a propriedade de eliminação de corte e usa essa prova como argumento para afirmar que esse novo operador lógico é intuicionistamente aceitável. Rapidamente, podemos ver que para esse caso uma seqüência de introdução-eliminação pode ser realmente eliminada: Γ1 , [A]i ∇1 ⊥
Γ2 , [B ] j ∇2 A
A 6⊂ B ⊥
j
Γ3 ∇3 Bi e6⊂
i6⊂
Γ3 ∇3 Γ2 , B ∇2 Γ1 , A ∇1 ⊥
Todavia, observemos, uma das condições para introduzir o operador envolvia a dedutibilidade de B a partir de um conjunto Γ3 de fórmulas, mas agora a regra de eliminação já não seria capaz de nos devolver essa condição inicial de dedutibilidade. Assim, parece-nos que a regra de eliminação seria demasiado fraca no sentido de não permitir reestabelecer aquilo que já estava presente nas condições de introdução do operador, apesar da regra de eliminação poder ser validada a partir da regra de introdução. Para dizer de um modo figurado, é como se o banco da desimplicação, definido com esse par de regras, exigisse um depósito maior para abrir a conta e
Que é Harmonia para Regras de Introdução/Eliminação?
227
só permitisse, posteriormente, o saque de parte do dinheiro inicial, uma espécie de escroqueria. Acerca do problema da harmonia das regras, duas atitudes são possíveis. Uma primeira atitude mais em linha com o ponto de vista intuicionista interpreta as regras como regras de inferência, onde os seus componentes devem ser vistos como asserções. Como já dissemos acima, desde esse ponto de vista, em geral, escolhe-se ou as regras de introdução ou as regras de eliminação como as regras a serem consideradas imediatamente válidas, sendo as demais justificadas com base no grupo de regras considerado mais primitivo. Porém, outro ponto de vista admissível é aquele segundo o qual os dois tipos de regras, introduções e eliminações, são considerados conjuntamente relevantes. Para esse ponto de vista, o que importa mostrar é que as regras sejam harmônicas: todas as conseqüências que se sigam comumente das condições suficientes para a introdução de uma constante também devem ser obtidas como conseqüência do uso dessa constante via regras de eliminação. Desde esse ponto de vista, a escolha da regra de introdução do segundo naipe com a eliminação do primeiro naipe estaria em desarmonia, pois nem todas as conseqüências comuns às condições suficientes para introdução da constante seriam conseqüências, via regras de eliminação, do uso dessa constante. Essa forma de formular o princípio de harmonia é aquela que mais particularmente receberia nesse instante nossos olhares favoráveis. Muitas questões acerca da aplicação desse princípio e sua relação com a definição das constantes lógicas são para nós problemas em aberto. Com efeito, a própria questão do que é que podemos chamar de constante lógica é um problema não claramente elucidado. Um paradigma para abordar a questão consiste em assumir a elucidação em termos de regras de introdução e de eliminação. Esse paradigma apresenta problemas internos e externos. Um dos problemas internos, nós tentamos mostrar acima. Como problema externo, podemos citar a dificuldade em elucidar o uso de algumas constantes lógicas como os operadores modais dentro do próprio paradigma.
Referências Bowen, K. A. 1971. An Extension of the Intuitionistic Propositional Calculus. Indagationes Mathematicae, v. 33, f. 1. Amsterdã: North-Holland. Prawitz, D. 1965. Natural Deduction. Estocolmo: Almqvist & Wicksell. Prior, A. N. 1967. The Runabout Inference-Ticket. In Strawson, P. F. (ed.) Philosophical Logic. Oxford: Oxford University Press, p. 129–31. Schröder-Heister, P. 2007. Generalized Definitional Reflection and The Inversion Principle. [a ser publicado] Tennant, N. 1978. Natural Logic. Edinburgo: Edinburgh University Press.
III ÉTICA FILOSOFIA POLÍTICA
VALOR DA V IDA H UMANA E A NENCEFALIA A LCINO E DUARDO B ONELLA Universidade Federal de Uberlândia (UFU)/FAPEMIG
abonella@ufu.br
Problemas que envolvem a vida e a morte de seres humanos são não raras vezes de difícil tratamento, na teoria e na prática, e quase sempre envolvem decisões públicas e privadas em comunidades políticas cujos membros divergem fortemente sobre o que é melhor fazer em tais situações. Exemplos típicos desses problemas aparecem nas discussões sobre o aborto, suicídio assistido e eutanásia, o possível uso de embriões humanos em pesquisa, protocolos médicos para casos envolvendo fetos e recém-nascidos com graves deficiências, como é o caso da anencefalia. Neste trabalho, focalizando este último problema, examinaremos alguns aspectos normativos, em especial, aspectos políticos do uso da razão pública em sociedades democráticas, que são importantes para o tratamento de dilemas morais que envolvem o valor da vida humana. Os aspectos tratados aqui estão vinculados a outros pontos principais de uma teoria do valor da vida, como o estatuto moral e metafísico da vida humana e não-humana, e a identidade individual em questão nestes dilemas, e outros pontos especificamente bioéticos, que não serão abordados diretamente neste trabalho.1 Tomemos alguns princípios e valores gerais normalmente utilizados em debates bioéticos. A Constituição do Brasil explicitamente institui como valores supremos e fundamentos da República a cidadania, a dignidade da pessoa humana e o pluralismo social e político (cf. Preâmbulo e art. 1o¯ , inc. II, III, V), assim como prescreve a prevalência dos direitos humanos na regência de suas relações internacionais, dando estatuto constitucional a tratados e convenções internacionais de direitos humanos (art. 4o¯ , II; art. V, par. 2), e estabelece direitos e garantias fundamentais, dentre os quais, como direitos e deveres individuais e coletivos, encontram-se: a garantia da inviolabilidade do direito à vida, à liberdade e à igualdade, em termos, entre outros, de igualdade entre homens e mulheres, de permissão de fazer ou deixar de fazer exceto se lei obrigar diferentemente, de proibição da tortura e tratamento desumano ou degradante, e de inviolabilidade da intimidade e da vida privada (cf. Art. 5o¯ , incisos I, II, III e X). Como norma jurídica maior, a Constituição enquadra a existência, interpretação e aplicação de todas as outras leis, incluindo as leis anteriores à sua promulgação, controlando assim sua validade. Uma ação singular sempre é avaliada juridicamente à luz de alguma norma, e, em última instância, à luz do complexo de normas jurídicas constitucionais e infraconstitucionais. Para que seja legal ou ilegal, a ação singular é subsumida como caso individual de uma norma, e, como ocorre com qualquer avaliação ou juízo normativo, há a possibilidade de termos dificuldades na descrição da ação, na escolha da norma que deva reger o caso, e, muitas vezes, na interpretação e aplicação da norma escolhida ao caso concreto.2 Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 231–239.
232
Alcino Eduardo Bonella
Um modo de estudarmos tais dificuldades consiste em tentar entendermos melhor o conflito de normas. Normas morais e leis normalmente são princípios gerais, que regem ações em suas características mais comuns e destacáveis, em parte, para que possamos nos guiar com mais segurança em nossas deliberações cotidianas nas situações que provavelmente emergirão em nossas práticas. Mas, por isso, ao menos algumas vezes, podemos ter um caso com aspectos factuais regidos prima facie por mais de uma norma geral, e a aplicação de uma delas conduzindo a resultados contraditórios com a aplicação de outra. A solução do conflito, em termos lógicos, gerará a preponderância de uma das normas, seja na forma de aplicação ao caso de uma delas, afastando a outra, seja na forma de um tipo de especificação da norma, que pondere conscienciosamente uma solução normativa mais detalhada para aquele tipo de caso problemático. Vimos acima um conjunto complexo de valores e normas presente em apenas algumas páginas da Constituição. Essa descrição simplificada do conflito de normas é uma sugestão para minimamente distinguirmos dois complexos antitéticos, e decidirmos, ou por um deles, ou por uma síntese bem ponderada de elementos presentes nos dois lados, ponderando e especificando uma solução. Casos difíceis ocorrem na vida diária, mas temos exemplares deles em especial nos debates de bioética, campo da reflexão crítica sobre a correção de ações que afetam mais diretamente a vida e a morte, como é o caso dos debates citados no primeiro parágrafo. O problema da anencefalia, em especial a avaliação dos protocolos médicos possíveis em seu enfrentamento, é um dos casos normalmente vistos como conflituosos, ou de dilema ético. Um feto ou um recém-nascido anencéfalo está gravemente prejudicado em sua formação. Eles carecem do chamado cérebro superior (higher brain), os hemisférios cerebrais onde se forma o córtex cerebral, parte do cérebro responsável por nossas capacidades humanas cognitivas e emocionais propriamente ditas, nossas capacidades psicológicas. Para o consenso científico disponível até o momento, a falta dos hemisférios cerebrais é uma condição biológica incompatível com a manutenção da vida extra-uterina e, quando do breve período em que um ser humano assim viver, é uma condição incompatível com a experiência psicológica conhecida: em todos os casos recém nascidos assim morrerão muito cedo, e em todos os casos eles não têm capacidades cerebrais para consciência e autoconsciência. Eles também não têm a potencialidade de desenvolver tais capacidades em período ulterior. Todavia, apesar de não possuírem os hemisférios cerebrais, anencéfalos ainda possuem o tronco cerebral (lower brain), parte do sistema nervoso que controla certas funções vegetativas, e, ao menos em certo período breve de tempo, eles possuirão alguma capacidade de sustentação da vida biológica, ou seja, estarão vivos e serão geneticamente humanos. A marioria dos fetos com esta anomalia morre durante a gestação, e daqueles que chegam a nascer, a maioria morre nas primeiras horas, e uma percentagem pequena sobreviverá alguns meses, mas não se conhece nenhum caso de sobrevivência, sendo considerada uma doença letal. (Cf. MacMahan 2002, pp. 450–5; Steinbock 1996, pp. 30–6; Ford 2002, pp. 86–8, 96–9, 155–6, 166–7; Strong 1997, pp. 175–6.)
Valor da Vida Humana e Anencefalia
233
Quando este tipo de tragédia ocorre e é diagnosticada durante a gestação, algumas mulheres desejam interromper a gestação o mais depressa; outras escolhem manter a gestação. Dentre as pessoas que pensam que o aborto é normalmente errado, algumas duvidarão que seja errado interromper a gestação neste caso, por causa da condição descrita acima. Dentre as que pensam que o aborto é normalmente lícito e não coloca nenhum problema ético mais importante, algumas reforçarão que o que torna justificável aceitar a decisão da mulher neste caso é, em especial, a falta de benefício para o feto, se obrigamos ou recomendamos a manutenção da gestação: os pais podem inclusive pensar que manter uma vida biológica com tal anomalia é desrespeitar a dignidade do filho, pedindo a interrupção não só por sua causa (dos pais), mas também em nome do filho. Mas outros pais podem discordar e querer manter o curso da gestação. Normalmente os países que ainda proíbem legalmente o aborto são tolerantes com a interrupção neste tipo de anomalia. Um aspecto importante é que em muitos países, quando as leis contra o aborto foram definidas, não havia ainda tecnologia de diagnóstico deste tipo de anomalia fetal, e isto gera problemas para a aplicação da lei existente e para a elaboração (ou não) de novas leis. Mesmo países onde o aborto é normalmente lícito discutem o problema do que fazer em casos de nascimento de um bebê com anomalia grave, e em especial, o problema do que fazer no caso da doação dos órgãos de bebê anencéfalo, pois para que haja a doação querida pelos pais e que em tese seria benéfica aos que receberiam os órgãos, o bebê anencéfalo tem de ter seus órgãos retirados antes que ocorra a morte completa do tronco cerebral, pois não é possível esperar a morte segundo o critério tradicional de morte cerebral (que inclui o tronco cerebral) porque a fisiologia do bebê nesta condição inviabilizará o funcionamento adequado dos órgãos com tal espera. Neste caso, usar tal critério inviabilizaria a doação dos órgãos; por outro lado, o bebê já está completamente sem o córtex cerebral, e a morte do córtex é um critério discutido hoje em certos círculos médicos e filosóficos como mais adequado para se definir a morte humana, mesmo de uma pessoa adulta. Se o bebê com anencefalia não possuiu ou possui, e nunca possuirá, um córtex cerebral capaz de gerar auto-consciência, ao menos neste caso se poderia com segurança aplicar tal critério (cortical death) com razoável certeza prática.3 No Brasil há uma discussão judicial no Supremo Tribunal Federal (STF, que atua entre outras funções como corte constitucional suprema), sobre a licitude da antecipação terapêutica do parto em casos de anencefalia. Desde 2004, quando um sindicato nacional de trabalhadores da saúde defendeu no Tribunal que uma interpretação conforme a Constituição fundamenta e apóia o direito da mãe antecipar o parto no caso de anencefalia do feto, caso assim o deseje, aguarda-se a manifestação final da corte sobre o mérito jurídico do apelo. O problema que tal discussão judicial enfrenta é que, sob certa interpretação do Código Penal no Brasil (estabelecido na década de 40, e que penaliza o aborto exceto nos casos de risco de morte da mãe e de gravidez resultante de estupro), a antecipação terapêutica do parto ou interrupção terapêutica da gestação de um feto anencéfalo seria crime de aborto, ainda que a interrupção
234
Alcino Eduardo Bonella
da gestação seja sugerida pelo médico como terapêutica indicada para os casos de gravidez de anencéfalo. Mulheres e médicos estão em uma situação de insegurança jurídica, pois poderiam ser processados pelo crime de aborto. Não é raro médicos e outros profissionais da saúde, e muitos operadores do direito, como juízes e promotores, identificarem assim a antecipação terapêutica do parto, equiparando-a com o aborto de um feto normal. Daí o processo direto no STF, que trata da interpretação conforme a Constituição, deste dispositivo do Código Penal, e é um exemplo de controle da validade das leis pela interpretação e aplicação das normas e valores maiores da Lei Maior. Os valores e normas constitucionais transcritos no início deste trabalho exemplificam não só alguns dos princípios gerais que normalmente estarão presentes em avaliações de casos assim, ao menos em avaliações jurídicas, mas também mostram a imersão da atual configuração político-jurídica brasileira na cultura política pública das democracias constitucionais modernas, cultura que implica num ideal de razão pública para a deliberação razoável dos cidadãos e dos agentes públicos em casos importantes de divergência. Mesmo nessa cultura há ainda problemas sobre a melhor interpretação e aplicação de seus valores supremos, especialmente diante do pluralismo que a caracteriza. Nas democracias a soberania pertence em última instância aos cidadãos vistos como sujeitos iguais e livres. Toda intervenção contra alguém ou algum grupo, da parte do Estado, só se justifica para a proteção dos direitos e interesses mais importantes de outro cidadão ou grupo de cidadãos. Quanto à imposição de ação ou abstenção, através da coerção estatal, ninguém pode alegar uma razão que apenas ele e seu grupo de aderentes aceitam; e uma razão que não seja relativa apenas a tal pessoa ou grupo tem de estar inerentemente ligada à liberdade e igualdade de todos os cidadãos, assim como à garantia da proteção de seu direito de sustentar doutrinas e razões diferentes: o esforço por expressar uma solução deste tipo em uma filosofia normativa e em um ideal de razão pública caracteriza parte substantiva da filosofia política democrática contemporânea, especialmente o trabalho de J. Rawls. Um ideal de razão pública é, para Rawls, parte da concepção de justiça para democracias constitucionais em que os cidadãos professam uma pluralidade de doutrinas filosóficas, morais e religiosas acerca de seu bem e do que é justo exigir de cada um. A utilização e imposição de uma doutrina abrangente, nas condições modernas de pluralismo, só ocorrem pelo uso opressivo do aparato estatal. Para evitar uma situação de guerra e conflito permanente, e assegurar a igualdade e liberdade para todos, os regimes democráticos produziram, em parte como mero modo de vida resultante das acomodações de conflitos, e em parte como proposta normativa candidata ao apoio racional dos grupos que os compõe, um tipo de consenso liberal em sentido amplo. Nesse consenso, os ideais de democracia e de razão pública, que por um lado explicam aspectos factuais e normativos principais presentes nos regimes conhecidos vigentes, e por outro lado, estabelecem diretrizes para avaliação e deliberação em casos de divergência, podem ser expressos por uma concepção de justiça, uma concepção restrita ao domínio do político e que é democrático-liberal. Ela especifica
Valor da Vida Humana e Anencefalia
235
direitos, liberdades e oportunidades fundamentais do tipo geralmente conhecido em regimes democráticos, atribui prioridade a tais direitos diante de exigências do bem comum e valores perfccionistas, além de endossar medidas institucionais que garantam meios materiais polivalentes para que todos os cidadãos usufruam desses direitos e liberdades básicos. Os direitos e liberdades fundamentais são em suma os que encontramos nos textos jurídicos e tradições políticas dos regimes democráticos conhecidos (como os que encontramos no artigo quinto da Constituição Brasileira). O estabelecimento de tais direitos e da prioridade das liberdades fundamentais, por exemplo, na proteção especial da liberdade de consciência e da liberdade religiosa, é a expressão da solução principal para os conflitos entre indivíduos e grupos que discordam sobre a vida boa e a justiça social. Tal prioridade, porém, não protege apenas o indivíduo contra associações, mas também protege as associações civis das intrusões do Estado e de outras associações mais poderosas. Segundo Rawls, tanto “as associações quanto os indivíduos precisam de proteção, assim como as famílias também precisam ser protegidas das associações e do governo, e da mesma forma os membros individuais das famílias precisam ser protegidos de membros da família (esposas dos maridos, filhos dos pais). É incorreto dizer que o liberalismo concentra-se exclusivamente nos direitos dos indivíduos: seria mais acertado dizer que os direitos que reconhece objetivam proteger as associações, os grupos mais fracos e os indivíduos todos uns dos outros, num equilíbrio apropriado especificado pelos princípios de justiça que o norteiam.” (1993, p. 221, nota 8) Já a restrição à esfera política significa, para Rawls, que a concepção de justiça focaliza a estrutura básica da sociedade, é independente de doutrinas filosóficas, morais e religiosas abrangentes, e utiliza as idéias implícitas na cultura política pública de uma sociedade democrática. Para que tal concepção de justiça seja bem articulada e utilizada pelos cidadãos em seus debates e votações, precisamos de diretrizes para a indagação e deliberação na esfera pública, o que Rawls entende ser um ideal de razão pública, especificado de certa maneira, e que estará intrinsecamente ligado à concepção liberal (em sentido amplo), implicando, basicamente: que os cidadãos devam, quando deliberam sobre questões constitucionais essenciais ou questões de justiça básica, abster-se de apelar para valores e ideais abrangentes, valores que se refiram ao que entendem ser a verdade completa retirada de sua doutrina particular. Ao invés disto, os cidadãos devem apelar somente para os valores políticos partilhados em sua cultura pública (valores de justiça política, como a igual liberdade política e civil, a igualdade de oportunidades, a igualdade social e a reciprocidade econômica, o bem comum e os meios necessários para realizar tais valores por cada um; e valores de razão pública, como indagação pública e livre, razoabilidade e disposição de praticar o dever de civilidade), e expressos nos principais textos jurídicos de um regime democrático. “O ideal da razão pública aplica-se aos cidadãos quando atuam na argumentação política no fórum público e, por isso, também aos membros dos partidos políticos e aos candidatos em campanha, assim como a outros grupos que os apóiam. Aplica-
236
Alcino Eduardo Bonella
se igualmente à forma pela qual os cidadãos devem votar nas eleições, quando os elementos constitucionais essenciais e as questões de justiça básica estão em jogo.” (1993, p. 215) Se aplica-se aos cidadãos em geral, muito mais às autoridades diversas do Estado, “de forma especial, ao judiciário, e sobretudo, ao supremo tribunal numa democracia constitucional com revisão judicial. É assim porque os juízes têm de explicar e justificar suas decisões como decisões baseadas em sua compreensão da Constituição, de códigos e precedentes relevantes” (1995, p. 216), o que torna as decisões do supremo tribunal um exemplo de razão pública para todos os cidadãos. O ideal de cidadania que emerge das principais tradições políticas dos regimes democráticos e constitucionais modernos impõe um dever moral a todos os cidadãos (chamado por Rawls de dever de civilidade), de serem capazes de, “no tocante a (essas) questões fundamentais, explicar aos outros de que maneira os princípios e políticas que se defende e nos quais se vota podem ser sustentados pelos valores políticos da razão pública. Esse dever também implica a disposição de ouvir os outros, e uma equanimidade para decidir quando é razoável que se façam ajustes para conciliar os próprios pontos de vista com os de outros.” (1993, p. 217) Em suma, o que se exige dos cidadãos é que expliquem mutuamente suas posições em termos de um equilíbrio razoável de valores políticos públicos, e, mesmo que sua doutrina particular seja uma base adicional a esses valores, não apelem para ela. Poderá haver mais de um equilíbrio razoável e poderá haver posições particulares não razoáveis numa doutrina em geral razoável. Rawls ilustra isso com a questão do aborto. Para ele, qualquer equilíbrio razoável dos valores políticos do devido respeito pela vida humana, da reprodução ordenada da sociedade política e da igualdade das mulheres enquanto cidadãs iguais, “dará à mulher o direito devidamente qualificado de decidir se deve ou não interromper a gravidez durante seu primeiro trimestre. A razão é que, nesse estágio inicial da gravidez,4 o valor político da igualdade das mulheres é supremo e esse direito é necessário para lhe dar substância e força. Outros valores políticos, se condizentes, não afetariam, a meu ver, essa conclusão. Um equilíbrio razoável dará à mulher um direito que vá além do que foi considerado acima, ao menos em certas circunstâncias. No entanto, não discuto a questão geral aqui, pois quero simplesmente ilustrar o que o texto quer dizer ao afirmar que toda doutrina abrangente que leva a um equilíbrio de valores políticos que exclua aquele direito devidamente qualificado de interromper a gravidez no primeiro trimestre não é, nesta medida, razoável; e dependendo dos detalhes de sua formulação, tal equilíbrio pode ser até mesmo cruel e opressivo como, por exemplo, se negar esse direito por completo, exceto em caso de estupro e incesto. Assim, supondo-se que essa seja uma questão constitucional ou uma questão de justiça básica, estaríamos indo contra o ideal de razão pública se votássemos de acordo com uma doutrina abrangente que negue esse direito. Mas uma doutrina abrangente não deixa de ser razoável por levar a uma conclusão não-razoável em um caso, ou em vários. Ainda pode ser razoável com respeito à maior parte dos casos.” (Rawls 1993, pp. 243–4, nota 32.) Como podemos avaliar o debate judicial em curso no Brasil sobre o direito das
Valor da Vida Humana e Anencefalia
237
mães anteciparem terapeuticamente o parto no caso de feto anencéfalo? Ambos os lados divergentes concordam que a dignidade da pessoa e certos direitos individuais são valores supremos para um balanço apropriado do caso e sua solução. Ambos os lados têm usado tais valores em seu apelo. A interpretação e aplicação de valores político-jurídicos comuns ao caso não tem gerado um consenso, e serve para manter a divergência. Na petição inicial, apresentada por advogado constitucionalista, sustenta-se, basicamente, que a antecipação terapêutica do parto em caso de anencefalia não é aborto, pois neste protocolo médico não estaria presente a tipicidade estrita indicada no código penal, e que a negação deste protocolo a médicos e mulheres fere os preceitos constitucionais de dignidade da pessoa humana da mulher, da proibição de tratamento cruel similar à tortura, da liberdade de fazer ou deixar de fazer senão em virtude de lei e do direito à saúde. Por isso, segundo tal sustentação, a interpretação que identifica a antecipação terapêutica com aborto deve ser afastada como inconstitucional, sem que se afaste o texto do dispositivo penal. O procurador geral da República na época contra-argumentou contestando o pedido, sustentando que a aceitação da antecipação é equivalente ao aborto porque o feto morrerá mais cedo do que morreria naturalmente, não sendo tal ação permitida expressamente nas exceções previstas no dispositivo penal; também alegou que a antecipação fere os preceitos constitucionais do direito à vida e da dignidade da pessoa humana do feto, destacando que, pela convenção de direitos humanos assinada pelo país e conhecida como Pacto de São José da Costa Rica, a proteção do direito à vida se deve dar em geral desde a concepção. Nos termos postos, considerando o texto constitucional e aceitando a exemplificação de Rawls, podemos defender que a posição em favor do direito da mulher decidir ou não levar a termo gestação de anencéfalo deve prevalecer e que é a melhor posição ao menos nos seguintes pontos: ela é procedente em sustentar que no caso de anencefalia o feto se diferencia claramente, em termos factuais, do feto normal, e, o procedimento, diferente de simples aborto. Ela também faz um balanço dos valores envolvidos explicitando devido peso e importância aos dois lados da questão, justificando como uma ponderação cuidadosa pode aceitar o direito de autonomia das mães sobre o valor da vida fetal com anencefalia, o que a posição contrária não o fez, ao menos não completamente. Por exemplo, a petição não foi confrontada em relação ao alegado direito à saúde das mães, tratamento cruel dispensado à mulher e falta de proibição expressa em lei do protocolo para anencefalia, focalizando exclusivamente a dignidade do feto e o direito à vida. Podemos, além disso, reforçar a posição da petição, e a opinião de Rawls sustentando que, se mesmo um feto normal pode ter seu desenvolvimento interrompido, em caso de estupro (como permite o dispositivo penal citado), então, é razoável não se proibir a opção médica da antecipação terapêutica do parto no caso de anencefalia. O interesse da mãe, que sofre com a anencefalia do filho e deseja interromper a gravidez, é relevantemente similar ao interesse de uma mãe estuprada, que não quer também manter a gravidez.5 E somente se pede ao tribunal superior reconhecer que a exclusão total do direito das mães a
238
Alcino Eduardo Bonella
tal antecipação é inconstitucional. Obviamente é possível ainda defender a posição contrária em termos puramente públicos e políticos, defendendo a negação da antecipação do parto no caso de anencefalia, nos termos sugeridos pelo procurador, o que também torna problemático o direito de abortar ao menos no caso já previsto de aborto em caso de estupro. Mas a negação completa de um direito das mulheres de recorrer à antecipação em caso de anencefalia, ao menos na fase inicial da gestação, retira qualquer força e substância à dignidade e ao direito das mulheres, como cidadãs iguais e livres (como sustentou Rawls), e, nestes termos, não é a solução mais razoável para este debate.
Referências Bonella, A. E. 2003. Notas sobre como tomar decisões racionais em ética. In Di Napoli et al. (orgs.) Ética e Justiça. v. 1. Santa Maria: Palloti. —–. 2007. Prescritivismo e Utilitarismo. In Carvalho, M. C. (org.) Utilitarismo em Foco. Florianópolis: Editora da UFSC. —–. 2006. Conflicts, Language and Rationality. In Gasser, G. et al. Cultures: Conflict, Analysis, Dialog. Kirchberg am Wechsel: Austrian L. Wittgeinstein Society. Brandt, R. 1996. Facts, Values and Morality. Cambridge: Cambridge University Press. —–. 1992. Morality, Utilitarianism, and Rights. Cambridge: Cambridge University Press. Brasil. Supremo Tribunal Federal. Argüição de Descumprimento de Preceito Fundamental No¯ 54. Disponível em www.stf.gov.br. Acessado em 05 de agosto de 2007. Chin, C. 2005. Infant heart transplantation and hypoplastic left heart syndrome: what are the ethical issues? In Frankel et al. 2005, pp. 170–6. Constituição da República Federativa do Brasil, 1988. Da Silva, J. A. 2006. Curso de Direito Constitucional Positivo. São Paulo: Malheiros. Diniz, D. 2007. Selective Abortion in Brazil. Developing World Bioethics 7(2): 64–7. Diniz, D. & Ribeiro, D. C. 2003. Aborto por anomalia Fetal. Brasília: Letras Livres. Ford, N. 2002. The pregnant woman and her fetus. In: The Prenatal Person. Oxford: Blackwell. Frader, J. E. 2005. Infant heart transplantation and hypoplastic left heart syndrome: a response (to Chin). In Frankel et al. 2005, pp. 177–84. Frankel, L., Goldworth, A., Rorty, M. V. and Silverman, W. A. (orgs.) 2005.Ethical Dilemmas in Pediatrics: Cases and commentaries. Cambridge: Cambridge University Press. Glover, J. 1979. Causing Death and Saving Lives. London: Penguin. Hare, R. 2000. Sorting Out Ethics. Oxford: Clarendon. —–. 1993. Essays on Bioethics. Oxford: OUP. Kushe, H. & Singer, P. (eds.) 2001. A Companion to Bioethics. Oxford: Blackwell. Kluge, E.-H. Severely disabled newborns. In Kushe and Singer 2001, p. 242–9. MacMahan, J. 2002. The Ethics of Killing. Oxford: OUP. —–. 2001. Brain death, cortical death and persistent vegetative state. In Kushe and Singer 2001, p. 250–60. Rawls, J. 1993. Political Liberalism. New York: Columbia University Press. —–. 1999. The Public Reason Revisited. In The Law of Peoples. Cambridge, Mass.: Harvard University Press. Singer, P. 1994. Ética Prática. São Paulo: Martins Fontes.
Valor da Vida Humana e Anencefalia
239
Strong, C. 1997. Fetal Anomalies. In Ethics in Reproductive and Perinatal Medicine. New Haven & London: Yale University Press. Stofell, B. 2001. Voluntary euthanasia, suicide and physician-assisted suicide. In Kushe and Singer 2001, p. 272–9. Tooley, M. 2001. Personhood. In Kushe and Singer 2001, p. 117–26. Steinbock, B. 2001. Mother-Fetus Conflict. In Kushe and Singer 2001, p. 135–46. —–. 1996. Life before Birth. Oxford: OUP. Warren, M. A. 2001. Abortion. In Kushe and Singer 2001, p. 127–34.
Notas 1 R A representa uma relação T -ária definida em A para i ∈ I ; f A é uma função j -ária de A n em A, (i ) i j supondo-se T1 ( j ) = n, para j ∈ J ; e c k é uma constante de A, para k ∈ K . 1 Ambos os aspectos (políticos e bioéticos) fazem parte de uma compreensão abrangente do valor da
vida, e de uma avaliação crítica de dilemas morais, compreensão e avaliação que tanto sejam propostas como bem ponderadas diante de nossas intuições morais mais fortes, quanto, também, sejam especificadas e criticadas o suficiente para se sustentarem diante de nossas melhores capacidades analíticas e reflexivas. Isso significa que uma avaliação normativa adequada deve possuir uma natureza deontológica (por exemplo, de cunho kantiana) e teleológica (por exemplo, de cunho utilitarista). 2 Ou seja, pode haver discordância não só sobre o que o caso realmente comporta factual e normativamente, mas, após concordância sobre tais aspectos, pode restar ainda divergência sobre o que fazer neste caso em concreto. 3 A possibilidade de erro médico, ou, da morte do córtex ser um estado reversível, é apontada como uma razão contra a adoção do novo critério de morte, mas ela não está presente no caso de bebês anencéfalos, e haverá a morte certa com a perda dos órgãos, caso se opte pela proibição da aplicação deste critério. Sobre a dificuldade com a doação de órgãos de anencéfalos, ver MacMahan 2002, pp. 208, 230– 1, 451; Steinbock 1996, pp. 30–1; Chin 2005, pp. 174–5; Frader 2005, pp. 181–2. 4 Grifo nosso: Rawls não explica porque exatamente pensa que o estágio da gravidez é relevante, e esse é um dos pontos bioéticos e metafísicos sobre identidade humana e pessoal que dissemos necessários para uma teoria abrangente do valor da vida. Obviamente fica subentendido que para Rawls há graus (estágios) numa gestação de um feto humana correlacionados com o que a mulher pode fazer autonomamente, e quanto mais cedo o aborto, melhor. 5 Por analogia, o interesse do feto anencéfalo é ao menos menor que o interesse de um feto normal fruto de estupro, dada a ausência das capacidades psicológicas e a letalidade prematura da doença.
I DENTIDADE C OLETIVA , C ULTURAS E S ECESSÃO A LESSANDRO P INZANI Universidade Federal de Santa Catarina/CNPq
alepinzani@hotmail.com
1. Uma tensão inescapável No seu livro The Parallax View, Slavoj Žižek utiliza-se do conceito de visão paralaxe para apontar para o fato de que não podemos enxergar determinados fenômenos sociais (mas também psíquicos) de perspectivas diferentes sem que eles assumam outros contornos aos nossos olhos, transformando-se radicalmente (Žižek 2006). Aparentemente, isso é o que acontece ao considerarmos a questão da existência de direitos coletivos, em particular, de direitos à autodeterminação política de grupos definidos em termos culturais ou até étnicos. Neste contexto a impossibilidade é a de considerar tal questão ao mesmo tempo do ponto de vista da salvaguarda dos direitos coletivos e daquele da salvaguarda dos direitos individuais. Isso se torna evidente se nos perguntarmos quem seria o destinatário de um eventual direito à sobrevivência que fosse reclamado por uma comunidade culturalmente definida. A primeira resposta, mais óbvia e menos problemática, seria: o estado em que aquela comunidade vive, talvez como minoria, ou — não necessariamente em alternativa — outros estados e outras comunidades. Mas é pensável uma outra resposta, bem mais problemática, segundo a qual os destinatários de tal direito seriam os próprios membros da comunidade em questão, particularmente quando não haja o perigo de uma agressão externa, mas o de um abandono daquela cultura por parte dos seus representantes. Imaginemos, por exemplo, que os catalães ou os habitantes do Quebec abandonem aos poucos seu idioma nacional, a saber: catalão e francês, em prol do idioma dominante nos seus recíprocos estados, a saber: castelhano e inglês, sem que haja por parte do governo central espanhol ou do governo federal canadense uma pressão neste sentido, antes: sem que tais governos mudem sua atual política de encorajamento e de apoio às duas culturas em questão. Se a cultura catalã e a quebequense possuem um direito à sobrevivência, tal direito deveria ser reclamado neste caso contra os próprios catalães e quebequenses, que, portanto, deveriam ser obrigados a seguir falando catalão e francês (na sua variante quebequense). Isso poderia parecer ficção política, mas de fato há já grupos culturais cuja sobrevivência é garantida juridicamente contra seus próprios membros. É o caso, por exemplo, de algumas tribos indígenas dos EUA e do Canadá (os filósofos políticos deveriam agradecer a existência do Canadá, fonte inesgotável de exemplos ligados a questões culturais e de direitos coletivos), as quais, graças à ampla autonomia recebida dos respectivos governos federais, procedem contra membros renitentes que não se conformam às tradições ou à cultura tribais. Assim, mulheres que casem com homens que não são da tribo podem Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 240–258.
Identidade Coletiva, Culturas e Secessão
241
ser obrigadas a deixar o território da tribo e a ceder sua propriedade a esta última. Isso é contrário ao direito individual de propriedade garantido pela constituição canadense ou norte-americana, mas os tribunais até hoje quase sempre reconheceram validade às decisões das tribos, pois a autonomia da qual elas gozam visa justamente a salvaguardar sua sobrevivência e a garantir que a terra fique sempre nas mãos de membros plenos da tribo.1 Esta tensão aponta para uma questão fundamental que precisa ser respondida por qualquer teoria que se preocupe com o reconhecimento de direitos culturais: os sujeitos de tais direitos são grupos (culturas, minorias etc.) ou indivíduos membros destes grupos? É a cultura catalã que tem um direito à sua existência ou são os catalães que têm o direito de falar seu idioma e celebrar sua cultura? Esta tensão entre direitos individuais e direitos coletivos, entre indivíduos e comunidade, caracteriza, portanto, não somente o debate teórico (como no caso da querelle entre liberais e comunitários, por exemplo), mas também a praxe política e merece, portanto, muita atenção — particularmente numa época na qual o multiculturalismo parece dominar a cena do debate filosófico-político, e até questões de justiça distributiva são reformuladas em termos de política do reconhecimento (cf. Fraser & Honneth 2003; sobre a noção de reconhecimento com relação às culturas o texto de referência é Taylor 1994, que aliás introduziu no debate o termo “multiculturalismo”). Um caso paradigmático da tensão da qual estou falando é a questão do direito de secessão, que — ao mesmo tempo — representa um caso limite (e, portanto, relativamente fácil de discutir) da problemática geral, especialmente quando ela é interpretada na ótica segundo a qual o direito à autodeterminação de um povo teria uma base cultural (cf. Tamir 1993, p. 57ss). Meu interesse em tal questão é, portanto, funcional à questão mais abrangente da tensão entre indivíduo e comunidade; neste artigo limitar-me-ei a uma exposição esquemática dos principais conceitos e argumentos que podem ser utilizados na discussão da questão da secessão (reservo-me uma discussão mais detalhada para outra ocasião). Iniciarei, contudo, analisando brevemente o contexto teórico no qual é discutida hoje em dia a questão da secessão, a saber, o debate sobre multiculturalismo e política do reconhecimento.
2. Multiculturalismo e política do reconhecimento: breves notas sobre o status quaestionis Segundo Will Kymlicka, nos últimos anos o debate teórico-político tem sido dominado pelo tema do multiculturalismo (Kymlicka 2001, p. 17ss). Poderíamos suspeitar Kymlicka de parcialidade, já que ele é com certeza um dos principais responsáveis pela ‘onda’ multiculturalista que tomou posse da filosofia política contemporânea — e não somente no mundo anglo-saxônico. Contudo, quase não há pensadores políticos de primeiro plano que, de fato, não tenham tomado posição sobre o assunto, ainda que fosse para negar sua relevância (como no caso de Brian Barry, em Barry 2001, p. 6).2 Embora não seja possível fazer jus à complexidade do assunto neste con-
242
Alessandro Pinzani
texto, oferecerei uma rápida caracterização do problema e um esboço de tópicos úteis para a discussão da questão da secessão. O termo multiculturalismo indica uma posição teórica e política que aponta para a circunstância de que em muitas sociedades convivem no mesmo espaço geopolítico (principalmente isto significa: no mesmo Estado) várias culturas ou grupos identificáveis culturalmente (ou seja, com base em elementos que os diferenciam de outros grupos e que podem ser a língua, a religião, etc.); o multiculturalismo exige o reconhecimento político e jurídico das diferenças culturais e luta contra qualquer tentativa de assimilação forçada (violenta ou não). Ele celebra, portanto, tais diferenças como algo de positivo que merece ser mantido. Normalmente se distinguem os casos em que a convivência entre as culturas tem raízes históricas antigas (como, por ex., no caso da Espanha e das culturas catalã e basca) e os casos em que tal convivência é a conseqüência de fluxos migratórios recentes (como no caso das minorias muçulmanas na Europa contemporânea).3 O multiculturalismo não se ocupa, então, com a questão do diálogo entre culturas distantes, mas com a questão da convivência de culturas diversas num espaço comum. Em seguida deixaremos implícito, portanto, que as culturas nas quais estaremos falando são culturas que compartilham um mesmo espaço geopolítico, não culturas que pertencem a diferentes espaços. Esta definição de multiculturalismo é muito geral, já que existem vários tipos de multiculturalismo. M. M. Slaughter, por exemplo, identifica dois tipos de multiculturalismo: o pluralista e o separatista (Slaughter 1994, p. 370). O primeiro reconhece as diferenças entre culturas mas procura uma base comum sobre a qual elas podem organizar sua convivência, como na idéia dos EUA como “uma nação de minorias”, conforme a célebre fórmula usada pelo juiz Powell.4 Os separatistas, pelo contrário, insistem na necessidade de um reconhecimento público e jurídico da fragmentação cultural. Slaughter recorre à metáfora do mosaico para explicar a diferença entre as duas posições: os pluralistas apontam para o fato de que as peças do mosaico (as culturas) formam uma unidade (o desenho do mosaico), enquanto os separatistas insistem sobre o fato de que as peças são discretas e auto-suficientes e que só foram juntadas com outras, pré-existindo então ao mosaico. Seyla Benhabib recorre também a esta metáfora, mas para recusar a posição daquele que ela denomina de “multiculturalismo a mosaico” (mosaic multiculturalism). A crítica principal de Benhabib concerne à visão de que os grupos e as culturas seriam entidades claramente delineadas e identificáveis, cada uma com limites claros e imutáveis (Benhabib 2002, p. 8). A esta visão ela contrapõe a idéia de que as culturas humanas são “criações, recriações e negociações contínuas de limites imaginários entre ‘nós’ e o(s) ‘outro(s)”’ (ibid.)5 . Os defensores do “multiculturalismo a mosaico” tentariam em suma negar o Outro como algo de inevitavelmente presente em cada cultura e objetivariam uma integridade cultural inatingível. Eles fundamentariam sua posição sobre uma ficção, que James Tully denomina de “billiard-ball conception” (Tully 1995, p. 10), a saber, a idéia de que um grupo (cultura, minoria) seja algo de claramente identificado e fechado em si mesmo (como uma mônada ou uma peça de mo-
Identidade Coletiva, Culturas e Secessão
243
saico, justamente). Ao “multiculturalismo a mosaico” Benhabib contrapõe a visão de um diálogo entre culturas definidas por narrativas sempre mutáveis e Tully uma noção de reconhecimento constitucional que foge dos esquemas rígidos da concepção “bola de bilhar”. Ambos estes autores colocam no centro da sua reflexão a difícil relação entre grupo (incluídas as culturas) e indivíduo, embora com êxitos divergentes.6 As tensões internas a esta relação se manifestam de forma clara se considerarmos a questão do surgimento da identidade individual e da coletiva.7 A formação da identidade individual só é possível no contexto de uma cultura, através da apropriação por parte do indivíduo dos ‘códigos’ lingüísticos, morais etc. próprios de uma comunidade. Contudo, este processo acontece no nível simbólico, isso é, no âmbito da narrativa que constitui aquela cultura (e, portanto, sua identidade coletiva) e da narrativa individual através da qual cada um se define como sujeito (sigo aqui a central intuição freudiana e lacaniana). O processo não acontece num nível ontológico, por assim dizer, pois em caso contrário ninguém poderia sair da própria cultura e afastar-se dela. Ora, cada narrativa (coletiva ou individual) está sujeita a mudanças e pode ser modificada em várias circunstâncias.8 Interessantemente, a idéia de que a identidade coletiva é definida com base em narrativas mutáveis é retomada em parte pelo próprio Charles Taylor, que no seu Modern Social Imaginaries defende a posição de que cada sociedade se fundamenta num determinado “imaginário social”. Com este termo, ele entende “as maneiras nas quais as pessoas imaginam sua existência social, o modo como elas se acomodam com os outros, o modo como funcionam as coisas entre elas e seus semelhantes, as expectativas que são satisfeitas normalmente, e as noções e imagens normativas mais profundas que fundamentam tais expectativas” (Taylor 2004, p. 23). Este imaginário é compartilhado pelos membros de uma sociedade e possibilita a existência de práticas comuns e de um senso de legitimidade relativo a tais práticas: “possuímos um senso de como as coisas vão habitualmente, mas isto é entrelaçado com a idéia de como elas deveriam ir” (ibid., p. 24). Por isso, é possível identificar um certo repertório de ações coletivas disponíveis para uma determinada sociedade e que compreende as ações que os membros daquela sociedade sabem como praticar e aceitam como legítimas. Tais ações variam desde a maneira de celebrar eleições gerais, por ex., até a maneira de manter “uma conversa social com desconhecidos no hall de um hotel”. É como se os membros de uma sociedade trouxessem sempre consigo um “mapa implícito do espaço social”, sabendo (sempre de forma implícita) com que tipo de pessoas eles podem associar-se, em que formas e em que circunstâncias (ibid., p. 25s). Ora, um imaginário social pode mudar. Novas práticas podem ser reconhecidas como legítimas e até substituir as antigas. Segundo Taylor isto acontece através de longos processos começados geralmente por iniciativas de grupos menores no interior da sociedade, e o resultado final é o surgimento de um novo imaginário social. O que eu gostaria manter desta teoria tayloriana é a idéia de que uma sociedade se constitui como sociedade primariamente no imaginário dos seus membros, mais precisamente por meio de visões compartilhadas sobre práticas legítimas e expecta-
244
Alessandro Pinzani
tivas normativas ligadas a elas. Isto não significa negar valor à base material de uma sociedade, ou seja, às concretas relações de poder que juntam seus membros (e uso o termo “poder” aqui no sentido foucaultiano, não como algo de negativo, mas como indicando as relações constitutivas da própria subjetividade, isto é, os processos de subjetivação). Só que tais relações ainda não constituem uma sociedade enquanto elas não entrarem no imaginário social recebendo nele uma determinada interpretação e legitimação.9 Se aplicássemos o conceito de imaginário social ao conceito de cultura, chegaríamos à posição (defendida por Tully e Benhabib, entre outros) segundo a qual uma cultura é definida não com base em elementos substanciais como história comum, língua, religião, etc., mas com base numa visão compartilhada de tais elementos. Na opinião de Benhabib, “as próprias culturas, assim como as sociedades, são sistemas de ação e de atribuição de sentido não holísticos, mas polifônicos, que possuem vários níveis, são descentralizados e percorridos por fraturas” (Benhabib 2002, p. 25; meu itálico). Deste ponto de vista, falar em identidade coletiva de um grupo, de uma cultura ou de uma sociedade significa simplesmente utilizar uma metáfora modelada sobre o conceito de identidade individual — uma metáfora, contudo, que (como todas as metáforas) não descreve uma realidade, mas chama a atenção para uma semelhança entre dois objetos, neste caso o indivíduo e o coletivo. Ora, no caso em questão esta semelhança não parece suficientemente forte para justificar o uso do termo “identidade” no sentido mais próprio, quando aplicado a um coletivo (sem contar que, talvez, ele seja impróprio até quando aplicado a um indivíduo; mas não me ocuparei disso, neste contexto). Cabe aqui mencionar a análise contundente de Lutz Niethammer (Niethammer 2000, p. 35ss), segundo o qual o conceito de “identidade coletiva” representa um conceito pobre de conteúdo, que serve para operar uma redução, já que a sua finalidade é a de abstrair da diversidade dos fenômenos e reduzi-los a um mínimo denominador comum. O conceito de identidade de um coletivo pretende eliminar a complexidade da sua história e das suas narrativas (das maneiras pelas quais ele tentou articularse e definir-se como coletivo), como no caso em que, por exemplo, se pretendesse identificar uma identidade brasileira que perpassasse todos os momentos históricos desde a colonização portuguesa (ou até antes dela) até o dia atual. Deste ponto de vista, tal conceito opera uma transformação de acontecimentos históricos em dados “naturais” e faz do coletivo, que em si é o resultado (provisório) de um determinado processo histórico, algo de dado uma vez por todas. Isso resulta no caráter de fetiche do conceito de identidade coletiva e na formação de estereótipos: o povo brasileiro, italiano, alemão etc. mantém sua identidade no tempo, permanece “semper idem”, sempre o mesmo.10 O redimensionamento do conceito de identidade coletiva e da própria noção de cultura não significa, contudo, a negação da importância de questões como as levantadas pelos teóricos do multiculturalismo. Ao apontarmos para a dimensão simbólica e não essencialista dos processos constitutivos de grupos, de culturas e de socieda-
Identidade Coletiva, Culturas e Secessão
245
des, não estamos afirmando que grupos, culturas e sociedades não possuam realidade e, portanto, não mereçam ser considerados como possíveis objetos de uma teoria da justiça (ou até como possíveis detentores de direitos). O que pretendemos evitar é a armadilha do “multiculturalismo a mosaico”, ou seja, a idéia de que os grupos em questão sejam como mônadas perfeitamente autônomas, isoladas e imutáveis. O reconhecimento político e jurídico, que tais grupos reclamam para si, não pode fundamentar-se, em suma, na visão “bola de bilhar”. Devemos, antes, aceitar a noção de que os grupos estão destinados a mudar e até a desaparecer, e que ao Estado cabe não a tarefa (impossível, no fundo) de impedir isso, mas a de não provocar ativamente tal processo. Um caso concreto discutido por Brian Barry pode exemplificar isso (Barry 2001, p. 256). A tribo indígena dos Musqueam pretende ser isentada do respeito a uma medida dirigida à proibição da pesca numa determinada área protegida do Canadá. Eles alegam que a pesca naquelas águas representa um elemento essencial da sua cultura. Barry aponta para dois aspectos relevantes. O primeiro: a proibição em questão pode de fato representar uma interferência na identidade cultural da tribo. Mas não necessariamente uma mudança nesta identidade comporta a sua destruição, exatamente como uma mudança na nossa vida de indivíduos (um novo trabalho, a perda de um ente querido, a imigração num outro país etc.) não corresponde à destruição de nossa identidade pessoal. Se a identidade da tribo fosse ligada de forma tão essencial à prática da pesca naquelas águas, isso seria uma maneira bem peculiar de se definir uma identidade coletiva.11 E aqui se insere o segundo aspecto: Se o Estado garantisse a isenção e, daí a poucos anos, as reservas de peixe da região se esgotassem, impossibilitando a pesca, a tribo dissolver-se-ia por isso? Perderia sua identidade? “A idéia de que as culturas aborígines sejam extraordinariamente frágeis — conclui Barry — é profundamente paternalista” (ibid.). Se for verdade que todos os indivíduos precisam de um contexto cultural íntegro, é verdade também que qualquer contexto cultural está sujeito a mudanças e transformações e que seus membros são capazes de adaptar-se a elas, embora eles tenham a faculdade ou até o direito de opor-lhes resistência. Fazer o possível para preservar uma determinada identidade cultural pode ser justo, mas nem por isso é necessário (num sentido não meramente normativo, mas ontológico, por assim dizer). Tendo em mente todas estas considerações, passemos agora a considerar a questão do direito de secessão.
3. Argumentos para a secessão Habitualmente, os argumentos utilizados para justificar um direito à secessão são de três tipos. O primeiro tipo é o mais comum e aponta para a existência de formas graves de discriminação e de violação dos direitos de membros de minorias culturais ou étnicas por parte do estado no qual eles vivem. Comentarei este tipo de argumento só brevemente no final, sob o ponto (c). O segundo tipo de argumentos, que tratarei sob o ponto (a), pressupõe a idéia de que cada cultura dá lugar a uma comunidade po-
246
Alessandro Pinzani
lítica que pode legitimamente aspirar à autodeterminação, independentemente do fato de haver discriminações contra a cultura em questão. O direito à autodeterminação representaria uma pretensão cultural, mais do que política, e precisamente seria “o direito de preservar a existência de uma nação como entidade cultural distinta” — direito bem diferente daquele que os indivíduos possuem de decidir sobre suas vidas e participar num processo político livre e democrático (Tamir 1993, p. 57). A primeira posição é, portanto, menos radical do que a segunda. Ambas têm como seu ponto de partida a noção de que existem grupos que podem ser claramente identificados com base na sua cultura ou ‘etnia’. Chamarei, então, de substancialistas estes tipos de argumentos, já que eles pressupõem a existência de elementos substanciais (língua, história comum, características físicas etc.) que permitem definir uma cultura ou uma ‘etnia’. Existe enfim a possibilidade de fundamentar uma secessão com base num outro tipo de argumentos, a saber, argumentos estritamente políticos e funcionais. Neste caso, os habitantes de uma determinada região reclamariam a secessão por razões meramente políticas ou de maior eficácia administrativa; longe de defender uma peculiaridade cultural ou étnica, eles insistiriam sobre a necessidade de gerir sua vida pública de forma mais justa ou eficaz do que acontece presentemente por meio de sua permanência num certo estado. Ocupar-me-ei deste terceiro tipo de argumentos sob o ponto (b). a) Argumentos substancialistas Os argumentos substancialistas partem da analogia entre indivíduos e grupos, uma analogia bem conhecida na tradição ocidental no que diz respeito ao conceito de estado. Segundo tal analogia, um estado seria um macroindivíduo dotado de todas as características pessoais tais como: autonomia, vontade, interesses, etc. Ele lutaria pela própria sobrevivência e pela sua propriedade (ou seja: para a integridade do seu território) exatamente como um indivíduo, e há autores que chegam a falar em “direitos humanos” para estados (Höffe 2005). Na realidade, um estado é uma entidade bem mais complexa do que um indivíduo. Não somente é muito difícil identificar seus interesses e, portanto, sua vontade, já que na realidade o que passa por interesse nacional muitas vezes coincide com o interesse particular de um grupo ou de um setor da sociedade; além disso, o conceito de autonomia é extremamente ambíguo já quando utilizado para indivíduos e torna-se altamente duvidoso quando aplicado a estados, particularmente numa época de crescente integração política e jurídica internacional. Last, but not least, os confins de um estado não são imutáveis como os limites de um corpo humano, mas podem ser modificados sem que o estado em questão cesse de existir, como demonstrado por inúmeros exemplos históricos. A conseqüência principal do uso da analogia individual no caso de grupos étnicos ou culturais, de nações e de povos, é a invocação de um direito à autodeterminação política para estas entidades. Tal direito estaria baseado na idéia de que cada grupo cultural ou etnicamente definido deveria governar-se autonomamente. Ora,
Identidade Coletiva, Culturas e Secessão
247
sem considerar o fato de que neste caso o numero de estados no mundo deveria ser de vários milhares, já que segundo a UNESCO existem pelo menos cinco mil grupos culturais diferentes, permanecem três problemas que deveriam ser resolvidos para fundamentar o direito em questão. O primeiro seria o de dispor de um critério certo para identificar um grupo cultural ou étnico; o segundo seria o de demonstrar a necessidade de que tais grupos se governem autonomamente; o terceiro seria de fundamentar o direito à secessão propriamente dito com argumentos de justiça. Sobre o primeiro problema, limitar-me-ei a apontar para a dificuldade acima discutida de dispor de critérios certos para definir uma cultura ou uma etnia. Quando a analogia com os indivíduos for aplicada a entidades coletivas diversas do Estado, isto é, às culturas, às nações, aos povos e aos grupos étnicos, nós deparamos não somente com os problemas conhecidos, mas até com uma dificuldade ainda maior: enquanto os estados possuem confins certos embora mutáveis, já que são frutos de convenções, as entidades que acabei de mencionar são porosas e menos homogêneas.12 Uma análise dos mais recentes conflitos étnicos na ex-Iugoslávia ou em Ruanda demonstraria a dificuldade de traçar linhas nítidas de demarcação entre as “etnias” em luta e sugeriria antes a impossibilidade de chegar a uma distinção definitiva.13 Deste ponto de vista, a idéia de limpeza étnica possui um caráter utópico, embora se trate de uma utopia perversa. Uma cultura nunca é claramente delimitada e homogênea. A visão de uma cultura ou de um grupo como uma mônada, como algo de perfeitamente auto-suficiente e isolado (a “billiard-ball conception” de Tully) é uma visão incorreta e deve ser substituída por uma visão na qual uma cultura resulta de um processo continuado de redefinição interna e de confrontação com outras culturas — confrontação que é, ao mesmo tempo, um momento de interação e influência recíproca. Já apontei para as dificuldades implícitas no conceito de identidade coletiva. Tais dificuldades aumentam quando tal identidade (melhor: o que se presume ser a identidade de um grupo) é invocada para fundamentar um direito à autodeterminação política. Normalmente, isso acontece quando um certo grupo avança a pretensão de constituir uma nação e, portanto, de ter direito a um estado todo para si. Só que não é claro o que constituiria uma nação, quando ela não existe já como estado. Um estado possui uma história, possui fronteiras, possui personalidade jurídica. O mesmo não vale para uma nação. Uma nação só recebe personalidade jurídica quando organizada como estado ou quando reconhecida oficialmente como minoria num estado existente. Sua história, normalmente, é “repleta de tradições inventadas” (Tamir 1993, p. 64) ou, no mínimo, transfiguradas. Uma nação é uma comunidade imaginada, para usar a célebre formula de Benedict Anderson, cujo estudo exemplar sobre a Indonésia poderia ser repetido em todas as nações e estados (Anderson 1983). Ela é criada com base numa narrativa histórica e politicamente determinada, como bem demonstra a história do nascimento dos estados latino-americanos (particularmente os hispânicos). Sem contar que, como afirmava Renan, uma nação é fundada não somente sobre as memórias comuns, mas também sobre uma amnésia compartilhada que leva seus
248
Alessandro Pinzani
membros a esquecer os ‘outros’ que poderiam ameaçar a unidade nacional (como, no caso da França, a existência de outras nações — que freqüentemente foram submetidas forçosamente e reduzidas ao silêncio por séculos — no seu seio: os bretões, os provençais, os borguinhões, os bascos, os catalães). Se for verdade que para o pensador francês uma nação é um “plebiscito de cada dia”, é também verdade que “o olvido e, diria, até o erro histórico são um elemento essencial para a criação de uma nação” (Renan 1997). Como escreve Yael Tamir, “as nações, antigas ou recentes, tendem a reformular seu passado, a reinterpretar sua cultura, a esquecer as diferenças e a salientar as características comuns, a fim de criar a ilusão de uma unidade ‘natural’ com uma longa história, geralmente gloriosa, e um futuro promissor” (Tamir 1993, p. 67). Nos dizeres de Alexander Wendt, as nações são metáforas cujo sentido é estabelecido pelos seus membros e redefinido quando for preciso, e as culturas são selffulfilling prophecies que sempre se tornam o que elas pretendem ser (Wendt 1999, p. 161 e p. 184ss). Sempre será possível encontrar uma origem mítica ou uma tradição perdida (já que sem passado não há cultura) que justifiquem a pretensão de um grupo de que ele constitui uma cultura autônoma — exatamente como na Indonésia analisada por Anderson. A mesma coisa acontece quando um grupo pretende constituir uma nação, que pode ser definida justamente como uma “comunidade territorial cujos membros possuem a consciência de ser membros dela e querem manter a identidade dela” (Cobban 1969, p. 107; apud Tamir 1993, p. 65) ou como uma entidade que se dá quando “um número significativo de pessoas numa comunidade se considera como formando uma nação ou age como se a formasse” (Seton-Watson 1977, p. 7; apud Tamir 1993, ibid.). Em suma, uma nação se dá quando um número suficiente dos indivíduos que a formam sabe disso e quere que a situação não mude. A identidade coletiva se baseia então na identidade individual, ou seja, na percepção que cada indivíduo tem de si enquanto membro de uma nação: “a identidade coletiva é uma questão da identificação por parte dos indivíduos envolvidos” (Straub 1998, p. 102). À medida que os indivíduos perdem esta percepção, a nação desaparece. Uma nação, como qualquer outro grupo, precisa de um idem sentire, de um sentir comum (Cerutti 1996, p. 6). Isso, contudo, não significa — como já disse — negar valor ou realidade à existência dos coletivos, das culturas, das nações, etc. Como observa Jan Assmann: “O corpo social não se dá no sentido de uma realidade visível e tangível. É uma metáfora, uma grandeza imaginária, uma construção social. Como tal, porém, ele pertence plenamente à realidade” (Assmann 1992, p. 132). O ponto que gostaria salientar é tão-somente que tal corpo é mutável e transformável justamente enquanto se trata de uma construção social (fruto de um “imaginário social”, como diria Taylor), de uma metáfora (como relevado também por Wendt) e de uma grandeza imaginária (conforme a idéia de “comunidade imaginária” de Anderson). Além disso, não fica claro por que razão um grupo étnico ou cultural deveria alcançar autodeterminação política. Normalmente, o argumento é que esta seria a con-
Identidade Coletiva, Culturas e Secessão
249
dição necessária para o grupo em questão manter sua identidade coletiva. Considerando as dificuldades, acima expostas, que estão ligadas a este último conceito, não fica claro como seria possível alcançar este fim, a não ser impondo aos membros do próprio grupo manter aquele ‘sentir comum’ indispensável para tal identidade. Se os indivíduos fossem deixados livres para se considerarem membros do grupo ou não, a identidade coletiva poderia ser ameaçada e isso seria contrário ao princípio segundo o qual cada grupo deve cuidar dela. Um argumento possível a partir de uma perspectiva liberal seria a necessidade de que os indivíduos disponham de uma esfera pública correspondente à sua cultura. Eles pretendem, em suma, criar instituições e organizar sua vida comum numa maneira que reflete seus valores, tradições e história comuns (Tamir 1993, p. 70). O argumento pressupõe, novamente, a possibilidade de identificar de forma razoavelmente clara e certa tais valores, tradições e história, mas podemos aceitar isso, por amor do debate. Em segundo lugar, ele faz dos indivíduos (e não do grupo) os detentores do direito à autodeterminação — e isso faz deste um argumento liberal. Contudo, pressupõe nos indivíduos a vontade de criar uma esfera pública correspondente à sua cultura. Esta pressuposição, porém, está baseada ou numa certa visão antropológica, a saber, na idéia de que os indivíduos sempre querem organizar sua vida comum conforme sua cultura;14 ou numa certa visão normativa, a saber, na idéia de que os indivíduos devem organizar sua vida comum conforme sua cultura. Ambas as visões me parecem discutíveis; a segunda, com certeza, testemunha mais uma vez da tensão entre indivíduo e comunidade. Contudo, deixarei de lado neste contexto este segundo problema e focalizarei o terceiro. Para este fim, admitirei que seja possível identificar de forma clara um grupo cultural ou étnico, e que haja boas razões para defender a posição de que seria desejável que cada grupo cultural ou étnico chegasse à autodeterminação política. Esta última concessão não corresponde, contudo, à afirmação de que tais grupos possuem um direito à secessão de uma entidade estatal existente, ou seja, à afirmação de que tal secessão seria moralmente justificada. Darei um exemplo concreto. Imaginemos que seja possível identificar claramente uma cultura basca e afirmar que seria desejável que os bascos chegassem à autonomia política. Isso seria suficiente para justificar uma secessão das Províncias Bascas da Espanha? Partindo do pressuposto que os bascos gozem de todos os direitos civis e políticos dos demais espanhóis (em outras palavras: que eles não sejam discriminados), o único argumento seria que eles, apesar de possuírem todas as liberdades civis e políticas, se sentem marginalizados e privados de algo de essencial pelo fato de que as instituições que governam sua vida comum não refletem sua cultura (ou não a refletem exclusivamente). Embora eles possam falar euskera e possuam ampla autonomia administrativa, eles são súditos do rei de Espanha e obedecem à constituição espanhola e ao governo central de Madri. Já que não há discriminação ativa, o que estaria faltando aos bascos seria reconhecimento, no sentido em que o termo é usado por Taylor ou Honneth (Taylor 1994 e Honneth 2003). Neste caso, podemos pensar ou
250
Alessandro Pinzani
(1) que os indivíduos possuam essencialmente um interesse em preservar sua identidade nacional e em organizar suas instituições de maneira correspondente à sua cultura (esta é, como vimos, a posição de Tamir);15 ou (2) que eles — num determinado momento — queiram emancipar-se e organizar suas instituições conforme sua cultura. Considero a primeira possibilidade questionável. O interesse em preservar sua comunidade nacional é por sua vez o produto histórico de determinadas circunstâncias. Os indivíduos têm um interesse em preservar um âmbito cultural íntegro, como vimos; mas isso também não exclui a possibilidade de mudanças e transformações. Para formar sua identidade, um indivíduo precisa de uma cultura, mas não necessariamente da cultura na qual seus pais se formaram. Brutalmente, poderíamos dizer que ele precisa de uma cultura qualquer, não importa qual. Mas isso não implica na necessidade de ele formar-se em instituições correspondentes aos valores de tal cultura. Na realidade, muitas vezes vale o contrário: um indivíduo pode formar sua identidade numa determinada cultura embora as instituições políticas que governam sua vida não correspondam a ela — como no caso dos próprios bascos durante os séculos nos quais eles foram impedidos de falar abertamente sua língua. A sobrevivência do euskera nestas condições testemunha, aliás, por um lado, a força que uma cultura pode ter e, por outro, a irrelevância que até as políticas públicas mais radicalmente repressivas possuem em certos casos (este dado empírico deveria levar a um redimensionamento teórico com respeito ao efetivo alcance das políticas que tentam garantir reconhecimento, assim como daquelas que o negam). O sentimento de pertença a uma nação é algo que se torna popular (no sentido de que se estende às massas populares e não permanece exclusivo de uma elite) somente no século XIX e XX. Considerando, além disso, que a maioria dos estados contemporâneos tendem a possuir instituições políticas e jurídicas semelhantes ou até comuns, é difícil entender o que deveriam ser, por ex., instituições políticas ou jurídicas peculiarmente bascas. O nascituro estado basco garantiria direitos fundamentais a seus cidadãos, possuiria um parlamento (não importa como organizado), organizaria eleições etc. Em que estas instituições corresponderiam a valores próprios da cultura basca que não seriam presentes na cultura espanhola ou em outras culturas? A segunda possibilidade acima mencionada pressupõe a vontade dos bascos de se separarem da Espanha (embora seja pensável afirmar a existência de uma obrigação dos bascos a querer sua independência, conforme a visão “forte” segundo a qual as culturas possuem direitos contra seus membros). Ora, que significa falar em “vontade dos bascos”? O uso do termo vontade remete, mais uma vez, à analogia com os indivíduos: os bascos constituiriam um sujeito coletivo individual dotado — como todos os indivíduos — de uma vontade única. Poderíamos falar em “o povo basco” ou “a nação basca” a fim de melhor imaginar tal individualidade. Mas este estratagema lingüístico não pode enganar sobre o fato de que o povo em questão é composto por uma pluralidade de indivíduos dotados cada um de uma vontade própria e de uma visão pessoal sobre a questão da secessão. A alternativa seria pensar no povo basco
Identidade Coletiva, Culturas e Secessão
251
como uma entidade que compreende mais do que os indivíduos que o formam neste momento e inclui também as gerações passadas e futuras: um Povo com P maiúsculo, entendido diacronicamente como sucessão de gerações, contraposto ao povo com p minúsculo, entendido sincronicamente como soma dos indivíduos no estado atual. Isso, contudo, complicaria as coisas, pois tornaria muito difícil estabelecer em que consistiria a vontade do Povo com P maiúsculo — uma dificuldade, esta, que os teóricos da vontade geral, de Rousseau a Kant, nunca souberam superar de forma convincente. Deveríamos, portanto, limitar-nos à vontade popular do povo com p minúsculo. Segundo Rousseau, para que surja um estado é necessário o consenso de todos os cidadãos: o contrato social pressupõe a unanimidade. Já que na política concreta a unanimidade é praticamente impossível, devemos renunciar a esta teoria “ideal” e contentar-nos com uma teoria “não ideal” na qual as decisões — incluída a de formar um novo estado — são tomadas por uma maioria. Contudo, é difícil imaginar que esta maioria possa limitar-se a ser maioria simples, já que a criação de um novo estado por meio de uma secessão comporta problemas e custos não indiferentes para os envolvidos (e sem contar que, no fundo, em caso nenhum uma maioria, por mais ampla que seja, pode afirmar estar agindo em nome do todo). Em casos como este, normalmente se prefere introduzir o mecanismo da maioria qualificada, embora este último seja um conceito bastante vago. Imaginemos que uma maioria de dois terços possa ser considerada suficientemente qualificada e que a minoria derrotada esteja disposta a aceitar pacificamente a decisão de tal maioria alcançada, digamos, por meio de um plebiscito. Voltando ao nosso exemplo: quem deveria decidir sobre a secessão das Províncias Bascas? Somente os bascos? Ou também os habitantes da região que não são bascos? E por que não todos os demais espanhóis, já que uma secessão teria conseqüências importantes para eles também?16 Os defensores da tese substancialista dirão que este último ponto de vista não é relevante, já que se trata justamente de garantir o direito à autodeterminação de uma minoria — direito sobre o qual a maioria não pode decidir. Mas então, por coerência, eles deveriam excluir da decisão os representantes da maioria que se encontram no território em questão, no nosso caso, os espanhóis não bascos, e, inversamente, deixar que participem da decisão os bascos que vivem fora do país basco. Somente neste caso, se a decisão for tomada exclusivamente por bascos, ela poderá ser considerada como tomada de fato em nome do povo basco. Se, pelo contrário, os não bascos que habitam na região forem admitidos ao plebiscito, os defensores da tese substancialista estariam admitindo que o critério da pertença ao grupo étnico ou cultural não é decisivo. Neste caso a decisão da secessão perderia o caráter de reivindicação da autodeterminação por parte de um grupo étnico ou cultural, a não ser que se pressuponha que os não bascos votarão contra a secessão e os bascos em prol dela — que é provavelmente o que os substancialistas pensam — e que, portanto, o voto no plebiscito será sempre e necessariamente expressão da diversa pertença étnica e cul-
252
Alessandro Pinzani
tural. Contudo, nesta visão, o plebiscito representaria simplesmente a imposição de uma cultura majoritária (a basca) sobre uma minoritária (a dos castelhanos, catalães, galegos ou andaluzes que moram no País Basco). O resultado de uma secessão seria a criação de um estado predominantemente basco com algumas minorias. Por coerência, os substancialistas deveriam apoiar as reivindicações de tais minorias e seus direitos à autodeterminação. O resultado poderia ser um regressus ad infinitum. b) Argumentos políticos e funcionais A alternativa seria a renúncia ao argumento substancialista e o recurso ao tipo de argumentos que chamei de políticos e funcionais. Nesta ótica, o direito de secessão é reconhecido não a grupos culturalmente definidos e com finalidades de defesa da própria identidade coletiva, mas sim com base em outros critérios. David Copp acha, por ex., que um tal direito só pertence a sociedades que possuem uma dimensão territorial e política relevante. Ele define brevemente uma sociedade como “um grupo bastante amplo, em relação à população do estado; que possui uma história que compreende muitas gerações; caracterizado por uma rede de relações sociais e por normas de cooperação e coordenação relevantes para seus membros; que inclui a inteira população de pessoas que residem de forma permanente sobre um território relevante, com a exceção de recém-chegados, que podem não integrar-se na rede de relações sociais” (Copp 1997, p. 290s; itálico meu). Ora, esta definição aparentemente escapa das dificuldades ligadas à questão da identidade coletiva. Contudo, a definição de Copp não se distingue de maneira relevante das noções de cultura ou nação acima mencionadas. A referência aos recém-chegados que não se integrariam na rede de relações sociais remete à idéia de que para participar nesta rede é preciso pertencer à sociedade de uma forma ‘forte’: não é suficiente habitar no mesmo território e compartilhar as mesmas leis, é necessário integrar-se. A noção de integração remete a uma dimensão que podemos chamar de identitária. Os critérios ‘externos’ (como o de morar num território) não são tão fortes quanto o critério da integração, isto é, da interiorização e apropriação dos elementos que caracterizam a identidade daquela sociedade, seu imaginário social, para usar a expressão tayloriana. Para continuar com nosso exemplo, definir os bascos uma sociedade significa apontar a identidade dos bascos enquanto grupo culturalmente definido. O fato de eles terem vivido no mesmo território por muitas gerações só é relevante porque podemos identificá-los como grupo com base em outras características, começando pelo idioma e, sobretudo, por causa do seu imaginário social. Isso fica evidente nos casos de grupos que convivem no mesmo território por muito tempo, como no caso da ex-Iugoslávia. Seriam os sérvios, os croatas e os muçulmanos da Bósnia três sociedades no sentido de Copp, embora os três grupos tenham compartilhado por séculos o mesmo território? (Sem considerar um quarto grupo, infelizmente minoritário, a saber, os indivíduos que não queriam ser identificados com nenhum dos outros grupos e preferiam considerar-se iugoslavos.) Enfim: um argumento político para a secessão que parta do ponto de vista do coletivo (como a sociedade de Copp)
Identidade Coletiva, Culturas e Secessão
253
incorre nos mesmos problemas dos argumentos substancialistas pelo fato de ser, no fundo, um argumento substancialista disfarçado. A alternativa seria, portanto, oferecer um argumento político partindo do ponto de vista do indivíduo — de um ponto de vista liberal. Neste caso, a decisão pela secessão seria tomada pelos indivíduos com base em considerações de caráter estritamente individual. Eles podem votar na secessão por um sentimento de pertença cultural, por nacionalismo, ou pela convicção de que viver num País Basco independente (para continuar com nosso exemplo) seria melhor para eles do que permanecer no estado espanhol, de que o novo estado seria mais eficiente ou mais justo ou menos corrupto ou mais dinâmico ou mais democrático e próximo aos cidadãos. O que importa é que nesta perspectiva os indivíduos não são chamados a tomar sua decisão com base unicamente na pertença a um determinado grupo cultural ou étnico, mas podem escolher livremente num leque de motivações possíveis. Nesta perspectiva os participantes do plebiscito decidem como indivíduos e não simplesmente como membros de um determinado grupo. Sua individualidade é levada a sério e não é reduzida à mera pertença a uma cultura ou a uma etnia. Porém, a partir desta perspectiva, a secessão não seria expressão da vontade de autodeterminação de um povo ou de uma nação, mas uma simples medida que visa a estabelecer uma situação de maior eficiência administrativa ou econômica, de maior democracia ou de maior justiça. Isso salientaria o caráter convencional e contingente que, no fundo, é próprio de cada estado. Existe a tendência a pensar nos estados como em seres imortais, insubstituíveis e dotados de uma necessidade quase metafísica. Mas eles não o são. Um ser humano nasce como aquele indivíduo determinado e não pode deixar de sê-lo. Um estado, pelo contrário, é o resultado de uma série de eventos históricos que podem ser definidos contingentes na medida que a história poderia ter tomado outro rumo. A Revolução Farroupilha, por exemplo, poderia ter ganhado e hoje teríamos dois países lusófonos na América do Sul. Em 1830 os valões poderiam ter declarado sua independência das Províncias Unidas em nome da sua língua francesa, em vez de se unirem aos flamengos (que falam neerlandês como os holandeses) em nome da comum religião católica, e hoje não haveria a Bélgica como a conhecemos (e quiçá daqui a pouco tempo a Bélgica não cesse de existir dividindo-se justamente ao longo das diferenças lingüísticas).17 A tese substancialista desconsidera isso e pretende impor à contingência histórica a rigorosa necessidade de sua fria teoria. Ela pretende criar novos confins com base em critérios duvidosos (etnia, cultura) e sem levar em conta os desejos e os interesses concretos dos indivíduos. Ela identifica o estado com a nação, a dimensão política e jurídica com a dimensão étnica e cultural. Ela se serve de um conceito forte de povo, identificado por ela com uma determinada comunidade cultural ou étnica que na sua homogeneidade é o resultado de uma ficção — a “bola de bilhar” de Tully. A esta concepção corresponde a negação do valor do indivíduo como tal e uma visão da política como convivência de culturas isoladas e preocupadas em manter sua presumida integridade ao preço da liberdade dos seus membros. Nesta ótica o Estado
254
Alessandro Pinzani
é o instrumento da dominação da comunidade sobre o indivíduo, da imposição de valores culturais tradicionais e do fechamento contra outros valores, outras culturas, outras tradições que são percebidas como ameaças. É o mundo da tribo e da mentalidade tribal, cujos representantes são incapazes de confrontar-se com o outro e de pôr-se em questão. Na ótica substancialista, o direto à secessão pertence à comunidade, ao grupo étnico ou cultural pelo simples fato de ele ser um tal grupo; na ótica político-funcional ele pertence aos indivíduos que habitam uma determinada região e que podem avançar várias razões para pedir a secessão — incluído a razão da sua diversidade cultural ou étnica.18 c) O argumento da discriminação Para finalizar, tocarei brevemente o argumento em prol da secessão baseado na necessidade de reagir a uma discriminação contra um determinado grupo étnico ou cultural.19 Entre os exemplos mais atuais poderíamos mencionar a situação dos curdos na Turquia e da minoria albanesa no Kosovo antes da intervenção da OTAN. Em tais circunstâncias, os defensores da tese substancialista vêem sua posição confirmada: um grupo é discriminado ou até perseguido e ameaçado fisicamente pela sua diversidade cultural ou étnica. A única saída é a secessão e a criação de um estado no qual tal grupo possa exercer sua autonomia e afirmar sua cultura. De fato, quando isso acontecer — como proximamente no Kosovo — o resultado mais provável é a criação de um estado em que a ex-minoria, agora maioria, se vingará contra os membros da ex-maioria que ainda vivam naquele território (como demonstrado pelos pogroms anti-sérvios no Kosovo). Mas, fora isso, o que interessa é perguntar se a injustiça que aqui se pretende corrigir é feita ao grupo ou aos indivíduos que o formam. Ao percebermos como injustas as medidas do governo turco contra o livre uso da língua curda ou contra a mera menção de que exista algo como uma cultura curda, nós nos referimos ao fato de que quem sofre por causa desta medida são indivíduos concretos, pessoas que falam curdo e se identificam como curdos, e não uma abstrata cultura ou etnia curda. O fato de a perseguição acontecer com base em razões culturais não a torna pior do que se a perseguição acontecesse com base no comprimento do cabelo, como na Albânia de Enver Hoxha, na estatura, como no caso da perseguição dos Tutsi pelos Hutus, nas preferências sexuais, na cor da pele, na forma do nariz ou na cor dos olhos. Objeto de tais discriminações são indivíduos. Eles perdem sua vida, seus bens ou sua liberdade — e não o grupo, a cultura, a etnia. Quando a única saída é a criação de um novo estado onde os discriminados não sejam mais perseguidos, isso acontece em nome dos seus direitos como seres humanos, como indivíduos, como pessoas, e não como meros membros de uma certa cultura ou etnia. Se o novo estado surgir com base nesta pertença étnica ou cultural, conflitos e discriminações contra membros da ex-maioria são inevitáveis, como já disse. No fundo, a própria base das discriminações sofridas pela minoria em questão é a tese substancialista de que um grupo precisa de homogeneidade para se manter intacto e garantir sua sobrevivência. A própria tese que sustenta a idéia de autodeterminação dos povos corre o risco
Identidade Coletiva, Culturas e Secessão
255
de oferecer a justificativa para a opressão, particularmente quando se deixe de lado a dimensão individual para concentrar-se em macro-sujeitos como “povo”, “nação”, “etnia” ou “cultura”. Finalmente, os defensores da tese substancialista apontam corretamente pelo fato de que os indivíduos precisam — para se tornarem indivíduos, para formarem sua individualidade e personalidade — pertencer a uma determinada cultura. Eles teriam, então, um direito a uma cultura intacta. Isso pode ser concedido, mas não se vê a razão pela qual esta cultura deva ser necessariamente uma cultura mais do que outra. Um indivíduo nascido em Montreal precisa crescer numa cultura intacta, mas não necessariamente na cultura francesa do Quebec. Se ele se socializar num contexto lingüístico anglo-saxônico, sua vida não será por isso mais pobre ou irrealizada. A perda de uma língua e de uma cultura é algo lastimável, mas não consigo ver argumentos que justifiquem sua salvaguarda ao preço da liberdade dos indivíduos que não queiram mais falar aquela língua ou manter em vida aquela cultura. Claro, muitas vezes uma cultura desaparece sob o ataque de outra cultura mais forte, não por livre escolha dos seus membros. Mas a resposta ao assim chamado “colonialismo cultural” (conceito que, contudo, considero muito questionável e pouco claro) não pode ser uma forma de comunitarismo antiindividual e de imposição forçada de modelos de vida.20
Referências Anderson, B. 1983. Imagined Communities. Reflections on the Origin and Spread of Nationalism. London & New York: Verso. Assmann, J. 1992. Das kulturelle Gedächtnis. Schrift, Erinnerung und politische Identität in frühen Hochkulturen. München: Beck. Barry, B. 2001. Culture and Equality. An Egalitarian Critique of Multiculturalism. Cambridge (MA): Harvard University Press. Benhabib, S. 2002. The Claims of Culture. Equality and Diversity in the Global Era. Princeton: Princeton University Press. Buchanan, A. 1991. Secession. The Morality of Political Divorce from Fort Sumter to Lithuania and Québec. Boulder (CO): Westview. —–. 1997. Self-Determination, Secession, and the Rule of Law. In McKim, R. & McMahan, J. (eds.). The Morality of Nationalism, Oxford: Oxford University Press, pp. 301–23. Carens, J. 2000. Culture, Citizenship, and Community. A Contextual Exploration of Justice as Evenhandedness. Oxford: Oxford University Press. Cerutti, F. 1996. Identità e politica. In Cerutti, F. (a cura di), Identità e politica, Roma & Bari: Laterza, pp. 5–41. Cobban, A. 1969. The Nation-State and National Self-Determination. London: Collins. Copp, D. 1997. Democracy and Communal Self-Determination. In McKim, R. & McMahan, J. (eds.). The Morality of Nationalism, Oxford: Oxford University Press, pp. 277–300. Fraser, N. & Honneth, A. 2003. Redistribution or Recognition? A Political-Philosophical Exchange. London & New York: Verso. Höffe, O. 2005. A democracia no mundo de hoje. São Paulo: Martins Fontes.
256
Alessandro Pinzani
Honneth, A. 2003. Luta pelo reconhecimento. São Paulo: Editora 34. Kymlicka, W. 1995. Multicultural Citizenship. A Liberal Theory of Minority Rights. Oxford: Oxford University Press. —–. 2001. Politics in the Vernacular. Nationalism, Multiculturalism, and Citizenship. Oxford: Oxford University Press. Niethammer, L. 2000. Kollektive Identität. Heimliche Quellen einer unheimlichen Konjunktur. Reinbek bei Hamburg: Rowolth. Renan, E. [1882] 1997. Qu’est-ce qu’une nation? Texto eletrônico acessível pelo link: http:// www.bmlisieux.com/archives/nation01.htm; acessado em 23 de outubro de 2007. Seton-Watson, H. 1977. Nations and States. London: Methuen. Slaughter, M. M. 1994. The Multicultural Self: Questions of Subjectivity, Questions of Power. In Rosenfeld, M (ed.). Constitutionalism, Identity, Difference, and Legitimacy. Theoretical Perspectives. Durham: Duke University Press, pp. 369–80. Straub, J. 1998. Personale und kollektive Identität. Zur Analyse eines theoretischen Begriffs. In Assmann, A. & Friese, H. (Hg.). Identitäten. Erinnerung, Geschichte, Identität 3. Frankfurt a. M.: Suhrkamp, pp. 73–104. Tamir, Y. 1993. Liberal Nationalism. Princeton: Princeton University Press. Taylor, Ch. 1994. Multiculturalism. Examining the Politics of Recognition. Ed. by A. Gutmann, with essays by K. A. Appiah, J. Habermas, St. C. Rockefeller, M. Walzer and S. Wolf. Princeton (NJ): Princeton University Press. —–. 2004. Modern Social Imaginaries. Durham: Duke University Press. Tully, J. 1995. Strange Multiplicity. Constitutionalism in an Age of Diversity. Cambridge: Cambridge University Press. Wagner, P. 1998. Fest-Stellungen. Beobachtungen zur sozialwissenschaftlichen Diskussion über Identität. In Assmann, A. & Friese, H. (Hg.). Identitäten. Erinnerung, Geschichte, Identität 3. Frankfurt a. M.: Suhrkamp, pp. 44–72. Wendt, A. 1999. Social Theory of International Politics. Cambridge: Cambridge University Press. Zanini, P. 1997. Significati del confine. I limiti naturali, storici, mentali. Milano: Bruno Mondadori. Žižek, S. 2006. The Parallax View. Cambridge (MA): The MIT Press.
Notas 1 Slaughter cita um caso paradigmático nos EUA (Slaughter 1994, p. 375 s). Benhabib cita Ayelet Scha-
char, que fala no “paradoxo da vulnerabilidade multicultural”: políticas estaduais que visam, com boas intenções, a salvaguardar os direitos das minorias podem acabar permitindo vexames sistemáticos contra indivíduos membros da minoria em questão (apud Benhabib 2002, p. 104). 2 Em geral, o livro de Barry representa um redde rationem feroz contra o multiculturalismo e seus argumentos a partir de um ponto de vista liberal que interpreta o liberalismo em primeiro lugar como teoria da eqüidade e da justiça. 3 Veja-se o clássico Kymlicka 1995, p. 10ss. 4 Em fundamentar sua posição na causa University of California vs. Bakke, apud Slaughter 1994, p. 370. 5 Uma posição análoga é defendida por Joseph Carens, que afirma “que as culturas evolvem e mudam no tempo; que as culturas são influenciadas direta e indiretamente por outras culturas; que as culturas contêm elementos em conflito entre si; que as culturas estão sujeitas a muitas interpretações diversas, freqüentemente conflitantes, seja por parte de seus membros como por parte de estranhos; que à medida que uma certa cultura dá valor e sentido às vidas das pessoas que nela participam pode variar entre
Identidade Coletiva, Culturas e Secessão
257
os membros daquela cultura e ser objeto de disputas interpretativas; e que membros de uma cultura podem ser expostos a, ter acesso a ou até participar como membros em uma ou mais culturas diferentes” (Carens 2000, p. 15). 6 Benhabib se movimenta no âmbito de uma posição inspirada na teoria discursiva e mais próxima ao liberalismo, enquanto Tully critica o liberalismo pela sua pretensão de universalidade. Esta crítica é refutada veementemente por Barry (Barry 2001, p. 261ss). 7 Sobre a relação entre estes dois tipos de identidade e sua problematicidade veja-se Wagner 1998, p. 44ss. Neste contexto, partirei do pressuposto que os dois conceitos (particularmente o de identidade individual) sejam menos problemáticos do que Wagner (corretamente, na minha visão) considera. No fundo, os autores que defendem posições multiculturalistas nem sempre partem de um conceito forte de identidade coletiva (veja-se por ex. a noção de “imaginário social” usada por Taylor e comentada mais abaixo neste artigo). 8 Obviamente, os grupos diferem em relação à possibilidade que seus membros têm de reformular sua identidade no contexto da narrativa própria da sua cultura. Há contextos culturais que oferecem aos indivíduos múltiplas possibilidades de repensar e redefinir sua identidade individual e outros que os põem perante a dramática alternativa entre adaptação aos padrões dominantes e exclusão. Quanto maiores as possibilidades de reformulação da própria identidade, tanto maior a autonomia prática do indivíduo (cf. Benhabib 2002, p. 16). 9 Num sentido, isso corresponde a uma reformulação da teoria contratualista clássica, segundo a qual uma multidão só se transforma num povo no momento em que seus membros aceitam como legítimo um determinado arranjo institucional (que é o objeto do contrato social, justamente). Só que agora a dimensão voluntarista e decisória é substituída por um conceito mais neutro: o imaginário social se forma por processos impessoais interiores a um determinado grupo de indivíduos, cuja origem não é objeto de análise (assim como ela não o é nas teorias de um Hobbes ou de um Kant, que só visam à legitimação de um certo tipo de Estado e não pretendem explicar o surgimento da sociedade civil ou do próprio Estado). 10 Seguindo Niethammer, Jürgen Straub afirma que o conceito de identidade coletiva assim como usado habitualmente é cientificamente insustentável (do ponto de vista das ciências empíricas e das humanas) e remete em realidade a uma normatividade implícita. Straub considera tal conceito utilizável somente no sentido (utilizado neste artigo por mim) da “imagem que um grupo constrói de si e com a qual seus membros de identificam” (Straub 1998, p. 102). 11 Straub chama a atenção para a confusão conceitual entre identidade e individualidade no plano pessoal: um indivíduo pode ter uma crise de identidade sem por isso cessar de ser o mesmo indivíduo (Straub 1998, p. 78). No caso que estamos discutindo, poderíamos dizer que uma transformação da identidade tribal dos Muqueam não implica o desaparecimento da tribo. 12 Sobre a questão dos confins, das fronteiras e dos limites em geral veja-se o excelente Zanini 1997. 13 No caso de Ruanda, ambos os Hutus e os Tutsis pertencem na realidade à mesma etnia, a Banto, falam a mesma língua e possuem praticamente a mesma cultura; a distinção é primariamente uma distinção econômica e social, vivendo os Hutus originariamente de agricultura e os Tutsis de criação de gado (esta diferença de estilo de vida explicaria também as diferenças físicas — começando pela altura — que, contudo, caracterizam só uma minoria de indivíduos). As duas “etnias” foram criadas pelos belgas quando sucederam aos alemães como potência colonial dominadora em 1916. O caso da Iugoslávia é mais complexo, mas é inegável que — nas regiões que conheceram as lutas mais ferozes e os episódios mais cruentos das guerras civis dos anos Noventa — os vários grupos lingüísticos e religiosos eram fortemente misturados e o número de matrimônios mistos muito elevado. 14 Esta parece ser a posição do próprio Tamir (cf. particularmente Tamir 1993, p. 72). 15 “Dado o interesse essencial dos indivíduos em preservar sua identidade nacional, é justificado garantir-lhes um conjunto de direitos visados a proteger tal interesse” (Tamir 1993, p. 73). 16 Deixo de lado, por simplicidade, a circunstância de que há bascos também na França e que, portanto, o surgimento de um estado basco no lado ibérico dos Pireneus teria conseqüências inevitáveis também no lado francês.
258
Alessandro Pinzani
17 A Suíça possui quatro grupos lingüísticos fortemente caracterizados, mas é um país só e compacto,
enquanto a comunidade cultural alemã está dividida numa pluralidade de países (a Alemanha, a Áustria e a Suíça, primariamente, mas também a Bélgica, a Itália e — até a Segunda Guerra Mundial — a Tchecoslováquia e a Polônia). 18 No fundo, nós deparamos aqui com a velha dicotomia entre uma visão da cidadania e da pertença à comunidade política na qual é membro somente quem nasce de pais que já são membros e uma na qual é membro quem queira sê-lo, por exemplo, através da imigração. Esta dicotomia perpassa a história política do Ocidente, desde a contraposição da pólis grega (na qual o estrangeiro permanece um meteco sem direito pleno de cidadania) ao império romano (no qual é a lei que estabelece quem é civis) até a contraposição moderna de ius sanguinis e ius solis. Isso demonstra mais uma vez o caráter paradigmático da questão da secessão: como ao enfrentarmos tal questão nós deparamos com os principais conceitos da teoria e da praxe política ocidental. Contudo, neste contexto deixarei de lado a questão da definição do direito de cidadania. 19 Em relação à necessidade de inserir o direito de secessão para este tipo de situações no contexto do direito internacional, veja-se os textos de Allen Buchanan (Buchanan 1991 e 1997), com cujos argumentos e conclusões concordamos plenamente. 20 Agradeço a Fernando Coelho a preciosa obra de revisão lingüística deste texto. As traduções de textos ingleses e alemães foram efetuadas todas por mim.
P ODE R AWLS TACHAR O U TILITARISMO DE D OUTRINA ( ABRANGENTE ) DO B EM ? A NTONIO F REDERICO S ATURNINO B RAGA FACC-Universidade Federal do Rio de Janeiro
antoniofsbraga@uol.com.br
O objetivo deste trabalho é analisar um dos elementos envolvidos na disputa entre a teoria rawlsiana da justiça e a teoria utilitarista. Mais precisamente, vou examinar a tese rawlsiana de que, nessa disputa, o utilitarismo pode e deve ser considerado como uma doutrina abrangente. Esta tese aparece em diversas passagens do livro Liberalismo Político (Rawls 1996); veja, por exemplo, as páginas 13, 37 e 170. Vou me concentrar, porém, no capítulo (ou conferência) V, intitulado A Prioridade do Justo e Idéias do Bem, no qual a referida tese está inserida no contexto de uma discussão sobre o problema das comparações interpessoais. Nesse capítulo, aliás, Rawls retoma as reflexões desenvolvidas no artigo Social Unity and Primary Goods (Rawls 1982), no qual a disputa entre a sua própria teoria e o utilitarismo é enfocada por meio, justamente, de uma análise sobre o modo pelo qual cada uma das teorias aborda o problema das comparações interpessoais. Em Social Unity and Primary Goods, logo na primeira seção, Rawls afirma que, para abordar o problema das comparações interpessoais, é preciso estabelecer uma divisão entre dois grandes tipos de concepções de justiça (Rawls 1982, p. 160): por um lado, teorias da justiça que admitem uma pluralidade de concepções de bem, diferentes, opostas e até incomensuráveis, e, por outro lado, teorias da justiça que sustentam que há uma única concepção do bem que deve ser reconhecida por todas as pessoas, na medida em que são racionais. Já no capítulo V de Liberalismo Político, Rawls deixa indicado que uma doutrina abrangente constitui uma visão sobre o sentido, valor e propósito da vida humana como um todo (Rawls 1996, p. 179–80). Considerando que sentido, valor e propósito da vida humana costumam ser reunidos no conceito de “Bem”, podemos afirmar que, para Rawls, há uma equivalência, pelo menos em princípio, entre as noções de “doutrina abrangente” e “concepção de bem” — em princípio, uma concepção de bem é uma doutrina abrangente (do bem), e viceversa. No capítulo I, por sua vez, Rawls estabelece uma distinção entre, por um lado, concepções políticas da justiça e, por outro lado, doutrinas “morais” (talvez seja melhor usar o termo “éticas”), baseada no fato de que, ao contrário das primeiras, estas últimas em geral representam doutrinas abrangentes, quer dizer, doutrinas que pretendem aplicar-se às diversas esferas da existência humana, desde o comportamento estritamente pessoal, passando pelas relações propriamente pessoais e chegando à organização da sociedade como um todo — chegando, em outras palavras, à regulação da esfera política (Rawls 1996, p. 13).
Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 259–272.
260
Antonio Frederico Saturnino Braga
Reunamos agora os diversos elementos conceituais que acabam de ser mencionados. Uma concepção de bem é uma concepção “ética”, quer dizer, uma concepção que indica sentido, valor e propósito da existência humana como um todo. É por isso, justamente, que uma concepção de bem tem, em princípio, um alcance abrangente, quer dizer, pretende aplicar-se às diversas esferas da existência humana, desde o comportamento estritamente individual, passando pelas relações propriamente pessoais e chegando às relações sociais constitutivas da esfera política. Ora, ao pretender aplicar-se à esfera política, uma concepção abrangente do bem constitui-se simultaneamente numa concepção política, ou seja, numa teoria da justiça — trata-se de uma teoria sobre os princípios que devem reger a esfera política. Diferentes concepções abrangentes do bem equivalem, portanto, a diferentes teorias da justiça. Em outras palavras, do ponto de vista de uma concepção abrangente do bem, uma teoria da justiça equivale a uma concepção do bem, o que significa que, desse ponto de vista, uma teoria da justiça simplesmente não pode admitir uma pluralidade de concepções do bem, diferentes, opostas e incomensuráveis. Vimos acima que Rawls parte do princípio de que há teorias da justiça que admitem uma pluralidade de concepções do bem, diferentes e opostas. Com base no que acaba de ser dito, podemos afirmar que as concepções de bem contempladas por este tipo de teoria da justiça não podem ser doutrinas rigorosamente abrangentes. Para estabelecer a possibilidade deste tipo de teoria da justiça, Rawls precisa contar com a possibilidade de se fazer uma distinção entre a esfera da ética e a esfera da política, ou seja, entre a esfera “não-política” da existência humana, na qual cada indivíduo se orienta por uma das diversas concepções de bem que legitimamente vicejam na sociedade, e, por outro lado, a esfera propriamente política, regida por uma teoria unitária e coerente da justiça (exclusivamente política). Do ponto de vista deste tipo de teoria da justiça, portanto, uma concepção de bem, ainda que continue a ter visada abrangente, precisa ser reduzida a uma concepção “quase-abrangente”; deste ponto de vista, uma concepção quase-abrangente do bem, ainda que continue a alimentar a pretensão de fornecer orientação para a esfera política, precisa admitir o fato de que esta sua orientação deve poder traduzir-se nos termos de uma racionalidade estritamente política, tal como indicada ou estruturada pela teoria da justiça consensualmente aceita na sociedade. E uma das condições dessa racionalidade política consiste, precisamente, na admissão da legitimidade do pluralismo das concepções de bem, o que implica que as decisões do Estado, assim como a justificação destas decisões, devem caracterizar-se pelo maior grau de neutralidade possível em relação aos valores, anseios e projetos expressos em cada uma das concepções de bem. A grande dificuldade que este tipo de teoria da justiça enfrenta reside no fato de que, em muitos casos, conflitos propriamente políticos parecem envolver, inevitável e essencialmente, conflitos entre concepções (quase-abrangentes) de bem, o que significa que, ao resolver estes conflitos, a teoria da justiça adotada pela sociedade acaba tendo uma influência mais favorável a uma (ou algumas) destas concepções, em detrimento de outras. E isto simultaneamente significa que, para resolver estes
Pode Rawls Tachar o Utilitarismo de Doutrina (abrangente) do Bem?
261
conflitos, uma teoria da justiça precisa propor um critério de decisão que, na impossibilidade da neutralidade absoluta, possa ao menos ser considerado razoavelmente neutro (ou imparcial) pelos próprios indivíduos cujas concepções de bem seriam diferentemente afetadas. No contexto do “fato do pluralismo”, um critério justo é, precisamente, um critério razoavelmente neutro, ou, mais simplesmente, um critério “razoável” — o sentido de “razoável” aponta, precisamente, para a neutralidade que se pode razoavelmente esperar e exigir dos agentes políticos. No capítulo V de Liberalismo Político, Rawls deixa claro que ele considera o utilitarismo como uma doutrina que especifica sentido, valor e propósito da vida humana (Rawls 1996, p. 179–80); em outras palavras, Rawls deixa claro que ele considera o utilitarismo como uma concepção do bem. Isto suscita a seguinte questão. Considerando que ele teria de admitir a distinção acima estabelecida entre concepções do bem rigorosamente abrangentes e, por outro lado, concepções quase-abrangentes, em qual destas categorias ele colocaria o utilitarismo? Para encaminhar esta questão, voltemos, rapidamente, à distinção entre uma concepção abrangente do bem e uma concepção quase-abrangente. Em ambos os casos, uma concepção de bem consiste numa doutrina que especifica sentido e propósito da vida humana como um todo. Tratando-se, em ambos os casos, de uma concepção de caráter normativo, trata-se de uma doutrina que especifica o propósito global que deve ser visado pelos indivíduos, na medida em que são racionais. No caso de uma concepção rigorosamente abrangente, como foi indicado acima, trata-se de uma doutrina com pretensão de validade política, o que significa que sentido e propósito da existência funcionam como critérios propriamente políticos, quer dizer, critérios para a discussão e decisão dos conflitos políticos. Neste caso, a concepção de bem constitui-se, automaticamente, numa teoria da justiça. Pode-se afirmar ainda que, nesse caso, a doutrina sobre o bem ergue pretensão de verdade (validade geral), e que essa pretensão regula a esfera política. Ora, dizer que a esfera política é pautada pela crença de que uma certa concepção de bem representa a verdadeira concepção do propósito da existência humana — dizer isso equivale a dizer que a justiça política consiste na promoção dessa concepção de bem. O Estado justo é o Estado que educa ou pelo menos estimula os cidadãos para a vida regulada por essa concepção, ou seja, é o Estado que promove essa concepção. É por isso que se diz que, nesse caso, há uma prioridade do bom sobre o justo. É obvio que, entendida dessa maneira, uma concepção abrangente é incompatível com o “fato do pluralismo”, ou seja, com o reconhecimento de que há uma pluralidade de concepções razoáveis de bem, que merecem ser respeitadas e até preservadas, na maior medida possível. E isso significa que ela é incompatível com uma ordem política autenticamente pluralista. Em contrapartida, uma concepção quaseabrangente é uma concepção de bem compatível com o fato do pluralismo e com a ordem política pluralista. Trata-se de uma concepção que, indicando ainda sentido e propósito da vida humana como um todo, deixa de erguer pretensão de validade política — ainda que mantenha a pretensão de fornecer orientações para a esfera po-
262
Antonio Frederico Saturnino Braga
lítica. Trata-se de uma concepção que aceita o fato de que outras doutrinas sobre o bem vicejam na sociedade, e que assume uma atitude de tolerância política em relação a elas. Nesse caso, a concepção quase-abrangente aceita o fato de que a discussão e resolução das questões políticas não podem mais basear-se numa concepção específica (particular) do propósito global que deveria ser visado pelos indivíduos, na medida em que são racionais. Ora, por abandonar a pretensão de ter validade na esfera política, a concepção quase-abrangente precisa encontrar uma teoria política que, ao mesmo tempo em que lhe seja aceitável, seja aceitável também para as outras teorias do bem que vicejam na sociedade. No Capítulo IV de Liberalismo Político, que discute a idéia do Overlapping Consensus, Rawls parece propor que o utilitarismo seja enquadrado na categoria das concepções quase-abrangentes do bem. Com efeito, no §8 deste capítulo, Rawls apresenta o utilitarismo como uma das doutrinas “abrangentes” que poderiam apoiar a concepção de justiça do “liberalismo político” (e não mais da “justiça como eqüidade” — o que suscita a difícil questão de saber quais seriam, exatamente, as relações entre as teorias da “justiça como eqüidade” e do “liberalismo político”). Em outras palavras, Rawls tenta mostrar de que modo o utilitarismo poderia “aproximar-se” da teoria da justiça do liberalismo político e reconhecer nela uma concepção “satisfatória” (Rawls 1996, p. 169–70). Ora, é claro que, se o utilitarismo está sendo tomado como uma doutrina que pode aproximar-se da teoria da justiça do liberalismo político, que pode, em outras palavras, vir a aceitá-la como uma teoria política satisfatória — se o utilitarismo está sendo tomado desta forma, ele está sendo tomado, não como uma doutrina rigorosamente abrangente do bem, mas como uma doutrina quaseabrangente. No contexto do fato do pluralismo, uma concepção quase-abrangente do bem é uma concepção que entra no domínio da ética, ao passo que as correspondentes teorias da justiça entram no domínio da filosofia política. É claro que o utilitarismo pode ser visto como uma doutrina ética, quer dizer, voltada para a direção das condutas estritamente individuais e das relações propriamente pessoais. Mas isso absolutamente não significa que ele deva ser visto como uma doutrina que abandonou o campo da filosofia política, e que, ao abandoná-lo, fica obrigado a encontrar a teoria (política) da justiça que lhe seja mais próxima ou aceitável. Ao contrário, o sentido prioritário do utilitarismo sempre foi e continua a ser o de uma teoria propriamente política, quer dizer, uma teoria com pretensão de validade na esfera política. Isso significa que, se se quiser mantê-lo na classe das concepções de bem, é preciso enquadrá-lo na categoria das concepções abrangentes do bem, quer dizer, concepções do propósito da vida humana que pretendem ter validade também na esfera política. O enquadramento do utilitarismo na classe das concepções abrangentes do bem esbarra num grande obstáculo. Trata-se do fato de que, à primeira vista, esta classe é inteiramente ocupada pelas doutrinas perfeccionistas nos moldes clássicos, ou seja, doutrinas que apresentam o propósito da vida humana como um estado objetivo que deve ser diligentemente buscado — a virtude, a excelência, a perfeição. Em outras pa-
Pode Rawls Tachar o Utilitarismo de Doutrina (abrangente) do Bem?
263
lavras, trata-se do fato de que as concepções abrangentes do bem em princípio são identificadas àquelas doutrinas que, além de pretenderem ensinar aos homens que caminho eles devem seguir na vida, apresentam tal caminho como um esforço de repressão e superação dos desejos, preferências ou impulsos mais imediatos, como um esforço, em outras palavras, de substituição dos desejos imediatos por desejos eticamente elevados. E, como bem ensina Robert Goodin (Goodin 1993), o utilitarismo, com todas as discussões internas que o caracterizam, sempre tendeu a afastar-se destas doutrinas normativamente densas sobre o bem humano — com exceção, talvez, da vertente claramente minoritária representada, por exemplo, por Moore. Assim, se for verdade que o utilitarismo inclui uma especificação do propósito da vida humana, tal propósito não se apresenta em termos normativos ou morais, como um estado objetivo que deve ser diligentemente buscado. Para entendermos o lugar que a noção de propósito ocupa no utilitarismo, é interessante vê-lo, num primeiro nível, como uma concepção “experimental” da boa vida, Rawls tal como definida por Scanlon (Scanlon 1991, p. 20).1 Trata-se de uma concepção segundo a qual aquilo que torna a vida uma boa vida para aquele que a vive consiste em estados psicológicos (ou subjetivos) “desejáveis”. O impulso antinormativo do utilitarismo, tal como apresentado no artigo de Goodin acima citado, se expressaria então na redução do desejável ao desejado. Dessa forma, o utilitarismo incluiria a concepção de que aquilo que torna a vida uma boa vida para aquele que a vive é, essencialmente, a presença de estados psicológicos desejados, reunidos sob o título “satisfação”. Aproveitando as lições de Scanlon, podemos afirmar que este tipo de concepção, embora equivalha, num certo sentido, a um juízo valorativo — trata-se, justamente, do juízo sobre aquilo que torna a vida uma boa vida para aquele que a vive, não equivale a um juízo estritamente moral. Em outras palavras, em vez de apontar para uma norma (correta) de vida, quer dizer, uma prescrição (correta) do tipo de vida que os homens devem levar, tal concepção aponta antes para uma descrição (verdadeira) da boa vida, quer dizer, uma descrição (verdadeira) daquilo que torna a vida uma boa vida para aquele que a leva. Segundo a descrição utilitarista, aquilo que torna a vida uma boa vida para aquele que a leva é, essencialmente, a presença de estados subjetivos factualmente desejados, reunidos sob o título “satisfação”. Embora o ponto exija uma análise mais cuidadosa, admitamos provisoriamente que, neste tipo de concepção, a satisfação representa o propósito buscado pelos indivíduos. Assim, retomando a frase com que iniciamos o parágrafo anterior, podemos dizer agora o seguinte: se for verdade que o utilitarismo inclui uma especificação do propósito da vida humana, tal propósito se apresenta, não em termos normativos ou morais, como um estado objetivo que deve ser diligentemente buscado, mas, antes, em termos empíricos ou factuais, quer dizer, como o estado subjetivo que os homens, como questão de fato, (já) buscam ou desejam: a satisfação, entendida como o sentimento ou estado mental grosso modo “positivo” que se associa à realização dos desejos ou preferências do indivíduo, quaisquer que elas sejam, e por diferentes que elas sejam. Como explica Goodin, esta espécie de teoria decerto envolve conseqüên-
264
Antonio Frederico Saturnino Braga
cias morais — e o moral equivale aqui, como veremos adiante, ao político (no sentido normativo); mas ela não envolve avaliações morais (quer dizer, éticas) sobre a legitimidade das preferências individuais: “Não há nada na teoria que diga que as pessoas devam ter estes (ou aqueles) tipos de preferências. É simplesmente uma teoria sobre o que se segue, moralmente, se lhes acontece ter esse tipo de preferência. É bom — bom para elas — ter suas preferências satisfeitas, quaisquer que elas sejam.” (Goodin 1993, p. 243). Se se quiser manter a tese de que a “satisfação” funciona no utilitarismo como especificação empírica do propósito da vida humana, será preciso refletir sobre a tensão inerente a este propósito. Ele por um lado é uno: a satisfação representa o propósito único perseguido por todos os homens. Por outro lado, porém, ele admite a variação e o pluralismo: admite-se que a satisfação pode estar associada a desejos, preferências e projetos extremamente variados, até opostos. Ora, para classificar o utilitarismo como uma doutrina rigorosamente abrangente do bem, é preciso encaminhar esta tensão para o lado da unidade, na medida em que uma doutrina abrangente do bem é (e não pode deixar de ser) uma concepção que especifica o propósito uno dos homens e da sociedade. E, para fazer isso, como se verá logo a seguir, é preciso trocar a categoria em que se coloca a noção de satisfação, tomada como propósito da vida humana: é preciso deslocar tal noção, tirando-a da categoria de especificação empírica do propósito que os homens por natureza buscam, e colocando-a na categoria de especificação normativa do propósito que eles devem buscar, na medida em que são racionais. Em Social unity and primary goods, Rawls defende uma leitura do utilitarismo que exemplifica este tipo de deslocamento (1982, p. 174–83). Na sua leitura, o utilitarismo sustentaria, grosso modo, o seguinte argumento: ainda que, empiricamente, seja verdade que os homens têm, em princípio, desejos e preferências muito diferentes entre si, eles sempre devem tentar adotar aquelas preferências que melhor se alinham com o sistema de preferências gerado pelos impulsos predominantes na sociedade como um todo, ou seja, eles devem abandonar valores e projetos que estejam em desacordo com tal sistema de preferências. Assim, ao dizer que o propósito da vida humana é a satisfação, o utilitarista estaria simultaneamente dizendo que o indivíduo deve tentar harmonizar sua satisfação individual com a satisfação “social” (ou global); isto significa, justamente, que ele deve buscar aquele projeto de vida que melhor se alinha com o sistema de preferências gerado pelos impulsos socialmente predominantes. Para classificar o utilitarismo como uma doutrina abrangente do bem, é preciso, portanto, atribuir-lhe uma certa concepção de pessoa, a saber, a de “pessoa despida” (Rawls 1982, p. 180–1). Ainda que Rawls não o afirme, é claro que sua leitura pressupõe que se trata de uma concepção normativa da pessoa, na qual a pessoa é apresentada como um indivíduo que deve estar disposto a se despir dos valores e projetos que estejam em desacordo com as preferências socialmente predominantes, para abraçar aqueles que efetivamente se alinham com tais preferências, de modo a alinhar-se ao propósito, simultaneamente individual e político, da maximização da satisfação.
Pode Rawls Tachar o Utilitarismo de Doutrina (abrangente) do Bem?
265
Desse ponto de vista, o utilitarismo aparece como uma doutrina que se opõe ao reconhecimento da legitimidade do pluralismo dos valores, ainda que de maneira um tanto disfarçada. Com efeito, lido desta maneira, o utilitarismo, longe de reconhecer a positividade do pluralismo dos valores e projetos de vida, patrocina, ao menos indiretamente, a uniformização da concepção de bem na sociedade. Se o propósito que o indivíduo deve abraçar equivale à adoção do projeto de vida que melhor se alinha com o sistema de preferências socialmente dominante, estabelece-se uma perfeita harmonia entre a maximização da satisfação como propósito individual e a maximização da satisfação como propósito social (político). É preciso lembrar que, no contexto do fato do pluralismo, conflitos políticos são conflitos entre demandas individuais irredutivelmente distintas, e critérios de justiça (política) são critérios para o encaminhamento e resolução deste tipo de conflito. Tal como interpretada acima, a maximização da satisfação, em vez de funcionar como critério para a decisão de conflitos entre demandas individuais irredutivelmente distintas, funciona ao contrário como princípio normativo para a dissolução das diferenças ou desacordos entre as demandas individuais. Por representar um propósito que deve ser compartilhado, não só entre os (diversos) indivíduos “despidos”, mas também entre estes e o agente político, a maximização da satisfação, à semelhança do que ocorre no caso das doutrinas perfeccionistas, unifica a sociedade em torno de um projeto comum — só que nesse caso se trata do projeto oriundo do sistema de preferências gerado pelos impulsos socialmente predominantes. É claro que este tipo de leitura seria rejeitado por alguns dos grandes representantes do utilitarismo contemporâneo, como, por exemplo, J. Harsanyi. Com efeito, Harsanyi ancora o utilitarismo naquilo que ele chama de “importante princípio filosófico da autonomia das preferências”, a saber, “o princípio de que, ao decidir-se o que é bom e o que é ruim para um dado indivíduo, o critério último só pode ser seus próprios (deste indivíduo — A.S.B.) desejos e suas próprias preferências.” (Harsanyi 1982, p. 55. O grifo é do próprio autor.) De acordo com Harsanyi, portanto, o utilitarismo não aceita a idéia de que o bom para o indivíduo possa ser estabelecido a partir do sistema de preferências socialmente dominante. Ao ancorar o utilitarismo no princípio da autonomia das preferências, Harsanyi está implicitamente dizendo que esta teoria aceita e até valoriza a pluralidade das concepções individuais de bem — expressas nos diferentes sistemas individuais de preferências. Além disso, até onde sei, o próprio Rawls, depois do artigo de 82, deixou de recorrer a essa espécie de interpretação “totalitária” do utilitarismo — ela não aparece, por exemplo, em nenhum dos capítulos de Liberalismo Político. E a razão da inaceitabilidade desta leitura é clara: não se coaduna com o espírito do utilitarismo o deslocamento normativo da noção de satisfação, tomada como propósito da vida individual. Se se quiser manter a tese de que a noção de satisfação representa, no utilitarismo, o propósito da vida individual, é preciso manter esta noção no plano do empírico-factual. Como questão de fato, o propósito que os indivíduos buscam é, essencialmente, a maximização da satisfação, entendida como estado subjetivo grosso
Antonio Frederico Saturnino Braga
266
modo positivo que se associa à realização de suas preferências, quaisquer que elas sejam, e por variadas que elas sejam. Ter satisfação, quer dizer, um máximo de satisfação, é aquilo que torna a vida uma boa vida para aquele que a leva — não no sentido de uma vida “realizada”, mas no sentido de uma vida meramente “gostosa”. Trata-se decerto de uma concepção ética, mas de uma concepção normativamente descompromissada. No âmbito do utilitarismo, se se quiser deslocar as noções de satisfação e maximização da satisfação para a esfera da teoria normativamente densa ou comprometida, será preciso deslocá-las da esfera da teoria ética para a esfera da teoria propriamente política. Nesta última esfera, entretanto, é equivocado apresentar a maximização da satisfação como propósito da vida política, quer dizer, como o bem da sociedade como um todo. Na teoria política do utilitarismo, em vez de funcionar como definição do bem da sociedade como um todo, a maximização da satisfação funciona como um critério de justiça — trata-se de um critério justo para a resolução dos conflitos (políticos) entre preferências ou demandas individuais irredutivelmente distintas. Se isso for verdade, impõe-se a conclusão de que a teoria política do utilitarismo não deve ser vista como uma concepção abrangente do bem, quer dizer, uma concepção do bem da sociedade como um todo, e simultaneamente de cada indivíduo que dela faz parte. A teoria política do utilitarismo deve ser vista como uma doutrina que, ao incorporar o fato do pluralismo, admite a irredutibilidade das diferenças nas concepções individuais de bem, e usa a noção de maximização da satisfação como critério político para a resolução dos conflitos entre demandas individuais irredutivelmente distintas. Isso significa que esta noção funciona no utilitarismo simplesmente como explicação do conteúdo da justiça, e não como explicitação de uma concepção abrangente do bem. *** Para dar continuidade ao meu argumento, gostaria agora de abordar o problema das comparações interpessoais. Antes de mais nada, é preciso destacar que se trata aqui de um problema essencialmente político, ou seja, um problema que só aparece em teorias com pretensão de validade política; uma concepção quase-abrangente do bem não precisa abordar esse problema. Em Social unity and primary goods, logo depois de estabelecer a divisão entre teorias da justiça que valorizam o fato do pluralismo e teorias da justiça que vinculam a justiça a uma concepção unitária e abrangente do bem, Rawls afirma que “Teorias da justiça que entram nos lados opostos dessa divisão tratam o problema das comparações interpessoais de modos inteiramente diferentes” (Rawls 1982, p. 160). Rawls não chega a expor o modo como o problema é tratado numa teoria da justiça vinculada a uma concepção abrangente do bem. Eu gostaria, entretanto, de tentar fazer isso, para dar continuidade ao meu argumento sobre a natureza da teoria política do utilitarismo. Precisamos de uma caracterização inicial do problema. Nos textos que estamos analisando, Rawls deixa claro que o problema das comparações interpessoais vincu-
Pode Rawls Tachar o Utilitarismo de Doutrina (abrangente) do Bem?
267
la-se à necessidade de se dispor de um critério político para a resolução dos conflitos entre as diversas reivindicações que os diferentes cidadãos fazem em relação ao Estado. Para resolver esses conflitos, é preciso que se tenha uma concepção sobre os tipos de reivindicação que os cidadãos podem apropriadamente fazer em relação ao Estado, sobre as razões capazes de legitimar e dar peso a tais reivindicações, e sobre o modo como se deve avaliar e fixar o peso relativo dessas diferentes reivindicações, para se resolver os conflitos entre elas. E é nesse ponto que surge o problema das comparações interpessoais: para determinar o peso correto de cada reivindicação em conflito, é preciso compará-las, ou seja, é preciso comparar a situação dos indivíduos que respectivamente as fazem. E para se fazer essa comparação, precisase de um padrão de comparação, o qual exige a especificação de um valor comum e compartilhado. Tomemos primeiro o caso das teorias da justiça vinculadas a uma concepção unitária e abrangente do bem. Como vimos acima, neste tipo de teoria a justiça está vinculada a uma concepção do bem, ou do propósito, da sociedade como um todo — que é simultaneamente o bem, ou o propósito, de cada indivíduo que dela é parte. No caso deste tipo de teoria, o valor comum e compartilhado consiste, precisamente, numa concepção compartilhada do propósito da existência humana, que indica o sentido e a meta da existência, não só da comunidade política, mas também de cada cidadão que dela faz parte. Ora, ao indicar que tipo de vida os cidadãos devem buscar, a concepção abrangente do bem indica também, de forma direta, que tipo de reivindicação os cidadãos podem legitimamente fazer em relação ao Estado, e de que modo as reivindicações individuais devem ser comparadas, avaliadas e ponderadas, de modo a se resolverem os eventuais conflitos entre elas. Pode-se dizer que, nesse caso, as comparações das reivindicações individuais consistem numa análise do mérito que elas respectivamente auferem da concepção supra-individual de bem reconhecida pela comunidade. Para determinar o peso correto das reivindicações em conflito, parte-se da concepção suprapessoal de bem compartilhada pela comunidade, e, partindo-se daí, procede-se a um cotejo da função e mérito dos indivíduos que fazem as reivindicações, e da contribuição que o atendimento das mesmas traria ao bem global — que é o bem do indivíduo e do próprio Estado. Por outro lado, quando a teoria da justiça incorpora o reconhecimento de que há uma pluralidade de concepções razoáveis do bem pessoal, a exeqüibilidade e legitimidade das comparações interpessoais deixam de poder fundar-se numa concepção de bem unitária e abrangente. O problema adquire nova feição, que pode ser exposta da seguinte maneira. Numa ordem política pluralista, os cidadãos podem legitimamente abraçar concepções de bem não apenas diferentes e muitas vezes opostas, mas, principalmente, incomensuráveis: na ausência de uma concepção de bem reconhecida como politicamente válida, não se pode mais, do ponto de vista político, medir e determinar os respectivos méritos das diferentes concepções do bem pessoal — em princípio, todas são reconhecidas como igualmente legítimas e valiosas. Ora, considerando que o bem representa o propósito visado pelos próprios indivíduos que
268
Antonio Frederico Saturnino Braga
fazem reivindicações em relação ao Estado, dizer que há e pode haver diferentes concepções de bem, incomensuráveis entre si, equivale a dizer que as comparações dessas reivindicações individuais não podem mais basear-se num propósito unitário e compartilhado, que deveria ser visado por todos os indivíduos — seu verdadeiro bem pessoal. É preciso encontrar um outro princípio de comparação. É nisso que consiste, essencialmente, o problema das comparações interpessoais numa ordem política pluralista. Esse novo princípio de comparação pode ser definido como aquilo com que o Estado deve preocupar-se, depois que ele não pode mais preocupar-se em promover a concepção de bem reconhecida como verdadeira pela comunidade. É aqui que aparece o conceito independente do Justo: depois que o Estado não pode mais preocupar-se com a promoção de uma concepção unitária e abrangente do Bem, aquilo com que ele deve preocupar-se passa a ser definido como “o justo”. Depois que a questão do bem é rebaixada a questão de preferência individual, ou seja, questão que não admite encaminhamento e resolução publicamente compartilhados, o debate político caracteriza-se por uma prioridade do conceito de justiça, com as características e condições que lhe são peculiares. Dentre essas características avulta a neutralidade, ou imparcialidade: se é verdade que, numa ordem política pluralista, as diferentes concepções de bem respectivamente preferidas pelos indivíduos devem em princípio ser reconhecidas como igualmente legítimas e valiosas, o propósito das decisões e ações do Estado, a justiça política, deve caracterizar-se pelo maior grau possível de neutralidade em relação a essas diferentes concepções de bem. É injusto que o Estado intencionalmente favoreça uma ou outra dessas concepções, em detrimento das demais. É claro que essa exigência de neutralidade gera uma série de problemas, aos quais corresponde, por exemplo, a tentativa de Rawls de estabelecer uma distinção entre “neutralidade de objetivo” e “neutralidade de influência” (Rawls 1996, p. 190–5). Mas não precisamos entrar aqui nessa distinção, nem nos problemas a que ela responde; basta-nos uma compreensão do sentido geral da exigência de neutralidade, a qual decorre do reconhecimento do pluralismo das concepções razoáveis de bem pessoal, e da incomensurabilidade entre elas. Resumindo: numa ordem política pluralista, as necessárias comparações das reivindicações individuais não podem mais basear-se numa concepção compartilhada do Bem, ou seja, numa concepção do bem da sociedade como um todo e, simultaneamente, de cada indivíduo que dela é parte. Elas só podem apoiar-se numa concepção compartilhada da justiça política, ou seja, numa concepção compartilhada daquilo com que o Estado deve preocupar-se, depois que ele não pode mais preocupar-se em promover uma determinada concepção de bem. Aquilo com que o Estado deve preocupar-se representa um valor comum e compartilhado, ou seja, um valor que todos os indivíduos “razoáveis” reconhecem, muito embora ele seja distinto do seu bem pessoal — categorialmente distinto. As comparações políticas das reivindicações individuais são análises do peso que elas adquirem ao serem referidas a esse valor compartilhado, ou seja, são análises das suas respectivas contribuições para a promoção
Pode Rawls Tachar o Utilitarismo de Doutrina (abrangente) do Bem?
269
desse valor político, categorialmente distinto do bem, entendido como propósito visado pelos indivíduos. Numa ordem política pluralista, o problema das comparações interpessoais envolve, portanto, a seguinte pergunta: com que o Estado deve essencialmente preocupar-se, depois que ele não pode mais preocupar-se em promover um propósito global ou abrangente? Para encaminhar a reflexão sobre essa pergunta, gostaria de citar por extenso uma passagem do capítulo V de Liberalismo Político, que já foi mencionada anteriormente (Rawls 1996, p. 179–80). No liberalismo político o problema das comparações interpessoais aparece da seguinte maneira: dadas as conflitantes concepções abrangentes do bem, como é possível alcançar um tal entendimento político a respeito do que deve valer como reivindicações apropriadas? A dificuldade é que o governo, assim como não pode agir para promover o catolicismo ou o protestantismo, ou qualquer outra religião, tampouco pode agir para maximizar a satisfação (fulfillment) das preferências ou desejos racionais dos cidadãos (como no utilitarismo), ou para promover a excelência humana ou os valores da perfeição (como no perfeccionismo). Nenhuma dessas visões sobre o significado, valor e propósito da vida humana, tal como especificados pelas respectivas doutrinas religiosas ou filosóficas abrangentes, é afirmada pelos cidadãos em geral, e por isso a busca de qualquer uma delas por meio das instituições sociais básicas daria à sociedade política um caráter sectário.
Nessa passagem, Rawls explicitamente aproxima o utilitarismo das doutrinas perfeccionistas e religiosas. Doutrinas perfeccionistas e religiosas não são apenas doutrinas sobre o sentido e propósito da vida humana, quer dizer, doutrinas que especificam qual é o propósito da vida humana; mais fundamentalmente, são doutrinas que, ao especificar esse propósito, colocam-se numa esfera densamente normativa: elas especificam o propósito que os indivíduos devem buscar, mesmo que ele seja bastante distinto de suas preferências empíricas imediatas. Mas será que o utilitarismo especifica um propósito que os indivíduos devem buscar? E será que um propósito normativamente especificado desempenha algum papel na teoria política do utilitarismo? A dificuldade, como foi sugerido acima, reside na interpretação da noção de “satisfação”, que ocupa lugar central na teoria utilitarista. Essa noção pode indicar: (a) ato ou efeito de satisfazer uma preferência ou desejo — quaisquer que eles sejam, e por diferentes que eles sejam; (b) estado mental uniforme que os indivíduos experimentam ao terem satisfeitas suas preferências ou desejos — quaisquer que elas sejam, e por diferentes que elas sejam; (c) propósito empírico dos indivíduos, quer dizer, propósito factualmente visado pelos indivíduos; (d) propósito normativo dos indivíduos, quer dizer, propósito que os indivíduos devem visar; (e) Propósito normativo unitário e abrangente, univocamente compartilhado entre indivíduos e comunidade política. É importante destacar as enormes diferenças entre essas interpretações. Nas interpretações (a) e (b), admite-se que os propósitos preferidos e vi-
270
Antonio Frederico Saturnino Braga
sados pelos indivíduos sejam diferentes, e que a noção de satisfação indique, não o propósito uniformemente visado por eles, mas o estado mental que eles uniformemente experimentam, ao verem realizados os propósitos ou subpropósitos que eles variadamente preferem. A interpretação (c) já é mais densa: ela sugere que todos os indivíduos no fundo adotam um mesmo propósito, “obter satisfação”; em outras palavras, a interpretação (c) sugere que o propósito visado pelos indivíduos é, não tanto seguir e realizar os diversos projetos de vida que eles respectivamente preferem, com as diversas subpreferências que lhes são constitutivas, mas é, antes, obter “satisfação”. É importante, entretanto, enfatizar o seguinte: adotar esta interpretação não implica suprimir as diferenças nos esforços e caminhos pelos quais os diferentes indivíduos perseguem este (mesmo) propósito. A identidade do propósito representa aqui, simplesmente, a identidade de um estado mental ou subjetivo, e não a identidade de uma meta objetiva. O mesmo estado subjetivo é perseguido por diferentes caminhos, o que significa que não há uma convergência dos interesses individuais numa meta una e abrangente. Não se deve confundir aqui a identidade nominal das diferentes metas com a unidade real de um foco de convergência. As interpretações (d) e (e) resultam, justamente, desse deslize interpretativo. No contexto da nossa discussão, a tese (d) de que o indivíduo deve buscar a satisfação, ou a maximização da satisfação, só faz sentido se for interpretada nos seguintes termos: o indivíduo deve seguir aquele caminho e meta de vida que, por harmonizar-se com o sistema de preferências socialmente dominante, promete-lhe maior quantidade de satisfação. E com isso chegamos à interpretação (e) da satisfação como meta socialmente unitária e abrangente. Não é preciso entrar numa investigação mais detalhada da tradição utilitarista para afirmar que, ainda que a interpretação (c) corresponda, grosso modo, à tendência hedonista das primeiras formas de utilitarismo, e ainda que ela possa, talvez, ser compatibilizada com as formas mais recentes de utilitarismo, como o utilitarismo das preferências — ainda assim não é plausível admiti-la numa descrição geral da teoria utilitarista, em virtude, justamente, da sua demasiada suscetibilidade ao deslize conceitual que leva às interpretações (d) e (e), totalmente contrárias ao espírito do utilitarismo. Afastemos, portanto, a tese de que as noções de satisfação e maximização da satisfação funcionam no utilitarismo como indicação de um propósito: quer do propósito factualmente visado pelos indivíduos, quer do propósito que eles devem visar, quer do propósito para o qual devem convergir os esforços e caminhos dos diferentes indivíduos. Adotemos definitivamente a tese de que o utilitarismo reconhece a legitimidade e até positividade das diferentes concepções do bem pessoal, e se insere perfeitamente no contexto do pluralismo destas concepções. Retomemos agora a pergunta que acima formulamos para expressar o problema fundamental das teorias políticas que se inserem neste contexto: com que o Estado deve essencialmente preocupar-se, depois que ele não pode mais preocupar-se em promover um propósito geral ou abrangente? Ora, uma das respostas que podem se apresentar a essa pergunta, e uma resposta bastante plausível, é, justamente, a de
Pode Rawls Tachar o Utilitarismo de Doutrina (abrangente) do Bem?
271
que a justiça política consiste, grosso modo, na maximização da satisfação dos indivíduos — tomada, mais uma vez, não como o propósito que é visado pelos indivíduos, nem como o propósito que eles devem harmoniosamente visar, por serem racionais (e portanto dispostos a “despir-se” de valores e projetos irracionais), mas como estado mental que eles uniformemente experimentam ao atingirem seus propósitos, ou ao realizarem algumas das preferências constitutivas de seus propósitos, por diferentes que sejam esses propósitos e preferências, e por legítimas que sejam estas diferenças. A plausibilidade dessa resposta se expressa no seguinte raciocínio. Vimos acima que uma das exigências básicas de uma ordem política pluralista é a exigência de neutralidade em relação às diferentes concepções razoáveis de bem. Ora, para ser razoavelmente neutra em relação às diferentes concepções de bem adotadas pelos cidadãos, uma teoria da justiça deve deixar de preocupar-se com valores de conteúdo normativo mais intenso, como liberdade e igualdade, na medida em que tais valores podem acabar implicando um favorecimento conteudisticamente determinado de certas concepções de boa vida, em detrimento de outras, e um favorecimento conteudisticamente determinado viola a exigência de razoável neutralidade. Para ser razoavelmente neutra, uma teoria da justiça deve preocupar-se apenas com o valor “satisfação”, entendido como o único valor que, por ser conteudisticamente neutro, sem qualquer implicação para o conteúdo das diversas concepções razoáveis de bem, pode ser razoavelmente aceito numa ordem política pluralista. É óbvio que essa resposta suscita uma série de problemas, nos quais, entretanto, não entrarei aqui. Quis apenas mostrar que, para enfrentar o utilitarismo, a teoria rawlsiana não tem o direito de situá-lo na categoria das concepções abrangentes de bem, mas precisa enfrentá-lo no âmbito próprio das teorias da justiça, como uma teoria que se insere perfeitamente neste âmbito.
Referências Goodin, R. 1993. Utility and the good. In Singer, P. (ed.) A Companion to Ethics. Oxford: Blackwell, p. 241–8. Harsanyi, J. 1982. Morality and the theory of rational behaviour. In Sen, A. & Williams, B. (eds.) Utilitarianism and beyond. Cambridge: Cambridge University Press, p. 39–62. Rawls, J. 1982. Social unity and primary goods. In Sen, A. & Williams, B. (eds.) Utilitarianism and beyond. Cambridge: Cambridge University Press, p. 159–85. —–. 1996. Political Liberalism. New York: Columbia University Press. Scanlon, T. 1991. The moral basis of interpersonal comparisons. In Elster, J. & Roemer, J. (eds.) Interpersonal Comparisons of Well-Being. Cambridge: Cambridge Univ. Press, p. 17–44.
Notas 1 Notar-se-á que, apesar de me valer das lições de Scanlon, divirjo em alguns pontos de sua interpre-
tação do utilitarismo, especialmente do “utilitarismo das preferências”. Ao contrário do que sustenta
272
Antonio Frederico Saturnino Braga
Scanlon, penso que o utilitarismo das preferências pode ser visto, num primeiro nível, como uma concepção experimental da boa vida, semelhante ao utilitarismo hedonista. E a passagem do nível da concepção experimental do bem para o nível da concepção moral (política) de justiça também é bastante semelhante nestes dois casos de utilitarismo. A discussão destes pontos, entretanto, exigiria uma análise detalhada dos diálogos internos à tradição utilitarista, o que excede os limites deste trabalho.
H ABERMAS , E UGENIA L IBERAL E J USTIÇA S OCIAL C HARLES F ELDHAUS Universidade Federal de Santa Catarina
charlesfeldhaus@yahoo.com.br
Introdução Jürgen Habermas, em Die Zukunft der menschlichen Natur, objeta à eugenia liberal, à pesquisa com células tronco embrionárias e ao diagnóstico genético de préimplantação. Parte das objeções habermasianas trata de considerações de justiça, contudo não de justiça distributiva. A questão que o presente trabalho procura responder relaciona-se com a compatibilidade entre a posição habermasiana no texto supracitado e tentativas recentes de abordar a justiça distributiva e social à luz dos últimos avanços no campo da engenharia genética e nos avanços que ao menos em hipótese acredita-se serem possíveis. A motivação destas tentativas de re-formulação das teorias da justiça tradicional são as mais diversas, contudo uma das principais é a preocupação com o surgimento de uma sociedade de duas classes estável, caso surgisse o que Nozick já denominou genetic supermarket (Nozick 1999, p. 315). Para avaliar esta compatibilidade, são necessários alguns elementos prévios, a saber, uma compreensão breve, porém precisa da posição habermasiana acerca da eugenia liberal nos aspectos relevantes ao presente tema e uma compreensão de algumas das tentativas de reconstruir teorias da justiça consagradas, como é o caso da concepção de justiça como equidade de John Rawls, para tratar das questões suscitadas pela engenharia genética. Uma vez fornecidas estas duas pré-condições tratarse-á de modo breve das dificuldades de compatibilidade entre a posição habermasiana e tais extensões da concepção tradicional de justiça social e distributiva.
1. Habermas e a eugenia liberal Como já enfatizado, a posição habermasiana será reconstruída apenas nos aspectos que se acredita serem relevantes ao assunto. A estratégia argumentativa do Frankfurtiano oscila em vários níveis em Die Zukunft der menschlichen Natur, que versam desde o que a intervenção genética causa a quem ela é aplicada até os efeitos desta prática a sociedade liberal como um todo. Da perspectiva de quem é afetado pela intervenção genética, Habermas sustenta que o embrião geneticamente manipulado é alvo de um tratamento instrumental, que dependendo do tipo de atitude envolvida pode ser proibido, permitido, mas nunca prescrito. A intervenção genética à qual subjaz uma atitude terapêutica pode ser no máximo permitida, nunca prescrita, pois o critério do que se considera doença contém conteúdo em parte variável culturalmente. A intervenção genética à qual subjaz uma atitude de aperfeiçoamento Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 273–280.
274
Charles Feldhaus
do patrimônio genético, para Habermas, deve ser proibida. Ela deve ser proibida pelo dano a liberdade ética da pessoa manipulada e pela incompatibilidade com os pressupostos das sociedades liberais contemporâneas. Para Habermas, defender a eugenia liberal supostamente visando proteger a liberdade reprodutiva dos progenitores, desconsidera a diferença entre o debate a respeito do aborto e o debate a respeito da eugenia liberal, particularmente os efeitos da intervenção sobre uma pessoa concernida, a saber, sob quem é alvo da intervenção, pois implica a violação da liberdade ética da pessoa manipulada e um trato instrumentalizante da dignidade da vida humana da pré-pessoa do embrião. Habermas não está se comprometendo, ao sustentar tal posição, com a questão a respeito do estatuto ontológico do embrião, pois, segundo ele, essa questão é impossível de ser respondida, e tal constatação é a contribuição que é possível obter do debate bioético a respeito do estatuto ontológico do embrião no que diz respeito à questão da permissibilidade ou não do aborto. Por conseguinte, Habermas defende que ao realizar a intervenção genética que supera a lógica da cura e adentra no campo do aperfeiçoamento genético, os progenitores estão limitando o espaço dentro do qual a futura pessoa poderia exercer sua liberdade de empreender seu projeto racional de vida. E, como permitir que as pessoas possam realizar pacificamente seu projeto racional de vida é uma das atribuições do Estado liberal de direito, tal Estado permitindo a intervenção pretensamente com base no direito de liberdade reprodutiva, que também é garantido pela Carta Maior, estaria entrando em contradição autorizando uma prática que atenta contra a liberdade ética em vez de defendê-la. Além do mais, o critério habermasiano para delimitar os tipos de intervenções permitidas das não permitidas ou proibidas, é a possibilidade de pressupor um consentimento contrafactual da pessoa afetada pela intervenção. Habermas aqui parte de uma idéia regulativa presente nas decisões bioéticas contemporâneas e na concepção prática moderna, a saber, a de que o consentimento somente pode ser presumido de modo contrafactual no caso de evitação de dano grave ou severo, por isso o consentimento contrafactual somente é possível nos casos de eugenia negativa e não de eugenia positiva. Para justificar essa posição Habermas também recorre a possibilidade sempre presente de ocorrer uma discordância entre as intenções do manipulador genético e as próprias intenções em relação ao seu projeto racional de vida por parte do ser geneticamente manipulado.
2. Teorias da justiça e a eugenia liberal Segundo Resnik, Buchanan, Farrelly, entre outros a engenharia genética tem o poder de alterar suposições chave de nossas teorias da justiça. Teorias renomadas da justiça, como a justice as fairness de Rawls contém como elemento constitutivo das mesmas, a noção que quem distribui talentos naturais entre os membros da sociedade é a loteria natural. As teorias da justiça como a igualdade de recursos, das quais Rawls certamente é fonte inspiradora, porém Ronald Dworkin talvez o mais ilustre re-
Habermas, eugenia liberal e justiça social
275
presentante, sustentam que a noção de mérito é de suma importância quando se está discutindo justiça social e igualdade. Resnik pretende aplicar a teoria da igualdade de recursos, não especificamente a de Dworkin, à engenharia genética. Buchanan et al. também consideram a igualdade de recursos ser dotada de alguma vantagem quando aplicada à engenharia genética. Entretanto, como há uma tensão no pensamento de Rawls entre o que Buchanan et al. denominaram de social structural view e brute luck view nem será tratado dessa distinção nem da distinção entre a igualdade de recursos e a justiça como equidade. Para explicitar a tensão é suficiente apenas enfatizar que, para Rawls, as desigualdades “imerecidas merecem reparação; e desde que as desigualdades de dotes naturais são imerecidas, estas desigualdades devem de alguma maneira ser compensadas” (Rawls 2000, p. 107). A teoria da justiça como eqüidade tem como objeto primário dos princípios de justiça a estrutura básica da sociedade, a saber, “ao modo como as principiais instituições distribuem direitos fundamentais e deveres e determinam à divisão de vantagens da cooperação social” (Rawls 2000, p. 7). Por causa disso, Buchanan et al. interpretaram a justiça como equidade como uma social structural view e não como uma brute luck view. Para estes, a brute luck teria vantagens em relação a social structural view, pois a segunda trataria de desigualdades em dotes naturais apenas na medida em que essas tivessem efeitos em nível das principais instituições da sociedade ao passo que a primeira poderia incorporar diretamente a dotação natural dentro da esfera de relevância e não apenas indiretamente. Entretanto, convém ressaltar que os dois mais ilustres defensores destas duas posições Rawls (social structural view) e Dworkin (brute luck view) compartilham aspectos essenciais em suas posições no que diz respeito às questões de justiça distributiva oriundas da engenharia genética. Tanto Rawls quanto Dworkin defendem que as vantagens oriundas do acesso diferencial a tecnologia não podem ser limitadas, caso desta limitação não resulte beneficio aos menos favorecidos (Rawls) ou para outros (Dworkin). Uma vez que, para Dworkin, o remédio “para a injustiça é a redistribuição, e não a recusa dos benefícios para alguns sem ganhos correspondentes para os outros” (Dworkin 2005, p. 628) assim como para Rawls “propor políticas que reduzem os talentos dos outros não traz vantagens para os menos favorecidos” (Rawls 2000, p. 115). Segundo Resnik, se a engenharia genética permitir exercer controle sobre a loteria natural (Resnik 1997), e assumimos que um dos objetivos mais importantes da justiça distributiva é a igualdade eqüitativa de oportunidades, então temos um forte argumento para manipular a loteria natural, a fim de promover a igualdade eqüitativa de oportunidades. Por conseguinte, é necessário expandir o escopo de atuação das teorias da justiça atuais para que possam lidar com os desafios resultantes deste avanço tecnológico. Resnik sugere que se compreenda a engenharia genética humana como um tipo de healt care, desde que ela pode ser usada para prevenir e curar doenças e afeta a saúde humana, porque compreendendo ela como um healt care é possível recorrer aos tipos de aplicação dos princípios da justiça às questões de saúde tal como fez
276
Charles Feldhaus
N. Daniels em seu livro Just Healt Care. Resnik reconhece fazer uso de muitos discernimentos de Daniels na construção de sua posição e entre os quais se incluem tratar healt cares como uma instituição social que distribui direitos, deveres e vantagens sociais e a noção de normal opportunity range. Para a noção de normal opportunity range é fundamental a de funcionamento típico da espécie, pois ela fornece um critério para diferenciar as intervenções que visam prevenir doenças das que visam promover outras metas sociais. Uma vez que doenças não podem ser entendidas apenas como desvios das normas sociais, dado que se relacionam com desvios da organização funcional natural de um membro típico da espécie. Essa noção pode ser útil a uma teoria da justiça que se volte para a engenharia genética, pois doenças podem colocar restrições moralmente arbitrárias as gamas de oportunidades e conferir desvantagens injustas. Todavia, Resnik e outros também reconhecem que a meta da promoção da igualdade de oportunidade é limitada pela escassez de recursos (Farrelly 2004, p. 22) e por isso reivindica a criação de um ranking em que alguns tipos de cuidados de saúde devem ser priorizados ou não em relação a gama de oportunidades normais. Para melhor delimitar os casos permitidos dos proibidos de intervenção genética, Resnik assim como Buchanan et al. também o fizeram, recorre à noção de funcionamento normal da espécie. Resnik distingue o sentido normativo do descritivo, pois uma teoria da justiça não pode apenas descrever o que a variação genética incluída no funcionamento normal consiste, mas deve também prescrever o que deveria ser tal variação e por isso ele apresenta três conceitos de normalidade genética que não pretendem ser nem exaustivos, nem excludentes: 1 – NS – normalidade da espécie – permite a máxima desigualdade e a única coisa proibida é criar novas espécies. Teorias da justiça na linha ralwsianas não endossariam NS. 2 – MMG – mínimo e máximo genético – admite diferenças genéticas, mas coloca condições. Teorias da justiça rawlsianas poderiam concordar. 3 – MG – mesma (dotação) genética – coloca muito peso no controle social e violaria o princípio da diferença, por isso uma teoria da justiça rawlsiana não poderia endossar. Resnik acredita ser possível tratar de MMG em termos de bens primários, e que embora possa não ser fácil definir uma gama aceitável ou ‘eqüitativa’ de variação genética, isso ainda é certamente preferível a não ter limite algum ou limites extremamente restritivos. Outros autores, por sua vez, sustentam que a engenharia genética suscitará grandes dificuldades para as teorias tradicionais da justiça. Para Farrelly (Farrelly 2002, p. 81–2), a engenharia genética complica dois aspectos principais da teoria da justiça de Rawls, a saber, é obscuro como definir os menos favorecidos, pois Rawls focou apenas na distribuição de bens primários sociais e não nos naturais e, além disso, bens primários sociais definem a pior posição somente em termos de renda e riqueza re-
Habermas, eugenia liberal e justiça social
277
lativa. Outro aspecto está relacionado em como conciliar os princípios que regulam a distribuição de bens naturais primários com a distribuição de bens sociais primários. Em outras palavras, como ponderar exigências simultâneas de diferentes partes da sociedade por bens primários (renda e riqueza) e bens naturais (inteligência e imaginação, por exemplo). Outro aspecto complicador é que muitos poderiam objetar a qualquer tipo de controle da tecnologia, pois ainda é viva a memória da eugenia praticada pelos nazistas e para alguns, entre os quais poderíamos incluir Ronald Dworkin, as decisões eugênicas estão relacionadas com um tipo de valor, independente ou intrínseco, que pertence a uma esfera dos assuntos privados dos individuais, na qual qualquer intrusão é considerada moralmente problemática. Mas, para Resnik (Resnik 1997), “as conseqüências de não exercer controle social ou governamental sobre a genética humana pode ser exatamente tão problemática, desde que os pais tentarão com toda probabilidade dotar seus filhos com vantagens genéticas, e o resultado em longo prazo pode ser o exacerbamento das desigualdades sociais e econômicas existentes e a criação de um sistema de castas genético”. Nicholas Agar, filósofo neozelandês, que muito influenciou a posição de Habermas em Die Zukunft der menschlichen Natur, também aborda questões de justiça social, particularmente como distribuir o acesso à tecnologia. Ele identifica dois tipos de polarização que poderiam resultar da engenharia genética, a saber, a polarização intrínseca (sobre a qual cai a ênfase de Habermas e Feinberg), que “pode ocorrer quando pessoas que acontecem preferir certo modo de vida fazem seus filhos diferentes dos outros de modos que permitem seus filhos melhor perseguir este modo de vida” (Agar 2004, p. 3). E a polarização resultante de acesso diferencial à tecnologia. Ao tratar desta última, ele considera importante prestar atenção à distinção entre dois tipos de bens. Pois, para ele, “tratar aperfeiçoamentos como bens que podemos ou não ser bem sucedidos em distribuir equitativamente ignora um aspecto em que eles diferem de outros bens que permitimos o mercado complacentemente mal alocar. Precisamos distinguir bens que permite a alguma pessoa vidas melhores de outros destes que fazem as pessoas diferentes das outras” (Agar 2004, p. 138). Agar ressalta que embora melhores tecnologias e tratamentos médicos tornem ricos diferentes de pobres, por exemplo, não tornam as pessoas tão diferentes a ponto de não poderem considerar-se mutuamente como membros da mesma comunidade, ou seja, a eugenia pode tornar as pessoas tão diferentes que até mesmo qualquer senso de solidariedade seja perdido. Agar sugere acesso universal a tecnologia como uma resposta efetiva à pretensa polarização extrínseca da eugenia liberal. Contudo, ele mesmo reconhece que é uma opção muito cara, por isso distingue uso de acesso, sustentando que pode não ser tão oneroso aos cofres públicos garantir apenas o acesso, mas não o uso de todos. Para Buchanan et al., certas suposições de nossas concepções de justiça tradicionais não se aplicam mais, pois a distribuição de bens não será mais limitada a pessoas cujas identidades são fixadas previamente ao ato de distribuição, a própria distribui-
278
Charles Feldhaus
ção de genes pode em parte determinar as identidades das pessoas. Deste modo, caso as promessas da engenharia genética se concretizem, as teorias da justiça tradicionais estarão operando com duas suposições incrivelmente obsoletas: 1) a distribuição das características com que as pessoas nascem são dadas e estão além do controle humano; 2) problema da justiça é distribuir bens entre pessoas particulares antecedentemente existentes (Buchanan 2000, 85–6). Para tratar deste problema, Buchanan sugere que precisamos aprender a pensar a justiça não como distribuição de bens entre pessoas, mas como incluindo a distribuição de características que constituem pessoas, de modo a assegurar oportunidades iguais a quaisquer que sejam as pessoas que venham a existir. Contudo, eles defendem que “são apenas aquelas desigualdades naturais que causam ou constituem pontos de partida adversos ao funcionamento normal da espécie que são preocupações de justiça” (Buchanan 2000, 98). Entretanto, eles reconhecem que se aperfeiçoamentos genéticos se difundirem, seria preciso “chegar a considerar uma pessoa que carece deles como sofrendo de um ponto de partida adverso ao funcionamento normal” (Buchanan 2000, 99). Portanto, para Buchanan et al., “aperfeiçoamentos podem ser não apenas permissíveis, mas obrigatórios, como uma questão de justiça” (2000, 96). Se bem que eles reconheçam que a busca de vantagens posicionais mediante aperfeiçoamento genético de alguns traços pode ser ou injusto ou contraproducente (2000, 155). Pois, se todos puderem realizar a intervenção, pode ser contraproducente e se apenas os mais ricos, esse tipo de vantagem parece injusta e exigiria reparação ou ao menos compensação. Entretanto, Kamm levante um problema fundamental, porém sistematicamente pouco discutido por estas tentativas de desenvolver teorias da justiça para lidar com estas questões ainda hipotéticas, a saber, que aquela sociedade que “engajar-se em alteração genética além das mudanças relacionadas com defeitos e excelências básicas socialmente acordadas” podem “violar a neutralidade liberal em relação às visões controversas sobre a vida boa” (Kamm 2002, 361).
3. Poderia Habermas ser compatibilizado com algumas destas abordagens da justiça distributiva? Como já observado, Habermas também está preocupado com a violação da neutralidade ética, contudo, afirma que a eugenia liberal suscita questões que colocam em xeque a autocompreensão normativa da modernidade e por isso recorre à ética da espécie. A moderação justificada na filosofia em questões de vida boa precisa ser abandonada quando está em jogo a moralidade como um todo. Além disso, para Habermas, a liberdade ética, cuja relevância é maior no debate acerca da eugenia liberal, não é a liberdade ética dos pais, ou a liberdade reprodutiva, pois o caso da eugenia liberal é distinto do debate a respeito do aborto. A liberdade ética afetada para ele é a liberdade ética do futuro indivíduo manipulado. Intervenções que ultrapassam a
Habermas, eugenia liberal e justiça social
279
eliminação de doenças não podem presumir o consentimento ou ao menos sempre é possível haver discordância entre as intenções dos genitores e do filho geneticamente manipulado. A ausência de certeza acerca da futura aceitação por parte do programado das intenções do designer implica um tipo de moderação e reconhecimento da finitude cognitiva no que diz respeito às questões agatológicas. Sem contar que a concepção normativa moderna parte da divisão entre questões de justiça e questões de bem ou vida boa, reservando a última à esfera privada da liberdade subjetiva do indivíduo. A eugenia que ultrapassa a lógica da cura atenta contra os pressupostos da moralidade, pois, segundo Habermas, a pessoa geneticamente manipulada seria incapaz de compreender-se como única autora de seu projeto racional de vida e como única responsável. Por conseguinte, para Habermas, qualquer tipo de intervenção que ultrapasse a lógica da cura deve ser proibido. É impossível presumir consentimento contrafactual no caso de intervenções genéticas que adentrem no germ-line enhancement. Contudo, isso não implica que para Habermas as intervenções genéticas não possam ser incluídas dentro dos bens oferecidos pelo Estado como bens primários naturais sociais. O Estado poderia distribuir esses bens na medida em que estes estivessem voltados a eliminar doenças que diminuem as vantagens competitivas. Além disso, mesmo dentro das doenças Habermas considera ser possível haver variação cultural, por isso cada sociedade deveria decidir os tipos de intervenções genéticas curativas permitidas e conseqüentemente os tipos de intervenções para as quais seria necessário algum tipo de compensação para garantir uma competição justa por renda e riqueza. Contudo, a decisão democrática somente poderia deliberar a respeito de intervenções curativas, pois as intervenções aperfeiçoadoras atentam contra os pressupostos da moralidade moderna liberal e contra a liberdade ética de futuro membro da comunidade moral. Nas palavras Prusak, um pensador simpático à estratégia habermasiana em Die Zukunft der menschlichen Natur: “Habermas nega, contrariamente a Agar e Buchanan et al., que possamos assumir legitimamente que uma pessoa possível consentiria até mesmo a ‘uma expansão dos recursos e a um nível mais alto de bens genéticos básicos” (Prusak 1997, 39). É possível traçar uma distinção geral entre estas tentativas de ampliação da esfera da justiça para lidar com a engenharia genética e a habermasiana atentando para o diferente tipo de polarização a que buscam atacar. Habermas está principalmente preocupado com a polarização intrínseca resultante da eugenia liberal, a saber, ele preocupa-se com a limitação das opções de vida ética oferecida a pessoa futura. Resnik, Buchanan e Farrelly preocupam-se com a polarização extrínseca ou resultante de acesso diferencial à tecnologia. Com isso, não se pretende defender que Habermas não se preocupa com a polarização resultante de acesso diferencial ou que não possa incorporar uma teoria da justiça distributiva para lidar com essas questões, mas apenas deixar claro que para Habermas a polarização intrínseca deve ser resolvida antes da polarização resultante de acesso diferencial. Essa priorização da polarização intrínseca, todavia, limita os tipos de polarização resultante de acesso diferencial
280
Charles Feldhaus
que Habermas pode procurar resolver. Ele somente pode incorporar, em função dessa priorização, uma expansão dos bens primários que não inclua aperfeiçoamento genético nesta esfera, porque aperfeiçoamentos implicariam no seu entender um tipo de polarização intrínseca.
Referências Agar, N. 2004. Liberal Eugenics. In Defence of Human Enhancement. Oxford: Blackwell Publishing. Buchanan, A. 2000. From Chance to Choice: Genetics and Justice. Cambridge: Cambridge University Press. Dworkin, R. 1993. Life’s Dominion. An Argument about abortion and euthanasia. Londres: Harper Collins. —–. 2000. Sovereign Virtue. The Theory and Practice of Equality. Cambridge: Hardard University Press. Farrelly, C. 2002. Genes and Social Justice: A rawlsian reply to Moore. Bioethics 16(1): 72–83 —–. 2004. The Genetic Difference Principle. The American Journal of Bioethics 4(2): 21–8. Habermas, J. 2004. O Futuro da Natureza Humana. Tradução de Karina Jannini. São Paulo: Martins Fontes. —–. 2001. Die Zukunft der menschlichen Natur. Auf dem Weg zu einer liberalen Eugenik? Frankfurt: Suhrkamp Verlag. Kamm, F. M. 2002. Genes, Justice, and Obligations to Future People. Social Philosophy & Policy Foundation 19(2): 360–88. Nozick, R. 1999. Anarchy, State and Utopia. Oxford: Blackwell Publisher. Prusak, B. G. 2005. Rethinking ‘liberal eugenics’: reflections and questions on Habermas on bioethics. The Hasting Center Report 35(nov-dec): 31–42. Rawls, J. 2000. Uma Teoria da Justiça. Tradução Almiro Pisetta e Lenita M. R. Esteves. São Paulo: Martins Fontes, —–. 2003. Justiça como Eqüidade. Uma Reformulação. Tradução de Claudia Berliner. São Paulo: Martins Fontes. Resnik, D. B. 1997. Genetic engineering and social justice: a rawlsian approach. Social Theory and Practice 23(3): 427–48.
A F ELICIDADE E O S ENTIMENTO DE P RAZER E D ESPRAZER EM K ANT É DISON M ARTINHO DA S ILVA D IFANTE Universidade Federal de Santa Maria
edisondifante@bol.com.br
A felicidade é fundamentalmente empírica, na medida em que depende dos desejos subjetivos determinados pelos sentimentos de prazer ou de dor. A produção do desejo é sempre contingente, pois é determinada por objetos empíricos. Nessa perspectiva, é impossível universalizar os desejos e determinar a felicidade. Isso significa afirmar que somente se o homem fosse um ser onisciente1 poderia especificar o que é a felicidade. Só um ser onisciente poderia conhecer o “todo absoluto”, na determinação da vontade, que garantisse para ao indivíduo um máximo de bem-estar, no “estado presente e em todo o futuro” (Kant 1995, p. 55). A felicidade, para o homem, não passa de um ideal impossível de ser estabelecido, já que se baseia em sensações e não em um princípio universal, a priori, válido para todos.2 A felicidade, com efeito, liga-se ao bem-estar, mais precisamente ao sentimento de prazer do sujeito subjetivamente considerado. A partir da sensibilidade, o homem só toma interesse por aquilo que lhe proporciona prazer. O sentimento de prazer, que é receptivo, faz com que o homem sofra diversos estímulos. O prazer proporcionado pela sensação provoca, no homem, um interesse que o conduz a produzir, pela faculdade de desejar, o objeto aprazível na efetividade da ação (Kant 2002, p. 37–8). O interesse, então, é satisfeito pelo objeto do desejo. O resultado é, em primeira instância, que o sentimento de prazer seja prático, isto é, que sirva de fundamento subjetivo de determinação do arbítrio. A base dos objetos do prazer está justamente no efeito que proporcionam ao ânimo. Esse efeito é meramente subjetivo, e tem a sua validade restrita ao sujeito afetado. É, portanto, no interesse empírico que se funda a necessidade de produção do objeto que sacia o prazer. A produção do objeto aprazível do desejo dá-se por meio da faculdade de desejar. A máxima produção do objeto aprazível do desejo chama-se, segundo Kant, felicidade. O prazer, com efeito, depende da representação de determinado objeto (e de sua efetivação ou produção), e da afecção do mesmo; portanto, diz respeito a uma faculdade passiva. Segundo afirma Kant, na Crítica da razão prática: O prazer decorrente da representação da existência de uma coisa, na medida em que deve ser um fundamento determinante do apetite por essa coisa, funda-se sobre a receptividade do sujeito, porque ele depende da existência de um objeto; por conseguinte ele pertence ao sentido (sentimento) e não ao entendimento, que expressa uma referência da representação a um objeto segundo conceitos, mas não ao sujeito segundo sentimentos. (Kant 2002, p. 37)
O prazer somente pode manifestar-se ao sujeito como um sentimento particular e subjetivo. O sentimento de prazer é prático, na medida em que “a sensação de agrado Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 281–285.
282
Édison Martinho da Silva Difante
que o sujeito espera da efetividade do objeto determina a faculdade de apetição” (Kant 2002, p. 38). Logo, não há sequer uma determinação, causada pelo objeto aprazível de desejo, que possa fundamentar ou dela surgir algum tipo de lei prática objetiva. Segundo consta na Antropologia de um ponto de vista pragmático,3 a dinâmica da vida humana é estabelecida a partir dos sentimentos de prazer e de dor. Existe uma espécie de jogo antagônico entre esses dois sentimentos. Esse antagonismo ocorre porque o prazer ou o “contentamento é o sentimento de promoção da vida; dor o de um impedimento dela” (Kant 2006, p. 128). Portanto, prazer e dor são sentimentos opostos, porque as suas respectivas implicações para a vida são opostas; desse modo, sentir prazer e dor em um único momento é algo contraditório. Ao iniciar o Livro Segundo da “Dialética Antropológica”, intitulado “O sentimento de prazer e desprazer”, Kant estabelece que esses dois sentimentos (prazer e dor) não são contraditórios em si, como proveito e falta de proveito, de tal modo que a dor seja algo neutro e o prazer o sentimento positivo (enquanto efeito sentido). Dessa forma, a dor não proporcionaria dinâmica alguma à vida, e os únicos sentimentos possíveis seriam prazerosos. Por isso, Kant vê a necessidade de mostrar que existe uma realidade lógica na oposição entre prazer e dor. Segundo ele: Contentamento é um prazer sensorial, e o que dá prazer ao sentido é agradável. Dor é desprazer por meio do sentido e o que a produz é desagradável. — Não estão um para o outro como ganho e falta (+ e 0), mas como ganho e perda (+ e -), isto é, um não é oposto ao outro meramente como contraditório (contradictorie s. logice oppositum), mas também como contrário (contrarie s. realiter oppositum) (Kant 2006, p. 127).
Segue-se, que um prazer não é necessariamente a ausência de dor e, sim, o seu oposto, ou seja, a sensação de não sentir dor. A dor, portanto, só pode ser um atributo realmente oposto ao prazer (Heck 1999, p. 176). O esclarecimento desses dois sentimentos (provocados nos sentidos) é proporcionado pelo efeito que a sensação de nosso estado causa ao ânimo (Kant 2006, p. 128). Kant diz o seguinte: O que me impele imediatamente (pelo sentido) a abandonar meu estado (a sair dele) me é desagradável — me é doloroso; do mesmo modo, o que me impele a conservá-lo (a permanecer nele) me é agradável, me contenta. (2006, p. 128)
A explanação anteriormente citada permite afirmar que, sempre, o prazer vai referirse à estabilidade, e o desprazer à instabilidade das sensações (Beck 1984, p. 93). Mais adiante (§76), Kant volta reforçar a mesma definição ao ressaltar, da seguinte forma, que: O sentimento que impele o sujeito a ficar no estado em que está, é agradável; mas o que o impele a abandoná-lo, desagradável. Ligado à consciência, o primeiro chame-se contentamento (voluptas); o segundo, descontentamento (taedium). (Kant 2006, p. 152).
A felicidade e o sentimento de prazer e desprazer em Kant
283
Com efeito, pode-se dizer que é na relação conflituosa entre os sentimentos de prazer e dor (desprazer) que os indivíduos conduzem suas vidas. O homem é incessantemente levado pelo fluxo do tempo e pela mudança de sensações a ele ligadas. Se bem que abandonar um momento e entrar em outro seja um mesmo ato (de mudança), ainda assim em nosso pensamento e na consciência desta mudança há uma sucessão temporal, conforme a relação de causa e efeito (Kant 2006, p. 128).
Os sentimentos de prazer e de dor, em analogia ao que se dá com (as categorias) causa e efeito, impõem à vida a atividade caracterizada pela mudança temporal das sensações recebidas. Essa atividade, ou dinâmica desses sentimentos, é o que impede a inércia da vida. O fluxo de tempo imprime na consciência do homem um tipo de causalidade como um devir (futuro vir-a-ser) e nunca ao passado (foi assim); isso resulta em uma mudança de estado do presente ao futuro. Mas o futuro é inseguro, incerto, porque é imprevisível. Nesse sentido a insegurança diante do prazer futuro ocorre inevitavelmente. Somente é possível determinar que, na mudança de estado, o que se impõe é a fuga da dor e não a espera de um prazer determinado. Caso exista esperança no prazer, ela não se baseará em um prazer determinado e certo, mas na possível agradabilidade provocada pela eliminação da dor. Na consecutiva alternância desses dois sentimentos, “antes de todo o contentamento tem de preceder a dor; a dor é sempre o primeiro” (Kant 2006, p. 128). A promoção da vida é garantida pelo sentimento de prazer. Todavia, se não existisse a dor, como anterior (no tempo), não haveria promoção da vida. Caso o prazer fosse o primeiro haveria regressão e não promoção da vida. “Pois que outra coisa se seguiria de uma contínua promoção da força vital, que não se deixa elevar acima de um certo grau, senão uma rápida morte de júbilo?” (Kant 2006, p. 128). O sentimento de prazer pode levar a um estado de inércia ou a um estado de inatividade. No caso da dor, isso não é possível, já que a dor é criadora de necessidades que obrigam o ser vivo a saciá-las, mantendo-o em atividade. É a partir dela, portanto, que surge a necessidade de mudança (Beck 1984, p. 93). Esses sentimentos, embora contrários, estão necessariamente interligados. Um contentamento tampouco pode seguir imediatamente a outro, mas, entre um e outro, tem de se encontrar a dor. São pequenos obstáculos à força vital, mesclados com incrementos dela, que constituem o estado de saúde, o qual erroneamente consideramos como sendo o sentimento de bem-estar; porque consiste unicamente de sentimentos agradáveis que se sucedem com intervalos (sempre com a dor se intercalando entre eles). A dor é o aguilhão da atividade e somente nesta sentimos nossa vida, sem esta ocorreria a ausência da vida. (Kant 2006, p. 128)
Na Antropologia, Kant passa a idéia de que a dor é fundamental na determinação das necessidades dos homens, visto que, se não fosse pela dor, nada poderia provocar insatisfação. Logo, sem dor, não haveria a necessidade e nem o interesse pela
284
Édison Martinho da Silva Difante
felicidade (enquanto satisfação empírica). Em adição, na ausência da dor, não haveria interesse algum na satisfação, pois a própria satisfação não existiria. Dessa forma, seria impossível sentir prazer. Em última instância, não seria possível sentir a própria vida.4 O tédio é um estado insuportável, principalmente se considerada a possibilidade hipotética de os prazeres serem alcançados ou produzidos em grau máximo. O grau máximo de prazer é impossível de ser alcançado; caso o fosse, a dinâmica da vida estagnar-se-ia. O prazer contínuo, sem movimento algum, ou seja, sem dinâmica, leva o homem necessariamente ao tédio. Portanto, os prazeres em excesso conduzem à estagnação da vida, ou até mesmo a algo pior. Kant apresenta o seguinte exemplo a esse respeito: Essa pressão ou impulso que se sente, de abandonar todo o momento em que nos encontramos e passar ao seguinte, é acelerada e pode chegar à resolução do pôr fim a própria vida, porque o homem voluptuoso tentou prazeres de toda espécie e nenhum mais é novo para ele; (. . . ). — O vazio de sensações que se percebe em si provoca horror (horror vacui) e é como que o pressentimento de uma morte lenta, considerada mais penosa que aquela em que o destino corta repentinamente o fio da vida. (Kant 2006, p. 130)
Um estado de volúpia máxima torna-se entediante por não mais provocar necessidade alguma no indivíduo. Com efeito, Kant recomenda moderação com relação aos sentimentos (Borges 2003, p. 204). “A alegria em excesso (não moderada por nenhuma apreensão de dor) e a tristeza profunda (não amenizada por nenhuma esperança), o abatimento, são afecções que ameaçam a vida” (Kant 2006, p. 152). O indivíduo perde todo o interesse por novas sensações. Além disso, Kant constata que “mais seres humanos perdem subitamente a vida por alegria do que por tristeza profunda, porque a mente se abandona inteira à esperança, como afecção, quando inesperadamente se abre a perspectiva de uma felicidade sem limites” (Kant 2006, p. 152). Por isso, pelo que afirma Kant, o sentimento de dor exerce uma maior relevância, visto que, sem ele o tédio acabaria com a vida. Sentir a vida e “sentir contentamento não é, pois, nada mais que se sentir continuamente impelido a sair do estado presente” (Kant 2006, p. 130). A sensação do estado presente, no qual o sujeito se encontra, pode estar envolvido em um prazer contínuo. Não obstante, a vida impulsiona o sujeito a quebrar a continuidade da sensação prazerosa, fazendo incidir sobre ela um sentimento de dor. Por isso, Kant concebe a vida como uma atividade de busca de prazer e fuga da dor. De fato, esse parece ser o movimento que caracteriza a vida. Assim, Kant parece justificar o prazer em contraposição à dor, pois é a dor (ou o desprazer) que garante o avanço da força vital, que evita a estagnação da vida.
A felicidade e o sentimento de prazer e desprazer em Kant
285
Referências bibliográficas Beck, L. W. 1984. A commentary on Kant’s Critique of Practical Reason. Chicago: University of Chicago Press. Borges, M. L. 2003. Felicidade e beneficência em Kant. Síntese, Belo Horizonte, 30(97): 203–15. Heck, J. 1999. O princípio do amor-próprio em Kant. Síntese, Belo Horizonte, 26(85): 165–86. Kant, I. 1995. Fundamentação da metafísica dos costumes. Trad. Paulo Quintela. Lisboa: Edições 70. —–. 1996. Crítica da razão pura. Trad. Valério Rohden e Udo Baldur Moosburger. São Paulo: Nova cultural. —–. 2002.Crítica da razão prática. Trad. Valério Rohden. Baseada na edição original de 1788. São Paulo: Martins Fontes. —–. 2006. Antropologia de um ponto de vista pragmático. Trad. Clélia Aparecida Martins. São Paulo: Iluminuras. Martins, C. A. 2006. Introdução à Antropologia. In Kant 2006, pp. 11–7.
Notas 1 Uma qualidade onisciente diz respeito a quem sabe tudo, cujo saber é ilimitado, ou seja, onisciente é
quem tem um conhecimento ou saber total (o saber de Deus). 2 Kant afirma, na Crítica da razão pura, que “a felicidade consiste na satisfação de todas as nossas inclinações” (Kant 1996, p. 393), portanto, algo puramente pessoal e incomunicável. Com efeito, ela pode ser concebida e manifesta de diversos modos, e a vontade do homem, em sua relação, não é possível de ser reduzida a um princípio comum válido para todos. Princípios empíricos são subjetivos e contingentes, logo, a posteriori, e relacionam-se com as mais variadas finalidades; e a satisfação baseada em princípios empíricos não é outra coisa senão a felicidade. 3 Na Antropologia de um ponto de vista pragmático, Kant trata, entre outras coisas, do conhecimento referente ao humano, isto é, do homem enquanto cidadão do mundo. Segundo ele, “uma doutrina do conhecimento do ser humano sistematicamente composta (antropologia) pode ser tal do ponto de vista fisiológico ou pragmático” (Kant 2006, p. 21). O conhecimento fisiológico do homem tende à explicação de que ele é o que a natureza faz dele; o conhecimento pragmático é referente ao homem, enquanto ser de livre atividade, que faz ou pode fazer de si mesmo o que quiser. A Antropologia não corresponde “a uma função sistemática de mediação entre liberdade e natureza do homem, porque nela não há uma exposição das leis morais sob as condições subjetivas da natureza humana, o aspecto decisivo desta obra só pode ser compreendido se ela for considerada a partir da Crítica da razão prática” (Martins 2006, p. 13–4). 4 Na Antropologia, Kant escreve o seguinte: “Por fim, ao menos uma dor negativa afetará freqüentemente aquele que uma dor positiva não incita à atividade, o tédio, como vazio de sensação, que o homem habituado à mudança desta percebe em si quando se esforça em preencher com ela seu impulso vital, e o afetará em tal medida, que se sentirá impelido a fazer antes algo que o prejudique, a não fazer absolutamente nada” (Kant 2006, p. 129–30).
N ORMATIVIDADE A PARTIR DE S OCIALIZAÇÃO E I NDIVIDUALIZAÇÃO : P ROXIMIDADES ENTRE H EGEL E H ABERMAS E RICK C. DE L IMA UNICAMP/FAPESP
ericklima74@hotmail.com
Peter Dews defende que, se uma preocupação fundamental da teoria discursiva do direito e do modelo deliberativo de democracia é a perda de solidariedade nas sociedades modernas, Habermas teria de olhar, para além da explicitação do engate sociológico-normativo dos direitos subjetivos e da democracia deliberativa, na direção do possível revigoramento desta solidariedade; pois, para ele, autonomia legal e política são apenas, no máximo, condições necessárias, mas não suficientes para isso (Dews 1993). Já William Outhwaite acredita que a teoria habermasiana do direito se ressinta de uma investigação acerca de formas de solidariedade social que possam ser desenvolvidas no quadro de um mundo gradativamente mais globalizado e, ao mesmo tempo, fragmentado. Pois, para Outhwaite, ainda que o intento sistemático da obra de Habermas tenha mostrado como os elementos dispersos do pensamento jurídico-político podem ser trazidos a um arcabouço comum, escapou-lhe um enfoque mais detido sobre o fato de que as importantes formas institucionais explicitadas repousam sobre processos mais informais no interior da sociedade civil (Outhwaite 1994). Pretendo aqui revisitar parte da produção de Habermas que se conecta ainda com o horizonte temático mais amplo, proposto pela Teoria do Agir Comunicativo, antes de seu “direcionamento jurídico” na década de 1990. O objetivo desta incursão é indicar, ainda que de maneira preliminar, a possibilidade de uma assimilação construtiva de colocações como aquelas que são feitas acima. O fio condutor será um certo alinhamento entre Habermas e a filosofia do jovem Hegel, o qual reside na conexão entre a normatividade e os processos de socialização e individualização. Justamente porque esta conexão constitui o preâmbulo também para a “ênfase jurídica” da teoria do agir comunicativo, minha suspeita é que tal direcionamento deixe ainda intocados determinados potenciais heurísticos da ética do discurso para a teoria social. Neste itinerário, terei também de recorrer a trabalhos que procuram focar os nexos sócioindividualizantes do conceito hegeliano de reconhecimento. Primeiramente, pretende-se uma rápida consideração do problema da intersubjetividade em Hegel, bem como expor as diretrizes gerais de nossa interpretação desta temática, expostas alhures (Lima 2006, 63ss). Em seguida, vou considerar a assimilação, por parte de Habermas, de uma conexão entre a validez normativa e os processos societários, o que, tal como tenciono, servirá, futuramente, à investigação de alternativas à complementação da “guinada jurídica”.
Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 286–305.
Normatividade a partir de socialização e individualização
287
1. Notas sobre o problema da relação entre eticidade e intersubjetividade na obra de Hegel Muito se tem falado atualmente de como os textos postumamente publicados de Hegel sobre filosofia prática e ética, produzidos em Jena anteriormente à Fenomenologia e posteriormente ao Artigo sobre o Direito Natural, conteriam um enorme potencial em pontos de vista que não somente não teria sido aproveitado pela forma definitiva da “filosofia do espírito objetivo”, como ainda teriam sido deslocados a um plano secundário. Já há alguns anos a originalidade e o potencial da teoria da eticidade desenvolvida por Hegel em textos como o Sistema da Eticidade e os Esboços de Sistema de Jena vêm sendo reivindicados pelo “pensamento pós-metafísico” para o revigoramento da “filosofia prática” e “teoria da justiça” — e isto justamente numa direção em que se realça o desvirtuamento das intuições jenenses pela subordinação da exposição sistemática da eticidade à auto-reflexividade do espírito. No trabalho que delimita as intuições embrionárias de sua teoria da ação comunicativa, Habermas já alertara, a respeito principalmente das “potências” constitutivas do espírito no esboço de 1803/1804, que Hegel “pôs como fundamento para o processo de formação do espírito uma sistemática peculiar, que fora depois renunciada.”(Habermas 1974, p. 786–7) Para o Habermas deste texto seminal, a diferença fundamental em relação à sistemática definitiva da filosofia prática hegeliana está em que, nos Esboços, não é o espírito no movimento absoluto de reflexão de si mesmo que se manifesta, dentre outros, também na linguagem, no trabalho e na relação ética, mas antes a conexão dialética de simbolização lingüística, trabalho e interação que determina o conceito de espírito. (Habermas 1974, p. 786)
É justamente esta conexão dialética entre o trabalho, o reconhecimento e a mediação lingüística que Habermas lamenta ter sido perdida no desenvolvimento subseqüente do sistema com a substituição da mesma pelo processo de formação auto-reflexiva de um espírito “solitário”, o qual recobra, tanto nas instituições político-jurídicas e sociais, quanto na arte, na religião e na filosofia, apenas os elementos de sua autoprodução. Paradoxalmente, entretanto, Habermas entende que é a relação do espírito a seu outro, plasmada segundo o modelo do reconhecimento de si mesmo, isto é, a transformação da relação ética em célula do sistema, que representa o estopim desta reviravolta (Habermas 1974, p. 807ss). Como se sabe, a posição de Habermas foi extremamente influenciada pela intenção fundamental de revisar o materialismo histórico de Marx — e sua tendência à “absolutização” do processo de reprodução material como elemento sócio-determinante — através do resgate da alternativa hegeliana de aglutinar à “potência do instrumento e do trabalho”, ao agir instrumental, o valor próprio das relações intersubjetivas e da mediação lingüística como elementos irredutíveis do espírito e, por conseguinte, momentos imprescindíveis para a formação de identidade estável do eu, para a integração social e para a reprodução cultural.
288
Erick C. de Lima
Para meus propósitos aqui convém notar que, na filosofia do espírito de Jena, Hegel tornou o modelo de interação social, assimilado a partir de Fichte, a base para sua teoria social e política, fundamento para a constituição processual de seu conceito de Espírito do Povo. A originalidade atribuída à teoria jenense da eticidade gravita em torno de dois temas relacionados: por um lado, a compreensão da intersubjetividade, desenvolvida como parte integrante de sua filosofia social de Jena pela via do conceito de reconhecimento; por outro lado, o tratamento coeso daquilo que, nas Grundlinien, teria sido separado em direito abstrato, moral e eticidade — e novamente, segundo uma estrutura tripartida, nas esferas pelas quais se desenvolve a eticidade —, de maneira que sua conexão interna e interdependência, mais visível em Jena, teria sido perdida e apenas a impressão de uma sobreposição de esferas independentes teria restado. Na esteira da inovadora interpretação fornecida por Ludwig Siep,1 para o qual o conceito jenense de reconhecimento conecta ética, política, moral e direito, propiciando, pela superação da distinção entre filosofia política clássica e moderna, uma renovação da filosofia prática, também Roth interpreta, mais recentemente, a sistemática definitiva da filosofia hegeliana como desvirtuamento desta integração.2 Os textos não publicados de Jena vinculam a realização social do espírito à socialização ativa dos indivíduos, os quais, ao reconstituírem a partir de sua individualização uma unidade político-estatal, engendram as normas e instituições que dão corpo à autoconsciência universal e ao espírito do povo. O procedimento hegeliano nestes textos se caracterizaria, sobretudo, pela gênese das relações concretas, costumes e normas que mediatizam a vida social a partir do intercâmbio social dos indivíduos, ao passo em que as Grundlinien perseguiriam o processo de efetivação do espírito de uma maneira destacada da práxis social, isto é, como sucessão de figuras derivadas exclusivamente da “lógica” do desenvolvimento imanente do espírito universal, compreendido de maneira solitária, de forma que o agir e querer dos indivíduos nada mais constitui do que um pressuposto. Em face da filosofia de Jena, a submissão da eticidade ao movimento de auto-reflexão de um einsamer Geist acarreta uma perda de conexão entre as esferas que possa convencer sem a pressuposição do conceito tardio de espírito e da lógica especulativa (Honneth 2001). As conseqüências da tese habermasiana do desvio de Hegel em relação a suas intuições primevas, especialmente da perda de importância da intersubjetividade para a filosofia social, foram estabelecidas por Theunissen,3 o qual, num exame acurado das Grundlinien, mostrou que, em sua filosofia social madura, Hegel “reprimiu” todas as formas de intersubjetividade, alocadas no “espírito subjetivo”, na constituição da realidade sócio-política (Theunissen 1992). Theunissen associa a eliminação e repressão do tema “intersubjetividade” na Filosofia do Direito a uma subordinação ao modelo substancialista de eticidade e, portanto, a um alinhamento excessivo com a filosofia política antiga em detrimento de uma aproximação com a filosofia política moderna, o que, para ele, só se processa na opção por um conceito solipsista e individualista de vontade na introdução das Grundlinien.4 Entretanto, o fato de que
Normatividade a partir de socialização e individualização
289
Theunissen não chegue, dentro de seu próprio argumento, a uma conclusão acerca do alinhamento moderno ou antigo de Hegel, sugere que é preciso cautela na avaliação da posição hegeliana. Para Hegel, nenhuma das duas alternativas é satisfatória, e ele procurará construir seu pensamento político de forma a integrar ambas as visões (Müller 1998): os antigos suprimem a liberdade subjetiva, e os modernos procuram fundamentar a ética e a política na liberdade subjetiva do indivíduo, o que resulta em formalismo e individualismo. O projeto hegeliano é uma tentativa de mediação entre estas alternativas, e o seu conceito de espírito não pode ser reduzido nem à substância ética abstrata dos antigos, nem à subjetividade monológica e individualista da modernidade: tratase de uma alternativa intersubjetiva, que prima pela noção de um descentramento da subjetividade auto-referente (Lima 2007, p. 23ss).5 Mesmo ao se apelar à Enciclopédia, pode-se ver que a inovação terminológica hegeliana Geist denota justamente uma ampliação da subjetividade como resultado do reconhecimento de si no outro, o descentramento do sujeito transcendental individual que traz tanto a possibilidade de uma vida destrutiva, como também a possibilidade de uma ampliação da liberdade no contexto ético da comunidade. É neste ambiente teórico, ainda que subordinado a ditames sistemáticos, que Hegel compreende as instituições da eticidade como condições da auto-realização da liberdade no mundo. Obviamente, não se pode ignorar que, sob ditames sistemáticos específicos, as Grundlinien escamoteiam o papel vital das relações intersubjetivas na gênese dos momentos de efetivação “comunitária” da liberdade, ainda mais quando o primado do auto-desdobramento da singularidade da idéia de liberdade em sua universalidade supra-individual desemboca na efetividade da idéia ética como estado e parece destruir, assim, a possibilidade de uma constituição da vontade universal e efetiva a partir da sobreposição de níveis diferenciados de relações intersubjetivas (Honneth 1992). Entretanto, a questão que se põe é se, apesar dos imperativos metodológicos engendrados pelo projeto enciclopédico de Hegel, as Grundlinien permitem um resgate daqueles nichos de intersubjetividade deslocados pela primazia do desdobramento da singularidade conceitual da liberdade.6 Uma intuição que nos parece poder revelar como os momentos intersubjetivos de constituição do espírito objetivo podem se tornar ainda significativos para a compreensão sócio-filosófica da profundidade do insight hegeliano, é justamente a percepção, auxiliada pelo exame dos escritos “pré-fenomenológicos” de Hegel (Lima 2006, p. 67ss), da relação dialética entre uma compreensão “solidária e não-excludente” da intersubjetividade e uma concepção negativa e limitativa da relação intersubjetiva.7 A “ambivalência” do estatuto supra-individual da efetivação do conceito de direito (Müller 2003) poderia assim ser compreendida de maneira que o conteúdo formado pelas relações intersubjetivas que fazem a mediação das configurações comunitárias do espírito objetivo não se esgotasse na sua subordinação ao movimento da substância ética enquanto sujeito. Desta maneira, procurando perceber como este conteúdo de relações intersubjetivas se revela no conflito entre os dois paradigmas de inter-
290
Erick C. de Lima
subjetividade, poder-se-ia sustentar a tese de que o ponto de intersecção do que, nas Grundlinien, é compreendido como uma superposição de esferas sem uma ligação profunda (Roth 2002) está no projeto de institucionalização social de forças sóciointegrativas ou centrípetas, isto é, efetivação social de nichos de intersubjetividade solidária que possam fazer frente ao movimento centrífugo de uma intersubjetividade limitativa, excludente e desagregadora, modelo de intersubjetividade que, entretanto, tem sua gênese histórica determinada pelo processo de modernização e de intensificação da liberdade subjetiva e dos direitos individuais. A partir de Jena, a eticidade moderna passa a ser compreendida conceitualmente como processo de institucionalização normativa de níveis de intersubjetividade capazes de amortecer o processo de “individualização” decorrente da “modernização”. Sem dúvida deve ser levada em conta a realização limitada deste processo nas Grundlinien, o qual se realiza sob os preceitos da auto-efetivação da singularidade espiritual absoluta (Müller 2003). Entretanto, poder-se-ia ainda conferir ao intento hegeliano seu poder normativo e sua atualidade pela percepção do jogo entre estas concepções de intersubjetividade. A percepção que, a partir do desenvolvimento da concepção hegeliana de eticidade em Jena, parece encontrar sua plena ressonância na filosofia política tardia, quando posta sob a forma da relação dialética entre dois modelos de intersubjetividade, diz respeito à insuficiência da regulamentação social pela via exclusiva de princípios universais e abstratos de um paradigma jurídico-moral de justiça, pois o direito privado e sua garantia dos direitos individuais à liberdade e à proteção da propriedade privada maximiza o individualismo e a atomização que ameaça as sociedades modernas com a sombra da desintegração social. Somente se se observa a antecipação do reconhecimento pelo estado da dignidade do singular numa intersubjetividade integradora e solidária entre os indivíduos, somente assim se faz justiça à idéia do universal ético como imanente à vida social, como unidade originária que emana da multiplicidade.
2. Normatividade a partir dos processos de socialização e individualização: reflexões a partir de Hegel e Habermas Habermas demonstrou, recentemente, não partilhar da posição de Honneth de que os esboços de sistema de Jena, embora continuem a manter a força de seu viés socializador, sacrifiquem seu nexo individualizante com a adesão à teoria da consciência e o conseqüente afastamento em relação ao ponto de partida aristotélico do System der Sittlichkeit (Habermas 1999). Segundo Honneth, a progressiva intensificação dos laços sócio-integradores possui como contrapartida um processo de individualização e sofisticação da relação a si do eu, o que ocorre graças à prévia imersão do indivíduo no estofo originário de relações comunicacionais que caracteriza a eticidade natural.8 Honneth acredita que Hegel teria compensado sua adesão à teoria da consciência com uma renúncia ao intersubjetivismo em sentido forte que residia no recurso ao
Normatividade a partir de socialização e individualização
291
ponto de partida “teórico-comunicativo” aristotélico.9 Já Habermas estabelece, partindo de Hegel, uma vinculação das mais importantes entre a normatividade e os processos de socialização e individualização. Para Habermas, o que notabiliza a concepção hegeliana do eu em face dos seus predecessores idealistas é justamente sua compreensão do mesmo, plasmada pela estrutura lógicoespeculativa do conceito, como unidade imediata de universalidade e singularidade, pela qual Hegel vai além do eu kantiano enquanto unidade originária da apercepção, que representa a experiência, fundamental para a filosofia da reflexão, da identidade do eu na auto-reflexão, a auto-experiência do sujeito cognoscente proporcionada por sua capacidade de absoluta abstração (Habermas 1974, p. 790).Este conceito de unidade espiritual permite que os singulares se identifiquem uns com os outros e, ao mesmo tempo, percebam-se como não idênticos. A percepção originária de Hegel consiste em que o eu enquanto autoconsciência somente pode ser compreendido quando é espírito, isto é, quando ele passa da subjetividade à objetividade de um universal, em que, sobre a base da reciprocidade, os sujeitos que se sabem como não idênticos são unificados. (Habermas 1974, p. 790)
Habermas relaciona este conceito de unidade espiritual justamente a dois momentos: o momento da normatividade intersubjetivamente engendrada e o momento dos processos de socialização e individualização. Sobre a primeira conexão, diz Habermas: porque Hegel compreende autoconsciência a partir da conexão interativa do agir complementar — a saber, como resultado de uma luta por reconhecimento —, ele percebe o conceito kantiano da vontade autônoma . . . como uma abstração peculiar da relação ética dos singulares que se comunicam. (Habermas 1974, p. 794)
Esta conexão da unidade espiritual com a idéia de uma normatividade intersubjetivamente engendrada, a relação ética, torna-se extremamente importante para as premissas da teoria da ação comunicativa e, na medida em que é capaz de corrigir, por assim dizer, o “fundamentalismo” de uma ética de tipo kantiano, também para a concepção originária da ética do discurso.10 Ainda no texto de 1968, Habermas expõe, partindo da acepção hegeliana da autoconsciência como unidade de universalidade e singularidade e se baseando em Divisão do Trabalho Social de Durkheim, uma conexão unívoca entre os processos de socialização e de individualização.11 Habermas mantém esta conexão bastante firme, pois, no texto sobre Hegel de 1999, comenta que a compreensão pós-mentalista, alcançada por Hegel na teoria dos media do Esboço de Sistema 1803/04, de que o sujeito cognoscente está, enquanto espírito, desde sempre junto de seu outro, articulase “nas reflexões contemporâneas . . . sobre a individualidade das pessoas agentes e de seus contextos de ação.” (Habermas 1999, p. 188) Os seres humanos constroem ou formam (ausbilden) sua individualidade em formas de vida culturais, adquirindo
292
Erick C. de Lima
uma específica auto-compreensão como pessoas “que como eu e outro, ego e alter, entram em relações uns com os outros e, ao mesmo tempo, formam comunidades na consciência de sua absoluta diversidade.”(Habermas 1999, p. 199) Habermas sustenta que, ao compreender a intersubjetividade como cerne da subjetividade, Hegel descobre também “as conseqüências subversivas que a inicialmente imperceptível decisão mentalista de identificar o sujeito cognoscente com o eu traz consigo.” (Habermas 1999, p. 199) Para Habermas, para além de uma perspectiva objetivante, a identidade da pessoa depende também da maneira como ela se identifica da perspectiva de uma primeira pessoa, isto é, levando em conta, ela própria, sua história de vida insubstituível. Entretanto, prossegue Habermas, isto não quer dizer que a pessoa não exija das outras, apelando à sua própria história de vida, ser universalmente reconhecida como este indivíduo impermutável. Este caráter individual de pessoas falantes, que se comunicam umas com as outras e que agem, se reflete, de certa maneira, também nas formas de vida culturais e práticas que ela compartilha com outras. Hegel conheceu o desafio filosófico que reside nestes fenômenos. (Habermas 1999, p. 199)
Eis porque Habermas considera que Hegel tenha sido o arauto da intuição que ele mesmo desenvolveu mais tarde em um outro contexto: todos os fenômenos históricos têm maior ou menor participação na estrutura dialética das relações de reconhecimento recíproco, nas quais pessoas são individualizadas pela socialização (Vergesellschaftung).12
Habermas entende que o teor filosófico inovador da teoria hegeliana do reconhecimento reside na possibilidade de reconduzir à unidade de um processo dialético os “impulsos” para a socialização e para a individualização, os quais, na tradição “mentalista” — e sobretudo em sua guinada transcendental — aparecem irrelacionados como os princípios da pessoa em geral e do indivíduo impermutável. “Todavia”, diz Habermas, eu somente adquiri esta auto-compreensão como pessoa e como indivíduo por meio de que eu cresci em uma determinada comunidade. Comunidades existem essencialmente na figura de relações de reconhecimento recíproco entre membros. A partir desta estrutura intersubjetiva da comunitarização (Vergemeinschaftung) de pessoas individuais, Hegel se deixa guiar na explicação lógica do conceito de “universal concreto” ou de “totalidade”. (Habermas 1999, p. 200)
Remete à teoria hegeliana do reconhecimento a correlação do diagrama da lógica aristotélica, principalmente com a percepção historicamente suscitada do momento da singularidade como ser humano perfeitamente individualizado, às três perspectivas sob as quais os indivíduos socializados se reconhecem reciprocamente, a saber: como pessoas em geral, que equivalem a todas as outras pessoas em pontos de vista essenciais; como membro particular, os quais compartilham peculiaridades de sua comunidade de origem; e como indivíduos, que se diferenciam de todos os indivíduos restantes. (Habermas 1999, p. 200)
Normatividade a partir de socialização e individualização
293
A justificativa do nosso fio condutor se estabelece pela intensificação da conexão, na obra habermasiana nas décadas 1980 e 1990, entre os processos de individualização e socialização, por um lado, e a relação entre a eticidade e o ponto de vista moral, por outro. Na tentativa de fundamentação da ética do discurso, tanto Habermas quanto Apel (1986) se beneficiam de elementos que remetem, em última instância, ao debate hegeliano-kantiano entre eticidade e moralidade. Em geral, Habermas determina a relação entre moralidade e eticidade — ou entre a prática comunicativa reflexiva (discurso) e a prática comunicativa cotidiana — dizendo que o ponto de vista moral, a ser fundamentado discursivamente, não se relaciona a questões práticas no sentido em que Hegel esperava ter criticado a ética kantiana, isto é, no que concerne à produção de normas ou conteúdos éticos, mas sim no sentido da tematização de problemas éticos surgidos diretamente do contexto comunitário e que tornam inviável a coordenação das ações na comunicação cotidiana.13 Desta maneira, ao serem tematizadas moralmente as questões práticas deixam de ser consideradas do ponto de vista da manutenção de uma forma de vida particular ou da persecução de histórias de vida particulares. Quer em sua gênese histórica, quer na ontogênese, a moral pós-convencional tematiza os problemas surgidos nos contextos socializadores e individualizadores do mundo da vida com respeito às orientações para o agir que já não podem contar com o endosso inquestionavelmente válido da herança cultural. Em princípio, tanto Kant, quanto Habermas e Apel escapam à principal crítica hegeliana, pois recorrem a uma racionalidade prática de tipo procedimental, capaz de examinar normas já existentes. Para Habermas, o discurso prático é isomórfico em relação à própria racionalidade comunicativa pela qual os sujeitos coordenam suas ações cotidianamente, de maneira que passa a se referir a acordos normativos perturbados como sendo a situação de partida a fornecê-lhe elementos conteudísticos. Com efeito, a atitude hipotética à qual se alça o sujeito que julga moralmente, embora possa colocar sub judice uma totalidade de relações intersubjetivas reguladas de modo supostamente legítimo, não elimina o nexo entre ações e normas problemáticas e o contexto em que elas são intersubjetivamente engendradas. Esta continuidade entre a eticidade e a moral implica em uma certa relação entre normatividade e os processos de individualização e socialização, pois o ponto de vista discursivo não pode acarretar a ruptura com a totalidade comunicativa dos processos pelos quais determinados sujeitos se socializaram e formaram suas identidades individuais. Sendo assim, é justamente na relação entre a normatividade discursiva e os processos formadores de uma unidade social e de identidades individuais determinadas que se deixa precisar a herança hegeliana em Habermas. Histórica ou ontogeneticamente, o ponto de vista moral e a atitude hipotética frente a normas tornadas problemáticas, a qual se sedimenta em juízos morais e em ações conformes aos mesmos, dependem de que processos de socialização e individualização, processos intersubjetivos que tecem a rede de relações da eticidade de uma forma de vida, têm de ter podido torná-los aptos a se deslocar do estofo tradicional que responde pelas ob-
294
Erick C. de Lima
viedades normativas. Deste modo, o projeto habermasiano de resgatar, em meio ao debate entre defensores da ética formalista e céticos morais vinculados ou não a posições neoaristotélicas, a univocidade do ponto de vista moral, bem como a possibilidade de julgar inequivocamente a “racionalidade de uma forma de vida”, aponta para uma investigação de padrões racionais de socialização e individualização. Para além da “desestabilização” da fusão operada no mundo da vida entre a validez normativa e factual, a atitude hipotética implícita no ponto de vista moral decompõe a prática comunicativa em normas e valores, em elementos cuja justificação moral pode ser examinada e problematizada, por um lado, e elementos intersubjetivamente gerados no processo de socialização/individualização cuja tematização moral é indisponível e que se vinculam aos âmbitos individuais ou coletivos de autorealização. No entanto, Habermas compreende que a contrapartida deste processo histórico e/ou ontogenético de diferenciação ocasionado pelas operações abstrativas da moral pós-convencional, pelo qual se intensifica a racionalidade da tematização de questões normativas, é o eventual desligamento do agir com base em juízos morais de motivações empiricamente eficazes, como aquelas que se ligam diretamente à valoração intersubjetivamente gerada no quadro de uma eticidade concreta. Habermas se volta, então, à questão de pensar como pode ser compensada a descontextualização da moral universalista no sentido de uma vinculação da motivação racional com as atitudes empíricas eficazes. Em textos da década de 1980, antes de ser conduzido à investigação do direito positivo como medium pós-convencional capaz de (re)estabilizar a tensão entre validez normativa e validez social, Habermas parece ter uma visão mais abrangente de como processos de socialização e individualização poderiam colaborar para a determinação das possibilidades de formas da vida concretas fomentarem não somente o ajuizamento moral de normas vigentes, mas, sobretudo, as tomadas de atitudes em conformidade com eles. Se, por um lado, no contexto de sua fundamentação teóricodiscursiva do direito, Habermas persegue a explicação do surgimento de uma integração social sob condições de uma socialização instável (Habermas 1997, p. 39); por outro lado, ao se debruçar sobre questões relativas à avaliação da racionalidade de uma forma de vida, isto é, sua capacidade de tornar convicções morais efetivas na prática, Habermas define dois eixos supra-individuais em torno dos quais uma forma de vida pode contribuir à “compensação do déficit prático” gerado pelo ponto de vista moral: por um lado, o problema cognitivo de aplicação de princípios universais; por outro lado, “o problema motivacional de encaixe de um procedimento de justificação moral no sistema da personalidade” (Habermas 1991, p. 85). Para Habermas, a eficácia prática do processo discursivo de exame de validez de pretensões normativas se deixa aferir somente na transformação das condições de vida dos próprios participantes, bem como na sua capacidade de impulsioná-los a uma melhor aplicação de conteúdos normativos previamente criticados, aplicação mediatizada por processos de aprendizagem. Portanto, segundo o primeiro aspecto supra-individual de colaboração de uma forma de vida à efetivação de conteúdos
Normatividade a partir de socialização e individualização
295
normativos universalistas, Habermas vincula a aplicação eficaz e moralmente coerente de princípios universalistas à ancoragem de processos de aprendizagem14 em um quadro institucional pós-convencional. No que concerne à questão do encaixe motivacional de princípios universalistas no sistema da personalidade, Habermas parece deixar em aberto, para além da introdução do direito no rol das investigações da teoria do agir comunicativo, que a proteção de uma socialização exitosa também aponta para outros elementos ligados a processos de individualização. Para Habermas, a perda do caráter inquestionável das orientações normativas compostas de evidências culturais pode ser compensada por um sistema de controle interno de comportamento, capaz de responder positivamente a juízos morais dirigidos por princípios, ou seja, a convicções racionalmente motivadoras e que possibilite a auto-regulação do comportamento. (Habermas 1991, p. 88)
Um tal sistema, pensa Habermas, tem de ser dotado da capacidade de funcionar autonomamente em face da validez social de normas reconhecidas, o que somente pode acontecer pela interiorização dos princípios abstratos que a própria ética do discurso representa como pressuposições do procedimento de fundamentação de normas. Habermas fornece, então, o direcionamento investigativo para as condições de possibilidade destas “estruturas pós-convencionais do super-ego”. E justamente aqui retorna a questão hegeliana de um paralelismo entre processos pós-convencionais de socialização e individualização. A ética do discurso aponta para uma colaboração propiciada pela eficácia socializadora do entorno”, isto é, para “padrões de socialização e processos de formação que fomentem o desenvolvimento moral e o desenvolvimento do eu de jovens e impulsionem os processos de individualização para além dos limites de uma identidade convencional, de uma identidade que se atém a determinados papéis sociais. (Habermas 1991, p. 89)
Segundo Habermas, a resolução de ambos os problemas relacionados à tradução efetiva de princípios universais, ancoragem de processos de aprendizagem em ordenamentos institucionais de tipo pós-convencional e padrões de socialização revertidos em uma individualização pós-convencional, está ligada a um modo reflexivo de tradição e, neste sentido, Habermas deixa em aberto a compreensão do processo ontogenético de progressiva individualização como contrapartida de processos socializadores efetivados sob tais circunstâncias pós-convencionais, no sentido específico que Honneth atribui ao “teor individualizante” de relações intersubjetivas. A pergunta que se coloca é, então, se padrões jurídicos de socialização seriam capazes, no contexto de sociedades pluralistas, de deliberação democrática insuficiente e de participação política irregular, de permitir, para além de uma individualização simplesmente abstrata, formação de identidades culturalmente diversificadas. Não é difícil ver que Habermas investe o direito positivo moderno da capacidade de complementar o déficit prático de uma moral universalista, principalmente no
296
Erick C. de Lima
que concerne à ancoragem de processos de aprendizagem ligados à formação política da vontade em um quadro institucional pós-convencional. Entretanto, no tocante ao problema dos padrões pós-convencionais de socialização revertidos em uma individualização potencialmente aberta, o direito exerce uma função exterior, no sentido em que assegura a integração social e a salvaguarda de uma individualização abstrata em circunstâncias de uma socialização frágil. Com efeito, o direcionamento da teoria do agir comunicativo para a explicitação de um conceito normativo de democracia deliberativa parece também apontar para a sua complementação por uma investigação mais pormenorizada e interna da possibilidade de processos de socialização revertidos em uma individualização pós-tradicional, os quais podem e devem, decerto, entrar numa simbiose com o medium do direito positivo, mas não se reduzem a ele nem o podem reduzir a si. Portanto, sugerimos aqui uma linha de investigação que procura examinar a interface entre o direito e, por exemplo, a estrutura da formação familiar, bem como com o sistema educacional. Tais elementos sócio-formadores se beneficiam das salvaguardas proporcionadas pela institucionalização jurídica, porém não parecem, em todos os casos, se comportarem de maneira passiva em relação a ele, mas antes podem também agir e retroagir sobre o momento jurídico da organização social, principalmente sobre o locus privilegiado da legitimidade: os processos de legislação. No sentido de uma futura investigação destas interfaces é que a sugestão hegeliana de uma interface entre a família e a sociedade civil pode ser ainda enriquecida a ponto de auxiliar, enquanto modelo sociológico, a investigação de fenômenos pósconvencionais. É o próprio Habermas que, na esteira de sua assimilação da problemática hegeliana, deixa ainda em aberto, em meados dos anos 1980, as potencialidades de uma vinculação das idéias morais com a força motivacional inserida em instituições reconhecidas. Em suas palavras, as idéias morais têm que ser transformadas, como diz Hegel, em debates concretos da vida cotidiana. E assim é em realidade: toda moral universalista depende da sustentação e do apoio que lhe ofereçam as formas de vida. Necessita de uma certa concordância com práticas de socialização e educação que ponham em marcha nos sujeitos controles de consciência fortemente internalizados e fomentem identidades do eu relativamente abstratas. Uma moral universalista necessita também de uma certa concordância com instituições sociais e políticas em que já estejam encarnadas idéias jurídicas e morais de tipo pós-convencional. (Habermas 1986, p. 23)
Já aqui se torna claro o direcionamento do pensamento habermasiano para a tese da complementaridade entre moral e direito positivo, mas também se faz observar ainda o papel a ser desempenhado por padrões de socialização e individualização forjados paralelamente ao medium jurídico, ancorados talvez na interface formada pela esfera da família em sua acepção pós-convencional mais geral, que engloba também o ambiente de formação educacional, e a sociedade civil enquanto esfera de um reconhecimento jurídico recíproco.
Normatividade a partir de socialização e individualização
297
A justificação de uma tal orientação investigativa, a qual pretende, no fundo, seguir a tradição de uma teoria social fundada sobre a racionalidade comunicativa através de um resgate de elementos da concepção hegeliana de intersubjetividade, converge para a consideração da complementação da moral universalista pelo direito. A questão é se há sentido em investigar outras interfaces sociais que, ao lado do direito, permitam o resgate institucional das pretensões interativas inseridas em uma ética do discurso e referentes à formação de identidades individuais num sentido pós-tradicional através da socialização. As pretensões interativas inseridas na ética do discurso ficam mais claras quando Habermas procura comprovar que a fundamentação discursiva do juízo moral em um procedimento faz jus às intuições morais enquanto elementos substanciais às formas de vida, o que se dá, segundo Habermas, justamente pelo estabelecimento da conexão interna entre questões de justiça e questões do bem comum, tratadas separadamente por éticas deontológicas e éticas valorativas (Habermas 1986). Para Habermas, de um ponto de vista antropológico, a moral pode ser compreendida como um mecanismo de proteção à vulnerabilidade estrutural das formas de vida sócio-culturais, isto é, à característica incontornável da espécie humana de somente ser capaz de proceder à individualização pela via da socialização. As formas de vida sócio-culturais se caracterizam, portanto, pelo fato de que os processos comunicativos que subjazem à intersubjetividade da interação socializadora, constroem e reproduzem co-originarimente a identidade do indivíduo e da coletividade sóciocultural. Isto cria, segundo Habermas, uma reciprocidade entre a intensificação da individualidade e o adensamento da rede intersubjetiva de formação, de maneira que a possibilidade de auto-determinação se vincula à imersão do sujeito na teia de relações intersubjetivas que compuseram sua identidade extremamente individualizada, o que significa que este processo de sofisticação da identidade individual comporta também riscos crescentes à integridade da pessoa formada, isto é, de que aspectos incontornáveis da auto-realização do indivíduo não encontrem o efetivo respaldo social. Para Habermas, a moral se dirige, em geral, a aplacar esta vulneralibilidade na forma da salvaguarda tanto da integridade individual, quanto do “tecido vital das relações de reconhecimento recíproco nas quais unicamente as pessoas podem estabilizar sua frágil identidade.”(Habermas 1986, p. 24) É neste sentido que Habermas compreende que a moral tem de se voltar à intangibilidade dos indivíduos pela exigência de respeito à dignidade de cada um e à proteção da tessitura intersubjetiva das relações comunitárias, o que leva ao duplo ônus da moral: as questões relativas à justiça e as questões relativas à solidariedade social, ou seja, problemas vinculados à igualdade de direitos dos indivíduos e problemas ligados ao bem estar do próximo. Por um lado, diz Habermas, a justiça em sentido moderno se refere à liberdade subjetiva dos indivíduos, e a solidariedade se refere ao bem estar dos indivíduos que compartilham intersubjetivamente uma forma de vida sócio-cultural. Com efeito, para Habermas, somente a ética do discurso é capaz de mostrar como o duplo ônus da moral se compõe de elementos complementares que se deixam re-
298
Erick C. de Lima
conduzir à noção de vulnerabilidade da socialização individualizante e, portanto, à complementaridade dos processos de socialização e individualização. Este resultado permite “o direcionamento jurídico” e o resgate da intenção fundamental do direito natural racional de extrair, do próprio âmbito da comunicação lingüisticamente mediatizada, elementos compensatórios para a vulnerabilidade. Habermas vai encontrar no direito positivo moderno a possibilidade de solucionar o problema fundamental de sua teoria social, ancorada no conceito de racionalidade comunicativa, acerca da possibilidade de uma reprodução da sociedade que, em última instância, se dá na base das idealizações inseridas no meio lingüístico que estrutura tais formas de vida, isto é, na base de pretensões de validade normativa às quais os agentes têm que recorrer na coordenação de suas ações (Habermas 1997, p. 25). A descontinuidade pós-convencional entre moralidade e eticidade se depara, enquanto tensão entre facticidade e validade, com a fragilidade dos processos de socialização que se estabilizam pelo reconhecimento intersubjetivamente mediado de pretensões de validez normativa, e esta ameaça ao mecanismo regulador das ações cobra neutralização como condição de integração social. A ameaça de desintegração social se intensifica na medida em que as sociedades se tornam ainda mais complexas e passam a abrigar sistemas que operam pela orientação estratégica do agir e cujo amortecimento normativo se torna problemático. Também aqui o direito positivo moderno, baseado no conceito de esferas subjetivas de liberdade de ação, revela sua potência estabilizadora, na medida em que tangencia tanto as “idealizações” vinculadas à capacidade normativa auto-organizatória das comunidades jurídicas, como também a liberação dos indivíduos para a persecução estratégica de seus interesses no quadro delineado por preceitos sistêmicos. Neste sentido, o direito positivo se estabelece, do ponto de vista histórico, como contrapartida institucional dos processos de intensificação do individualismo e do atomismo próprios à solidificação de relações capitalistas de produção, e permite a estabilização da pluralização de formas de vida e a intensa individualização das histórias de vida que, paralelamente à complexidade sistêmica das modernas sociedades econômicas, tornam cada vez mais volátil a convergência das convicções que povoam o mundo da vida. A partir da perspectiva dos próprios agentes, há, portanto, uma desvinculação, inexistente em sociedades tradicionais, da validez normativa das convicções racionalmente motivadas e da validade social das normas, para onde emigram também, a despeito de a integração social entre os agentes depender ainda de seu entendimento mútuo relativo ao reconhecimento intersubjetivo de pretensões de validez normativa, as “coerções sistêmicas” de uma orientação estratégica no agir. Em sociedades modernas, a estabilização da tensão entre facticidade e validade supõe, portanto, a regulamentação intersubjetiva de ações estratégicas e, por conseguinte, na medida em que representa a distribuição de esferas de liberdade subjetiva sob a coerção objetiva de um aparelho estatal, o direito positivo moderno pode ser visto como exercendo a requerida função estabilizadora. Para Habermas, sob circunstâncias pós-
Normatividade a partir de socialização e individualização
299
convencionais, cabe ao sistema jurídico — e, especificamente, ao processo legislativo — a tarefa de integração social. Neste ponto se insere a suposição, trazida por Habermas da prática discursiva, de que o processo legislativo é capaz de ir além da mera perspectiva individualista e atomista segundo a qual todos os envolvidos são livres para a persecução estratégica de seus interesses privados na direção da formação de um ambiente de regulamentação normativa da convivência, o que supõe a compreensão do processo de legislação como expediente em que os envolvidos se erguem à condição de sujeitos de direito, de cidadãos dotados de direitos políticos de participação, que agem também orientados ao entendimento mútuo. Segundo Habermas, é por isso que o conceito de direito moderno — que intensifica e, ao mesmo tempo, operacionaliza a tensão entre facticidade e validade na área do comportamento — absorve o pensamento democrático, desenvolvido por Kant e Rousseau, segundo o qual a pretensão de legitimidade de uma ordem jurídica construída com direitos subjetivos só pode ser resgatada através da força socialmente integradora da “vontade unida e coincidente de todos”. (Habermas 1997, p. 63)
Portanto, Habermas entende que a integração social em sociedades complexas é propiciada por um “resgate jurídico” e pós-convencional da solidariedade social, pois o processo legislativo, que funda a legitimidade de normas socialmente válidas, baseia-se na auto-compreensão dos envolvidos enquanto cidadãos, enquanto indivíduos em pleno exercício de suas autonomias comunicativas. Com efeito, para Habermas, a integração social em sociedades complexas e a manutenção de uma rede socializadora, à qual, apesar de sua fragilidade, os sujeitos devem, em quaisquer circunstâncias, sua sofisticada individualização, é localizada na conexão interna entre a imposição factual do direito e a legitimidade que lhe é conferida pelo processo de legislação. Do ponto de vista teórico, entretanto, não se configura sociologicamente plausível que, em vista da complexidade e retroação jurídica dos sub-sistemas, o direito possa desempenhar sua função sócio-integradora a partir somente de nichos sócio-solidários. E é esta realidade que impõe à teoria discursiva do direito de Habermas a superação tanto dos paradigmas da filosofia da justiça, quanto dos padrões objetivistas da sociologia do direito (Habermas 1997, p. 55). O papel sócio-integrador do direito permaneceria sub judice enquanto não se mostrasse a estabilização, no próprio direito positivo, do ponto de vista moral que responde pela formação imparcial do juízo e da vontade coletiva. Como a questão se refere justamente à contingência de conteúdos de um direito positivo sujeito à modificação, não basta a positivação de conteúdos do direito natural racional, mas é o momento moral integrado no direito positivo que tem de revelar sua potência auto-reguladora. O núcleo racional (em sentido prático-moral) dos procedimentos jurídicos se nos revela quando se analisa como, através da idéia de imparcialidade, tanto a fundamentação das normas como a aplicação das regulamentações vinculantes estabelecem uma conexão construtiva entre o direito vigente, os procedimentos legislativos e os procedimentos de aplicação do direito. Esta idéia de imparcialidade constitui o núcleo da razão prática. (Habermas 1992, p. 563)
Erick C. de Lima
300
O modelo do discurso prático se revela mais adequado para deslindar este conteúdo prático-moral do direito porque nele o procedimento racional e imparcial de formação da vontade coletiva é identificado com o próprio processo de argumentação moral. Por isso, diz Habermas: o direito procidementalizado e a fundamentação moral de princípios se remetem um ao outro. A legalidade somente pode engendrar legitimidade na medida em que a ordem jurídica reage reflexivamente à necessidade de fundamentação surgida com a positivação do direito, e isso de maneira que se institucionalizem procedimentos jurídicos de fundamentação que sejam permeáveis a discursos morais. (Habermas 1992, p. 565)
A questão da vulnerabilidade dos indivíduos que somente podem se individualizar pela socialização, bem como sua solução “moral”, é retomada sob a perspectiva da complementaridade entre moral e direito. Para Habermas, é justamente a incompletude da racionalidade implementada em argumentações morais que aponta para uma complementaridade entre moral e direito, pois no caso daquela a imparcialidade do exame discursivo de determinadas normas problematizadas não fica imediatamente atrelado à garantia de infalibilidade15 . A diferença agora é que Habermas direciona a neutralização destas dificuldades diretamente à complementaridade da moral pelo direito, não admitindo mais, aparentemente, que, ao lado da eficácia prática de juízos morais através de sua ligação com o momento institucionalizável dos procedimentos jurídicos, outros tipos de padrões de socialização — e inclusive a educação — venham a desempenhar um papel relevante na salvaguarda de processos mutuamente referentes de socialização e individualização, embora pareça reduzir a complementaridade jurídica da ética do discurso “a todos aqueles âmbitos de ação em que conflitos, problemas funcionalmente importantes e matérias de relevância social exijam tanto uma regulação unívoca como em um prazo fixo, e que resultem, além disso, obrigantes para todos.” (Habermas 1992, p. 566) É no sentido desta justificação moral da complementaridade da moral pelo direito que se coloca a questão chave de nossa incursão acerca do potencial de uma investigação acerca dos meios para a resolução do problema moral fundamental: a salvaguarda dos processos da mútua implicação entre individualização e socialização. Haveria algum sentido em associar ao viés profundamente socializador da teoria discursiva do direito, viés que, como é claro, salvaguarda também a possibilidade de uma individualização pulverizada, a investigação de outros padrões “leves” de socialização que possam colaborar com a institucionalização “forte” do medium jurídico?
Referências Apel, K.-O. 1986. Kann der postkantische Standpunkt der Moralität noch einmal in substantielle Sittlichkeit „aufgehoben“ werden? In: Kuhlmann, W. Moralität und Sittlichkeit: Das Problem Hegels und die Diskursethik. Frankfurt am Main: Suhrkamp, p. 217–63.
Normatividade a partir de socialização e individualização
301
Dews, P. 1993. Faktizität, Geltung und Öffentlichkeit. Deutsche Zeitschrift für Philosophie 41(2): 359–64 Habermas, J. 1974. Arbeit und Interaktion. Bemerkungen zu Hegels Jenenser “Philosophie des Geites”. In Göhler, G. Frühe politische Systeme. Frankfurt am Main: Ullstein. —–. 1988. Nachmetaphysisches Denken. Frankfurt am Main: Suhrkamp —–. 1989. Notas programáticas para a fundamentação de uma ética do discurso. In Habermas, J. Consciência Moral e Agir Comunicativo. Rio de Janeiro: Tempo Brasileiro, p. 61–141. —–. 1991. Escritos sobre moralidad y eticidad. Padiós: I.C.E-U.A.B. —–. 1997. Direito e Democracia entre facticidade e validade. Rio de Janeiro: Tempo Brasileiro. —–. 1999. Wahrheit und Rechtfertigung: philosophische Aufsätze. Frankfurt am Main: Suhrkamp. Honneth, A. 1992. Kampf um Anerkennung. Zur moralischen Grammatik sozialer Konflikte. Frankfurt am Main: Suhrkamp. —–. 2000. Das Andere der Gerechtigkeit: Aufsätze zur praktischen Philosophie. Frankfurt am Main: Suhrkamp. —–. 2001. Beyond liberalism and communitarianism: studies in Hegel’s Philosophy of right. New York: Albany. —–. 2004. Gerechtigkeit und Kommunikative Freiheit: Überlegungen im Anschluss an Hegel. In Merker, B. Subjektivität und Anerkennung. Frankfurt am Main: Mentis, p. 213–27. —–. 1994 Kontexte der Gerechtigkeit: politische Philosophie jenseits von Liberalismus und Kommunitarismus. Frankfurt am Main: Suhrkamp. Hösle, V. 1987. Hegels System. Der Idealismus der Subjektivität und das Problem der Intersubjektivität. Hamburg: Felix Meiner. Kaltenbacher, W. 1994. Freiheitsdialektik und Intersubjetivität in Hegels Rechtsphilosophie. Frankfurt am Main: Peter Lang. Kojève, A. 1947. Introduction à la lecture de Hegel. Lecons sur la Phénoménlogie de l’Esprit professées de 1933 à 1939 à L’École des Hautes Études. Paris: Gallimard Lima, E. C. 2006. Direito e Intersubjetividade: eticidade moderna em Hegel e o conceito fichteano de reconhecimento. Campinas. 293p. Tese de Doutorado em Filosofia, UNICAMP. —–. 2007. Direito, Intersubjetividade e Educação: sobre a leitura hegeliana do Naturrecht de Fichte”. Doispontos (Curitiba/São Carlos) 4(1): 63—106. Müller, M. 1998. A Gênese Conceitual do Estado Ético. Revista de Filosofia Política, Nova Série (Porto Alegre: L&PM) 2: 9–38. Outhwaite, W. 1994. Habermas: a Critical Introduction. Cambridge: Polity Press. Roth, K. 2002. Abstraktes Recht und Sittlichkeit in Hegels Jenaer Systementwürfen. In Henkel, M. Staat, Politik und Recht beim frühen Hegel. Berlin: Berliner Wissenschafts-Verlag, p. 11– 37. Siep, L. 1979. Anerkennung als Prinzip der praktischen Philosophie. Freiburg, München: Alber. Theunissen, M. 1982. Die verdrängte Intersubjektivität in Hegels Philosophie des Rechts. In Henrich, D. e Horstmann, R.-P. (eds.) Hegels Philosophie des Rechts. Die Theorie der Rechtsformen und ihre Logik. Stuttgart: Klett-Cotta, p. 317–81 Wildt, A. 1983. Autonomie und Anerkennung. Hegels Moralitätskritik im Lichte seiner FichteRezeption. Stuttgart: Klett-Cotta. Williams, R. 1992. Recognition: Hegel and Fichte on the Other. Albany: University of New York Press. —–.1997. Hegel’s Ethics of Recognition. Los Angeles: University of California Press.
302
Erick C. de Lima
Notas 1 A reflexão de Ludwig Siep é o marco que permite superar a predominância da influente interpretação
feita por Kojève do conceito hegeliano de reconhecimento como centrado na relação entre senhor e escravo (Kojève 1947). Dentro do estágio eu-tu de reconhecimento, Siep diferencia dois modelos: o amor e a luta, isto é, uma forma de reconhecimento sem oposição das vontades; e um conflito de vontades que visa ao reconhecimento mútuo. Já o estágio das relações de reconhecimento entre indivíduo e as instituições, Siep pretende que o Hegel de Jena desenvolva o reconhecimento como um princípio crítico que permite precisar a legitimidade de instituições sociais, nas quais os indivíduos devem poder se encontrar a si mesmos e se ver refletidos em seus interesses. Siep vê a importância do reconhecimento para a filosofia prática de Hegel na capacidade de permitir uma renovação da filosofia prática tradicional em bases pós-modernas, pós-liberais e intersubjetivas. Desta maneira, Hegel superaria o quadro conceitual individualista do direito natural moderno, inadequada a uma plena compreensão da liberdade individual em sua necessária mediação intersubjetiva e em sua significação plenamente positiva. Esta superação teria, de acordo com Siep, o resultado de fornecer uma reconciliação entre a tradição aristotélica e a filosofia transcendental (Siep 1976). 2 Hegel teria chegado, para Roth, a uma teoria da sociedade civil e do estado que, calcada no conceito de reconhecimento, abrangia aspectos jurídico-morais e salientava os momentos conectivos das esferas político-social e jurídico-moral, ao passo que a sistemática definitiva da filosofia do espírito objetivo, alcançada na Propedêutica dos Nürnberger Schriften, tornaria, graças ao obscurecimento do elemento intersubjetivo, os temas de filosofia prática aparentemente independentes uns dos outros (Roth 2002).Especialmente confuso se torna, para Roth, o modo como as diversas esferas do espírito objetivo se relacionam umas às outras, principalmente como direito abstrato e moral devam ser compreendidos como momentos não-éticos ou pré-éticos a serem “suspensos” na eticidade e conservados nela. Para Theunissen, as primeiras esferas do espírito objetivo exercem uma função apenas crítica no todo da obra, representam apenas uma apreciação crítica e desconstrutivista do direito natural e da moral kantianofichteana da autonomia, que, entretanto, não obtém resultados construtivos, os quais somente na terceira parte são introduzidos. Roth critica esta visão dos capítulos iniciais das Grundlinien apenas como “preâmbulo desconstrutivista” do panorama teórico jurídico-moral pré-hegeliano: caso se interprete ambos os capítulos como incapazes de fornecer elementos constitutivos para a compreensão da vida sócio-política, não se compreende como Hegel espera que os elementos positivos, desenvolvidos neste capítulo, possam ser conservados na eticidade e como nexos que lhe são constitutivos. 3 A pertinência da análise de Theunissen em relação ao preâmbulo crítico fornecido pelo artigo seminal de Habermas é atestada pelo próprio Habermas recentemente (Habermas 1999, p. 196). Refiro-me aqui propriamente ao capítulo 4, intitulado “Wege der Detranszendentalisierung. Von Kant zu Hegel und zurück”, no qual Habermas menciona que se trata em seu artigo de uma análise “epistemológica” do problema da intersubjetividade em Hegel e se exime de um exame do tema da verdrängte Intersubjektivität em um registro político-filosófico, dando a entender, ao citar Theunissen, sua satisfação com a análise das Grundlinien feita por este sob a inspiração da tese fornecida por Habermas com respeito ao abandono por Hegel de suas intuições jenenses. 4 De certa maneira, pode-se dizer (Kaltenbacher 1994) que Theunissen defende uma tese que é, em muitos aspectos, uma versão invertida da tese de Hösle (Hösle 1987). Enquanto Hösle afirma que as categorias da lógica são todas mundanas e que, por conseguinte, não podem suportar as considerações de Hegel sobre a intersubjetividade na “filosofia real”; Theunissen acredita que, muito embora Hegel apresente uma teoria com algum teor de intersubjetividade nas Grundlinien, esta intersubjetividade é reprimida, não simplesmente na obra como um todo, mas em detalhes da argumentação. As razões alegadas por Theunissen para esta repressão da intersubjetividade são os compromissos metafísicos de Hegel, a pretensa tomada de partido de Hegel pelos antigos contra os modernos, e seu conceito monológico de sujeito. De maneira geral, Theunissen pretende que o conceito hegeliano do social destitua os indivíduos de sua independência, pois a compreensão metafísica da relação entre eles — um espírito objetivo hipostasiado como substância ética — se sobrepõe à intersubjetividade. “A concepção pan-
Normatividade a partir de socialização e individualização
303
teísta de espírito objetivo remove toda a intersubjetividade da eticidade . . . Hegel substitui toda relação intersubjetiva por uma relação da substância a estas pessoas, e como resultado a independência das pessoas desaparece.” (Theunissen 1982, p. 12) 5 Robert Williams desenvolveu, na década de 90, uma interessante leitura do conceito hegeliano de reconhecimento, a qual se acha mais claramente exposta em dois livros e alguns artigos (Williams 1992, 1997). Depois de enfatizar a teoria do reconhecimento do jovem Hegel, Williams procura empreender uma sólida leitura da filosofia política madura de Hegel através do conceito de reconhecimento. Grosso modo, pode-se dizer que a tese central de Williams é que o reconhecimento não é apenas uma figura fenomenológica do conceito de liberdade, mas também a estrutura intersubjetiva e padrão do conceito hegeliano de espírito. Para Williams, diante desta tese de envergadura, o reconhecimento fornece a estrutura ontológica mais fundamental da filosofia hegeliana do espírito, de sua filosofia prática e do conceito hegeliano de eticidade. Williams concorda com Honneth e Habermas que o reconhecimento fornece um itinerário promissor para a reconstrução pós-metafísica da filosofia social e da ética, mas refuta a tese de que o reconhecimento seja abandonado pelo Hegel maduro. 6 Em seu recente livro sobre a filosofia política de Hegel, Honneth delineia um esboço de re-atualização de caracteres gerais do pensamento hegeliano. Este trabalho se compreende como uma tentativa indireta de reconstrução, na medida em que, ignorando o que chama de atuais reservas metodológica e política para com a obra de Hegel, não tenciona uma reconstrução “direta”, ou seja , que pretendesse tornar plausíveis quer a lógica especulativa, quer o conceito substancial de Estado. Ao invés disso, Honneth procura mostrar como a intersubjetividade latente no conceito hegeliano de eticidade — que segundo ele teria, num misto de Zeitdiagnose e Gerechtigkeitstheorie, um papel eminentemente terapêutico em relação às concepções essencialmente modernas da liberdade, mas unilaterais e monológicas, típicas das esferas da pessoa jurídica e do sujeito autônomo, do direito e da moral — pode, por meio da recuperação das relações de reconhecimento recíproco, representar ainda um rico filão para a atual filosofia política, mesmo para autores cuja teoria da justiça tenha sido cunhada pelo modelo kantiano do princípio universalista e formal da moral, como Habermas e Rawls. Para Honneth, “tudo que Hegel tenha a dizer no tocante aos fundamentos epistemológicos e normativos para seu próprio conceito de ‘eticidade’, permanece oculto por detrás dos elementos de sua metodologia e de seu conceito de estado postos em questão.” Segundo Honneth, de acordo com o paradigma pós-metafísico de pensamento,“nem o conceito hegeliano de estado, nem seu conceito ontológico de espírito . . . parecem ainda hoje em dia serem, de alguma maneira, passíveis de reabilitação.” O objetivo desta reconstrução indireta da atualidade da filosofia do direito de Hegel no quadro das discussões atuais no campo da filosofia política e da filosofia social é demonstrá-la “como projeto de uma teoria normativa daquelas esferas de reconhecimento recíproco, cuja manutenção (Aufrechterhaltung) é constitutiva para a identidade moral de sociedades modernas.” (Honneth 2001) 7 Em um texto sobre a Introdução das Grundlinien, Müller fornece uma interessante interpretação do “estatuto supra-individual” do “conceito positivo de direito” que incorpora momentos da interpretação de Theunissen e parece abrir, ao mesmo tempo, novas possibilidades de apreciação da obra de maturidade e de aproximação com a discussão sobre a intersubjetividade feita em Frankfurt e Jena. Partindo da anotação ao §29 e da crítica hegeliana à compreensão negativa do direito defendida por Kant e Fichte, Müller contrapõe o “conceito positivo de direito”, vinculado à sua “base substancial supra-individual” que reúne as condições comunitárias da realização da liberdade de todos, à concepção formalista do direito, que tem seu ponto de partida na multiplicidade atomista das vontades individuais e cujo sentido comunitário se vê reduzido à regulação legal formal pela coerção recíproca dos singulares. À “base substancial” (LFFD §29) do sentido comunitário ou positivo do conceito de direito, que se constitui pela suspensão da “vontade singular em seu arbítrio peculiar” (LFFD §29A) implicada na contradição interna do arbítrio, Müller relaciona a figura da universalidade imanente às vontades singulares, a qual considera ser o núcleo normativo de uma “sociabilidade positiva”, um paradigma não limitativo ou excludente de intersubjetividade propiciado pela universalidade imanente da idéia ética enquanto “o bem vivo”(LFFD §142). Müller considera que, nas Grundlinien, esta “sociabilidade positiva” se relaciona com a “sociabilidade negativa” da concepção formal do direito como sua condição de possibilidade, isto é,
304
Erick C. de Lima
como substrato de relações intersubjetivas orgânicas que torna possível a socialmente necessária restrição recíproca das esferas de liberdade. 8 Honneth tem uma visão bastante diferenciada do desenvolvimento de Hegel em Jena, principalmente no que concerne às relações entre sua teoria do reconhecimento e a teoria da eticidade. Por um lado, Honneth consegue depreender seu modelo dos três estágios de reconhecimento pelo qual se dá o desenvolvimento “histórico” da eticidade diretamente do System der Sittlichkeit, mas parece lamentar o fato de que Hegel não possua meios na época para uma “compreensão mais determinada de sua mediação de Fichte e Hobbes” (Honneth 1992, p. 47). Por outro lado, Honneth lamenta também que, com o apelo à teoria da consciência a partir de 1803, Hegel tenha eliminado do conceito de natureza todo o seu “significado ontologicamente abrangente” (Honneth 1992, p. 48), o qual passa apenas a significar o contraposto absoluto do espírito, isto é, a natureza física e pré-humana. Honneth vê nisso a estruturação teórica da esfera da eticidade entregue ao processo de reflexão do espírito, o que já aponta para a sistemática definitiva. Com respeito à inserção da teoria do reconhecimento, apesar de preservar a relação ética do estado como ponto central da análise reconstrutiva da eticidade, “Hegel não pode mais agora compreender o itinerário de formação de uma comunidade estatal como um processo de desdobramento conflituoso de estruturas elementares de uma eticidade natural, originária.” (Honneth 1992, p. 49). Embora desde 1802 Hegel compreenda, diz Honneth, o movimento do reconhecimento sempre como um meio de socialização e formação comunitária da consciência universal pelo descentramento das perspectivas excessivamente individuais, somente o System der Sittlichkeit mune este movimento com a capacidade de gerar individualização, isto é, “aumento das capacidades do eu” (Honneth 1992, p. 51). O motivo para esta complexa modificação Honneth atribui ao arrefecimento da influência aristotélica pela adesão ao programa de uma teoria da consciência. Para Honneth, “o âmbito objetivo de sua análise reconstrutiva se compõe não mais de formas de interação social, de “interações éticas”, mas se constitui de níveis de auto-mediação da consciência individual” (Honneth 1992, p. 52), de maneira que “também as relações de comunicação entre sujeitos não podem ser mais compreendidas como algo fundamentalmente prévio aos indivíduos”. Ao sacrificar esta faceta, a teoria hegeliana do reconhecimento acaba por perder sua característica de “história da sociedade” e passa a se compreender como formação do indivíduo para o universal social. (Honneth 1992, p. 52) 9 Para Wildt, enquanto Hegel desenvolve, no System der Sittlichkeit, sua teoria do reconhecimento a partir de uma teoria do crime; a partir de 1803, a luta não se origina mais de um “crime” contra um estágio prévio de relação comunicacional entre os indivíduos, o que não significa, para Wildt, que, aliada à sua capacidade socializadora e geradora de normas, a teoria do reconhecimento perca, como quer Honneth, sua capacidade de intensificação das capacidades individuais. Para Wildt, a diferença da teoria do reconhecimento em sua nova versão em relação à teoria do crime não está em que ela subtrai a lesão ao outro de qualquer vinculação normativa, mas que “ela, seguindo o atalho que passa pelo conceito de consciência e a experiência da mesma em relação à própria morte, relaciona a temática do crime explicitamente à problemática da identidade do eu” (Wildt 1983, p. 341) 10 Para Habermas, Kant pressuporia a autonomia individual como dado, isto é, “o caso limite de uma pré-estabelecida coordenação dos sujeitos agentes”, o que significa que “exclui o agir ético (sittliches Handeln) justamente do âmbito da moralidade”; pois “a sincronização prévia dos agentes no quadro de uma intersubjetividade não rompida (bruchlos) proscreve do âmbito da teoria dos costumes (Sittenlehre) o problema da eticidade (Sittlichkeit).” Desta maneira, “a interação se dissolve . . . em ações de sujeitos solitários e auto-suficientes, dos quais cada qual tem de agir como se fosse a única consciência que existe; entretanto, pode ter, ao mesmo tempo, a certeza (GewiSSheit) de que todas as suas ações sob as leis morais se coadunam necessariamente com as ações morais de todos os outros possíveis sujeitos . . . A relação positiva da vontade com a vontade do outro é subtraída à possível comunicação e substituída por uma concordância transcendentalmente necessária de atividades teleológicas (Zwecktätigkeiten) sob leis abstratamente universais.” (Habermas 1974, p. 794–5) 11 Habermas diz: “porque eu é, exatamente neste sentido explicitado, identidade do universal e do singular, a individualização de um recém-nascido, o qual é, enquanto ser vivo pré-linguístico no corpo da mãe, exemplar do gênero e, biologicamente, pode ser suficientemente explicado a partir de uma combi-
Normatividade a partir de socialização e individualização
305
nação limitada de muitos elementos, somente pode ser compreendida como um processo de socialização (Sozialisierung). Nestes termos, certamente, a socialização não pode, por sua vez, ser pensada como sociabilização (Vergesellschaftung) de um indivíduo dado: ela mesma produz antes e primeiramente um individualizado.”(Habermas 1974, p. 790–1) 12 Habermas se refere explicitamente a outro momento de sua obra (Habermas 1988). 13 Para Habermas, a função das pretensões de validez normativa na coordenação das ações e, portanto, a tese teórico-social de que as formas de vida sócio-culturais se constituem pela cooperação comunicativa dos membros, ficam evidentes ao se atentar para o fato de que os envolvidos em consensos perturbados são levados à consciência de que a problematização das pretensões somente podem ser superadas cooperativamente. Com isto se conecta também a tese de isomorfia estrutural entre a prática comunicativa cotidiana e o discurso prático, pois, “ao entrarem em uma argumentação moral, os participantes prosseguem seu agir numa atitude reflexiva com o objetivo de restaurar o consenso perturbado.” (Habermas 1989, p. 87) Seguindo a inspiração hegeliana com respeito à causalidade do destino e a relação ética, Habermas entende que a reparação do acordo normativo perturbado consiste “em assegurar o reconhecimento intersubjetivo para uma pretensão de validez inicialmente controversa e em seguida desproblematizada ou, então, para uma outra pretensão de validez que veio substituir a primeira. Essa espécie de acordo dá expressão a uma vontade comum.”(Habermas 1989, p. 87–8) Deve-se concluir, portanto, que dentre as pressuposições que o discurso comparte com o agir orientado para o entendimento mútuo em geral estão, por exemplo, as relações de reconhecimento recíproco. (Habermas 1989, p. 111) Tal caráter comum permite a Habermas definir a controvérsia em torno de normas, na medida em que esta afeta o equilíbrio das relações de reconhecimento, como sua própria versão da “luta por reconhecimento” (Habermas 1989, p. 128). 14 Para Habermas, a possibilidade de processos de aprendizagem está vinculada pela transcendência da prática comunicativa cotidiana ocasionada pelos pressupostos idealizadores inseridos no meio lingüístico que estrutura as formas de vida (Habermas 1997, p. 21) 15 Em Faticidade e Validade, Habermas pretende empreender a comprovação da tese seminal que parece ter voltado sua trajetória intelectual para o problema do direito, a saber: a tese de que, sob pontos de vista funcionais, “a figura pós-tradicional de uma moral orientada por princípios depende de uma complementação através do direito positivo.” (Habermas 1997, p. 23) Apesar de esta tese da complementaridade ter sido tematizada no texto programático de sua filosofia do direito, as chamadas Tanner Lectures, Habermas adverte o leitor, na introdução de Direito e Democracia, que não compreende mais a complementaridade no mesmo sentido de em que a estabelecera em fins da década de 1980.
A R AZÃO DO D IREITO EM H ABERMAS G IOVANNE B RESSAN S CHIAVON UFSC/UEL/PUC-PR/Faculdade Paranaense
ghbs2002@yahoo.com.br
1. Introdução Se a filosofia reflete o quê pode ser conhecido, tal saber é expresso na comunicação entre sujeitos que conhecem. Na Modernidade, os filósofos apontam que, mesmo de modo inconsciente, cada época possui conceitos próprios ao seu modo de viver. Esse modelo de racionalidade, implícito na linguagem, tende a ser universalizado e influenciar os indivíduos, posto que estes interpretam sua realidade a partir dessa compreensão. Na Modernidade, dentre os vários instrumentos de controle social, o ordenamento jurídico destaca-se com a afirmação de sua obrigatoriedade a partir da coação estatal. Neste texto, apresenta-se que se a obrigatoriedade do direito, soluciona o problema da indeterminação cognitiva objetiva (ou seja, a questão do quê deve guiar as condutas). Por outro lado da simples afirmação de que o direito guia as condutas sociais não decorre o conhecimento de seu conteúdo. Neste momento, o conteúdo do direito passa a ser determinado caso a caso. Habermas inicialmente vislumbra no ordenamento jurídico um modelo de dominação viciado pela racionalidade instrumental. A exemplo de outros modelos de conduta sociais, operaria exclusivamente através de um juízo de adequação entre expectativas e possibilidades (cálculo “custo x benefício”). Com o amadurecimento de sua obra, o direito tem seu papel revisto e aumentado. Além de ser compatível com a racionalidade instrumental, o ordenamento jurídico, também operaria por uma racionalidade normativa, de cunho comunicativo. Nos estreitos limites deste texto pretende-se primeiro caracterizar o desencanto de Habermas com o direito, para depois apresentar o seu reencantamento a partir da revisão da relação direito e moral. O que lhe possibilita propor a reconstrução da metodologia do direito.
2. O desencanto com a teoria do direito A relação direito, moral e política, é um dos temas analisados por Jürgen Habermas em sua ampla obra filosófica. Um marco de sua contribuição ao debate se deu com a publicação da obra: Theorie des kommunikativen Handelns (1981) [Teoria da Ação Comunicativa]. Nessa, apresenta que na Modernidade a razão não pode mais fundamentar-se no transcendente como se fosse necessário para possibilitar a experiência e a comunicaDutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 306–318.
A razão do Direito em Habermas
307
ção humanas. Muito pelo contrário, afirma que a razão moderna existe para o homem de modo comunicativo, fundando-se no entendimento. Deste modo, pode-se associar suas premissas à tradição sociológica européia, perante a qual, não é mais possível a afirmação da existência de um modelo único de comportamento apto a explicar a tomada de decisões individuais. Afirma, após extensa argumentação teórica, que uma sociedade com um “ethos” comum só seria possível no que Max Weber denomina como “sociedades tradicionais”, ou seja, naqueles grupos que possuem uma consciência comum. Ocorre que, com a Modernidade as teses tradicionais aptas a assumir posição como um conhecimento totalizante são rompidas. Não há mais uma religião comum, o poder político não se ajusta ao divino e a obediência não se vincula ao carisma. Assim, se as sociedades tradicionais se fragmentaram, ao tempo que certos saberes se especializaram, as condutas deixaram de ser enquadráveis numa dada racionalidade. Por exemplo, o conhecimento científico se especializou a ponto de tornar-se acessível a poucos iniciados. O mesmo ocorrendo com o direito, a arte, a economia etc. Embora Max Weber não chegue a falar num sistema com autonomia completa, Niklas Luhmann e Talcott Parsons afirmam que esses saberes se transformaram em verdadeiras estruturas especializadas, denominados de subsistemas. Cite-se o caso do direito, no qual a afirmação da autopoiese faz com que a ciência do direito afirme a sua autonomia cerrando em seus postulados todos os elementos necessários para a sua explicação. Aos advogados, juízes e promotores só resta aceitarem esses dogmas e cumprirem as regras técnicas. Vale indicar que isso ocorre também com os subsistemas mercado, política, artes etc. Habermas constata que ao indivíduo resta um pequeno espaço de autonomia — denominado de mundo da vida — que não chega a se especializar (até porque se assim fosse esse não seria acessível a todos). O mundo da vida é o espaço dos valores tradicionais, uma situação na qual as pessoas agem livremente visando o entendimento. Enquanto que cada subsistema, possui seu próprio padrão, ou racionalidade, pautados de modo teleológico, ilustrado pelo cálculo “custo X benefício”. Daí porque o mundo da vida deve ser analisado a partir de uma racionalidade comunicativa que lhe é própria. Na modernidade, Habermas identifica que os subsistemas mercado (com sua finalidade econômica) e política (visando o poder) são os mais influentes e terminam por interferir nos outros. De um lado, os defensores do livre mercado argumentam que esse subsistema tem a capacidade de se regular e produzir riqueza para todos. Em outro extremo há aqueles que sustentam que o subsistema política deve eliminar as disfunções do mercado. Vislumbra que o mundo da vida se vê cada vez mais invadido, ora pelo mercado, ora pela política, ou por algum subsistema que se autonomizou, como o próprio direito. Há um mundo técnico que intervém no mundo da vida. Parece que a modernidade se tornou cindida e irreconciliável consigo própria. Enfim, a obra “Teoria da Ação Comunicativa” expõe um desencanto, quanto à sociedade moderna, atomi-
Giovanne Bressan Schiavon
308
zada, inidividualista, perante a qual as relações sociais são funcionais e despersonalizadas.
3. Republicanismo e comunitarismo No pensamento anglo-americano das três últimas décadas, as mesmas dificuldades foram percebidas, porém com resultados mais promissores, no sentido de oferecer alternativas para a solução do impasse. O republicano e o comunitarismo criticam o grande destaque conferido pelas teorias liberais à capacidade individual de alcançar o consenso e agir conforme esse. Através do republicanismo/comunitarismo propõe-se a substituição da razão prática de cunho individual por uma razão prática fundada na soberania popular. Antes de se conceituar esses modelos normativos de democracia, faz-se necessário esclarecer o conceito de soberania popular por esses adotado. Com apoio em Jürgen Habermas recorda-se que o conceito de soberania formulado por Jean Bodin como poder absoluto, irrenunciável e perpétuo foi apropriado por Rousseau e transformado no “autodomínio de sujeitos livres e iguais”: Segundo a concepção republicana, o povo, ao menos potencialmente presente, é o portador de uma soberania que em princípio não pode ser delegada: em sua qualidade de soberano, o povo não pode ser representado. O poder constituinte se restringe na prática da autodeterminação dos cidadãos, não de seus representantes (Habermas 1999, p. 244–5).
A cidadania deve se envolver em todos os problemas de modo ativo e há necessidade do reconhecimento de que alguns valores devem, obrigatoriamente, ser impostos ao grupo social. Há que se ter em conta, também, que esta reivindicação agrega-se ao indicado “desencanto do mundo” e se desenvolve a partir de perspectivas diferentes. Peña Echeveria identifica duas tendências básicas: uma centrada na identidade e outra direcionada contra a rígida separação da autonomia individual em pública e privada (Peña Echeveria 1996, p. 7). A primeira perspectiva — comunitarista — critica a concepção abstrata e homogeneizadora da sociedade moderna. A qual parece não reconhecer o papel do contexto comunitário na Constituição e manutenção da identidade dos sujeitos. Afirma que sem a referência a tradições e valores, torna-se impossível conferir coesão e sentido à vida humana. Como exemplo de autores que possibilitaram a afirmação do comunitarismo têm-se Aristóteles e Charles Taylor. Para Aristóteles uma ação é eticamente correta quando não se distanciar dos costumes da “pólis”. Por exemplo: tem-se o covarde, o corajoso e o temerário. Aristóteles ensina que não deve-se pecar pelo excesso, logo ser corajoso é o virtuoso. Só existe virtude com referência aos valores da comunidade. A outra perspectiva — republicana — denuncia a dissociação liberal entre o privado e o público, e propõe a afirmação de uma comunidade democrática de cidadãos
A razão do Direito em Habermas
309
baseada na participação ativa e solidária. O republicanismo é a concepção defensora da necessidade da estrutura política e jurídica para organizar a sociedade e indicar os conceitos de bem, de moralmente correto, de comunidade. Nesse modelo, há necessidade de uma cidadania que esteja pronta a colocar em primeiro plano os interesses sociais. Cidadãos que estejam dispostos a deixar de lado seus afazeres pessoais para se envolver nas questões sociais por solidariedade. Daí afirmar uma esfera pública ampliada. A tradição republicana, partindo de Hegel na obra “Filosofia do direito” (1821), sustenta a existência de certos valores que não podem ser desprezados. Esses valores devem ser incorporados pelo Estado e aplicados, mesmo que de modo autoritário. Assim concilia o conjunto de valores com as instituições de uma identidade moral real. A obra de Hegel é entendida como expressão da busca por uma identidade comunitária. O Estado deve ser organizado conforme o “espírito” da época. A “eticidade substancial” é o conteúdo que informa a comunidade e que varia conforme as condições históricas e/ou sociais (dialética hegeliana). De sorte que, o republicano, se pauta nos valores sociais e resulta num civismo acentuado. Como pilares do comunitarismo e do republicanismo, têm-se que estes: Em um primeiro momento, ampliam a soberania popular a ponto de que, seus valores, são elevados à categoria de fundamento do Estado e do direito. A partir dos valores confere-se identidade aos indivíduos e às instituições. Um segundo pilar, é a afirmação da “virtude cidadã” de modo que, o cidadão deve sempre participar das questões públicas e resguardar seus valores. Isso porque o comunitarismo é compatível com o conceito positivo de liberdade. A partir do qual há liberdade quando as ações são guiadas pelas máximas que o sujeito próprio elabora. O terceiro pilar está na substituição da igualdade formal liberal, por um paradigma material. Na medida em que a igualdade formal é injusta por não corresponder a uma realidade material. A lei deve ser contextual, ser particularizada. Deve adotar uma discriminação positiva. Como crítica a materialização do direito, Max Weber já apresentava que, ao se privilegiar minorias, estará procurando solucionar problemas morais por meio do direito e o Estado não deve tomar parte de questões morais. Entretanto, os defensores da igualdade material, poderiam contra-argumentar que a sua busca por identificar, destacar as potencialidades de cada um visa dar efetividade à igualdade buscada pelos liberais no séc. XVII e XVIII. Daí porque Peña Echeveria interpreta que o republicanismo e o comunitarismo vinculam à razão prática a uma soberania popular completamente consciente de seus valores e absolutamente livre (Peña Echeveria 1996, p. 13–4). Contudo isso só é obtido com a destruição de todo particular ou “positividade” preexistente. Assume-se, assim, o risco de que alguém chame para si a pureza da universalidade e a partir dela restrinja toda a individualidade. O republicanismo parece propor a integração social a partir da renúncia da subjetividade individual, já que se exige do cidadão fidelidade patriótica e se lhe nega capacidade de determinação. Por isso termina por voltar-se
310
Giovanne Bressan Schiavon
para o que é, para um projeto de vida moral real, em vez de manter-se na oposição infinita entre ser e dever ser da moralidade kantiana.
4. Estado de direito e democracia O ingresso de Habermas no contexto teórico do mundo anglo-saxão se dá com a obra Faktizität und Geltung (1992) [Direito e democracia: entre facticidade e validade]. Nesta, aperfeiçoa sua explicação do direito enquanto subsistema que coloniza o mundo da vida e expõe a possibilidade de que a criação e aplicação das normas jurídicas se dê pela racionalidade comunicativa a partir da adoção de metodologia procedimental. Toma por certo que se pode haver cumprimento do direito por obrigação, por igual poderá se obtido por convicção. Nessa linha de raciocínio, o direito não é mais tido como mero resultado de um poder, mas como expressão de uma organização social (resultado de uma “política deliberativa”). A argumentação habermasiana, visa provar um nexo conceitual ou interno entre Estado de Direito e Democracia, o qual não é só histórico ou casual, mas também funcional e sociológico. Essa compreensão do direito contempla que os pressupostos comunicativos e as condições do processo de formação democrática da opinião e da vontade são a única fonte de legitimação para sociedades cujos saberes se autonomizaram. Na explicação tradicional, o direito é essencialmente um instrumento de controle social que delimita o espaço de ação individual ou coletivo da pessoa de modo certo. Em termos mais formais, determina uma “esfera de autonomia” da pessoa ou mais simplesmente, sua liberdade. Raramente os direitos são absolutos. Isso porque com a modernidade passou-se a considerar que o Estado de Direito é uma estrutura na qual a pessoa conhece de antemão seus direitos e deveres e suas garantias. Nesta perspectiva o ordenamento jurídico limita-se à função de segurança jurídica. Na Modernidade, a maioria das pessoas concorda que o âmbito dos direitos individuais está limitado pelos direitos dos outros. Motivo pelo qual, tem-se o direito de fazer tudo o que não for proibido por uma lei. Os direitos estão relacionados com deveres. Sempre que alguém tiver um direito, outra pessoa terá o dever de respeitálo. Um dever legal é uma obrigação de fazer coisas específicas — pagar impostos, por exemplo. O direito diz respeito àquilo que foi arranjado pelo Estado, ou com seu consentimento, para regular a vida comum.
5. A relação direito e moral É certo que, com o fenômeno da positivação, a produção e a aplicação do direito (escrito ou costumeiro) é regulado por regras (escritas) obrigatórias adotadas por um povo organizado em um território. A organização estatal moderna monopolizou nos seus órgãos componentes a produção e aplicação do direito, resolveu o problema da
A razão do Direito em Habermas
311
indeterminação cognitivo-objetivo (a questão quanto ao quê deve influenciar a conduta) mas não o cognitivo-subjetivo (como selecionar o conteúdo dessa regra). Para a solução do problema cognitivo-subjetivo, pode-se dividir o pensamento filosófico jurídico em pelo menos duas perspectivas: 1) vinculação do direito à moral, o qual propõe que a ação jurídica seja explicada pelo dever; 2) separação do direito à moral, para a qual a lei é um fato social, ou seja, uma instituição criada pelo homem com a finalidade de determinar as condutas e imposta pela coação estatal. A afirmação da separação do direito e moral conduz a três caminhos: a) uma perspectiva negativa: a afirmação da que a dominação exercida pelo direito é um projeto do grupo social mais influente como um meio para perpetrar a dominação sobre as massas; b) uma perspectiva neutra: que sustenta que o direito é composto por um conjunto de regras técnicas a serem aplicadas de modo neutro e imparcial; c) uma perspectiva positiva: a qual pretende que o direito seja explicado como um meio de aprimoramento das relações entre seres humanos. Na primeira perspectiva, muitos pretenderam encontrar o conteúdo das regras jurídicas incrustados em valores morais. Posto que, no pensamento kantiano a moral cuida do conjunto de questões que pertinem a todos os sujeitos em qualquer tempo e lugar e contém o modo pelo qual uma pessoa deve tratar outra (o que não significa que sua existência esteja vinculada com sua observância, ou seja, a determinação moral é válida ainda quando não seja seguida). Todavia, a vinculação direito e moral não é uma opção tranqüila. Habermas no “Posfácio” de “Faktizät und Geltung” apresenta que a absoluta vinculação do direito à moral não é possível porque: 1) o universo moral por não possuir fronteiras sociais ou históricas, abrange todas as pessoas naturais; enquanto que uma comunidade jurídica protege somente os integrantes de sua ordem, delimitada no espaço e no tempo; 2) as regras morais obrigam, o comportamento externo e se impõe em foro íntimo; o direito, por sua vez só se preocupa com o comportamento externo e para tanto possui força coativa que lhe confere forma impositiva; 3) o direito possui uma estratégia mais complexa que a da moral, porque: a) possibilita o debate e, ao mesmo tempo, restringe a liberdade de ação (com orientação simultânea em valores e interesses); b) confere uma forma impositiva a objetivos e programas coletivos (Habermas 1997, v. 2, p. 312–3). Se a distinção entre o justo e o injusto não está vinculada a uma moral universal. A segunda perspectiva traz a questão: a quem compete estabelecer o que é justo ou injusto? Alguns, afinados com a tradição hegeliana, pretenderam vincular a obrigatoriedade do direito à institucionalização do comportamento socialmente adequado, identificado com a perspectiva ética. Cumpre esclarecer, diferente da moral que transcende ao grupo, uma ética fica restrita a interpretação que este elabora sobre a idéia de “vida boa” (modo de vestir, alimentar . . . ). Neste sentido, Ronald Dworkin explica que a ética inclui convicções sobre quê tipos de vida são bons ou maus para uma pessoa (Dworkin 1996, p. 135).
312
Giovanne Bressan Schiavon
As teorias éticas do direito surgem da percepção de que a sociedade é heterogênea e pluralista, repartida em classes e grupos, cujos conflitos e lutas de interesses são os mais contraditórios possíveis. Assim não se permite mais explicar as normas como resultado de um “contrato social”, no qual o grupo abre mão de sua liberdade em prol do Estado. Isso porque, em um mesmo grupo social há múltiplas concepções de vida boa e mesmo de justiça. Motivo pelo qual a estabilidade das normas se torna problemática. Nesse contexto é de convir que a metodologia clássica tivesse de ser substituída (ou modificada) por regras interpretativas correspondentes à concepções mais dinâmicas, que contemplassem essa nova compreensão da sociedade. Nesse sentido, o ordenamento não existe de forma sistemática. O sentido da lei depende da interpretação judicial. Mesmo que o juiz pretendesse encontrar uma única decisão correta na lei, a existência de princípios contraditórios não permitiriam. Aqui, é possível a denúncia de que os juízes ao julgar protegem interesses próprios ou de um grupo social. Contra aqueles que afirmam a absoluta separação do direito e moral, Habermas reconstrói a compreensão tradicional da sociedade em prol da racionalidade comunicativa dos modernos. Para tanto firma a noção de que o direito deve ser elaborado e aplicado discursivamente. Ou seja, a noção absoluta de justiça será identificada nos vários argumentos expressos na comunicação cotidiana do mundo da vida. Então, torna-se possível uma explicação alternativa para a relação direito e moral. O discurso social passa a ser descrito como procedimento que possibilita ao grupo resgatar o direito como instrumento que possibilita a vida em sociedade, com os seguintes argumentos: 1) Embora a necessidade do direito derive do aparecimento de um conflito de interesses — situação que exige uma ordem de validade objetiva reconhecida como justa, para restabelecer a paz social — Habermas argumenta apesar do conflito, ou mesmo, em razão de sua existência, as partes teriam interesse na sua resolução e estrategicamente, de maneira inconsciente, fornecem elementos aptos ao consenso. Ao julgador (aplicador do direito) caberia captar esses argumentos e proferir o julgamento imparcial, sem necessidade de recurso a uma moral metafísica para justificá-lo; 2) Sobre a crítica de que, com o direito desvinculado da moral correr-se-ia o risco da indeterminação. Ou seja, uma vez que os discursos em condições ideais podem não ter fim, ou mesmo porque as regras do discurso podem não ser suficientemente seletivas para possibilitar uma única saída correta. Aqui, Habermas propõe a complementação da interpretação do direito por argumentos especiais (morais, éticos e pragmáticos) os princípios. Tais especificam as condições gerais do processo de discursos práticos-morais em relação à ligação com o direito vigente; 3) Sobre a crítica da impossibilidade da adoção desses princípios gerais, pois o direito não é um todo coerente. Habermas concorda que o discurso social e as regras jurídicas podem espelhar teorias políticas e argumentos contraditórios. Porém se o
A razão do Direito em Habermas
313
direito é composto por regras e muitas das quais não podem ser identificas como componentes de um todo coerente, sua aplicação deve ser sempre coerente. Havendo a necessidade de se buscar não a única decisão correta, mas a melhor decisão possível (Habermas 1997, v. 1, p. 288–9). Então, para Habermas, o direito é compatível com o procedimento argumentativo, que expressa a intersubjetividade das relações sociais. Faz eco aos estudos de J. L. Austin e J. Searle, para os quais, quando de seus estudos sobre o sentido da linguagem, o ato de fala induz seu próprio significado. As palavras podem fazer coisas. Toda vez que determinadas palavras são utilizadas constitui-se em verdadeiro agir. A pragmática lingüística sugere que devem ser diferenciadas as expressões, os enunciados, a partir de suas “pretensões”: descritiva, expressiva e normativa.
6. Validade do direito e espécies de normas jurídicas A “pretensão de validade” quando relacionada com o mundo objetivo, tem uma “pretensão descritiva” que confrontará o critério de verdade ou de falsidade. Note que a linguagem é que é passível de verdade ou de falsidade, não o ser. Quando relativa ao mundo subjetivo, do ser, a linguagem possui “pretensão expressiva”; toda vez que o enunciado refere-se a um “estado interno” há pretensão de validade expressiva. Esta terá como critério a sinceridade ou não sinceridade. Por fim, o mundo social contempla a “pretensão normativa” da linguagem; a qual enuncia parâmetros de correção ou não correção. Isto posto, inicia-se o estudo da norma jurídica pelo seu conceito. Pode se conceituar norma jurídica como a proposição enunciada numa forma aceita ou imposta pelo poder público (direito interno) ou pelas pessoas de direito internacional (direito internacional) como fundamento de um direito ou obrigação legítima. O primeiro aspecto a ser destacado deste conceito é a afirmação de que a norma expressa uma proposição e a conseqüência dessa assertiva. Por proposição entendese o significado do juízo realizado a partir de um conjunto de palavras (enunciado). Desse modo Hans Kelsen pôde distinguir proposição de enunciado. Um enunciado é a forma gramatical e lingüística pela qual um determinado significado é expresso. Por isso a mesma proposição pode ter enunciados diversos, e o mesmo enunciado pode exprimir proposições diversas. Ao contrário, com o mesmo enunciado pode-se exprimir, em contextos e circunstâncias variáveis, proposições diversas. Por exemplo, quando se diz, voltando-se para um amigo: “Gostaria de beber uma limonada”, pretende-se exprimir um desejo e além disso conferir ao amigo uma informação sobre o estado de espírito; se se dirigem as mesmas palavras para uma pessoa que está atrás do balcão de um bar, não se pretende expressar um desejo nem lhe dar uma informação, mas impor-lhe uma determinada conduta. Enquanto no primeiro uso da expressão é previsível, por parte do amigo, a resposta: “Eu também”; a mesma resposta por parte do segundo interlocutor seria quase uma ofensa.
314
Giovanne Bressan Schiavon
Então, pode-se afirmar que a norma jurídica é uma estrutura proposicional, posto que o seu conteúdo pode ser enunciado mediante uma ou mais palavras entre si correlacionadas, sendo certo que o significado do enunciado por uma norma jurídica só é dado pela interpretação das proposições que nela se contêm. A partir dessa primeira explicação algumas observações já são possíveis, quando se diz que uma norma jurídica é uma proposição, quer-se dizer que é um conjunto de palavras que têm um significado. O que interessa ao jurista, quando interpreta uma lei, é o seu significado. Como uma proposição em geral pode ter um significado, mas ser falsa, também uma proposição normativa pode ter um significado e ser falsa. Porém, essa análise de verdade ou falsidade, refere-se a um juízo de adequação da proposição com o contexto de proferimento e não um juízo de se o que foi dito representa um fato ou objeto. Exemplo, na linguagem descritiva quando se diz “banana”, quer se representar uma fruta. Em linguagem prescritiva quando se diz “fique quieto” pretende-se provocar um comportamento, o que pode ou não ser adequado. Então, o positivismo jurídico kelseniano quando desliga o direito da moral e possibilita a afirmação de que as proposições normativas, se diferenciam das proposições descritivas, uma vez que, as proposições descritivas utilizam o critério de verdade ou falsidade de modo diferente da proposição prescritiva, (pela qual se distingue proposição verdadeiras e válidas de proposições falsas ou inválidas) e por isso o sentido adequado da norma jurídica só aparece com o juízo de interpretação. Um segundo aspecto do conceito de norma jurídica “obrigação legítima”, força recordar que perante o direito da Modernidade uma norma existe quando houve observância de um determinado procedimento e quando seu conteúdo seja adequado ao conjunto normativo. Nesse sentido, afirma-se que esse juízo pode receber explicações distintas conforme se modifique a perspectiva de análise. Se para as teorias que vinculam o direito com a moral, só é obrigatória a conduta adequada ao senso de justiça, para as teorias que os separam, só é obrigatória a conduta enunciada numa forma prescrita e imposta pelo Estado ou que prevalece socialmente. O positivismo demonstrou que toda norma, seja moral, ética ou jurídica é imperativa por sempre significar uma definição de certo e errado e assim expressar uma pretensão de comandar condutas. Nesse sentido a norma jurídica distingue-se das outras espécies normativas porque somente essa é imposta pela força, somente essa é garantida por uma sanção externa e institucionalizada. Mas daí não decorre a conclusão de que norma válida é a norma efetivamente seguida numa determinada sociedade. Ora, o estudo e aplicação do direito se dão sobre um conjunto de comandos e o problema da real aplicação desses comandos é objeto de outro grupo de estudos, da sociologia. Por isso afirma-se que a efetividade da aplicação não é requisito da norma jurídica. Para Habermas, além de ser dotada de coação, o que efetivamente caracteriza uma norma jurídica, é o fato de ser uma estrutura enunciativa de uma forma de organização ou de conduta, que deve ser seguida de maneira objetiva e obrigatória. Se
A razão do Direito em Habermas
315
no modelo positivista a diferença entre normas é formal, no aspecto de que uma (primária) determina um dever às pessoas, ao tempo em que, outra (secundária) estabelece poderes e diz respeito à identificação, alteração e aplicação das regras primárias. Na obra de Habermas o gênero norma abrange duas espécies: regras e princípios. As regras são normas que já prevêem sua hipótese de aplicação, destinadas a comandar diretamente as condutas tal estatal, qual das pessoas. Enquanto que os princípios são normas mais gerais e abstratas que representam os valores incorporados ao conjunto normativo e desempenham uma função de “otimização” no conjunto normativo. Consideradas do ponto de vista de sua forma, ou modo de exteriorização de seu conteúdo, as normas de direito ora se revelam como ordens (mandamentos que garantem um determinado espaço de ação), ora como diretrizes, princípios ou preceitos meramente dispositivos. Nos dizeres de Robert Alexy a distinção entre regras e princípios constitui-se numa chave para a solução de problemas centrais do estudo das normas e do direito (Alexy 1997, p. 81–2). Sobre as perspectivas metodológicas, cumpre observar que: a proposta da vinculação do direito com a moral padece de dificuldades até agora não solucionadas, uma vez que, na modernidade não existem mais modelos de justiça universalmente válidos. Por outro lado, a proposta da estrita separação entre direito e moral, por considerar como requisito da norma jurídica unicamente a imperatividade, termina por vincular o conceito de norma à exclusiva atuação estatal sob a promessa de produção de enunciados normativos certos e determinados. Isso na prática resultou na defesa da legalidade em detrimento da legitimidade do direito. Habermas propõe a conciliação destas perspectivas com a afirmação de que validade jurídica é um conceito que deve ser vinculado à atuação do Estado garantindo que a maioria das pessoas obedeça às normas: a) mesmo que isso implique o emprego de sanções; ou, b) por meio de pressupostos institucionais se vincule os destinatários das leis à sua produção (surgimento legítimo da norma) para que ela também possa ser seguida a qualquer momento por convicção (1997, v. 2, p. 308). Vale ressaltar, que não parece correta a afirmação comumente associada à teoria positivista de que uma ordem jurídica possa se sustentar somente por coação ou na ameaça de sanção. O direito procedimental não despreza o dado social (particular seleção de regras sustentadas pelo poder coercitivo) porém o direito não obtém obediência fundando-se somente em mera coerção, ou ameaça de sanção, mas também na sua legitimidade. Assim, a compreensão do direito passa a se mover sob dois princípios fundamentais: segurança jurídica e o da legitimidade (adequação à idéia de justiça).
7. Princípios funcionais do direito O direito, pelo princípio da segurança jurídica deve ser uma força que se impõe na sociedade o que (por via de conseqüência) gera uma certa previsibilidade das condutas. Joseph Raz afirma, por exemplo, que o Estado de direito “significa uma organização
316
Giovanne Bressan Schiavon
em que todos são iguais perante a lei e todos sabem qual é sua situação perante a lei, sabendo o tratamento que podem esperar se assumirem um comportamento ou outro” (Kukathas e Pettit 1995, p. 37). Pelo outro princípio, o da legitimidade, destaca-se que essa força pode surgir de seu reconhecimento como justa, ou seja independente do aparato estatal, mas sim de sua identidade com a justiça. Não raro, quando da interpretação da norma jurídica, a segurança jurídica (coerência sistêmica) é obtida em detrimento da idéia de justiça. Nesse sentido, pretender descobrir a resposta correta em um julgamento jurídico significa responder primeiro se isso é possível e depois como se conciliar esses dois princípios. Cada concepção, ou teoria sobre o direito, tende a valorizar um princípio em detrimento do outro, aqueles que separam o direito da moral valorizam a segurança jurídica, os que os associam valorizam a justiça. Com a proposta da interpretação a partir de princípios busca-se solucionar o problema de legitimação do direito sem descuidar da segurança jurídica. Melhor dizendo, a partir do momento que se adota uma perspectiva de que o direito deve ser resultado da participação da sociedade e de que a função do Estado é intermediar as relações, a norma jurídica, então, será válida quando desempenhar esse papel. Motivo pelo qual o conceito de legitimidade deixa de assumir uma explicação formal e passa a ser tido como um conceito material. A coerência sistêmica, tão almejada pelo positivismo jurídico, não será conhecida de antemão. Pelo contrário, será obtida a posteriori pelo juiz à luz do caso concreto, nunca se conhecerá a resposta (ou interpretação) correta antes da situação real ser apresentada ao juiz. Uma norma é legítima quando houver reconhecimento social da adequação do seu conteúdo com o conceito de justo discursivamente compartilhado. Cabe enfatizar que o Discurso de que fala Habermas parte daquilo que ele próprio denomina uma “situação ideal de fala” e que, na maioria das vezes, nos discursos reais que ocorrem nem todos esses pressupostos são cumpridos. Talvez o não cumprimento destes pressupostos seja uma das causas de tantas situações reais de fala conduzirem a conflitos e não ao consenso, isso sem contar o ressentimento advindo de uma expectativa quebrada e que pode culminar com atos violentos por parte de indivíduos e até mesmo de nações. Entretanto, fica evidenciado na reflexão habermasiana, e algo similar pode ser dito de Kant, que a definição das condições de vida em sociedade e de suas respectivas regras são um processo necessariamente argumentativo, sem coação e, portanto, não violento.
8. Conclusão Nesse sentido, a moral discursiva, ao lado da ética e dos enunciados descritivos, é um dos elementos a considerar no momento de criação e aplicação do direito. Afirma
A razão do Direito em Habermas
317
então que os princípios jurídicos resultado de incorporação ao direito de projetos deliberados socialmente, devem ser considerados quando da aplicação das regras. Vale destacar, os cidadãos passam a ser entendidos não só como destinatários, mas também como autores das normas jurídicas. A liberdade da pessoa não se restringirá ao espaço determinado pelos direitos subjetivos descritos nas regras de direito, mas reside em conduzir-se criticamente tanto frente a condutas alheias quanto às próprias. Desse modo, Habermas não fundamenta o direito exclusivamente na coerção e, também, não o vincula subjetivamente à moral. O agir jurídico é explicado pelo entendimento. E por meio deste o direito é capaz de mediar as relações entre os subsistemas e preservar as relações cotidianas. Aylton Barbieri no 2o¯ seminário internacional de filosofia política e jurídica identificou aqui o papel imenso conferido ao direito no livro Faktizität und Geltung. Destacou que, se os subsistemas especializados cada vez mais intervêem no mundo da vida das relações cotidianas, tal com a invasão dos termos técnicos, qual com a afirmação de uma verdade inquestionável em suas proposições. O subsistema jurídico ao disciplinar as relações entre os subsistemas e mundo da vida termina pode lhe proteger. A soberana vontade popular, origem do direito, deve assumir a possibilidade de intervir nos subsistemas (mercado, política etc.). Essa abordagem é similar ao positivismo jurídico, em seu projeto de desvincular a explicação do direito de um conteúdo metafísico (os valores do jusnaturalismo, por exemplo). Mas, em vez de vincular o direito à sua utilidade de modo neutro ou imparcial, apresenta que a validade do direito deve se dar através da aplicação das regras jurídicas a partir de princípios hermenêuticos obtidos por um procedimento reconhecido por todos e que reproduzam os objetivos e as funções do direito. Esse procedimento não será neutro, nem imparcial, e surgirá com a percepção de que o Estado e o direito devem ser utilizados para promoção de uma sociedade desejável. Intérprete dos tempos atuais, Habermas continua sua obra de enfrentamento com os céticos quanto ao projeto emancipatório da modernidade, argumentando que a racionalidade comunicativa pode ser incorporada ao trabalho jurídico. Isso por meio do debate sobre temas prementes da sociedade e do direito. Como por exemplo, o fenômeno político da modificação do conceito de soberania, a emergência da revisão da teoria constitucional e, por fim, a internacionalização dos direitos humanos.
Referências Alexy, R. 1997. Teoria de los derechos fundamentales. Trad. Ernesto Garzón Valdés. Madrid: Centro de Estudios Constitucionales. Dworkin, R. 1996. La comunidad liberal. Trad. Claudio Montilla. Santafé de Bogotá: Siglo del Hombre – Facultad de Derecho – Universidad de los Andes. Habermas, J. 1997. Direito e democracia: entre faticidade e validade. Trad. Flávio Beno Siebeneichler. Rio de Janeiro: Tempo Brasileiro, 2 v.
318
Giovanne Bressan Schiavon
—–. 1999. La inclusión del otro: Estudios de teoría política. Trad. Juan Carlos Velasco Arroyo e Gerard Vilar Roca. Barcelona: Paidós. Kukathas, C. e Pettit, P. 1995. Rawls “Uma teoria da justiça” e os seus críticos. Trad. Maria Carvalho. Lisboa: Gradiva. Peña Echeveria, J. 1996. Identidad comunitaria y universalismo. Crítica [UEL/PR] 2(5): 5–54.
A R ELAÇÃO ENTRE D EVER E I NCLINAÇÃO NA P RIMEIRA S EÇÃO DA “F UNDAMENTAÇÃO DA METAFÍSICA DOS COSTUMES ” J OEL T HIAGO K LEIN Universidade Federal de Santa Maria
jthklein@yahoo.com.br
A ética kantiana frequentemente é caricaturada como uma proposta racionalista totalmente desvinculada da realidade sensível, logo, como completamente alheia à realidade humana. A pureza exigida por Kant no processo de busca e fixação do princípio da moralidade fortalece uma série de preconceitos nos críticos da filosofia kantiana. Paradoxalmente, uma grande fonte de mal entendidos são os exemplos fornecidos por Kant no intuito de esclarecer sua posição. No intuito de esclarecer em que consiste o valor moral de uma ação e de que forma as inclinações sensíveis podem ou não se relacionar com uma ação considerada moral, passa-se agora a analisar os exemplos que Kant oferece na primeira seção da Fundamentação da metafísica dos costumes. Em outras palavras, pretende-se determinar o que se segue e o que não se segue da fundamentação da moral kantiana para o campo do ajuizamento moral, o que nada mais é do que um dos momentos que constituem a discussão sobre a aplicabilidade da teoria. Discute-se o trecho da Fundamentação por acreditar-se que ele serve como modelo paradigmático à proposta kantiana de ajuizamento moral. Os exemplos apresentados e discutidos na primeira seção da Fundamentação constituem de maneira implícita a primeira das três proposições sobre o dever que Kant afirma apresentar na primeira seção.1 Na exposição dos exemplos já se pressupõem que existe algo como “dever”, isto é, assume-se que a tarefa de busca e fixação da lei moral seja algo já estabelecido. A sua intenção é determinar claramente o que seria uma ação moral, isto é, mostrar que uma ação possui valor moral somente na medida em que é realizada por dever. Na busca pela determinação do valor moral de uma ação, Kant descarta de início aquelas ações contrárias ao dever. Poder-se-ia perguntar de que forma sabe-se que uma ação é contrária ao dever. Contudo, é importante perceber que Kant não quer fornecer um critério para julgamento de ações particulares, por isso, o problema não diz respeito ao fato de como se pode saber se uma determinada ação é realizada ou não por dever, se possui ou não valor moral. O objetivo de Kant é esclarecer o conceito de ação moral e, nesse sentido, trata-se de uma distinção conceitual e não da determinação de critérios para o julgamento moral de ações particulares. Dessa forma, quando Kant diz que, de antemão descarta as ações contrárias ao dever, precisa-se perceber que ele qualifica sua afirmação dizendo que se trata de ações “reconhecidas como contrárias ao dever” (Kant 1980, p. 112). Além do mais, a discussão não poderia tratar do julgamento de determinadas ações particulares, visto que o próprio Kant impõe uma barreira intransponível à deDutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 319–325.
320
Joel Thiago Klein
terminação segura dos motivos de um agente em uma situação particular. Nas palavras de Kant: [acontece] por vezes na verdade que, apesar do mais agudo exame de consciência, não possamos encontrar nada, fora do motivo moral do dever, que pudesse ser suficientemente forte para nos impelir a tal ou tal boa ação ou a tal grande sacrifício. Mas daqui não se pode concluir com segurança que não tenha sido um impulso secreto do amor-próprio, oculto sob a simples capa daquela idéia, a verdadeira causa determinante da vontade. Gostamos de lisonjear-nos então com um móbil mais nobre que falsamente nos arrogamos; mas em realidade, mesmo pelo exame mais esforçado, nunca podemos penetrar completamente até aos móbiles secretos dos nossos atos, porque, quando se fala do valor moral, não é das ações visíveis que se trata, mas dos seus princípios íntimos que se não vêem. (Kant 1980, p. 119, itálico acrescentado)
Em sua análise, Kant também deixa de lado as ações conformes ao dever, mas realizadas não por dever e sim por uma inclinação egoísta. Kant menciona o exemplo de um vendedor que não sobe os preços para o comprador inexperiente por estratégia de manter a freguesia através de sua reputação de honesto. Considerando-se que se trata de uma distinção conceitual, segue-se que não é o caso de se afirmar que nenhum merceeiro possa manter os preços por dever e não por inclinação egoísta, mas apenas que, supondo que um merceeiro age por meio de uma intenção egoísta, segue-se que sua ação não é moral. A dificuldade surge, segundo Kant, na seguinte questão: pode-se atribuir valor moral a uma ação que é conforme ao dever e cujo fundamento é uma inclinação imediata? Ou ainda, uma ação realizada por dever, mas que se vincula também a uma inclinação imediata, possui valor moral? Apesar de semelhantes, essas são, na verdade, duas questões completamente diferentes. A primeira indaga se uma ação realizada por inclinação imediata possui valor moral, a outra questiona se uma ação realizada por dever precisa necessariamente excluir em todos os momentos qualquer tipo de inclinação imediata. Dependendo da resposta à essas questões, define-se o modo como a ética kantiana encara a relação entre dever e inclinações nos campos da determinação e aplicação moral. Kant oferece os seguintes exemplos: Conservar cada qual a sua vida é um dever, e é além disso uma coisa para que toda a gente tem inclinação imediata. Mas por isso mesmo é que o cuidado, por vezes ansioso, que a maioria dos homens lhe dedica não tem nenhum valor intrínseco e a máxima que o exprime nenhum conteúdo moral. Os homens conservam a sua vida conforme ao dever, sem dúvida, mas não por dever. Em contraposição, quando as contrariedades e o desgosto sem esperança roubaram totalmente o gosto de viver, quando o infeliz, com fortaleza de alma, mais enfadado do que desalentado ou abatido, deseja a morte, e conserva contudo a vida sem a amar, não por inclinação ou por medo, mas por dever, então a sua máxima tem um conteúdo moral.
A relação entre dever e inclinação
321
Ser caritativo quando se pode sê-lo é um dever, e há além disso muitas almas de disposição tão compassiva que, mesmo sem nenhum outro motivo de vaidade ou interesse, acham íntimo prazer em espalhar alegria à sua volta e se podem alegrar com o contentamento dos outros, enquanto este é obra sua. Eu afirmo porém que neste caso uma tal ação, por conforme ao dever, por amável que seja, não tem contudo nenhum verdadeiro valor moral, mas vai emparelhar com outras inclinações, por exemplo o amor das honras que, quando por feliz acaso topa aquilo que efetivamente e de interesse geral e conforme ao dever, é conseqüentemente honroso e merece louvor e estímulo, mas não estima; pois a máxima falta o conteúdo moral que manda tais ações se pratiquem, não por inclinação, mas por dever. Admitindo pois que o ânimo desse [jenes] filantropo estivesse velado pelo desgosto pessoal que apaga toda a compaixão pela sorte alheia, e que ele continuasse a ter a possibilidade de fazer bem aos desgraçados, mas que a desgraça alheia não o tocava porque estava bastante ocupado com a sua própria; se agora que nenhuma inclinação o estimula já, ele se arrancasse a esta mortal insensibilidade e praticasse a ação sem qualquer inclinação, simplesmente por dever, só então é que ela teria o seu autêntico valor moral. (Kant 1980, p. 112–3)
A maioria dos indivíduos cuida da sua própria vida pelo fato de possuírem uma inclinação imediata para isso. Também não é difícil representar-se alguém que “mesmo sem nenhum outro motivo de vaidade ou interesse, [acha] íntimo prazer em espalhar alegria à sua volta e se [pode] alegrar com o contentamento dos outros, enquanto este é obra sua”, ou seja, um filantropo. Contudo, para Kant, o comportamento desses agentes é um comportamento conforme ao dever, mas não por dever, por conseguinte, sua máxima não possui nenhum conteúdo moral. Com esses exemplos Kant quer destacar que apenas ações realizadas por dever (aus Pflicht) possuem conteúdo moral. Em outras palavras, uma ação somente possui valor moral se a sua máxima for determinada pela lei moral. Além disso, deve-se perceber que Kant não afirma que as inclinações sejam algo ruim, elas apenas não conferem valor moral às ações. Ele inclusive afirma que as ações do filantropo são honrosas e dignas de louvor e estímulo, mas não dignas de estima. O que precisa ser discutido é se na teoria kantiana há espaço para algo como uma ação realizada simultaneamente por dever e por inclinação imediata, isto é, aus Pflicht und aus unmittelbarer Neigung.2 Essa discussão se refere a primeira questão mencionada acima. Em primeiro lugar, depõe contra essa posição o fato dos exemplos destacarem justamente que as ações dotadas de valor moral são aquelas realizadas puramente a partir do dever, as quais não necessitam de qualquer impulso ou auxílio de inclinações, ficando claro que é apenas a lei moral que atribui valor moral à ação. Em segundo lugar, se uma ação moral precisasse, além do dever, de uma inclinação, então, isso significaria que a lei moral não é suficientemente forte para determinar uma ação, logo, uma ação não poderia ser realizada apenas por dever (aus Pflicht). Nesse caso, a imperatividade da lei moral seria uma mera quimera, pois, na verdade, ela não ordena nada por si mesma. Como que prevendo essa forma equivocada de
Joel Thiago Klein
322
leitura, Kant expõe o seguinte exemplo: Se a natureza tivesse posto no coração deste ou daquele homem pouca simpatia, e ele (honrado de resto) fosse por temperamento frio e indiferente às dores dos outros por ser ele mesmo dotado especialmente de paciência e capacidade de resistência às suas próprias dores e por isso pressupusesse e exigisse as mesmas qualidades dos outros; se a natureza não tivesse feito de um tal homem (que em boa verdade não seria o seu pior produto) propriamente um filantropo — não poderia ele encontrar ainda dentro de si um manancial que lhe pudesse dar um valor muito mais elevado do que o dum temperamento bondoso? Sem dúvida — e exatamente aí é que começa o valor do caráter, que é moralmente sem qualquer comparação o mais alto, e que consiste em fazer o bem, não por inclinação, mas por dever. (Kant 1989, p. 113, itálico acrescentado)
A segunda questão mencionada acima refere-se ao problema de se uma ação moral precisa exigir a ausência completa de qualquer inclinação. De outra forma, a ética kantiana tem como conseqüência que apenas um misantropo ou alguém que não sinta inclinação imediata alguma em viver pode agir moralmente. Nessa linha de interpretação é posta a famosa crítica de Schiller que se lamenta por ajudar seus amigos com prazer. O prazer que ele sente na ação tiraria todo o valor moral da ação, por conseguinte, a “lei moral” nos obrigaria a realizar o dever com desprazer (Abscheu).3 Em primeiro lugar, precisa-se ter em consideração que os exemplos que Kant oferece têm a função elucidativa e não a função de servir de regra para o ajuizamento moral. Isso faz com que as situações apresentadas sirvam como casos possíveis, mas não como os únicos. Em segundo lugar, é preciso perceber que a intenção de Kant é excluir a inclinação como o elemento responsável pelo estabelecimento da máxima da ação, não da ação particular mesma. Nesse sentido, a seguinte passagem é importante: Só pode ser objeto de respeito e portanto mandamento aquilo que está ligado à minha vontade somente como princípio e nunca como efeito, não aquilo que serve à minha inclinação mas o que a domina ou que, pelo menos, a exclui do cálculo na escolha [wenigstens diese von deren Überschlage bei der Wahl ganz ausschließt], quer dizer, a simples lei por si mesma. (Kant 1980, p. 114, itálico acrescentado)
Ao se considerar atentamente a letra do texto, nota-se que Kant ressalta que a inclinação não deve participar do ato pelo qual o indivíduo estabelece a máxima da sua ação, mas não nega que ela possa estar presente no próprio indivíduo que age moralmente. A formulação de Kant deixa em aberto se no momento da ação a inclinação precisa ser excluída ou não. Isso significa que, segundo a teoria kantiana, um misantropo pode e deve ser uma pessoa moral, mas a moralidade não precisa conduzir a misantropia.4 Ou ainda, não há nenhuma relação condicional entre moralidade e misantropia, por exemplo. Dessa forma, parece não haver uma impossibilidade teórica de concebermos um filantropo moral, ou seja, alguém que ajuda aos
A relação entre dever e inclinação
323
outros por dever e, além disso, sente prazer em fazer isso, isto é, sente uma inclinação imediata (um amor para com os outros). Essa forma de leitura assume que a ética kantiana pode admitir a fórmula “ação por dever e com inclinação” (aus Pflicht mit Neigung). O significado expresso por ela é diferente daquela fórmula mencionada anteriormente, a saber, “ação por dever e por inclinação” (aus Pflicht und aus Neigung). É importante que se perceba que no exemplo do dever de caridade não fica excluído a possibilidade de uma ação ser simultaneamente moral e o indivíduo também possuir uma inclinação imediata. O exemplo refere-se a um mesmo indivíduo que num primeiro momento age por filantropia e num segundo momento, com a falta dessa inclinação, passa a desempenhar a caridade por dever.5 Admita-se que esse mesmo indivíduo que desempenha o seu dever, por respeito à lei, acabe desenvolvendo novamente o sentimento de filantropia. Isso faria com que ele necessariamente deixe de agir por dever e os seus atos deixem de ser morais? A resposta mais razoável é: “não necessariamente”. Claro que é difícil representar uma situação onde o indivíduo age por dever e possui, ao mesmo tempo, uma inclinação imediata para realizar tal ação.6 Contudo, é possível conceber conceitualmente tal situação, a saber, uma ação cuja máxima é estabelecida através do respeito pela lei moral e, além disso, o indivíduo possui um sentimento favorável a tal ação. Veja-se que a lei moral deve determinar a máxima da ação, mas o indivíduo, no momento da ação, poderia sentir satisfação ou mesmo sentir uma inclinação imediata para aquela ação. O modo de compreender a relação entre “ação moral” e “inclinação” como podendo ser expresso pela fórmula “aus Pflicht mit Neigung” pressupõe que o conceito de “ação” envolve, pelo menos, dois momentos ou níveis. No primeiro nível, tem-se a reflexão realizada pelo indivíduo e o estabelecimento da máxima da ação, ou melhor, da máxima da conduta. No segundo nível, tem-se a ação propriamente dita enquanto uma ação particular empiricamente condicionada. O valor moral da ação, o qual exige que ela seja realizada simplesmente por dever, é uma atribuição que pertence ao primeiro nível do conceito de “ação”. O fato de uma máxima ser estabelecida por respeito à lei moral, não exclui a possibilidade de haver inclinações envolvidas na realização da ação, isto é, no segundo nível da “ação”. Como uma contraprova a essa interpretação considere-se o seguinte: se Kant excluísse completamente a possibilidade das inclinações e dos sentimentos configurarem no contexto moral, então, como poder-se-ia ler a passagem onde ele afirma que a felicidade, sob a qual se reúnem uma enorme soma de inclinações sensíveis, deve ser buscada e fomentada?7 Também na Metafísica dos Costumes Kant aborda essa temática dos sentimentos vinculados à ação moral. Ali ele distingue entre sentimentos patológicos (estéticos) e sentimentos morais (práticos). Aqueles precedem à representação da lei moral, esses podem segui-la. Apesar dos sentimentos práticos não poderem ser ordenados, visto que “o que se faz por coação não se faz por amor” (Kant 1999, p. 257 (b)), eles podem ser desenvolvidos indiretamente mediante a prática da moralidade.8 Mais adiante no texto, Kant afirma que existe certo tipo de de-
Joel Thiago Klein
324
ver especial, isto é, um dever indireto de cultivar sentimentos naturais compassivos (estéticos) e utilizá-los como outros tantos meios para a participação que nasce de princípios morais e do sentimento correspondente (cf. Kant 1999, p. 329 (b)). Veja-se a seguinte passagem: Alegrar-se com os outros e sofrer com eles (sympathia moralis) são sem dúvida sentimentos sensíveis de prazer ou desagrado (que, por tanto, hão de chamar-se estéticos) pelo estado de satisfação ou de dor alheios (simpatia, sentimento de compartilhar), para os quais já a natureza tem feito receptivos aos homens. Mas utilizá-los como meio para fomentar a benevolência ativa e racional é todavia um dever especial, ainda que somente condicionado, que leva o nome de humanidade (humanitas): porque aqui o homem não se considera unicamente com um ser racional, senão como um animal dotado de razão. (Kant 1999, p. 327–8 (b))
Pode-se ler a última frase desse excerto vinculada com o que foi chamado de segundo nível envolvido no conceito de ação. No primeiro nível, todos os sentimentos devem ser excluídos, caso contrário, a ação será desprovida de valor moral. Mas no segundo nível, isto é, ao se considerar a ação particular, é impossível desvencilharse das determinações da sensibilidade. Afinal de contas, o único campo em que o homem pode agir é a experiência e, por isso, está sob as suas leis. No momento da aplicação da máxima escolhida a uma determinada situação em particular, o homem se encontra preso às regras da experiência. Ele não pode evitar gostar ou desgostar de algo. Ele pode estabelecer o que ele faz, não o que ele sente no momento da ação e por isso ele se encontra na situação de um animal. Essa leitura também permite compreender de que forma Kant pode falar em certos momentos de sentimentos que podem auxiliar a moralidade e, em outros, rejeita completamente qualquer influência sensível no estabelecimento de uma máxima moral. Ora se aceitarmos que a ação comporta dois níveis, então, pode-se restringir a influência das inclinações e dos sentimentos ao segundo nível. Ali eles podem ser vistos não como motivos da ação, mas como elementos sensíveis que não dificultam a execução da máxima. A existência de sentimentos favoráveis à lei moral impede que surjam ou que se fortaleçam sentimentos que não são favoráveis à lei. Por “favorável”, entende-se aqui os sentimentos que no momento da ação empiricamente considerada não fazem com que o indivíduo sinta desejo de abdicar de sua máxima e abrir uma exceção para si na legislação moral. Sentimentos favoráveis à lei moral são aqueles que facilitam a aplicação da máxima moral em situações singulares. Contudo, tal como era o intuito de Kant na primeira seção da Fundamentação, a completa falta de inclinação imediata não impossibilita que o sujeito ainda assim desempenhe a sua ação conforme a sua máxima.
Referências Allison, H. 1990. Kant’s theory of freedom. Cambridge: Cambridge University Press.
A relação entre dever e inclinação
325
Baron, M. 2006. Acting from Duty (GMS I, 397-401). In: Christoph Horn e Dieter Schönecker (eds., in cooperation with Corinna Mieth) Groundwork for the metaphysics of morals. Berlin; New York: Walter de Gruyter, p. 3–22. Bittner, R. 1993. Das Unternehmen einer Grundlegung zur Metaphysik der Sitten. In: Otfried Höffe (Hrsg.) Grundlegung zur Metaphysik der Sitten: Ein kooperativer Kommentar. Frankfurt am Main: Klostermann, p. 13–30. Kant, I. 1980. Fundamentação da metafísica dos costumes. Trad. Paulo Quintela. (Coleção Os Pensadores) São Paulo: Abril Cultural, p. 101–62. —–. 1999a. Grundlegung zur Metaphysik der Sitten. Mit einer Einl. hrsg. von Bernd Kraft und Dieter Schönecker. Hamburg: Meiner. —–. 1999b. La metafísica de las costumbres. 3.ed. Trad. Adela Cortina Orts e Jesus Conill Sancho. Madrid: Editorial Tecnos. Schönecker, D.; Wood, A. 2002. Immanuel Kant ‘Grundlegung zur Metaphysik der Sitten’: Ein einführender Kommentar. Padernborn; München; Wien; Zürich: Schöningh.
Notas 1 Segundo Schönecker e Wood (2002, p. 60–1), as três proposições sobre o dever são: 1) uma ação a
partir do dever é uma ação a partir do respeito pela lei; 2) uma ação a partir do dever segue uma máxima ordenada pela lei moral e é com isso uma ação necessariamente ordenada através da lei moral objetiva; 3) dever é a necessidade de uma ação a partir do respeito pela lei. 2 Essa interpretação é chamada de “motivationalen Überbestimmung” (Schönecker e Wood 2002, p. 69) 3 Conforme Schiller: “Gewissensskrupel: Gerne dien ich den Freunden,/ doch tu ich es leider mit Neigung,/ und so wurmt mir oft,/ daß ich nicht tugendhaft bin. Decisium: Da ist kein anderer Rat,/ du mußt suchen, sie zu verachten,/ und mit Abscheu alsdann tun,/ was die Pflicht dir gebeut” (Schiller, F. Werke, Nationalausgabe, Bd.I, S.357, apud Schönecker e Wood 2002, p. 70). 4 Por misantropia entende-se aqui um homem de “temperamento frio e indiferente às dores dos outros”. 5 Não é unanimidade interpretar o exemplo do dever de caridade como sendo um exemplo que se refere a um mesmo agente em dois momentos distintos. Um exemplo dessa leitura: Schönecker e Wood (2002, p. 68. nota). Mas a própria formulação de Kant utilizando o termo “jenes” indica que trata-se do mesmo indivíduo em dois momentos distintos. 6 Schönecker e Wood criticam essa posição da seguinte forma: “Vielleicht könnte man noch meinen, daß eine Handlung aus Pflicht erfolgen kann, die von der Existenz einer Neigung begleitet wird, die aber tatsächlich keinen Einfluß ausübt. Allerdings fällt es schwer, sich vorzustellen, wie man etwa einen Menschen liebe kann (wobei wir die Liebe als Neigung verstehen), ihm in einer bestimmten Situation aber nicht aus dieser Neigung, sondern aus Pflicht hilft, obwohl die Neigung (die Liebe) present ist” (Schönecker e Wood 2002, p. 68). 7 Conforme: “Assegurar cada qual a sua própria felicidade é um dever (pelo menos indiretamente); pois a ausência de contentamento com o seu próprio estado num torvelinho de muitos cuidados e no meio de necessidades insatisfeitas poderia facilmente tornar-se uma grande tentação para a transgressão dos deveres” (Kant 1980, p. 113). 8 Conforme: “Fazer o bem é um dever. Quem o pratica muitas vezes e tem êxito em seu propósito bem feitor, chega ao final a amar efetivamente àquele a quem tem feito o bem. Portanto, quando se diz: deves amar ao teu próximo como a ti mesmo, não significa: deves amar imediatamente (primeiro) e mediante este amor fazer o bem (depois), senão: faz o bem a teu próximo e esta beneficência provocará em ti o amor aos homens (como hábito da inclinação à beneficência)” (Kant 1999, p. 257 (b)).
S OBRE A P OSSIBILIDADE DE UMA T EORIA M ORAL B ASEADA EM D IREITOS M ARCO A NTONIO O LIVEIRA DE A ZEVEDO IPA – Centro Universitário Metodista
mazevedo@via-rs.net
1. Introdução Não obstante sejam poucos os filósofos que não atribuam algum papel aos direitos em suas teorias, são poucos os que consideram direitos como tendo o papel central em suas abordagens. Um destes é Robert Nozick (1974). Nozick é um dos mais notáveis defensores de uma concepção de filosofia moral baseada em direitos. Sua referência é a teoria moderna do direito natural de John Locke. Outro filósofo contemporâneo defensor de uma abordagem em filosofia moral centrada em direitos é Ronald Dworkin (1977). No capítulo “A justiça e os direitos” de Levando os direitos a sério (1977; 2002, p. 266), Dworkin disse que cada teoria política bem formada, ainda que possa incluir em seu escopo tanto metas sociais, como direitos e deveres atribuídos a indivíduos, atribui um “lugar de honra” a apenas um desses conceitos: ou uma meta dominante (como a utilidade geral), ou um conjunto de direitos fundamentais, ou um conjunto de deveres transcendentes. É nesse aspecto que Dworkin claramente se alinha a Thomas Paine na defesa de uma concepção de moralidade política baseada em direitos. Embora Nozick e Dworkin defendam teorias igualmente centradas em direitos, as divergências entre ambos não são pequenas. Dworkin alia-se a uma concepção de justiça distributiva influenciada especialmente pelo igualitarismo de John Rawls (1971); Nozick, por sua vez, atacou duramente as concepções de justiça distributiva, especialmente as baseadas no igualitarismo “kantiano” de Rawls (Nozick defende o que poderíamos chamar de “tese da primazia absoluta dos direitos” individuais, sejam eles “naturais” ou “adquiridos”, sobre quaisquer políticas ou considerações públicas de justiça social distributiva). Não obstante isso, o que os torna defensores de uma abordagem geral em filosofia moral e política igualmente baseada em direitos é o fato de ambos defenderem uma concepção de moralidade política baseada primariamente no respeito aos direitos dos indivíduos, bem como o fato de ambos defenderem a primazia desses direitos sobre quaisquer outras obrigações ou interesses individuais ou coletivos não amparados em direitos individuais (uma tese que Dworkin tornou explícita).1 Embora Nozick e Dworkin sejam os mais conhecidos defensores de uma teoria moral ancorada em direitos, penso que a abordagem mais persuasiva nesse sentido foi a oferecida por Judith Jarvis Thomson (1990). Segundo Thomson, nós tomamos a nós mesmos como tendo direitos, do que se seguem conseqüências morais. Penso que o que Thomson sustenta é que direitos são fatos primitivos acerca de nós (ou Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 326–342.
Sobre a Possibilidade de uma Teoria Moral Baseada em Direitos
327
que há pelos menos alguns direitos que revelam aspectos inerentes ao que entendemos como sendo nossa natureza, ou ao menos como inerentes à imagem que dela fazemos). De todo modo, foi John Mackie quem considerou explicitamente a possibilidade de uma ética baseada em direitos como alternativa às teorias mais conhecidas e tradicionais: as éticas baseadas em obrigações (éticas deontológicas), as éticas conseqüencialistas (e as éticas ou concepções de moralidade política baseadas em metas sociais), e as éticas da virtude, incluindo as éticas perfeccionistas. Segundo Mackie, dizemos de uma teoria que é baseada em X (deveres, resultados, virtudes ou direitos) quando esta teoria toma X como o conceito que confere sentido ao conjunto da teoria (Mackie 1998, p. 141). Nesse escopo amplo, não somente teorias libertarianas, como a teoria de Nozick, ou teorias igualitaristas, como a teoria política de Dworkin, assim como teorias morais ao menos parcialmente baseadas em direitos, como a de Thomson, poderiam ser classificadas como baseadas em direitos, mas também as novas teorias do Direito Natural, como a teoria proposta por John Finnis (cuja referência clássica é Tomás de Aquino).2 Assim, influenciado por Mackie, podemos chamar de teorias morais baseadas em direitos a esse conjunto, internamente variado, de teorias morais que tomam o conceito de direito como central para o entendimento, senão da totalidade, ao menos de parte expressiva da moralidade humana. Neste ensaio, pretendo mostrar como é possível vincular conceitualmente restrições ou obrigações morais ao respeito a direitos individuais. Minha pretensão é modesta, pois, para uma argumentação completa em defesa de uma teoria moral baseada em direitos seria necessário um longo desenvolvimento, algo que está além dos objetivos de um pequeno ensaio. Pretendo, não obstante, contrastar duas visões gerais sobre “direitos” (direitos como títulos e direitos como exigências), e mostrar como uma visão adequada sobre direitos como exigências pode servir de base a uma teoria moral baseada em direitos. A seguir, a partir de conceitos desenvolvidos por Thomson, pretendo mostrar de que modo afirmações em torno de direitos podem contar como premissas em raciocínios práticos. Esses resultados fornecerão, assim penso, plausibilidade à idéia de uma teoria moral ao menos parcialmente baseada em direitos.
2. O que são direitos? Há duas visões distintas sobre o que são direitos. Chamo à primeira de visão dos direitos como títulos (em inglês, rights as entitlements) e à outra de visão dos direitos como exigências (em inglês, rights as claims) (Azevedo 2006). A primeira toma direitos como relações entre alguém e algo (no caso, um bem); a segunda toma direitos como relações entre um indivíduo (ou alguém) e outra pessoa, ou, mais propriamente, como exigências de alguém sobre outrem acerca de algo.3 Dessas duas, pode-se dizer que a primeira é a que poderíamos chamar de “visão dominante” ou “hegemônica”.4 Penso
328
Marco Antonio Oliveira de Azevedo
que é a visão que melhor caracteriza a concepção presente nos manifestos e no discurso comum dos ativistas dos direitos humanos. Há uma tendência entre os ativistas dos direitos humanos a considerar direitos como títulos e os direitos humanos como títulos de caráter especial. Em diferença aos direitos em geral, direitos humanos seriam títulos comuns a todos os seres humanos e inalienáveis. Por ‘título’ entenda-se aqui a “posse” ou vínculo, assim tido como legítimo, a certo bem (de fato, para os simpatizantes dessa visão, estar intitulado a algo é ter uma espécie de posse legítima).5 Daí a visão de que a posse de um direito expressa um interesse justificado em algo, o qual, acredita-se, possa ser julgado imparcialmente como um bem justamente merecido. Suponhamos certo bem X . Se X for um bem para S, segue-se que S tem ou pode ter interesse em X . Seria o interesse de S por X condição suficiente para que S alegue um direito a X sobre alguém, ou mesmo sobre todos os demais? É evidente que não. Assim, é preciso, assim prosseguem coerentemente os defensores dessa visão, que o interesse de S por X esteja amparado em alguma razão adicional, a qual possa ser aceita de modo imparcial ou universal.6 Exemplo: se a vida for um bem para mim, segue-se meu interesse subjetivo nela; porém, se a vida for um bem essencial, sem o qual eu não poderia, sob hipótese alguma, alcançar qualquer outro bem ou ideal de auto-realização pessoal, então tenho uma razão adicional e objetiva para exigir dos demais que não a limitem, obstruam ou impeçam-me seu usufruto. Daí a afirmação: a vida é um bem a que sou justamente merecedor, um bem cuja garantia e proteção me são devidas. É o que os ativistas pretendem dizer quando afirmam que alguém tem direito à vida. Direitos humanos seriam bens desse tipo, bens essenciais a qualquer possibilidade de realização humana, individual ou comum; é o que justificaria a alegação de que se tratam de bens que não poderiam ser negados a ninguém.7 Eles não somente não poderiam ser negados, como deveriam ser promovidos. Nesse caso, se a vida for um direito humano, então não apenas posso, isto é, tenho a permissão ou a potência de estar a ela vinculado, como se trata de algo que me é devido pelos demais. Em outras palavras, necessariamente a vida é um bem que mereço usufruir, não sendo permitido a qualquer outro lesá-la muito menos extingui-la, cabendo (assim pelo menos inferem seus defensores) a mim e aos demais promovê-la. Sendo isso verdadeiro, segue-se também que todo meio necessário para o usufruto desse bem é igualmente um bem essencial. Desse modo, se saúde, por exemplo, for admitida como condição necessária para o usufruto do bem “vida”, então a saúde é igualmente um bem a que estou necessariamente intitulado. Essa visão prossegue do seguinte modo. O que determina o mérito (ou não) a algo é um princípio moral ou legal. Direitos morais são justificados por um princípio moral; direitos legais seriam, por outro lado, justificados por um princípio ou norma legal. Em geral, direitos humanos são entendidos como direitos morais. Isso significa que o mérito de meu título a certo bem se deriva de um princípio moral (deixo, todavia, em aberto o que se poderia entender aqui por um princípio especificamente
Sobre a Possibilidade de uma Teoria Moral Baseada em Direitos
329
“moral”). Se um direito moral também for justificado por um princípio jurídico ou legal, então este direito, além de ser um direito moral, também é um direito legal. A visão geralmente aceita é que nem todos os direitos legais precisam ser justificados por princípios morais, mas que todos os direitos morais devem ser tornados ou transformados em direitos legais. Nessa visão, um direito moral somente será um direito legal se houver algum princípio legal (ou uma lei) que o declare (do contrário, será apenas a aspiração ou pretensão a um direito legal).8 Mas há um problema com essa visão. É que seus defensores julgam válido inferir do mero fato de que algo, digamos V , seja um bem necessário ou merecido para X , que X tenha, com efeito, direito a V sobre todos os demais. Contudo, essa inferência é prima facie inconcebível: como deduzir deveres ou obrigações alheias de afirmações sobre necessidades humanas? Hume foi quem primeiro nos advertiu desse problema lógico: como inferir do mero fato de que V é um bem para X que Y tenha algum dever de propiciá-lo? Em outras palavras, não é à primeira vista compreensível por que do mero fato, ainda que universalmente reconhecido, de que V é um bem (merecido ou necessário) para X , que Y tenha uma dívida, um débito, ou um dever para com X , dever do qual Y somente se desoneraria se e somente se X vier efetivamente a obter V .9 Não penso que tenhamos chegado, no estado atual das investigações sobre lógica de nosso raciocínio moral, a uma conclusão plenamente satisfatória sobre como realizar esse tipo de passagem. Minha opinião, não obstante, é que a visão dos direitos como títulos é incapaz de explicá-la. Isto é, neste ponto, Hume está certo: não é logicamente concebível porque temos deveres estritos para com alguém, dado o mero reconhecimento de suas necessidades, por mais essenciais que sejam. Aliás, segundo Hume, não há sequer irracionalidade em recusar-se a satisfazê-las. É verdade que se somos efetivamente benevolentes, faz sentido para nós ajudar outra pessoa. Nesse caso, ajudá-la é algo que naturalmente se impõe à nossa vontade. Mas e se alguém não se importar com isso? Teria ele, ainda assim, o dever estrito de fazê-lo? É verdade, com efeito, que, diante da crença de que alguém sofre pela falta de um bem essencial, e dada nossa possibilidade real de ajudá-la, na ausência de outras explicações ou motivos morais, somente a crueldade e a insensibilidade moral explicam nossa eventual omissão ou impassividade. Mas ser cruel e insensível não é o mesmo que ser injusto. Exigências de justiça não implicam benevolência (há, de fato, situações em que a benevolência implica injustiça). Direitos, enfim, são exigências por justiça, e não demandas por caridade ou solidariedade. E já que não há como semanticamente extrair conclusões normativas que expressem obrigações estritas apenas e tão somente de considerações sobre necessidades, a benevolência pode explicar a conduta de quem reage simpaticamente às necessidades ou carências de outros, mas ela é incapaz de explicar ou justificar obrigações de justiça. Se a justiça é a virtude de quem reconhece o que é devido a outrem, é preciso mostrar que algo é efetivamente devido para que possamos conformar nossa conduta a esse reconhecimento (é o que Hume queria dizer quando advertia que a virtude da justiça pressupõe um dever antecedente).
330
Marco Antonio Oliveira de Azevedo
É preciso, portanto, uma alternativa semanticamente mais aceitável capaz de identificar que tipos de estados-de-coisas poderíamos chamar de justos. E se justiça for, como Platão e Aristóteles corretamente pensavam que devia ser, a virtude ou disposição de dar ou de garantir a alguém o que lhe é devido, então é preciso corrigir a visão dos direitos como títulos. Precisamos de uma visão que mostre explicita e diretamente como nossos direitos relacionam-se àqueles que nos devem algo. A visão dos direitos como exigências corrige essa falha semântica. Segundo esta outra visão, quando alguém pronuncia algo como: ‘Tenho direito a X ’, ele não está simplesmente enunciando uma relação entre ele e algo (X ). Ele está exigindo, demandando X de alguém. Assim, enquanto que na visão dos direitos como títulos, direitos expressam primariamente relações entre dois termos (um sujeito portador do direito e algo), na visão dos direitos como exigências, direitos primariamente expressam relações entre três termos (um demandante, um demandado e algo). Nessa visão, sempre que se enuncia um direito, está-se afirmando uma relação entre (ao menos) duas pessoas (ou entre um indivíduo e uma pessoa), e algo (um estado-de-coisa, ou uma ação determinada).10 Essa visão (diretos como exigências) foi semanticamente explorada de forma analítica originalmente por Hohfeld. Em 1913, Wesley Newcomb Hohfeld, em dois artigos simultaneamente publicados na Yale Law Review e intitulados Fundamental conceptions as applied in judicial reasoning, afirmou que os juristas norte-americanos e ingleses empregavam a palavra ‘direito’ de modo confuso. Hohfeld identificou e distinguiu oito conceitos (idéias ou pensamentos) empregados pelos juristas e advogados, seus contemporâneos, conceitos que ele julgava “fundamentais” porque expressavam relações jurídicas básicas existentes em qualquer sistema jurídico ou de governo. Para Hohfeld, essas relações jurídicas eram sui generis, o que dificultaria definições formais rigorosas. Para torná-las claras, apresentou-as em um esquema de “opostos” e “correlativos”. Assim, as seguintes relações representam opostos: a) Direito/ Não-direito; b) Privilégio/Dever; c) Poder/Incapacidade; d) Imunidade/Suscetibilidade. Ao passo que as seguintes relações expressam correlativos: e) Direito/Dever; f ) Privilégio/Não-direito; g) Poder/Suscetibilidade; h) Imunidade/Incapacidade.11 Um direito é o “correlativo” (correlative) de um dever (duty). É o que se entende por um direito em sentido estrito, já que, assim lembra Hohfeld, juízes, advogados e mesmo pessoas comuns tendem a usar o termo ‘direito’ de uma forma ampla e indiscriminada. A fim de evitar ambigüidades e confusões, Hohfeld sugeriu que fosse empregado o termo em inglês claim para indicar um direito em sentido estrito (ou claim-right). Um claim é uma demanda ou exigência legítima contra alguém: se tenho um direito em sentido estrito, então tenho um direito relativamente a alguém, e esse alguém tem, em sentido correlato, um dever relativamente a mim. O termo empregado por Hohfeld é duty. Vale assinalar que não se trata nem do “dever” a que alguns filósofos morais entendem como expressão de um imperativo moral, nem do “dever” que expressa a conclusão final de um raciocínio prático – aquilo que se deve fazer consideradas todas as circunstâncias.12
Sobre a Possibilidade de uma Teoria Moral Baseada em Direitos
331
Judith Jarvis Thomson procurou clarear as idéias de Hohfeld com os seguintes enunciados (Thomson 1990, p. 37–60). Segundo ela, o que Hohfeld procurou dizer é que alegações em torno de direitos (direitos em sentido estrito) são afirmações que têm a seguinte forma geral: X tem um direito relativamente a Y de que p, onde ‘p’ é substituível por qualquer sentença ou proposição. Essa afirmação é equivalente (isto é, tem estritamente o mesmo significado, embora propriamente não o mesmo sentido13 ) que: Y está sob um dever (entenda-se, ‘a duty’) relativamente a X , a saber, o dever que Y se desonera se e somente se p. Em outras palavras, enquanto p não for o caso, perdura o direito de X e o dever de Y . Se tenho um direito em sentido estrito relativamente a alguém, suponhamos Adolfo, esse direito (essa demanda, reivindicação ou exigência por um direito) somente é respeitado ou satisfeito quando p for o caso (isto é, quando p for verdadeira). Uma das confusões envolvendo os múltiplos usos da palavra ‘direito’ encontra-se na ambigüidade em denotar-se, por vezes, um direito (em sentido estrito), outras vezes uma permissão.14 Contudo, uma permissão é o oposto de um dever e o correlativo de um “não-direito”. Uma pessoa tem uma permissão sempre que for falso que ela tenha algum dever (duty) a que alguma coisa não seja (ou seja) o caso. Ou, em sentido equivalente, sempre que for falso que alguém tenha relativamente a ela um direito (claim) de que alguma coisa não seja o caso. E quanto a poderes e imunidades? Seguindo Hohfeld, ter um poder é ter a habilidade ou a capacidade de fazer com que outra pessoa tenha ou deixe de ter direitos de qualquer tipo (para Hohfeld, o correlato de um poder é uma liability, isto é, uma suscetibilidade). E alegar uma imunidade relativamente a alguém equivale a dizer que este não tem ou deixou de ter algum poder relativamente àquele. Thomson ainda acrescenta outro tipo de direito, que ela chamou de cluster-rights (vou chamá-los de direitos compostos). Um direito é composto se for um direito que inclua ou contenha outros direitos. Exemplos paradigmáticos desse tipo de direito são: o direito à propriedade, o direito à vida e o direito à liberdade. Vejamos cada um desses. Se Thomson está certa em classificar o direito à propriedade como exemplo de um direto composto, então o que queremos dizer quando alegamos direitos à propriedade? Ora, alegamos uma conjunção de “direitos”, isto é, de exigências, permissões, poderes e imunidades. Ter direito à propriedade é ter não apenas direitos em sentido estrito (o direito, por exemplo, de que alguém se mantenha distante do que é meu), mas é ter igualmente permissões e, especialmente, poderes. Ter a propriedade sobre algo implica o poder de transmitir esse direito composto a outrem, ou mesmo de transmitir apenas uma permissão de uso. Ter direito à vida, por seu lado, comporta um conjunto de permissões (como a permissão pueril de viver ou
332
Marco Antonio Oliveira de Azevedo
de simplesmente prosseguir vivendo), bem como, e especialmente, o direito em sentido estrito de que outrem não ameace minha vida ou minha integridade física. Além disso, parece plausível que o direito à vida também comporte poderes, como a capacidade de alterar os deveres alheios de não ameaçar minha vida (é o que Feinberg e Thomson sugeriram ao interpretar o polêmico “direito” ao suicídio assistido).15 E o direito à liberdade? Ora, o que chamamos “direito à liberdade” (ou talvez simplesmente “liberdade”) é igualmente um direito composto que comporta uma série de permissões e principalmente o direito em sentido estrito a não interferência alheia sobre certa esfera de condutas permitidas. Ele inclui igualmente o poder de conceder a alguém permissões eventuais, alterando os deveres de outrem para com o detentor do direito.
3. Direitos e racionalidade prática Uma das objeções a teorias morais baseadas em direitos é que a “justificação de um sistema de regras em cujo interior ocorram exigências válidas não é em si baseada em direitos” (Beauchamp & Childress 2005, p. 36). Deontologistas usualmente imaginam um sistema único de regras ou máximas subjetivas determinando os juízos práticos de alguém; as regras desses sistemas normativos devem, por sua vez, ser justificadas por regras ou princípios universais (uma tese que, como bem sabemos, tem em Kant seu maior expoente). Seguindo essa visão, direitos se derivam dessas normas (prima facie gerais e indeterminadas). Não fica claro, assim, qual a relação entre os direitos de alguém e as obrigações dos demais. Como deveres indeterminados ou gerais são os conceitos primários, direitos são vistos unicamente como faculdades ou capacidades de agir (ou deixar de agir), sempre em conformidade com tais deveres.16 Segundo essa visão, deveres morais determinam direitos morais; deveres legais determinam, por sua vez, direitos legais. A tendência óbvia, portanto, é enxergar dois sistemas normativos distintos e independentes: um sistema moral e outro jurídico. Porém, há um sentido em que direitos não são “comandos”, já que, ao alegarmos direitos, fazemos afirmações.17 Exigências são veiculadas por meio de enunciados assertóricos. Quem exige um direito usualmente afirma algo. Nesse caso, tanto exigências jurídicas como morais seriam afirmações, que, como tais, poderiam ser verdadeiras ou falsas. Esta é justamente a tese de Thomson. Segundo essa visão, direitos são o objeto primário da fundamentação de uma teoria moral. Eles são o cerne de um conjunto de “princípios”, a partir dos quais derivamos obrigações ou outras normas (bem como ausências de obrigações). Penso que se trata de uma tese bastante persuasiva. Não é possível no âmbito deste ensaio apresentar uma argumentação completa em favor dessas idéias. Mas penso que se for possível mostrar como direitos podem contar como premissas em raciocínios morais práticos, essa idéia central de que direitos são os conceitos fundamentais em uma teoria moral torna-se compreensível, o que é um aspecto central de sua plausibilidade. Vejamos. Imagine-se Sigmund, um médico psiquiatra de caráter inatacável. Em
Sobre a Possibilidade de uma Teoria Moral Baseada em Direitos
333
uma consulta, Adolfo, seu paciente, relata-lhe uma série de detalhes sobre sua vida privada, dentre esses, que há alguns anos cometeu um crime. Seria correto afirmarse que Adolfo tem direito sobre seu médico, Sigmund, à confidencialidade, isto é, de que este não revele estas informações a quem quer que seja? A propósito, em nosso país, esta é justamente a idéia.18 Assim, admitamos que Adolfo tenha com respeito a Sigmund direito a que este não revele informações obtidas durante a consulta, isto é, que Sigmund tem o dever correlato de confidencialidade, não podendo revelar nem mesmo o delito, seguramente “grave”, de que seu paciente cometeu um crime. Faria sentido dizer que é verdadeira a afirmação de que Adolfo tem um direito sobre Sigmund a que este não revele que cometeu um crime? Admitamos que não haja consenso sobre isso. Contudo, mesmo assim não podemos negar que: C : “Adolfo tem direito sobre Sigmund a que este não revele a ninguém que cometeu um crime” [é verdadeira] se e somente se [realmente] Adolfo tem direito sobre Sigmund a que este não revele a ninguém que cometeu um crime.19 Haveria dúvidas de que C é verdadeira? Certamente que não. C é necessariamente verdadeira.20 Poderia C ser verdadeira e o enunciado “Adolfo tem direito sobre Sigmund a que este não revele a ninguém que cometeu um crime” não ser, todavia, um enunciado assertórico? Suponhamos que alguém divirja e afirme que o enunciado “Adolfo tem direito sobre Sigmund a que este não revele a ninguém que cometeu um crime” não é um enunciado assertórico, e sim, tal como diria Hare, um enunciado prescritivo. Compare agora este enunciado com o seguinte enunciado nãoassertórico: P : “Diga à Polícia tudo o que você sabe sobre Adolfo”, dita, suponhamos, por um amigo de Sigmund. Ora, note-se que, relativamente a esse enunciado, não faz sentido (em termos gramaticais) dizer que: P 0 : “Diga à Polícia tudo o que você sabe sobre Adolfo” [é verdadeira] se e somente se diga à Polícia tudo o que você sabe sobre Adolfo. Faria sentido, ao contrário, dizer que: D: “Sigmund deve dizer à Polícia tudo o que sabe sobre Adolfo” se e somente se Sigmund deve dizer à Polícia tudo o que sabe sobre Adolfo. Parece claro que não estamos diante das mesmas proposições (P 0 e D). A bem da verdade, ao contrário de D, P 0 não tem qualquer sentido gramatical. A razão é que P não é um enunciado descritivo. P não é um enunciado que pode ser verdadeiro ou falso. Em conseqüência, P ’ (um enunciado em que P faz parte) jamais poderia ser um enunciado assertórico. Ora, se todos os enunciados que expressam deveres fossem igualmente prescrições, então D também não poderia ser um exemplo de enunciado
334
Marco Antonio Oliveira de Azevedo
ou sentença assertórica bem construída. Assim, se “Sigmund deve dizer à Polícia tudo o que sabe sobre Adolfo” fosse um enunciado prescritivo, então D não poderia ter o sentido que todo enunciado assertórico pode ter (o de dar expressão à verdade ou falsidade). Porém, D é certamente um enunciado gramaticalmente bem construído. E parece evidente que D não é somente gramaticalmente bem construído; seu sentido (ou classe gramatical) é o de um enunciado que pode ser verdadeiro ou falso. Assim, segue-se que enunciados com conteúdo normativo podem ser igualmente asseridos, podendo, com efeito, ser verdadeiros ou falsos. Essa é uma idéia controversa. A idéia de que enunciados “normativos” são passíveis de verdade ou falsidade é uma das idéias mais fortemente criticadas pela tradição positivista. Kelsen, por exemplo, disse que a função de enunciados normativos é estabelecer o que “deve ser”, e o que “deve ser” é sempre o correlato de um “querer”. São, portanto, o sentido de um ato de vontade e, como tais, não podem ser nem verdadeiros nem falsos. De “normas” como “Ama a teus inimigos” ou como “O homicídio deve ser castigado com a morte do homicida” não se pode dizer que são verdadeiras nem falsas (Kelsen 1978, p. 7). Para Kelsen, normas pretendem ser válidas, e dizer de uma norma que é válida é dizer que ela “deve ser obedecida”. Em seu apoio, Kelsen lembra o paradoxo conhecido como “Paradoxo de Jörgensen”. Kelsen refere-se ao filósofo dinamarquês, Jörgen Jörgensen, que em um artigo intitulado “Imperatives and logic” (1937/8) sustentou a impossibilidade de inferências deônticas: nenhuma conclusão poderia ser inferida de premissas que não podem ser verdadeiras nem falsas. Assim, sentenças prescritivas não poderiam funcionar como parte em nenhum argumento ou inferência. O paradoxo resulta de que é, por outro lado, evidente que se pode formular inferências em que haja premissas prescritivas ou imperativas. Um exemplo típico seria: “Cumpre tuas promessas; esta é uma promessa tua; logo, cumpra-a.” Há um longo debate sobre esse tema, e não há como explorá-lo em profundidade aqui.21 Meu objetivo é fazer notar que o paradoxo de Jörgensen somente se sustenta caso insistamos na tese de que enunciados normativos nunca podem ser verdadeiros ou falsos. Ora, como vimos acima, há pelo menos um tipo de enunciado normativo que pode ser verdadeiro ou falso: enunciados que atribuem direitos e deveres (enunciados, portanto, que expressam o que Hohfeld chamou de “relações jurídicas”). E caso adotemos a linguagem dos direitos como exigências é certamente possível realizar inferências válidas tomando esses enunciados como premissas. Senão, vejamos. Considere-se, novamente, o seguinte enunciado: C : “Adolfo tem direito sobre Sigmund a que este não revele a ninguém que cometeu um crime” [é verdadeira] se e somente se Adolfo tem direito sobre Sigmund a que este não revele a ninguém que cometeu um crime. Se este enunciado for necessariamente verdadeiro, então temos que “Adolfo tem direito sobre Sigmund a que este não revele a ninguém que cometeu um crime” é possivelmente verdadeiro (isto é, pode ser verdadeiro ou falso). Seguindo-se a semântica hohfeldiana, segue-se, por dedução, que:
Sobre a Possibilidade de uma Teoria Moral Baseada em Direitos
335
Se “Adolfo tiver um direito sobre Sigmund a que este não revele a ninguém que cometeu um crime”, então “Sigmund tem o dever de não revelar a ninguém que Adolfo cometeu um crime”. Segue-se disso, também, que Sigmund não pode, sob nenhuma hipótese, revelar que Adolfo cometeu um crime? Ora, este é outro problema (um problema de natureza prática). Veremos isso adiante. Voltemos, agora, ao exemplo de Jörgensen. Ali está Karl, amigo de Adolfo, prometendo a este que não revelará seu crime a ninguém. Teria Karl o dever de cumprir sua promessa? Poderia Karl descumpri-la? Que razões teria Karl para cumprir a promessa que fez a Adolfo? Ora, não seria uma razão, e a chamemos seguindo uma denominação conhecida de Kant de uma razão categórica, simplesmente o fato da promessa feita? E se promessas são fatos, qual o significado disso? Ora, uma idéia sugestiva é que, se Karl prometeu a Adolfo não contar a ninguém o que sabe (e este é um fato), segue-se que Karl submeteu-se a um compromisso frente a Adolfo, ou, em outras palavras, que Karl submeteu-se ao dever de não revelar o que sabe, e que Adolfo, seu amigo, obteve de Karl o direito a uma confidência. Mas e se Karl vier a acreditar que não revelar o que sabe levará a danos graves e insuperáveis? Suponhamos que Karl tenha boas razões para crer que Adolfo provavelmente virá a cometer um novo crime, um crime brutal, o qual somente será impedido caso Karl revele o que sabe à política. Deve Karl, nessas circunstâncias, revelar o que sabe? É possível, e, a princípio, até mesmo razoável que assim o faça. Judith Jarvis Thomson (1990) tratou brilhantemente desse problema pondo em contraste o que chama de visão de que todas as exigências por direitos são absolutas e a visão contrária, a saber, de que é possível que alguém possa eventualmente ter de fazer algo mesmo contrariando seus (um ou alguns de seus) deveres. O problema prático é justamente: que (boas) razões tenho (atualmente) para deixar de fazer aquilo que de outro modo teria a obrigação de fazer? Pois, se não tenho boas razões para deixar de fazer aquilo que é minha obrigação fazer, segue-se que devo fazer o que estou obrigado. Trata-se de um problema de racionalidade prática, um problema, aliás, clássico desde Aristóteles. Muitos, porém, consideraram que o próprio Aristóteles entendia os raciocínios práticos como inferências cujas premissas incluíam normas ou imperativos e cujas conclusões expressavam prescrições (Hare, por exemplo, era dessa opinião). Todavia, os exemplos de Aristóteles eram geralmente de inferências cujas premissas correspondiam a enunciados assertóricos, isto é, enunciados que podem ser verdadeiros ou falsos, e cujas conclusões expressavam ações. Seguindo um esquema semelhante ao de Aristóteles, sugiro a seguinte distinção: raciocínios teóricos ou doxásticos são raciocínios cujas conclusões expressam proposições a que temos razões suficientes para acreditar; raciocínios práticos, por sua vez, são raciocínios cujas premissas nos conduzem a ações (ou omissões), a que temos boas razões para realizar (ou não realizar).22 Argumentos, contudo, como bem o sabemos, são, por sua vez,
336
Marco Antonio Oliveira de Azevedo
seqüências válidas de sentenças ou proposições (sendo algumas premissas e uma a conclusão). Não faz, certamente, sentido falar-se em “argumentos práticos” (já que argumentos, como tais, não são propriamente nem “teóricos” nem “práticos”). É o ato de pensamento que extrai como conclusão uma ação possível do agente que pode ser corretamente chamado de “prático”, notadamente se as circunstâncias revelam-se como atuais ou efetivas.23 Parece suficientemente claro por que direitos podem contar como razões para agir. Se eu sei (ou acredito) que alguém tem um direito sobre mim, segue-se que tenho (ou acredito que tenho) um dever (duty) correlato. Digamos que meu dever correlato seja ‘Fazer p’. Meu raciocínio torna-se prático quando me pergunto: ‘Devo, dadas as circunstâncias, fazer p?’24 Ora, por que não deveria? Afinal, se tenho o dever de fazer p, parece razoável que deva fazê-lo. Ocorre que o ‘deve’ contido nas premissas não é o mesmo ‘deve’ que se acha na conclusão prática. O deve (duty) contido na(s) premissa(s) expressa uma relação entre mim, alguém e algo (p), e essa relação é enunciada de forma assertórica — é algo no qual devo acreditar. A questão é saber se devo conformar minha vontade a isso? Assim, o ‘deve’ que se acha contido na conclusão prática não expressa uma relação deôntica entre mim, alguém e algo, e sim entre mim (ou minha vontade) e algo (objeto do direito de alguém). Thomson emprega o termo ‘ought’ para destacar essa distinção. Minha conclusão prática expressa, assim, o que devo (ought) fazer, dado que devo (duty) realizar p (isto é, dado que alguém tem direito sobre mim a que eu o faça). Penso que a regra prática de que, tudo o mais sendo igual, tendo eu o dever de fazer algo em respeito ao direito de alguém, segue-se que devo fazê-lo, é uma regra que expressa um princípio universal de razoabilidade prática. Em outras palavras, que: Se Y tem um dever frente a X de que p, então Y tem, prima facie, uma razão prática para agir ou comportar-se de modo tal que p seja ou venha a ser o caso. Isso não significa que, sempre e absolutamente, assim deva Y , ao fim e ao cabo, comportar-se, pois sempre é possível que existam outras razões, as quais, dadas as circunstâncias, justifiquem um comportamento contrário. O mesmo vale com respeito a permissões. Suponhamos que não seja verdadeiro que Y esteja, afinal, sob qualquer dever frente a X de que p seja o caso. Ora, nesse caso, Y não tem qualquer dever estrito frente a X de que p. Quais razões poderiam, nessas circunstâncias, orientar a ação de Y ? Bem, há várias. Considerações sobre o que é bom ou recomendável podem preencher esse critério.25 Nada impede, aliás, que Y possa vir a ter alguma outro motivo razoável, além de um dever estrito, para fazer com que p seja o caso. De qualquer modo, se fosse verdadeiro que há um dever estrito de fazer com que p seja o caso, então tais motivos não poderiam ser motivos quaisquer. Assim, direitos (e deveres correlatos) são razões preeminentes para a tomada de decisões moralmente orientadas. Admiti-lo é meio caminho andado para aceitar-se a plausibilidade de uma teoria moral baseada em direitos. E de uma teoria
Sobre a Possibilidade de uma Teoria Moral Baseada em Direitos
337
moral baseada em direitos entendidos como fatos, e não como normas derivadas de outras normas, princípios, entendidos como imperativos.
Referências Anscombe, G. E. M. 1957. Intention. Oxford: Basil Blackwell. Republicado por: Cambridge, Mass., London: Harvard University Press, 2000. —–. 1958. Modern moral philosophy. Philosophy 53: 1–19. Republicado em: Geach, M. & Gormally, L. (eds.) 2005. Human life, action and ethics. Essays by G. E. M. Anscombe. Exeter, Charlottesville : Imprint Academic, p. 169–94. Azevedo, M. A. O. 2002. Bioética fundamental. Porto Alegre: Tomo Editorial. —–. 2002. Há obrigações fora do Direito. Bioética CFM. 8(2): 265–84. —–. 2003. A lei de Hume. Tese de Doutorado, UFRGS. —–. 2005. Direitos à saúde: demandas crescentes e recursos escassos. In Gauer, G. C; Ávila, G. A; Ávila, G. N. (orgs.) Ciclo de conferências em bioética. Rio de Janeiro: Lumen Juris. —–. 2006. Dois conceitos de direitos. Ciência em movimento. Ano VIII, 16: 27–54. —–. 2007. Razões para agir (ou como Lewis Carroll nos ajudou a entender também os raciocínios práticos). Veritas 52(2): 91–108. —–. 2008. O direito de morrer. In Souza, R. T. de & Oliveira, N. F. (orgs.) Fenomenologia hoje III. Porto Alegre: Edipucs, p. 417–30. Barbosa Filho, B. 1999. Saber, fazer e tempo. Uma nota sobre Aristóteles. In Marques, E. R.; Rocha, E. M; Levy, L. et al (orgs.) Verdade, conhecimento e ação. Ensaios em homenagem a Guido Antonio de Almeida e Raul Landim Filho. São Paulo: Edições Loyola, p. 15–24. Barzotto, L. F. 2005. Os direitos humanos como direitos subjetivos: da dogmática jurídica à ética. Direito & Justiça 31(1): 67–119. Beauchamp, T. L & Childress, J. F. 2001. The principles of biomedical ethics. Oxford Press, 5a¯ ed. Bobbio, N. 2004. A era dos direitos. Rio de Janeiro: Elsevier. Brandom, R. B. 2000. Articulating reasons. An introduction to inferentialim. Cambridge, Mass., London: Harvard University Press. Dworkin, R. 1977. Taking rights seriously. Cambridge, Mass., London: Harvard University Press. —–. 2002. Levando os direitos a sério. São Paulo: Martins Fontes (trad. de Dworkin 1977). Edmundson, W. A. 2004. An introduction to rights. Cambridge, New York: Cambridge University Press. Feinberg, J. 1973. Social Philosophy. New Jersey : Prentice Hall (tradução: Feinberg, J. 1974. Filosofia Social. Rio de Janeiro: Zahar. Finnis, J. 1980. Natural law and natural rights. Oxford: Clarendon Press. Gauer, G. C; Ávila, G. A; Ávila, G. N. (orgs.). 2005. Ciclo de conferências em bioética I. Rio de Janeiro: Lúmen Júris. Haack, S. Philosophy of logics. 1978. Cambridge, New York: Cambridge University Press. Hare, R. M. 1996. A linguagem da moral. São Paulo: Martins Fontes (traduzido de: Hare, R. M. 1956. The language of morals. Oxford Press). —–. 1997. Sorting out ethics. New York, Oxford: Oxford University Press. Hayek. F. A. 1976. Law, legislation and liberty. Vol. 2, The mirage of social justice. Chicago, London: The University of Chicago Press.
338
Marco Antonio Oliveira de Azevedo
Hohfeld, W. N. [1913]. Fundamental legal conceptions. In: Paterson, D. (ed.) 2003. Philosophy of law and legal theory. Blackwell Publishing, p. 295–321. Jörgensen, J. 1937/8. Imperatives and Logic. Erkenntnis 7: 288–96. Locke, J. 2003. Segundo tratado sobre o governo. São Paulo: Martin Claret. Mackie, J. L. 1998. Can there be a right-based moral theory? In: Rachels, J. (ed.) Ethical theory 2: theories about how we should live. Oxford Readings in Philosophy. New York, Oxford: Oxford University Press, p. 129–42. Nietzsche, F. 2004. Aurora. São Paulo: Companhia das Letras. Nozick, R. 1974. Anarchy, state and utopia. New York: Basic Books. Puente, F. R (org.) 2002. Os filósofos e a mentira. Belo Horizonte: Editora da UFMG. Rawls, J. 1971. A theory of justice. Cambridge, Mass., London: Harvard University Press. Raz, J. 1986. The morality of freedom. New York, Oxford: Oxford University Press. Reale, M. 2005. Lições preliminares de Direito. São Paulo: Saraiva. Thomson, J. J. 1990. The realm of rights. Cambridge, Mass.: Harvard University Press. —–. 2001. Goodness and advice. Princeton: Princeton University Press.
Notas 1 É o que se acha subentendido na famosa tese de Dworkin de que direitos individuais são trunfos
(trumps); em outras palavras, que considerações sobre direitos visam a resolver definitivamente contendas morais, e que a solução de conflitos entre direitos individuais e aspirações coletivas resolve-se, em princípio, em detrimento dos interesses políticos coletivos não ancorados em direitos (razões políticas somente sobrepassam direitos individuais caso fundamentem-se em princípios cujo fim é proteger os direitos em questão). Chamo-a de tese da preeminência dos direitos individuais sobre interesses coletivos. Segundo Dworkin, “segue-se, da definição de um direito, que ele não pode ser menos importante que todas as metas sociais”. Assim, “não chamaremos de direito qualquer objetivo político, a menos que ele tenha certo peso contra as metas coletivas em geral; a menos que, por exemplo, não possa ser invalidado mediante o apelo a quaisquer das medidas rotineiras da administração política, mas somente por uma meta de urgência especial” (Dworkin 2002, p. 297). A propósito da preeminência dos direitos individuais sobre interesses e metas coletivas, veja-se meu artigo Direitos à saúde: demandas crescentes e recursos escassos (em Gauer, Ávila & Ávila 2005, p. 45–100). 2 Finnis inicia o oitavo capítulo de seu mais importante livro, Natural law and natural rights (1980, p. 198) dizendo que ‘praticamente tudo neste livro é sobre direitos humanos (. . . ). Pois, como veremos, a gramática moderna dos direitos proporciona um meio de expressar virtualmente todas as exigências da razoabilidade prática’. Uma visão da ética sustentada em uma teoria dos direitos humanos numa linha de argumentação tomista foi recentemente defendida em nosso meio por Luis Fernando Barzotto, professor de filosofia do direito na UFRGS e PUCRS, no artigo “Os direitos humanos como direitos subjetivos: da dogmática jurídica à ética” (2005). 3 Joel Feinberg foi quem de uma forma explícita considerou essas duas visões ao identificar, de um lado, um sentido de ‘direito’ como ‘claim-right’, como direito exigível contra alguém e, de outro, o sentido empregado pelos manifestos (Feinberg 1973, p. 85–8). 4 Refiro-me aqui especialmente ao discurso em torno de “direitos morais” e à linguagem dos direitos humanos. Isso porque devo reconhecer que a visão dominante no meio jurídico brasileiro sobre o que são direitos, entendidos de forma mais restrita como direitos legais ou como direitos “subjetivos” legais, é difícil de classificar. Tendo a achar que se trata de uma terceira visão, todavia equívoca. Acredito que seus equívos ficarão subentendidos ao mostrar o contraste entre as duas visões de direitos que me interessam: a visão dos direitos como “títulos” e a visão dos direitos como “exigências”. “Direitos subjetivos” são freqüentemente definidos na dogmática jurídica nacional ora como “vantagens” legalmente estabelecidas em favor de um indivíduo sobre outros, ora como permissões, licenças ou autorizações
Sobre a Possibilidade de uma Teoria Moral Baseada em Direitos
339
legalmente conferidas para fazer alguma coisa, ora como “poderes”, “habilidades”, ou “faculdades” para a realização ou demanda judicial de algum interesse legítimo. Essa variedade de classificações dá mostras de sua pouca clareza. Há contudo, uma visão dominante e tradicional. Segundo a maior parte dos juristas brasileiros, direitos subjetivos são facultas agendi. Uma das origens dessa idéia é a teoria legal de Georg Jellinek, que definiu direito subjetivo como um poder de querer, no caso, o poder de querer reconhecido e protegido pelo Estado, e dirigido ao um bem ou interesse. A obra clássica de Jellinek é o livro System der subjektiven öffentlichen Rechte, editado em 1892. A visão não é menos confusa. Deixarei, porém, a crítica detalhada a essa visão para outra oportunidade. 5 Não são incomuns autores que, desde pelo menos o século XVII, tratavam direitos como “posses”, já que o direito de propriedade sempre foi um exemplo paradigmático de direito subjetivo. A analogia com a idéia de posse está provavelmente na raiz da concepção que aqui chamo de “visão dos direitos como títulos”. Talvez fosse mais adequado chamá-la de “visão dos direitos como propriedades”, mas, como a maior parte dos defensores atuais dessa concepção não somente entendem que os direitos de propriedade são apenas um exemplo de direitos dentre uma variedade mais ampla de outros, mas sobretudo consideram-se críticos à visão liberal dos pensadores da era moderna que incluíam dentre os direitos humanos os direitos subjetivos de posse (incluindo-os dentre os direitos liberais de primeira geração), denominar essa visão de “visão dos direitos como propriedades” seria, penso, enganador. A denominação sugeriria algo que alguns ativistas dos direitos humanos, os quais, penso, de fato empregam essa visão, recusariam identificar-se. 6 Raz, tal com penso, um defensor da visão dos direitos como títulos, define ‘direito’ do seguinte modo: ‘S tem um direito a X ’ se e somente se: i) S pode portar direitos; ii) caeteris paribus, o objeto do interesse de S (isto é, X ) conta como razão suficiente para se atribuir a outra pessoa um dever correspondente (ver Raz 1986, p. 166). Para que X (ou o interesse de S) conte como razão suficiente para atribuir-se um dever a outrem é preciso justificativas adequadas. Direitos no sentido de Raz são apenas conclusões intermediárias para se atribuir a outrem algum dever (isto é, para conectar os interesses de alguém aos deveres de outros). 7 Direitos humanos são vistos como direitos essenciais. Assim, toda demanda pessoal ou “subjetiva” por um direito humano teria uma justificativa, portanto, objetiva, a qual independeria da existência de qualquer legislação (para a filosofia do século XVII e XVIII, como bem o sabemos, a base objetiva dos chamados “direitos do homem” é a lei natural). Essa é a visão dos que defendem a visão dos direitos como títulos e que admitem a existência de direitos essenciais ou fundamentados na “razão natural”. A propósito, tanto os defensores da visão dos direitos humanos como títulos como os positivistas que são céticos quanto à existência de direitos não ancorados em leis “humanas” admitem que deve haver leis ou razões objetivas antecedentes para se demandar um direito. Tradicionalmente, isso nos reporta à conhecida distinção entre direito “subjetivo” e direito “objetivo” — uma “infeliz e enganosa distinção”, com bem assinala William Edmundson (2004, p. 10). A existência de uma lei, de qualquer modo, é vista usualmente como uma razão objetiva para demandar-se um direito. A divergência entre positivistas e jusnaturalistas é sobre se há, ou não, alguma lei natural e objetiva antecedente (e igualmente dotada de autoridade jurídica ou política) sobre as leis humanas positivas. Ambos, contudo podem e freqüentemente sustentam a visão dos direitos como títulos. 8 Note-se o quanto essa distinção pode ser problemática para os positivistas. Para os jusnaturalistas não há problema em haver tanto direitos justificados pela lei natural e direitos justificados por leis positivas. Um direito moral legalmente não declarado é uma aspiração a um direito legal, mas não uma aspiração a um direito moral: ele é um direito moral. Além disso, para os jusnaturalistas, direitos morais valem tanto quanto direitos legais (a infração a um direito moral não deixa de ser uma infração a um direito). Para os positivistas, no entanto, não há direitos “naturais” ou “morais” (estes são antes meras aspirações a direitos). Bobbio, por exemplo, um dos positivistas mais lidos e seguidos hoje em dia, inclusive por boa parte dos ativistas dos direitos humanos, procurou solucionar o problema encontrando um “direito positivo” historicamente determinado que amparasse a validade das demandas por direitos humanos. Trata-se, segundo ele, das várias declarações internacionais promulgadas após a criação das Nações Unidas (a propósito, veja-se: Bobbio, 2004). Segundo Bobbio, “o problema do fundamento”
340
Marco Antonio Oliveira de Azevedo
positivo “dos direitos humanos somente teve sua solução atual na Declaração Universal dos Direitos do Homem aprovada pela Assembléia Geral das Nações Unidas em 10 de dezembro de 1848” (p. 48). Um positivista que discordar da eficácia da Declaração (como lei efetiva) não poderá concordar com essa conclusão otimista de Bobbio. Afinal, como fica o caso dos países não signatários? Além do que, o estatuto do direito internacional é ainda assunto controverso entre os juristas. 9 Eis o que disse Hume: “Em toda teoria da moralidade com a qual me deparei até aqui, sempre me dei conta de que o autor prossegue por algum tempo no modo comum de pensar, estabelece a existência de um Deus ou faz observações com respeito às ocupações dos homens, quando, repentinamente, surpreendo-me ao descobrir que, ao invés das usuais cópulas das proposições, ‘é’ e ‘não-é’, não encontro nenhuma proposição que não esteja conectada com um ‘deve’ ou um ‘não-deve’. Tal mudança é imperceptível, mas é da máxima importância. Pois, como esse ‘deve’, ou ‘não-deve’, expressa alguma nova relação ou afirmação, esta deveria necessariamente ser notada e explicada e, ao mesmo tempo, dada uma razão para o que parece inteiramente inconcebível: a saber, como essa nova relação pode ser deduzida de outras que lhe são inteiramente diferentes. Como os autores comumente não usam tal precaução, pretendo recomendá-la aos leitores.” (Hume, D. Treatise of human nature. Livro III, parte I, seção II, parágrafo 27). Hume não disse, a propósito, que não se pode derivar um “deve” de um “é”, e sim que do modo como usualmente é feita essa passagem, ela é logicamente inconcebível. A advertência foi feita contra as teorias morais usuais de sua época, em especial, às teorias do direito natural de seus contemporâneos. Penso que essa advertência serve plenamente contra as tentativas de derivar conclusões normativas de afirmações sobre fatos (bens) feitas pelos defensores de visões dos direitos como títulos. 10 Esta era a visão, a propósito, de Benjamin Constant, algo que ficou claro em sua conhecida polêmica com Kant, ato afirmar que “dizer a verdade é um dever apenas em relação a quem tem direito à verdade”. E, segundo Constant, não faz sentido alegar direito a uma “verdade” que efetivamente prejudique outrem. As opiniões de Constant encontram-se no capítulo VIII (“Des principes”) da obra “Des réactions politiques”, de 1797, traduzido no livro “Os filósofos e a mentira”, organizado por Fernando Rey Puente, e publicado pela UFMG em 2002 (Puente 2002, p. 61–72). Nietzsche, sem comprometer-se com qualquer teoria política em particular, não paradoxalmente também numa crítica ao rigorismo de Kant, defendeu uma visão similar sobre a relação entre deveres e direitos. No aforismo 39 do livro Aurora, Nietzsche referiu-se aos direitos dos outros como àquilo a que se referem nossos deveres (Nietzsche 2004, p. 199). A visão de que deveres se correlacionam a direitos pode ser encontrada em liberais como Hayek, que aliás foram bastante explícitos ao afirmar que: ‘Ninguém tem um direito a um estado-de-coisas particular a menos que seja o dever de alguém garanti-lo’ (Hayek 1976, p. 102). Recentemente, a visão de direitos como exigências foi sistematicamente apresentada e desenvolvida por Judith Jarvis Thomson, em The realm of rights (Thomson 1990). 11 Ver Hohfeld 2000, p. 36. As expressões em inglês são, respectivamente: right/no-right; privilege/duty; power/disability; immunity/liability; right/duty; privilege/no-right; power/ liability; immunity/disability. 12 Richard Hare é um dos filósofos que sustentou a tese de que deveres morais expressam imperativos (Hare 1996). Tratei dessas distinções no artigo “Razões para agir (ou como Lewis Carroll nos ajudou a entender também os raciocínios práticos)” (Azevedo 2007). 13 Atente-se aqui para a distinção clássica entre significado e sentido de Frege em Über Sinn und Bedeutung. 14 O termo empregado por Hohfeld foi privilege. Penso, porém, que o significado pretendido por Hohfeld não era esse. Por isso, prefiro traduzir ‘privilege’ por ‘permissão’. Dizemos que alguém tem um privilégio quando se trata de uma permissão especial ou exclusiva. Médicos, por exemplo, têm o privilégio de realizar cirurgias (trata-se de uma permissão exclusiva). 15 Defendi essa tese no artigo “O direito de morrer” (Azevedo 2008). 16 Esta é, a propósito, a visão mais difundida em nosso meio jurídico. Como assinalei em nota acima, seguindo Georg Jellinek (entre outros), direitos são facultas agendi. Sobre essa visão, veja-se Reale (2005). Para Jellinek, o direito é o poder de querer (reconhecido e protegido pela Lei) dirigido a um bem ou interesse. Ora, os que pensam assim acabam por confundir um tipo de direito com o conceito de direito em geral. Bebês precisam mamar. E é plausível que tenham inclusive o direito sobre suas mães a
Sobre a Possibilidade de uma Teoria Moral Baseada em Direitos
341
serem alimentados. Seriam bebês portadores dessa facultas agendi? Teriam bebês um “poder de querer” dirigido a um bem legalmente protegido? Os defensores da visão entendem que não há problema, já que a suposta vontade do bebê pode ser juridicamente representada. Mas pais e mães têm o dever de abrigar e alimentar seus filhos, por exemplo, mesmo que estes não queiram. O fato é que “poder” é uma palavra ambígua. Pode significar “possibilidade” ou “capacidade”, mas também pode ter um sentido análogo ao que tinha para Hohfeld, isto é, como a capacidade jurídica especial de alterar os direitos ou permissões de outrem. 17 Tais afirmações compreendem ou implicam comandos. É plausível, assim, que normas jurídicas (os enunciados legislativos que se acham expressos textualmente em constituições, códigos, leis e estatutos) também não sejam imperativos, e sim enunciados declarativos dos quais se pode extrair imperativos, comandos ou prescrições. Leis e direitos não são, portanto, (em sentido primitivo) prescrições, embora seja constitutivo de seu conteúdo semântico que sujeitos autorizados (juízes, por exemplo) possam, de leis ou direitos, extrair prescrições (imperativos, ordens ou comandos) como conclusões. A propósito, no estado civilizado, somente pessoas investidas de poder público estão autorizadas politicamente a produzir comandos a partir de seus próprios julgamentos. Cidadãos comuns, ao contrário, diante do reconhecimento de uma norma, extraem, salvo exceções (por exemplo, situações de iminente perigo, bem como delitos flagrantes), apenas conclusões práticas subjetivas, mas não comandos dirigidos a outros. É verdade que posso chamar a atenção de alguém sobre as conclusões que ele deveria extrair, mas, salvo situações especiais, não tenho autoridade para comandá-lo. Assim, a menos que se tenha alguma autoridade pública ou política, ninguém tem a permissão de dar ordens a outra pessoa (salvo em alguma formulação de Estado de Natureza, como em Hobbes ou Locke, por exemplo). Aliás, esse é um aspecto central comum às teorias contratualistas. É o que Locke afirmou quando sustentou que, no governo civil, abdicamos de nossa licença natural de julgar e de dar execução a nossos juízos políticos (eventualmente por meio de comandos), concedendo-a somente aos juízes, governantes e seus subordinados legalmente autorizados. Penso que este é também um aspecto do conhecido direito à liberdade, ou direito a não interferência, e do direito ao devido processo legal. Nessa esteira, conclui-se que o direito à liberdade e o direito ao devido processo não são direitos que poderíamos ter nos estados de natureza de Hobbes ou mesmo de Locke. São direitos gerados com o estado civilizado. Assim, o que entendemos por liberdade corresponde a um “estado-de-coisas” de natureza política, de fato, a um tipo de estado político, o chamado “Estado de Direito”. É desses fatos, isto é, é da compreensão correta sobre esse estado-de-coisas que podemos inferir corretamente conclusões práticas sobre nossas próprias condutas ou eventuais comandos legítimos (quando se trata, nestes casos, de determinar por nossa vontade a conduta de outrem). 18 Médicos no Brasil estão proibidos por seu Código de Ética a revelar informações obtidas confidencialmente durante consulta, e esta obrigação persiste mesmo que o fato seja de conhecimento público, e mesmo que o paciente tenha falecido. As exceções são: “justa causa”, “dever legal”, ou autorização expressa do paciente (Código de Ética Médica 1988, artigo 102). 19 As palavras ‘verdadeira’ e ‘realmente’ são, de fato, ociosas (por isso, os colchetes). O enunciado acima expressa uma proposição necessariamente verdadeira; ele representa uma versão da conhecida fórmula empregada por Tarski em sua concepção semântica da verdade. Tarski tomou o enunciado (T ): ‘S é verdadeira sse p’ como enunciando o que chamou de condição material de adequação a qualquer teoria sobre a verdade. Assim, a função do enunciado (T ) é fixar a extensão da palavra ‘verdade’. Desse modo, S determina a extensão de todo enunciado ou proposição capaz de ser verdadeira ou falsa, a saber: enunciados, proposições ou sentenças assertóricas. Com efeito, se algum enunciado não puder ser empregado em substituição a S (isto é, se sua substituição gerar em T uma sentença gramaticalmente sem sentido), segue-se obviamente que não se trata de um enunciado assertórico. A propósito da teoria tarskiana e o contraste com outras teorias da verdade, veja-se o livro de Susan Haack (1978, p. 100–2). 20 Mesmo não-descritivistas, como Richard Hare, concordariam com isso. Hare inclusive disse-o explicitamente em Sorting out ethics (1997, p. 57) que a palavra ‘verdade’ tem certas propriedades formais, que ele não pode ignorar (referindo-se justamente ao teorema de Tarski). Hare inclusive imagina que um opositor à sua teoria de que enunciados morais e deônticos não são enunciados descritivos, e sim
342
Marco Antonio Oliveira de Azevedo
prescritivos, poderia aludir a tais propriedades formais em favor de que não descritivistas (como ele) estão errados. Hare concorda, porém, que se alguém afirmar que p ele certamente não pode, ao mesmo tempo, deixar de endossar p. Ninguém pode sensatamente dizer ‘p, porém não é verdade que p’. Assim, se um enunciado moral contiver aspectos descritivos (o que Hare certamente admite), então, em um sentido, é certo que, ao fazer um enunciado moral, eo ipso dou-lhe também meu endosso, mas apenas, assim sustenta Hare, com respeito a seu conteúdo descritivo, e não a seu conteúdo prescritivo. Não devo ir muito longe aqui nessa pretensão de refutar essa visão de Hare. Pretendo apenas que o leitor note as conseqüências que se seguem da aceitação do teorema de Tarski ao caso de enunciados sobre direitos e deveres. Faria sentido dizer que, sendo, digamos, q um enunciado com conteúdo normativo do tipo ‘X tem um direito sobre Y de que ϕ?, que alguém poderia sensatamente enunciar: ‘q, embora não seja verdade que q’? (Algo como afirmar que ‘X tem um direito sobre Y de que ϕ embora não seja verdade que X tenha um direito sobre Y de que ϕ’.) Dado que é insensato afirmá-lo, segue-se que enunciados morais tais como ‘X tem um direito sobre Y de que ϕ’ são também “minimamente aptos a verdade”. Hare admitiu que prescrições são “minimamente aptas à verdade” (Hare 1997, p. 58). Porém, o quê exatamente é “minimamente” apto à verdade em enunciados como ‘X tem um direito sobre Y de que ϕ’? Quais seriam os constituintes “puramente” descritivos que tornariam esse enunciado minimamente apto à verdade? Ora, não havendo como isolar tais aspectos, conclui-se que certos conteúdos tipicamente prescritivos é que conferem ao enunciado em questão o caráter de “minimamente” apto à verdade (embora aqui devamos nos perguntar se ainda faz sentido falar em enunciados “minimamente” aptos à verdade). 21 Minha tese de doutorado lidou com problemas semelhantes. Nela sustentei que é possível derivar conclusões morais de premissas factuais, entendendo que o próprio David Hume, tradicionalmente classificado como crítico a essa idéia, defendeu essa possibilidade. Sobre isso, veja-se minha tese de doutorado, ‘A “Lei de Hume’” (2003). 22 Esta distinção já é canônica na filosofia moral. Sobre esses conceitos, veja-se Brandom (2000). 23 Elizabeth Anscombe chamava os “raciocínios práticos” tomados “em hipótese” de meros “exemplos de sala-de-aula”. Para Anscombe, (bem como para Aristóteles) raciocínios práticos são raciocínios feitos em circunstâncias de ação; eles expressam um ato de deliberação do agente (Anscombe 1957). 24 Em nosso meio, uma das maiores contribuições para o estudo do contraste entre raciocínios ou inferências teóricas e raciocínios ou inferências (e deliberações) práticas foi feita pelo professor Balthazar Barbosa Filho no artigo ‘Saber, fazer e tempo: uma nota sobre Aristóteles’ (1999). Neste artigo, o professor Balthazar ressalta que agir consiste em tornar determinado o que não é, ao passo que dizer de uma proposição que é verdadeira é dizer que certo estado de coisas ocorre tal como a proposição expressa, o que implica admitir que o que torna no mundo uma proposição verdadeira não pode ser objeto de ação. Penso que isso ajuda-nos a explicar porque o enunciado de dever que é conclusão de um raciocínio prático difere do enunciado de dever que serve de premissa ao mesmo raciocínio. Se X tem direito sobre Y de que p (isto é, de que p seja o caso), X tem um dever (duty) frente a Y de que p (seja o caso). Desse fato de que X tem um dever frente a Y de que p, infere-se (em termos práticos) que X tem (coeteris paribus) uma razão deôntica, um dever (an ought) de fazer com que p seja o caso. Ora, alguém pode certamente saber que tem um dever de que p (seja o caso) e não adequar sua vontade a isso. Sua imoralidade ou incontinência o explicariam. O que sugiro (muito embora não sem controvérsia) é que ‘X tem um dever frente a Y de que p’ expressa, tal como assinalou Thomson, uma proposição, a qual, em sendo verdadeira, corresponde a um estado de coisas efetivo (um fato). A conclusão do raciocínio, contudo, entendida como conclusão de um raciocínio prático efetivo (e não de um raciocínio abstraído de seu contexto prático, o que não passaria de um mero “exemplo de sala-de-aula”, tal como dizia Anscombe), não expressa uma proposição em sentido próprio: é um imperativo. 25 Sobre a diferença entre o que é bom (e recomendável) e o que é correto (ou justo) — e exigível, veja-se a Tanner Lecture de Judith Jarvis Thomson, Goodness and advice (Thomson 2001).
Q UEM SÃO OS M EMBROS DA C OMUNIDADE M ORAL ? P ETER S INGER , A S ENCIÊNCIA E AS R AZÕES U TILITARISTAS M ARIA C ECÍLIA M ARINGONI DE C ARVALHO Universidade Federal do Piauí
mcecilia19@uol.com.br
1. Sobre a senciência Andrew Linzey, teólogo anglicano, cunhou o termo “senciencismo”1 para designar as posições que elegem a senciência, vale dizer, a capacidade que um organismo tem de sentir e de sofrer, para demarcar a esfera da comunidade moral. Na Alemanha cunhou-se o termo “patocentrismo” para designar as posições que — como o nome sugere — realçam a capacidade de sofrer como sendo a característica crucial que outorga estatuto moral a seu portador. Richard D. Ryder preferiu os termos “painism” e “painience” (Ryder 1998, p. 45–6; cf. também “Painism”, em Bekoff e Meaney 1998; p. 269–70) — que Sonia T. Felipe traduziu, a meu ver muito oportunamente, pelos neologismos “dorismo” e “dorência” ou “sofrência” respectivamente (Felipe 2005a, p. 205–27); no entender de Ryder, o termo “dorência”, ou então, “sofrência”, por acentuar a capacidade que um organismo tem de sentir dor e de sofrer — incluindo-se nele todas as formas de sofrimento — se mostra mais adequado do que “senciência” para traçar a linha divisória da comunidade moral. Embora Peter Singer não seja o único e nem tenha sido o primeiro pensador a defender uma posição voltada para o objetivo de proteger da inflição desnecessária de dor e sofrimento aqueles organismos, humanos ou não-humanos, dotados de sensibilidade e consciência, ele deu sistematicidade a tal posição. A clareza com que escreve proporcionou popularidade a seus escritos e o rigor buscado na argumentação, a riqueza de exemplos usados, bem como o embasamento científico de suas afirmações lhe garantiram respeitabilidade acadêmica. Singer é considerado um dos mais polêmicos filósofos da atualidade, dada a radicalidade com que procura assumir as conseqüências de suas posições que, muitas vezes, afrontam concepções tradicionais na Ética, a que muitos consideram difícil de renunciar. Digno de registro parece ser o fato de que mesmo aqueles que não subscrevem todas as teses de Singer ou os que apontam em sua teoria tensões e dificuldades, não conseguem negar, por exemplo, que a senciência, sobretudo a capacidade de sentir dor e de sofrer, seja um importante atributo dos pacientes morais, vale dizer, daqueles seres que, a despeito de não serem agentes morais, são afetados por ações de agentes morais, o que lhes dá a senha de acesso à comunidade moral. 1.1. A plausibilidade prima facie da senciência como critério de estatuto moral A senciência é, ao menos prima facie, um critério plausível de estatuto moral, uma vez que não parece haver dúvida de que é moralmente errado infligir dor a um terceiro Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 343–355.
344
Maria Cecília Maringoni de Carvalho
na ausência de uma boa razão para tal. O próprio senso-comum moral repele como crueldade injustificável a inflição gratuita de dor. Cabe ressaltar que o que caracteriza uma posição senciencista é que ela caracteriza o erro da crueldade em função do dano que é imposto à vítima, paciente moral por excelência, sem recorrer (primariamente) a considerações alheias a seu sofrimento. Assim, se um animal não-humano, por exemplo, é maltratado, ferido ou morto, a obrigação moral de evitar tais sacrifícios se põe em consideração a ele e não — ou não apenas — em atenção a humanos que, por alguma razão, poderiam se sentir prejudicados em decorrência do sofrimento infligido ao animal. Já se questionou no passado a capacidade de os nãohumanos sentirem dor. Sabe-se que René Descartes defendeu e incapazes de sentir e sofrer. Uma tal posição é hoje em dia difícil de ser seriamente sustentada, sobretudo após Darwin ter acentuado nossa proximidade filogenética com não-humanos.2 Todavia é possível encontrar as raízes cartesianas no pensamento de alguns filósofos e, como mostra S. T. Felipe, elas estão fortemente presentes ainda hoje na ciência experimental (Felipe 2007, p. 41ss). É provável que a senciência não seja encontrável em todos os organismos não-humanos, mas há fortes evidências de que ela não é apanágio do ser humano. Além das evidências fisiológicas, anatômicas e comportamentais de que os animais sentem dor, esta possui, como afirma Singer, incontestável utilidade biológica, e não seria razoável supor-se que os sistemas nervosos de humanos e não-humanos funcionassem de modos tão diferentes no que respeita às sensações subjetivas.3 Por certo que a senciência não se acha igualmente distribuída entre os animais; este assunto não será explorado aqui, pois o que está em questão é a relevância da senciência, ou seja, se sua presença faz alguma diferença para se decidir questões de estatuto moral. 1.2. Peter Singer e a escolha da senciência para demarcar a comunidade moral O que há de especial na senciência para que dela deflua ser razoável atribuir-se estatura moral a seu portador? Poderia ela ser considerada como condição necessária e suficiente para que seres dotados dessa capacidade se credenciem como dignos de consideração moral? Para Peter Singer a senciência é uma qualidade que confere estatuto moral a seu portador, porque seres sencientes possuem interesses, ao menos o interesse em não sofrer, em não sentir dor, e uma teoria ética aceitável não pode deixar de incluir no conjunto de suas prescrições aquela que recomenda a minimização da dor e do sofrimento, por conta de ela ir ao encontro do interesse principal de seres dotados de sensibilidade e consciência, que é o interesse em evitar a dor. Uma vez que uma teoria ética não pode simplesmente deixar de levar em conta interesses de agentes e pacientes morais, e a ética utilitarista, sobretudo em sua vertente preferencial, à qual se filia P. Singer, considera como seu princípio fundamental a maximização da satisfação de interesses ou preferências de todos os potencialmente afetáveis por uma ação/abstenção, não há de causar surpresa o fato de a ética aplicada ou prática de
Quem são os membros da comunidade moral?
345
Singer situar a satisfação de interesses/preferências no centro de suas preocupações. Que o sofrimento evitável seja moralmente injustificável e deva, tanto quanto possível, ser combatido/ minimizado, parece ser uma decorrência da tese de que seres sencientes têm interesses, dentre os quais se destaca como o mais fundamental o interesse em evitar a dor ou sofrimento. Para Singer a senciência é condição necessária e suficiente para se outorgar considerabilidade moral àqueles que a possuem, independente da espécie biológica à qual pertençam. As fronteiras da esfera moral coincidem, portanto, com as fronteiras da senciência. Enquanto condição suficiente de estatuto moral, todos os organismos sencientes, sejam humanos ou não-humanos, pertencem à comunidade moral; sendo também condição necessária, os que são desprovidos de senciência permanecem ausentes da comunidade moral, não significando, por certo, que sejam pura e simplesmente destituídos de importância, ou que possam ser danificados ou destruídos, sem que isso tenha alguma relevância; significa tão- somente que sua importância ou não é de ordem moral ou sua relevância moral é apenas indireta, na medida em que danos a eles afetam interesses humanos. Todavia, pode-se questionar a razoabilidade de uma tal implicação, que exclui da esfera moral ou da considerabilidade moral direta os seres não-sencientes — aqueles que por natureza não são dotados de senciência ou já não mais o são. O princípio básico da ética de Singer, que prescreve serem considerados por igual os interesses semelhantes de todos os seres sencientes, é visto por Singer como uma decorrência da exigência de imparcialidade, que estaria ancorada no próprio ponto de vista moral, o qual exigiria que os interesses de um sujeito singular X não podem ter mais peso na deliberação moral por conta tão-somente de serem os interesses de X . A imparcialidade e a universalizabilidade próprias da moralidade prescrevem que interesses iguais sejam considerados de modo igual. Singer dá a esta idéia o nome de Princípio da Igual Consideração de Interesses Semelhantes, o qual não exige tratamento igual, mas tão somente consideração igual a interesses comparáveis e semelhantes.4 Uma transgressão do Princípio da Igual Consideração de Interesses Semelhantes, além de ferir a exigência da universalizabilidade, ainda se compromete com o especismo, para Singer tão condenável quanto o racismo ou o sexismo (Singer 2000, p. 6). À exigência moral de igualdade ele dá uma interpretação original: de acordo com Singer, sofrimento igual, vale dizer, de igual intensidade ou duração, exige igual consideração: não importa se quem sofre é um indivíduo da espécie humana ou um animal não-humano. Isso parece tornar os animais não-humanos sencientes nossos iguais morais. Todavia, a reflexão de Singer não se detém aí. O Princípio da Igualdade de Consideração de Interesses Semelhantes por si só não delimita seu alcance. Singer não considera, por exemplo, que a vida de todos os organismos sencientes tenha igual valor. A vida de um ser dotado da qualidade de ser pessoa, isto é, de ser um indivíduo que, além de senciente, é também racional e autoconsciente,5 tem mais valor do que as vidas dos seres que são meramente conscientes. Contudo, como pretendo mostrar no decorrer desta exposição, o embasamento utilitarista que Singer confere à sua ética, parece lhe acarretar alguns embaraços.
346
Maria Cecília Maringoni de Carvalho
1.3. A senciência como condição necessária para se ter interesses O termo “interesse”, como o sabemos, possui dois significados. Quando dizemos que X tem interesse em Y podemos querer dizer que X valoriza Y , tem apreço por Y , pretende, de alguma forma, obter Y . Ou então, podemos querer dizer que, independentemente de X se interessar ou não por Y , Y é do interesse de X , isto é, Y é benéfico para X . Na filosofia muito se tem debatido sobre que tipos de entidade podem realmente ter interesses. Em um extremo, R. G. Frey defende que somente os seres humanos têm interesses, dado que — segundo Frey — para se ter interesses é necessário que se tenha crenças e desejos, o que por sua vez exigiria a capacidade para se usar a linguagem, a qual nenhum animal não-humano possui.6 No outro extremo, alguns eticistas ambientalistas7 argumentam que todos os seres viventes (e, possivelmente, alguns não viventes) têm interesses porque são sistemas teleológicos que possuem um bem que lhes é próprio. A posição de Singer se situa no meio entre os dois extremos, na medida em que atribui interesses a todos os seres sensíveis e conscientes e somente a estes. Todavia, o que significa dizer que todos os seres sencientes e somente estes têm interesses? Bernard E. Rollin argumenta que nenhum animal, tampouco o ser humano, é explicitamente consciente de todas, sequer da maioria de suas necessidades. O que converte suas necessidades em interesses é sua capacidade de reação mental, que emerge quando determinadas necessidades não são atendidas. Se não podemos identificar todas as nossas necessidades, podemos algumas vezes saber quando algumas são frustradas ou atendidas. Dor e prazer são os modos óbvios de tais fatos virem à consciência, mas não são os únicos. Frustração, ansiedade, doença, tédio, e raiva estão entre os muitos indicadores de necessidades insatisfeitas que se converteram em interesses (Rollin 1992, p. 76ss). Singer observa que organismos não sencientes podem ter necessidades e, portanto, um bem que lhes é próprio, mas não um bem passível de ser experimentado. 1.4. É a senciência um critério adequado de estatuto moral? Do que foi exposto se pode depreender que a senciência é um atributo importante e que não pode ser negligenciado por uma teoria ética. Seres sencientes se credenciam como merecedores de estatuto moral. A senciência pode, portanto, atuar como condição suficiente para se atribuir considerabilidade moral aos seres que a possuem. Disso não se segue, todavia, ser ela condição necessária de estatuto moral. Ademais, parece existir razões positivas para queremos atribuir ao menos um grau de estatuto moral a seres que, ao que tudo indica, não são sencientes: pessoas que, em virtude de alguma enfermidade se encontram em condição de coma profundo, e, aparentemente, não são sencientes; fetos humanos e não-humanos, nos estágios iniciais de gestação e pessoas falecidas. Além disso, gostaríamos de poder conceder respeito moral — inter alia — a símbolos na-
Quem são os membros da comunidade moral?
347
cionais ou religiosos bem como a lugares tidos por sagrados, ainda que não compartilhemos das crenças que emprestam significado a tais símbolos. É possível que possuir estatuto moral não seja uma questão de tudo ou nada e que precisemos de uma teoria mais sofisticada para que possamos conceder estatuto moral a entidades individuais ou específicas que não possuem o atributo da senciência. Talvez seja o caso de se pensar em uma teoria multicriterial de estatuto moral, como a desenvolvida por Mary Anne Warren (Warren 1997).
2. A senciência e a ética utilitarista Passo agora a enfocar algumas dificuldades da ética de Singer que resultam de sua adesão ao Utilitarismo; se algumas delas, a meu ver, têm sua origem em mal-entendidos, outras parecem afetar seriamente a posição abolicionista de Singer. Em primeiro lugar, nunca é demais ressaltar que algumas objeções amplamente disseminadas contra Singer são equivocadas, pois parecem não levar em conta sua versão particular de utilitarismo. Há que se sublinhar – como tem ressaltado Sonia T. Felipe —, que Singer preconiza a igual consideração de interesses semelhantes, o que ao menos em tese exclui o problema de se ter de escolher entre preferências ou interesses que não são semelhantes e, portanto, não comparáveis entre si.8 Assim, o interesse de muitos humanos pelo uso de novos cosméticos não justifica o enorme sofrimento imposto a animais de teste. Interesses triviais de muitos nunca podem receber mais peso que interesses básicos de outros. Um conflito somente surgiria em uma situação em que dois ou mais indivíduos tivessem interesse em aliviar sua dor ou sofrimento e os recursos disponíveis para tal fossem escassos, não permitindo que todos os afetados tenham sua dor atenuada. Para enfrentar este problema Singer, em consonância com o Utilitarismo, propõe que se recorra ao princípio da utilidade marginal decrescente.9 Todavia, é preciso se reconhecer, contra Singer, que os críticos que acenam para dificuldades na defesa utilitarística do igualitarismo por Singer têm o seu ponto, o qual consiste em que situações são pensáveis, nas quais o agente moral tem de tomar uma decisão, porém nem a tese que prescreve igual consideração de interesses semelhantes, tampouco o princípio da utilidade marginal decrescente apontam para uma solução inequívoca. Ou podem apontar na direção de uma solução que imponha sacrifícios aos animais. Explicando melhor: mesmo com as ressalvas acima, não se pode evitar a impressão de que o Utilitarismo, na medida em que exige sejam computadas todas as conseqüências de uma ação visando o atendimento de interesses semelhantes, pode ser condescendente com a realização de experimentos em que se usam animais e que podem infligir-lhes grande sofrimento, quando não a morte. Tal impressão é reforçada por algumas concessões, que Singer aparentemente se viu obrigado a fazer para ser coerente com seu Utilitarismo. Nesse contexto pode-se lembrar, como o fez Jörg Klein (Klein 1999, p. 67–83) que na obra Libertação Animal Singer admite estar moralmente justificado um experimento que permitisse fossem salvas milhares de vidas humanas, a despeito de tal experimento
348
Maria Cecília Maringoni de Carvalho
infligir dor e sofrimento ao animal sujeito da experiência, muito embora Singer reconheça que a possibilidade de ocorrer uma tal situação, a despeito de ser concebível, é muito remota (Singer 2000, p. 78). Tendo isso em mente, Singer propõe que, a fim de não incorrermos em especismo, quando tivermos de decidir se uma experiência é ou não justificável, estejamos dispostos à utilização de um ser humano mentalmente deficiente em uma tal experiência.10 Outro argumento usado por Singer para se defender da acusação imputada à sua ética, ou seja, a de que o utilitarismo abriria uma brecha para a justificação de experimentos dolorosos com animais, consiste em apontar para o fato de o Utilitarismo ser incompatível com um catálogo de normas que devam valer de modo absoluto, e que tal estado de coisas é um dos méritos do utilitarismo. O recurso a uma lista de normas que nos prescrevessem o que fazer poderia apenas à primeira vista ser vantajoso, pois, como adverte Singer, um rol que contivesse nossos deveres nos pouparia de refletir sobre as características de uma situação particular. Todavia, a suposta vantagem se esvai, uma vez que as proibições ou mandamentos incondicionais revelam-se inadequados diante de circunstâncias inusitadas ou extremas (Singer 2000, p. 78). Boa parte dos problemas éticos não pode ser enfrentada com soluções simples ou préfabricadas, mas exige uma investigação pormenorizada e a consideração mais ampla possível das várias conseqüências dos diversos cursos de ação disponíveis. Enfim, em favor do utilitarismo se pode dizer que se queremos uma ética que faça jus às peculiaridades de cada situação, não podemos nos contentar com uma tábua de mandamentos, cuja simplicidade e generalidade nos deixariam desprovidos de orientação em situações complexas. Todavia, contra o utilitarismo vale afirmar que o cômputo das satisfações das várias preferências em disputa, mesmo em se considerando a cláusula de que somente as preferências ou os interesses semelhantes devem ser tidos em linha de conta, não é tarefa das mais fáceis ou sequer exeqüível. 2.1. Valor do sofrimento, valor da vida Outro ponto que os críticos de Singer costumam receber com reserva diz respeito ao tratamento diferenciado que ele dá ao valor do sofrimento e ao valor da vida. Se ao sofrimento dos animais deve ser concedido o mesmo peso que ao dos humanos, Singer considera que à vida de seres humanos normais — por conta de sua autoconsciência, sua capacidade de planejar o futuro, etc. — se deve outorgar um valor mais alto do que à dos animais não-humanos. Assim, de acordo com Singer, não seria especista11 julgar que a vida de um adulto normal, membro de nossa espécie, seja mais valiosa do que a de um rato adulto normal, o que, todavia, de acordo com Singer, não deve ser entendido como significando que seja sempre moralmente permissível eliminarse a vida de um rato: sua morte, ainda que indolor, reduziria certamente a quantidade total de felicidade no universo e é, nessa medida, indesejável. Observe-se que neste particular Singer recorre ao Utilitarismo clássico, que contabiliza prazeres e dores, ao invés de preferências satisfeitas ou frustradas. Todavia, eliminar a vida de uma pes-
Quem são os membros da comunidade moral?
349
soa, que Singer caracteriza como um ser que tem consciência de si e é capaz de se ver como indivíduo distinto com um passado e um futuro — é intrinsecamente pior do que eliminar a de um rato, dado que a morte de uma pessoa não apenas contribui, em geral, para diminuir o montante de felicidade no universo, mas ainda acarreta a frustração das preferências que a pessoa pode ter tido relativamente a seu futuro.12 Coerente com seu Princípio de Igual Consideração de Interesses Semelhantes e com a tese de que a vida de não-pessoas tem valor diminuído relativamente ao da vida de pessoas, Singer considera que uma lesma e um recém-nascido de um dia têm o mesmo valor. Nenhum dos dois dispõe de preferências voltadas para o futuro, que possam ser frustradas. O mesmo se dá em relação a bebês anencéfalos, embriões e fetos de uma certa faixa etária, bebês humanos atingidos por severa e irreversível limitação mental.13 2.2. Um Utilitarismo levado a sério A teoria ética de Singer parece comportar três teses que podem conflitar entre si: 1) a prescrição da igual consideração de interesses semelhantes; 2) o maior valor a ser concedido a indivíduos com vidas mentais mais complexas; 3) a norma utilitarista de se contabilizar todas as conseqüências, inclusive os efeitos colaterais de nossos atos. Como já ressaltado Singer defende um utilitarismo que não apregoa a igual consideração de todos os interesses e preferências, mas somente de interesses semelhantes. Mas há que se realçar também que o Utilitarismo de Singer é sensível à maior ou menor complexidade de vidas mentais. Tampouco se pode esquecer que o utilitarismo recomenda que se contabilizem todas as conseqüências de nossas ações, inclusive os efeitos colaterais das mesmas. Posto isso, Singer parece se ver constrangido a relativizar sua tese, segundo a qual dor é dor, não importando quem a sente, e, no limite, a privilegiar as dores do ser humano em detrimento das do animal. É o que se pode depreender de sua resposta à observação de Richard J. Arneson que, em uma crítica a Singer (Arneson 2000, p. 105), sustentou que, em tese, se estivéssemos diante da escolha entre as seguintes alternativas: ou bem permitir/ causar fortes dores de dente em uma criança ou então dores ainda mais fortes em um jovem rato, teríamos que nos decidir, de acordo com Singer, pela primeira alternativa, o que afrontaria, sem dúvida, o senso-comum moral. Em sua resposta a Arneson, Singer, em conformidade com o utilitarismo, que exige sejam computadas todas as conseqüências de nossas ações, inclusive seus efeitos colaterais, se vê compelido a admitir que “devemos levar em consideração outros interesses além do interesse em não experimentar o sofrimento causado por uma dor de dente: os interesses da criança em ser capaz de freqüentar a escola, ou os interesses dos pais em não ver sua criança sofrendo. Estes outros interesses, algumas vezes, porém nem sempre, inclinarão a balança em uma direção diferente daquela em que estaria se tivéssemos que considerar tão — somente a severidade da dor física”. (Singer 2000, p. 299).14 Em consonância com o Utilitarismo, Singer — como observado por Jörg Klein
350
Maria Cecília Maringoni de Carvalho
(1998, p. 67–83) — muitas vezes acrescenta à sua afirmação, segundo a qual dores são dores e, por conseguinte, dignas de igual consideração independentemente da espécie a que o indivíduo que as sente pertence, a cláusula “ other things being equal.” Assim, as dores de dente de um ratinho e de uma criança só mereceriam a mesma consideração se, a despeito de serem supostamente de igual intensidade, pudéssemos supor que não haveria nenhuma outra diferença relevante provocada por elas. Todavia, uma vez que por conta das dores de uma criança — como Singer aparentemente entende — um número maior de interesses costuma ser frustrado do que em decorrência das dores de um rato, aquelas devem merecer mais peso, ainda quando sejam tão fortes como as do rato e, muitas vezes também, quando são menos fortes do que elas. 2.3. Pessoas com diferentes níveis de desenvolvimento mental No que tange à questão do valor da vida de seres vivos Singer não apenas diferencia entre pessoas e não-pessoas, mas ainda introduz distinções adicionais em função do grau de desenvolvimento das características pessoais de um ser vivo, visando oferecer subsídios para a resolução de alguns casos de conflito. Em “Ten Years of Animal Liberation” Singer parece ter razão quando aponta para uma contradição na obra de Tom Regan, e que consistiria no fato de não obstante Regan defender que a vida de todos os mamíferos — dos ratos até os humanos — possua o mesmo valor inerente e, portanto, mereça a mesma proteção moral, ele sustenta que no caso hipotético de um barco salva-vidas que estivesse com superlotação e em cujo interior se encontrassem, além de quatro seres humanos normais também um cachorro, seria moralmente exigível — caso tivéssemos que lançar para fora da embarcação um de seus ocupantes, a fim de evitar que todos perecessem — que escolhêssemos lançar para fora o cachorro e não um dos seres humanos. De acordo com Regan a razão para tal residiria em que a morte acarreta maior dano a um ser humano do que a um cachorro, dado que a eliminação prematura da vida de um ser humano o impede de ter mais experiências de vida valiosas — tanto em número quanto em variedade — do que seria o caso em decorrência da morte precoce de um cão (Singer 1985, p. 48ss). Por outro lado, Singer tem consciência de que seu princípio que prescreve igual consideração de interesses semelhantes não ofereceria entrave algum para se justificar a decisão de se salvar os humanos, em detrimento do animal, pois tudo indica que os humanos têm um interesse maior pela vida do que os cães. Tanto se poderia dizer que ao ser humano estariam abertas maiores possibilidades de satisfação em suas vidas como também que eles — porém não os cães — acalentam planos, esperanças e desejos, que a morte impediria fossem realizados. Estas e outras passagens na obra de Singer apontam para o fato de que, de acordo com sua teoria ética, em situações em que a vida está contra a vida, aqueles seres vivos cujo nível mental é superior ao de outros, deveriam ter prioridade no momento
Quem são os membros da comunidade moral?
351
de um resgate. A situação do barco salva-vidas não é, em princípio, diferente de uma situação em que um animal é morto com o fito de se salvarem vidas humanas. Jörg Klein chamou a atenção para o caso do xenotransplante, ou seja, o uso de órgãos de animais não-humanos para serem transplantados em humanos (Klein 1998, p. 67– 83). Se um cão deve ser sacrificado e lançado fora da embarcação para que um ser humano possa sobreviver, ou se um porco é morto e seu coração transplantado em um ser humano, que, do contrário, morreria, são duas situações que parecem se assemelhar. Não obstante, Singer se pronunciou contra o xenotransplante, por admitir que porcos são pessoas.15
3. Para concluir Não se pode negar que a contribuição de Singer para ampliar a esfera da comunidade moral e romper a barreira da espécie humana foi significativa. Sua obra parece ter propiciado o fato de muitos humanos terem-se tornado mais sensíveis à dor e ao sofrimento impostos aos animais não-humanos pelos modos habituais como estes são (mal) tratados. Também se pode afirmar que possivelmente por conta da obra de Singer a filosofia acadêmica tenha passado a acolher a ética animal ou zooética como parte importante de seu trabalho de investigação. Todavia, como ressaltado neste artigo, o critério singeriano da senciência, a despeito de sua plausibilidade, ainda permanece excludente por não poder incluir na esfera moral seres não-sencientes a quem se poderia/deveria atribuir estatuto moral. O Utilitarismo de preferências de Singer não está isento de dificuldades; na medida em que se interpreta “preferências” em termos de necessidades conscientes, nele não há espaço para se incluir privações não registradas pela consciência animal. Animais mantidos em cativeiro sob condições de vida muito ruins provavelmente não podem imaginar uma vida melhor para eles. Animais sencientes podem sentir dor, medo, e isso parece ser tudo o que um utilitarismo de preferências é capaz de capturar. O que a perspectiva do utilitarismo de preferências parece não conseguir levar em conta é a condição de privação de uma vida melhor.16 Ademais, a senciência se considerada como condição necessária de estatuto moral, parece impedir que se contemple, por exemplo, o respeito que deveríamos poder atribuir aos mortos, a objetos e símbolos que tenham significado para nós ou para outros, como, por ex. bandeiras, imagens religiosas, lugares sagrados, etc. O cômputo utilitarista de todas as conseqüências de uma ação e a tese de que a vida de pessoas tem mais valor que a de não-pessoas podem, em uma situação de conflito, favorecer uma decisão em prol da vida humana, o que pode atenuar o vigor e o impacto da defesa singeriana dos animais. É difícil não concordar com a conclusão de J. Klein, segundo a qual, o utilitarismo de preferências não dá suficiente amparo para uma defesa em favor da igual consideração para animais, não sendo, por conseguinte, o fundamento adequado para uma ética igualitarista que se propõe a defen-
352
Maria Cecília Maringoni de Carvalho
der a igual consideração de interesses semelhantes, independentemente da espécie biológica a que os pacientes morais pertençam. Contudo, a preocupação com o sofrimento animal veio para ficar. Qualquer teoria ética que pretenda superar a de Singer deverá incluir entre suas normas a proibição de crueldade para com animais não-humanos e contemplar sua vulnerabilidade ao sofrimento em suas variadas formas.
Referências Arneson, R. 2000. What, if Anything, Renders all Humans Morally Equal? In Jamieson 2000, p. 103–28. Bekoff, M & Meaney C. A. (eds.) 1998. Encyclopedia of Animal Rights and Animal Welfare. Westport, Connecticut: Greenwood Press. Dutra L. H. & Mortari, C. (orgs.) 2005. Ética. Anais do IV Simpósio Internacional Principia. Parte 2. Florianópolis: Núcleo de Epistemologia e Lógica. Felipe, S. T. 2003. Por uma questão de princípios. Alcance e Limites da Ética de Peter Singer em defesa dos animais. Florianópolis: Fundação Boiteux. —–. 2005a. Atribuição de direitos aos animais: três argumentos para sua fundamentação. In Dutra & Mortari 2005, p. 205–27. —–. 2005b. Natureza e Moralidade. Igualdade Antropomórfica, Antropocêntrica ou Ética? Philosophica (Lisboa) 25: 43–75. —–. 2006. Da considerabilidade moral dos seres vivos: A Bioética Ambiental de Kenneth E. Goodpaster. Ethic@. Revista Internacional de Filosofia Moral (Florianópolis) 5(3): p. 103– 18. —–. 2007. Ética e experimentação animal. Fundamentos Abolicionistas. Florianópolis: Editora da Universidade Federal de Santa Catarina. Frey, R. G. 1980. Interests and Rights. The Case Against Animals. Oxford: Oxford University Press. Jamieson, D. (org.) 2000 [1999]. Singer and His Critics. Oxford: Blackwell Publishers. Klein, J. 1998. Die ethische Problematik des Tierversuchs. Ethica 4(6): 383-406. —–. 1999. Gleichheit für Tiere? Aufklärung und Kritik 2: 67-83. Leopold, A. 1949. A Sand County Almanach. Oxford: Oxford University Press. Linzey, A. 1998. Sentientism. In Bekoff & Meaney 1998, p. 211. Regan T. & Singer, P. (eds.) 1989. Animal Rights and Human Obligations. Englewood Cliffs, New Jersey: Prentice Hall. Rollin, B. E. 1989. Animal Pain. In Regan & Singer 1989, p. 60–65. —–. 1992. Animal Rights and Human Morality. Buffalo, NY: Prometheus Books. Rolston III, H. 2000. Respect for Nature: Counting what Singer finds of no Account. In Jamieson 2000, p. 247–68. Ryder, R. D. 1998. Political Animal. The Conquest of Speciesism. Londres: McFarland. Singer, P. [1975] Libertação Animal. Trad. Maria de Fátima St. Aubyn. Lisboa: Via Óptima, 2000. —–. 1985. Ten years of animal liberation: a review of ten recent books. The New York Review of Books (17 January 1985): 46–52. —–. [1993] Ética Prática. Trad. Jefferson Luiz Camargo. São Paulo: Martins Fontes, 1994. —–. 2000[1999] A Response. In Jamieson 2000, p. 269–335. Steinbock, B. 1978. Speciesism and the Idea of Equality. Philosophy 53: 247–56.
Quem são os membros da comunidade moral?
353
Taylor, P. W. 1986 Respect for Nature: A Theory of Environmental Ethics. Princeton, NJ: Princeton University Press. Warren, M. A. 1987. Difficulties with the Strong Animal Rights Position. Between the species 2(4): 163–73. —–. 1997. Moral Status. Obligations to persons and other living things. Oxford: Oxford University Press.
Notas 1 Linzey 1998, p. 211. De acordo com Sonia Felipe, ele foi uma das “vozes dissidentes mais poderosas da
Igreja Católica” no século XX. Cf. Felipe 2003, p. 82. 2 Bernard Rollin assevera que “there is no good reason, philosophical or scientific, to deny pain in animals”. Prossegue afirmando que “ as the Darwinians recognized, it is arbitrary and incoherent, given the theories and information current in science, to rule out mentation for animals, particularly such a basic, well-observed mental state as pain”. Cf. “Animal Pain”, p. 63 — excerto publicado na coletânea organizada por Tom Regan e Peter Singer (1989), intitulada Animal Rights and Human Obligations, extraído de sua obra The Unheeded Cry. Oxford: Oxford University Press, 1989. 3 Cf. Singer [1975], p. 11–2. Bernard E. Rollin afirma: “Denial of pain consciousness in animals is incompatible not only with neurophysiology, but with what ca be extrapolated from evolutionary theory as well. There is reason to believe that evolution preserves and perpetuates successful biological systems. Given that the mechanisms of pain in vertebrates are the same, it strains credibility to suggest that the experience of pain suddenly emerges at the level of humans. [. . . ] Feeling pain and the motivational influence of feeling it are essential to the survival of the system, and to suggest that the system is purely mechanical in animals but not in man is therefore highly implausible”. Itálico no original. Rollin 1989, p. 64. 4 Cf. Singer [1993], p. 33, onde o autor afirma: “ Trata-se de um princípio mínimo de igualdade, no sentido de que não impõe um tratamento igual”. Como Singer mostra, há situações em que um tratamento desigual promove um resultado mais igualitário, o que está de acordo com o princípio da diminuição da utilidade marginal. Cf. também [1975], p. 2. 5 Cf. Singer [1993], p. 97. Singer acolhe os “indicadores de humanidade” arrolados por Joseph Fletcher: consciência de si, autocontrole, senso de futuro e passado, capacidade de relacionar-se com os outros, preocupação com os outros, comunicação e curiosidade (cf. Singer [1993], p. 96). Menciona também a definição de John Locke para o ser pessoa, cujas características não se contrapõem à de Fletcher: ser pensante e inteligente, dotado de razão e reflexão, que é capaz de se ver como tal, como sendo a mesma coisa pensante, em tempos e lugares diferentes (cf. Singer [1993], p. 97); 6 Frey, R. G. “Why Animals lack beliefs and desires”, em Regan & Singer 1989, p. 39–42. Excerto extraído de Frey 1980. Ver o excelente artigo de Sonia Felipe (2005b), em que a autora à página 57 denuncia as raízes cartesianas do pensamento de R. G. Frey. O tema é abordado também em seu livro Felipe 2007, p. 134–5. O princípio da utilidade marginal decrescente é aí rebatizado por Felipe de modo bastante feliz como “princípio do não-desperdício” ou “princípio do melhor aproveitamento dos bens”, a ser invocado quando os recursos são escassos e as demandas são semelhantes e competem entre si. Cf. Felipe 2007, p. 147–8. 7 Aqui não se pode deixar de mencionar A. Leopold, precursor do moderno movimento ambientalista, autor de A Sand County Almach, and Sketches Here and There [1949], como também Paul W. Taylor Respect for Nature: A Theory of Environmental Ethics, 1986, que defende um igualitarismo biocêntrico, o qual exige não apenas o respeito a todos os seres viventes, mas que outorguemos à vida de todos os viventes o mesmo valor que outorgamos à nossa própria vida, uma posição teoricamente difícil de ser sustentada, dado não haver razão aparente para se conceder relevância ética ao ser vivente em contraste com a natureza inanimada, além da dificuldade de se pôr em prática uma ética que interdita a destruição de qualquer organismo vivo. O critério da senciência é considerado limitado também por Holmes
354
Maria Cecília Maringoni de Carvalho
Rolston III, autor de “Respect for Life: Counting what Singer finds of no Account”. In Jamieson 2000, p. 247–68. Mais recentemente Kenneth Goodpaster tem mostrado os limites do critério da senciência e argumentado em favor de uma bioética ambiental e da considerabilidade moral dos seres vivos. Leia-se a respeito o artigo de S. T. Felipe (Felipe 2006). 8 Ver por exemplo as observações pertinentes de Sonia Felipe em 2005b, p. 43–75. 9 Singer [1993], cap. 2. Sonia Felipe, em seu livro (2007) defende Singer de diversas críticas dirigidas que lhe são dirigidas por sua posição igualitário-utilitarista. Cf. sobretudo, as páginas 166–78. 10 Singer [1975], p. 79. Em palavras de Singer: “[. . . ] uma experiência não pode ser justificável a não ser que seja tão importante que justificasse a utilização de um ser humano mentalmente deficiente” ([1975], p. 78). 11 Cf. Singer [1993]; à página 71 ele escreve: “Não seria especista afirmar que a vida de um ser consciente de si, capaz de pensamento abstrato, de planejar o futuro, de realizar complexos atos de comunicação etc., seja mais valiosa do que a vida de um ser que não possua essas aptidões. Veja-se também [1975], p. 19: “Enquanto a autoconsciência, a capacidade de pensar em termos de futuro e ter esperança e aspirações, a capacidade de estabelecer relações significativas com os outros, entre outras, não são relevantes para a questão da inflicção de dor — uma vez que dor é dor, independentemente das capacidades do ser para além da capacidade de sentir dor — estas capacidades são relevantes para a questão da morte. Não é arbitrário defender que a vida de um ser com autoconsciência, capaz de pensamento abstracto, de planeamento para o futuro, de actos complexos de comunicação, etc., é mais valiosa do que a vida de um ser sem estas capacidades”. 12 Com respeito à independência que Singer julga existir entre o valor da vida de uma entidade e o valor de seu sofrimento, Bonnie Steinbock observou criticamente: “But I doubt that the value of an entity’s life can be separated from the value of its suffering in this way. If we value the lives of human beings more than the lives of animals, this is because we value certain capacities that human beings have and animals do not. But freedom from suffering is, in general, a minimal condition for exercising these capacities, for living a fully human life . . . That is why we regard human suffering as more deplorable than comparable animal suffering”. (Steinbock 1978) 13 Singer escreve: “O embrião, o feto, a criança com profundas deficiências mentais e o próprio bebê recém nascido são, todos, membros inquestionáveis da espécie Homo Sapiens, Mas nenhum deles é autoconsciente, tem senso de futuro ou capacidade de se relacionar com outros” ([1993], p. 96). Para caracterizar o termo “pessoa” Singer subscreve os “indicadores de humanidade” de Joseph Fletcher: “consciência de si, autocontrole, senso de futuro e passado, capacidade de relacionar-se com os outros, preocupação com os outros, comunicação e curiosidade” (cf. [1993], p. 96). 14 No original lê-se: “we should take into account other interests beyond the interests in not experiencing the pain of a toothache: the child’s interests in being able to attend school, or the interests of the parents in not seeing her child in pain. These other interests will sometimes, but not always, tilt the balance in a different direction from where it would lie if we were to consider only the severity of the physical pain”. Singer 2000, p. 299. 15 Cf. Singer, P. “Xenotransplantation and speciesism”, Transplantation Proceedings 24: 728–32, (1992), apud Klein 1999; Hutchinson, A. & Singer, P. “Xenotransplantation: is it ethically defensible?” Xeno 3: 58–60 (1995), apud Klein 1999. Em seu artigo Klein conclui que, examinando-se com atenção, a defesa singeriana da igualdade para animais não encontra amparo suficiente em seu utilitarismo de preferências que, se levado às últimas conseqüências, mina sua argumentação em prol da igualdade para animais, tornando-a mais retórica do que utilitaristicamente fundada. 16 Poderíamos, por exemplo, como argumenta Bernard E. Rollin, até imaginar confinarmos um animal em uma jaula ou gaiola e condicioná-lo de forma a que ele goste de sua prisão e desenvolva horror ou temor ao espaço aberto. Tal comportamento seria moralmente errado, mas o critério da senciência e o utilitarismo de preferências não nos proíbem de fazer tal coisa. Em Animal Rights and Human Morality, p. 70, ele escreve a “It would also seem to be clearly wrong for us to take an animal that was by nature free-roaming, say a gazelle or tiger o, more dramatically an eagle, and conditon it to prefer living in a tiny cage and to abhor or fear open space. Even though we were producing no pain in the animal, and
Quem são os membros da comunidade moral?
355
possibly even conditioning it to feel a good deal of pleasure at being in its cage, we would consider such an action to be monstrous for moral reasons having nothing to do with pleasure and pain, namely, violating the animal’s nature and dignity. This same intuition may explain the repugnance we feel at watching bears ride bicycles, even when we are assured that they have not been trained using negative reinforcement and are, in fact, well-fed and well-cared for. The concept of an animal’s nature is crucial here [. . . ]”. Ver também Felipe 2006, p. 108. Em seu artigo, Sonia Felipe ressalta que uma vida pode se ver impedida de se expressar plenamente, sem que isso represente dor ou sofrimento para ela, razão por que Tom Regan leva em conta não somente a senciência, mas a vulnerabilidade ao dano, concedendo a este um estatuto diferenciado, distinguindo-o da dor e do sofrimento e propondo um critério mais abrangente do que o da senciência.
A C O - ORIGINARIEDADE DO D IREITO À L IBERDADE E DO D IREITO À I GUALDADE EM K ANT M ILENE C ONSENSO T ONETTO Universidade Federal de Santa Catarina
mitonetto@yahoo.com.br
Considerações iniciais Kant afirma, na Metafísica dos Costumes, que o ser humano possui um único direito inato, a saber, o direito à liberdade. Para ele, o direito inato é aquele que pertence a qualquer ser humano devido sua própria natureza e em virtude da sua humanidade, independentemente de todo ato jurídico. Apesar de Kant afirmar ser o direito à liberdade o único direito inato que o homem possui, o que se pode constatar na articulação da sua argumentação é a derivação do direito inato à igualdade. Além do direito à igualdade, Kant também deriva outros direitos inatos: o direito do homem de ser seu próprio senhor, a qualidade de um homem irrepreensível e a prerrogativa de fazer aos outros aquilo que não tira o que os outros têm direito de fazer. O principal objetivo desse trabalho será analisar a justificação kantiana do direito à igualdade. Investigar-se-á a existência de uma relação de co-originariedade entre o direito inato à liberdade e o direito inato à igualdade. Todavia, essa investigação irá nos remeter a uma análise da dedução do princípio do direito. Também será analisado em que consiste o direito à igualdade, levando em consideração, por exemplo, as afirmações excludentes que Kant faz em relação às mulheres e em geral aos cidadãos considerados cidadãos passivos.
1. O direito inato à liberdade e o princípio do direito O conceito de liberdade pode ser considerado fundamental para entendermos o desenvolvimento da filosofia moral e prática de Kant. De modo geral, na teoria moral, Kant diferencia a liberdade como sendo interna e externa. A liberdade interna é o tema da teoria ética. Por outro lado, a liberdade externa é um tema da teoria do direito. Segundo Kant, A doutrina do direito trata somente da condição formal da liberdade externa (. . . ) isto é, do direito. Mas a ética vai além disso e fornece um conteúdo (um objeto da escolha livre), um fim da razão pura que é representado como um fim que também é objetivamente necessário, isto é, um fim que, na medida em que os seres humanos são considerados, é um dever tê-lo. (Kant [1797], Ak 380)
Pode-se sustentar, desse modo, que a primeira parte da Metafísica do Costumes é o sistema dos princípios morais em que estão baseados as leis que prescrevem deveres Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 356–365.
A co-originariedade do direito à liberdade e do direito à igualdade em Kant
357
a alguém que pode ser coagido a cumprir. Por outro lado, a segunda parte da obra é o sistema dos deveres pelos quais somente a auto imposição através do dever é possível. Antes de começar a tratar propriamente da justificação do direito à liberdade é necessário fazer alguns esclarecimentos sobre a diferença entre as leis morais e as leis do direito na teoria kantiana. Essas distinções serão importantes para analisar, posteriormente, a dedução do princípio universal do direito. A análise da dedução do princípio do direito é necessária aqui, pois dependendo do seu status, isto é, se o princípio é deduzido de modo analítico ou sintético, se puramente formal ou ético, pode-se investigar de maneira mais atenta o sistema de direitos kantiano. A partir do princípio universal do direito alguns princípios mais específicos do sistema de direitos parecem ser derivados, a saber: o princípio que diz que as violações do direito podem ser prevenidas ou punidas enunciado por Kant na afirmação de que “O direito e a autorização do uso da coerção significa uma e a mesma coisa” (Kant [1797], Ak 232); o princípio do direito privado que mostra ser possível as pessoas adquirirem direitos de propriedade. Desse modo, pode-se investigar se certos direitos justificados por Kant tornam o sistema consistente ou não. De acordo com Kant, todos os princípios morais são formais e não materiais.1 Um princípio é considerado formal quando ele não depende da mudança de conteúdo da vontade individual, a saber, desejos, necessidades ou intenções. Por outro lado, os princípios morais, para Kant, não dependem do que pode ou não acontecer de forma contingente. Desse modo, eles são imperativos categóricos, isto é, comandos universais e incondicionais que obrigam todos os seres racionais capazes de cumprir um dever. Os seres com capacidade de determinar sua própria vontade de acordo com um dever, que experienciam e podem sucumbir às inclinações possuem a liberdade de escolha (frei Willkür). Como as leis morais regulam a liberdade de escolha elas são chamadas leis da liberdade. Diferentemente das leis éticas, as leis do direito restringem somente a escolha livre externa e não a vontade interna. Na introdução da Doutrina do Direito, Kant afirma que o conceito de direito está relacionado com três características essenciais. Primeiro, o direito diz respeito às relações externas entre os indivíduos na medida em que as ações podem afetá-los direta ou indiretamente. Segundo, o direito não está relacionado com os desejos individuais, mas somente com a relação da escolha de alguém com a escolha de outro. Terceiro, o direito trata somente da forma das relações entre as escolhas (e não de conteúdo) na medida em que elas são vistas como livres (Kant [1797], Ak 230). E assim, Kant acaba por definir: “o direito é o conjunto das condições, por meio das quais o arbítrio de um pode estar de acordo com o arbítrio de um outro, segundo uma lei universal da liberdade” (Kant [1797], Ak 230). Em seguida, Kant estabelece o princípio universal do direito, assim enunciado: “É justa toda ação segundo a qual ou cuja máxima a liberdade do arbítrio de cada um pode coexistir com a liberdade de qualquer um segundo uma lei universal.” (Kant [1797], Ak 231). Aqui, Kant parece derivar o princípio universal do direito a partir do
358
Milene Consenso Tonetto
princípio universal da moralidade, isto é, do Imperativo Categórico. Paul Guyer, no artigo Kant’s deduction of the principles of right, escreve que Kant parece apenas aplicar aquela exigência fundamental do princípio de que “nós usamos nosso poder da escolha livre e da ação sob nossa escolha de acordo com a condição de que as máximas sob a quais nós escolhemos agir sejam universalizáveis” (Guyer 2002, p. 23). Para Guyer, isso quer dizer que o imperativo categórico significa os meios pelos quais nós conhecemos nossa liberdade e também o princípio pelo meio do qual nós restringimos nossa liberdade a fim de determinar nossos direitos legais e também nossos deveres éticos impostos a cada um de nós. Muitos comentadores têm divergido dessa posição sustentada por Guyer. O problema parece residir na afirmação de que o princípio universal do direito pode ser deduzido analiticamente do conceito de direito ou de que o princípio universal do direito é deduzido a partir do imperativo categórico. Mary Gregor, por exemplo, argumenta que “apesar de Kant fornecer um material para o argumento que vai do imperativo categórico até o princípio universal do direito, ele deixa o leitor organizar esse material para ele construir o argumento.” (Gregor 1988, p. 761). Além disso, acrescenta ela, a seção do texto em que Kant apresenta a dedução não parece ter uma ordem lógica. Para outros, como Leslie Mulholland, se o princípio universal do direito for considerado analítico, Kant não poderá demonstrar que os homens possuem direitos (Mulholland 1990, pp. 167–9). Para este, a capacidade de obrigar os outros a um dever, isto é, a definição de direito, é derivado do imperativo categórico. E por esse motivo Kant escreve que (. . . ) nós conhecemos nossa própria liberdade (de que procedem todas as leis morais, portanto também todos os direitos quanto os deveres) somente através do imperativo moral, que é uma proposição que ordena um dever, a partir do qual pode ser desenvolvida posteriormente a faculdade de obrigar os outros, isto é, o conceito do direito. (Kant [1797], Ak 239)
Contudo, o imperativo moral que Kant está se referindo é o imperativo categórico e este é uma proposição sintética. A pergunta, então, que se pode fazer é: como uma proposição analítica (o princípio universal do direito) pode ser derivada de uma proposição sintética (o imperativo categórico)? Segundo Mulholand, uma solução possível para esse problema é vermos que Kant, na Crítica da Razão Prática, sustenta que mesmo a “lei fundamental” pode ser considerada analítica se pressupormos a liberdade da vontade (Kant [1788], Ak 31).2 Kant por meio dessa passagem sustenta ser analítico o fato de um indivíduo com vontade livre ser sujeito do imperativo categórico. Do mesmo modo, ao se examinar o conceito de pessoa que Kant sustenta na introdução da Metafísica dos Costumes, poder-se-á dizer que nele já está contido o conceito de lei moral. Segundo Kant “pessoa é aquele sujeito cujas ações são passíveis de uma imputação. A personalidade moral nada mais é, portanto, do que a liberdade de um ser racional sob leis morais.”
A co-originariedade do direito à liberdade e do direito à igualdade em Kant
359
(Kant [1797], Ak 223). Além disso, na Crítica da Razão Prática, Kant também deixa claro que sem a liberdade transcendental, a imputação das ações não seria possível.(Kant [1788], Ak 96, 97, 99, 100). Então, uma pessoa é e deve ser um ser livre. E um ser livre, para Kant, é, necessariamente, um ser autônomo. Assim, do conceito de pessoa segue-se “que uma pessoa não está submetida a outras leis senão aquelas que ela mesma se dá (ou só ela ou ao menos simultaneamente com outros)” (Kant [1797], Ak 223). A partir disso, Mulholand conclui que é analítico que qualquer ser com obrigações (uma pessoa), isto é, qualquer ser com capacidade de entrar em relações com outras involvendo direitos, está subordinado somente a leis que ele dá a si mesmo. Portanto, a lei moral está contida no conceito de pessoa. (Mulholland 1990, p. 168). E desse modo, o princípio do direito somente expressa o que já está contido no conceito de sujeito do qual ele pertence, na medida em que sujeito é caracterizado como pessoa. Quando se questiona se o princípio do direito é analítico ou sintético, não se pode inferir que ele é sintético porque simplesmente o imperativo categórico é sintético. Ao olhar para o problema dessa maneira, Mulholand afirma que o princípio universal do direito é analítico porque ele estabelece um princípio que obriga um ser com vontade livre. Contudo, para Mulholand, defender que o princípio do direito é analítico não demonstra que o indivíduo possui direitos. “Kant vai muito longe ao defender que o princípio universal do direito é analítico se este é tomado para implicar que os seres humanos têm direitos ou estão obrigados às leis que determinam direitos.” (Mulholland 1990, p. 171). A afirmação de que o homem é livre é sintética. Assim, também, a afirmação de que os seres humanos possuem direitos é sintética. Por outro lado, Kant se refere ao princípio universal do direito como axioma e, algumas vezes, como um postulado. Axiomas e postulados são proposições sintéticas a priori. Como resultado, escreve Mulholland, “a afirmação de que o homem tem direitos, como é dado no conceito de direito inato, pressupõe uma proposição sintética de que o homem possui vontade livre” (Mulholland 1990, p. 171). E isso diz algo a mais do que os direitos são, pois afirma que nós temos direitos. Se considerado dessa maneira o princípio universal do direito será sintético. Ele será somente analítico quando considerado simplesmente uma definição que deriva do conceito de direito. Além desse, há outro problema de se considerar o princípio universal do direito analítico. Kant trata do direito estrito como aquele que não possui nenhum conteúdo ético. Também afirma que o princípio do direito pode ser entendido e seguido sem fazer referência a ética (Kant [1797], Ak 232). Dessa maneira, pode-se perguntar: como o conceito de pessoa pode ser entendido no direito? O conceito moral de pessoa é aquele de um ser racional portador de liberdade como capacidade. Contudo, as leis morais são leis que governam o comportamento das pessoas. E, como as pessoas podem ser obrigadas por leis morais se e somente se elas são determinadas de maneira autonôma, todas as leis morais devem estar de acordo com a igualdade de todos os seres racionais como pessoas. Segundo ele, “a posse da faculdade inata da liberdade prova que um ser humano é uma pessoa igual por estar obrigado a cumprir as leis morais” (Mulholland 1990, p. 171). Contudo, se o direito não pode estar relacionado
360
Milene Consenso Tonetto
com a ética, então, não há nenhum fundamento para afirmar que todos os seres que na esfera da ética têm um status de pessoa também têm esse status no direito. Por outro lado, há uma boa razão para considerarmos a capacidade de ser uma pessoa no âmbito da ética como uma condição necessária para ser uma pessoa no âmbito do direito. O direito depende da capacidade de imputação das ações e as ações podem ser imputadas somente para pessoas naturais. Contudo, na medida em que os direitos estão separados da ética, nós podemos conceber um sistema de direitos que para alguns seres humanos, considerados pessoas naturais, são negados o status de pessoa nas relações legais. Assim, eles poderão ser caracterizados no direito como não-autônomos, por exemplo, escravos, ou poderiam talvez ocupar alguma posição análoga ao status de ser incapaz de exercer a responsabilidade, tais como uma criança que, para Kant, é uma pessoa que poderia ser possuída como uma coisa (Kant [1797], Ak 282), mas que deve ser tratada como um fim e não como um mero meio. Assim, para Mulholland, o conceito de direito formulado por Kant está correto, a saber, que um direito num sistema de direitos é a capacidade de obrigar a um dever. Contudo, essa capacidade deve ser exercitada somente por aqueles que possuem o status legal de pessoa. E isso não é indicado pela definição de direito. A análise kantiana do conceito de direito somente assegura como uma pessoa deve estar relacionada com outra pessoa quando existe uma relação coercitiva. Ela não afirma que todos nós devemos ser considerados pessoas. E para defender isso, devemos ver o direito como sendo dependente da ética. Assim, por exemplo, se numa sociedade seres humanos são vistos como escravos, nós devemos apelar a um princípio ético para criticar essa caracterização. Contudo, os seres que nessa sociedade escravocata possuem o status de pessoa deverão ter o dever ético de eliminar a escravidão. Desse modo, podemos afirmar ser inconsitente o sistema de direitos kantiano porque por ser independete da ética permite transformar uma pessoa que possui o direito inato à liberdade em uma coisa, isto é, um escravo. Paul Guyer, no artigo Kant’s Deductions of the Principles of Right, também parece seguir, em linhas gerais, a interpretação de Mulholland. Guyer afirma que se deve ter cuidado ao tirar conclusões sobre a analiticidade dos princípios do direito, porque de fato “Kant aplica a distinção analítico/sintético aos princípios do direito de diferentes maneiras e, por isso, o mesmo princípio pode ser analítico por um critério, mas sintético por outro”. (Guyer 2002, p. 41) Além disso, para ele, a posição que defende que o princípio do direito não é derivado do imperativo categórico, entendido somente como um procedimento para agir somente conforme máximas que podem servir como leis universais, é correto porque o princípio do direito regula a conformidade de nossas ações com a liberdade dos outros e não com as nossas máximas (Guyer 2002, p. 25). Contudo, Guyer irá acrescentar que “qualquer outra afirmação de que o princípio do direito não é derivado do princípio fundamental da moralidade, no sentido do conceito fundamental da moralidade, será, certamente, implausível” (Guyer 2002, p. 25). O imperativo categórico nos fala qual forma nossas máximas devem tomar para elas serem compatíveis com o valor fundamental da liberdade. Por
A co-originariedade do direito à liberdade e do direito à igualdade em Kant
361
outro lado, o princípio do direito nos diz qual a forma nossas ações devem ter para elas serem compatíveis com o valor universal da liberdade, não importando quais são as nossas máximas e motivações. Assim, para Guyer, “o princípio universal do direito pode não ser derivado do imperativo categórico, mas ele é, certamente, derivado da concepção de liberdade e seu valor que é o princípio fundamental da moralidade kantiana.” (Guyer 2002, p. 25) Guyer defende, então, que o princípio do direito não é derivado do imperativo categórico, mas derivado do conceito de liberdade como o princípio fundamental da moralidade. Além de usar a distinção analítico/sintético para contrastar os deveres de direito com os deveres éticos, Kant também usa essa distinção para evidenciar a diferença entre o direito inato à liberdade e os direitos adquiridos de propriedade. Como vimos, para Kant existe um único direito inato, a saber, o direito à liberdade. Esse direito pode então ser considerado analítico na medida em que ele segue do próprio conceito de liberdade. Kant também identifica outros direitos, que, estão contidos no próprio princípio do direito inato à liberdade. Segundo Kant: A igualdade inata, isto é, a independência que consiste em não ser obrigado por outros a mais do que se pode também obrigá-los reciprocamente; portanto a qualidade do homem de ser seu próprio senhor (sui iuris), assim como a de um homem irrepreensível (iusti) porque não foi injusto com ninguém antes de qualquer ato jurídico; finalmente, também a autorização para fazer contra outros aquilo que em si não lhes reduz o seu, se eles não querem aceitá-lo, como é lhes comunicar meramente seus pensamentos, contar-lhes ou prometer-lhes algo, quer seja verdadeiro e honesto, quer seja falso e desonesto (veriloquium aut falsiloquium), porque depende apenas deles dar-lhe crédito ou não; todas estas autorizações encontram-se já no princípio da liberdade inata e dela não se distinguem efetivamente (como membros de uma divisão sob um conceito superior de direito). (Kant [1797], Ak 237, 238)
Esses direitos também são analíticos, uma vez que Kant afirma serem autorizações envolvidas pelo direito inato à liberdade. E é dessa forma que Kant deduz o direito à igualdade. Se deduzidos analiticamente eles devem também ser considerados inatos. Portanto, pode-se sustentar que o direito à igualdade possui o mesmo status teórico que o direito à liberdade na filosofia prática de Kant, isto é, na sua filosofia do direito e na sua filosofia política. Em outros termos pode-se considerar a liberdade e a igualdade como sendo co-originários.
2. O direito à igualdade e a cidadania Na Fundamentação da Metafísica dos Costumes, Kant enfatiza que os princípios morais propostos ali devem ser aplicados não somente aos homens nem só para os seres humanos, mas para todos os seres racionais. Isso gera a expectativa de que na teoria política kantiana todos os seres racionais serão considerados igualmente. Contudo,
362
Milene Consenso Tonetto
tal expectativa é rapidamente frustada com a leitura da Doutrina do Direito e do ensaio Teoria e Prática. Na primeira obra, Kant define o cidadão da seguinte forma: “os membros unidos de um Estado com vistas à legislação se chamam cidadãos (civis)”. (Kant [1797], Ak 314). Além disso, Kant escreve que o cidadão possui atributos jurídicos ou princípios inseparáveis de sua natureza, a saber: a liberdade legal de não obedecer a nenhuma lei a que não tenham dado o seu consentimento; a igualdade civil, de não reconhecer com relação a si mesmo nenhum superior no povo, a não ser um em relação ao qual ele tenha a mesma faculdade moral de obrigar juridicamente; terceiro, o atributo da independência civil, isto é, de não ficar devendo sua própria existência e sustento ao arbítrio de um outro no povo, senão aos seus próprios direitos e faculdades, como membro da república, por conseguinte, a personalidade civil que consiste em não poder ser representado por nenhum outro nos assuntos jurídicos. (Kant [1797], Ak 314)
Contudo, depois de estabelecer esses três princípios, Kant imediatamente escreve que nem todos dentro do Estado poderão ser de fato considerados cidadãos. Apesar de todos serem livres como seres humanos e iguais como sujeitos nem todos serão independentes. Kant escreve que no Estado nem todos se qualificam com igual direito a ter o direito de sufrágio, isto é, a ser cidadãos. Pois do fato de poderem exigir ser tratados por todos os outros segundo leis da liberdade e igualdade natural, como partes passivas do Estado, não se segue o direito de, como membros ativos, também tratar do próprio Estado, de organizá-lo e contribuir para a introdução de certas leis. (Kant [1797], Ak 315)
Para Kant, os cidadãos passivos carecem de personalidade civil e, portanto, terão que ser comandados ou protegidos por outros indivíduos. Ele então fornece uma série de exemplos de cidadãos passivos: O ajudante de um comerciante ou de um artesão, o serviçal (não aquele que está a serviço do Estado), o menor (naturaliter vel civiliter), todas as mulheres e em geral qualquer um que é obrigado a sustentar sua existência (alimento e proteção), não com seu próprio trabalho, mas de acordo com a disposição de outros (com exceção do Estado), todos eles carecem de personalidade civil e sua existência é como que mera inerência. (Kant [1797], Ak 314)
Essa distinção entre membros ativos e passivos é problemática para Kant. Apesar de afirmar que essa diferença não contradiz a definição de cidadão, podemos dizer que ela serve no mínimo para justificar a desigualdade de direitos entre dois grupos da sociedade. Certamente, a preocupação de Kant aqui é a de que se for permitido aos serviçais o direito de voto estes correm o risco de se tornarem meros seguidores de seus chefes. Em outras palavras, a servidão econômica pode se transformar em servidão política ou levar a coerção política dessa. O desejo de Kant ao fazer a distinção entre cidadãos ativos ou passivos é o de permitir que somente os que são independentes contribuam na formulacão das leis e nas eleições.
A co-originariedade do direito à liberdade e do direito à igualdade em Kant
363
Mesmo com essa diferença, Kant sustenta que a dependência desses indivíduos em relação à vontade dos outros não é contrária ou incompatível com a liberdade e igualdade deles enquanto homens. Kant lembra que somente por meio das condições da liberdade e igualdade podem os indivíduos reunidos constituírem um povo e, assim, tornarem-se um Estado e entrar numa constituição civil, (. . . ) de progredir do estado passivo para o estado ativo (Kant [1797], Ak 315). A implicação dessa passagem é que mesmo um aprendiz ou um empregado doméstico terá a oportunidade de chegar a ser um cidadão ativo, para obter a independência social e econômica que traz junto delas a independência civil. Kant sustenta que todos podem ser capazes de passar do status passivo para o ativo como cidadãos. Desse modo, poder-se-ia sustentar ser meramente contigente o status defendido por Kant em relação às mulheres. Lembremos que na Alemanha do século XVIII se afirmava que as mulheres careciam de independencia civil. Dessa maneira, não seria um problema real, uma vez que, por exemplo, as mulheres poderiam aspirar ao status de cidadãos ativos. Todavia, como observa Susan Mendus, ao se analisar a obra Teoria e Prática podese perceber que Kant oferece uma razão diferente para negar às mulheres o status de cidadãos ativos (Mendus 1992, p. 172). Ali, Kant escreve que a única qualificação requerida para ser cidadão, fora a natural (não ser criança ou mulher), é a de que ele deve ser seu próprio senhor (sui juris), ou seja, ter alguma propriedade (que pode ser alguma habilidade, um negócio, um talento artístico, uma ciência) para prover a ele mesmo (Kant [1793], Ak 295, grifos acrescentados).
Nessa afirmação, não parece ser meramente contigente que falta às mulheres a cidadania ativa. Ao contrário, as mulheres parecem estar excluídas desde o ponto de partida de Kant. Aqui nessa afirmação está negado até mesmo a possibilidade das mulheres alcançarem o status ativo de cidadãos. Assim, pode-se sustentar que em Teoria e Prática, a exclusão da mulher não ocorre de maneira contingente. Ao contrário, ali as mulheres parecem ser, por definição, incapazes de alcançar a independência civil. Essa exclusão se torna pior do que a de qualquer cidadão passivo masculino, uma vez que nega a elas a oportunidade de alcançar a cidadania ativa. A oportunidade de alcance do status de cidadão ativo é um requerimento da igualdade. Por isso, se está negada às mulheres a possibilidade de avanço ao status de cidadão ativo, então, está negado prima facie a igualdade pertencente a todos os homens sejam eles passivos ou ativos (Mendus 1992, p. 174). Assim, Kant não parece só estar negando a participação política das mulheres mas também a igualdade que ele tinha afirmado pertencer a todos como sujeitos.
3. Considerações Finais A dedução do princípio do direito, como foi vista, pode ser considerada analítica ou não dependendo do critério de analiticidade tomado. Assim, parece ser plausível aceitarmos a posição de Guyer, segundo a qual o princípio do direito é derivado da
364
Milene Consenso Tonetto
concepção de liberdade e de seu valor que é o princípio fundamental da moralidade kantiana. Isso também mostra como Kant deduz o direito inato à liberdade. A justificação kantiana ao direito à liberdade é a de que o homem o possui em virtude de sua humanidade. Nessa dedução, torna-se evidende a relação do direito à liberdade com o imperativo categórico, principalmente com a chamada fórmula da humanidade. A falta de conteúdo ético encontrado no princípio do direito permite Kant fazer afirmações excludentes em relação ao direito de igualdade. Apesar de afirmar que os indivíduos possuem o direito inato à liberdade e, dessa forma, o direito inato à igualdade, Kant nega o direito de votar às mulheres e aos não proprietários. Essas afirmações são aqui apontadas como inconsistências do sistema de direitos. Contudo, se for tomado o fato de que o princípio do direito é destituído de valor ético, Kant pode negar o direito de voto sem ser inconsitente. Isto é, nas relações do domínio do direito, uma pessoa, considerada um fim em si mesmo, pode ser considerada um ser sem personalidade civil.
Referências Gregor, M. 1988. Kant’s Theory of Property. Review of Metaphysics (41): 757–8. Guyer, P. 2000. Kant on Freedom, Law, and Happiness. New York: Cambridge University Press. —–. 2002. Kant’s Deductions of the Principles of Right. In Timmons, M. (ed.) Kant’s Metaphysics of Morals: interpretative essays. New York: Oxford University Press, pp. 23–64. —–. (ed.) 2006. The Cambridge Companion to Kant and Modern Philosophy. New York: Cambridge University Press. Höffe, O. 1996. Categorical Principles of Law. Pennsylvania, Pennsylvania University Press. Kant, I. [1797]. The Metaphysics of Morals. Tradução de Mary Gregor. New York: Cambridge University Press, 1996. —–. [1797]. A Metafísica dos Costumes. Tradução de José Lamego. Lisboa: Fundação Calouste Gulbenkian, 2005. —–. [1793]. On the common saying: That may be correct in theory, but it is of no use in practice. New York: Cambridge University Press, 2006. —–. [1797] Die Metaphysik der Sitten. Frankfurt: Suhrkamp, 1982. —–. [1788]. Critique of practical reason. New York: Cambridge University Press, 2006. Kersting, W. 2002. Global Human Rights, Peace and Cultural Difference: Huntington and the Political Philosophy of International Relations. Kantian Review (6): 5–34. Mendus, S. 1992. Kant: ‘An honest but Narrow-Minded Bourgeois’? In Williams, H. (ed). Essays on Kant’s Political Philosophy. Chicago: Chicago University Press, pp. 166–90. Mosser, K. 1999. Kant and Feminism. Kant-Studien 90: 322-53. Mulholland, L. A. 1987. Kant on War and International Justice. Kant-Studien 78: 25–41. —–. 1990. A. Kant’s system of rights. New York: Columbia University Press. Pippin, R. B. 2006. Mine and Thine? The kantian state. In Guyer 2006, pp. 416–46. Timmons, M. (ed). 2002. Kant’s Metaphysics of Morals: interpretative essays. New York: Oxford University Press. Williams, H. (ed). 1992. Essays on Kant’s Political Philosophy. Chicago: Chicago University Press.
A co-originariedade do direito à liberdade e do direito à igualdade em Kant
365
Notas 1 Há uma discussão na literatura sobre se a formulação do imperativo categórico, a saber, a fórmula da
humanidade é formal ou não. Se interpretarmos Kant como afirmando que tratar o ser humano como fim em si mesmo e não como mero meio significa levar em consideração os seus fins sem necessariamente identificá-los, então, tal formulação do imperativo categórico também pode ser considerada formal num sentido amplo desse termo. 2 Na Crítica da Razão Prática, a formulação do imperative categórico, agora chamado “lei fundamental da razão,” de Kant é a seguinte: “So act that the maxims of will might become law in a system of universal moral legislation.” A idéia, aqui, seria considerar o imperativo categórico analítico. Mas, então, não se poderia derivar nem direitos nem deveres.
H ABERMAS : DA C RÍTICA AO “C IENTISMO ” À É TICA DA A ÇÃO C OMUNICATIVA PAULO C ÉSAR DE O LIVEIRA UFSJ
PATRICIA DE C ARVALHO UNIS-MG
{deoliveirapc,pcfisiovarginha}@yahoo.com.br
1. Considerações Iniciais Jürgen Habermas é, ao lado de Gadamer, o mais importante filósofo alemão do pósguerra. Ele se coloca como continuador e inovador da tradição “anti-acadêmica”, sobretudo aquela ligada a Karl Marx e ao, assim chamado, “marxismo ocidental”, uma vez que nas suas reflexões não há espaço para o marxismo oriental-leninista. De fato, ele diz claramente: “Hegel e Marx foram e permanecem sendo o ponto de referência mais importante do meu pensamento” (Le Rider 1990, p. 204). Até 1979 o seu nome foi associado à Escola de Frankfurt. Aproximou-se de Marx mediante as leituras dos marxistas ocidentais como Luckás e Korsch. Entre os anos de 1956 e 1961 foi assistente de Adorno. Duas coisas chamaram-lhe a atenção em Adorno: o fato de falar de Marx como se fosse um contemporâneo e a ignorância em relação a Heidegger e à filosofia alemã recente. Diferentemente de Adorno, Habermas tem continuadamente presente a tradição filosófica recente. Em 1981, diz em entrevista que o seu caminho autônomo o levou a temáticas comuns à da Escola de Frankfurt. Ele estuda a influência da intelectualidade hebraica na tradição alemã de Kant aos tempos atuais. Segundo ele, quase todos os pensadores originais desta tradição filosófica são judeus. Os raros não hebreus foram, no século XX, abertamente antisemitas e foram os únicos a continuar ensinando na Alemanha nazista. A contribuição dos intelectuais hebreus foi determinante para o desenvolvimento do pensamento em língua alemã, mesmo no exílio. O idealismo dos pensadores hebreus produziu o que ele chamou de “fermento de uma utopia crítica” (Petrucciani 2000, p. 19).
2. O combate ao “cientismo” Uma das primeiras questões que se apresenta a Habermas é o combate ao “cientismo”. Esta corrente representa, não uma questão acadêmica, mas um problema político, enquanto reforça uma concepção da ciência que legitima os mecanismos de controle tecnocráticos e exclui uma via racional de elucidação. A alternativa ao “cientismo” é indicada pela “filosofia crítica” que, enquadrando numa perspectiva práticoemancipativa o problema da ciência e da técnica nas sociedades avançadas, operaria Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 366–371.
Habermas: da crítica ao “cientismo” à ética da ação comunicativa
367
como “teoria das ciências” e filosofia prática ao mesmo tempo. O confronto mais importante pela notoriedade dos interventores, entre a teoria crítica de uma parte e a epistemologia analítica de outra, ocorreu em 1961 no Congresso da Sociedade de Sociologia alemã. Habermas não limita as suas críticas teóricas ao cienticismo. Ele também critica o envolvimento de Heidegger com o nazismo (Le Rider 1990, p. 207). O que ele critica não é o envolvimento oportunista, mas aquele teórico; este é mais perigoso! As raízes do envolvimento teórico de Heidegger com o nazismo estão no fato da transformação da teoria em ideologia. Habermas sustenta que Heidegger “até o fim da guerra, não tinha se desvinculado da sua posição inicial”. As posições fatalísticas de Heidegger, após a guerra, são fruto de uma desilusão e de um repensar que o levam a não esperar mais nada dos governantes e a pensar que “só um Deus pode nos salvar”. Contra o cientismo de matriz neopositivista, contra as posições pós-existencialistas de Heidegger, aparecem os objetivos teóricos e políticos de Habermas. Ele considera os pensamentos de Hegel e Marx como o ponto de referência fundamental para a elaboração de sua filosofia crítica. O ponto chave de seu discurso é a relação entre o marxismo (ocidental e os expoentes da Teoria Crítica) com Max Weber. A questão central é o problema da “racionalização” da resposta que o marxismo ocidental deu ao desafio de Weber, das razões da insuficiência de tal resposta, da pesquisa de uma resposta nova que construa uma “dialética da racionalização”, capaz de “utilizar Weber ‘corrigindo’ Marx”, mas sem jogá-lo fora (Petrucciani 2000, p. 38).
3. Conhecimento e interesse: a revisão do marxismo Nos anos de 1965 a 1969, Habermas conclui uma primeira fase de sua pesquisa caracterizada pela prevalência de categorias ligadas à filosofia do sujeito, das quais se libertará nos anos da “reviravolta” lingüística. Ele propõe uma filosofia crítica que pretende ser uma “superação” seja dos limites das tendências neopositivistas seja dos limites do marxismo ocidental e da própria teoria crítica. Uma filosofia crítica que “reveja” o marxismo não para abandoná-lo, mas para adequá-lo às condições do nosso tempo. De fato, a filosofia de Habermas quer ser semelhante à de Marx: crítica e revolucionária. A sua filosofia pretende reafirmar com força a conexão entre interesse e conhecimento. As ciências empírico-analíticas utilizam a observação, uma vez que não têm o que fazer com os puros fatos. As ciências empírico-analíticas são o resultado de interesses cognitivos voltados à eficácia (sucesso ou insucesso) e radicadas naquilo que Habermas chama de “agir instrumental” (Petrucciani 2000, p. 26). As ciências histórico-hermenêuticas têm o que fazer com a “experiência objetiva” na nossa linguagem e nas nossas ações e são voltadas à contemplação do sentido, que foi reduzida, pelo historicismo contaminado pelo positivismo, a “aparência objetivista”. Tais ciências, observa Habermas, devem ser direcionadas por um interesse
368
Paulo César de Oliveira / Patricia de Carvalho
prático: o papel da hermenêutica dever ser aquele de indagar a realidade inspirandose no interesse da manutenção e extensão da intersubjetividade de um possível entendimento que oriente a ação, em que a temática do agir e do entendimento comunicativos possam emergir. As ciências orientadas criticamente vão além do interesse teórico das empíricoanalíticas e do interesse prático das histórico-hermenêuticas. São inspiradas no interesse emancipativo e apontam para a auto-reflexão como método de “auto-libertação”. As ciências criticamente orientadas têm em comum com a filosofia este processo: a auto-reflexão. A conexão entre conhecimento e interesse é necessária para colher criticamente as funções e os limites das ciências singulares nos diversos níveis cognoscitivos. Esta conexão é buscada em toda a história da humanidade que tende à auto-libertação mediante os processos de socialização, tais como o trabalho, a linguagem e o domínio. Trabalho e domínio se vinculam à relação com a natureza e linguagem à relação com a comunicação, com o conhecimento e, portanto, com a emancipação. Neste âmbito, se coloca a filosofia. A filosofia tradicional errou ao supor que a emancipação tenha sido realizada com a estrutura da linguagem. A emancipação é um objetivo a ser realizado; e passa pela linguagem, lugar do “agir comunicativo”. Somente quando, no curso dialético da história, a filosofia descobre as marcas da violência, que deforma o diálogo, consegue levar adiante o processo rumo à emancipação. A tese de Habermas é que a conexão entre forças produtivas e relações de produção (fundamento da teoria da luta de classes de Marx) deveria ser substituída por uma mais abstrata entre trabalho e interação; isto é, entre agir instrumental e agir comunicativo. Ele propõe que a teoria dialética marxiana seja substituída por uma outra teoria também dialética, aquela que interpreta criticamente a história humana como dialética entre duas “racionalizações”: a do agir instrumental e a do agir comunicativo.
4. Crítica da hermenêutica e a reviravolta lingüística Habermas constrói uma alternativa a Marx, ou melhor, uma adequação do “marxismo” aos nossos tempos, mediante a adoção de novas categorias interpretativas. Ele critica a hermenêutica proposta por Gadamer, uma vez que ela legitima e absorve a tradição rejeitando uma visão crítica. Segundo Habermas, é uma auto-reflexão incompleta e mutilada, que não reconhece a força transcendente da reflexão. Reduzir a linguagem à interpretação é esconder o fato que a linguagem não é independente das relações sociais. A linguagem não é um depósito neutro e transmissor da tradição; é também um instrumento de domínio e poder social. Ela serve também a legitimar a organização das relações de poder social e, portanto, é também ideológica. A experiência hermenêutica deve transcender à crítica da ideologia; deve realizar uma reflexão que transcenda o nível hermenêutico e ir além, como faz a psicanálise
Habermas: da crítica ao “cientismo” à ética da ação comunicativa
369
em relação à linguagem cotidiana do indivíduo. A hermenêutica deve abandonar as suas pretensões de universalidade e deixar o lugar às reflexões críticas que dêem razão não só ao que ocorre no plano lingüístico, mas ao que ocorre no plano objetivo das ações sociais. O nexo objetivo que permite compreender as ações sociais é constituído pela linguagem, pelo trabalho e pelo poder. A hermenêutica deve passar do plano da historicidade meramente lingüística (como proposta por Gadamer) ao plano da história universal que compreende os níveis indicados e dá origem à própria historicidade. Habermas elabora uma teoria da linguagem e da comunicação que constitui a base da sua “reviravolta lingüística” e que encontra sua sistematização na obra “Teoria do Agir Comunicativo” (1981). A superação da hermenêutica é sugerida quando se recorre à crítica e à psicanálise como método para “desmascarar” o que está atrás do nível puramente lingüístico e que dá origem à comunicação distorcida.
5. A teoria do agir comunicativo Sob o estímulo do empenho político, muito forte nos anos 70 do século passado, Habermas vê com preocupação o emergir, na Alemanha e no Ocidente, de tendências contrapostas (neo-conservadoras e neo-anárquicas) que rejeitam as sociedade democráticas. Nesse contexto surge a obra “Teoria do Agir Comunicativo em 1981. Trata-se de uma obra de arquitetura complexa. O objetivo é a formulação de uma teoria orgânica da racionalidade crítica e comunicativa; uma teoria fundada sob a dialética entre agir instrumental e agir comunicativo ou, como ele diz, entre “sistema e mundo da vida”. O sistema está vinculado ao agir instrumental; é o Estado com seu aparato e a sua organização econômica. O mundo da vida está vinculado ao agir comunicativo; é o conjunto de valores que cada um de nós individualmente ou comunitariamente “vive” de maneira imediata, espontânea e natural. Segundo Habermas, estado e sociedade se tornaram autônomos mediante meios de controle que são o valor de troca e o poder administrativo (Petrucciani 2000, p. 97). Foram condensados em um complexo monetário-administrativo; tornaram-se autônomos em relação ao mundo da vida estruturado comunicativamente (com esfera privada e pública); tornaram-se manifestadamente “super-complexos”. Esta supercomplexidade do sistema faz com que ele interfira nos mundos da vida que são ameaçados por uma colonização interna que coloca em risco a autonomia. Esta tese de Habermas clareia os limites do marxismo. Os imperativos sistêmicos intervêm em âmbitos da ação estruturados em modo comunicativo. Trata-se de questões da produção cultural da integração social e da socialização. São questões que têm pouco a ver com aqueles clássicos do marxismo (luta de classes, opressão, coisificação). Hoje os imperativos da economia e da administração, transmitidos mediante o dinheiro e o poder (imperativos do sistema) penetram nos ambientes (nos mundos da vida) de tal maneira que os destrói. Esses imperativos são controlados pela mídia.
370
Paulo César de Oliveira / Patricia de Carvalho
O conflito principal do nosso tempo, nas sociedades capitalistas avançadas e democráticas, não é um conflito de classe, mas um conflito que deriva do processo em ato de “colonização” por parte do sistema em relação aos mundos da vida. Diante desse conflito, não são utilizáveis as teorias enraizadas no velho marxismo e as recentes teorias pós modernas e anti-modernas, que rejeitam em bloco a “herança do racionalismo ocidental” com suas feições humanísticas e iluministas. Habermas olha com confiança os vários tipos de movimento que lutam em defesa dos mundos da vida para enriquecê-los e torná-los autônomos em relação às ameaças de colonização, apresentadas continuamente pelo sistema. Ele não propõe programas políticos precisos, mas se mantém no âmbito teórico. Ele propõe uma “revisão e adequação” do marxismo em relação aos problemas e conflitos do nosso tempo, que não é o de Marx e de seus sucessores. A sua proposta teórica se contrapõe abertamente àquelas dos teóricos do “pósmoderno”, uma vez que ele defende a herança do racionalismo ocidental que deve ser corrigido, mas não descartado. Esta defesa se fundamenta na tese da “mudança de paradigma”: da filosofia do sujeito à filosofia da intersubjetividade comunicativa.
6. Considerações Finais A crítica das teorias do pós-moderno e do anti-moderno se apresentou nos escritos de Habermas dos anos 70 e 80. Ele reconduz às raízes clássicas da filosofia moderna a complexidade da temática. As raízes são individuadas em Hegel. Nele se forma, com maturidade, o conceito de modernidade. Três fatos constituem a modernidade: o novo mundo, o renascimento e a reforma. Esses fatos levaram ao surgimento da temática da autonomia do sujeito e da razão e ao iluminismo. Os traços da idade moderna são visto de Descartes a Kant, mas somente em Hegel alcançam a maturidade. Hegel é consciente não somente do “fato”, mas sobretudo do “problema” modernidade. O problema é que a subjetividade moderna, livre da religião, não é suficientemente eficaz para unificar. A predominância da subjetividade e da razão levou, não a uma nova união, mas a diversificações que a razão iluminista não consegue superar, como por exemplo a separação fé x saber. Hegel supera esse problema mediante dois caminhos: o primeiro é superando a religião ortodoxa e positiva e a própria razão. A solução é dada por um cristianismo originário no qual o amor e a vida representariam o meio e a condição da união intersubjetiva. O segundo é buscando a via de superação que se refere tanto à própria razão quanto ao sistema das relações de vida, na própria razão iluminista. Segundo Habermas, Hegel caiu em um dilema: ele quer ir além do iluminismo, mas permanece “preso” na dialética da filosofia do sujeito. Existe um outro caminho? Habermas diz que sim: é o caminho da teoria da comunicação. Hegel poderia conservar as intuições do seu período juvenil (o amor, a vida), filtrando-as na reflexão filosófica, ao invés de idealizá-las ou abandoná-las. Tanto a fi-
Habermas: da crítica ao “cientismo” à ética da ação comunicativa
371
losofia de Hegel quanto a de seus sucessores faliram porque não conseguiram ir além do sujeito, além da dialética interna ao iluminismo. Nesse ponto, aparece Nietzsche. Ele submete a razão centrada no sujeito a uma crítica imanente ou abandona tudo? Ele prefere renunciar a uma revisão do conceito de razão e, com isso, à dialética do iluminismo. Nietzsche busca alternativas à razão iluminista e as indica no mito de Dionísio, na arte, na vontade de poder, no nihilismo. Isto faz dele, segundo Habermas, um pertencente à filosofia do sujeito, da qual não conseguem sair nem mesmo os seus sucessores. Segundo Habermas, todas as tentativas de sair da filosofia do sujeito faliram. Por isso, ele propõe uma saída: a razão comunicativa contra a razão “sujeitocêntrica”. O paradigma do conhecimento de objetos deve ser substituído pelo paradigma de entendimento entre sujeitos capazes de falar e de agir. Por isso, a teoria do agir comunicativo constitui a alternativa aos teóricos do pós-moderno e que ajuda a enfrentar o problema do moderno sem abandonar a herança preciosa do iluminismo. Falar de razão comunicativa é falar de razão. A razão deve ser “salva”e fundada, não no sujeito, mas na intersubjetividade comunicativa e no entendimento interpessoal que dela deriva (comunicação que passa pela linguagem e pela ação). A razão comunicativa desemboca em algo prático. Com isso, não ressurge o “purismo” da razão pura, mas a vontade de empenho prático para resolver, não individualisticamente, os problemas do nosso tempo.
Bibliografia Habermas, J. 1982.Conhecimento e Interesse. Rio de Janeiro: Zahar Editores. —–. 1984. Mudança Estrutural na Esfera Pública. Rio de Janeiro: Tempo Brasileiro. —–. 1989. Consciência Moral e Agir Comunicativo. Rio de Janeiro: Tempo Brasileiro. —–. 1990. Pensamento Pós-Metafísico. Estudo Filosófico. Rio de Janeiro: Tempo Brasileiro. —–. 1990. Discurso Filosófico da Modernidade. Lisboa: Publicações D.Quixote. —–. 1994. Técnica e Ciência como “Ideologia”. Porto: Rés Editora. —–. 1997. Direito e democracia: entre facticidade e validade. Rio de Janeiro: Tempo Brasileiro. —–. 1999. Direito e Moral. Lisboa: Instituto Piaget. Le Rider, J. 1990. Jürgen Habermas. In Le Monde Filosofias (trad. de Nuno Ramos). São Paulo: Ática, p. 203–12. Petruccuani, S. 2000. Introduzione a Habermas. Roma: Editori Laterza. —–. 2000. Comentários à Ética do Discurso. Lisboa: Instituto Piaget.
IV HISTÃ&#x201C;RIA DA FILOSOFIA
A I NFLUÊNCIA H EIDEGGERIANA NA V ISÃO DE G ADAMER DE C OMPREENSÃO E L INGUAGEM , COM C ONTRIBUIÇÕES DE F. S CHLEIERMACHER A GUINALDO A MARAL Universidade Federal de Santa Catarina
aguinaldoamaral@hotmail.com
Em Gadamer, a linguagem é constitutiva do mundo humano, uma dimensão insubstituível de sua experiência, um medium exclusivo de acesso ao mundo, em que se revela incessantemente a “significação do mundo”. Em outras palavras a linguagem atestaria o finito radical do homem e a emergência efetiva da verdade, devido a seu caráter histórico e filosófico. O ser a que me remeto e que posso compreender é, antes de tudo, linguagem, ou, me é representado pela linguagem. A historicidade cumpre um papel fundamental na hermenêutica gadameriana pois, como Gadamer costumava dizer “ nós somos o produto dos efeitos da história, assim como nossa produção e, a produção de nossos antepassados humanos”. As expressões humanas ou signos não são fixos como nos outros animais, essas expressões variam, uma mesma expressão pode ter significados diferentes em diferentes contextos para diferentes pessoas. A linguagem intermedia nossa relação com conceitos existenciais como, esperança, amor, cuidado, fé. Conceitos que expressam a chamada vida fática, portanto cumprem um papel importante neste âmbito, com implicações na interpretação e compreensão do mundo objetivo. Mas qual seria a origem da linguagem humana, se pergunta Gadamer. Como teria surgido este processo de simbolizar as coisas? A linguagem, de um modo geral, possui proposições que repousam na noção de signo simples empregada nas sentenças as quais designamos por nomes. Este signo satisfaz a exigência de simplicidade pois não é composto por outros signos. Estas questões nos remetem à antropologia filosófica da linguagem, uma área em que poucos filósofos como Heidegger e Gadamer se dedicaram. Segundo Schleiermacher, a hermenêutica é uma realização moderna, em particular uma transposição. Esta transposição vai muito além do mero analisar textual, ela proporcionou uma autêntica revolução na História da filosofia onde as perspectivas da compreensão e da interpretação representam agora parâmetros da atividade filosófica. Desde os gregos a hermenêutica se pergunta pelos critérios segundos os quais se podem interpretar o discurso. Em que sentido se da este discurso? Como posso ter certeza acerca do que o outro disse? É possível colocar-me no lugar do outro para poder interpretá-lo? Heidegger e Gadamer enfocam estas questões em suas respectivas obras. A tarefa da hermenêutica é recolocar a transcendentalidade no contexto das diversas formas de expressão, proporcionando uma crítica da reflexão semelhante a critica kantiana no surgimento de uma nova forma de filosofar. Essa critica da razão Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 375–381.
376
Aguinaldo Amaral
é transformada em critica da linguagem por Heidegger e por Gadamer, uma espécie de critica lingüística, onde o sentido se sobrepõe a outros aspectos. Um possível equívoco da filosofia moderna se manifestaria na visão gadameriana, dissolução da ontologia em teoria do conhecimento, tomando as representações subjetivas dos objetos como única forma de acesso a estes. Neste ponto, na revolução que transcende o sentido, a teoria do conhecimento é superada pelo âmbito da linguagem, pois todo o conhecimento nos advém através de alguma forma de linguagem, também neste contexto incluem-se linguagens não-orais ou não-escritas. A substituição do conceito de objetos, diz Gadamer, pelo conceito de estados de coisas, não ocorre ao acaso, deriva-se daí uma série de considerações acerca das proposições e dos juízos que são únicas na História da Filosofia, a questão da subjetividade vem à tona na análise e interpretação textual. O ponto de partida nas análises filosóficas são as propriedades atribuídas aos objetos por meio dos juízos. O entendimento lingüístico seria constituído a partir das impressões dos diversos intérpretes. No consenso de entendimento acerca do objeto, esse “compreender os outros”, torna-se mais importante que o modo de análise individual, uma espécie de entendimento coletivo e universal que suplantaria as interpretações individuais, esse universal não é reconhecido em sentido absoluto, à compreensão e o entendimento a partir desse universal, assim como a própria linguagem, somente são possíveis pelo consenso, se houver. A linguagem é um caminho alternativo ao da transcendentalidade, e é por este caminho que a hermenêutica se envereda, embora já tenha recebido os mais diferentes encaminhamentos ao longo da história. É na Filosofia da Linguagem onde localizamos as vigas que sustentam o edifício hermenêutico, contrastando com a filosofia cartesiana do sujeito na modernidade. Em Heidegger o marco inicial é a questão do ser, a emergência do Dasein que surge com a colocação da questão. Em Gadamer o ser que pode ser compreendido é linguagem, manifesta-se na e através da linguagem. O sujeito da compreensão ou, o ser que interpreta, deveria ser tomado como meta e não como ponto de partida do processo hermenêutico. Este sujeito deve ser o objeto de investigação na busca pela verdade implícita ou explicita do texto. O duelo entre a Filosofia Analítica e a Filosofia Hermenêutica encontra em Heidegger e Gadamer duas das suas mais altas figuras de expressão, ao passo que em Ricoeur encontraríamos o chamado ecletismo hermenêutico, Ricoeur seria então um promotor do diálogo entre estas duas posturas filosóficas. A tese do sujeito constituindo-se pela linguagem é humboldtiana, porém Gadamer adota esta mesma postura, quando coloca que a linguagem é aquilo sem a qual não poderia haver nada, ou melhor dizendo, nem mesmo o nada, pois para refletir ou falar sobre esse nada já estaríamos no âmbito da linguagem. Até mesmo para pensar a ausência de linguagem nós temos que usar a linguagem. As possibilidades de interpretação de um texto confundem-se com as possibilidades do próprio sujeito que o interpreta. O ser que interpreta se identifica com as produções simbólicas do ser humano,
A influência heideggeriana na visão de Gadamer de compreensão e linguagem
377
essa identificação é uma chave de leitura, uma porta de acesso ao que foi simbolizado no sentido próprio em que o autor pensou ou quis expressar. Quando se define em Aristóteles o homem como um animal que possui logos, esse logos quer dizer também, e sobretudo, linguagem, pois para haver razão é preciso que haja linguagem e esta também é a interpretação de Gadamer da linguagem. Poder falar, poder usar a linguagem, significam poder tornar algo visível, mesmo que este algo não esteja presente, é através da fala, da simbolização, que se representam as coisas, existente ou não. A linguagem é um veiculo que conduz o ser que interpreta ao sentido do texto, sem linguagem não há texto, não há autor, não há intérprete, não há mundo. Se homem etimologicamente é definido como aquele que nomeia, poderia existir o homem ou o ser humano sem este nomear? Como falar ou pensar coisas que não possuem nomes? O compartilhamento de conceitos é o que torna a vida social possível. Jamais poderia haver entendimento sem este compartilhamento. Talvez se possa pensar em um estágio anterior a linguagem, ou um estágio humano destituído de linguagem, mas até para pensarmos na ausência de linguagem, como no exemplo anterior, temos que lançar mão desta, nossas reflexões acerca de sua ausência implicam em sua utilização. A linguagem não é como um instrumento que você utiliza para algo, e após deixa em algum lugar, é impossível deixar de usar ou simplesmente descartar a linguagem. Quando nos deparamos com algo estranho, provocante e desorientador, iniciamos a compreensão, nossa compreensão é paralisada pelo “não-lugar”, por algo que não faz parte de nenhum esquema prévio de nossa expectativa de compreensão. Neste sentido não podemos avançar com nossas expectativas pré-esquematizadas, de nossa orientação no mundo. O próprio conhecimento de modo geral, somente poderia ser adquirido através da linguagem em suas mais variadas formas. A linguagem faz interpretações sobre o mundo, tudo o mais é derivado ou vem depois destas interpretações. Diante da finitude heideggeriana a linguagem emerge para dar conta de tal, ao passo que a compreensão estaria nas articulações e ordenamentos do mundo, e na compreensão de nós mesmos. Desse modo, poderíamos afirmar que o que esperamos do texto depende do grau de conhecimento que possuímos do seu contexto, e do nosso. É preciso extrair os distúrbios da compreensão do fenômeno da compreensão para ter-se mais claro o processo hermenêutico. O próprio pensar, nas palavras de Schleiermacher, já seria um falar, uma espécie de falar interior. A filosofia pode ser encarada como um exercício da linguagem, terminológico por assim dizer, a perspectiva da linguagem ultrapassa o âmbito ontológico e epistemológico tornando-se ela mesma objeto do filosofar. A hermenêutica moderna é estabelecida no contexto da revolução proporcionada pelo surgimento da lingüística atual, como fonte e área de pesquisa onde destaca-se a interpretação de expressões lingüísticas. O diálogo autêntico ou discurso autêntico é caracterizado pela falta de controle de seus interlocutores no sentido de pôr esse diálogo na direção para a qual gostariam
378
Aguinaldo Amaral
que fosse. Quanto mais a direção de um diálogo for controlada, mais inautêntico esse diálogo será. A compreensão jamais pode tomar por base um “colocar-se no interior do outro”. Gadamer é radicalmente contra este tipo de postura pois a toma do ponto de vista de sua impossibilidade. Ao possuirmos uma história de vida determinada, e, reafirma Gadamer, uma forma de pensar é sempre um produto dos efeitos desta história de vida, de sua época. Nunca se conseguirá tomar absolutamente o lugar do outro ou do autor por assim dizer. Compreender o que alguém diz é pôr-se de acordo com aquilo que é dito, não há a possibilidade de colocar-me no lugar do outro, pois este outro possui vivências que lhe são próprias. Em Gadamer, o compreender tem como pré-suposto uma contestação e uma crítica do que se deteve e, tornou-se estranho, a compreensão não deve se deixar guiar por tudo aquilo que é prévio. Uma visão prévia, uma concepção prévia, uma posição prévia. Novos modos de enunciação surgem freqüentemente concatenados. Na vida da linguagem e no seu uso, as mudanças imperceptíveis sempre houveram, as gírias são um exemplo disso, quantas surgem de tempos em tempos? Quantas caem em desuso em poucos anos? Mesmo no âmbito técnico-acadêmico a linguagem segue seu tempo, certamente que os termos técnico-filosóficos usados na idade média não são os mesmos da idade contemporânea. A tradução, por exemplo, não deixa de ser uma interpretação, mesmo tendo o tradutor o dever de manter o sentido proposto pelo autor. Assim como todo o compreender, em última instância também não deixa de ser um interpretar pois a forma da realização da compreensão é a interpretação, de onde deriva-se os problemas de interpretação lingüística que, em última análise, seriam problemas de compreensão. Gadamer chama a atenção para o âmbito científico se perguntando pelo modo como se dão as relações entre o dizer e o pensar científico e o dizer e o pensar extraciêntífico. A ciência desenvolve um processo de fixação e entendimento próprios, uma linguagem própria no processo de investigação. Esta linguagem tem a pretensão de atingir a consciência pública eliminando sua incompreensibilidade, no entanto sua diretriz principal é tornar cada vez mais precisa e livre de ambigüidades, a linguagem usual. É interessante observarmos que linguagem científica deriva de um sistema de comunicação que não faz parte da linguagem cotidiana, embora a linguagem da ciência pretenda atingir também a consciência pública e superar a incompreensão. O fenômeno hermenêutico é um caso particular da relação pensar/falar, uma vez que a linguagem se oculta no pensamento. Se considerássemos apenas o discurso racional como universal, verdadeiro e entendível, os problemas de compreensão estariam todos resolvidos, uma vez que o ser que interpreta estivesse participando dessa mesma racionalidade, todos os desafios de interpretação seriam eliminados. Em Heidegger tem-se clara a distinção entre dois “logos” pelo menos, o apofântico, que derivaria do enunciado verbal, e o “logos” hermenêutico, por conseqüência interpretativo. Pensar nesta perspectiva exige toda uma nova estrutura conceitual uma vez que o próprio processo de compreensão depende da linguagem, mesmo
A influência heideggeriana na visão de Gadamer de compreensão e linguagem
379
quando esta volta-se para fora de si mesma. Na interpretação filosófica o computo hermenêutico se reveza com o computo crítico. Há uma estreita correlação entre um texto, no sentido de um discurso fixado, e uma postura interpretativa inteligível segundo o conteúdo de um pensamento. O filólogo ou o lingüista devem levar em consideração a relação existente entre um discurso escrito e a fala cotidiana, em sua extensão. Toda a compreensão já esta inserida na linguagem, compreender é compreender e compreender-se na linguagem. É em função da compreensão que se opera a superação do estranhamento entre o Eu e o Tu, pois há uma relação lingüística em toda a compreensão aponta Heidegger. Poderíamos dizer que a compreensão esta nas articulações e ordenamentos do mundo e também na compreensão de nós mesmos. A concepção de sujeito está presente na perspectiva hermenêutica, assim como a concepção de linguagem que o inclui, tributária de uma nova racionalidade e de um novo conceito de linguagem. Não se trata de uma simples junção de vagas intuições particulares de sentido. Estrutura e sentido são os elementos principais dos quais se compõe todos os discursos humanos. O texto é essencialmente a trama, a rede, o tecido de um discurso, de um pensamento formulado expresso impresso, de modo geral. Assim como em um colóquio, dialogamos com nosso interlocutor. O discurso escrito nos remete em primeiro plano, a uma interpretação gramatical, morfológica e sintática. Há uma correlação entre o aspecto gramatical e o aspecto psicológico no processo interpretativo. Na visão de Gadamer, não é no arbítrio de atribuir nomes que se localiza nossa relação fundamental com a linguagem. Não existiu uma primeira e única palavra dando origem a tudo, quando se fala em palavra, já se está “pré-supondo” todo um sistema de palavras onde esta ocupa um lugar, não poderíamos falar em uma primeira palavra se já não houvessem outras para explicar o que esta significa. Atreladas ao enunciado sempre estão às motivações, falamos sempre por algum motivo, mesmo que secreto, explica-nos Heidegger. A linguagem não depende de quem a usa. Cada um quando fala constitui-se em um modo de ser da linguagem, uma vez que o próprio falar se desenvolve no elemento da conversa. Há uma tendência natural na linguagem para ocultar e proteger a si mesma, onde a palavra não representa o verdadeiro ser da coisa, diz Gadamer, nem jamais representará, haja visto que, não há linguagem perfeita absolutamente, toda a linguagem é uma artificialidade, uma tentativa de expressar e de comunicar o mais exatamente possível a essência das coisas. O ser que nomeia cria o mundo a partir de si, dito de outro modo, os seres da espécie que nomeia também criam e desenvolvem os nomes dados pelos primeiros a nomear, nossos antepassados humanos. Em Verdade e Método, Gadamer explica que o falar, manifestaria a verdade existente nas coisas, e não as palavras como símbolos simplesmente. No dialogar, por assim dizer, o mundo seria construído através do diálogo. Uma vez que, sem fala e sem diálogo as palavra não teriam sentido algum, até mesmo para se considerar a palavra enquanto tal é preciso que haja um falar, um diálogo.
380
Aguinaldo Amaral
O termo é sempre um artifício produzido pelo homem, um algo artificial para que o homem possa lidar com as coisas. Para Gadamer o termo é uma palavra rígida, o uso terminológico é um ato de violência contra a linguagem, por definição enormemente abrangente. O contexto não é o único molde para a significação da palavra. O que está presente no discurso, o seu sentido, não é o único elemento a que devemos atentar, há algo mais “co-presente”, esse elemento “co-presente” é o que dá vida ao discurso. Em Heidegger, por exemplo, a abertura do chamado ser-no-mundo se dá pela compreensão e pela disposição no sentido de existenciais fundantes. Gadamer se apropria da idéia heideggeriana de que a estrutura de articulação do discurso é uma espécie de “totalidade significativa”. O ser-no-mundo em Heidegger busca uma disposição que se anuncia no discurso e que faz parte da compreensibilidade do ser. É da existência do Dasein que vem o discurso. A constituição fundamental da presença, pré-molda a estrutura própria da abertura do ser-no-mundo no discurso. Em um sentido ontologicamente amplo é que deveria ser compreendido o fenômeno da comunicação. O discurso e a linguagem dão significado ao ser-no-mundo, sua própria estrutura é pré-moldada por essa constituição fundamental. Também em sentido ontologicamente amplo entende-se o fenômeno da comunicação da linguagem, no tom do discurso temos um índice lingüístico próprio, onde se anuncia o “ser-em” da disposição, para Heidegger. A linguagem pode ser considerada a condição de possibilidade de toda a reflexão humana pois todo o pensamento faz parte de uma comunidade lingüística ou comunidade de pensamento, construída intersubjetivamente. O ser é velado e desvelado na linguagem segundo a força hermenêutica que o interpreta. Neste ponto a hermenêutica é obrigada a aprovar certa concepção de unicidade não dedutível do conjunto sintático-semântico. São nas linguagens particulares onde manifestam-se de modo efetivo o uso, o entendimento e a linguagem, e isto já dizia Schleiermacher, seria então um “universal particular”, universal no sentido de que abrange, mesmo que superficialmente, todo um universo de elementos, todas as coisas que conhecemos. Singular no sentido de que é uma forma de interpretação e de comunicação única, relativa a uma determinada espécie. São as convenções e os consensos que fazem com que a linguagem exista como um todo organizado e coerente. O sentido das palavras é alterado a cada instante, a cada momento em que alguém a utiliza cotidianamente. A semântica convencional da linguagem é suspensa por seu emprego metafórico e simbólico, essa suspensão exige uma redefinição dos caracteres que lhe são inerentes pois a linguagem está sempre em constante transformação. A concepção de mundo como um texto a ser decifrado, é freqüente entre os grades hermeneutas, cabe a linguagem então, decifrar ou interpretar esse mundo, mostrar-nos o sentido das coisas e de nós mesmos pois, heideggerianamente falando, se não vemos sentido em nós mesmos não conseguiremos ver sentido no mundo ou nas coisas, mesmo que este sentido seja algo artificial produzido para complementar um ciclo de significações da própria vida. O espírito, o pensamento, a alma do autor e do interprete, necessitam coadunar
A influência heideggeriana na visão de Gadamer de compreensão e linguagem
381
para que o círculo da compreensão se complete e seja o mais perfeito possível, isto é, o mais fiel possível. O consenso quanto à coisa, é o objetivo de toda compreensão e de todo entendimento, explica Heidegger. A unidade de sentido deve ser confirmada de modo mais unívoco enquanto os projetos se posicionam lado a lado na elaboração da interpretação. A ambigüidade se faz presente na cotidianidade quando ambas se mesclam naquilo que é acessível a todo mundo, junto com o que todo mundo pode dizer da coisa. Fracassaria o tempo em sentido autêntico quanto a seu empenho no famoso Dasein de Heidegger, no estado silencioso de sua realização. Aquilo que se cria de autenticamente novo chega envelhecido quando se torna público, através do texto ou do discurso, em virtude da ambigüidade do chamado falatório e da curiosidade. Os discursos prévios, as percepções curiosas, são dados pela ambigüidade da interpretação pública. A obstinação em perceber a relação entre palavra e coisa ou entre falar e pensar, é algo que nos acompanha desde os gregos, nos aponta Gadamer. Questões envolvendo linguagem e verbo, geralmente remetiam à hermenêutica teológica. Um dos grandes mistérios da linguagem consiste na investigação da relação linguagem-pensamento, no modo como ocorre esta relação. As línguas tanto naturais quanto artificiais jamais manifestariam o verdadeiro ser das coisas, nem mesmo seu próprio ser é manifestado através dessas línguas. Na palavra tornada pública, diz Gadamer, temos a entrega irrecuperável do próprio pensamento ao outro, não somos mais donos de nossos pensamentos ao tornarmos eles públicos, quando a palavra é tornada pública tudo o que consideramos íntimo já não o é mais. Para Gadamer a palavra surge ao mesmo tempo em que a formação do intelecto. A hermenêutica busca esclarecer o fenômeno da linguagem partindo de uma própria realização vital que lhe é inerente. E a hermenêutica filosófica permite ver que o sujeito conhecente está indissoluvelmente unido ao que se lhe abre e se mostra como dotado de sentido. Há uma relação íntima entre a palavra e a coisa, desde a antiguidade, o homem antigo compreendia intuitivamente esta relação, se sentia como parte da palavra que pronunciava. O caráter comum do mundo teria assim, a particularidade de ser sempre pressuposto pela linguagem.
Referências Gadamer, H.-G. 1988.Verdad y Metodo. Traducción de Ana Apud Aparicio e Rafael Agapito. 3a¯ ed. Salamanca: Ediciones Sígueme. —–. 1998. Verdade e método I. Traços fundamentais de uma hermenêutica filosófica. Petrópolis: Vozes. —–. 2002. Linguagem e Compreensão. In Gadamer 1998. —–. 2002. Homem e Linguagem. In Verdade e Método II. Petrópolis: Vozes. Heidegger, M. 1988. Ser e tempo. Trad. Marcia de Sá Cavalcante. Petrópolis: Ed. Vozes, v.1. —–. 1989. Ser e tempo. Trad. Marcia de Sá Cavalcante. Petrópolis: Ed. Vozes, v.2. Schleiermacher, F. 1999. Hermenêutica: arte e técnica da interpretação. Petrópolis: Vozes. —–. Sobre os diferentes métodos de traduzir. Preprint, trad. Celso R. Braida.
O P ROBLEMA DA I NTENCIONALIDADE : DA O BJETIVIDADE I MANENTE EM F. B RENTANO À C ONSCIÊNCIA T RANSCENDENTAL NA F ENOMENOLOGIA DE E. H USSERL C ARLOS D IÓGENES C. T OURINHO Universidade Federal Fluminense (UFF) / NUFIPE
cdctourinho@yahoo.com.br
É na obra de São Tomás de Aquino que o filósofo alemão Franz Brentano (1838-1917) busca fundamentos para reeditar a questão da intencionalidade no último quarto do século XIX. Para Tomás de Aquino, existir na natureza (esse naturale), que é como existem, para ele, as formas, é distinto de existir no pensamento (esse intentionale). Apoiando-se nesse segundo modo de existência, no qual as coisas existem no intelecto (in intellectu) enquanto “coisas pensadas”, Brentano propõe uma teoria imanentista da intencionalidade, segundo a qual o ato de ser intencional deve ser definido como “ser objetivo em sentido imanente”, o que equivale a dizer que todo ato mental contém em si algo como seu objeto. Na obra de Tomás de Aquino, particularmente, em Quaestiones Disputatae de Veritate (Quaestio Prima), deparamo-nos com algumas considerações importantes sobre o tema em questão. Logo no Artigo Primeiro da referida obra, Tomás de Aquino afirma-nos que a alma é dotada de duas faculdades: uma cognoscitiva e outra apetitiva (Thomae de Aquino 1970, p. 5). Enquanto a concordância do ente com a segunda faculdade se exprime com o termo “o bem”, no sentido de que “o bem é aquilo a que tendem todas as coisas” (bonum est quod omnia appetunt), a concordância do ente com a primeira faculdade expressa-se no termo “verdadeiro”. Com efeito, toda cognição se efetua, segundo Tomás de Aquino, mediante uma concordância do intelecto com a coisa conhecida, de modo que tal concordância passa a ser concebida como a causa da cognição (causa cognitionis). O ente não pode ser conhecido se não corresponder ao intelecto ou com ele não concordar. No Artigo Segundo (Quaestio 1, Articulus 2), Tomás de Aquino afirma-nos que o complemento ou a plenitude de qualquer movimento é constituído pelo seu fim ou termo. Se o movimento da faculdade cognoscitiva encontra o seu termo na própria inteligência, pois a coisa conhecida deve necessariamente encontrar-se na inteligência que conhece, segundo o modo característico desta última (modum cognoscentis), a faculdade apetitiva encontra o seu termo nas coisas (Thomae de Aquino 1970, p. 9). Segundo São Tomás de Aquino, eis a razão pela qual Aristóteles estabelece, na parte III do De Anima (comentário 54 e seguinte), um certo circuito nos atos da alma e da inteligência (circulum quendam in actibus animae), no qual o objeto que está fora da inteligência a põe em movimento; o objeto conhecido desperta a faculdade apetitiva, e esta faz, por sua vez, com que a inteligência retorne ao objeto, do qual partiu todo o processo cognoscitivo. Na medida em que o bem se encontra correlacionado à faculDutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 382–391.
O Problema da Intencionalidade
383
dade apetitiva e o verdadeiro se relaciona com o intelecto, Aristóteles afirma-nos, no comentário nono, do livro VI de sua Methaphysicae, que o bem e o mal se encontram nas coisas, ao passo que o verdadeiro e o falso encontram-se na inteligência. Nesse sentido, uma coisa só se diz verdadeira na medida em que concorda ou corresponde com a inteligência que a conhece. Para Tomás de Aquino, a coisa criada encontra-se situada entre duas inteligências: a divina e a humana; denominando-se verdadeira segundo a sua conformidade com ambas. A coisa se conforma à inteligência divina (intellectum divinum) na medida em que cumpre a função para a qual foi destinada por essa mesma inteligência. Por outro lado, a coisa criada denomina-se verdadeira na medida em que se conforma à inteligência humana (intellectum humanum), fornecendo por si mesma uma base para um julgamento correto; analogamente, dizemos que uma coisa é falsa quando ela aparenta algo que na realidade não é. Aqui, Tomás de Aquino chama-nos a atenção para duas acepções da verdade: a primeira reside na coisa antes da segunda, haja visto que a conformidade da coisa criada com a inteligência divina é anterior à conformidade com a inteligência humana. Por conseguinte, mesmo que não houvesse inteligência humana, as coisas continuariam a denominar-se verdadeiras em relação à inteligência divina, pois “nenhuma coisa pode ser falsa se comparada com a inteligência de Deus” (Thomae de Aquino 1970, p. 31). No que concerne a este ponto, Tomás de Aquino afirma-nos que, com respeito ao intelecto de Deus, toda coisa é em si verdadeira. Ao contrário, a comparação (da coisa) com a inteligência humana é acidental, pois, em relação a ela, a coisa não se pode denominar sempre absolutamente verdadeira. O intelecto humano desdobra-se, segundo São Tomás de Aquino, em um intelecto que forma as qüididades das coisas (intellectus quiditatem rerum formantis) e um intelecto que exerce uma atividade sintetisante e analisante (intellectus componentis e dividentis), fornecendo-nos um juízo sobre as coisas. O conceito de verdade se verifica na inteligência humana primariamente a partir do momento em que esta começa a possuir algo de próprio, que a coisa (ou ente) existente fora da inteligência não possui; algo que não deixa, contudo, de corresponder à coisa, assegurando, com isso, a concordância entre ambos (entre a inteligência e a coisa). O intelecto formador das qüididades somente possui uma imagem da coisa existente fora do espírito, ao passo que o intelecto sintetisante e analisante encarrega-se de fazer um julgamento acerca da coisa. É sobre a atividade exercida pelo intelecto formador de juízos que São Tomás de Aquino situa o que há de próprio no intelecto humano, algo que não se encontra na própria coisa. Quando aquilo que se encontra na coisa extrínseca concorda com o julgamento da inteligência, dizemos que o julgamento é verdadeiro. Para Tomás de Aquino, conforme a exposição do Artigo Terceiro (Quaestio 1, Articulus 3), falar da verdade implica em falar de uma concordância ou conformidade entre a coisa e a inteligência. Nesta concordância, porém, não é necessário que os dois membros dessa relação tenham existência atual, uma vez que a inteligência pode concordar com coisas que ainda não existem, mas existirão futuramente. Do contrá-
384
Carlos Diógenes C. Tourinho
rio, nos diz Tomás de Aquino, não poderia ser verdadeira a frase: “Nascerá o Anticristo” (Thomae de Aquino 1970, p. 18). Pode-se dizer que tal afirmação é verdadeira com respeito à verdade que se encontra só no intelecto, mesmo que a própria coisa ainda não exista. Conclui-se, então, que a inteligência está em conformidade não somente com as coisas que existem atualmente, mas também com aquelas que não possuem existência atual. Na inteligência, a verdade reside como alguma coisa que resulta de uma atividade exercida pelo próprio intelecto, e como algo que é conhecido através da inteligência. No Artigo Nono (Quaestio 1, Articulus 9) , Tomás de Aquino chama-nos a atenção para a idéia de que a verdade é conhecida pelo intelecto na medida em que ele reflete sobre o seu próprio ato, não apenas no sentido de conhecer o ato para o qual se volta, mas também no sentido de conhecer a relação (intencional) do ato com a coisa. Tal relação somente pode ser conhecida caso se conheça a natureza do próprio ato, e a natureza deste, por sua vez, somente pode ser conhecida caso se conheça a natureza do princípio ativo, que é a própria inteligência, cuja inclinação consiste em se colocar em conformidade com as coisas (Thomae de Aquino 1970, p. 29). Residindo no próprio intelecto, a conformidade com as coisas pressupõe tanto a possibilidade de apreensão das coisas (que estariam fora da alma) mediante imagens, como a formação de juízos verdadeiros, conforme o modo característico da inteligência que conhece (modum cognoscentis). Para Tomás de Aquino, as coisas criadas existiriam, portanto, de dois modos distintos: na natureza ou “fora da alma” (extra animam) e no intelecto (in intellectu). É nesse segundo modo que encontramos a idéia de uma “in-existência” da coisa no intelecto, a coisa segundo o modo de existência de coisa pensada (secundum esse quod habet in intellectu). Trata-se aí de uma “inexistência” não no sentido de “não existir”, mas no sentido de “existir em”, conforme o modo ou termo característico da própria inteligência. Há, portanto, uma relação na qual o intelecto — movido pelo próprio objeto que o desperta no início do processo cognoscitivo — apreende, mediante imagens, esse mesmo objeto, que passa, por sua vez, a (in)existir no intelecto. Inspirando-se nesse segundo modo de existência, no qual as coisas existem no intelecto (in intellectu) enquanto “coisas pensadas”, Brentano reedita, no último quarto do século XIX, uma teoria imanentista da intencionalidade, na qual o objeto do pensamento in-existe como tal no próprio pensamento. Em sua obra de 1874, intitulada Psicologia do Ponto de Vista Empírico, o filósofo alemão Franz Brentano — professor na Universidade de Viena — busca, basicamente, um critério de demarcação que permita o estabelecimento de uma distinção entre os fenômenos físicos e os fenômenos mentais. No primeiro capítulo do Livro II, Brentano começa essa discussão com a seguinte afirmação: “Todos os dados da consciência são divididos em duas grandes classes — a classe do fenômeno físico e a classe do fenômeno mental” (Brentano [1874], p. 77). Ainda no mesmo capítulo, Brentano introduz o que considera a característica que melhor permite-nos distinguir os fenômenos mentais dos fenômenos físicos: trata-se da relação intencional entre atos mentais e seus objetos. A idéia central de Brentano é a de que os fenômenos mentais são atos
O Problema da Intencionalidade
385
mentais dirigidos (ou voltados) intencionalmente para os seus objetos. Em princípio tais objetos são fenômenos físicos, porém, os fenômenos mentais (ou “atos mentais”) podem também se tornar objetos de outros atos mentais. A relação entre fenômenos mentais e fenômenos físicos é, portanto, uma relação entre atos mentais e seus objetos. Brentano irá caracterizar esta relação a partir de uma reedição da concepção aristotélico-tomista de “in-existência intencional” de um objeto. Trata-se aí de uma “in-existência” não no sentido de “não existir”, mas no sentido de “existir em”. Após cair em desuso no Renascimento e na Modernidade, essa terminologia foi, então, revivida por Brentano, usada para veicular a idéia de que o objeto do pensamento in-existe como tal no pensamento, no qual se torna um objeto do próprio ato mental. Eis a definição do termo “intencionalidade” na filosofia de Brentano: “ser objetivo em sentido imanente”, o que equivale a dizer que todo fenômeno mental contém em si algo como seu objeto (ou seu conteúdo). O campo fenomenal se abre revelando, em sua imanência, a referência intencional aos objetos. Em Brentano, a intencionalidade (ou “in-existência intencional”) aparece, então, como um critério de demarcação, como aquilo que diferencia o fenômeno físico do fenômeno mental. Somente o fenômeno mental possuiria intencionalidade. Como herança do pensamento de Brentano, Husserl retém a idéia básica de que a intencionalidade é a peculiaridade da experiência de ser consciente de alguma coisa. Pode-se dizer que, até 1900, Husserl recorre, tal como Brentano, à in-existência imanente de um conteúdo mental. Aqui, a noção de “conteúdo” é para ser tomada literalmente: o objeto intencional encontra-se contido no fenômeno mental como uma de suas próprias partes. Estabelece-se uma equivalência entre o “objeto” e o “conteúdo” de um ato mental. Inspirado em Brentano, o primeiro Husserl admite, então, o chamado “princípio de adequação mereológica”, segundo o qual o objeto ou conteúdo de um ato mental in-existe como tal no próprio ato1 . Em suas Investigações Lógicas (1900/1901), Husserl apresenta-nos um ponto de rompimento com relação à teoria da intencionalidade formulada por Brentano. Tal rompimento concentra-se na rejeição do “princípio de adequação mereológica”. Husserl parece confirmar a sua nova posição a respeito do problema em questão, afirmando-nos, no parágrafo 11 da V Investigação, que: . . . é sempre inteiramente questionável e bastante equivocado dizer que os objetos percebidos, imaginados, afirmados ou desejados “entram na consciência”. . . ou dizer similarmente que a experiência intencional contém alguma coisa como seu objeto nela mesma...Não existem duas coisas presentes na experiência, nós não experienciamos o objeto e ao lado dele a experiência intencional dirigida para ele; não há mesmo duas coisas presentes no sentido de uma parte e de um todo que a contém . . . É claro, ao menos, até onde nós temos investigado, que o melhor seria evitar falar de “objetividade imanente”. (Husserl [1900/1901], p. 98)
Estabelece-se, a partir desse momento, a distinção entre “conteúdo” e “objeto” de um ato mental. A nova teoria de Husserl partirá da idéia de que, no que se refere a qualquer ato mental particular, “conteúdo” e “objeto” nunca coincidem. Enquanto o
386
Carlos Diógenes C. Tourinho
conteúdo de um ato mental encontra-se presente no próprio ato, o objeto intencional de um ato o transcende, não estando, portanto, contido nele de forma imanente. O eixo das atenções concentra-se, então, neste momento da obra de Husserl, em torno da necessidade de elucidar a “referência intencional” de um ato mental sobre os objetos, ou seja, o modo por meio do qual um ato intencional se refere a um objeto. Afinal, como nos lembra o próprio Husserl, existem essencialmente diferentes espécies e subespécies de intenções, diferentes modos de referência intencional (Husserl [1900/1901], p. 96). Passa a ser de fundamental importância a investigação do momento interno de um ato que, no próprio ato, é responsável pela determinação de sua referência objetiva. Afinal, como os elementos atualmente presentes em um ato mental podem capacitar esse ato à objetivar, referir ou significar alguma coisa que, por sua própria natureza, não faz parte dele, ao contrário do que se pensava na posição anterior? Como faz questão de ressaltar o próprio Husserl: “. . . é de um interesse epistemológico fundamental conseguir a máxima clareza possível acerca da essência desta referência” (Husserl [1900/1901], p. 129). Na V Investigação, Husserl chama-nos a atenção para a idéia de “conteúdo fenomenológico de um ato”. Segundo Husserl, deve haver, no próprio conteúdo fenomenológico de um ato, um elemento que determine o objeto para o qual o ato mental estaria voltado intencionalmente, mas também um elemento responsável por fazer com que o objeto possa ser intentado por um ato como um objeto julgado, desejado, representado, etc. Destacam-se os conceitos de “matéria” e de “qualidade” de um ato mental, definidos, em termos gerais, como dois momentos abstratos, dois constituintes internos, comuns a todos os atos. A matéria é, segundo Husserl, aquela parte peculiar do conteúdo fenomenológico de um ato que aponta o objeto para o qual o ato estaria dirigido ou voltado intencionalmente, determinando, portanto, o direcionamento do ato para este objeto e não para outro. A matéria intencional deve ser, portanto, aquele elemento em um ato mental que determina, primeiramente, a sua referência a um objeto (ou a sua “referência objetiva”). Já a “qualidade” de um ato mental é, tal como a matéria, um aspecto abstrato do próprio ato, porém, enquanto a matéria determina o objeto para o qual o ato estaria dirigido intencionalmente, a “qualidade somente determina se o que é já apresentado de uma maneira definida encontra-se intencionalmente apresentado como algo desejado, questionado, localizado em um julgamento, etc”. Eis, portanto, os elementos que, no próprio ato, tornariam possível o direcionamento intencional, servindo de ponto de apoio para a superação do desafio que o problema da intencionalidade (agora concebido como problema da “objetividade transcendente”) impõe à V Investigação. Pode-se dizer que o momento decisivo para a formulação de uma nova concepção de intencionalidade ocorre nas cinco “lições” pronunciadas por Husserl, em abrilmaio de 1907, diante dos seus alunos da Universidade de Göttingen — que ele deixaria em 1916, indo para a Universidade de Freiburg-im-Breisgau. Somente após a sua morte tais lições seriam publicadas, sob o título de A Idéia da Fenomenologia (Die Idee der Phänomenologie). A partir desse momento, assumindo, como modelo explícito, o
O Problema da Intencionalidade
387
método cartesiano da dúvida hiperbólica, Husserl afirma, na referida obra, que, para fundar a filosofia sobre um solo inabalável, estabelecendo-lhe seus fundamentos, seria preciso começar por duvidar de qualquer outra fonte de conhecimento (Husserl [1907], p. 23). Em seu propósito de alcançar uma fundamentação rigorosa para a filosofia, está em jogo uma “reflexão radical” (Selbstbesinnung)2 que dará sentido ou consistência racional a todas as ciências e à Filosofia. No exercício dessa reflexão, a única realidade cuja existência se revelaria de modo indubitável seria a dos nossos próprios pensamentos (cogitationes), ou seja, dos “fenômenos” que aparecem para o nosso espírito — desde que esse espírito seja definido não como “eu” empírico, mas sim, como “consciência pura”, dotada da capacidade de “ver” as essências em si mesmas, independentemente de qualquer referência a um mundo “posto entre parênteses”. Abrem-se as portas para um nova filosofia do sujeito, para um novo idealismo transcendental. Desenvolver as grandes linhas deste novo idealismo constituirá um dos objetivos principais do pensamento husserliano. Neste sentido, A Idéia da Fenomenologia — que constitui o núcleo das Cinco Lições pronunciadas em 1907, em Göttingen — assume um lugar de destaque no itinerário traçado por Husserl, pois, nas Cinco Lições, o mesmo autor já anuncia o intuito de promover uma reforma total da filosofia para fazer desta uma ciência de fundamentos absolutos. Esta disciplina filosófica fundamental — definida como “ciência dos fenômenos puros” — é o que Husserl denominará de “fenomenologia”. A partir das lições de 1907, é possível notar, definitivamente, a aceitação não mais de uma fenomenologia meramente empírica (ou de uma psicologia descritiva), restrita à simples esfera das vivências intelectivas, das vivências de um “eu empírico” (ou de um “eu psicológico”), mas sim, de uma “fenomenologia transcendental”, preocupada fundamentalmente em captar, através da redução fenomenológica, o fenômeno puro, cuja essência imanente é exibida como um dado absoluto. A respeito da sua nova posição, o próprio Husserl especifica, em um manuscrito de 1907 (setembro de 1907, B II 1), que, de certo modo, as Investigações Lógicas ainda faziam a fenomenologia passar por uma “psicologia descritiva”, embora, conforme nos assinala o autor no referido manuscrito, no texto das Investigações já fosse determinante o interesse teórico-cognoscitivo. O autor confirma, então, a sua nova posição, afirmando-nos que: As ‘Investigações Lógicas’ fazem passar a fenomenologia por psicologia descritiva (embora fosse nelas determinante o interesse teórico-cognoscitivo). Importa, porém, distinguir esta psicologia descritiva, e, claro, entendida como fenomenologia empírica, da fenomenologia transcendental . . . O que nas minhas ‘Investigações Lógicas’ se designava como fenomenologia psicológica descritiva concerne à simples esfera das vivências, segundo o seu conteúdo incluso. As vivências são vivências do eu que vive, e nessa referem-se empiricamente às objectidades da natureza. Mas, para uma fenomenologia que pretende ser gnosiológica, para uma doutrina da essência do conhecimento (a priori), fica desligada a referência empírica. Surge assim uma fenomenologia transcendental . . . (Husserl [1907], p. 13–4).
388
Carlos Diógenes C. Tourinho
Neste sentido, Husserl alerta-nos para a importância de se distinguir essa psicologia descritiva, entendida como “fenomenologia empírica”, de uma fenomenologia transcendental, voltada para uma consciência constituinte capaz “ver” as essências em si mesmas. “Surge assim uma fenomenologia transcendental, que foi efetivamente aquela que se expôs em fragmentos, nas Investigações Lógicas” (Husserl [1907], p. 14). É nesse nível que a função “intencional”, recriando um laço entre a minha consciência e o objeto que esta lições, é possível notar, portanto, de forma definitiva, a aceitação não mais de uma fenomenologia meramente empírica, restrita à simples esfera das vivências intencionais de um “eu empírico”, mas sim, de uma “fenomenologia transcendental”, voltada para uma consciência pura capaz de intuir as essências universais (entendidas como “idealidades meramente significativas”). Sob a égide desta nova diretriz, a fenomenologia de Husserl tomaria novos rumos, não deixando de prescindir de um método de evidenciação dos fenômenos. Husserl opta, então, como estratégia metodológica para o alcance de evidências plenas (cuja revelação implica em uma absoluta ausência de dúvidas), pelo exercício da suspensão de juízo (epoché) em relação ao mundo natural: me abstenho de tecer considerações acerca da existência ou não existência das coisas mundanas (a facticidade do mundo fica “fora de circuito”). Husserl defende o exercício da epoché em relação aos fatos, ao eu psicológico que os vivencia e as próprias vivências deste eu. A epoché proporcionará o deslocamento da atenção, inicialmente voltada para os fatos contingentes do mundo natural, para o domínio de uma subjetividade transcendental (permanente e universal), onde as idealidades inteligíveis se revelarão como “evidências absolutas” para uma consciência pura, dotada da capacidade de ver verdadeiramente os fenômenos enquanto “essências universais” (trata-se do “puro ver das coisas”). Daí Husserl definir, por vezes, a fenomenologia como “Doutrina Universal das Essências” ou “Ciência dos Fenômenos Puros”. O exercício da epoché proporciona, portanto, o acesso ao modo de consideração transcendental do objeto, possibilitando o retorno à consciência pura e, por conseguinte, ao modo como nela os objetos se constituem. Para Husserl, é como se houvessem “duas regiões”. De um lado, deparamo-nos com o domínio dos fatos, do que tem existência, do mundano, do que se encontra submetido a uma dimensão espaço-temporal. Paralelamente, como um recurso metodológico para o alcance das evidências apodíticas, o exercício da epoché e, conseqüentemente, da redução fenomenológica, promoverá o salto para o domínio das idealidades inteligíveis, que se revelam na e para uma consciência pura (ou transcendental); “puro” aqui significa a priori (independente da experiência), aquilo que não pode ser pensado em termos de dados empíricos; se esta consciência pura não pode ser tomada a partir de dados empíricos, cabe-nos apenas concebê-la a partir de sua relação intencional com o seu objeto (não objeto no sentido de “fato” ou “coisa”, mas sim, objeto enquanto uma idealidade, destituído de qualquer contingência ou “facticidade”). Trata-se de uma idealidade meramente significativa, que se revela como um dado absoluto e imediato para uma tal consciência pura que o apreende intui-
O Problema da Intencionalidade
389
tivamente. O objeto, precisamente porque inconcebível sem ser pensado, exige uma doação de sentido que só pode vir através dos atos de consciência (que nada mais são do que “atos de pensamento”, cuja essência é a própria intencionalidade), isto é, as unidades de sentido pressupõe uma consciência de sentido. Portanto, concentrandose na relação intencional entre a consciência e o fenômeno, a fenomenologia irá se ocupar não de uma consciência empírica que porventura correspondesse ao fato natural, mas sim, de uma consciência pura voltada intencionalmente para o “fenômeno puro”. Tal consciência pura (ou transcendental), dirá Husserl, será no fundo uma consciência “doadora originária de sentido”; na fenomenologia, as essências (enquanto “unidades ideais de significação”) somente podem ser pensadas na medida em que se revelam na consciência transcendental e para essa mesma consciência. Tais sentidos seriam constituídos por essa consciência pura doadora de sentidos. Daí tomarmos a fenomenologia como um novo “idealismo transcendental”. Quando pensamos a relação desta consciência pura com os seus objetos (que rigorosamente falando, nada mais são do que “conteúdos intencionais da consciência), pensamos primeiramente em uma relação de imanência, pois, o objeto se revela na consciência. Mas pensamos também em uma relação de “transcendência”, pois, este mesmo objeto que se revela na consciência, é, enquanto um sentido, constituído por essa mesma consciência. No plano transcendental, poderíamos, então, dizer que, na relação intencional da consciência pura com o seu objeto, há uma relação da ordem de uma “transcendência na imanência”. A fenomenologia transcendental será então uma fenomenologia da consciência constituinte. Exercer a epoché é reduzir à consciência transcendental (o mundo reduzido é o mundo tal como se revela ou aparece na consciência, não mais como “fato”, mas sim, como um “horizonte de sentidos”). A constituição de sentido se faz, no plano transcendental, por intermédio da intencionalidade (a unidade de sentido constituída encontra-se em minha vida intencional e a partir da minha vida intencional). O fenômeno puro é o sentido que, uma vez constituído, se revela de forma imediata como um dado absolutamente evidente para a própria consciência que o apreende intuitivamente. A epoché revela-nos que o mundo que existe para nós, tira o seu sentido de ser da nossa vida intencional. Ao situar a intencionalidade em um plano transcendental, o foco das atenções concentra-se em torno dos elementos que, na consciência pura, são responsáveis pela constituição do objeto (unidade de sentido) e pelas diferentes formas ou modalidades do “dar-se na consciência” (o aparecer enquanto tal). Portanto, a partir de A Idéia da Fenomenologia, as investigações em torno da intencionalidade não habitariam mais o domínio do que é meramente empírico e, definitivamente, não estariam mais voltadas para a idéia de uma “objetividade imanente” (no sentido proposto por Brentano), nem tampouco para o problema da “objetividade transcendente” (isto é, o problema de como é possível uma vivência intelectiva intentar algo que se encontra fora do domínio da própria consciência empírica). Ao suspender o juízo em relação à facticidade do mundo, a fenomenologia promoverá,
390
Carlos Diógenes C. Tourinho
a partir da redução fenomenológica, o salto do domínio do que é transcendente (no sentido do que não é auto-evidente) para o domínio de uma autêntica imanência (de uma claridade absoluta, do dar-se em si mesmo), fazendo com que o fenômeno puro se revele imediatamente para uma consciência doadora de sentido. Recuperase a idéia de “objetividade imanente”, porém, no plano transcendental. O mundo reduzido será, então, considerado apenas como significado e, portanto, apresenta-se como mero corolário da consciência pura que o significa, adquirindo assim um caráter absoluto. Amplia-se a esfera de investigação em torno da intencionalidade, cabendo agora examinar os elementos que, na consciência pura, são responsáveis pela constituição das diferentes modalidades do “aparecer” enquanto tal (diferentes formas do dar-se dos objetos na consciência pura). Diferentemente de Brentano, para quem a relação intencional ainda se mantinha em uma dimensão meramente psicológica, Husserl procurou situar, através da redução fenomenológica, a intencionalidade em uma região transcendental, independente de — e anterior a — toda descrição psicológica, recuperando, assim, de um modo original, a idéia de “objetividade imanente”.
Bibliografia Bell, D. 1995. Husserl. The Arguments of the Philosophers. Edited by Ted Honderich. London and New York: Routledge. Brentano, F. ([1874] 1973). Psychology from an Empirical Standpoint. Ed. by L. L. McAlister, translated by A. C. Rancurello, D. B. Terrell and L. L. McAlister. London: Routledge & Kegan Paul. Føllesdal, D. 1998. Edmund Husserl (1859-1938). In: Craig, E. (ed.) Routledge Encyclopedia of Philosophy. London: Routledge. Fradique Morujão, A. 2002. Estudos Filosóficos. Vol. 1. Lisboa: Imprensa Nacional – Casa da Moeda. Fragata Sj, J. 1956. A Fenomenologia de Husserl como fundamento da filosofia. Braga: Livraria Cruz. —–. 1989. Problemas da Filosofia Contemporânea. Braga: Publicações da Faculdade de Filosofia da UCP. Husserl, E. ([1900/1901] 2001). Logical Investigations (Volume II). London and New York: Routledge. —–. ([1907] 2000). A Idéia da Fenomenologia. Lisboa: Edições 70. Thomas de Aquino. 1970. Quaestiones Disputatae de Veritate (Quaestio Prima). Opera Omnia, Tomus XXII. Volumen I, Fasc. 2. Iussu Leonis XII P. M. Edita. Romae ad Sanctae Sabinae.
Notas 1 Trata-se da aceitação do princípio segundo o qual a relação de um fenômeno mental (ou de um ato
mental) com o seu conteúdo é uma relação do todo com a sua própria parte. Neste sentido, dizemos, com o referido princípio, que o conteúdo de um ato in-existe como tal no próprio ato, desde que não seja idêntico a ele. Ou seja, o conteúdo b está contido no ato mental a, no entanto, a não é idêntico a b.
O Problema da Intencionalidade
391
2 Besinnung é uma palavra que dificilmente se traduz para o português, como, em geral, para qualquer
outra língua. Husserl caracteriza-a com suficiente amplidão, esclarecendo-a como uma “manifestação íntima do sentido” (Sinn), ou seja, como uma “exposição radical do sentido” (ursprüngliche Sinnesauslegung). “Selbstbesinnung” será, portanto, uma clarificação do sentido íntimo por meio de uma reflexão radical.
N OTA SOBRE O C ONCEITO DE M OVIMENTO NO LE MONDE E NOS PRINCIPES DE LA PHILOSOPHIE : CONTINUIDADE OU RUPTURA ? É RICO A NDRADE M. DE O LIVEIRA Universidade Federal de Alagoas / Universidade Federal de Pernambuco
ericoandrade@hotmail.com
1. Introdução Descartes escreve os Principia Philosophiae (doravante: Princípios) com a intenção de divulgar sua obra nas escolas.1 Para realizar essa empresa ele teria que consentir uma dupla adaptação de sua filosofia; por um lado, ele deveria a dispor em forma de manual escolástico o que implica a assimilação de um vocabulário próximo ao aristotélico, estranho ao espírito cartesiano.2 Por outro, ele deveria obrigatoriamente conciliar a sua física, notadamente a teoria heliocêntrica, outrora defendida por ele no Le Monde (doravante: Mundo), com as doutrinas da Igreja, visto que a ausência dessa conciliação já houvera custado a vida para alguns e condenado outros ao silêncio definitivo.3 Essas exigências talvez tenham tornado esse manual de filosofia paradoxalmente a obra cartesiana mais difícil. Primeiro, as críticas vorazes aos manuais da escola foram de certa forma esquecidas por Descartes que resolve “escolastitizar” sua própria filosofia.4 Segundo, a conciliação do repouso da Terra com o movimento dos turbilhões, que a conduzem a mudar de posição em relação ao Sol, demanda uma teoria reconhecidamente pouco clara do movimento. As dificuldades resultantes da adaptação cartesiana dos Princípios aos manuais da escola se multiplicam em diferentes níveis. No entanto, o escopo do presente artigo circunscreve-se à análise do conceito de movimento. Assim, poder-se-ia inquirir se a mudança em alguns conceitos da ciência cartesiana, empreendida nos Princípios, sobretudo sua inédita crítica ao heliocentrismo conduziriam inevitavelmente a uma mudança estrutural na concepção de movimento que resultaria, em última instância, na produção de duas físicas distintas. A questão que se impõe, portanto, consiste em saber se a concepção de movimento dos Princípios seria antagônica àquela do Mundo, prescrevendo uma disjunção absoluta entre uma visão cinemática ou geométrica do movimento (Mundo) face a uma compreensão dinâmica (Princípios)? Parte das interpretações da ciência cartesiana insiste que a mudança de concepção de movimento subscreve a necessidade de se substituir a conotação cinemática, passível de uma descrição geométrica, por uma concepção dinâmica em função da qual se poderia incluir a força como uma variável determinante para a compreensão do movimento. Graças a essa renovação do conceito de movimento, seria possível fornecer subsídios teóricos ao modelo dos turbilhões, empreendido nos Princípios. Em outras palavras, a tese padrão e tradicionalmente aceita pelo interpretes da física cartesiana defende que o conceito de força desempenha um papel eminente nos Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 392–408.
Nota sobre o conceito de movimento no Le Monde e nos Principes de la Philosophie
393
Princípios — traduzido na absolutização da dinâmica em detrimento da cinemática esboçada no Mundo — devido à ênfase cartesiana à ação dos turbilhões que desencadeia o movimento do objeto face aos seus vizinhos (Koyré 1966, p. 131, 136 e 337; Gaukroger 2002, p. 105). Infere-se dessa tese que a definição dos Princípios poderia ser tomada como o epílogo da eliminação de uma descrição geométrica do movimento — restrita à variação espacial do corpo, conforme predissera o Mundo — incapaz, portanto, de aplicar-se à compreensão do corpo em sua interação — colisão — com os outros corpos. Por outro lado, outros intérpretes defendem que a definição dos Princípios embora de fato acentue a dimensão dinâmica do movimento, poderia guardar um certo grau de similaridade em relação àquela do Mundo no que concerne, pelo menos, à compreensão do movimento sem a variável do tempo. Não obstante essa similaridade, não se poderia obliterar o ponto de ruptura entre as referidas definições. Esse ponto encontrar-se-ia mais na supressão — problemática porque marcada por uma série de dificuldades técnicas e práticas — do movimento relativo em favor de um movimento tomado no sentido absoluto (ontológico) do que numa passagem da cinemática para a dinâmica. A existência de uma dupla definição do movimento: movimento relativo e movimento absoluto desempenharia, segundo esses intérpretes, diferentes papeis nos Princípios, aventando uma ambigüidade — inexistente no Mundo — inscrita numa dupla forma de conceber o movimento (Gueroult 1970, p. 91–3 e p. 104–7). Desse modo, se tomado no sentido relativo — por isso condicionado a um referencial arbitrário conforme o qual se identifica o deslocamento espacial de um corpo (Mundo e Princípios parte I e II) — o movimento seria considerado nos Princípios; vulgar. Se tomado no sentido absoluto — translação de um corpo em relação aos seus vizinhos — o movimento seria considerado real (Garber 1999, p. 249, p. 253). Contrariamente as duas correntes de interpretação que enfatizam, em diferentes tons, a disjunção entre as definições do movimento estabelecidas no Mundo e nos Princípios, tencionamos mostrar que a compreensão do movimento no seu aspecto dinâmico garimpa um terreno igualmente importante tanto na definição do movimento do Mundo quanto naquela dos Princípios, sobretudo no tocante à constituição do modelo dos turbilhões. Assim, embora divirjam em relação ao modo ou ao critério de identificação do movimento, as referidas definições cumprem uma mesma função no edifício teórico cartesiano. Elas apontam para a circularidade do movimento, bem como para a sua assimilação enquanto variável central para a composição do modelo dos turbilhões, fomentando uma unidade entre as físicas produzidas naquelas obras. Nosso artigo arquiteta-se em quatro etapas. 1. A análise do conceito de movimento no Mundo no que diz respeito à crítica cartesiana à compreensão do movimento em Aristóteles e à proximidade daquele conceito com a dinâmica. 2. Tentaremos compreender a dupla significação do termo movimento nos Princípios: vulgar e absoluto enquanto uma revisão do modo de identificar o movimento de um corpo, sem grandes repercussões no modelo teórico dos turbilhões. 3. Apresentaremos as possíveis confluências e divergências em torno das diferentes definições do movi-
394
Érico Andrade M. de Oliveira
mento estabelecidas por Descartes nas duas obras mencionadas no que se refere à assimilação do movimento circular e à inexistência do vazio. 4. Argumentaremos em favor da coextensão das implicações que decorrem das diferentes definições cartesianas do movimento: em ambas as obras o movimento é tomado, em última instância, como uma unidade de medida da variação dinâmica da matéria juntamente com a grandeza dos corpos. Concluiremos que as definições de movimento oferecidas nas referidas obras distanciam-se no que concerne à forma de se identificar o movimento de um corpo, mas proporcionam subsídios idênticos no que releva da instauração da dinâmica cartesiana, apresentada por meio do modelo dos turbilhões.
2. Definição de movimento no Mundo como crítica ao conceito de movimento aristotélico A gênese da concepção de movimento em O Mundo estrutura-se sob uma crítica incisiva à definição aristotélica do movimento, amplamente retomada na Idade Média. Para Aristóteles pode-se definir o movimento, de maneira geral, como a passagem daquilo que está em potência ao ato: o movimento é o ato do ente em potência enquanto tal (Motus est actus entis in potentia, prout in potentia est, O Mundo AT, XI, p. 39). Essa definição coloca no mesmo plano a análise metafísica do movimento, que o considera, de forma geral, como a travessia que conduz o ser à metamorfose e a física que desvela na estrutura material do corpo a indicação do lugar para o qual ele tende a se direcionar no intuito de adequar-se à ordem natural do mundo. Com efeito, essa dupla forma de considerar o movimento é circunscrita numa mesma esfera teórica que visa compreendê-lo enquanto um modo essencial do ser. Assim, física e metafísica concorrem para a explicação da travessia da potência ao ato por meio da qual ocorre a metamorfose do ser, sua mudança, seu reposicionamento na ordem natural. Descartes dirige uma crítica mordaz à definição aristotélica do movimento por sua vacuidade. Falta-lhe uma intensão precisa que permita a ciência decidir quanto ao movimento de um corpo. A argumentação de Descartes incide sobre a imprecisão da linguagem empregada para estabelecer a definição — a dificuldade da definição dada em latim permanece na língua francesa — e, sobretudo, no objeto que ela designa.5 A definição aristotélica-escolástica envolve todo processo de mutação do ente. Desse modo, sua extensão é ampla, considerando que ela abrange não apenas o ente submetido a um certo deslocamento, mas também se aplica à explicação de uma série de qualidades sensíveis, supostamente intrínsecas ao ente, que lhe impulsionam ao movimento, ou, em alguns casos, à metamorfose. Ele está, portanto, subordinado às diversas qualidades do ser, existindo para cada uma delas um tipo de movimento: movimento da forma, da quantidade, do calor, etc. (Mundo, AT, XI, p. 39). A definição aristotélica é, então, subdividida em diversos níveis sem que haja um critério claro em razão do qual possa ser identificado o ponto que os reúnem na forma de um conceito. Para reverter o epicentro da definição aristotélica do movimento e restringi-la ao
Nota sobre o conceito de movimento no Le Monde e nos Principes de la Philosophie
395
deslocamento de um corpo no espaço Descartes realiza no Mundo uma dissecação e, posteriormente, uma eliminação, dos diversos extratos da matéria aristotélica a fim de compreendê-la sob uma base formal, alheia a eventuais características sensíveis dos corpos — suas qualidades. Assim, elimina-se, com Descartes, as qualidades do objeto para que ele seja considerado como uma quantidade: . . . o que quer que seja essa Matéria primeira dos Filósofo, se a analisamos todas as suas formas e qualidades permanece apenas aquilo que é claramente extenso.6 A concretude da matéria — sua substancialidade — está, portanto, na sua dimensionalidade: em uma palavra, na sua abertura à quantificação. No Mundo podemos recuperar o caminho da ruptura que a definição da matéria como extensão introduzida e postulada por Descartes como crítica à matéria, diríamos, viva aristotélica, impõe à compreensão do movimento de Aristóteles: Os filósofos supõem também vários movimentos que eles pensam poder ser feitos sem nenhum corpo mude de lugar, como aqueles que chamam: Motus ad formam, motus ad calorem, motus ad quantitatem (movimento da forma, movimento do calor, movimento da quantidade) e mil outros. E eu não conheço nenhum que aquele que é mais fácil de conceber que as linhas dos geômetras, que faz com que o corpo passe de um lugar a outro, ocupando sucessivamente todos os espaços que são entre eles (AT, IX, p. 39-40).7
Ao invés de adscrever os fatores supostamente endêmicos que concorrem para a metamorfose do ente, a física cartesiana agirá com parcimônia. Ela fará uma notável economia no tocante ao conceito de movimento aristotélico na medida em que o restringe ao deslocamento de um objeto extenso no espaço. A física cartesiana confere um caráter inerte à matéria cuja decorrência é a transposição da noção de causalidade, compreendida por Aristóteles como a expressão das qualidades sensíveis do corpo, inscritas na essência do mesmo e, por conseguinte, responsáveis pelo seu movimento em direção à ordem natural, para a esfera do fortuito. Ou seja, retira-se da física os componentes que poderiam fornecer subsídios para interpretações fortemente qualitativas do movimento — que se concentram em cada um dos aspectos particulares da composição do corpo —, tornando-a mais modesta. Essa deflação das variáveis responsáveis pela compreensão do movimento dos objetos da física pode ser finalmente comparada —, mas não identificada — à simplicidade com a qual os geômetras definem o movimento das figuras geométricas no espaço, que se restringe à variação de suas posições. Descartes procede, então, à analogia entre o movimento na geometria e o movimento dos objetos físicos no intuito de sublinhar a simplicidade desse último: Mas, ao contrário, a natureza do movimento da qual eu penso aqui falar é tão fácil de ser conhecida que os geômetras mesmo que, entre todos os homens são aqueles que são mais cultivados para bem distinguir as coisas que eles tomam como objeto, têm julgado essa sorte de movimento mais simples e mais inteligível que aqueles de suas superfícies e de suas linhas; assim eles parecem ter explicado a linha pelo movimento do ponto e a superfície por aquele da linha (AT, XI, p. 39).8
396
Érico Andrade M. de Oliveira
Muitos intérpretes vêem nessa analogia da natureza do movimento na física com o movimento do ponto geométrico no espaço euclidiano como a descrição de uma identidade entre física e geometria. Entretanto, essa passagem revela duas concepções de movimento distintas cuja comparação longe de visar uma subsunção de uma pela outra, pretende enfatizar a simplicidade do movimento descrito pelos corpos físicos, mostrando que a despeito de sua subordinação a um maior número de variáveis, ele pode ser mais facilmente compreendido que o realizado pelos corpos geométricos. Assim, ainda que Descartes não desenvolva precisamente em que sentido o movimento dos corpos é mais fácil de ser compreendido que aqueles dos geômetras, parece-nos lícito perceber que a referida analogia assenta-se na identidade que ambos os movimentos guardam no que tange a definição do movimento em função do deslocamento dos corpos no espaço. O que nos permite concluir que assim como os geômetras, que definem o movimento dos seus objetos em função do seu deslocamento no espaço, os físicos devem ater-se apenas ao deslocamento dos corpos no que concerne à definição do movimento. Contudo, ao contrário do movimento do corpo no espaço geométrico, que pode ser descrito sem levar em consideração a força, o movimento no espaço físico não pode desconsiderar esse fator. Por isso, os parágrafos que sucedem a analogia entre o movimento dos corpos geométricos e o movimento dos corpos físicos remetem-se à relação das leis da natureza — que traçam a topografia da força — com a determinação do estado da matéria ou da disposição dos corpos físicos no mundo (cf. AT, XI, p. 40).9 Na ordem argumentativa cartesiana primeiro é necessário se desfazer das qualitates reales que protagonizavam a subordinação da compreensão do movimento à estrutura interna de cada objeto. Uma vez deflacionado o número de variáveis que concorria para a compreensão do movimento, a argumentação cartesiana se dirige para as leis da natureza que regem o comportamento dos corpos em função apenas da força que eles exercem um sobre os outros, quando colidem. Assim, para extraviar qualquer possibilidade de um estudo geométrico do movimento Descartes enuncia a analogia supracitada no mesmo contexto em que são introduzidas as leis da natureza, relativas ao comportamento dos corpos submetidos à ação de forças, deixando claro que a compreensão do movimento está subordinada à compreensão das leis que regem a ação das forças sobre o corpo. A arquitetura do texto consolida-se numa oposição irrestrita entre as concepções do movimento dos filósofos (compreensão aristotélica) e o movimento introduzido no Mundo enquanto modelo de simplicidade — econômico face à enorme quantidade de variáveis que concorriam para a sua realização no universo aristotélico. A simplicidade que Descartes reivindica, por analogia com a geometria, do movimento dos corpos físicos tem sua raiz no estabelecimento de leis claras que regem todos os corpos físicos — sem se restringir a certas regiões do universo — no que diz respeito às forças desprendidas numa colisão. Para a compreensão do movimento no Mundo não se pode abster-se da força, pois
Nota sobre o conceito de movimento no Le Monde e nos Principes de la Philosophie
397
considerando que a estrutura do universo não comporta o vazio, o deslocamento dos corpos implica sempre choques e, consequentemente, a ação de forças. A descrição geométrica do movimento, que poderia aproximar a definição cartesiana do movimento da cinemática, é negligenciada por sua improficuidade no tocante ao estudo do comportamento dos corpos. Descrever a trajetória dos corpos é pouco. Sem as leis da natureza — que envolvem princípios próximos à dinâmica — a própria trajetória dos corpos torna-se incompreensível. Do Mundo, é possível inferir apenas que quando se pretende compreender o movimento dos corpos sem as leis da natureza — as quais regem a relação de força entre os corpos em movimento — incorre-se na assimilação de uma física desenraizada do real — refugiada no âmbito da imaginação — porque debitária do falso pressuposto da existência de corpos imunes à ação de uma força.10 Por isso, a analogia do movimento dos corpos geométricos com o dos corpos físicos deveria ser interpretada como uma descrição antitética do movimento da física cartesiana face ao movimento dos filósofos. A antítese assenta-se na certeza de que se deve reduzir as diversas formas de se definir o movimento ao simples deslocamento dos corpos, ocasionados pela colisão entre eles e regido pelas leis da natureza. A definição do movimento do Mundo esvazia a matéria de todas as suas qualidades menos para compreendê-la sob um prisma cinemático, enquanto um ponto material, que para instituir como únicos elementos no estudo do comportamento dos corpos: a grandeza e o movimento. Em outras palavras, a física cartesiana afasta-se da cinemática, em diferentes aspectos: desprezo pelo tempo como variável significativa para a determinação da variação da posição do objeto, assim como pela aceleração do objeto em movimento, dada pela relação entre velocidade e tempo. No entanto, poder-se-ia tomar as referidas lacunas na física cartesiana do ponto de vista acidental (falta de precisão conceptual, desconhecimento de certas propriedades da matéria etc.) que dificultariam a instauração da cinemática; caso não se atentasse para o inegável uso do movimento como o epicentro da formação do modelo dos turbilhões e, conseqüentemente, da explicação da disposição dos objetos no mundo em função da força que um corpo exerce sobre outro (cf. AT, XI, p. 43). Voltaremos a esse tema nas secções subseqüentes desse artigo, apresentando a convergência das definições do movimento no Mundo e nos Princípios em função da constituição do modelo dos turbilhões.
3. Definição do movimento nos Princípios: dualidade e conciliação Parece inequívoco que a definição do movimento dos Princípios se não é estabelecida em função da conciliação do movimento da Terra com as doutrinas do Santo Ofício, é fortemente irênica em relação à doutrina da Igreja, pois, do contrário, a referida obra não teria sido publicada. Mas, como sugeríamos na introdução do presente artigo, não nos ocuparemos dessa discussão. De sorte que as ponderações e precauções cartesianas frente ao Santo Ofício, que eventualmente tenham lhe impulsionado
398
Érico Andrade M. de Oliveira
a operar uma certa mudança na sua concepção do movimento, não serão objeto de nossa análise. Se o movimento é definido no Mundo em função do deslocamento do corpo no espaço, o que inevitavelmente desembocaria no heliocentrismo dada a mudança da posição da Terra em relação ao Sol, nos Princípios ele é definido em função do deslocamento do corpo em relação aos outros corpos que lhe circundam sob a alegação que tal definição aproxima-se de forma mais consistente do real. Conforme podemos ler no seguinte parágrafo: . . . o transporte de uma parte da matéria, ou de um corpo, daqueles corpos vizinhos que lhe tocam e que nós os consideramos em repouso, para a vizinhança de outros11 .
As dificuldades desta definição começam pelo termo transporte cujo emprego pode sugerir uma referência ao termo aristotélico translatio conforme o qual Aristóteles descreveu um dos movimentos mais relevante para a física: o deslocamento (cf. Aristóteles, Physique, 243a39, 260a20–261a26, 265b17–266a5). No entanto, as semelhanças que podem trazer a análise etimológica do termo transporte parecem ser diluídas quando se leva em consideração o termo no contexto da definição proposta por Descartes. O termo transporte não denota na passagem citada apenas o deslocamento, visto que os objetos podem eventualmente se deslocar face a um referencial fixo sem que eles se desloquem em relação aos corpos que lhe são contíguos. Descartes pretende com o termo transporte arrolar uma definição inédita do movimento cuja novidade estaria ligada à relação do movimento com a disposição dos corpos face aos outros corpos que lhe são contíguos. Assim, se um determinado corpo passa a ter outros corpos como vizinhos, isso indica que ele foi transportado ou transladado, a despeito dele mudar ou não de posição face a um referencial fixo, arbitrariamente escolhido. O movimento seria uma espécie de indicação de uma separação entra as partes de um corpo. Elas se deslocariam umas em relação às outras. As dificuldades de se definir o movimento em termos de transporte proliferam-se em diferentes dimensões o que parece ter impelido Descartes a tecer alguns esclarecimentos a respeito de sua própria definição. Essa translação revelaria ainda, argumenta ele, que o movimento está sempre no corpo em movimento (. . . le mouvement est toujours dans le mobile. Pr. II, Art. 25, AT, IX, p. 76). Esse apêndice ou acréscimo da definição de movimento a torna paradoxalmente mais obscura, pois ela sugere que o movimento está no corpo, quando sabemos que na física cartesiana o corpo está desprovido de qualquer qualidade inerente à sua estrutura ontológica que lhe impulsione ao deslocamento ou ao repouso. A matéria para Descartes é inerte. Em razão dessa dificuldade sugeríamos a leitura do parágrafo 28, no qual se apresenta, de certa forma, o propósito da definição do movimento, na medida em que Descartes aponta a quê ela se opõe: Eu tenho acrescentado ainda que o transporte do corpo se faz da vizinhança daqueles que ele toca, para a outra vizinhança e não de um lugar a outro porque o lugar pode ser tomado em várias formas que dependem do nosso pensamento
Nota sobre o conceito de movimento no Le Monde e nos Principes de la Philosophie
399
como eu tinha observado acima. Mas quando nos tomamos o movimento pelo transporte de um corpo que deixa a vizinhança daqueles que lhe tocam, é certo que nós não saberemos atribuir a um corpo mais de um movimento, por causa que há apenas um certa quantidade de corpos que o podem tocar ao mesmo tempo. (Pr. II, art. 28. AT, IX-2, p. 78)12
As várias acepções do lugar podem obscurecer o conceito de movimento apresentado nesta passagem, visto que esse termo pode denotar, entre outras coisas, a posição no espaço de um dado objeto, sugerindo, por conseguinte, que o transporte seria a variação da posição de um objeto no espaço face a um referencial fixo, arbitrariamente escolhido. No intuito de usarmos o conceito de lugar como uma ferramenta à compreensão do conceito de movimento convém traçarmos algumas considerações sobre sua definição, dada a ambigüidade que ela porta, pois embora o lugar designe sempre o espaço, ele pode, por meio da razão — distinctio rationis — ser concebido distintamente do espaço, segunda a noção de posição. A dupla designação do termo lugar é traçada no parágrafo 14 da segunda parte dos Princípios no qual esse termo pode designar, por um lado, a posição de uma coisa face às outras, e, por outro, a grandeza e a figura que um determinado corpo ocupa no espaço (Pr. II, Art. 14, AT, IX, p. 70). O duplo significado dessa palavra corresponde a dupla maneira do pensamento considerar uma coisa face às outras no espaço físico. Contudo, a definição do movimento não pode pautar-se nessa duplicidade do significado do termo lugar,13 condicionada a uma distiction ractionis, sob preço de assimilar a divergência teórica do emprego deste termo como uma impossibilidade a priori de se conceber a univocidade entre os fatos do mundo e uma única descrição científica das implicações conceptuais do conceito de movimento.14 A compreensão espacial do lugar pode sugerir que movimento é apenas o deslocamento espacial de um objeto, subordinando a identificação do movimento à relatividade do referencial em função do qual um corpo se desloca. Com efeito, o movimento relativo não permite uma decisão quanto ao deslocamento do objeto que permanece subordinado à posição do observador. A compreensão relativa do movimento transcreve, desse modo, um empecilho ao objetivo cartesiano, radicalizado nos Princípios, de compreender o movimento em sua abordagem, diríamos, dinâmica conforme a qual se leva em consideração a causa — individual porque circunscrita apenas à colisão entre objetos — que impulsiona um dado corpo a se deslocar em relação aos outros que lhe são contíguos. Nessa perspectiva, a abordagem cartesiana afasta-se da compreensão do lugar como posição no espaço — próxima à definição da geometria — para compreendê-lo enquanto figura e grandeza que um corpo ocupa no espaço. Elimina-se a ineficiência da definição do Mundo (mais próxima de uma definição geométrica porque inscrita na variação da posição do corpo) em fornecer uma descrição absoluta do movimento, instituindo o lugar como a congruência entre o corpo e o espaço que são indissociáveis e apontam para instituição do movimento enquanto mudança do lugar em que um corpo encontrava-se face aos seus vizinhos.
400
Érico Andrade M. de Oliveira
Nessa perspectiva, o lugar deve expressar nos Princípios menos uma posição no espaço que a situação de um objeto face aos outros que lhe são contíguos, pois caso ele representasse uma posição, poder-se-ia atribuir a um objeto, que está em repouso em relação aos outros objetos que estão adjacentes à sua superfície, um movimento: dado sua mudança de posição face a um determinado referencial fixo. Ou ainda, poder-se-ia atribuir, num sentido inverso, o repouso, como nos mostra o exemplo do barco na segunda parte dos Princípios (cf. Pr. II, art. 15, AT, IX, p. 71), a um objeto — considerando que ele mantém a mesma posição relativa face à um determinado referencial, por exemplo a margem — quando esse objeto está efetivamente se deslocando — efetuando uma translação — faces aos objetos que lhe são vizinhos, o rio. Por conseguinte, deve-se observar que o objeto pode participar de vários movimentos quando se considera sua posição espacial, porém ele se move apenas quando há uma força atuando sobre ele que lhe impulsiona a se movimentar face aos outros que lhe são contíguos. Podemos constatar as conseqüências dessa nova compreensão do movimento nos Princípios revela um caráter irênico em relação ao heliocentrismo. A Terra é arrastada pelos turbilhões, como um viajante arrastado pelo barco, sem que ela se mova em relação às partes que lhe são contíguas (Pr. III, art. 28, AT, IX, p. 113–4), assim como o viajante não se move em relação ao barco (Pr. III, art. 29, AT, IX, p. 115). A definição dos Princípios permite esclarecer a ambigüidade de considerar a Terra em movimento em relação às estrelas fixas, mas em repouso face aos turbilhões (concepção vulgar: Pr. III, art. 30, AT, IX, p. 115–6) na medida em que ela dissolve a analogia com a geometria, através da qual se enfatizava que a variação do lugar — posição — do objeto no espaço implicava o movimento, para acentuar que o movimento é a translação de um corpo em relação àqueles que lhes são contíguos. Como a Terra não se desloca em relação às partes do turbilhão que lhe envolvem; ainda que ela se desloque em relação aos outros planetas e ao sol, ela não se move no sentido radical do termo, isto é, no sentido absoluto do movimento. Assim, o deslocamento do objeto, relativo a um referencial previamente estabelecido, não indica que ele esteja em movimento, pois apenas quando ele é submetido à uma colisão que lhe desloca face aos outros corpos aos quais ele era contíguo é que se pode asseverar o seu movimento. Descartes institui nos Princípios um referencial efetivamente fixo para se identificar o movimento: os corpos contíguos aqueles que se transladam ou se transportam. Resta saber se essa nova forma de se definir o movimento implica uma mudança na física cartesiana, aproximando-o da dinâmica e distanciando-a da física apresentada no Mundo.
4. O movimento no Mundo e nos Princípios: algumas aproximações a partir do corolário da inexistência do vazio Ainda que as definições do movimento propostas por Descartes nos Princípios e no Mundo pressuponham que haja, de fato, um deslocamento espacial em relação a um
Nota sobre o conceito de movimento no Le Monde e nos Principes de la Philosophie
401
referencial fixo — sejam os corpos vizinhos, onde o referencial são os próprios corpos contíguos, seja um referencial fixo arbitrário — a definição dos Princípios passa a privilegiar a separação de um objeto face aos outros que lhe são contíguos como o referencial em função do qual se pode fornecer a definição mais precisa do movimento ou nas palavras de Descartes absoluta. Entretanto, essa forma diversa de identificar o movimento nas referidas obras não indica necessariamente a constituição de uma física igualmente diversa. A divergência de referencial num universo pleno de matéria não altera o modelo científico cartesiano, sobretudo, porque pesa sobre a física cartesiana uma necessidade irrestrita de conciliar o universo fluído com o movimento dos turbilhões para cuja constituição concorre uma mesma compreensão do movimento, tomado, por um lado, enquanto medida da variação e disposição da matéria, por outro, como imagem do deslocamento circular da matéria contida nos turbilhões. Nesse sentido, teceremos na presente secção algumas linhas sobre a relação do corolário da inexistência do vazio com a coextensão das definições do movimento dos Princípios e do Mundo. A inexistência do vazio — corolário, diríamos, do postulado do universo indefinidamente extenso, estabelecido no Mundo e nos Princípios (AT, XI, p. 18–20, Pr. II art. 16, AT, IX, p. 71–2) — não permite que os objetos desloquem-se sem promoverem alguma colisão. Por isso, a advertência cartesiana no fim de sua analogia do movimento físico com aqueles descritos pela geometria requer ainda algumas considerações estranhamente obliteradas pelos intérpretes cartesianos. As linhas que encerram a analogia entre os movimentos dos corpos físicos e geométricos sublinham a importância capital do referido corolário. Considerando sua relevância à presente discussão, repetiremos uma citação exposta neste artigo, referente à definição do movimento no Mundo: E quanto a mim eu não conheço nenhum outro que aquele que mais simples de se conceber que as linhas dos geômetras, o qual faz com que os corpos passem de um lugar a outro e ocupam sucessivamente todos os espaços que há entre dois corpos.15
O deslocamento do ponto sobre a linha transcreve um acento sobre o deslocamento do objeto em detrimento do estudo da força propulsora — desconsiderada na descrição cinemática do movimento, mas presente no Mundo — do movimento. Todavia, essa definição do Mundo já destaca, aquilo que será enfatizado à exaustão nos Princípios, que o deslocamento não pode ser compreendido sem considerar que a dinâmica das partículas em movimento prescreve uma sorte de harmonia na qual elas se sucedem sem deixarem o mínimo espaço entre elas. Por isso, a preocupação de Descartes em acentuar que o deslocamento não acontece no vazio — como subscreve e pressupõe a cinemática — mas no espaço plenamente preenchido por uma quantidade indefinida de partículas. Devido à inexistência do vazio, as partículas são sempre constrangidas por outras partículas a desviarem suas rotas e descrevem invariavelmente um movimento
402
Érico Andrade M. de Oliveira
circular ou curvilíneo. A associação da circunferência ao movimento das partes da matéria indica-nos um elo irreversível que prolonga as questões tratadas no Mundo para além de suas fronteiras. Nos Princípios o movimento das partes da matéria é invariavelmente circular. Vejamos em paralelo as seguintes passagens do Mundo e dos Princípios: Teria dificuldade em responder essa questão, caso houvesse reconhecido, através de diversas experiências, que todos os movimentos que são realizados no Mundo são de algum modo circulares, isto é; quando um corpo deixa seu lugar, ele entra sempre no lugar de um outro e esse outro num naquele lugar referente a um outro e assim se procede até o último, que ocupa o lugar deixado pelo primeiro corpo. (AT, XI, p. 19)16 . . . devemos concluir que haja sempre um círculo na forma de um anel de corpos que se movem juntos num mesmo tempo de modo que quando um corpo deixa seu lugar há outro que lhe substitui (. . . ) e assim se segue até o último que ocupa o instantaneamente o lugar deixado pelo primeiro corpo.17
Diante de um universo pleno de matéria, compactada em indefiníveis partes, as físicas produzidas no Mundo e nos Princípios adotam o movimento circular como a expressão mais fiel à dinâmica e disposição dos corpos constantemente submetidos a choques. Por conseguinte, a analogia do movimento dos físicos com o da geometria, introduzida no Mundo, permanece ainda pertinente caso se leve em consideração que a linha é composta de infinitos pontos, uns sucedendo aos outros, sem que haja intervalos entre eles: as partículas são ligadas umas às outras, de sorte que não há intervalos entre elas. Ademais, com o condicionamento do movimento à trajetória circular ou curvilínea a física cartesiana extravia a necessidade de um estudo do movimento no que concerne à sua trajetória e direção. Não é possível determinar a priori a trajetória e direção dos corpos submetidos a uma quantidade indefinida de colisões que podem ocorrer de diversos modos. A física cartesiana põe-se num caminho diametralmente oposto à cinemática na medida em que considera o movimento apenas no que revela da mecânica das partículas que compõem a matéria e, consequentemente, os fenômenos naturais; relegando o estudo do movimento — enquanto análise a priori da trajetória e direção dos corpos — a um plano imaginativo, distante do real e, portanto, desnecessário por não se adequar a priori a um universo pleno de matéria. Procedendo sempre dos efeitos para as causas, a física cartesiana não pode compreender o movimento senão como um elemento capaz de mensurar os impactos responsáveis pela atual constituição e disposição da matéria. No entanto, o deslocamento espacial não pode ser considerado alicerce seguro para se identificar o movimento de um corpo, pois ainda que o movimento seja um estado puramente contingente do corpo, a sua descrição deve determinar de maneira unívoca e absoluta se um objeto está em movimento ou não.18 Por isso, Descartes parece abandonar a analogia com o movimento dos geômetras — permitida na definição do Mundo, mas que perde em certa medida sua relevância, sendo imputada
Nota sobre o conceito de movimento no Le Monde e nos Principes de la Philosophie
403
como ambígua nos Princípios — no que concerne à possibilidade de se determinar a mobilidade de um corpo a partir do seu deslocamento espacial. Entretanto, a analogia perde seu sentido apenas em parte, pois nos Princípios Descartes retomou, como vimos na última citação, o exemplo do círculo para ratificar a impossibilidade do vazio na estrutura do universo. Nesse sentido, a passagem dos Princípios, acima citada, coaduna-se perfeitamente com a definição “geométrica” proposta no Mundo, pois o movimento continua sendo um deslocamento circular de partículas só que nos Princípios o referencial fixo é determinado independente do contexto, referindo-se às partes que se separam no movimento circular. Assim, ainda que nos Princípios haja um referencial absoluto para a definição do movimento: as partículas que são contíguas ao corpo em translação, a definição do Mundo indica igualmente uma congruência entre lugar e objeto — impassível de deixar espaços vazios — que desemboca na compreensão circular do movimento, por meio da qual é possível mostrar que as partículas sucedem umas às outras indefinidamente. Segue-se da ausência do vazio, uma inquietação de Descartes a propósito da mensuração das colisões entre os objetos à proporção que se elimina qualquer pretensão de um estudo cinemático do movimento. Assim, as explicações subseqüentes à inexistência do vazio valorizarão uma compreensão do movimento como unidade de medida dos impactos, aos quais os corpos estão submetidos. Teceremos agora alguns comentários de como a postulação da matéria sutil, em oposição à existência do vazio, arrola uma concepção do movimento como unidade de medida da colisão entre os corpos.
5. Da impossibilidade do vazio à matéria sutil: o movimento como unidade de medida Descartes recorre a partículas imperceptíveis — matéria sutil, contíguas a todos os corpos — no intuito de dissuadir qualquer aspiração de se tomar o vazio como variável relevante para a compreensão da mecânica do universo, uma vez que mesmo diminutas, essas partículas guardam uma certa extensão e compõe todas as “frestas” dos fragmentos da matéria. Ele as postula do seguinte modo: . . . melhor, a fim de não ser constrangido a admitir algum vazio na natureza eu não lhes atribuo (matéria sutil) partes que não tenham nenhuma grandeza nem figuras determinadas.19 Essa matéria sutil aponta para um universo fluído que se constitui em virtude da interação dinâmica de inúmeras partes da res extensa. Essas partes se submetem a diferentes choques, inscritos nos diversos turbilhões que envolvem os corpos. Para mensurar e descrever o comportamento dos turbilhões e dos corpos neles imersos, o Mundo e os Princípios instituem essencialmente as mesmas variáveis: movimento, grandeza, figura20 . Leiamos as seguintes passagens do Mundo e dos Princípios:
404
Érico Andrade M. de Oliveira
. . . para explicar esses elementos [que compõe a natureza], eu não me sirvo das qualidades que se chamam calor, frio, umidade e secura, assim como o fazem os filósofos (. . . ) e que se eu não em engano não apenas essas qualidades, mas todas as outras, e mesmo as formas inanimadas podem ser explicadas, sem que seja necessário supor para tal feito nenhuma outra coisa na sua matéria, que o movimento, a grandeza, a figura e a disposição de suas partes. (Mundo AT, XI, p. 25–6) . . . eu acrescento que não conheço outra matéria nas coisas corporais senão que elas podem ser divididas, possuem figura e se movem de diferentes modos . . . (Pr. II, AT, IX, p. 102)21
Subtrai-se da matéria uma parcela significativa dos diversos modos de se concebê-la, decompondo-a em diferentes extratos de extensão cuja análise remete-se à sua grandeza, figura e movimento. A redução das variáveis no estudo da natureza, operada nas passagens citadas, abre margem, desse modo, à reconstituição da física que se esmeira na simplificação do seu objeto. Em outras palavras, a física torna irrelevante eventuais qualidades perceptíveis da matéria para lhe aprisionar num quadro conceptual por demais restrito que otimiza as variáveis responsáveis pela explicação dos fenômenos naturais, centrando-se basicamente na grandeza, figura e movimento das partes do universo. Subseqüente a essa restrição no escopo do estudo da física, nós temos a indicação dos turbilhões como a expressão mecânica do universo. A seguinte figura está presente nas duas obras como uma espécie de topografia do universo:
Nota sobre o conceito de movimento no Le Monde e nos Principes de la Philosophie
405
Da figura do Mundo para aquela dos Princípios apenas se varia a notação relativa aos astros envoltos no turbilhão de sorte que ambas as figuras prescrevem os turbilhões — que correspondem na figura acima as regiões compostas pelos centros D, S, L, V, E, N — como um aglomerado difuso de matéria no qual o movimento das partes determina a constituição e forma (figura) dos fenômenos.22 Graças à agitation (movimento) das partículas que se entrechocam incessantemente, devido à estrutura ontológica do universo, que não comporta o vazio, operase, segundo Descartes, a constituição da diversidade empírica do real. Essa diversidade empírica seria uma conseqüência direta dos resultados dos impactos, aos quais os corpos estão submetidos quando inseridos nos turbilhões (AT, IX, p. 75 e p. 128– 31). A medida desses impactos é dada pela intensidade do movimento que se institui, junto com a grandeza dos corpos, enquanto variável que determina o comportamento da matéria e, por conseguinte, da disposição e organização dos elementos que compõe os diferentes fenômenos no universo (cf. AT, IX, p. 126–7, p. 156–7, p. 177–8 etc.). Desse modo, a diversidade de fenômenos que existem na natureza é modelada em função do movimento dos fragmentos da matéria, inseridos nos turbilhões. Descartes encontra no movimento uma unidade de medida capaz de codificar a os fenômenos do universo em conformidade com a variação dinâmica, a qual estão submetidos os fragmentos da extensão. Ele não se ocupa do movimento enquanto um objeto de estudo cujo campo de análise comportaria uma descrição geométrica ou uma descrição cinemática da variação temporal e espacial de um corpo em deslocamento. Em outras palavras, não se é autorizado a tomar o Mundo, nem muito menos os Princípios, como o expoente de uma cinemática incipiente, visto que a compreensão do movimento na física cartesiana — seja na versão proposta pelos Princípios, seja por aquela ventilada no Mundo — é indissociada da ação das forças que o produzem; por compreender que nenhum corpo do universo está isento da ação de uma força.
6. Conclusão Por fim, o deslocamento espacial de um corpo, conforme fora estabelecido por Descartes no Mundo, tem um duplo pressuposto: primeiro que haja choques visto que os corpos estão imersos num espaço plenamente repleto de outros corpos. Segundo, que não há intervalo entre os corpos, mesmo no momento em que eles são submetidos a um forte impacto, dada a inexistência do vazio; o que implica — tanto no Mundo quanto nos Princípios — a assimilação irrestrita do movimento circular. A presença desses dois pressupostos escamoteia uma explicação cinemática do movimento por achá-la pouco produtiva para apreender a dinâmica dos corpos, uma vez que na cinemática o estudo da variação espacial dos corpos pressupõe a existência do vazio, no mínimo hipoteticamente, ao passo que a compreensão do movimento cartesiana critaliza-se sob a rejeição absoluta do vazio. Portanto, poderíamos dizer, então, que as definições do Mundo e dos Princípios
406
Érico Andrade M. de Oliveira
são semanticamente diferentes porque designam distintos modos de se identificar o movimento de um corpo, entretanto, elas são coextensas, pois abrangem objetos comuns: uma unidade de determinação da intensidade da variação dinâmica da matéria — força — em função da qual se explica à própria mecânica do universo. Além de apontarem para o movimento invariavelmente circular das partículas que compõem o universo.
Bibliografia Adam, C. e Tannery (eds.) 1986. Œuvres de Descartes. 12v. 2. ed. Paris: Ed. Vrin. Andrade M. de Oliveira, É. 2006. A função da hipótese e da experiência na constituição da certeza científica de Descartes. Cadernos de História e Filosofia da Ciência 16(2): 259–80. —–. 2006. Le Rôle de la Méthode dans la Constitution de la physique cartésienne. Paris: Sorbonne. Aristote. 2002. Physique. Ed. P. Pellegrin. 2éd. Paris: Flammarion. Beyssade, J.-M. (ed.) 1981. L’Entretien avec Burman. Paris: PUF. Descartes, R. 2008. O Mundo ou Tratado da Luz. Trad. Érico Andrade. São Paulo: Hedra. Eustache, S. 1609. Summa Philosophiae. Paris. Garber, D. 2004. Corps Cartésiens. Paris: PUF. —–. 1999. La Physique Métaphysique de Descartes. Paris: PUF. Gaukroger, S. 2002 emphDescartes’s system of natural philosophy. Cambridge: Cambridge University Press. Gueroult, M. 1970. Études sur Descartes, Spinoza, Malebranche et Leibinz. Hildesheim: Georg Olms. Harrison, P. 2000. The influence of Cartesian cosmology in England. London: Routledge. Koyré, A. 1966. Études Galiléennes. Paris: Hermann.
Notas 1 Descartes escreve a Mersenne essa intenção: . . . et je dirai, entre nous, que je commence à en faire un
Abegé, où je métai tout le cours par ordre, pour le faire imprimer avec un Abrégé de la philosophie de L’École (Mersenne 12/1640, AT, III, p. 259). Todas as referências das obras de Descartes serão atualizadas quanto à tipografia e posta segundo as inicias dos editores : AT, volume e página. As traduções para o português são nossas. 2 Descartes escreve em cartas a Mersenne que pretende voltar sua análise a certos manuais de filosofia contemporâneos aos anos de 1610-1640. Ele já houvera consultado os de Conimbre, Toletus e Rubiusa, mas pede a Mersenne algum de Charteux e Feuillant, cf. Mersenne AT, III, p. 185 e sobre Abra de Raconis. Cf. AT, III, p. 234. Embora tenha pedido o concelho de Mersenne a respeito desses manuais, Descartes não aparentava ter muita paciência para dedicar-se a eles. Ele dedica-se apenas ao de S; Eustache que lhe desperta uma certa admiração, cf. Mersenne 11/11/1640, AT, III, p. 232 e 03/12/1640 AT, III, p. 251. Entretanto, a diferença dos Princípios para a Summa Philosophiae é considerável. Na Summa termina pela metafísica, ao passo que os Princípios começa por ela. Além disso, a lógica, que marca o começo da Summa, não faz parte dos Princípios. A ética também é ausente nos Princípios, ao passo que é trabalhada na Summa. Enfim, na Summa há uma parte relevante dedica à discussão do método o que não é realizada nos Princípios. Eustache S. Summa Philosophiae Paris, 1609, sobre o método, particularmente; p. 185–92.
Nota sobre o conceito de movimento no Le Monde e nos Principes de la Philosophie
407
3 Um outro fator histórico importante para composição dos Princípios é relativo ao desejo cartesiano
de divulgar os principais resultados de sua filosofia para o grande público. Ele confidencia seu desejo a Mersenne: je dirai, ente nous, que je commence à faire un Abragé, où je mettrai tout le cours par ordre, pour le faire imprimer avec Abragée de la philosophie de L’Ecole (Mersenne 12/1640, AT, III, p. 529). Esse desejo implica uma dupla adequação do método cartesiano: por um lado, o método de exposição dos resultados deverá, como se fazia nas Abragée Ecoles, apresentar a opinião dos adversários e criticá-las. Por outro lado, todos os argumentos devem ser pautados na experiência. Além disso, deve-se adequar o vocabulário ao público leitor, o que fará com que essa obra, mais que qualquer outra, seja plena de vocábulos escolásticos. Ainda sobre o caráter de diríamos divulgação científica da referida obra: . . . j’ai resolu d’employer à écrir ma Philosophie en tel ordre qu’elle puisse aisément être enseignée. Carta a Mersenne 31/12/1640, AT, III, p. 276. Descartes não se mostra constrangido em chamar seu Princípios de sua summa philosophiae, Cf. carta a Huygens 31/01/1642, AT, II, p. 523. 4 São diversos os momentos em que Descartes defere uma crítica ao modo de proceder escolástico naquilo que revela da apresentação de uma obra. No Mundo, por exemplo, Descartes afirma que não vai perdre le temps à disputer (AT, XI, p. 5). No Discours as disputas serão condenadas como ineficazes na busca pela verdade: Je n’ai jamais remarqué non plus que, par moyen des disputes qui se pratiquent dans les écoles, on ait découvert une vérité qu’on ignorât auparavant. . . AT, VI, p. 69. No L’Entretien avec Burman, ele diz; Ce qui davrait en tout cas nous avertir que mieux vaut de beuacoup avoir une théologie aussi simples qu’eux (. . . ), que de l’écraser sous la masse des controverses, et par là de la gâter en ouvrant la champ aux dissensions, aux querelles, aux guerres, etc. L’Entretien avec Burman, ed. Jean-Marie Beyssade, Paris, PUF, 1981. 5 Et en effet ces mots : le mouvement est l’acte d’un être en puissance, en tant qu’il est en puissance, ne sont pas clairs, pour être français. AT, XI, p. 39. 6 . . . qu’elle soit cette Matière première des Philosophes qu’on a si bien dépoillée de toutes ses formes et qualités qu’il n’y est bien rien demeure de reste, qui puisse être clairement étendu (AT, XI, p. 33). 7 Les philosophes supposent aussi plusieurs mouvements qu’ils pensent pouvoir être faits sans qu’acun corps change de place, comme ceux qu’ils appellent: Motus ad formam, motus ad calorem, motus ad quantitatem (mouvement à la forme, mouvement à la chaleur, mouvement à la quantité) et milles autres. Et moi je n’en connais aucun [movimento] que celui qui est plus aisé concevoir que les lignes des Géométres, qui fait que les corps passent d’un lieu en un autre et occupent successivement tous les espaces qui sont entre deux. AT, IX, p. 39-40. 8 Mais, au contrai, la nature du mouvement duquel j’entends ici parler est si facile à connaître que les géomètres mêmes qui, entre tous les hommes, se sont le plus étudiés à concevoir bien distinctement les choses qu’ils ont considérées, l’ont jugée plus simple et plus intelligible qu celle de leurs superficies et de leurs ligne; ainsi qu’il paraît en ce qu’ils ont expliqué la ligne par le mouvement d’un point et la superficie par celui d’une ligne (AT, XI, p. 39). 9 Descartes usa diversas vezes o termo força no Mundo e nos Princípios sem fornecer, contudo, uma definição clara e preciso deste conceito. As leis da natureza não variam substancialmente no Mundo e nos Princípios, permanecendo as mesmas. No Mundo elas são descritas do seguinte forma: L (1) Que chaque partie de la matière, en particulier, continue toujours d’être en un même état, pendant que la rencontre des autres ne la contraint point de changer (AT, XI, p. 38). L (2) Je suppose pour seconde Règle: Que, quand un corps en pousse un autre, il ne saurait lui donner aucun mouvement, qu’il n’en perde en même temps autant du sien; ni lui en ôter, que le sien ne s’augmente d’autant (AT, XI, p. 41). L(3): Que lorsqu’un corps se meut, encore que son mouvement se fasse le plus souvent en ligne courbe et qu’il ne s’en puisse jamais faire aucun, qui ne soit en quelque façon circulaire, ainsi qu’il a été dit ci-dessus, toutefois chacune de ses parties en particulier tend toujours à continuer le sien en ligne droite (AT, XI, p. 43–4). 10 A diferença entre os objetos da geometria e os da física que são essencialmente extensos não é traçada por Descartes em nenhuma das duas obras analisadas nesse artigo. Esse problema desemboca naquele relativo à ontologia da força, pois se os objetos são extenso, desprovidos, por conseguinte de massa, como eles podem agir fisicamente sobre os outros corpos? Descartes parece resignar-se apenas em for-
408
Érico Andrade M. de Oliveira
necer algumas raras indicações sobre a ontologia deste conceito. Contudo, ele não pode ser inerente à extensão pelo fato do corpo ser desprovido de qualquer qualidade que não seja geométrica. Esse pressuposto explica porque Descartes não aceitará a força de atração, visto que essa força pressupõe que os corpos têm uma qualidade que não pode ser restringida ao âmbito puramente geométrico. Sobre essa discussão ver: Garber 1999, p. 438–48. 11 . . . le transport d’une partie de la maprolifera-se tière, ou d’un corps, du voisinage de ceux qui le touchent immediatement, et que nous considérons comme en repos, dans le voisinage de quelque autres (Pr. II, art. 25. AT, IX, p. 76). Cf. (Pr. II, art. 28. AT, IX, p. 78). 12 J’ai aussi ajouté que le transport du corps se fait du voisinage de ceux qu’il touche, dans le voisinage de quelque autres, et non pas d’un lieu en autre, parce que le lieu peut être pris en plusieurs façon, qui dépendent de notre pensée, comme il a été remarqué ci-dessus. Mais quand nous prenons le mouvement pour le transport d’un corps qui quitte le voisinage de ceux qu’il touche, il est certain que nous ne saurions attribuer à un même mobile plus d’un mouvement, à cause qu’il n’y a qu’une certaine quantité de corps qui le puissent toucher en même temps (Pr. II, art. 28, AT, IX-2, p. 78). 13 O movimento é único em cada corpo, porém isso não consiste num empecilho à participação de um corpo em vários outros movimentos (Pr. II, art. 31–32, AT, IX, 80–1). 14 Notadamente o argumento central de Garber consiste na afirmação que ao abandonar a definição de movimento do Mundo, Descartes caminha para uma física supostamente mais próxima ao real. Desse modo, haveria uma tentativa cartesiana, segundo Garber, de extenuar a ambigüidade, aderente à definição do movimento relativo, mediante um referencial absoluto que permitiria, por seu turno, uma decisão quanto ao movimento ou repouso de um corpo. (Garber 1999, p. 246–9). Nesse aspecto as definições do Mundo e dos Princípios seriam diferentes, posto seus interesses ontológicos distintos. (Garber 1999, p. 250–1). 15 Et moi je n’en connais aucun que celui qui est plus aisé à concevoir que les lignes des Géomètres, qui fait que les corps passent d’un lieu en autre et ocupent succesivement tous les espaces qui sont entre deux (AT, XI, p. 39–40). 16 Cf. também AT, XI, p. 20, e AT, XI, p. 49. 17 . . . nous devons conclure qu’il faut nécessairement qu’il ait toujours tout un cercle de matière ou anneau de corps qui se meuvent ensemble en même temps; en sorte que, quand un corps quitte sa place à quelqu’autre qui le chasse, il entre en celle d’une autre, et cet autre en celle d’une autre, et ainsi de suite jusqu’au dernier, qui occupe au même instant le lieu laissé par premier (Pr. II, art. 33, AT, IX, p. 81). 18 Essa definição não é estranha ao Mundo que já negara a possibilidade do vazio e postulara a existência de uma quantidade indefinida de micro e macro partículas em todos o espaço. 19 Ou plutôt, afin de n’être pas contraint d’admettre aucun vide en la Nature, je ne lui attribue point de parties qui aient aucune grosseur ni figure déterminé (AT, XI, p. 24, cf. também no Mundo: AT, XI, p. 33–5 e p. 48–50; nos Princípios: AT, IX, p. 83–4). 20 Devemos notar que a grossura desempenha um papel importante tanto no Mundo quanto nos Princípios, embora em nenhuma dessas obras Descartes a defina. 21 . . . pour expliquer ces élémentes (que compõe a natureza), je ne me serve point des qualités qu’on nomme chaleur, froideur, humidité, et sécheresse, ainsi que font les philosophes (. . . ) et que, si je ne me trompe, non seulement ces quatres qualités, mais aussi toutes les autres, et même toutes les formes inanimés peuvent être expliquées, sans qu’il soit besoin de supposer pour cet effet aucune autre chose en leur matière, que le mouvement, la grossuer, la figure, et l’arragement de ses parties (AT, XI, p. 25–6). . . . je ne coinais point d’autre matière des choses que celle qui peut être divisée, figurée et meue e toute sorte de direction . . . (AT, IX, p. 102). 22 Sobre a influência do modelo dos turbilhões cartesianos na física clássica ver: Harrison 2000, p. 168.
A P LENITUDE C UVIERIANA F. F ELIPE DE A. FARIA Universidade Federal de Santa Catarina
felipeafaria@uol.com.br
1. Introdução Ao perquirir a história das idéias, em seu livro A Grande Cadeia do Ser (1936), Arthur Lovejoy destacou o que ele veio a chamar de princípio de plenitude. Investigado desde os escritos de Platão, tal princípio visa responder, entre outras questões, o que determina o número de espécies de seres que formam o mundo sensível e temporal (Lovejoy, 1936 p. 46). Lovejoy propôs usar o termo: Para cobrir, a partir de premissas idênticas às de Platão, um âmbito de inferências mais amplo do que ele mesmo extraiu; isto é, não apenas a tese de que o universo é um plenum formarum no qual o âmbito de diversidade concebível de espécies de coisas vivas é exaustivamente exemplificado, mas também quaisquer outras deduções feitas a partir da suposição de que nenhuma potencialidade de ser genuína pode permanecer incompleta, de que a extensão e abundância da criação devem ser tão grandes quanto à possibilidade de existência e comensuradas com a capacidade produtiva de uma Fonte “perfeita” e inesgotável e de que o mundo é melhor quanto mais coisas contiver” (Lovejoy 1936, p. 52).
Este conceito de completude influenciou o pensamento ocidental combinandose com a concepção de uma continuidade na história natural (Lovejoy 1936, p. 60), que compreendia a distribuição dos seres em uma ordem hierárquica, a qual receberia o nome de scala naturae. Ao longo da história da Biologia tal idéia foi combatida, de forma veemente, por alguns naturalistas, dos quais, Georges Cuvier (1769 - 1832) merece destaque. Em vários de seus trabalhos, mas principalmente em suas obras, Lições de Anatomia Comparada, de 1805 e O Reino Animal, de 1817, que serviram como instrumentos de divulgação de suas idéias defensoras do estabelecimento de um sistema de distribuição dos seres vivos segundo sua organização funcional, Cuvier negava a existência de uma escala de seres formando uma série única. Ele compreendia que os propositores desta escala a definiam da seguinte forma: . . . uma escala de seres que os reúne em uma única série, iniciando-se com o mais perfeito e finalizando com o mais simples, o qual será dotado das propriedades as menos numerosas e as mais comuns, e de tal forma que o espírito passará de um ao outro quase sem distinguir um intervalo e como que por nuances insensíveis [. . . ] e estas nuances suaves e insensíveis são tão observáveis que permanecem sobre as mesmas combinações dos órgãos principais, tanto que as funções principais permanecem as mesmas. (Cuvier 1805, p. 60) Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 409–416.
410
F. Felipe de A. Faria
Entretanto, para aquele naturalista francês do século XIX, não seria esta a situação ocorrente na natureza, pois, como já citado, ele argumentou em suas obras de 1805 e 1817, que: Todos os animais que apresentam tal situação parecem formados sob um plano em comum, que serve de base a todos as pequenas modificações exteriores: mas do momento onde se passa a estes que apresentam outras combinações principais, não há nenhuma semelhança, e não se pode desconhecer o intervalo ou o salto mais destacado. Qualquer arranjo que se dê aos animais, vertebrados ou invertebrados, não se consegue alocar ao fim de uma destas grandes classes, nem ao final de uma outra, dois animais que se assemelhem, para servir de elo entre elas (Cuvier 1805, p. 60).
Cuvier entendia que cada parte do corpo de um ser vivo estaria relacionada, funcionalmente, às outras partes e que esta cooperação funcional orgânica seria a responsável pela harmonia e o vigor do organismo, ambos baseados numa coordenação fisiológica e não em uma mera justaposição geométrica anatômica. Desta maneira qualquer combinação abstrata de órgãos, facilmente concebida pela imaginação de um naturalista, não deveria ocorrer, necessariamente, pois as partes, ao desempenharem ações umas sobre as outras, concorrem a um objetivo em comum, o qual é determinado pela fisiologia do ser. Portanto, aquelas modificações que não podem ocorrer em conjunto são excluídas reciprocamente, enquanto as outras são trazidas à existência. Baseada na fisiologia do ser, esta explicação da ausência de uma plenitude das formas orgânicas foi empregada por Cuvier como argumento da defesa que ele fez da existência de lacunas na notória série zoológica (scala naturae), inclusive considerando os seres desaparecidos1 que estariam representados somente na forma fóssil (Coleman 1964, p. 68). Mas apesar de contrapor-se à idéia da existência de uma scala naturae, Cuvier acreditava em uma relativa plenitude das formas, mas para que tal fenômeno ocorresse alguns pressupostos deveriam ser considerados. Estes pressupostos teriam como base a própria fisiologia do animal, e como tal deveriam obedecer as condições que garantissem a harmonia fisiológica e o vigor do organismo. Esta obediência a tais condições acabaria funcionando como uma forma de constrição para a manifestação de qualquer forma imaginável. Diante desta constatação, e considerando a impossibilidade da aplicação de recursos suplementares como, por exemplo, o matemático, para a ciência da anatomia comparada, Cuvier avançou na compreensão da propriedade constritiva pressuposta, aplicando um princípio filosófico conhecido vulgarmente, na época, como das causas finais e que veio a ser denominado por ele de condições de existência: Como nada pode existir sem que reúna as condições que tornem sua existência possível, as diferentes partes de cada ser devem estar coordenadas de maneira a tornar possível a totalidade do ser, não somente consigo mesmo, mas nas relações que mantém com o entorno [aqui compreendido como o ambiente abiótico
A Plenitude Cuvieriana
411
– (N. A.)], e a análise destas condições conduzem frequentemente às leis gerais como as derivadas do cálculo ou da experiência (Cuvier 1817, p. 7).
Tomando como ponto de partida este pressuposto, Cuvier pôde então, formular os princípios que orientariam a compreensão das relações de coexistência entre as partes de um ser vivo. O primeiro deles foi exposto no Lições de Anatomia Comparada e denominado pelo próprio Cuvier de Correlação das Partes. Em tal obra tal princípio é apresentado no momento em este naturalista discorre sobre a impossibilidade da realização de uma plenitude das formas: Essas combinações, que parecem possíveis, quando consideradas de uma maneira abstrata não existem na natureza, porque, no estado de vida, os órgãos não são simplesmente relacionados, mas agem uns sobre os outros e concorrem a um objetivo em comum. Segundo este fato, as modificações de um deles exercem uma influência sobre todas as outras. Aquelas modificações que não podem existir conjuntamente, excluem-se reciprocamente, enquanto que as outras se incluem, por assim dizer, não somente em uma relação imediata, mas ainda naquelas que parecem a primeira vista as mais distantes e mais independentes (Cuvier 1805, p. 47).
Mais tarde Cuvier aprofunda esta idéia defendendo que: Ao permanecer sempre dentro dos limites que as condições necessárias da existência prescrevem, a natureza é entregue a toda sua fecundidade desde que estas condições não a limitem; e sem afastar-se jamais do pequeno número de combinações possíveis entre as modificações essenciais dos órgãos importantes ela parece divertir-se infinitamente com todas as partes acessórias (Cuvier 1805, p. 59).
E assim, mediante esta graduação da importância das partes, entre essenciais e acessórias, ele estabelece o segundo princípio da anatomia comparada cuvieriana, o da subordinação dos caracteres: Há traços de conformação que excluem outros; há os que, ao contrário, se incluem; por isso, quando conhecemos tal traço em um ser, podemos calcular aqueles outros que coexistem com ele, ou aqueles que são incompatíveis. As partes, as propriedades, ou os traços de conformação que possuem um maior número de tais relações de incompatibilidade ou de coexistência com os outros, ou ainda em outros termos, que exercem sobre o conjunto do ser, a influência mais marcante, são aqueles que chamamos caracteres dominadores, os outros são denominados caracteres subordinados, ocorrendo em diferentes graus. (Cuvier 1817, p. 11)
Desta maneira, pode ser concluído que, os princípios da anatomia comparada cuvierianos além de estabelecerem limites para a ocorrência de uma plenitude das formas, que no caso são fisiológicos, também os dispõem de forma hierárquica, de acordo com sua importância na composição das partes segundo sua função. Outro limite que viria a se impor decorreu da constatação que o próprio Cuvier faria sobre a
412
F. Felipe de A. Faria
ocorrência do fenômeno da extinção e que com a rápida aceitação científica que recebeu, produziu, prontamente, algumas conseqüências. Segundo alguns naturalistas e pensadores dos séculos XVIII e XIX tal limite relacionava-se integralmente, à questão temporal, pois a manifestação de todas as formas possíveis não teria ocorrido de forma simultânea, uma vez que somente para o Universo, em sua total extensão temporal, o princípio de plenitude poderia seria válido (Lovejoy 1936, p. 244). As realizações possíveis estariam dispostas ao longo do tempo e desta maneira algumas delas — desaparecidas (extintas) — já teriam desaparecido ao passo que outras estariam aguardando sua oportunidade de ocorrência. Entretanto, Georges Cuvier acreditava que a situação houvera sido diferente. Para ele o mundo no passado fora ocupado por todas as formas possíveis, respeitadas suas constrições, e com o decorrer do tempo estaria havendo um decréscimo nessa diversidade de organização, devido ao desaparecimento (extinção) de determinados seres, ou como ele percebia: tipos de organização. Assim, partindo do pressuposto, de que as formas orgânicas, em algum momento, atingiram uma plenitude em diversidade, limitada, somente pelas constrições impostas pelos princípios da anatomia comparada, o que passa a requerer uma explicação é o modo e o processo de ocorrência destes fatores limitantes. Explicar de que forma ocorrem tais constrições torna-se, no âmbito do programa científico de Cuvier, um dos importantes objetivos cognitivos, uma vez que surgem como desvios do que Stephen Toulmin denominou de ideal de ordem natural.
2. O Desvio do Ideal de Ordem Natural Apresentado na obra de Toulmin, Foresight and Understanding, publicada no ano de 1961, o ideal de ordem natural procura definir o estado ou o devir das coisas que se considera obvio, necessário, natural e, portanto, compreensível por si só, e deste modo o que rompe ou se desvia desta ordem é o que deve ser explicado (Toulmin 1961, p. 45). O estado que o ideal de ordem natural toulminiano estabelece funciona como um pressuposto, em certo âmbito disciplinar, ao definir “o que ocorre quando nada ocorre”, estabelecendo assim o horizonte de permanência sobre o qual emergem os fatos a serem explicados, que são o desvio deste horizonte (Caponi 2004, p. 13).2 Não obstante, alguns séculos tenham se passado, durantes os quais, no âmbito das ciências biológicas, teorias científicas foram aceitas e refutadas, cada uma das quais com seus pressupostos internos, o advento da Biologia Evolutiva do Desenvolvimento (Evo-devo), vem, de alguma maneira, estabelecendo, aos moldes cuvierianos, a plenitude das formas como um dos seus ideais de ordem natural. E também para a Evo-devo, é exatamente o desvio deste ideal, ou seja, a ausência do pleno, que deve ser explicada, pois o surgimento de inovações evolutivas, neste caso as novidades morfológicas, obedece a limites que a Evo-devo procura esclarecer.
A Plenitude Cuvieriana
413
Há entre os programas científicos cuvieriano e da Biologia Evolutiva do Desenvolvimento, outros pontos coincidentes que também estão relacionados ao arranjo funcional que as partes mantém entre si. Porém neste caso algumas ressalvas devem ser feitas, pois com relação à Evo-devo este arranjo funcional está relacionado aos estádios desenvolvimentais de um organismo e não apenas à sua fisiologia de adulto, a qual era o objeto de estudo de Cuvier. Os princípios da Anatomia Comparada cuvierianos demandam que se despenda uma atenção vigorosa a fatores internos, tais como as interações que ocorrem entre as partes do corpo de um organismo, e também para as decorrentes conseqüências quando da alteração das mesmas. A teoria evolutiva Neo-sintética vem, por sua vez, dar maior atenção às interações ocorridas entre organismos e seu entorno — ou ambiente, entendido aqui como ambiente físico e biótico — atentando pouco às muitas e variadas interações entre as partes internas de um organismo (Arthur 2004, p. 36). A abordagem externalista da teoria sintética neo-darwiniana é claramente voltada a adaptação ao ambiente a qual é frequentemente referida como adaptação ecológica. Por outro lado, a abordagem internalista volta-se à adaptação de uma parte do corpo do organismo à outra e assim, mediante a compreensão da interação entre estas partes durante o processo do desenvolvimento, a Biologia Evolutiva do Desenvolvimento procura explicar, sem descartar o papel da dinâmica genética e principalmente o da Seleção Natural, como se dá a construção da forma orgânica e o próprio fenômeno da evolução (Askonobieta 2005, p. 128). Tais interações, ao ocorrerem, obedecem a uma seqüência de eventos que, por sua vez, em cada ocorrência tem como implicação o estabelecimento de via a ser seguida e, portanto deste ordenamento decorre uma relativa subordinação ao evento anterior. De maneira semelhante ao caso da anatomia comparada cuvieriana, onde surge uma hierarquia imposta pelo princípio da subordinação dos caracteres, há uma graduação em importância entre os estádios do desenvolvimento de um organismo, devida aos efeitos que estes estádios determinam nas etapas subseqüentes daquele processo desenvolvimental. A alteração em um evento preliminar deve determinar a mudança em uma etapa ou em toda uma via do desenvolvimento. No entanto a alteração em estádios mais avançados refletem em alterações menos drásticas para aquele processo, pois um número menor de vias se oferece a partir daquela etapa. (Arthur 2004, p. 133). Como exemplo, Wallace Arthur, um dos promotores da Evo-devo, ao defender suas propostas, menciona, que a alteração em um estádio do desenvolvimento do eixo antero-posterior de um embrião, ocorrente nas primeiras fases deste processo, pode determinar a viabilidade de todo um organismo. Ele complementa esta explanação descrevendo a observação que fez de uma mudança ocorrida em uma etapa posterior do desenvolvimento, tal como a alteração na formação dos dígitos de um vertebrado, que não inviabiliza a fisiologia daquele organismo, mesmo tendo aquela mudança provocada uma característica negativa em termos adaptativos. Um exemplo relacionado à este tipo de circunstância foi pesquisado em 1985 por Pere Alberch e resultou na publicação de um trabalho sobre o processo de forma-
414
F. Felipe de A. Faria
ção do quinto dígito do membro posterior de cães de raças de grande porte. Alberch, utilizando a raça São Bernardo, concluiu que variações dimensionais da morfologia do embrião devem implicar na ocorrência ou ausência deste dígito extra. Assim ele pôde concluir que estas variações funcionariam como constrições desenvolvimentais (developmental constraints) (Alberch 1985, p. 430–1). Segundo Wallace Arthur, a manifestação destes caracteres superficiais, como também é o caso do melanismo, relaciona-se à expressão de um diminuto número de genes ao passo que na expressão de outros caracteres, tais como a conformação de uma estrutura orgânica, que pode determinar a própria viabilidade de um dado organismo, um número muito maior de genes estaria envolvido. Tal diferença quantitativa implicaria desta forma em uma conotação hierárquica entre a ocorrência dos estádios de desenvolvimento determinada por uma alteração na complexidade do aparelhamento genético envolvido (Arthur 2004, p. 143).
3. Condições De Existência Como Constraints Apesar da abordagem evolutiva que as idéias sobre interações orgânicas tem recebido, ao longo da história da Biologia, e neste momento muito em decorrência da discussão provocada pelos defensores da Evo-devo, elas também fazem parte do programa de Cuvier e os princípios que ele formulou, os quais permanecem como fundamento da anatomia comparada até a atualidade, estão de certa forma, analogamente relacionados à base argumentativa dos seus defensores. Assim como o desvio do ideal de ordem natural toulminiano de Cuvier, a Biologia Evolutiva do Desenvolvimento tem também como um de seus objetivos cognitivos o esclarecimento da ausência de uma plenitude das formas no mundo orgânico. Contudo, ao conceber as condições de existência como a constrição (constraint) da plenitude das formas orgânicas, Cuvier tinha em mente apenas o caráter limitante desta, ao passo que a Evo-Devo acrescenta à este conceito o sentido direcionador (drive) que pode conduzir o processo evolutivo. As similaridades entre idéias de naturalistas do século XIX e a Evo-devo, também neste caso, devem ser analisadas, levando-se em consideração a abordagem evolutiva que as mesmas receberam com a aceitação do evolucionismo, desde aqueles tempos. Em seu artigo intitulado “Phylogenic Reconstruction Then and Now”, publicado em 2002, Ron Amundson apresenta evidências, advindas da Genética Molecular, que de certa forma, dão suporte à hipótese da inversão da relação entre a posição do esqueleto e as vísceras, elaborada pelo embriologista comparativo, Etienne Geoffroy de Saint-Hilaire, para defender sua idéia de um tipo comum de organização para os animais. Este colega de Cuvier no Museu de História Natural de Paris utilizou tal conjectura para explicar como ambos os grupos estariam submetidos à um plano comum de composição zoológica. As atuais evidências moleculares desta hipótese estão fundamentadas na existência de uma homologia entre os genes envolvidos na formação do eixo dorso-ventral dos cordados e dos artrópodes, porém com uma polaridade revertida. Estes mesmos genes, de
A Plenitude Cuvieriana
415
acordo com sua homologia, determinam o pólo dorsal em um cordado, assim como, o pólo ventral em um artrópode, determinando, desta maneira, se o animal terá um esqueleto externo ou interno (Amundson 2002, p. 690). Além desta analogia, outras podem ser feitas entre as proposições da Biologia Evolutiva do Desenvolvimento e as idéias de Geoffroy de Saint-Hilaire, e como no caso de Cuvier, devem estar condicionadas à existência de constrições para uma plenitude das formas imaginadas para o mundo orgânico. A morfologia comparada de Geoffroy estabeleceu princípios, que por sua vez, estabeleceram limites para a ocorrência de qualquer tipo de morfologia. Um destes princípios determina que a natureza faça reaparecer os mesmos elementos, em igual número, nas mesmas circunstâncias e com as mesmas conexões (Princípio das Conexões). Por sua vez, o Princípio do Balanceamento dos Órgãos, vem a estabelecer que as partes adjacentes não alcançam deu desenvolvimento habitual, se um órgão empreende um crescimento extraordinário. A aplicação destes princípios se deu na análise dos estágios de desenvolvimento de alguns grupos taxonômicos e serviu para orientar as comparações entre eles, com as quais Geoffroy defendia sua hipótese de uma unidade de plano zoológica (Caponi 2006, p. 40). Aliás, segundo o trabalho desenvolvido por Casper Breuker, Vincent Debat e Christian Klingenberg, publicado em 2006 sob o título de Functional Evo-devo e que discute a modularidade das vias desenvolvimentais, tal idéia alavancou dentro do campo da Evo-devo, a elaboração do conceito de zoótipo. De acordo com o referido trabalho, este vem a ser um hipotético plano básico para todos os animais que apresentam simetria bilateral e age como constrição (nos sentidos de drive e constraint) durante o desenvolvimento do organismo (p. 488). Assim da mesma forma que na Anatomia Comparada de Georges Cuvier a Embriologia Comparada de Geoffroy de Saint-Hilaire, também estabeleceu algumas condições constritivas para uma plenitude das formas. Porém no caso de Geoffroy, o que provavelmente emerge como um destaque é a abordagem embriológica que ele empreendeu, e que portanto relaciona-se mais diretamente aos objetivos cognitivos da Evo-devo. Desvencilhado das teorias evolucionistas que surgiriam posteriormente, Geoffroy é considerado, por parte de defensores da Evo-devo, como Wallace Arthur e Ron Amundson, como um dos precursores destas idéias, mediante o ressurgimento que a sua embriologia comparada experimentou com a crescente aceitação da Evodevo (Arthur 2004 p. 16 e 73). Esta análise dos pontos coincidentes entre as idéias da Anatomia Comparada cuvieriana e as da Evo-devo e praticamente se limitou ao caráter restritivo das constrições, o que deve ser esperado, pois a anatomia e a embriologia comparadas, ao reservarem entre si pressupostos teóricos, também compartilham constrições para a ocorrência de uma plenitude das formas. O caráter direcional que estas constrições, ou neste caso, como melhor poderia ser denominada de coações, possam ter, está pouco relacionado aos princípios que Geoffroy e Cuvier pensaram para suas disciplinas científicas. Entretanto os fatores limitantes que ambos defenderam se fazem
416
F. Felipe de A. Faria
presente na composição dos objetivos cognitivos de avanços teóricos até nossos dias, em várias áreas da Biologia, como por exemplo na Paleontologia, na Anatomia Comparada, na Biologia do Desenvolvimento e como este trabalho propõem, também na Biologia Evolutiva do Desenvolvimento ou Evo-devo.
Referências Bibliográficas Alberch, P. 1985. Developmental Constraints: Why St.Bernards Often Have an Extra Digit and Poodles Never Do. The American Naturalist 126(3): 430-433. Amundson, R. 2002. Phylogenic Reconstruction Then and Now. Biology and Philosophy 17: 679–94. Arthur, W. 2004. Biased Embryos and Evolution. Cambridge: Cambridge University Press. Breuker, C.; Debat, V.; Klingenberg, C. M. 2006. Functional Evo-devo. Trends in Ecology and Evolution 21(9): 487–92. Azkonobieta, T. G. 2005. Evolución, Desarollo y (auto)organización. Un Estudio Sobre los Principios Filosóficos de la Evo-devo. San Sebastián. Tese (Doutorado em Filosofia) — Universidad del Pais Basco. 217p. (Disponível em: http: //www.ehu.es/ias-research/garcia/index_es.html. Acesso em: 25 março 2007. Caponi, G. A. 2004. La Navaja de Darwin. Ludus Vitalis 12(22): 9–38. —–. 2006. El Concepto de Organización en la Polêmica de los Analogos. Revista da Sociedade Brasileira de História da Ciência 4(1): 34–54. Coleman, W. 1964. Georges Cuvier: Zoologist. Cambridge, Harvard University Press. Cuvier, G. 1805. Leçons de Anatomie Comparée. Paris, Baudouin. —–. 1817. Le Règne Animal. Paris, Deterville. Lovejoy, A. O. 1936. The Great Chain of Being. Cambridge: Harvard University Press. Toulmin, S. 1961. Foresight and Understanding. Indianapolis: Indiana University Press.
Notas 1 O Termo “extinção” não aparece no vocabulário cuvieriano. Este naturalista utilizava o termo “desa-
parecido” para se referir àqueles seres que somente ocorriam na forma fóssil. 2 Toulmin utiliza para exemplificar paradigmaticamente este ideal, o princípio newtoniano da inércia, o qual reza que a permanência de um corpo nos estados de repouso ou de movimento retilíneo uniforme é o esperável, o normal, o natural. O que deve ser explicado, portanto, é a saída do referido corpo de qualquer um destes estados. Desta forma a física newtoniana procura uma maneira de explicar e calcular os desvios da inércia, decorrente da ação de forças e princípios adicionais como, por exemplo, a lei de gravitação universal (Toulmin 1961, p. 56).
T RANSCENDÊNCIA C RÍTICA SEM I DEAL “T RANSCENDENTAL”: SOBRE A QUESTÃO DA CRÍTICA , EM
F OUCAULT
R OMMEL L UZ F. B ARBOSA Universidade do Estado do Rio de Janeiro/CAPES
rommel.luz@gmail.com
Em uma entrevista concedida a Paul Rabinow, em maio de 1984, intitulada “Polêmica, política e problematizações”, Michel Foucault dizia que sua abordagem das questões políticas nada tinha a ver com uma forma de crítica que, “sob pretexto de um exame metódico, recusaria todas as soluções possíveis, salvo uma que seria a boa”1 (Foucault 2001, p. 1412). Ele nunca pretendeu conceber uma teoria política ou estabelecer os critérios de uma moralidade política. Em vez disso, buscou pensar como nossas experiências da sexualidade, da loucura e do crime, por exemplo, podem pôr problemas à política. É justamente a esse propósito que surge a questão do critério, de a partir de onde ou em nome de quê se questiona a política, senão em nome de uma lei a qual esta teria que, por alguma razão, se dobrar. O que é “pôr um problema” à política se tal não pode ser entendido como fazer sobre ela a lei? A esse respeito, Foucault lembra uma crítica dirigida a ele por Richard Rorty. Diz Foucault: “Richard Rorty assinalou que, em minhas análises, não faço apelo a nenhum ‘nós’ — a nenhum desses ‘nós’ cujos consenso, valores, tradicionalidade formam o quadro de um pensamento e definem as condições nas quais se pode validá-lo”. E prossegue: “Mas o problema justamente é de saber se efetivamente é no interior de um ‘nós’ que convém se situar para fazerem valer os princípios que se reconhecem e os valores que se aceitam; ou se não é preciso, elaborando as questões, tornar possível a formação futura de um ‘nós”’ (Foucault 2001, p. 1413). É bem conhecido o procedimento crítico kantiano, onde se intenta estabelecer, através de uma investigação de cunho transcendental, os limites para todo pensar e agir humano legítimos. Também se conhece a crítica política operada pelo Contrato Social, de Rousseau. Em ambos os casos, o “empírico”, o real é questionado em nome daquilo ao que ele deve se conformar. Trata-se de um modelo crítico que opõe ser e dever ser, o qual requer que se estabeleça e justifique, previamente ao questionamento da realidade, o dever ser que se lhe contrapõe. É preciso cindir ser e dever ser e situar-se do lado deste para, em seu nome, ajuizar o que é. Crítica judicativa que faz para o real a lei. A recusa em proceder desse modo é o que faz com que Foucault por vezes seja acusado de empreender uma crítica que careceria de critério, uma condenação do real que não se faria em nome de coisa alguma. No limite, Foucault se assemelharia a uma criança caprichosa que se rebela tão somente pelo prazer de se rebelar. Mas seria ingênuo ver as coisas dessa maneira. Ele sabia bem o que lhe era demandado e quais requisições não podia satisfazer, e por que não o podia. Como pretendo fazer ver, ao Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 417–426.
418
Rommel Luz F. Barbosa
menos em parte, trata-se não de um julgamento deficiente, e sim de um outro tipo de crítica. Rorty nota bem a ausência de um quadro de pensamento prévio às análises de Foucault, sua carência de “critério”. Se se encaram suas análises sob o modelo de uma crítica judicativa, realmente causa assombro não encontrar nelas a formulação de princípios segundo os quais o que é analisado deva ser julgado, bem como a devida justificação de tais princípios. Mas isso é o que justamente não se pode achar nos trabalhos de Foucault, e isso porque não se empreende ali uma crítica judicativa, não se pretende, neles, dar a medida segundo a qual o real deva ser medido, a lei segundo a qual ele deva ser julgado. O que ali se pretende é problematizar, não apontar inadequações. Resta então saber em que consiste essa crítica e como ela pode, não tendo um caráter judicativo, não carecer de “critérios”, isto é, de princípios que a orientem. À primeira questão (em que consiste essa crítica) só responderemos, aqui, em parte, na medida em que a abordagem do tipo de princípios que uma crítica como a foucaultiana pode pôr em jogo, que é propriamente nosso ponto, fala a respeito do modo de proceder dessa crítica. A esse respeito, é esclarecedora a distinção que Foucault opera, em uma entrevista de abril de 1983, intitulada “Política e ética”, dessa vez concedida a vários entrevistadores, dentre os quais P. Rabinow, R. Rorty e Charles Taylor, entre princípio regulador e princípio crítico. Ela ajudará a entender como é possível questionar as práticas políticas sem partir de uma concepção política prévia nem pretender a realização de um projeto político definido, ou seja, uma crítica que não seja judicativa nem vise uma “reforma”, mas que ainda assim não perde seu caráter de crítica, isto é, sem deixar de ter por meta uma modificação do real que seja refletida e não arbitrária. Modificação essa que não é uma “reforma do real”, mas a de aspectos específicos da experiência.2 A crítica judicativa, como afirmei, opõe ser e dever ser, e julga aquele em nome deste. Mas que tipo de princípios tal crítica põe em jogo? Pode-se dizer que a crítica judicativa opera com princípios reguladores, se por princípio regulador se entender aquilo em função de que “se deve organizar o fato, nos limites que podem ser definidos pela experiência ou pelo contexto” (Foucault 2001, p. 1409). O princípio regulador serve de medida na lida com o real. Ele pode servir como ideal pelo qual julgar o real, isto é, posso avaliar o quanto este se apresenta em conformidade com aquele e, então, tentar modificá-lo de modo a aproximá-lo de seu ideal. O princípio regulador aparece como o fim daquilo de que ele é a medida e, por conseguinte, anda de par com o projeto de uma reforma do real. Pode-se lembrar a idéia kantiana de autonomia, a qual se presta mesmo a ser vista como o fio condutor pelo qual é possível traçar a história da humanidade de um ponto de vista cosmopolita, isto é, a partir da perspectiva da espécie humana, pois a lei moral se confunde com a própria humanidade no homem.3 Também a idéia de beleza, em Friedrich von Schiller, corresponde à idéia de humanidade e mobiliza um projeto de formação dos homens de modo a alçá-los — ainda que tal intento seja entendido como possível de ser consumado apenas ao nível da espécie — à universalidade da “humanidade”. Se em Kant e Schiller a idéia de que a própria história tende à realização desse projeto busca impedir ações mais
Transcendência crítica sem ideal “transcendental”
419
apressadas para levá-lo a cabo, o mesmo não se deu na Revolução Francesa, onde o rei foi condenado em nome da humanidade: a política teve que se curvar sob a lei ditada por uma moral universal e alheia a considerações “empíricas”. Sobre isso, deve-se conferir o excelente trabalho de Reinhart Koselleck, chamado Crítica e crise, onde se pode ver a gênese política da crítica iluminista a partir da cisão, realizada pelo absolutismo, com outros propósitos, é claro, entre moral e política. Tem-se na transformação desses conceitos as origens mais próximas de nós de uma forma de crítica que cinde ser e dever ser, para julgar aquele em nome deste. O que, como Koselleck faz ver muito bem, um tal procedimento mascara é o caráter político dessa crítica, pois aqueles que falam em nome do universal, por isso mesmo não falam como indivíduos particulares, mas como embaixadores do universal que representam. Falam não eles, mas a “humanidade” neles. Com o mascaramento do político operado nessa forma de crítica, aqueles que a levam a cabo são “inocentados”, uma vez que aquilo em cujo nome falam e agem não pode ser avaliado por parâmetros “desse mundo”, isto é, políticos. A moral, com o iluminismo, se torna o tribunal no qual se julga o real, e o político é sempre culpado diante da moral, pois não pode deixar de se estruturar a partir do real tal qual ele é, e não como deveria ser. A crítica iluminista mascara o político, ela é ação política dissimulada. Que me seja permitido, a título de ilustração, lembrar as eloqüentes palavras de Schiller, na segunda carta de A educação estética do homem. Referindo-se à Revolução Francesa, ele diz: “Uma questão que sempre fora resolvida pelo cego direito do mais forte passa agora, parece, a depender do tribunal da razão pura, e quem quer que seja capaz de colocar-se no centro do todo, elevando seu indivíduo à espécie, poderá considerar-se um jurado nesta corte da razão, pois na qualidade de homem e cidadão do mundo ele é também parte interessada, próxima ou longinqüamente envolvida no resultado. O que se decide neste litígio não é apenas uma causa particular; deve-se julgar, ademais, segundo leis que ele, enquanto espírito racional, tem o direito e a capacidade de ditar” (Schiller 2002, p. 22). Note-se como o exercício do poder soberano, centrado na cisão entre moral e política, onde a liberdade de convicção e crença pessoal (maior ou menor, dependendo do caso) era equilibrada pela restrição de ação (a esfera da ação pública estava sob o domínio absoluto do soberano),4 erigida num esforço de resolução do problema das guerras civis religiosas, é tomado como mero exercício do “direito do mais forte”.5 A autoridade emanada da própria política deixa de ser reconhecida, e passa a ser considerada como emanando exclusivamente da força, uma vez que a única autoridade legítima passa a ser a moral — moral universal reconhecida como a lei da própria humanidade. O que, na estrutura do absolutismo, era o exercício legítimo do poder político, que visava assegurar a paz, se torna mera imposição arbitrária cujo fundamento é tão-só a força.6 É justamente desse procedimento que Foucault busca se afastar em seus trabalhos. Enquanto o princípio regulador diz o que deve ser, o princípio crítico é antes uma idéia crítica que se tem constantemente em vista na análise de algo ou numa prática, mas que não diz de antemão o que deve e o que não deve ser considerado
420
Rommel Luz F. Barbosa
correto ou desejável nessa prática ou no que é analisado. O primeiro é da ordem da lei, o segundo é “uma questão de prudência, de reflexão, de cálculo na maneira pela qual se distribui e se controla seus atos” (Foucault 1988, p. 52). O princípio crítico é um princípio diretor; ele dirige, orienta, não julga propriamente. Na referida entrevista, Foucault pergunta-se o que seria tratar o consenso como um princípio crítico, por exemplo, na análise das relações de poder? Tal implicaria “perguntar-se qual é a parte de não consenso implicada em uma certa relação de poder, e se essa parte de não consenso é necessária ou não” (Foucault 2001, p. 1409). O consenso não seria, desse modo, para as relações de poder, uma medida, uma lei, um dever ser, ele seria antes um princípio que orientaria a análise dessas relações. Se se tratasse de uma discussão, dir-se-ia que o consenso não é o fim da mesma, mas que se pode, numa discussão, estar atento para que ela não se dilua no dissenso total. O consenso permitiria, assim, que se agisse de modo refletido e prudente na discussão, que se estabelecessem estratégias que evitassem que ela colapsasse, mas não ajuizá-la segundo uma maior ou menor adequação a ele. Dir-se-ia, no limite, como Foucault, que “não é preciso talvez ser pelo consenso, mas é preciso ser contra o dissenso” (Foucault 2001, p. 1409). Tal caráter do princípio crítico está de acordo com o conceito de problematização. Esse conceito pretende dar conta do que seria uma história do pensamento que não fosse nem uma análise das representações que fazemos sobre as coisas nem dos comportamentos efetivos dos indivíduos. Ele faz parte da retomada, por Foucault, da questão da crítica. O que significa crítica? Como algo se torna, para nós, objeto de crítica? Questão, portanto, de “transcendência”, da possibilidade de distanciamento frente ao modo como pensamos e agimos em relação a nós mesmos e ao mundo. Como nosso próprio ser se nos oferece ao pensamento? Através de ciências onde nos descobrimos como seres vivos, falantes e trabalhadores? Por meio de técnicas que nos permitem compreendermo-nos como sujeitos de um desejo que permeia nossa conduta sem que tenhamos total clareza disso? Esses modos pelos quais nosso próprio ser nos é dado ao pensamento, as formas pelas quais podemos e devemos pensar a nós mesmos são nossas formas de problematizar o que somos. Trata-se não tanto das idéias que temos sobre nós mesmos, mas da “lógica” própria a essas idéias. Sua sintaxe mais do que sua semântica, se se quiser. Pode-se dizer que há uma “diferença de nível” na análise de nossas idéias sobre nós mesmos e da lógica que lhes é própria. Isso porque o conceito de problematização aponta não para as respostas que damos aos nossos problemas, mas para a forma dos mesmos. O que, em algum momento e por alguma razão, se torna para nós motivo de inquietação? E, mais ainda, como isso que apresenta para nós dificuldades, que não se deixa mais pensar como vinha sendo até então, é então elaborado, como o transformamos em problema? O conceito de problematização tenta dar conta dessas questões. Se a crítica kantiana se perguntava pelas condições universais e necessárias pelas quais poderíamos pensar, as condições de possibilidade de toda experiência possível, Foucault se pergunta por como pensamos objetos específicos, como eles se consti-
Transcendência crítica sem ideal “transcendental”
421
tuem como objetos, por exemplo, de um certo saber: ele se interessa por sua objetivação. A ele interessam as “condições de existência” em vez das condições de possibilidade, o “a priori histórico” em vez do a priori transcendental. Mas para o que apontam esses termos, afinal? Não pretendo discutir aqui os problemas levantados pelo projeto de uma arqueologia das formas de problematização, mas apenas indicar a direção de um movimento. Falar em “condições de existência” e em “a priori histórico” implica uma renúncia a um projeto crítico de caráter transcendental feita em nome de uma análise das regras segundo as quais algo se constitui como objeto de pensamento no interior de um recorte no tempo e no espaço. Parte-se, por exemplo, de domínios constituídos de saber, como as ciências humanas, e então se questiona como se constitui, para elas, seu objeto, no caso, o homem: como o que somos se dá, através delas, ao pensamento. Pode-se mesmo recuar e buscar como tais formas se constituíram, e, inclusive, chegar à conclusão de que o “homem”, como objeto dessas ciências, é algo novo e que o que somos foi problematizado de formas totalmente diferentes em outros momentos, e também que os saberes que formam a “ascendência” dessas ciências tinham outros objetos. Enfim, o importante aqui é fazer ver que o trabalho crítico de Foucault se volta sobre as formas como pensamos, não em busca do que pode haver de universal nelas, mas, ao contrário, à procura do que nelas pode haver de contingente: que a arqueologia das formas como problematizamos o que somos através das ciências humanas possa mostrar que, para que nos pensemos como partícipes de uma “humanidade” à qual é própria uma finitude que tem sua legalidade estabelecida em referência a ela mesma, em vez de se constituir em contraposição a uma infinitude, é preciso que a questão “que somos nós?” tenha uma determinada forma e não outra. Ao quê responde-se quando se pergunta pelo que somos, tal é o ponto da problematização, ou, mais precisamente, a problematização concerne à definição dos elementos aos quais se responde em nossos saberes ou práticas. Ela elabora as condições nas quais esses saberes e práticas podem apresentar soluções para problemas específicos, ou seja, ela define como esses problemas podem ser formulados, o que abre um campo limitado de respostas possíveis. Nas palavras de Foucault, ela torna possível “as transformações de dificuldades e embaraços de uma prática em um problema geral para o qual se propõem diversas soluções práticas” (Foucault 2001, p. 1417). A problematização delineia um horizonte no interior do qual podemos pensar, ela define o que pode e o que não pode ser pensado, o que se impõe como tarefa ou objeto de pensamento, o que pode e deve ser pensado, e como o pode. Ela diz respeito aos nossos limites. Entretanto, seria errôneo perceber aí um determinismo ou fatalismo onde o que se pode pensar estaria desde sempre já delimitado e de todo nos escaparia. É certo que esse horizonte permanece a maior parte do tempo como horizonte mesmo, nossas práticas se movimentam em seu interior, mas assim como nossas formas específicas de problematização definem o que vem a ser problema, bem pode ser que se torne problemática nossa forma de problematizar algo, ela pode se “fragilizar”. E isso porque a problematização é antes de tudo pensamento afrontando
422
Rommel Luz F. Barbosa
o real, jogando com ele, tentando lhe conferir forma. Para que uma dificuldade real se torne um problema para o qual se pode pensar em respostas cabíveis, é preciso que se afronte essa dificuldade através do pensamento e se lhe dê uma forma, se o transforme propriamente em um problema. Trata-se de um jogo onde a tensão entre o pensamento e o real não se desfaz. O termo experiência guarda também o sentido de experimento. Nas práticas que constituem nossa experiência (seja num laboratório, num consultório psicanalítico, etc.) as formas de problematização que perpassam essas práticas são, a um só tempo, postas em ação e postas à prova. A experiência não é apenas “vivência”, ela é também prova. A maior fraqueza de As palavras e as coisas, como testemunham as inúmeras discussões surgidas a esse respeito à época do lançamento do livro, está em Foucault não conseguir mostrar ali como o nível arqueológico das formas de problematização perpassa as práticas da história natural e da biologia, como elas, ao mesmo tempo, configuram essas práticas e são nelas postas à prova.7 Por isso, o livro, embora mapeie as modificações ocorridas entre uma episteme e outra, não obstante aponte o que muda ao nível arqueológico da história natural para a biologia, não consegue mostrar o que, ao nível das práticas que punham em ação os critérios dessa episteme, tornou necessário que se questionassem esses critérios, isto é, como eles foram postos à prova. É quando surgem dificuldades em nossas práticas, dificuldades graves o bastante para pôr em xeque nossas formas atuais de problematização, que se é novamente convocado à tarefa específica de reproblematização: não apenas movimentar-se no interior de um horizonte que define o que é problema e qual forma ele tem, mas trabalhar sobre esse horizonte mesmo, sobre os limites do pensamento. Não é incorreto dizer que, no que concerne aos limites do pensamento, somos mais e menos livres do que em geral supomos. Mais livres porque esses limites não são imutáveis, menos livres porque eles não se deixam modificar facilmente nem a todo momento. A problematização tem esse caráter dinâmico que permite que se pensem transformações em seu interior sem que estas tenham que ser entendidas como advindas do arbítrio humano. A inventividade, a possibilidade de se repensar o que se pensa, de afrontar os problemas que surgem de modo não previsível, não se confunde com uma inconcebível capacidade de mudar as formas pelas quais se pensa sem que tenham surgido dificuldades no modo como se vinha pensando até então, as quais incitam um esforço de reproblematização. A problematização não diz respeito a uma “espontaneidade criadora” que seria uma faculdade própria ao homem e que o faria externo aos seus modos de pensamento, tal qual o criador da criatura. Ela aponta para a possibilidade de, quando diante de uma dificuldade que perturbe o modo como vínhamos pensando algo até então, podermos reelaborar os modos como o fazíamos, para a possibilidade de que algo se faça, uma vez mais, questão. Por isso mesmo o pensamento, enquanto ação de problematizar, transborda suas formas singulares pelas quais o real se ordena, e, uma vez que ele não é uma faculdade de que podemos dispor segundo nossa vontade, ele também nos transborda. O que o pensamento proporciona é a possibilidade de uma transcendência crítica que é de ordem diversa daquela
Transcendência crítica sem ideal “transcendental”
423
propiciada pela capacidade de encontrar, para um caso particular, uma lei universal que lhe sirva de medida. O parâmetro avaliativo não pode preceder a avaliação. Em verdade, não se trata sequer de uma avaliação, mas da definição das condições segundo as quais certas avaliações podem ser reconhecidas como válidas. Aqui, o problema do critério se faz ver com mais acuidade. Os critérios, os parâmetros pelos quais se pode avaliar algo, não podem ser prévios às formas de problematização daquilo que se avalia porque, numa avaliação, quais critérios podem ser utilizados, a respeito de que o podem, por quais razões, tendo em vista quais fins, são questões que só podem ser respondidas desde um campo de problematização. Por isso a crítica consiste em assumirmos, quando instados a isso,8 o trabalho do pensamento, trabalho sobre nossos limites. Em vez de julgar o real “de fora” dele, um trabalho sobre os limites do real, trabalho esse que põe em jogo justamente o real e o pensamento que o transcende. O que no pensamento transborda o real, o que nele não se concretiza como nossas formas já singulares de pensar, não se pode obviamente pensar, pode-se apenas experimentar a tensão indissolúvel entre esse “dentro” e esse “fora”, a qual é própria ao trabalho sobre nossos limites. Assim, o consenso pode servir de princípio crítico na análise das relações de poder, mas não há nada que obrigue que tal seja feito. Podem-se usar outros princípios, como a dominação, por exemplo, podem-se analisar as relações de poder buscando, nelas, a parcela de reversibilidade que lhes cabe, o quanto e como aquele sobre quem se exerce o poder está em condições de reverter a relação, como ele pode reagir a ela, os modos de se deixar conduzir ou de resistir às tentativas de condução. Tal princípio é crítico porque ele pretende não apenas descrever essas relações sob um determinado aspecto, mas tornar possíveis ações no interior das mesmas. Compreender a lógica de tais relações permite que possamos nos posicionar nelas de modo refletido, que possamos estabelecer estratégias de ação. Trata-se de um distanciamento crítico que se faz sem apelo a nenhum “transcendental”. Que se pense nas discussões contemporâneas a propósito da ética. Sobre elas, escreve John Rajchman: “Dizem, vez por outra, que hoje vivemos em meio a diferentes tradições éticas, sem mais sermos capazes de dizer por que devemos adotá-las ou como escolher entre elas. O ‘pluralismo’ é a visão de que devemos conservá-las todas ao mesmo tempo, ainda que ao preço da dissonância ou ‘incomensurabilidade’ lógica; o ‘monismo’ é a visão de que precisamos ou devemos ter a única teoria correta. Mas em nenhum desses casos surge o problema do que ainda poderia ocorrer para rearranjar e repensar nossas tradições. (. . . ) A ‘questão da ética’ é sempre a questão do que pode ser novo na ética, e portanto, implica uma ‘desconfiança’ em relação aos valores aceitos, como sempre aconteceu” (Rajchman 1993, pp. 167–8). Problema de critério, como se vê. Mas, em vez de buscar um único critério ou a invalidação de qualquer critério a respeito dessas questões, pode-se perguntar pelo modo de formulação do problema. Pode-se questionar que, quando se fala na impossibilidade de dar razões consistentes para a “adoção” de um determinado conjunto de valores, faz-se uma cisão entre aquele que pode “adotar” um conjunto de valores e os conjuntos que
424
Rommel Luz F. Barbosa
estariam à sua disposição para avaliação e escolha. Se se parte desse esquema, como aponta Rajchman, não se pode perguntar pelo que pode haver de novo na ética, não se podem “rearranjar” essas tradições, não se podem reproblematizá-las. Primeiro porque o distanciamento crítico frente a elas é considerado como uma exterioridade, poder-se-ia dizer, ontológica, onde o que caracteriza fudamentalmente o indivíduo é sua capacidade de julgar valores que lhe seriam, por isso, externos. Segundo porque, nesse esquema, resta apenas a possibilidade de escolha entre a adoção e a rejeição, bem como das diferentes razões que se podem oferecer para justificar a escolha feita, as quais dependem, como lembrou Rorty, de um “quadro de pensamento”, ou seja de formas de problematização que definam quais razões são essas e qual seu alcance legítimo. Para que “a questão da ética” se ponha, do modo como a define Rajchman, é preciso que os valores que aceito não sejam entendidos como estando diante de mim, sendo, por isso, passíveis de uma avaliação “imparcial”. Eles precisam, ao contrário, ser entendidos como valores que se encadeiam de uma certa forma, de modo a constituir a maneira como eu posso pensar algo, um comportamento, por exemplo, tornando possível que eu faça a respeito do mesmo certos juízos. Juízos que podem mesmo ser antagônicos, pois o que a problematização define é o campo onde juízos opostos podem se enfrentar, os elementos em disputa pelas diferentes posições — o que interessa não é que haja quem defenda a moralidade ou imoralidade de um comportamento, mas as bases a partir das quais o fazem, os elementos que, nesses juízos, estão em jogo. Por exemplo, ante um homem efeminado, posso julgá-lo imoral ou não; o que interessa a uma análise das formas de problematização é o que determina a imoralidade ou não de tal comportamento: se meu juízo considera a passividade de caráter que tal comportamento traduz, ou se ele leva em consideração um direcionamento do desejo denunciado por esse comportamento. Um juízo depreciativo a respeito de um mesmo comportamento pode ser mobilizado a partir de formas de problematização do mesmo que são totalmente diversas. O que importa não é se esses juízos trazem a mesma “sentença” (moral ou imoral) sobre um comportamento, mas os elementos mobilizados nesses juízos. Essas formas e suas transformações permanecem impensadas quando não se as reconhecem como um campo de análise específico. É preciso que se veja que compreender a questão da ética em termos de um indivíduo que tem a capacidade de avaliar, como que de fora, seus próprios valores, como se estes pudessem ser distanciados da sua capacidade mesma de julgar, é já um modo possível, mas não inescapável, de pôr a questão, uma forma de problematizar a possibilidade de nos distanciarmos criticamente de nós mesmos. E tal modo não permite que se pense como modificar a lógica desses valores, em vez de apenas mobilizar critérios já à disposição para avaliá-los. O que há de comum entre o pluralismo e o monismo é que ambos se enquadram dentro desse mesmo modo de problematização da possibilidade de transcendência crítica; ambos partem de uma cisão radical entre o indivíduo e os valores que ele pode ou não “adotar”, bem como de uma compreensão
Transcendência crítica sem ideal “transcendental”
425
demasiado estática desses valores, como se os mesmos não fossem problemáticos ou problematizáveis. Foucault não pretende julgar o real se posicionando do lado de um dever ser previamente estabelecido, de uma teoria que lhe assegurasse os princípios aos quais recorrer na avaliação do real. Ele retoma a questão da crítica, que nos pertence tão fortemente desde o Iluminismo, redesenhando-a, buscando se desvencilhar da crítica como projeto para torná-la ainda uma vez em questão, de solução novamente em problema. Em seus últimos trabalhos tal esforço é patente. Trata-se de reelaborar o que entendemos por crítica, modificar não apenas a representação que dela fazemos, mas a maneira como a pomos em ação e à prova. Em vez de uma crítica que se faz em nome de uma razão universal, uma crítica que opera através da análise de formas específicas de racionalidade, de modos de problematização. Princípios que orientam a análise ou as práticas, em vez de leis que permitem julgá-las. Em suma, um esforço de repensar a herança crítica.9
Bibliografia Barbosa, R. L. F. 2007. Foucault e a ética: algumas considerações. Revista Aulas 3: 1–16. Foucault, M. 1988. História da sexualidade 2: o uso dos prazeres. Tradução de M. T. da Costa Albuquerque e J. A. Guilhon Albuquerque. 5a edição. Rio de Janeiro: Graal. —–. 2001. Dits et écrits II, 1976-1988. Edição estabelecida sob a direção de Daniel Defert e François Ewald. Paris: Quarto-Gallimard. Kant, I. 2002. Crítica da razão prática. Tradução, introdução e notas de Valério Rohden. São Paulo: Martins Fontes. Koselleck, R. 1999. Crítica e crise: uma contribuição à patogênese do mundo burguês. Tradução de Luciana Villas-Boas Castelo-Branco. Rio de Janeiro: Eduerj/Contraponto. Pessoa, F. 1977. Obra poética em um volume. Organização, introdução e notas de Maria Aliete Galhoz. Rio de Janeiro: Nova Aguilar. Rajchman, J. 1993. Eros e verdade: Lacan, Foucault e a questão da ética. Tradução de Vera Ribeiro. Rio de Janeiro: Jorge Zahar. Schiller, F. 2002. A educação estética do homem. Numa série de cartas. Tradução de Roberto Schwarz e Márcio Suzuki, introdução e notas de Márcio Suzuki. 4a edição. São Paulo: Iluminuras.
Notas 1 A versão para o português dos textos em francês é de minha responsabilidade. 2 É bem conhecida a insistência de Foucault em pensar uma ação “micro-política”, por oposição a uma
revolução de toda a realidade, bem como sobre a necessidade de intelectuais específicos, isto é, intelectuais que, em vez de estabelecerem ou justificarem um programa de reforma da realidade, ajam sobre pontos específicos da experiência. A revolução, em seu sentido moderno de reforma da totalidade do real, é veementemente rejeitada por Foucault e é indissociável do tipo de crítica que aqui chamamos judicativa, cujos primeiros representantes contam entre os iluministas franceses e alemães, passando por Rousseau, Fichte, Hegel, Marx, dos quais se poderia dizer, para usar palavras de Fernando Pessoa, que “levam a vida a querer inventar a máquina de fazer felicidade” (Pessoa 1977, p. 231).
426
Rommel Luz F. Barbosa
3 Com efeito, diz Kant, em sua Crítica da razão prática: “A lei moral é santa (inviolável). O homem é
deveras bastante ímpio, mas a humanidade em sua pessoa tem que ser santa” (Kant 2002, p. 141 / A 155). 4 Tal é, grosso modo, o esquema da cisão entre moral e política, no absolutismo. Mas esse esquema se apresentava bastante matizado, como se pode ver ao comparar os escritos de Hobbes e Locke. 5 Se se observar o Contrato Social, de Rousseau, ver-se-á que a estrutura do poder soberano é mantida, mas seu representante legítimo deixa de ser o príncipe e passa a ser o povo, cuja expressão é a “vontade geral”. Ora, uma vez que a vontade geral só se revela através do sufrágio, ninguém, em específico, responde por ela, ninguém, em especial, responde pelo político, pois, se a vontade geral é a vontade de todos (mesmo daqueles que votaram contra a vontade da maioria vencedora no sufrágio), ninguém, em específico, responde por ela. Não há mesmo perante quem se responsabilizar, pois o povo responde apenas a si mesmo — assim como o monarca soberano só respondia por seus atos perante si mesmo, perante Deus, ou perante seus pares, no caso de relações internacionais (lembrando que, antes da coroação, na Inglaterra, o rei precisava ser aclamado pelo povo). Assim, e eis aqui o ponto central, o próprio sufrágio não é entendido como um meio de resolução de um conflito entre posições discordantes, mas como meio de descoberta da real vontade de todos (a minoria vencida não é um partido discordante, mas indivíduos que não estão ainda devidamente conscientes do que em verdade querem). 6 Para uma abordagem pormenorizada desses acontecimentos, conferir a supracitada obra de R. Koselleck. 7 As metáforas de um solo epistemológico e de um “a priori”, ainda que histórico, se prestaram mais a aumentar a confusão do que a dissolvê-la, ao dar a impressão de que se tratava de uma causalidade da episteme sobre as práticas ou de que a episteme dizia respeito a condições de possibilidade do discurso verdadeiro que não tinham relação com aquilo a respeito do que se diz a verdade. Não estava suficientemente clara nem a relação entre as formas de problematização (com efeito, esse conceito só será cunhado por Foucault em seus últimos escritos) e as práticas, nem a tensão entre essa formas e o real, ou seja, que formas de problematização e práticas se co-constituem na medida em que as formas de problematização configuram as práticas que, a um só tempo, as põem em ação e as põem à prova na lida com o real. 8 Na maior parte do tempo, como já foi dito, sequer concebemos a possibilidade de pensar diferentemente, e é preciso que seja assim, pois, caso pudéssemos “sair de nós mesmos” de forma completa, seríamos lançados no nada, numa possibilidade que tanto mais plena (pela ausência de efetividade, de determinação, de limite) seria quanto mais vazia fosse. A crítica, com efeito, não é a dissolução dos limites, mas a reelaboração dos mesmos. 9 Este artigo faz parte de minha pesquisa desenvolvida no curso de mestrado do Programa de Pósgraduação em Filosofia da UERJ, sob orientação da Profa. Dra. Vera Maria Portocarrero, com o auxílio de uma bolsa da CAPES. Gostaria de agradecer também aos meus amigos e colegas de mestrado, Fábio da Costa, Gabriel Leitão e Taís Pereira, cuja leitura e discussão de diversos pontos aqui abordados foram imprescindíveis para que este artigo tenha a forma que tem agora.
A LGUMAS C ONSIDERAÇÕES SOBRE O PAPEL DA AUTENTICIDADE NA E SFERA P ÚBLICA EM C HARLES TAYLOR TAÍS S ILVA P EREIRA Universidade do Estado do Rio de Janeiro
tsp_br@terra.com.br
Às vezes como complemento (cf. Ferrara 1997), outras como contraposição à noção de autonomia (cf. Thiebaut 1997), a questão acerca do lugar do conceito de autenticidade se afigura central para as discussões de filosofia política contemporânea (exemplificada em torno das investigações concernentes ao multiculturalismo, ao nacionalismo, a teorias legais etc.), uma vez que remete a um modo de prática coletiva e à própria concepção de sociedade a ele ligada. O pensamento do filósofo canadense Charles Taylor destaca-se, neste sentido, pela recuperação deste conceito tendo em vista uma defesa dos pressupostos ontológico-morais constituídos nas formulações de sociedade de nossa época. Recuperar o lugar e o poder normativo da autenticidade é, em última instância, repensar a modernidade nos limites de suas próprias práticas. Por sua vez, uma teoria da modernidade, nos termos propostos por este filósofo, requer uma inextrincável conexão entre quatro termos, a saber: (1) as noções de bem; (2) os modos de ser do self ; (3) um conceito de história e (4) concepções de sociedade. A proposta da presente exposição se insere no interior da relação entre o primeiro e o quarto termos, isto é, pretende explicitar a defesa tayloriana de que toda sociedade se constitui através de certos bens que são comuns aos cidadãos. E, partindo desta tese mais geral, procuro mais especificamente tratar do papel normativo do conceito moderno de autenticidade para a formação do que chamamos, hoje, esfera pública. Acredito que uma maior atenção a esta relação no pensamento de Taylor poderá nos auxiliar a compreender como seu posicionamento frente a questões políticas tem de pressupor a defesa de uma ontologia temporalizada da moral que, por seu turno, não se coaduna com o liberalismo do tipo procedimental e tampouco com qualquer espécie de relativismo dos valores éticos. Porque, ao tratar de bens comuns, este filósofo parece apontar para conceitos imprescindíveis à nossa experiência e que, ao fim e ao cabo, é social. Para esse objetivo, esta apresentação visa a percorrer o seguinte percurso: (I) veremos como autenticidade é uma fonte moral, a partir da tese tayloriana de que bens ou fontes morais não são subjetivos e por isso; (II) pode ser comunicada por meio de uma linguagem intersubjetiva em um espaço comum, linguagem esta que não pode ser cindida dos próprios bens que estão em jogo (por isso, substantiva); para, finalmente, (III) mostrar como a esfera pública é um destes espaços comuns por excelência, no interior do qual a noção autenticidade é elaborada e re-elaborada na dinâmica social. Dutra, L. H. de A. e Mortari, C. A. (orgs.) 2009. Anais do V Simpósio Internacional Principia. Florianópolis: NEL/UFSC, pp. 427–435.
Taís Silva Pereira
428
I Em um primeiro momento, o título deste trabalho pode nos sugerir uma impressão errônea de que a importância do conceito de autenticidade reside na sua precedência lógica ou ontológica ao conceito de autonomia e que de alguma forma é mais valioso alocá-lo como o foco principal de toda discussão política. Poderíamos atribuir a Taylor apenas uma inversão de tal precedência conferida por autores como Habermas, Rawls e Dworkin, etc. — os quais defendem, cada um a seu modo, a prioridade da autonomia como um processo de autodeterminação em detrimento de concepções divergentes de bem — e, em última instância, conferir à autenticidade um papel mais pleno para todas as práticas sociais. Contudo, este primeiro olhar tende a se dissipar quando atentamos para o projeto filosófico de Taylor como um todo, o qual não se propõe perguntar pelo critério ou princípio a partir do qual as instituições e tais práticas precisam se pautar em sociedades democráticas. Antes, o que está em jogo é a questão referente ao modo como certas coisas se mantêm, desaparecem ou são re-elaboradas em nossas práticas comuns, ou seja, como certos conceitos são imprescindíveis de nosso domínio prático-moral, compreendido enquanto um nível da própria realidade (cf. Taylor [1988], [1989]). Tais conceitos dos quais não podemos nos furtar em meio a nossa própria experiência e pensamento morais, Taylor denomina bens constitutivos que se dão no interior de uma configuração específica da totalidade de nossa realidade moral. Em contraposição aos chamados bens de vida, de sentido estrito, que significam todas as coisas valiosas que buscamos, o filósofo refere-se, aqui, a bens em sentido amplo, concernente aos planos ou modos de vida assim avaliados (Taylor [1995], p.210). Diferente da concepção de valor, definida segundo termos individuais ou comunitários (de um grupo específico e sentido estrito), os bens constitutivos ou bens comuns não são objetos de escolha dos indivíduos e tampouco determinam completamente as nossas ações, isto porque os bens e os selves se constituem mutuamente em uma certa configuração de nosso espaço moral. E, porque o self e os bens são co-constituídos, essa relação não é estática, mas sim fluida e dinâmica, pois assim é nossa própria experiência.1 Desta forma, o conceito de autenticidade não é, seguindo o raciocínio de Taylor, um valor esposado por um ou alguns indivíduos. Ao contrário, é a partir dele que uma gama de discursos, teorias, questionamentos, dilemas e mesmo tentativas de negar sua vigência ou importância tornam-se inescapáveis a qualquer indivíduo moderno. Em outros termos, certos problemas só podem existir para nós como tais a partir desse conceito, visto que ele configura, dá forma, ao nosso modo de ser, agir e pensar. A autenticidade é um conceito moderno e só pode ser inteligível nos limites de nossa época. Ela central porque é um horizonte moral a partir do qual nos compreendemos de uma maneira e não de outra, é uma possibilidade de “descrição do que seria um modo de vida melhor ou superior, na medida em que ‘melhor’ ou ‘superior’ se definem não em função do que nos ocorre desejar ou necessitar, senão de
Algumas considerações sobre o papel da autenticidade na esfera pública em Charles Taylor
429
oferecerem uma norma do que deveríamos desejar” (Taylor [1991], p. 51).2 Esta descrição não pode, por conseguinte, prescindir de uma ordem normativa, isto é, de um pano de fundo comum a todos, no qual as coisas têm sentido para nós, configurado por nossas experiências morais neste espaço compartilhado. Uma ética da autenticidade é muito mais um trabalho de recuperação do seu lugar em nossa própria formação e de nosso tempo (porque se mantém em nossa experiência e pensamento morais) do que uma investigação desta noção enquanto uma capacidade intrínseca ao ser humano ou um princípio geral que possibilite normas morais e instituições políticas. Enquanto bem constitutivo e não regulativo,3 a autenticidade abre em nossa época uma gama de possibilidades que só existem no interior de um espaço específico de indagações, o campo da moralidade.4 Assim, o seu lugar é anterior a julgamentos de certo e errado, melhor e superior (porque tais julgamentos se manifestam nas diversas tentativas de resposta no interior da moralidade e não em sua existência enquanto objeto de conflitos), por isso se oferece como uma norma daquilo que deveríamos desejar. É uma espécie de padrão a partir do qual não podemos deixar de nos mover e de nos apoiar. Não podemos discorrer sobre a identidade e igualdade, sobre a questão do multiculturalismo e sobre teorias do direito, por exemplo, sem que este modo de descrever nossa realidade moral não esteja de algum modo presente — há uma ressonância entre tais conceitos. Entretanto, isso não implica sua vigência absoluta (ela não é um a priori de nossas ações). Um tal bem participa da história de nossa própria experiência moral e pode ser re-elaborada em nossas descrições de formas diferentes a partir de arranjos e rearranjos possíveis no interior das configurações, ou simplesmente deixar de ser um problema para nós. Com efeito, não há um único bem constitutivo, não nos constituímos apenas por meio do conceito como o de autenticidade. A autonomia mesma, a dignidade, entre outros, são hoje indispensáveis para nossas práticas: seja no cumprimento de obrigações, seja no que diz respeito a nossa auto-realização, seja em nossa postura, em nossos papéis sociais (que são, para Taylor, os três eixos de nosso domínio moral). A diversidade dos bens divergentes e muitas vezes concorrentes é o pressuposto para o que Taylor denomina domínio moral como um espaço de conflito, no qual a autenticidade é um dos bens que estão em jogo. Mas, este conflito é comunicável porque pressupõe um pano de fundo comum a todos. Assim, as descrições que sempre fazemos e buscamos partem de uma linguagem compartilhada e substantiva, visto que não são separáveis dos bens que os conformam. Todavia, poder-se-ia objetar a Taylor de que a autenticidade, na medida em que perfaz nosso horizonte moral, no qual descrevemos nossa vida em termos de melhor ou superior, é restrita a uma existência individual, ou, no máximo, a uma tradição muito específica e que não pode ser universalizada por completo, como pretende uma sociedade liberal. De fato, a preocupação deste filósofo se atém mais às possibilidades, ou melhor, às fontes morais, que nos impeliram a adotar o universalismo irrestrito em nossa época, a sua imediata defesa, posto que essa postura não é neutra. E, em resposta ao objetor, diria que a noção de experiência nunca é individual, mas
Taís Silva Pereira
430
sempre compartilhada por uma “gramática comum”. Tal como não podemos inventar uma linguagem a partir do nada, um bem, como a autenticidade, está atrelado a um pano de fundo experienciado por todos, por isso nossa vida não diz respeito apenas a certos indivíduos mais próximos. Antes, nossas descrições são compartilhadas e comunicadas substantivamente. II Essa última consideração nos leva, pois, ao segundo ponto desta apresentação, a saber, o caráter intersubjetivo dos bens por meio da defesa tayloriana de uma linguagem substantiva ou qualitativa que tenta descrever de forma mais plena aquelas coisas que se mantêm por serem boas, tal como a noção de autenticidade. Em outros termos, uma linguagem substantiva é, segundo Taylor: um padrão de atividade mediante o qual exprimimos/ realizamos um certo modo de ser no mundo, aquele que define a dimensão lingüística; mas esse padrão só pode ser apresentado contra um pano de fundo que nunca podemos dominar por inteiro. É também um pano de fundo pelo qual nunca estamos plenamente dominados, visto que o remoldamos constantemente. Remoldá-lo sem dominálo, ou ser capaz de supervisá-lo, significa que nunca sabemos de modo integral o que fazemos com ele. No que se refere à linguagem, somos tanto construtores como construídos. (Taylor [1995], p. 111, grifo meu)
Por expressão Taylor entende a tentativa de tornar manifesto algo até então obscuro. Expressar “um certo modo de ser no mundo” é, neste sentido, clarificar quem somos, isto é, articular nossa relação com nós mesmos e com o mundo. São articulações possíveis entre o indivíduo, o self, e o bem, as quais vão além de proferimentos ou mesmo de pressupostos lógico-pragmáticos da linguagem. No interior de nossa linguagem moral não apenas designamos objetos (falamos sobre), mas preponderantemente fazemos distinções qualitativas, hierarquizamos bens — aqui, em sentido amplo. Mas, estas distinções só podem ser realizadas a partir de um horizonte de inteligibilidade, de bens comuns, conceitos compartilháveis. A linguagem enquanto expressão de um modo de ser no mundo no interior da própria atividade da fala, não se restringe ao falar com alguém e/ ou sobre algo, porque também nos constituímos e nos fazemos entender uns aos outros por meio de gestos, pelo modo como nos orientamos no espaço, nas considerações que tomamos por relevantes, na fruição de uma obra de arte, em uma atividade física, etc. O diálogo em sentido amplo pressupõe todas estas formas de comunicação. As palavras ganham sentido a partir de nossos gestos e posturas; ao dialogarmos construímos um espaço comum entre nós, moldamos um mundo, ao mesmo tempo em que tal espaço nos possibilita dialogarmos de um certo modo. Não podemos determinar completamente nossa dimensão lingüística porque o espaço criado entre nós resiste a uma escolha totalmente arbitrária das palavras e gestos. Do mesmo modo, ele não é fechado o suficiente para que novas formas de modelação do mundo sejam feitas no interior de nossa experiência
Algumas considerações sobre o papel da autenticidade na esfera pública em Charles Taylor
431
prática. Assim, por práticas dialógicas Taylor não denomina a convergência de propósitos comuns (a soma de interesses específicos ou ainda o ideal de consenso), mas uma espécie de coordenação, de ritmo entre os seus participantes a partir de um foco que os irmana. É esta freqüência comum entre os participantes em sua relação com si e com o mundo, esta ressonância, que tem um papel capital para a formação de uma comunidade. É nesta relação que uma rede de conceitos é construída, afetando, por seu turno, os próprios construtores, visto que há, aqui, uma via de mão dupla. Por outro lado, a atenção ao caráter substantivo da linguagem afasta Taylor de uma defesa dos pressupostos lógicos da mesma, uma vez que estes, segundo seu aspecto formal, estão de uma certa maneira além da própria experiência, na medida em que são as condições de possibilidades dos próprios proferimentos. A defesa do uso constitutivo da linguagem se dá na própria atividade do falar e é substantiva porque não apenas designa estados de coisas neutros, mas está em estreita conexão com os bens comuns, inseparáveis de nossos modos de ser. Se nos descrevemos e descrevemos nossa relação com o nosso entorno a partir de distinções qualitativas, nossa linguagem não pode de maneira alguma se dar fora das hierarquizações que fazemos em nossa prática. Antes, ela já pressupõe uma ordem normativa e só pode ser comunicada à luz deste horizonte, ou seja, dessa rede de conceitos. E, tal como os bens não são acabados porque são inseparáveis de nossa atitude, o modo como nos comunicamos não está dado, posto que não nos portamos da mesma forma diante de diferentes circunstâncias e indivíduos. Com efeito, no que tange estes bens, o êxito de nossa interação é debitário tanto da clareza da relação consigo quanto com os demais em situações distintas. A linguagem, enquanto articulação de distinções qualitativas, corre sempre o risco de fracassar em seu objetivo por não expressar adequadamente uma postura, seja por desconhecer quais os motivos (enquanto fontes morais) e como eles estão rearranjados em nosso quadro descritivo da moral, seja por confundir tais fontes, seja por não conseguir torná-las compatíveis com sua própria prática. Saber usar tal linguagem é, para Taylor, antes de tudo saber conectá-la com suas fontes morais, com a diversidade de bens possíveis no espaço de nossa experiência moral para que uma certa hierarquia se dê: “Se a autenticidade consiste em ser fiel a nós mesmos, em recuperar nosso próprio ‘sentiment d l’existence’, nesse caso, talvez só podemos alcançá-lo em sua integridade se reconhecermos que este sentimento nos coloca em relação com um todo mais amplo” (Taylor [1991], p. 120). A autenticidade, na medida em que é um bem, tem uma linguagem própria porque não apenas discursamos sobre ela, mas igualmente tal conceito nos proporciona uma fonte para nossos dilemas políticos-morais. Ela é tema de questões e discursos, também nos colocamos frente aos outros a partir da valorização de ser fiel a si mesmo e julgamos nossas ações e de outrem a partir deste horizonte. Em outras palavras, ela não é objeto separável do self, mas o self moderno é também graças a bens constitutivos, neste caso específico, à noção de autenticidade. Em nossos dilemas nos movemos e nos apoiamos a partir da configuração de algo como este conceito. Por
Taís Silva Pereira
432
exemplo, hoje quando um fiel questiona-se a si próprio se seus propósitos e ações são condizentes com a doutrina abraçada, ou quando nos perguntamos sobre o papel de nosso Estado com respeito às diferentes nações e culturas, ou ainda quando valorizamos a existência e o trabalho de certas organizações internacionais, a autenticidade, enquanto fonte, aparece como uma grande mobilizadora de tais perguntas. Um membro de uma dada religião pode estar procurando ser o mais fiel possível em seu modo de vida, pois ser um membro de fato é viver plenamente sua profissão de fé: ser fiel consigo mesmo implica encarnar tal doutrina de modo que não haja separação entre ele e sua comunidade religiosa. De maneira análoga, quando nos perguntamos pelo modo como é ou deve ser um Estado, estamos igualmente colocando em consideração nossa postura de participantes deste meio comum e igualmente o seu significado. A descrição acerca da melhor organização governamental não é cindida de nossas práticas enquanto cidadãos (pois quando definimos ou defendemos uma dada sociedade, definimos também os seus membros), ou pelo menos, não deveria estar, pois ainda que ajamos de forma contrária a nossa descrição, medimos nossa postura a partir dela. Ainda assim a questão gira em torno mais profundamente sobre o que somos e sobre o que pretendemos/ queremos ser, ou seja, a linguagem da autenticidade. Todavia, cabe ressaltar que, ao dizer “linguagem da autenticidade”, não significa afirmar que tal linguagem é pronta. Tal como vimos anteriormente, se a linguagem e os bens não estão dados de antemão, o modo pelo qual descrevemos nossa situação a partir do conceito de autenticidade não é único nem universal em sentido estrito. O modo como a linguagem autêntica é expressa dependerá de outras fontes morais, do rearranjo das possibilidades no interior da configuração delineada pela autenticidade ao longo de uma narrativa de vida (a qual não se restringe a um indivíduo) que, por sua vez, não pode ser separável da história de seus conceitos. Por isto Charles Taylor pode falar em formas depravadas ou não deste horizonte, tal como o subjetivismo, declarações a respeito da autenticidade como um fenômeno puramente individual e por isso, impossível de possuir valor de verdade (como a posição relativista defenderia) ou de ser estendida a todo e qualquer indivíduo. Uma perspectiva subjetivista do horizonte da autenticidade tem de partir do pressuposto de que nós, em algum aspecto, podemos prescindir de um pano de fundo anterior a nós mesmos, sublimar o caráter dialógico substancial da própria linguagem construída pelos selves ao mesmo tempo em que os constrói. De fato, segundo Taylor, tal perspectiva é justamente um dos arranjos possíveis dos diversos bens que se colocam para nós na modernidade e não significa de pronto sua validade ou não. III Podemos perceber até aqui como a autenticidade não pode ser um valor subjetivo, mas um conceito sem o qual não nos compreendemos em nossa época. Ela, enquanto um bem constitutivo, só faz sentido a partir de um pano de fundo comum a todos, na
Algumas considerações sobre o papel da autenticidade na esfera pública em Charles Taylor
433
qual a interação por meio de uma linguagem substantiva e corporificada — que não está apartada do self — se dá. E, um destes lugares comuns é, para Taylor, justamente a esfera pública. A sua importância se deve à peculiaridade da esfera pública para a prática deliberativa nas sociedades contemporâneas, principalmente as democráticas. Diferente de outros espaços compartilhados que promovem uma ação conjunta com um propósito comum (como um jogo, uma conversação, uma cerimônia), a esfera pública não é um lugar delimitado, mas sim formada por uma miríade de meios e conexões além de encontros diretos para a discussão de questões em comum: “A discussão que podemos estar vendo na televisão agora trata daquilo que foi dito no jornal pela manhã, que por sua vez relata o debate radiofônico de ontem e assim por diante” (Taylor [1995], p. 277). Ela é, nas palavras de Taylor, um espaço metatópico5 posto que não possui uma delimitação específica, também não é em si um exercício de poder — aqui, poder institucional, ou seja, não é uma instituição específica e tampouco dependente de um governo. A rede de conexões que perpassa a esfera pública exprime não apenas informações a respeito de interesses individuais que, porventura, possam coincidir com os de outrem. Na medida em que é um lugar comum, a linguagem das discussões não perfaz a soma de interesses e tampouco apela necessariamente a um consenso normativo, mas aponta muito mais para uma compreensão comum deste espaço como um locus de dilemas e divergências que são comunicáveis, visto que podem tocar a todos. Por isto, afirma Taylor: “Partilhamos de uma opinião pública comum, quando partilhamos, porque a elaboramos juntos. Não é simplesmente que tenhamos por acaso concepções idênticas; elaboramos nossas convicções num ato comum de definição” ([1995], p. 279). Estes dilemas, vale ressaltar, não são concernentes à maior satisfação de interesses em seu sentido mais imediato, ao bem-estar dos concernidos. Antes, são conflitos de ordem normativa, tal como Taylor os entende, a saber: a tentativa de explicitação de nossa relação conosco e com a própria sociedade no interior de suas práticas por meio dos mais diversos meios de propagação. O bem-estar, neste sentido, é apenas mais um modo de como a compreensão comum é articulada publicamente, pois não há — tal como vimos na discussão da primeira seção — uma escolha deliberada dos agentes individuais. Em outras palavras, as questões que nos tocam não são determinadas tout court por nós mesmos, o próprio espaço compartilhado também nos demanda certas ações e posturas. Os diversos modos da linguagem da esfera pública são, neste sentido, também substantivos, porque as compreensões comuns são expressas preponderantemente por meio de descrições qualitativas: as demandas feitas ao governo e a forma com que são difundidas pressupõem expectativas do que signifique a própria sociedade e nossa relação com ela. Tudo isto pressupõe o nosso modo de ser em sociedade. De forma análoga às considerações feitas a respeito dos bens constitutivos, estas expectativas formadas na esfera pública, constituem-se pelas mais diversas fontes, acarretando em diferentes usos deste espaço, como a tentativa de manipulação de
434
Taís Silva Pereira
seus meios em prol de certos interesses (seja do governo, seja de certas instituições), a falta de transparência dos diferentes lados das discussões, etc. Isto se dá justamente porque esse espaço concretiza, no interior de sociedades democráticas, o campo de conflito entre diversos bens através de rearranjos possíveis dos próprios conceitos que os constituem. O papel normativo da autenticidade é um destes bens constituintes de nossa compreensão comum publicamente disponível. Se for tomado de forma subjetiva e seu papel dialógico for desconsiderado, apenas, implicará uma concepção de sociedade enquanto somatório de interesses individuais — como o caso da defesa utilitarista de sociedade, a qual é amplamente criticada por este filósofo. Por outro lado, considerado enquanto um bem que é co-constitutivo de nosso próprio modo ser no mundo dialogicamente compartilhado, a autenticidade contribui para explicitar a atuação comunitária como a tentativa de expressar mais plenamente a diversidade das fontes morais para um fim que seja efetivamente comum através de suas próprias ações. O caráter metatópico da esfera pública viabilizaria diferentes modos de ação por meio da expressão de um bem (visto que é capaz de congregar diferentes meios e lugares comuns que estão de fora do poder governamental, como as ONGs, as mídias, o meio acadêmico etc.), enquanto a autenticidade, defendida em termos dialógicos, apontaria para uma comunidade que busca propósitos comuns enquanto um corpo multifacetado, mas ainda assim um corpo deliberativo. Ela é, então, elaborada e re-elaborada em uma sociedade que tem de pressupor o compartilhar deste próprio bem. A autenticidade, por conseguinte, incide sobre a própria noção de republicanismo defendida por Taylor, marcada pelo contínuo resgate destes propósitos comuns à luz de sua ontologia moral. Seu lugar tem de ser visto antes de qualquer coisa como uma fonte inextrincável de nossas sociedades democráticas que pressupõem bens compartilhados em sentido forte, isto é, conceitos comuns que não podem ser esgotados ou ultrapassados por procedimentos formais. Decerto, essa apreciação nos conduz, inevitavelmente, ao problema da incomensurabilidade entre bens completamente distintos que não fazem parte da rede de conceitos de certas comunidades. Em outras palavras, voltaríamos ao problema do arbítrio entre bens concorrentes. Contudo, se tivermos em vista as argumentações das páginas precedentes, não poderemos vincular a Taylor um projeto crítico que esteja além das próprias práticas sociais. Isso significa que não podemos atrelar a esse filósofo um procedimento formal para resolução de conflitos políticos e morais, mas disso também não se segue a ausência de qualquer crítica. Antes, o que parece estar em jogo, aqui, é uma audaciosa tentativa de escapar tanto da exigência radical de um universalismo quanto da inevitabilidade da incomensurabilidade, isto é, parece haver no pensamento tayloriano uma nova e outra forma de pensar a objetividade dos bens e possíveis resoluções de conflitos entre comunidades. Entretanto, esse tema só poderá ser propriamente desdobrado em estudos posteriores.6
Algumas considerações sobre o papel da autenticidade na esfera pública em Charles Taylor
435
Referências Ferrara, A. 1997. Authenticity as a normative category. Philosophy and Social Criticism 3(3): 77–92. Taylor, Ch. [1988]. Lo justo y el bien. Revista de Ciencia Política 12(1-2): 65–88, 1990. —–. [1989]. As fontes do self: a construção da identidade moderna. Tradução de Adail Ubirajara Sobral e Dinah de Abreu Azevedo. São Paulo: Loyola, 1997. —–. [1991]. La ética de la autenticidad. Tradução de Pablo Carbajosa Pérez. Barcelona: Paidós, 1994. —–. [1995]. Argumentos filosóficos. Tradução de Adail Ubirajara Sobral. São Paulo: Loyola, 2000. Thiebaut, C. 1997. The logic of autonomy and the logic of authenticity: a two-tiered conception of moral subjectivity. Philosophy and Social Criticism 3(3): 93–108. Tully, J. (ed.) 1994. Philosophy in an age of pluralism: the philosophy of Charles Taylor in question. Cambridge: Cambridge University Press.
Notas 1 Há de se notar a insistência do autor no que tange ao caráter inextrincável entre bem e self, principal-
mente na primeira parte de sua obra de 1989. Tal posição implica, sobretudo, a impossibilidade de se tratar o bem como valor a ser escolhido por indivíduos ou comunidades. Não escolhemos ou determinamos um bem, ao mesmo tempo em que eles não nos determinam completamente. 2 A tradução das passagens dessa obra é de minha responsabilidade. 3 Esse contraste é capital para o pensamento tayloriano, pois acarreta em sua posição sobre o que consiste um domínio moral, quais os seus limites. Por bem constitutivo o autor compreende aqueles conceitos a partir dos quais já sempre nos movemos em nossas práticas sociais, eles estão, deste modo, arraigados a nossa própria experiência. Ao passo que por bem regulativo, Taylor toma conceitos que estariam além — de uma maneira ou de outra — das práticas sociais. Esse ponto ficará mais claro a seguir, quando apontarmos as considerações sobre a linguagem dos bens. 4 Exatamente pelo pensamento de Taylor se afastar — em virtude de uma concepção ontológica da moralidade, que visa a explicar a totalidade da realidade de nossas práticas — da querela “deontologismo” x “teleologismo”, não há divisão entre ética e moral enquanto esferas da razão prática. Tais denominações são sinônimas na teoria deste autor. 5 Mas uma metatopicalidade que não ultrapassa a própria atividade comum, isto é, não remete a um outro tempo (neste sentido, ela é radicalmente secular). Para mais considerações sobre a relação entre secularização e esfera pública, ver Taylor [1995], p. 281–90, principalmente. 6 Esta exposição faz parte da pesquisa empreendida no mestrado, na linha de pesquisa de Ética e Filosofia Política do Programa de Pós-graduação em Filosofia da Universidade do Estado do Rio de Janeiro (UERJ), com apoio de uma bolsa da CAPES.