Gauss M. Cordeiro Clarice G. B. Demétrio Rafael A. Moral MODELOS LINEARES MODELOS LINEARES GENERALIZADOS E APLICAÇÕES GENERALIZADOS E APLICAÇÕES 5.1Introdução ......................................
5.2Técnicasparaverificaroajustedeummodelo
5.3Análisederesíduosediagnósticosparaomodelolinearclássico
5.3.1Tiposderesíduos
5.3.2Estatísticasparadiagnóstico ........................
5.3.3Tiposdegráficos
5.4AnálisederesíduosediagnósticoparaMLGs
5.4.1Tiposderesíduos ..............................
5.4.2Tiposdegráficos
5.5Métododasvariáveisexplanatóriasadicionaisnaseleçãodemodelos
5.6Verificaçãodafunçãodeligação
5.7Verificaçãodafunçãodevariância
5.8Verificaçãodasescalasdasvariáveisexplanatórias
5.9 Verificaçãodeanomaliasnocomponentesistemático,usando-seanálisedos resíduos
7.1Dadosbinárioseproporções
7.1.1Estimaçãodadoseefetivaeseuintervalodeconfiança
7.1.2Probabilidadederespostaaumadoseespecificada
7.1.3Paralelismoentreretasnomodelologísticolinearepotênciarelativa
7.2Dadosdecontagens
7.2.2Modeloslog-linearesparatabelasdecontingência
B.1Algoritmodeestimação,passoapasso,paraoExemplo2.1
B.2ProgramaRparaosdadosdoExemplo2.5:Rotenona
B.3ProgramaRparaosdadosdoExemplo6.1:Cerejeiras
B.4ProgramaRparaosdadosdoExemplo6.2:Gorduranoleite
B.5ProgramaRparaosdadosdoExemplo6.3:DadosdeAcáciaNegra
B.6ProgramaRparaosdadosdoExemplo6.4:Temposdesobrevivênciaderatos . 227
B.7ProgramaRparaosdadosdoExemplo6.5:DadosdeassinaturasdeTVacabo228
B.8ProgramaRparaosdadosdoexemplo7.1:Rotenona ............... 230
B.9ProgramaRparaosdadosdoexemplo7.2:Cipermetrina 231
B.10ProgramaRparaosdadosdoexemplo7.3:Mortalidadedobesourodafarinha234
B.11 ProgramaRparaosdadosdoexemplo7.4:Proporçõesdegemasfloraisde macieiras 238
B.12ProgramaRparaosdadosdoexemplo7.5:Culturadetecidosdemacieiras .. 241
B.13 ProgramaRparaosdadosdoexemplo7.6:Toxicidadeadissulfetodecarbono gasoso ......................................... 242
B.14 ProgramaRparaosdadosdoexemplo7.7:Armazenamentodemicroorganismos 245
B.15 ProgramaRparaosdadosdoexemplo7.8:Númerodebrotosemumestudode micropropagaçãodemacieiras 246
B.16ProgramaRparaosdadosdoexemplo7.9:Númerodeespéciesdeplantas 246
B.17 ProgramaRparaosdadosdoexemplo7.10:Coletadeinsetosemarmadilhas adesivas 247
B.18 ProgramaRparaosdadosdoexemplo7.11:Pneumoconioseemmineirosdecarvão 248
Famíliaexponencialdedistribuições 1.1INTRODUÇÃO Muitasdistribuiçõesconhecidaspodemsercolocadasemumafamíliaparamétrica denominada famíliaexponencialdedistribuições.Assim,porexemplo,pertencema essafamíliaasdistribuiçõesnormal,binomial,binomialnegativa,gama,Poisson,normal inversa,multinomial,beta,logarítmica,entreoutras.Essaclassededistribuiçõesfoi proposta,independentemente,porKoopman,PitmaneDarmois,nosanosde1935e 1936,aoestudaremaspropriedadesdesuficiênciaestatística.Posteriormente,muitos outrosaspectosdessafamíliaforamestudadosetornaram-seimportantesnateoria modernadaEstatística.OconceitodefamíliaexponencialfoiintroduzidonaEstatística porFisher,masosmodelosdafamíliaexponencialsurgiramnaMecânicaEstatística nofinaldoséculoXIXeforamdesenvolvidosporMaxwell,BoltzmanneGibbs.A importânciadessafamíliatevemaiordestaque,naáreadosmodelosderegressão,apartir dotrabalhopioneirodeNeldereWedderburn(1972),quedefiniramosmodeloslineares generalizados(MLGs).Nadécadade1980,essesmodelospopularizaram-se,inicialmente, noReinoUnido,e,posteriormente,nosEstadosUnidoseportodaEuropaocidental.
1.2FAMÍLIAEXPONENCIALUNIPARAMÉTRICA A famíliaexponencialuniparamétrica écaracterizadaporumafunção(deprobabilidadeoudensidade)especificadanaforma �� (��; ��) = ℎ(��) exp [ ��(��) ��
emqueasfunções ��(��), ��(��), �� (��) e ℎ(��) têmvaloresemsubconjuntosdosreais.As funções ��(��), ��(��) e �� (��) nãosãoúnicas.Porexemplo, ��(��) podesermultiplicadapor umaconstante ��,e �� (��) podeserdivididapelamesmaconstante.Adicionalmente,pelo teoremadafatoraçãodeNeyman-Fisher,aestatística �� ( ��) ésuficientepara ��
Váriasdistribuiçõesimportantespodemserexpressasnaforma(1.1),taiscomo: Poisson,binomial,Rayleigh,normal,gamaenormalinversa(astrêsúltimascoma suposiçãodequeumdosparâmetroséconhecido).Cordeiroetal.(1995)apresentaram24 distribuiçõesnaforma(1.1).Osuportedafamíliaexponencial(1.1),istoé, {��; �� (��; ��) > 0},nãopodedependerde ��.Assim,adistribuiçãouniformeem (0,��) nãoéummodelo dafamíliaexponencial.
Modeloslinearesgeneralizadoseaplicações
Éfácilcomprovarseumadistribuiçãopertenceounãoàfamíliaexponencial(1.1), comoédemonstradonostrêsexemplosqueseseguem.
Exemplo 1.1
AdistribuiçãodePoisson P(��) deparâmetro ��> 0,usadaparaanálisededados naformadecontagens,temfunçãodeprobabilidade
e,portanto,éummembrodafamíliaexponencial(1.1)com ��
Exemplo 1.2
Adistribuiçãobinomial B(��,��),com 0 <��< 1 e ��,onúmeroconhecidode ensaiosindependentes,éusadaparaanálisededadosnaformadeproporçõese temfunçãodeprobabilidade
,sendo, portanto,ummembrodafamíliaexponencial(1.1).
Exemplo 1.3
AdistribuiçãodeRayleigh,usadaparaanálisededadoscontínuospositivos, temfunçãodensidade (��> 0,��> 0)
e,portanto,pertenceàfamíliaexponencial(1.1)com
2log
Afamíliaexponencialnaformacanônicaédefinidapor(1.1),considerandoqueas funções ��(��) e �� (��) sãoiguaisàfunçãoidentidade,deformaque
Naparametrização(1.2), �� édenominadode parâmetrocanônico.Ologaritmoda funçãodeverossimilhançacorrespondenteaumaúnicaobservaçãonomodelo(1.2)é expressocomo ℓ(��) = ���� ��(��)+ log[ℎ(��)] e,portanto,afunçãoescore �� = �� (��) = ��ℓ(��)/���� resultaem �� = �� ��′ (��),sendoque ��′ (��) éaderivadadeprimeiraordemde ��(��) emrelaçãoa ��
Éfácilverificardaspropriedadesdafunçãoescore, E(��) = 0 e Var(��) = E ��2ℓ(��)/����2 = E(��′) (aúltimaigualdadeéainformaçãodeFisher),que
sendoque ��′′ (��) éaderivadadesegundaordemde ��(��) emrelaçãoa ��
Osimplesfatodesecalcularemmomentosdafamíliaexponencial(1.2)emtermos dederivadasdafunção ��(��) (denominadafunçãogeradoradecumulantes,verSeção 1.4)emrelaçãoaoparâmetrocanônico �� émuitoimportantenateoriadosmodeloslinearesgeneralizados,principalmentenocontextoassintótico.
1.3COMPONENTEALEATÓRIO OcomponentealeatóriodeumMLGédefinidoapartirdafamíliaexponencial uniparamétricanaformacanônica(1.2)comumparâmetroextradeperturbação, ��> 0, queéumamedidadedispersãodadistribuição,comoserádescritonaSeção2.3.Neldere Wedderburn(1972),aoproporemessamodelagem,conseguiramincorporardistribuições biparaméticasnocomponentealeatóriodomodelo.Tem-se
emque ��(·) e ��(·) sãofunçõesconhecidas.Quando �� éconhecido,afamíliadedistribuições(1.4)éidênticaàfamíliaexponencialnaformacanônica(1.2).Essafamília,também,éconhecidacomofamíliaexponenciallinear.NaSeção1.4,serádemonstradoque ovaloresperadoeavariânciade �� comdistribuiçãonafamília(1.4)são E(�� ) = �� = ��′ (��) eVar(�� ) = ����′′ (��).
Observa-se,apartirdaexpressãodavariância,que �� éum parâmetrodedispersão domodeloeseuinverso �� 1 ,uma medidadeprecisão.Afunçãoquerelacionao
ModeloLinearGeneralizado 2.1INTRODUÇÃO Aseleçãodemodeloséumaparteimportantedetodapesquisaemmodelagem estatística.Envolveencontrarummodeloquesejaomaissimplespossívelequedescreva bemoprocessogeradordosvaloresobservadosquesurgememdiversasáreasdoconhecimento,comoagricultura,demografia,ecologia,economia,engenharia,geologia, medicina,ciênciapolítica,sociologiaezootecnia,entreoutras.
NeldereWedderburn(1972)mostraramqueumconjuntodetécnicasestatísticas,comumenteestudadasseparadamente,podemserformuladas,deumamaneiraunificada, comoumaclassedemodelosderegressão.Aessateoriaunificadorademodelagemestatística,umaextensãodosmodelosclássicosderegressão,denominaram modeloslinearesgeneralizados (MLGs).Essesmodelosenvolvemumavariávelrespostaunivariada, variáveisexplanatóriaseumaamostraaleatóriade �� observaçõesindependentes,sendo que:
(i) avariávelresposta, componentealeatório domodelo,temdistribuiçãopertencenteàfamíliadedistribuições(1.4)queenglobaasdistribuiçõesnormal,gamae normalinversaparadadoscontínuos;binomialparaproporções;Poissonebinomialnegativaparacontagens;
(ii) asvariáveisexplanatóriasentramnaformadeumaestruturalinear,constituindo o componentesistemático domodelo;
(iii) aligaçãoentreoscomponentesaleatórioesistemáticoéfeitapormeiodeuma funçãoadequadacomo,porexemplo,logarítmicaparaosmodeloslog-lineares, denominada funçãodeligação.
Ocomponentesistemáticoéestabelecidoduranteoplanejamento(fundamentalpara aobtençãodeconclusõesconfiáveis)doexperimento,resultandoemmodelosderegressão(linearsimples,múltiplaetc.),deanálisedevariância(delineamentosinteiramente casualizados,casualizadosemblocos,quadradoslatinoscomestruturadetratamentos fatorial,parcelassubdivididasetc.)edeanálisedecovariância.Ocomponentealeatórioéespecificadoassimquesãodefinidasasmedidasaseremrealizadas,quepodem sercontínuasoudiscretas,exigindooajustedediferentesdistribuições.Apartirdeum mesmoexperimento,podemserobtidasmedidasdediferentestipos,como,dadosde alturadeplantas,númerodelesõesporplantaeproporçãodeplantasdoentes.
Modeloslinearesgeneralizadoseaplicações
Nomodeloclássicoderegressão,tem-se Y = �� + �� ,
sendo Y ovetor,dedimensões ��×1,davariávelresposta, �� = E(Y) = X��,ocomponente sistemático, �� amatrizdomodelo,dedimensões �� × ��, �� = ( ��1 , ··· ,�� ��)�� ,ovetor dosparâmetrosdesconhecidos, �� = (��1 , ··· ,����)�� ,ocomponentealeatóriocom ���� ∼ N(0,��2 ), �� = 1,...,��.Nessecaso,tem-sequeadistribuiçãonormal N( ��,��2 I) de Y defineocomponentealeatórioeovetordemédias �� dadistribuiçãonormaléigual aopreditorlinearquerepresentaocomponentesistemático.Essaéaformamais simplesdeligaçãoentreessesdoiscomponentes,sendodenominadadefunçãodeligação identidade.
Emmuitoscasos,porém,essaestruturaaditivaentreocomponentesistemáticoe ocomponentealeatórionãoéverificada.Alémdisso,nãohárazãoparaserestringir àestruturasimplesespecificadapelafunçãodeligaçãoidentidade,nemàdistribuição normalparaocomponentealeatórioeàsuposiçãodehomogeneidadedevariâncias.
Outrosmodelosforamsurgindoeosdesenvolvimentosqueconduziramaessavisão geraldamodelagemestatísticaremontamaquasedoisséculos.Entreosmétodosestatísticosparaaanálisededadosunivariados,quesãocasosespeciaisdosMLGs,citam-se:
(a) modeloclássicoderegressãomúltipla(Legendre,Gauss,iníciodoséculoXIX)e modelodeanálisedevariânciaparaexperimentosplanejados(Fisher,1920a1935) comoerrotendodistribuiçãonormal;
(b) modelocomplementolog-logparaensaiosdediluição,envolvendoadistribuição binomial(FISHER,1922);
(c) modeloprobito(BLISS,1935)paraoestudodeproporções,envolvendoadistribuiçãobinomial;
(d) modelologístico(BERKSON,1944;DYKE;PATTERSON,1952;RASCH,1960;COX, 1970)paraoestudodeproporções,envolvendoadistribuiçãobinomial;
(e) modeloslog-linearesparaanálisededadosnaformadecontagensemtabelasde contingência,envolvendoasdistribuiçõesdePoissonemultinomial(BIRCH,1963; HABERMAN,1970);
(f)modelologísticoparatabelasmultidimensionaisdeproporções;
(g) modelosdetestesdevida,envolvendoadistribuiçãoexponencial(FEIGL;ZELEN, 1965;ZIPPIN;ARMITAGE,1966;GASSER,1967);
(h) polinômiosinversosparaensaiosdeadubação,envolvendoadistribuiçãonormal naescalalogarítmicaelinearidadenaescalainversa(NELDER,1966);
(i)modelodeanálisedevariânciacomefeitosaleatórios;
(j)modeloestruturalparaanálisededadoscomdistribuiçãogama;
(l)modeloderegressãonão-simétrica.
Alémdessastécnicasusuais,outrosmodelospodemserdefinidosnocontextodos MLGscomoosmodelosdeBoxeCox(1964)ealgunsmodelosdesériestemporais.Devidoaograndenúmerodemétodosestatísticosqueengloba,ateoriadosMLGsvem desempenhandoumpapelimportantenaEstatísticamoderna,tantoparaespecialistas, quantoparanão-especialistas.EssesmodelospodemaindarepresentarummeiounificadodeensinodaEstatística,emqualquercursodegraduaçãooupós-graduação.
AlgumasreferênciasparaoestudodosMLGseextensõessão:Cordeiro(1986), McCullagheNelder(1989),Firth(1991),Morgan(1992),Francis,GreenePayne(1993), FahrmeireTutz(1994),McCullocheSearle(2000),Demétrio(2001),Collet(2002),Paula (2004),MolenberghseVerbeke(2005),Lee,NelderePawitan(2006),HardineHilbe (2007),DobsoneBarnett(2008)eAitkinetal.(2009).
2.2EXEMPLOSDEMOTIVAÇÃO Aseguir,serãoapresentadosalgunsdosmodelosqueapareceramnaliteratura, independentementeunsdosoutros,eque,conformeserámostrado,podemseragrupados deacordocomalgumaspropriedadescomuns,oquepermiteummétodounificadopara aestimaçãodosparâmetros.
2.2.1Ensaiosdotipodose-resposta Ensaiosdotipodose-respostasãoaquelesemqueumadeterminadadrogaéadministradaem �� diferentesdoses, ��1 ,...,���� ,respectivamente,a �� 1 ,...,���� indivíduos. Suponhaquecadaindivíduoresponde,ounão,àdroga,talquearespostaéquantal (tudoounada,istoé,1ou0).Apósumperíodoespecificadodetempo, �� 1 ,...,���� indivíduosrespondemàdroga.Porexemplo,quandouminseticidaéaplicadoaumdeterminadonúmerodeinsetos,elesrespondem(morrem)ounão(sobrevivem)àdoseaplicada. Quandoumadrogabenéficaéadministradaaumgrupodepacientes,elespodemmelhorar(sucesso)ounão(fracasso).Dadosresultantesdessetipodeensaiopodemser consideradosprovenientesdeumadistribuiçãobinomialcomprobabilidade ���� ,queéa probabilidadedeocorrência(sucesso)doeventosobestudo,ouseja,onúmerodesucessos ���� temdistribuiçãobinomialB(���� ,���� )
Osobjetivosdessetipodeexperimentosão,emgeral,modelaraprobabilidadede sucesso ���� comofunçãodevariáveisexplanatóriase,então,determinardosesefetivas (���� ��,dosesquecausammudançadeestadoem100��%dosindivíduos,porexemplo, ���� 50 ,���� 90 ),compararpotênciasdediferentesprodutosetc.
Estimação 3.1ESTATÍSTICASSUFICIENTES SejaumMLGdefinidopelasexpressões(2.4),(2.6)e(2.7)esuponhaqueasobservaçõesaseremanalisadassejamrepresentadaspelovetor y = (�� 1 , ,����)�� . Ologaritmo dafunçãodeverossimilhançacomofunçãoapenasde �� (considerando-seoparâmetro dedispersão �� conhecido),especificado y,édefinidopor ℓ( ��) = ℓ( ��; y) e,usando-sea expressão(2.4),tem-se
Aestimaçãodoparâmetrodedispersão �� seráobjetodeestudonaSeção4.4.Existem �� parâmetroscanônicos �� 1 ,...,���� e �� médias ��1 ,...,���� quesãodesconhecidos,mas quesãofunçõesde �� parâmetroslineares ��1 ,...,�� �� domodelo.Deve-se,primeiramente, estimarovetor �� deparâmetrosparadepoiscalcularasestimativasdovetor �� demédias edovetor �� deparâmetrospelasrelaçõesfuncionais ���� = �� 1 (x�� �� ��) e ���� = �� ( ���� ).
Seointervalodevariaçãodosdadosnãodependedeparâmetros,pode-sedemonstrar, paraosmodeloscontínuos(COX;HINKLEY,1986,Capítulo9),quetodasasderivadas de ∫ exp[ℓ( ��)]���� = 1 podemsercomputadasdentrodosinaldeintegraçãoequeo ponto ˆ �� correspondenteaomáximodologaritmodafunçãodeverossimilhança(3.1) estápróximodovetor �� deparâmetrosverdadeiroscomprobabilidadepróximadeumà medidaemque �� aumenta.Paraosmodelosdiscretos,aintegraçãoésubstituídapelo somatório.Essefatoocorreemproblemasdenominados regulares (COX;HINKLEY, 1986).
UmcasoimportantedosMLGssurgequandoovetor �� deparâmetroscanônicosda família(2.4)eovetor �� depreditoreslinearesem(2.6)sãoiguais,conduzindoàsfunções deligaçãocanônicas.Tem-se ���� = ���� = �� �� =1 ������ ���� ,para �� = 1,...,��. Asestatísticas ���� = �� ��=1 ���������� para �� = 1,...,�� sãosuficientesparaosparâmetros ��1 ,...,�� �� etêm
Modeloslinearesgeneralizadoseaplicações
dimensãomínima ��.Sejam ���� = �� ��=1 ������ ���� asrealizaçõesde ���� , �� = 1,...,��.Então,a equação(3.1)podeserescritanaforma
e,portanto, ℓ( ��) temaseguintedecomposição
emque ℓ1 (
Peloteoremadafatoração, S = (��1 , ··· ,�� ��)�� ésuficientededimensãomínima �� para �� = ( ��1 , ··· ,�� ��)�� e,portanto,ocorreumareduçãonadimensãodasestatísticas suficientesde �� (onúmerodeobservações)para �� (onúmerodeparâmetrosaserem estimados).Asestatísticas ��1 ,...,�� �� correspondemàmaiorreduçãoqueosdados podemter,semqualquerperdadeinformaçãorelevanteparasefazerinferênciasobreo vetor �� deparâmetrosdesconhecidos.
ConformedescritonaSeção2.3,asfunçõesdeligaçãoqueproduzemestatísticas suficientesdedimensãomínima �� paraasdiversasdistribuiçõessãodenominadas canônicas.ATabela2.7mostraqueessasfunçõesdeligaçãoparaosmodelosnormal, Poisson,binomial,gamaenormalinversosão �� = ��, �� = log( ��), �� = log[��/(�� ��)], �� = �� 1 e �� = �� 2 ,respectivamente.
3.2OALGORITMODEESTIMAÇÃO AdecisãoimportantenaaplicaçãodoMLGéaescolhadotrinômio:distribuiçãoda variávelresposta,matrizdomodelo(X)efunçãodeligação.Aseleçãopoderesultarde simplesexamedosdadosoudealgumaexperiênciaanterior.Inicialmente,consideraseessetrinômiofixoparaseobterumadescriçãoadequadadosdadospormeiodas estimativasdosparâmetrosdomodelo.Váriosmétodospodemserusadosparaestimaro vetor �� dosparâmetros,inclusiveoqui-quadradomínimo,obayesianoeaestimação-M. Aúltimaincluiométododemáximaverossimilhança(MV)quetemmuitaspropriedades ótimas,comoconsistênciaeeficiênciaassintótica.
Considerando-seométododeMVparaestimarosparâmetroslineares ��1 ,...,�� �� domodelo,ovetorescoreéformadopelasderivadasparciaisdeprimeiraordemdo logaritmodafunçãodeverossimilhança.Daexpressão(3.1)pode-secalcular,pela regradacadeia,ovetorescore U( ��) = ��ℓ( ��)/�� �� dedimensão ��,comelementotípico
( ��)
=
,pois
e,sabendo-seque
(3.2) para �� = 1,...,��.
Aestimativademáximaverossimilhança(EMV) ˆ �� dovetordeparâmetros �� é calculadaigualando-se ���� azeropara �� = 1,...,��. Emgeral,asequações ���� = 0, �� = 1,...,��, nãosãolinearesetêmqueserresolvidasnumericamenteporprocessos iterativosdotipoNewton-Raphson.
OmétodoiterativodeNewton-Raphsonparaasoluçãodeumaequação �� (��) = 0 é baseadonaaproximaçãodeTaylorparaafunção �� (��) navizinhançadoponto ��0 ,ouseja,
obtendo-se
ou,deumaformamaisgeral,
sendo �� (��+1) ovalorde �� nopasso(�� + 1), �� (��) ovalorde �� nopasso ��, �� (�� (��) ) a função �� (��) avaliadaem �� (��) e �� ′ (�� (��) ) aderivadadafunção �� (��) avaliadaem �� (��) . Considerando-sequesedesejaobterasoluçãodosistemadeequações U = U( ��) = ��ℓ( ��)/�� �� = 0 e,usando-seaversãomultivariadadométododeNewton-Raphson,temse �� (��+1) = �� (��) +(J(��) ) 1 U(��) , sendo �� (��) e �� (��+1) osvetoresdeparâmetrosestimadosnospassos �� e (�� + 1), respectivamente, U(��) ovetorescoreavaliadonopasso ��,e (J(��) ) 1 ainversada
4.1DISTRIBUIÇÃODOSESTIMADORESDOSPARÂMETROS
Nomodeloclássicoderegressão,emqueavariávelrespostatemdistribuiçãonormal eafunçãodeligaçãoéaidentidade,asdistribuiçõesdosestimadoresdosparâmetrose dasestatísticasusadasparaverificaraqualidadedoajustedomodeloaosdadospodem serdeterminadasexatamente.Emgeral,porém,aobtençãodedistribuiçõesexatas nosMLGsémuitocomplicadaeresultadosassintóticossão,rotineiramente,usados. Essesresultados,porém,dependemdealgumascondiçõesderegularidadeedonúmero deobservaçõesindependentes,mas,emparticular,paraosMLGsessascondiçõessão válidas(FAHRMEIR;KAUFMANN,1985).
Aideiabásicaéque,se ˆ �� éumestimadorconsistenteparaumparâmetro �� e Var( ˆ ��) éavariânciadesseestimador,então,paraamostrasgrandes,tem-se: (i) ˆ �� éassintoticamentenãoviesado(istoé,E[ ˆ ��]→ �� quando �� →∞); (ii)aestatística
ou,deformaequivalente,
Se ˆ �� éumestimadorconsistentedeumvetor �� de �� parâmetros,tem-se,assintoticamente,que
ˆ �� ��)�� V 1 ( ˆ ��
)∼
2
, sendo V amatrizdevariânciasecovariânciasde ˆ ��,supostanão-singular.Se V ésingular, usa-seumamatrizinversageneralizadaou,então,umareparametrizaçãodeformaase obterumanovamatrizdevariânciasecovariânciasnãosingular.
SejaumMLGdefinidoporumadistribuiçãoem(2.4),umaestruturalinear(2.6)e umafunçãodeligação(2.7).ÉfatoconhecidoqueosEMVstêmpoucaspropriedades
Modeloslinearesgeneralizadoseaplicações
quesãosatisfeitasparatodosostamanhosdeamostras,comosuficiênciaeinvariância. Aspropriedadesassintóticasdesegunda-ordemde ˆ ��,comooviésdeordem �� (�� 1 ) ea suamatrizdecovariânciadeordem �� (�� 2 ),foramestudadasporCordeiroeMcCullagh (1991)eCordeiro(2004a),Cordeiro(2004b),Cordeiro(2004c),respectivamente.
Define-seovetorescore U( ��) = ��ℓ( ��)/�� �� comonaSeção3.2.Como,emproblemas regulares(COX;HINKLEY,1986,Capítulo9),ovetorescoretemvaloresperadozeroe estruturadecovariânciaigualàmatrizdeinformação K,tem-sedaequação(3.2)que E[U( ��)] = 0 e
[U( ��)] = E[U( ��)U
ConformedemonstradonaSeção3.2,amatrizdeinformaçãopara �� nosMLGséexpressa por K = �� 1 X�� WX
Oteoremacentraldolimiteaplicadoa U( ��) (queequivaleaumasomadevariáveis aleatóriasindependentes)implicaqueadistribuiçãoassintóticade U( ��) énormal ��variada,istoé, N �� (0, K) Paraamostrasgrandes,aestatísticaescoredefinidapelaforma quadrática ���� = U( ��)�� K 1 U( ��) tem,aproximadamente,distribuição ��2 ��,supondoser verdadeiroomodelo,comovetordeparâmetros �� especificado.
Deformaresumidatêm-se,aseguir,algumaspropriedadesdoestimador ˆ ��:
i)Oestimador ˆ �� éassintoticamentenãoviesado,istoé,paraamostrasgrandes E( ˆ ��) = �� Suponhaqueologaritmodafunçãodeverossimilhançatemumúnicomáximo em ˆ �� queestápróximodoverdadeirovalorde ��.Aexpansãoemsériemultivariadade Taylordovetorescore U( ˆ ��) emrelaçãoa ��,atétermosdeprimeiraordem,substituindoseamatrizdederivadasparciaisdesegundaordempor K,implicaem
pois ˆ �� éasoluçãodosistemadeequações U( ˆ ��) = 0. Asvariáveisaleatórias U( ��) e K( ˆ �� ��) diferemporquantidadesestocásticasdeordem �� �� (1). Portanto,tem-seaté ordem �� 1/2 emprobabilidade
supondoque K sejanãosingular.
Aexpressãoaproximada(4.2)édegrandeimportânciaparaadeterminaçãode propriedadesdoEMV ˆ ��.Asvariáveisaleatórias ˆ �� �� e K 1 U( ��) diferemporvariáveis aleatóriasdeordem �� 1 emprobabilidade.Tem-se,então,que
pois E[U( ��)] = 0 e,portanto, ˆ �� éumestimadornãoviesadopara �� (pelomenos assintoticamente).Narealidade, E( ˆ ��) = ��+�� (�� 1 ),sendoqueotermodeordem �� (�� 1 ) foicalculadoporCordeiroeMcCullagh(1991).CordeiroeBarroso(2007)obtiveramo termodeordem �� (�� 2 ) daexpansãodeE( ˆ ��)
ii)Denotando-se U = U( ��) eusando(4.1)e(4.2),tem-sequeamatrizdevariâncias ecovariânciasde ˆ ��,paraamostrasgrandes,éexpressapor
Cov( ˆ ��) = E[( ˆ �� ��)( ˆ �� ��)�� ] = K 1 E(UU�� )K 1 �� = K 1 KK 1 = K 1 , pois K 1 ésimétrica.Narealidade, Cov( ˆ ��) = K 1 +�� (�� 2 ), sendoqueotermomatricial deordem �� (�� 2 ) foicalculadoporCordeiro(2004c).
iii)Paraamostrasgrandes,tem-seaaproximação
ou,deformaequivalente,
ouseja, ˆ �� temdistribuiçãoassintóticanormalmultivariada.Paramodeloslinearescoma variávelrespostaseguindoadistribuiçãonormal,asequações(4.3)e(4.4)sãoresultados exatos.FahrmeireKaufmann(1985),emumartigobastantematemático,desenvolveram condiçõesgeraisquegarantemaconsistênciaeanormalidadeassintóticadoEMV ˆ �� nosMLGs.
Paraamostraspequenas,comocitadoemi),oestimador ˆ �� éviesadoetorna-senecessáriocomputaroviésdeordem �� 1 ,quepodeserapreciável.Também,para �� não muitogrande,comocitadoemii),aestruturadecovariânciadosEMVsdosparâmetros linearesdiferede K 1 .Umademonstraçãorigorosadosresultadosassintóticos(4.3)e (4.4)exigeargumentosdoteoremacentraldolimiteadaptadoaovetorescore U( ��) eda leifracadosgrandesnúmerosaplicadaàmatrizdeinformação K.Pode-se,então,demonstrar,commaisrigor,anormalidadeassintóticade ˆ ��,commédiaigualaoparâmetroverdadeiro �� desconhecido,ecommatrizdecovariânciaconsistentementeestimada por K 1 = ��(X�� WX) 1 ,emque W éamatrizdepesos W avaliadaem ˆ ��.
ParaasdistribuiçõesbinomialedePoisson, �� = 1.Seoparâmetrodedispersão �� forconstanteparatodasasobservaçõesedesconhecido,afetaráamatrizdecovariância assintótica K 1 de ˆ ��,masnãoovalorde ˆ ��.Naprática,se �� fordesconhecido,deverá sersubstituídoporalgumaestimativaconsistente(Seção4.4).
Adistribuiçãoassintóticanormalmultivariada N �� ( ��, K 1 ) de ˆ �� éabasedaconstruçãodetesteseintervalosdeconfiança,emamostrasgrandes,paraosparâmetros
ResíduoseDiagnósticos 5.1INTRODUÇÃO AescolhadeumMLGenglobatrêsetapasprincipais:i)definiçãodadistribuição (quedeterminaafunçãodevariância);ii)definiçãodafunçãodeligação;iii)definição damatrizdomodelo.
Naprática,porém,podeocorrerque,apósescolhacuidadosadeummodeloe subsequenteajusteaumconjuntodeobservações,oresultadoobtidosejainsatisfatório. Issodecorreemfunçãodealgumdesviosistemáticoentreasobservaçõeseosvalores ajustadosou,então,porqueumaoumaisobservaçõessãodiscrepantesemrelaçãoàs demais.
Desviossistemáticospodemsurgirpelaescolhainadequadadafunçãodevariância (falsadistribuiçãopopulacionalparaavariávelresposta),dafunçãodeligaçãoeda matrizdomodelo,ouaindapeladefiniçãoerradadaescaladavariáveldependenteoudas variáveisexplanatórias(umparâmetroimportantequeestásendoomitidonomodelo)ou mesmoporquealgumasobservaçõessemostramdependentesouexibemalgumaforma decorrelaçãoserial.Discrepânciasisoladaspodemocorrerporqueospontosestãonos extremosdaamplitudedevalidadedavariávelexplanatória(umaoumaisobservações nãopertencendoàdistribuiçãopropostaparaavariávelresposta),ouporqueelesestão realmenteerradoscomoresultadodeumaleituraincorretaouumatranscriçãomalfeita, ouaindaporquealgumfatornãocontroladoinfluenciouaobtençãodeles.
Naprática,emgeral,háumacombinaçãodosdiferentestiposdefalhas.Assim, porexemplo,adetecçãodeumaescolhaincorretadafunçãodeligaçãopodeocorrer porqueelaestárealmenteerradaouporqueumaoumaisvariáveisexplanatóriasestão naescalaerradaoudevidoàpresençadealgunspontosdiscrepantes.Essefatofaz comqueaverificaçãodaadequaçãodeummodeloparaumdeterminadoconjunto deobservaçõessejaumprocessorealmentedifícil.Maioresdetalhessobreanálisede resíduosediagnósticospodemserencontradosemAtkinson(1985),Cordeiro(1986), Atkinsonetal.(1989),McCullagheNelder(1989),Francis,GreenePayne(1993),Paula (2004)eMoral,HindeeDemétrio(2017).
5.2TÉCNICASPARAVERIFICAROAJUSTEDEUMMODELO Astécnicasusadascomesseobjetivopodemserformaisouinformais.Asinformais baseiam-seemexamesvisuaisdegráficosparadetectarpadrões,ouentão,pontos discrepantes.Asformaisenvolvemespecificaromodelosobpesquisaemumaclasse maisamplapelainclusãodeumparâmetro(ouvetordeparâmetros)extra (��).Asmais usadassãobaseadasnostestesdarazãodeverossimilhançaseescore.Parâmetrosextras podemaparecerdevidoà:
•inclusãodeumavariávelexplanatóriaadicional;
• inclusãodeumavariávelexplanatória �� emumafamília ℎ(��; ��) indexadaporum parâmetro ��,sendoumexemploafamíliadeBox-Cox;
• inclusãodeumafunçãodeligação ��( ��) emumafamíliamaisampla ��( ��; ��),sendo umexemploafamíliadeAranda-Ordaz(1981),especificadanoExercício3do Capítulo2;
• inclusãodeumavariávelconstruída,porexemplo ˆ ��2 ,apartirdoajusteoriginal, paraotestedeadequaçãodafunçãodeligação;
• inclusãodeumavariável dummy tendoovalor1(um)paraaunidadediscrepantee 0(zero)paraasdemais.Issoéequivalenteaeliminaressaobservaçãodoconjunto dedados,fazeraanálisecomaobservaçãodiscrepanteesemelaeverificar,então, seamudançanovalordodesvioésignificativa,ounão.Ambos,porém,dependem dalocalizaçãodo(s)ponto(s)discrepante(s).
5.3ANÁLISEDERESÍDUOSEDIAGNÓSTICOS PARAOMODELOLINEARCLÁSSICO Nomodeloclássicoderegressão y = X�� + �� ,oselementos ���� dovetor �� sãoas diferençasentreosvaloresobservados ���� eaquelesesperados ���� pelomodelo.Esses elementossãodenominadoserrosaleatórios(ouruídosbrancos)econsidera-seque os ���� sãoindependentese,alémdisso,que ���� temdistribuiçãonormalcommédiazero evariância ��2 ,istoé, N(0,��2 ).Essestermosrepresentamavariaçãonaturaldos dados,mas,também,podemserinterpretadoscomooefeitocumulativodefatores quenãoforamconsideradosnomodelo.Seaspressuposiçõesdomodelosãovioladas, aanáliseresultantepodeconduziraresultadosduvidosos.Essetipodeviolaçãodo modelooriginaasfalhasdenominadassistemáticas(nãolinearidade,nãonormalidade, heterocedasticidade,nãoindependênciaetc.).Outrofatobastantecomuméapresençade pontosatípicos(falhasisoladas),quepodeminfluenciar,ounão,noajustedomodelo.Eles podemsurgirdeváriasmaneiras.SegundoAtkinson(1985),algumaspossibilidadessão:
• devidoaerrosgrosseirosnavariávelrespostaounasvariáveisexplanatórias,por medidaserradasouregistrodaobservação,ouainda,errosdetranscrição; •observaçãoprovenientedeumacondiçãodistintadasdemais;
• modelomalespecificado(faltadeumaoumaisvariáveisexplanatórias,modelo inadequadoetc.);
• escalausadadeformaerrada,istoé,talvezosdadossejammelhordescritosapós umatransformação,dotipologarítmicaouraizquadrada,porexemplo;
• apartesistemáticadomodeloeaescalaestãocorretas,masadistribuiçãoda respostatemumacaudamaislongadoqueadistribuiçãonormal.
Apartirdeumconjuntodeobservaçõeseajustando-seumdeterminadomodelo com �� parâmetroslinearmenteindependentes,paraverificaraspressuposiçõesdevem serconsideradoscomoelementosbásicos:
•osvaloresestimados(ouajustados) ˆ ���� ; •osresíduosordinários ���� = ���� ˆ ����
• avariânciaresidualestimada(ouquadradomédioresidual), ˆ ��2 = ��2 = QMRes =
��=1 (���� ˆ ���� ) 2 /(�� ��);
• oselementosdadiagonal(leverage)damatrizdeprojeção H = X(X�� X) 1 X�� , istoé, ℎ���� = x �� �� (X�� X) 1 x�� , sendo x�� �� = (����1 ,...,������).
Umaideiaimportanteéadadeleção(deletion),istoé,acomparaçãodoajustedo modeloescolhido,considerando-setodosospontos,comoajustedomesmomodelosem ospontosatípicos.Asestatísticasobtidaspelaomissãodeumcertoponto �� sãodenotadas comumíndiceentreparênteses.Assim,porexemplo, ��2 (�� ) representaavariânciaresidual estimadaparaomodeloajustado,excluídooponto ��.
5.3.1Tiposderesíduos Valedestacarqueosresíduostêmpapelfundamentalnaverificaçãodoajustede ummodelo.Váriostiposderesíduosforampropostosnaliteratura(COOK;WEISBERG, 1982;ATKINSON,1985).
(a) Resíduosordinários
Osresíduosdoprocessodeajustepormínimosquadradossãodefinidospor
AplicaçõesaDadosContínuos Nestecapítulo,apresentam-seanálisesdosseguintesconjuntosdedadoscontínuos: volumedeárvores,gorduranoleite,importaçãobrasileira,temposdesobrevivênciade ratoseassinaturasdeTVacabo.
6.1DADOSDEVOLUMEDEÁRVORES OsdadosdaTabelaA1,doApêndiceA,referem-seamedidasdediâmetroa4,5pés acimadosolo(��, polegadas)edealtura(��, pés)de31cerejeiras(“blackcherry”)empée devolume(��, péscúbicos)deárvoresderrubadas(RYAN;JOINER;JR.,1976)emumaárea daflorestaAlleghenyNationalForest.Oobjetivodessetipodeestudoépredizerovolume demadeiraaserextraídacomofunçãodasmedidasdiâmetroealturanasárvoresempé.
AFigura6.1apresentaosgráficosdedispersãodasvariáveisduasaduasparaosdados observadosnasescalasoriginalelogarítmica.Pode-severificarqueexisteumarelação funcionalmaiorentrevolumeediâmetroàalturadopeitoeentrevolumeealtura.Além disso,asobservaçõesdavariávelvolumecomofunçãodaalturatêmvariabilidademaior doqueasobservaçõesdavariávelvolumecomofunçãododiâmetroàalturadopeito.
Comoumprimeiromodelo(M1 )paraaanálisedessesdados,supõe-sequeavariável respostaé �� = �� + ��1 ,emque �� = �� e ��1 ∼ N(0,��2 1 ) e,portanto, �� ∼ N( ��,��2 1 ),a funçãodeligaçãoéaidentidade �� = ��,eopreditorlinearéexpressopor
, (6.1) emque ��1 = �� e ��2 = ��.
Umsegundomodelo(M2 )baseia-senofatodequeovolumeéproporcionalao produtododiâmetroàalturadopeitopelaaltura,istoé, �� ≈ ��0 �� ��1 �� ��2 e,portanto, log(�� )≈ ��0 + ��1 log(��)+ ��2 log(��).Então,pode-sesuporqueparaavariávelrespostanaescalalogarítmica �� = �� + ��2 ,emque �� = log(�� ) e ��2 ∼ N(0,��2 2 ) e,portanto, �� ∼ N( ��,��2 2 ),afunçãodeligaçãoéaidentidade, �� = ��,eopreditorlinearéexpresso por(6.1)com ��1 = log(��) e ��2 = log(��)
Comoumterceiromodelo(M3 ),supõe-sequeavariávelrespostaé �� = �� + ��3 ,em que �� = ��, �� = ��0 �� ��1 �� ��2 e ��3 ∼ N(0,��2 3 ) e,portanto, �� ∼ N( ��,��2 3 ),afunçãodeligaçãoéalogarítmica �� = log( ��) eopreditorlinearéexpressopor(6.1)com ��1 = log(��) e ��2 = log(��).
Figura6.1 Gráficodedispersãoparaosdadosdecerejeirasnasescalasoriginalelogarítmica.
Apósoajustedessestrêsmodelos,foramfeitos:(a)osgráficosdevaloresobservados versusvaloresajustados;(b)osgráficosdosresíduosestudentizadosversusvalores ajustadosparaosmodelosM1eM2edoscomponentesdodesvioversusvaloresajustados paraomodeloM3;e(c)gráficosnormaisdeprobabilidadecomenvelopessimulados paraosresíduosestudentizadosparaosmodelosM1eM2edoscomponentesdodesvio paraomodeloM3,usando-seopacote hnp dosoftwareR(MORAL;HINDE;DEMÉTRIO, 2017).Verificou-sequeexistemevidênciasdeumbomajustedetodoseles,conforme revelaaFigura6.2.
ATabela6.1apresentaosquadrosdaanálisedavariânciaedosdesviosparaaanálise dosdadosnaescalaoriginal(M1 ),naescalalogarítmica(M2 )eusandofunçãodeligação logarítmica(M3 ).Verifica-sequeexistemevidências,aonívelde 1% designificância,que osefeitostantododiâmetroàalturadopeito,comodaaltura,sãosignificativos,sendo queoefeitododiâmetroàalturadopeitoémaiordoqueodaaltura,paraostrêsmodelos. Entretanto,émuitomaisfortenocasodosmodelos M2 e M3 .Háevidências,portanto,de queambasasvariáveisexplanatórias–alturaediâmetro–sãonecessáriasparaexplicar ovolumeequeomelhorajusteéobtidocomosdadosnaescalalogarítmicaouusando afunçãodeligaçãologarítmica.Testes �� (equivalentesaostestes ��)eintervalosdeconfiançaparaosparâmetroseintervalosdeprevisãopara �� podem,então,sercalculados.
Valores ajustados
Valores observados
Quantis teóricos
Figura6.2 Gráficosdevaloresobservadosversusvaloresajustados;gráficosdosresíduos estudentizadosversusvaloresajustadosparaosmodelosM1eM2edoscomponentesdodesvio versusvaloresajustadosparaomodeloM3egráficosnormaisdeprobabilidadecomenvelopes simuladosparaosresíduosestudentizadosparaosmodelosM1eM2edoscomponentesdo desvioparaomodeloM3,paraosdadosdecerejeiras.
Hánecessidade,porém,deumestudomaisdetalhado,fazendo-seumaanálisedos resíduosedediagnóstico,paraaescolhadomodelofinal.Conformepode-severificar naFigura6.3,háindicaçãodequeomodelo M1 nãoseajustabemàsobservações. Nográficodosvaloresajustadosversusvaloresobservados,destacam-secomopontos extremosasobservações1,2,3e31,enquantonográficodosvaloresabsolutosdeDFFitS
AplicaçõesaDadosDiscretos Nestecapítulo,serãoapresentadasdiversasaplicaçõescomdadosnasformasdeproporções edecontagens.Osprogramasem R estãonoApêndiceB.
7.1DADOSBINÁRIOSEPROPORÇÕES 7.1.1Estimaçãodadoseefetivaeseuintervalodeconfiança ComofoidescritonaSeção2.2doCapítulo2,ensaiosdotipodose-respostasãomuitousados naáreadetoxicologia.Emgeral,osdadosresultantessãoproporçõeseosmodelosmaisusados sãologístico,probitoecomplementolog-log,que,quandoopreditorlinearéumaregressão linearsimples,podemserexpressospor
emque ���� éaprobabilidadedesucessodoeventosobestudo, �� (·) umaf.d.a.deinteressee ���� é avariávelexplanatória.Essesmodelos,ajustadosaconjuntosdedados,podemserusadospara sumarizá-lospelopardeestimativas ( ˆ ��0, ˆ ��1) dosparâmetroseformamabaseparacomparação dediferentesconjuntosdedados(MORGAN,1992).Assim,porexemplo,podemseradotados paracompararapotênciadediferentesprodutos(inseticidas,fungicidas,herbicidasetc.).
Emgeral,porém,ointeresseestánadeterminaçãodeestimativasdedosesefetivas, �� �� (DE100 �� ),quesãodosesque,sobomodeloajustado,causamumamudançadeestadoem100p% dosindivíduos.UmexemplomuitocomuméadeterminaçãodaDL50 (tambémdenominadadose mediana)queéadosequecausa50%deumamudançadeestado(porexemplo,mortalidade)dos indivíduos.De(7.1)paraumvalor �� especificado,tem-se
sendoque �� �� representaadoseefetiva.Portanto,deumaformageral,aestimativadadose efetiva �� �� écalculadapelaexpressão
queparaosmodeloscomumenteusadostransforma-seem
Modeloslinearesgeneralizadoseaplicações Logístico : logit
Probito : probit
OmodelodeAranda-Ordaztemcomocasosparticularesomodelologístico(�� = 1)eo modelocomplementolog-log(�� → 0).Umaestimativade �� podeserobtidapelométodode perfildeverossimilhança.
Se �� = 0, 50,verifica-seque,paraqualquermodelosimétrico,portanto,incluindoosmodelos logísticoeprobito,adoseefetivaédadapor
enquantoparaomodelocomplementolog-logéexpressapor
Éimportantenotarque,seomodeloestácomofunçãodologaritmo,emumabase �� qualquer, dadose,então, ˆ �� �� = log�� ( ˆ �� �� ) e,portanto,adoseefetivaéobtidaconsiderando-se
Aestimativaporpontodeumadoseefetivanemsempreésuficiente,havendonecessidade deseobteremintervalosdeconfiançapara �� �� .Entretanto, ˆ �� �� ,calculadapelaexpressão(7.3),é umquocientedevariáveisaleatóriasque,assintoticamente,têmdistribuiçãonormal,ouseja, ˆ ��0 ∼ N( ��0, Var( ˆ ��0)), ˆ ��1 ∼ N( ��1, Var( ˆ ��1)) e Cov( ˆ ��0, ˆ ��1) ≠ 0,istoé, ˆ �� ∼ N( ��, V) (Seção4.1), emque V = Cov( ˆ ��) éamatrizdevariânciasecovariânciasdosestimadoresdosparâmetros (inversadamatrizdeinformaçãodeFisher).Osmétodosaproximadosmaiscomumenteusados paraaconstruçãodeintervalosdeconfiançaparadosesefetivassão:ométododelta,odeFieller eodarazãodeverossimilhanças(MORGAN,1992;COLLET,2002).
Métododelta
AvariânciaassintóticadoEMVdeumafunçãoescalar ��( ˆ ��) deumvetor ˆ ��,dedimensão ��, deestimativasdeparâmetrosdesconhecidos,quandoamatrizdecovariânciasde ˆ �� éconhecida,
podeserdeterminadausando-seométododelta.EssemétodoébaseadonaexpansãodeTayloraté primeiraordemesupõeque,segundocondiçõesgeraisderegularidade,adistribuiçãoassintótica doEMV ˆ �� éN �� ( ��, V),sendo V obtidapelainversadamatrizdeinformação.
Tem-se,supondoqueasderivadasparciais ����( ��)/������ sãocontínuasenãotodasnulasem ˆ ��,
emque ��2 = Var[��
,...,����/���� �� )�� .Naprática, ��( ��), V e �� sãoestimadosem ˆ ��,paraquesejamrealizadostestesdehipótesesecontruídosintervalosde confiançapara ��( ��),baseando-senaaproximaçãonormalN(��( ��),��2).
Ilustra-se,agora,ométododeltaparaestimaravariânciadadoseefetivadeumtratamento correspondenteaumataxaespecificada 100��% demortalidadeemumexperimentodedoseresposta.Suponhaqueamatrizdeinformação K de ˆ
�� éestimada.Seja K 1 asua inversa,especificadapor
Deacordocomométododelta,fazendo-seumaexpansãodeTaylordeprimeiraordempara aexpressão(7.3)de ��
emtornode
,tem-se
Pelométododelta,supõe-sequeadistribuiçãoassintóticade
= ��( ˆ
) obtidausando-sea expressão(7.3)énormal N(�� �� ,��2) e,portanto,umintervalocom 100(1 ��)% deconfiança aproximadoparaadoseefetiva �� �� éexpressopor
emque �� ��/2 éopercentil (1 ��/2) dadistribuiçãonormalreduzida.
Umadesvantagemdessemétodoéqueointervalodeconfiançaésempresimétrico,oque podeserdesfavorávelàestimaçãodedosesefetivasextremascorrespondentesavaloresde �� próximosde0ou1.Pode,também,implicaremlimitesinferioresnegativos.Alémdisso,está baseadonadistribuiçãonormalassintóticade ��( ˆ ��)
MODELOS LINEARES GENERALIZADOS E APLICAÇÕES Gauss M. Cordeiro
Obteve seu PhD em Estatística no Imperial College, Universidade de Londres (1982), e tem pós-doutorado no Instituto de Matemática Pura e Aplicada (1990-1992). Publicou mais de 400 artigos em periódicos internacionais e orientou mais de 60 alunos de pós-graduação. Trabalha na área de Análise de Sobrevivência, Distribuições de Probabilidade e Modelos de Regressão.
Clarice G. B. Demétrio
Tem graduação em Engenharia Agronômica (1972-75), e mestrado (1976-79) e doutorado (1979-85) em Estatística e Experimentação Agronômica na ESALQ/USP, pós-doutorado no Imperial College of Science and Technology, Londres (1986-87) e Doctor Honoris Causa (2019) pela University of Hasselt, Bélgica. É professora titular no Departamento de Ciências Exatas da ESALQ/USP, desenvolvendo pesquisa e orientando, principalmente, em Modelos Lineares Generalizados e Extensões.
Rafael A. Moral
Professor associado de Estatística e diretor do grupo de pesquisas em Ecologia Teórica e Estatística na Maynooth University, Irlanda. Tem graduação em Ciências Biológicas (2007-11), e mestrado (2012-14) e doutorado (2014-17) em Estatística e Experimentação Agronômica pela ESALQ/USP. Desenvolve pesquisa em Modelagem Estatística Aplicada a Ecologia, Manejo da Vida Selvagem, Agricultura e Ciências Ambientais.
www.blucher.com.br
ABE - PROJETO FISHER