/07p1

Page 1

Combineren van sterktemetingen uit verschillende bronnen dr. Eric Schoen / drs. Jan Telman TNO Industrie en Techniek p. PB 155, 2600 AD Delft e. eric.schoen@tno.nl / jan.telman@tno.nl t. 015 269 2125 / 015 269 2286 versie: datum:

5a 16 april 2007

Asfalt dijkbekledingen moeten periodiek beoordeeld worden op weerstand tegen golfklappen. Daartoe worden op diverse plaatsen van de dijk kernen uitgeboord. Van elke kern worden twee proefstukken gemaakt. Het ene wordt onderworpen aan een vermoeiingsproef. Een belasting F wordt volgens een vaste frequentie opgelegd en weer weggenomen. Na N lastherhalingen breekt het stuk. Dit aantal is een maat voor de vermoeiingssterkte. Het andere proefstuk van een boorkern wordt onderworpen aan een bezwijkproef. Het stuk wordt onderworpen aan een oplopende belasting totdat het breekt. De belasting waarbij dat optreedt is de breuksterkte B. Op elke bemonsterde locatie van de dijk wordt de sterkte dus gekarakteriseerd door drie getallen: F, N en B. Daarbij zijn B en F beide krachten en N is een telling. Het is gebruikelijk dat van alle drie grootheden de dekadische logaritme (10log) wordt genomen. Ook gebruikelijk is de koppeling van de breuksterkte aan een aantal lastherhalingen N van 1 of een log(N) van 0. Uit de beschrijving van de bemonstering en bemeting van de asfaltbekledingen is duidelijk dat er twee verschillende informatiebronnen voor de sterkte van die bekleding zijn. De vraag die ik in dit document wil behandelen luidt: Hoe combineer ik twee verschillende informatiebronnen in ĂŠĂŠn model voor levensduur als functie van sterkte? De notatie van de sterktes in dit document wijkt af van wat gebruikelijk is. In de praktijk worden de sterktes namelijk met aangeduid. Dit symbool wil ik graag reserveren voor de standaarddeviatie van waarnemingen, zoals dat in de statistiek gebruikelijk is.

Meetgegevens In een recente beoordelingsronde zijn 8 kernen genomen op elk van de volgende dijkvakken: de Helderse, Pettense en Hondsbossche zeewering en de zeewering bij het Flaauwe Werk. Bovendien zijn er 14 kernen genomen uit de zeewering tussen Koehool en Zwarte Haan. De resultaten staan weergegeven in Figuur 1. De getrokken rechte lijn is de best passende rechte bij de vermoeiingsproeven met opgelegde spanning. De kromme lijn is afkomstig uit een model dat we later zullen bespreken. Het zwarte punt geeft de gemiddelde breuksterkte weer. In de figuur is

1


Figuur 1 Beproeving van kernen uit 5 dijklichamen

niet zichtbaar dat de meetpunten twee aan twee bij elkaar horen: bij elk paar (logF, logN) hoort een paar (logB, 0), afkomstig van 2 balkjes uit dezelfde boorkern. In de hierna beschreven statistische analyse is met deze paarvorming wel degelijk rekening gehouden.

Statistische analysemethode I: de ingrediënten We willen de informatie uit de breuksterkten graag gebruiken om iets te zeggen over de curve van logN versus logF in het schaars bemeten gebied. Ik stel voor om dit te doen met een zogenoemde Bayesiaanse analyse van de gegevens. Zo’n analyse heeft drie ingrediënten: 1. een kwantitatief model voor de waarnemingen 2. een reeks waarnemingen

2


3. prior verdelingen. Dit zijn statistische verdelingen die de huidige onzekerheid weergeven over de kerngrootheden van het model van de waarnemingen

Als ingrediënt 1 stel ik het volgende model voor. Voor het duo van de 2 balkjes uit boorkern i veronderstellen we: voor de breuksterkte (ene balkje): log Bi = + e1i met e1i ~ N( , 2B) [1] voor de vermoeiingssterkte (andere balkje): log Ni = i + e2i met e2i ~ N(0, 2N) [2] verder veronderstellen we de volgende curve ( - log Fi) [3] i = Door in deze relaties dezelfde index i te gebruiken voor log N, log B en log F koppelen we deze grootheden voor de 2 balkjes uit boorkern i aan elkaar. Relatie [1] geeft aan dat gemiddeld over de verschillende kernen de breuksterkte op een niveau ligt, en dat de verschillende kernen i daarom heen spreiden volgens een normale verdeling met standaardafwijking B (variantie B2). De modelparameter kan worden gezien als de gemiddelde ‘grenssterkte’ van het dijkvak. De B is een maat voor de spreiding t.g.v. variatie binnen het vak in combinatie met de meetfout. Relaties [2] en [3] geven aan dat de vermoeiingssterkte per kern i kan verschillen, afhankelijk van de opgelegde kracht. De relatie met de opgelegde kracht wordt gegeven door het wortelmodel [3], waarbij de modelparameter de ‘gevoeligheid’ aangeeft. Voor een willekeurige kern i wordt de voorspelde sterkte log Ni door model [3] bepaald als i. In relatie [2] wordt nog aangegeven dat de gemeten waarden rond deze voorspelling (punt op de curve) spreiden volgens een normale verdeling met standaardafwijking N (variantie N2). De N is een maat voor de spreiding t.g.v. variatie binnen het vak en de meetfout. In de statistische analyse worden de modelparameters , , B2 en N2 geschat op basis van de meetresultaten op een dijkvak. Omdat de 2 meetwaarden van de balkjes uit een specifieke kern i via de index i bij elkaar blijven, wordt in de analyse rekening gehouden met deze paarvorming. Voor 1 kern zou je de en zodanig kunnen schatten dat de curve precies door de 2 meetpunten van die kern loopt. Voor alle kernen van het dijkvak samen levert de analyse een gemeenschappelijke curve op die zo goed mogelijk bij alle meetpunten uit dat dijkvak past. De spreiding van de punten rond die curve wordt dan gekarakteriseerd door de geschatte varianties B2 en N2. Ingrediënt 2 van de Bayesiaanse analyse is niet anders dan de reeks waarnemingen waar we al kennis mee hebben gemaakt (zie Figuur 1).

Ingrediënt 3, de prior verdeling is iets nieuws. Het is een kwantitatieve formulering van ons idee over de parameters van het model [1] – [3] voordat we over meetgegevens beschikken. De formulering maakt gebruik van kansverdelingen. Als we vooraf geen idee hebben hoe de vlag erbij staat, dan formuleren we brede verdelingen; als we al wat weten dan kunnen we die informatie inbrengen door een preciezere formulering die wordt gerepresenteerd door een smallere prior verdeling.

3


Voor beide varianties heb ik een “vage” prior gebruikt, waarmee wordt aangegeven dat we nog maar weinig voor-informatie hebben: 1/

2

~ gamma(a=0.01,b=0.01)

De gamma verdeling geeft altijd positieve waarden. Het gemiddelde van deze specifieke gammaverdeling is 1; de variantie 100. We zeggen met deze formulering dus eigenlijk dat de reciproke van de variantie werkelijk overal kan liggen, behalve onder de 0. Daarmee kan de variantie zelf ook overal liggen behalve onder de 0. De keuze van de gamma verdeling volgt uit eigenschappen van de steekproefvariantie s2 als de waarnemingen normaal verdeeld zijn. Het is namelijk bekend dat (n-1).s2 2 een 2 verdeling volgt met n - 1 vrijheidsgraden. Hierbij is n het aantal waarnemingen van de steekproef. De 2 verdeling is niet anders dan een gamma verdeling met a = 0.5(n-1) en b = 0.5. Dus 1/ 2 volgt ook een gamma verdeling. We hebben hem vrij breed gekozen, omdat hij iets zegt over de homogeniteit van de boorkernen. Op voorhand is daar niet veel over bekend. Voor de gevoeligheid bestaat op voorhand het idee dat hij positief moet zijn. Alleen in dat geval daalt de lijn van log N als functie van log F bij toename van log F. De prior die ik heb gekozen luidt: ~ N(5,1) Ik heb hiervoor gekozen omdat er dan een verwaarloosbaar kleine kans is dat negatief is. Er geldt dat 99% van de waarden voor tussen de 2 en de 8 ligt. Merk op dat deze prior veel specifieker is dan die voor de varianties. Tenslotte heb ik voor de grenssterkte 1 kan liggen:

aangegeven dat hij overal tussen de 0.65 en

~ U(0.65,1) Hierbij geeft U(a,b) een uniforme verdeling aan tussen a en b. De range omvat het gemiddelde van de logB waarden. Het kiezen van een prior is één van de grootste discussiepunten bij een Bayesiaanse analyse. Het is typisch iets waarvoor overleg nodig is tussen een materiedeskundige en een statisticus. Ook is het verstandig om in een gevoeligheidsanalyse te bepalen hoe de conclusies veranderen door het kiezen van andere priors. Zowel het overleg als de gevoeligheidsanalyse moeten in een later stadium nog ingepland worden. De bedoeling van het huidige document is om de grote lijnen duidelijk te maken.

Statistische analysemethode II: de verwerking van de ingrediënten De analyse zelf vindt met computersimulatie plaats. We zijn erop uit om de kansverdeling van de parameterwaarden uit te rekenen gegeven de gevonden meetwaarden. Deze staan bekend onder de naam ‘posterior verdelingen’. Eerst doen we met de computer trekkingen uit de 4 prior verdelingen. Als we eenmaal een viertal parameterwaarden hebben, dan rekenen we twee dingen uit. In de eerste plaats is dat de kansdichtheid die bij de getrokken parameterwaarden hoort. Daartoe wordt

4


gebruik gemaakt van de opgegeven kansverdelingen. In de tweede plaats wordt uitgerekend hoe aannemelijk de gevonden gegevens zijn, gegeven de getrokken parameterwaarden. Beide getallen worden met elkaar vermenigvuldigd. Dit geeft op een constante na de posterior verdelingen. De constante wordt achteraf uitgerekend door de som van de kansdichtheden op 1 te stellen.

Resultaten De analyse levert de posterior kansverdeling voor de vier grootheden in het model. Dat is een 4-dimensionale kansverdeling voor , , en de beide varianties. Ik heb de analyse uitgevoerd voor de gegevens van alle vijf dijklichamen. Er zijn twee ‘ketens’ gebruikt met elk 5000 trekkingen, waarvan de eerste 500 de opstartfase vertegenwoordigen. Deze zijn voor de verdere weergave verwijderd. Er zijn dan totaal 9000 trekkingen over. De onderstaande plaatjes geven de kansverdeling voor de 4 modelgrootheden afzonderlijk (ik gebruik standaarddeviaties in plaats van varianties). De locaties zijn aangeduid met een cijfer tussen vierkante haken; de cijfers 1 t/m 5 corresponderen met respectievelijk de Helderse, Pettense en Hondsbossche zeewering, de zeewering bij het Flaauwe Werk en de zeewering tussen Koehool en Zwarte Haan. In Figuur 2 komen de plaatjes voor de gevoeligheden en grenssterktes.

5


beta[1] chains 1:2 sample: 9000

eta[1] chains 1:2 sample: 9000

1.5

15.0

1.0

10.0

0.5

5.0

0.0

0.0 4.0

5.0

6.0

7.0

0.6

beta[2] chains 1:2 sample: 9000

0.8

0.9

eta[2] chains 1:2 sample: 9000

1.5

15.0

1.0

10.0

0.5

5.0

0.0

0.0 2.0

4.0

6.0

0.7

beta[3] chains 1:2 sample: 9000

0.8

0.9

1.0

eta[3] chains 1:2 sample: 9000

1.5

10.0 7.5 5.0 2.5 0.0

1.0 0.5 0.0 3.0

4.0

5.0

6.0

7.0

0.6

beta[4] chains 1:2 sample: 9000

0.7

0.8

0.9

1.0

eta[4] chains 1:2 sample: 9000

2.0 1.5 1.0 0.5 0.0

15.0 10.0 5.0 0.0 4.0

5.0

6.0

0.6

beta[5] chains 1:2 sample: 9000

0.7

0.8

0.9

eta[5] chains 1:2 sample: 9000

2.0 1.5 1.0 0.5 0.0

20.0 15.0 10.0 5.0 0.0 4.0

Figuur 2

0.7

4.5

5.0

5.5

6.0

0.6

Posterior verdelingen voor gevoeligheid

0.7

0.8

en bezwijksterkte

Het lelijkste plaatje is dat van voor de Pettense zeewering (eta[2]). Hier kan volgens het model de waarde niet beneden de 0.79 liggen, omdat de log N waarde van een vermoeiingsproef bij een opgelegde log F van 0.79 groter was dan 0, zie Figuur 1. De volgende 10 plaatjes geven de standaarddeviaties van log N en log B weer.

6


sigmaB[1] chains 1:2 sample: 9000

sigmaN[1] chains 1:2 sample: 9000

20.0 15.0 10.0 5.0 0.0

6.0 4.0 2.0 0.0 0.0

0.1

0.2

0.3

0.4

0.0

sigmaB[2] chains 1:2 sample: 9000

0.5

1.0

1.5

sigmaN[2] chains 1:2 sample: 9000

10.0

4.0 3.0 2.0 1.0 0.0

5.0 0.0 0.0

0.2

0.4

0.6

0.0

sigmaB[3] chains 1:2 sample: 9000 3.0

10.0

2.0

5.0

1.0

0.0

0.0 0.2

2.0

3.0

sigmaN[3] chains 1:2 sample: 9000

15.0

0.0

1.0

0.4

0.0

sigmaB[4] chains 1:2 sample: 9000

1.0

2.0

sigmaN[4] chains 1:2 sample: 9000

20.0 15.0 10.0 5.0 0.0

6.0 4.0 2.0 0.0 0.0

0.2

0.4

0.0

sigmaB[5] chains 1:2 sample: 9000 6.0

20.0

4.0

10.0

2.0

0.0

0.0 0.1

0.15

0.5

0.75

1.0

sigmaN[5] chains 1:2 sample: 9000

30.0

0.05

0.25

0.2

0.0

0.25

0.5

0.75

1.0

Figuur 3 Posterior verdelingen voor standaarddeviaties van levensduren (sigmaN) en bezwijksterktes (sigmaB)

Het valt me op dat de homogeniteit van de proefstukken nogal uiteen kan lopen. In Tabel 1 worden de gegevens nog eens getalsmatig gekarakteriseerd.

7


Tabel 1 Samenvatting van de posterior verdelingen der modelparameters

B

N

1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

mean

sd

2.5%

50%

97.5%

5.474 4.893 5.535 5.716 5.396 0.783 0.8993 0.7619 0.7644 0.7361 0.0981 0.1591 0.1426 0.09405 0.09442 0.3618 0.4511 0.6191 0.2644 0.4228

0.3142 0.3237 0.4172 0.2357 0.2269 0.03266 0.04143 0.04512 0.0304 0.02303 0.0302 0.05306 0.04635 0.03244 0.02008 0.1168 0.1716 0.1983 0.09218 0.09091

4.882 4.332 4.74 5.258 4.96 0.7154 0.8245 0.6831 0.7107 0.6926 0.05834 0.08862 0.08261 0.05311 0.06461 0.211 0.2368 0.3583 0.146 0.2887

5.467 4.869 5.534 5.71 5.392 0.7832 0.8964 0.7586 0.762 0.7353 0.0919 0.1485 0.1325 0.08729 0.09121 0.3381 0.4146 0.578 0.246 0.4089

6.137 5.601 6.39 6.2 5.85 0.8469 0.9837 0.8627 0.8322 0.784 0.1748 0.2916 0.26 0.1774 0.1428 0.6526 0.874 1.123 0.4966 0.6319

Tabel 2 Vergelijking van Bayesiaanse resultaten met steekproefgrootheden en resultaten uit lineaire regressie

B

N

1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

Bayesiaans 0.783 0.8993 0.7619 0.7644 0.7361 0.0981 0.1591 0.1426 0.09405 0.09442 0.3618 0.4511 0.6191 0.2644 0.4228

frequentistisch 0.790 0.824 0.730 0.727 0.727 0.0706 0.1136 0.1128 0.05533 0.08005 0.3192 0.3191 0.5098 0.1875 0.3831

In Tabel 2 vergelijk ik resultaten van de Bayesiaanse analyse met steekproefgrootheden en resultaten uit een lineaire regressie van log N op log F. Voor elk dijklichaam wordt de gemiddelde grenssterkte vergeleken met het

8


gemiddelde van de breuksterktes (logB). De standaarddeviaties van de breuksterktes sB worden vergeleken met de corresponderende resultaten uit de Bayesiaanse analyse. Tenslotte wordt ook de standaarddeviatie rond de lineaire regressielijn van log N versus log F, sN vergeleken met de corresponderende standaarddeviatie uit de Bayesiaanse analyse. Voor de gevoeligheid uit de Bayesiaanse analyse is er geen corresponderende steekproefgrootheid. Op de grenssterkte voor de Helderse zeewering na zijn de resultaten uit de Bayesiaanse analyse hoger dan de steekproefresultaten. Dat zit hem in de koppeling van breuksterkte en bezwijksterkte in één model. Dat model maakt dat de grenssterkte rechts van de hoogste waarde van log F moet liggen. Voor de Helderse zeewering is dat geen probleem. Door de lage breuksterktes voor de Pettense zeewering is het daar wel een probleem. In mindere mate geldt dat ook voor de overige drie dijklichamen. Doordat groter dan de grootste log F moet zijn, zal de standaarddeviatie B ook groter moeten zijn dan om goed bij het model te passen. Door het verenigen van de resultaten voor log N met die van log B wordt de lijn van log N tegen log F meer onder druk gezet dan bij een regressie van log N tegen log F. Ook dit resulteert in een toegenomen standaarddeviatie. De vergelijking is echter naïef omdat de Bayesiaanse analyse resultaten betrekking hebben op parameterwaarden en niet op steekproefresultaten. De kromme lijnen in Figuur 1 geven een grafische indruk van de kwaliteit van het model. De modelwaarden zouden gelden onder de gemiddelde waarden van gevoeligheid en grenssterkte voor de diverse zeeweringen. Deze waarden staan vermeld in Tabel 1. Zo geef ik voor de Helderse zeewering temidden der meetpunten de curve Y=5.474* (0.783-X) weer. Men zou argwaan kunnen hebben bij de punten met een log (sterkte) van 0.52. Deze liggen beide onder de curve. Voor het overige geeft de lijn een plausibel beeld van het verloop van logN tegen log (sterkte). De curve met gemiddelde parameterwaarde is zo maar een aannemelijke curve. Er zijn talloze andere curven die net zo aannemelijk zijn en ook in de weergave verwerkt moeten worden. Een Bayesiaanse analyse resulteert altijd in verdelingen en nooit in één enkele curve die als gouden standaard dient. We kunnen meer speling in het model brengen door een andersoortige wortel te gebruiken in de modelformule. We gebruikten: i = ( - log Fi). Dit is equivalent 0.5 met: i = ( - log Fi) . Door de macht groter dan 0.5 (maar kleiner dan 1) te kiezen gaat de curve steiler naar beneden. Dan zouden de curven van alle zeeweringen behalve de Helderse dichter bij de best passende rechte lijn door de punten komen. Door de macht kleiner dan 0.5 te kiezen gaat de curve minder steil naar beneden. Dat zou de curve van de Helderse zeewering ten goede komen. Om na te gaan hoeveel onzekerheid er in de modellijnen zit heb ik éénzijdige 95% betrouwbaarheidsbanden voor de modelwaarden uitgerekend. Elk van de 9000 viertallen parameters beschouwen we als een trekking uit de 4-dimensionale kansverdeling die de waarschijnlijkheid van de viertallen beschrijft. Voor het trekken van curven hebben we alleen de 9000 paren ( , ) nodig. Elk paar stelt ons in staat de modelwaarden uit te rekenen voor waarden van de log-sterkte tussen het minimum van log F in de meetgegevens en het minimum van de 9000 grenswaarden uit de simulaties, met sprongetjes van 0.01. Per waarde van logF kan ik 9000 modelwaarden uitgerekenen. Van die 9000 modelwaarden neem ik het 5e percentiel. 9


Figuur 4 Wortelmodel voor gemiddelde parameters en 95% betrouwbaarheidsintervallen bij diverse dijkstukken

Samen vormen de percentielen de gewenste betrouwbaarheidsband. De onderste lijn van Figuur 4 geeft de resultaten weer. De bovenste lijn is weer de ‘gemiddelde’ modellijn, overgenomen uit Figuur 1. Uit Figuur 4 concluderen we dat de modelwaarden een smalle bandbreedte hebben. Dat is gunstig als het model goed bij de waarnemingen past. Daar moeten we echter nog aanvullend onderzoek naar doen.

10


Vervolgstappen De voorgestelde Bayesiaanse analyse ziet er veelbelovend uit, maar moet nog verder worden uitgewerkt. De volgende stappen zijn, in volgorde van prioriteit, in de besprekingen gedefineerd: 1. Bepaling van een 95%-ondergrens (of een ander betrouwbaarheidspercentage) voor de invididuele meetpunten. Bij voorkeur moet deze grens in een wiskundige curve worden uitgedrukt, zodat deze in simulatieberekeningen kan worden gecombineerd met de kansverdeling van de golfklappen. 2. Algemener formuren van het model (nu de wortel-curve) om de eventuele overlap in breuksterkte en bezwijksterkte goed aan te kunnen. 3. Opzetten en uitvoeren van een Bayesiaanse residuenanalyse. Dit geeft inzicht in de juistheid van het statistische model en aanwijzingen voor eventueel afwijkende meetpunten. Daarbij ligt het voor de hand om aandacht te besteden aan beide Helderse punten die bij een log sterkte van 0.52 zijn gemeten. Ook voor andere zeeweringen zullen er speciale aandachtspunten zijn. 4. Nagaan hoe gevoelig de modelresultaten zijn voor een verandering in prior verdelingen. 5. Onderzoeken van de mogelijkheid om berekeningen in de toekomst door DWW (Deltares) uit te laten voeren.

11


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.