2002/10.

Kaotikus és nemlineáris dinamika

Nagy időfelbontású öngyilkossági idősorok nemlineáris viselkedése1

Bozsonyi Károly

KSH Népesedés-egészségügyi és Szociális Statisztikai Főosztály
bozsonyi@yahoo.com

Veres Előd

elod.veres@office.ksh.hu

Bevezetés

Elemzésünkben Hurst-analízis2 segítségével vizsgáljuk 31 év napi felbontású öngyilkossági adatait. A nemlineáris idősorok elemzési technikáit társadalomtudományi területen viszonylag ritkán alkalmazzák, ugyanis ezek az elemzési módszerek csak nagymennyiségű (több ezer) adat esetén működnek igazán megbízhatóan. A társadalomtudományi szempontból releváns jelenségek idősoros adatbázisai általában ennél nagyságrendekkel kevesebb adatot tartalmaznak.

Kutatásunk során először az idősorelemzés klasszikus, a társadalomtudományokban jól ismert módszereit - exponenciális simítás, szezonális dekompozíció, ARIMA modellek - alkalmazzuk, hogy az idősorokat stacionáriussá tegyük és megtisztítsuk a környezet változásából adódó hatásoktól, majd a reziduális valamint differenciált idősorokat elemezzük Hurst-analízissel

Számításainkat a nemek szerint bontott adatokon végeztük, de mivel (a jelentős mennyiségi eltérésen kívül) jelentős különbségeket nem tapasztaltunk, helytakarékossági okokból a közölt grafikonok mindig a nemi bontást nem tartalmazó, egyesített adatokra vonatkoznak

Adatelőkészítés - klasszikus idősorelemzés

A vizsgált idősorok az öngyilkosságok napi gyakoriságait tartalmazzák nemek szerinti bontásban 1970. január 1-t 2000. december 31-ig. Mivel a 31 évben 8 szökőév volt, az idősorok 11 323 napot fognak át. A KSH adatai szerint ebben a 31 évben összesen 127 877 öngyilkosság történt, egy napra átlagosan 11 esemény jutott. A teljes esetszámból 15 esetben nem lehetett megállapítani az öngyilkosság pontos idejét, ezért a nemek bontása nélküli idősor 127 862 öngyilkosság napokra lebontott gyakoriságaiból áll. A vizsgált 31 évben 90 912 férfi és 36 965 nő követett el öngyilkosságot, ebből 11 férfinak és 4 nőnek nem ismert a pontos halálozási ideje. A teljes idősorban egy nap kivételével (2000. december 13.) minden nap előfordult legalább egy eset, a 0 esetszámú napok száma a férfiaknál 15, a nőknél 619. A vizsgálat megbízható adatokat tartalmaz; forrását azok a halottvizsgálati bizonyítványok és halálozási lapok adják, amelyek a KSH halálozási statisztikájának legfontosabb dokumentumai.

Napi gyakoriságokat bemutató idősorainkon az események általános, valamiféle természeti rendhez igazodó alakulásának feltárása önmagában is érdekes kérdés, de a vizsgálat más kérdésre kereste a választ: van-e a vizsgált idősorokban olyan tényező, amely a rendszer belső logikájából következően hat az eseményekre. Az idősorokra vonatkozó egyik megfogalmazható kérdés tehát a rendszerre kívülről ható tényezőkkel foglalkozik, a másik a rendszer belső elemeinek egymásra hatásával.

Az alábbiakban röviden ismertetjük a vizsgált idősorok bemenő változókká alakításának módszerét és azok fontosabb tulajdonságait. Az idősorok nemi bontás nélküliek, de a vizsgálatban természetesen elkülönítetten is kezeltük a férfiak és a nők idősorait. Jól ismert, és a hazai öngyilkossági statisztikák publikált nyers adataiból is világosan látszik, hogy 1970-től 2000-ig az öngyilkosságok számszerű alakulásának van egy felszálló és egy leszálló ága. A pontos fordulópontot nehéz meghatározni, de a trend egyértelmű: az 1980-as évek második feléig emelkedett, azt követően pedig csökkent az öngyilkosságok száma (1. ábra). A későbbiekben szerephez jutó nyers havi gyakoriságok idősorára illesztett polinomiális trendvonal ezt jól szemlélteti.

1. ábra

Az idősorokban levő trendhatásokat különböző aggregáltsági szinteken különböző statisztikai módszerekkel lehet vizsgálni, de a modell kiválasztását és az idősor felépítését alapvetően a szezonális komponensekre tett előfeltételezések határozzák meg.

A vizsgálat trendhatásoktól mentesített idősorát a hónapokra aggregált nyers napi gyakoriságok egyszerű exponenciális simító eljárással képzett reziduálisaiból állítottuk össze. A hosszú távú trend eltávolítása után kapott idősort azonban évek szerint ismétlődő szabályos ingadozások terhelik. A diagramon azt a sajátosságot lehet megfigyelni, hogy a hónapok váltakozásának szabályos rendje valamilyen úton-módon hat az idősor megfigyelt adataira. Az öngyilkosságok ilyen szezonalitása jól ismert a nemzetközi szakirodalomban, és nemrégiben hazai vizsgálatok is igazolták azok megállapításait: "Egyértelmű és konzekvens az a tapasztalat, hogy az öngyilkosság sajátos szezonalitással rendelkezik: a tavaszi hónapokban kezd a tragikus események száma emelkedni, a május-június-július hónapokban éri el a tetőpontját, míg a téli hónapokban a gyakoriság számottevően visszaesik (december-január-február)." (Zonda, Bozsonyi, 2001) Ezt a jelenséget az öngyilkosságok havi átlagai mutatják a 2. ábrán.

2. ábra

A detrendelt, havi szezonális hatásoktól mentes idősor előállításához a 31 év havi gyakoriságaiból álló idősor dátum változóját 12 hónapos periodicitással definiáltuk, és a szezonális dekompozíciós idősorelemző eljárás additív modellje alapján elkülönítettük az idősor egyes szezonális komponenseit. A havi szezonalitást leválasztó szezonális index-komponens egyértelműen igazolja a havi szezonalitásról mondottakat, a modell reziduális változója pedig egyértelműen olyan stacionárius idősort mutat, amely mentes a havi szezonális ingadozásoktól.

Az öngyilkosságok idősorában kimutatható rövidebb távú szabályos ingadozások közül a havi szezonális ingadozás csak az egyik, mondhatnánk jobban ismert általános jellegzetesség. A környezet társadalmi rendjéhez tartozó heti ciklikusosság kevésbé látható és észrevehető módon, de statisztikailag igazolhatóan befolyásolja az öngyilkosságok alakulását. A heti ciklusok alakulását vizsgálhattuk idősorainkon, hiszen azok napi gyakoriságokból épülnek fel. Az idősorokra illesztett dátum változó heti periódusának definiálásával 1617 periódust megkülönböztető idősorhoz jutottunk. A 3. ábra mutatja az öngyilkosságoknak a hét napjai szerinti átlagait. Az idősor meghatározó komponenseit ez esetben is a szezonális dekompozíciós idősorelemzés additív modellje alapján különítettük el egymástól. Az eljárás eredményeként kapott szezonális index értékei egyértelműen mutatják a hétfői csúcsot és a hétvégére eső visszaesést, a reziduális változó pedig vizsgálatunknak a heti szabályos ingadozásoktól mentes idősorát adta.

3. ábra

Említettük már, hogy a szezonális dekompozíciós eljárással elkülöníthető komponensek az idősor aggregáltsági szintjétől függnek: havi szabályos ingadozást csak havi, heti szabályos ingadozást csak napi gyakoriságokból álló idősorokon lehet vizsgálni. Vizsgálatunkban a napi gyakoriságokból álló idősorról úgy választottuk le a havi szezonalitást, hogy abból kivontuk a hónapok hosszával normált havi szezonális index értékeket. Az így képzett változóval megismételtük a heti periodicitással definiált szezonális dekompozíciós eljárást. A kapott teljes reziduális idősor változónak kitüntetett jelentősége van, hiszen az most már majdnem megfelel a vizsgálat bemenő változóival szemben támasztott legfontosabb követelményeknek: az idősor alakulását biztos, hogy nem befolyásolják a trend- és szezonális hatások.

4. ábra

Az idősoron ekkor azonban még lehetnek egy lineáris valószínűségi folyamatból származó hatások. Ezeket egy AutoRegressive Moving Average (ARIMA) modell specifikálásával szűrtük ki. Az adatokra legjobban illeszkedő folyamat egy másodrendű autoregresszív és egy másodrendű mozgóátlag tagot tartalmazó [AR(2)MA(2)] modell volt. Ennek a folyamatnak a reziduálisa már a lineáris folyamatok "rövid távú memória" hatásait sem tartalmazta, így teljesen megfelelt nemlineáris idősorelemzésünk céljaira.

Az autokorrelációs és parciális autokorrelációs függvényeket bemutató 4. ábrán jól látszik, hogy a lineáris folyamatok és a szezonális komponensek leválasztása után is szignifikáns hosszú távú korrelációk vannak az idősorban (melyek nem csengenek le exponenciálisan), ez önmagában is jelzi egy nemlineáris "hosszú távú memória" jelenlétét az idősort generáló folyamatban. Az eredeti idősorokat egyszerű differenciálással is stacionáriussá tehetjük. Az autokorrelációs függvények a differenciált idősorok esetén is a reziduális folyamat autokorrelációs függvényeihez hasonlóan viselkednek, ezért közlésüktől eltekintünk

Hurst-analízis - nemlineáris idősor-elemzés

5. ábra

Mind az eredeti idősorok, mind a reziduális, mind a differenciált idősorok Hurst-exponenseit (H) meghatároztuk. Ezt közöljük az alábbi táblázatban nemek szerinti bontásban, megadva az exponens becslésének megbízhatóságát kifejező r2 értéket is. A nyers adatok esetén nem túl meglepő módon 1-hez közeli2 Hurst-exponenst kaptunk, ami az erős trend- és szezonális hatások következménye. Ez a magas érték mintegy igazolja, miért volt szükséges az a rengeteg erőfeszítés a trend- és szezonkomponensek eltávolítására.

1. táblázat

Mondanivalónk szempontjából a reziduális és a differenciált idősorok részletes elemzése az érdekes. Megállapítható, hogy mind a férfiak, mind a nők esetében a 31 éves időszak három szakaszra bomlik. Ezeknek a szakaszoknak a határai azonban különböznek nemek szerint. A Hurst-exponens viselkedése az egyes szakaszokon belül már nem mutat jelentős eltérést a nemek között. Általánosságban elmondható az is, hogy a reziduális és a differenciált idősorok hasonlóan viselkednek, attól eltekintve, hogy az utolsó periódus exponense a differenciált idősorok esetén már nem becsülhető megbízhatóan.

Az első periódus hossza 21 nap körüli (de az egyenes illesztésének bizonytalansága és az eljárás robusztussága miatt nyugodtan mondhatjuk azt is, hogy néhány hét nagyságrendű), ahol a Hurst-érték 0,5 körül van, ami véletlen bolyongást jelez. Az egyes napok reziduális öngyilkossági adatai tehát néhány héten át nem mutatnak egymással kapcsolatot, véletlenszerűen változnak: nőnek vagy csökkennek egymástól függetlenül.

Sokkal érdekesebb a középső szakasz. Ez férfiaknál a 21 és 1825 nap között van, ami 5 év körüli periódust jelent, a nőknél viszont 15 év körüli ezen periódus hossza. Ezekben a középső periódusokban 0,15 körüli az exponens értéke mindkét nem esetén. Az alacsony érték úgynevezett "rózsaszín zaj" jelenlétére utal. Ilyen zajfolyamat esetén nagyon erősek a trendet fordító hatások, ami a mi esetünkben pontosan azt jelenti, hogy a folyamat nem tud messze eltávolodni a trend és a szezonális ciklusok által meghatározott pályától. Az alacsony Hurst-értékkel jellemezhető folyamatok másik jellegzetessége a relaxációs idő jelenléte. A relaxációs idő az az átlagos időtartam, amely alatt a rendszer egy külső zavar után visszaáll eredeti állapotába. Esetünkben ezt az időtartamot mindkét nem esetén néhány hétre becsülhetjük, hiszen átlagosan 21 nap véletlen ingadozás után megjelennek az eredeti pályától való további eltávolodást gátló, visszatérítő hatások. A rózsaszín zaj ötéves tartománya a férfiaknál azt jelenti, hogy igazából ötéves intervallumon belül van jó előrejelzési lehetőségünk az öngyilkosságok alakulására, hiszen addig intenzíven a trend felé törekszik az idősor, öt év után pedig ismét 0,5 körüli (0,39) értékkel inkább a véletlen bolyongáshoz hasonlít jobban a viselkedése. A nők esetén a trendhez visszatérő viselkedés időtartama 15 év, tehát ott sokkal hosszabb előrejelzéseink lehetnek, mint a férfiak esetén. A harmadik periódusra azonban a nők esetén már nem tudjuk az exponenst megbízhatóan becsülni, hiszen már csak az idősor második fele áll rendelkezésünkre, ezt a bizonytalanságot egyébként az alacsony (0,14) r2 is mutatja.

Összefoglalás

Megállapítottuk, hogy a trend- és szezonális komponensek leválasztása után kapott (valamint a differenciált) magyarországi öngyilkossági adatok erősen nemlineáris jellegűek. Kvalitatíve hasonlóan viselkednek a férfiakra és a nőkre vonatkozó idősorok is. A jellemző nemlineáris zajfolyamat a férfiak és a nők esetén egyaránt "rózsaszín zaj" jellegű 0,15 körüli Hurst-exponenssel. A rendszerre jellemző relaxációs idő néhány hét nagyságrendű, ezen belül véletlenbolyongás-szerűen távolodik a rendszer a trend- és szezonkomponenstől, ezen az időtartamon túl viszont tartani próbálja a korábbi pályához viszonyított állapotát. A férfiak esetén a rózsaszín zaj által meghatározott szakasz 5, a nőknél 15 év körüli.

További kutatási irány az idősort generáló folyamat fázisterének rekonstruálása és a Ljapunov-exponensek meghatározása az alacsony dimenziós káosz esetleges kimutatása érdekében. E vizsgálatok azonban az eddigieknél több és bonyolultabb számítást igényelnek.

1 A tanulmány az OTKA T33030 számú kutatás támogatásával készült. A szerzők köszönetet mondanak továbbá a Központi Statisztikai Hivatalnak (a Népesedés-egészségügyi és Szociális Statisztikai Főosztály vezetőjének, Gárdos Évának, valamint Szvitecz Zsuzsanna osztályvezetőnek), amiért a tanulmány alapját képező adatok elemzéséhez hozzájárult

2 A Hurst-exponens elméleti értéke ugyan nem lehet nagyobb 1-nél, de mivel becslését egy regressziós egyenes meredeksége adja, ezért a becslési hiba jelenléte miatt az adatokból számított érték lehet egynél nagyobb is. Az eltérés azonban esetünkben megnyugtatóan kicsi.

Kulcsszavak: idősorelemzés, Hurst-exponens, nemlineáris folyamatok, rózsaszín zaj, R/S-analízis.

IRODALOM

Adatok az öngyilkosságokról 1980-1999 / Gárdos Éva, Szvitecz Zsuzsanna; közrem. Veres Előd. Budapest: KSH, 2000. 17 p

Zonda Tamás - Bozsonyi Károly: A magyarországi öngyilkossági adatok szezonalitásáról, Szenvedély (Addictologia Hungarica, 2001. április)


<-- Vissza az 2002/10. szám tartalomjegyzékére