Nr. 5/2003


  Intervjuu
Kuidas Eestis sündimust tõsteti

Eeskätt sündimus ning sellega seoses ka rahvastikuteadus on viimasel ajal üha enam üldsuse huviorbiiti tõusnud. Ei pääsetud sellest küsimusest kuidagi mööda kevadises valimisvõitluses ja järgnevalgi perioodil. Ometi saab millestki asjalikult rääkida ikka siis, kui sellest piisavalt infot on. Kust leida teavet selle kohta, mis Eesti riigi rahvastikuga aegade jooksul on toimunud ja praegu toimub? Kas pakub selleks teavet rahvaloendus? Või näiteks Eesti Rahvastikuandmepank? Neil teemadel käis demograafide KALEV KATUSE ja ALLAN PUURI käest informatsiooni küsimas KÄRT JÄNES-KAPP.


Kalev Katust on ajakirjandus tituleerinud Eesti autoriteetseimaks demograafiks. Foto: Tiit Hunt

Mis on Eesti Rahvastikuandmepank? Kas selles pangas leidub infot iga kunagi Eestis elanud inimese kohta?

Ei, Eesti Rahvastikuandmepank (ERA) ei sisalda andmeid üksikisikute kohta, sellises andmepangas on alati agregeeritud ehk teatud tunnuste kaupa koondatud andmed. Ei ole muidugi välistatud, et andmepank ise on pidanud individuaalandmetest vajalikud näitajad välja arvutama. Milliseid indikaatoreid üks korralik rahvastikuandmepank peab sisaldama, see on aga rahvusvaheliselt kokku lepitud.

Euroopas tegutseb juba pikemat aega kolm suuremat rahvastikuandmete koondajat – Euroopa Rahvastikukomitee, ja Euroopa Rahvastiku Observatoorium sellega seotult, ÜRO Euroopa Majanduskomisjon ning Eurostat, mis tegeles kuni viimase ajani suhteliselt kitsalt Euroopa Liiduga, aga nüüd on muutumas laiemat riigikogumit hõlmavaks. Need kolm teevad tihedat koostööd. Kui pikka aega kogus igaüks neist teavet omaette, siis praegu korjatakse riikide käest rahvastikuandmeid ühekordselt. See toimub kord aastas, vastavale pärimisele vastab tavaliselt rahvuslik statistikaamet. Jooksvast statistikast erineb rahvastikuandmepank aga lausa põhimõtteliselt, sest sealne info peab olema võrreldav.


Allan Puur on üks neid Eesti demograafe, kes abistas Makedoonia rahvastikuteadlasi viimase rahvaloenduse läbiviimisel. Foto: Tiit Hunt

Ehk selgitate lähemalt, milles see põhimõtteline erinevus jooksva rahvastikustatistikaga – võrreldavus – ikkagi seisneb?

Jooksvalt kogutav/avaldatav statistika, olgu või iga-aastane statistiline aastaraamat, käib üldjuhul käesoleva ja mõne eelmise aasta kohta. See materjal on esitatud vaadeldava aasta halduspiirides, sellel aastal kehtivates klassifikaatorites jne. Kui taoline info tahetakse panna andmepanka, tuleb olla veendunud, et see läheb ühtsesse ritta mis tahes varasemal aastal kehtinud klassifikaatorite, haldusjaotuse ja muu seesugusega. Selles peitubki suur vahe! Ja see on koht, kus Euroopa riikides tuleb tavaliselt mängu rahvuslik demograafia instituut (meil Eesti Kõrgkoolidevaheline Demouuringute Keskus ehk EKDK). See instituut või siis vastavat ülesannet täitev organisatsioon peab hoidma kõnealuseid arve sageli hoopis teistsuguses struktuuris, kui mingi konkreetse aasta info seda on.

Võrreldavuse tagamiseks on vaja andmed harmoniseerida ehk ühtlustada. Nii näiteks teostatakse iga rahvaloenduse järgselt loendusvahelise perioodi tagasiarvestus. Vahepealsete aastate jooksul on kumuleerunud teatud viga, mis nüüd parandatakse. Niisugune viga ei seisne muidugi selles, nagu oleks näiteks sünde registreeritud rohkem või vähem, kui neid tegelikult oli. Kui võttagi konkreetseks näiteks just sündimusnäitajate täpsustamine, siis see ühtlusarvutus puudutab tavaliselt ikka seda n-ö nimetajat ehk rahvaarvu, mille alusel sündimusnäitajad arvutatakse. Muide – rahvaarvu jooksev arvestus ei ole kunagi, välja arvatud ehk neljas-viies Euroopa riigis, loendusel saadud rahvaarvuga kokku langenud. Vastav vahe ei teki muidugi ühe aastaga, vaid reeglina mingi perioodi jooksul. Kui loendus on ära olnud, arvutatakse kõik näitajad tagasivaatavalt ümber. Iga-aastased väljundid jäävad niisuguseks, nagu nad mingil konkreetsel aastal avaldati, rahvastikuandmepanka lähevad aga harmoniseeritud ehk ühtlusarvutatud andmed.

Andmete võrreldavaks tegemise kõrval kerkib rahvastikuandmepanga puhul üles veel teinegi küsimus, milleks on andmekvaliteet. Rahvastikuandmepanka saab lisada ainult niisugused andmed, mille kvaliteet on teada. Mitte selles tähenduses, et kas need andmed on kvaliteetsed või ei ole kvaliteetsed. Nii pole põhjust küsimust tõstatada, sest rahvastikuarengu puhul ei ole arvud kunagi ühe sünni või surma või siis elukohavahetaja võrra täpsed. Aga panga pidaja peab teadma, milline on täpsusaste ja millest johtub tõenäoline viga.

Heaks näiteks oleks siinkohal Küpros. Küprosel jääb praeguseni umbes 30 protsenti surmajuhte registreerimata. Nähtuse põhjused on hoopis omaette jutt, aga siinkohal tuleb rõhutada, et statistikaamet on Küprosel korralikult toimiv institutsioon. Statistik ei saa ju seista iga surmajuhtumi registreerimise juures, aga Küprose statistikud teavad, kui palju surmajuhte registreerimata jääb ja millised neist just registreerimata jäävad. Ühtlusarvutuste tulemusena vajalikud näitajad täpsustatakse. Nad ei esita oma arve kujul, millest saaks järeldada, nagu oleks Küprosel maailma pikim eluiga, vaid korrastavad andmed enne avaldamist. See et tähenda muidugi uute registreerimislehtede vorpimist, vaid kaudseid kvaliteedihinnanguid. Niisugused analüüsivõtted on paarisaja aasta jooksul demograafias üsna täpseks arendatud.

Probleemi illustreerimiseks sobib hästi ka järgmine natuke naljaks näide. Nimelt juhtus N. Liidus 1959. aasta rahvaloenduse tulemuste avaldamisel millegipärast nii, et Loksa elanikkonda arvestati kaks korda. Aga loendusandmed olid juba Moskvas kinnitatud ja midagi polnud enam teha. Loksa jäigi kaks korda suuremaks. Aga on hea teada, et vastav arv tuleb jagada kahega, ja et just see viga on põhjuseks, miks Loksa rahvaarv perioodil 1959–1970 (järgmise loenduseni) vähenes, mis pole iseenesest üldsegi tegelikkusele vastav. Ühtlusarvutus ei muuda suurusjärke – Eesti rahvaarv ei kasva 1,5 miljonilt 15 miljonile, aga rahvastikuteadlase jaoks toob see välja taolised mittevastavused.

Eespoolöeldut silmas pidades saab ehk selgeks, miks peab alati olemas olema teave, kui täpsed andmepangas sisalduvad indikaatorid on. Andmepangas võivad olla vähem kvaliteetsed ja rohkem kvaliteetsed andmed, aga peab olema selge, milline on vea tõenäosus. Nõrga statistikasüsteemiga riikide puhul ongi alati probleemiks, et arvud on küll olemas, vahel on neid ülearu palju, ent metoodiline pool on nõrk ning puudub teave andmete täpsuse kohta.


Nii et rahvastikuandmepangas on siis võrreldavad ja agregeeritud andmed. Aga kas need andmed on kuidagi piiritletud ka ajaliselt ja ruumiliselt?

Rahvastikuandmepanga puhul lisandub tavaliselt üks poliitiline moment, sest vähemalt Euroopas on kombeks, et pangas peavad olema andmed nii pika aja kohta, kui riik ennast riigiks peab. On suur vahe, kas riik peab end tekkinuks 1918 või 1991. Sest vastavalt sellele tuleb andmed esitada ka ÜRO-le, Eurostati ja mujale. Kui riik defineerib end olemas olnuks alates aastast 1918, siis peaksid rahvusvahelistesse organisatsioonidesse olema esitatud arvud alates 1918. aastast, mis ei välista muidugi, et need võivad olla lünklikud. Kui aga riik deklareerib, et ta loodi 1991, siis varasemaid andmeid muidugi ei saagi nõuda ja olla, sest riiki ju ei olnud. Teaduslikus mõttes tuleb rahvastikku käsitledes loomulikult arvestada pikemaajalisi trende, seda ka näiteks Sloveenias, aga ametliku väljundina ei pea Sloveenia neid varasemaid andmeid kuhugi esitama, sest Sloveenia riik loeb end tekkinuks aastal 1991.

Miks sellel ajamääratlusel üldse nii pikalt peatuda? Põhjus peitub eeskätt Eesti oludes. Tavaliselt pole andmete ajaline järjepidevus riikides probleem, aga Eestis on. Sest Eestis on vahepeal olnud niisugune periood, kus me ei vastutanud oma statistika eest, koguni ei tohtinud sellega tegeleda. Ja kõnealuse perioodi kohal laiutab nüüd suur auk, sest tollased andmed on hoopis teistsuguse kvaliteediga, ühtlusarvutamata. 50 aasta töö tagantjärele tegemine on suur ettevõtmine.


Kas probleem peitub vaid praeguste andmete ühildumises selle 50 aastaga või ka ühildumises varasemaga?

Vene riigis ei ole sisuliselt kunagi olnud keskstatistikat, kuigi Nõukogude-perioodil tundus see formaalselt nii olevat. Seetõttu võib väita, et riigi peamisi sotsiaalseid protsesse arvudega hõlmav, arve “tootev” institutsioon loodi Eestis 1921. Sinna läksid tööle oma aja professionaalid, seda nii Vene kui Saksa koolkonnast. Saksa koolkonna tugev külg oli täpne registreerimine, täpsed meetodid. Vene koolkond paistis silma oma teaduslike meetoditega – kuna Vene riigis oli statistilise registreerimise süsteem kohutavalt nõrk, siis ei kasutanud ka riigivõim mitte ametlikke ilustatud arve, vaid küsis vastuseid teadlaste käest. Seetõttu olidki Vene koolkonnas suhteliselt hästi arenenud kaudsed meetodid.

Eestis loodi eeskujulik süsteem, mille alusel statistika arenema hakkas. Paar aastat hiljem viidi juba läbi niisugune rahvaloendus, et see on siiani korrektsuselt teine loendus Eestis. Kogu jooksev rahvastikustatistika pandi korralikult tööle. Kuid tehti ka ühtlustustööd. Mitte ainult tollased arvud ei lähe paremini kokku rahvusvahelistega, vaid sama kehtib ka varasemate perioodide osas ühtlusarvutatud näitajate kohta. Hästi illustreerib seda EKDK kogemus seoses Euroopa Rahvastikukomitee uuringuprogrammiga, mis käsitles Euroopa vähemusrahvuste arengut aastail 1910–2000. Vastav ekspertrühm töötas kuus aastat ja analüüsis olemasolevat infot. Eesti andmete kohta antud hinnang kõlas: Teise maailmasõja eelsest ajast pärinevaid arve, kaasa arvatud neid, mis on tol ajal ühtlusarvutatud 1881. ja 1897. aasta rahvaloenduste põhjal, saab kasutada, aga Nõukogude-aegseid mitte. Kõnealuse tühiku täitmiseks tuli koostöös Välisministeeriumiga läbi viia eraldi küsitlusstatistiline töö.

Loomulikult tuleb ka täna tegeleda sõjaeelse statistikaga, aga eeskätt seetõttu, et praeguseid andmeid tollastega ühildades peab tollastki struktuuri hästi tundma. Ei saa öelda, et see töö on kunagi ära tehtud ja see meid enam ei huvita. Ettevõtmine on keerukas, sest paljud materjalid, näiteks kahe loenduse individuaallehed, põlesid sõjas koos statistikaameti arhiiviga. Aastate 1939–1940 info viisid venelased 1941. aastal ära ja see läks kaduma. Nii et üldise hea taseme juures jätkub probleeme ka selle perioodi osas küllaga. Tuleb arvestada, et tänapäeva statistika on tavaliselt detailsem, aga kuna sõjaeelse perioodi individuaalandmed on hävinud, pole detailsemad tagasiarvutused enam teostatavad.


Eesti Rahvastikuandmepanga kogus leidub hulgaliselt dokumente kõikvõimalikest perioodidest. Üks neist on Saksa võimude poolt 1918. aastal väljastatud isikutunnistus, mille puhul väärib tähelepanu, et sellele on jäädvustatud omaniku sõrmejälg.

Kuidas on lood järjekestvusega tänases päevas?

Eesti praeguses andmekorralduses on kaks tõsisemat probleemi.

Vaikimisi on kujunenud niisugune tööjaotus, et statistikaamet korjab jooksvat informatsiooni, seda ei saagi keegi teine teha. Seevastu ühtlusarvutamise ülesanne on langenud EKDK-le – sisuliselt rahvuslikule demograafia instituudile, nagu paljudes riikides. Eesti erisus seisneb asjaolus, et nende ühtlusarvutuste tähtsust ei ole üldisemalt teadvustatud.

Tõepoolest – kui rääkida käesolevast hetkest, siis mõnes mõttes on tõesti tähtsam see, kuidas täna andmeid korjata. Ent pikas perspektiivis on hoopis olulisem, et ühe või teise aasta info oleks võrreldav ruumis, teiste riikidega, ja ajas. Kui ta seda ei ole, on kogu töö tühja läinud. Paraku ongi paljude andmetega nii juhtunud. Ühtlusarvutused jäeti 50 aastat tegemata, statistika jooksis aastakaupa, ja kui midagi üldse ühtlusarvutati, siis Moskvas. Nii et võttes näiteks Nõukogude-aegsed väljaanded ja püüdes panna kokku kõige lihtsakoelisemad arvud, näiteks liites tollaste rajoonide rahvaarvud, ei anna need pahatihti kokku ENSV rahvaarvu.

Probleem on see, et statistikaamet korjab ka praegu andmeid viisil, et nende kokkuviimine kas või viimase 10 aasta jooksul korjatuga ei ole eesmärgistatud. Nii tekivad suured hüpped. Näiteks büdžetiuuringute küsimustikke on muudetud neli korda ja tulemuseks ei ole mitte kümne aasta trend, vaid neli juppi, mis ei lähe kokku ei omavahel ega ka Nõukogude ajaga. Ka viimane rahvaloendus viidi läbi kui asi iseeneses – rakendati definitsioone, mida ei olnud rakendatud ei küsitlusstatistikas ega ka jooksvas sündmusstatistikas. Aga kui definitsioonid on teistsugused, siis loomulikult ei haaku ka tulemused.


Näiteks?

Näited on alati spetsiifilised, need ei ole niisama lihtsalt lahtiseletatavad. Kõrvaltvaatajaile võib isegi tunduda, et tegu on pisiasjadega.


Siiski? Miks ja millised pisiasjad siis nii olulised on?

Küsimus ei seisnegi ju selles, mis on õige või vale, vaid ikka tolles ühildumises. Viimane Eesti loendus ei ühildu ei küsitlusstatistikaga, ei jooksva rahvastikustatistikaga, ei eelmise loendusega.

Näiteks on räägitud palju sellest, et ränne on Eestis olnud väga oluline mõjutegur. Me oleme saanud pärast Teist maailmasõda rahvast juurde olukorras, kus me ise ei kontrollinud oma piire. Välispäritolu rahvastiku osakaal ulatub 35–36 protsendini. Probleemist on ka välispoliitiliselt palju räägitud. Kui aga võtta rännet ja päritolu puudutavad küsimused, siis neid esitati 2000. aastal vähem kui viimasel Nõukogude-aegsel loendusel 1989. Veelgi enam – tollal küsiti päritolu puhul vähemalt oblastit (oleks pidanud küsima valda/linna) ja õigustatult, sest Pihkva oblastist pärines hoopis rohkem Eestisse sisserännanuid kui näiteks tervest Austraaliast või Brasiiliast. Mida tegi uus loendus? Võttis Eurostatist maailma riikide loendi ning loenduses seisavad nüüd küll eraldi Ghana, Kambodža, Teravmäed ja kõik muud riigid, aga Venemaagi on üks tervik, mille tulemusena puudub Eestil info, mis on hoopis olulisem mõistmaks, kes meil siin Eestis elavad.

Täpselt sama on juhtunud rahvustunnusega. Näiteks nii Tsaari-Venemaa kui ka varasemad Eesti rahvaloendused tõid eraldi välja setud, 2000. aasta loendus mitte. Setud käisid isegi küsimas, kas nende lülitamine loendusesse oleks suur rahvusvaheline viga. Küsisime, et kust nad niisuguse teabe on saanud? Nad vastasid, et nii öeldud neile statistikaametist. Loenduse korraldajad võtsid Luksemburgist nimekirja, kus setusid ei olnud, ja leidsid, et seetõttu ei ole ka asjakohane neid loendusesse lülitada.

Teisisõnu – liigendusi on kasutatud formaalselt, sõltumata sellest, kas need ühtivad varasemaga, võimaldavad arengutrende välja tuua, annavad infot, mida vajame.

Nüüd ongi tekkinud mured nii 2000. aasta rahvaloenduse kvaliteedianalüüsi kui ka andmete sobitamisega arengutrendi. See on ka põhjus, miks EKDK ei ole saanud 2000. aasta rahvaloenduse andmeid lülitada rahvastikuandmepanka. Need ei ühildu, ka kõige lihtsamate näitajate puhul tekivad suured hüpped. Võtame näiteks sündimuse. Viimase rahvaloenduse andmetel, kui võtta neid tõsiselt, suurenes Eestis sündimus 15 protsenti. Rumalus oli esitada niisugused arvud Eurostati – praeguseks on avaldatud juba vähemalt üks artikkel, mis analüüsib n-ö Eesti hüpet. Asjatundja taipab ju kohe, et sündide arv pole suurt muutunud – asi on hoopis rahvaarvu kasutamises. Aga Eurostati ei esitatud mitte rahvaarv, vaid sündimustrend, mis on ebaloogiline, sest niisugust hüpet ei saa olla. Trend on vale. Ja see on suhteliselt suur probleem.

EKDK-l on hetkel käimas koostöö Prantsuse Demograafia Instituudiga surmapõhjuste harmoniseerimise vallas. Selle ühistöö raames on otsustatud, et alates 2000. aastast tuuakse ära paralleelsed arvude sarjad. Jätkub endise struktuuri edasikandumine ja lisanduvad uue struktuuriga paralleelsed näitarvud. Tuleb kurvastusega tõdeda, et niisugune variant iseloomustab üldjuhul arengumaid. Sama on juhtunud Euroopas näiteks Armeenias, kus 1989. aasta loendus läks untsu, sest just enne seda oli toimunud maavärin.

Selline paralleelsete arvude olemasolu meenutab liiga palju Nõukogude-aega, mil olid olemas nn ametlikud andmed ja siis need, mis olid ühtlusarvutatud teiste organisatsioonide poolt.

Igal riigil on muidugi õigus öelda, et meie ametlikud andmed on niisugused…


Kuidas need paralleelsed andmete read siis kulgevad?

Paralleelsus algab aastaga 2000. Üks andmerida algab aastaga 1918, osalt isegi varasemast, veel 1881. aasta eelsest ajast. Ja lisandub ametlik andmete rida, mis algab aastaga 2000. See on hetkel parim lahendus, kuigi jõhkravõitu. Üldiselt poleks ju põhjust ega õigust kahelda, kui riik esitab ametlikult mingid andmed. Aga kui neid ei saa trendi panna, sest neid ei saa kirjeldada? Nagu juba eespool jutuks, tõusis 2000. aasta loenduse andmetel sündimus. Aga ühtlasi tõusis, õnnetuseks, ju ka suremus! Sest muutus nimetaja ehk rahvaarv. Mis põhjusel oleks Eestis aastal 2000 suremus pidanud tõusma? Põhjust pole. Lihtsalt ametliku rahvaarvu vähenemisega sai iga surmajuht suurema kaalu... Niisugused probleemid lahendatakse tavaliselt kahe seeriaga, mis kusagil siis jälle kokku saavad, kui toimub uus ühtlusarvutus.


Seda tööd teeb EKDK?

Jah, täpsemini Eesti rahvastikuteadlaskond. Seda otsustati juba Nõukogude aja lõpul, kui oli lootust, et andmed lähevad lahti. Eks oli teada, et tollal veel kinnise info kvaliteet on üsna kahtlane. Kui need andmed siis tõepoolest lahti tulid, siis isegi mõnede Eesti teadlaste jaoks oli üllatav, et seis nii kehv on.

Ühtlustamine on pikaajaline töö ja kannab nime Eesti Rahvastiku Ühtlusarvutuste Programm. Käivitus see 1989. Teatud alamprogrammide rahastamiseni jõudsime 1993–1994, seoses Kairo maailmakonverentsi vajadustega. Töö on kulgenud üle kivide ja kändude, kindlasti oleks see läinud kiiremini, kui vastavat vajadust oleks tunnetatud selgemini. Aga ega muudeski valdkondades riik valmis ei ole. Rahvastikuandmepanga pidamine on üks niisugune tegemine, mida oblastile pole vaja. Vihjan siin Lennart Merile, kes iseloomustas selle sõnaga sedalaadi loogikat, mis ei tunneta riigiesinduslikku vastutust. Võru maakonna kohta Eurostat Eestilt andmeid ei nõua. Aga kui Eesti tahab riik olla, siis üks riigi funktsioone lipu, vapi ja hümni omamise kõrval on ka see, et riik haldab oma territooriumi. Ja see haldamine ei tähenda mitte püssimeest, vaid ülevaadet riigis toimuvast. Ja teada ei pea olema ainult inimesed, kuigi inimesed on vahest ehk üks olulisem asi, vaid ka kõik muu. Ja see info peab olema võrreldavas struktuuris.

Nii et ülevaate omamine oma rahvastikust on riigi üks tunnusjooni ja seda ülevaadet tuleb kogu aeg täiustada, valmis ei saa see kunagi. Kui ka kogu varasem periood saab korda pandud, tuleb hoolt kanda selle eest, et read jätkuksid. Meil on niisiis hetkel probleeme nii selle varasema kordaseadmisega, aga õnnetuseks ka olemasoleva täiendamisega. Ja kõik need probleemid kontsentreeruvad Eesti Rahvastikuandmepanka. Mured tuleb lahendada, aga niikaua, kuni mõni töö on tegemata, näiteks viimase rahvaloenduse kvaliteedianalüüs, on sel kohal pangas lünk. Kui kvaliteedihinnang on antud, olgu siis parem või halvem, lähevad andmed rahvusvahelisse käibesse, kus neid siis omakorda hinnatakse ja analüüsitakse. Näiteks on selle läbinud Eesti Pere- ja Sündimusuuringu andmestik. Kui EKDK kodeeris ümber viimase Nõukogude loenduse (1989), eriti majandustunnuste osas, siis pärast kasutati neid skeeme muu hulgas ka Vene andmestiku ümbertegemiseks Genfis. Genfis tehti töö ära ja Venemaalt saadeti EKDK-le tänukiri, sest nad ei pidanud ise vastavat metodoloogiat välja töötama.


Rahvastikuandmepank on siis ühe sõltumatu riigi absoluutselt vajalik tunnus?

Me võime seda eri viisil nimetada, aga vastav teave küll. Eesti käest ei küsita, kuidas on lood naaberriigis, küll aga seda, kuidas need Eestis on. See kehtib muidugi ühtviisi mitmesuguste valdkondade, mitte ainult rahvastiku kohta. Aga kõik algab inimestest. Riik ei saa öelda, et aga ma ei teadnudki, et mul siin mingi vähemusrahvus või veel keegi teine-kolmas elab. See on ka üks põhjus, miks ükski riik, isegi Nõukogude Liit, kes pani oma rahva jaoks andmed kinni, ei jätnud kunagi rahvusvaheliselt esitamata infot rahvastiku kohta. Valetati, aga andmata ei jäetud.


Kuidas see Eesti Rahvastikuandmepank füüsiliselt välja näeb? Mitmed köited tabeleid?

Põhimõtteliselt jah, hulk köiteid ja sarju – kogum agregeeritud arve, mis üksteisega sobivad. Need on olemas nii paberil kui elektrooniliselt. Tänapäeva kõvaketaste suuruse juures mahub Eesti-suguse riigi rahvastiku kogu teave ühte arvutisse ära (mahtus juba 1991. aastal), isegi kui oleksid olemas kõigi Eestis läbi viidud rahvaloenduste individuaalandmed. Küsimus pole niisiis mitte infotehnoloogiline – tehnika ei sea piiranguid isegi mitte suurtele riikidele.

Mingeid takistusi pole ka tarkvara osas, viimane ei maksa samuti suurt midagi. Muidugi peab olema hunnik spetsiaalseid programme, mis levivad sidemete kaudu teiste metodoloogiliste keskustega. EKDK-s on selliseid erialaseid programme paari-kolmesaja ringis.

Eesti Rahvastikuandmepank eksisteerib ka tihedas rahvusvahelises seoses, nii et kui Eesti ära pühitakse, siis andmepank säilib näiteks Euroopa Rahvastikukomitees.


Rahvastikuandmepanga juures on lisaks agregeeritud andmetele ka hulk muid materjale. Mida need endast kujutavad?

Rahvastikuandmepanga kogu sisaldab põhimõtteliselt kahte sorti materjale. Ühe osa neist moodustavad metoodilised materjalid, mis annavad ülevaate sellest, kuidas on arvutatud pangas leiduvad näitajaid. Need metoodilised materjalid omakorda jagunevad kaheks. Ühelt poolt on olemas teatavad üldised põhimõtted, mis on rahvusvaheliselt kokku lepitud, sealhulgas näiteks klassifikaatorid.

Niisugust metoodikat ja klassifikaatoreid on rahvusvaheliselt kooskõlastatud juba enam kui 100 aastat. Kui nimetada rahvastikuteaduse seisukohalt tähtsamaid, tuleks välja tuua rahvusvaheline haiguste ja surmapõhjuste klassifikaator (International Statistical Classification of Diseases and Related Health Problems, ICD), ametite klassifikaator (International Standard Classification of Occupations, ISCO), õppe- ja hariduse klassifikaator (International Standard Classification of Education, ISCED). Need ja mitmeid teisedki on koostatud selleks, et kõikidel riikidel, kes soovivad, oleks üks alus, millest lähtudes oma (rahvastiku)andmeid hoida. Niisugust ühtset klassifikaatorit kasutades ei pea kellelegi seletama, et meil Eestis on midagi erakordselt teisiti tehtud.

Rahvastikuandmepanga metoodilisel osal on veel teinegi roll. Nimelt ei ole need materjalid mitte ainult passiivseks kasutamiseks, vaid nende puhul lisandub ka aktiivne komponent – iga kasutaja täiendab neid omalt poolt ja pakub välja ideid, mida teised saavad kasutada. Sest kõnealused reeglid ei tule ju kusagilt väljastpoolt, vaid ikka sellesama rahvusvahelise koostöövõrgustiku seest. EKDK osaleb hetkel küsitlusstatistika alal Euroopa pere- ja sündimusuuringu uue ringi GGS (Gender and Generation Survey) ettevalmistamisel, Euroopa Observatooriumi metodoloogiaalases töös, prognoosikoostamise metodoloogia väljatöötamisel jne. Viimase aja oluline ettevõtmine on olnud kolme Kaukaasia riigi nõustamine ning Makedoonia abistamine rahvaloenduse läbiviimisel.

Teiselt poolt leidub igas riigis mingeid detaile ja nüansse, nii et tavaliselt täiendab seda rahvusvahelist metoodilist materjali riigikeskne materjal, mis arvestab konkreetseid olusid. Näiteks määratleb rahvusvaheline definitsioon piiri selle vahel, kas inimene töötab või on töötu, nii, et kui keegi töötab tasu eest tund aega nädalas, siis ta töötab, aga kui ta töötab tasu eest vähem kui tunni, siis on ta töötu või majanduspassiivne. Iga riigi lahendada jääb, mis tähendab “tasu eest”. Näiteks kas tasu eest töötamiseks pidada ka maasikate korjamist suvel vanemate põllul? Teiseks heaks näiteks kohaliku eripära kohta sobib haridus. Inimeste haridus ei ole mitte see, mida kool täna annab – mõni tänane Eesti kodanik on sündinud aastal 1900 ja käinud koolis veel tsaariajal. See konkreetne, 70–80 aastat väldanud õpe tuleb panna tänapäevasesse struktuuri ja seda tuleb teha Eesti-keskselt, sest niisugust konkreetset ülesannet näiteks Inglismaal või Ameerikas ei ole. Aga sealgi leidub oma detaile. Kolmandaks näiteks sobivad rahvused, mis on ka rahvusvaheliselt klassifitseeritud, kuigi sel klassifikaatoril eraldi nimetust pole. Eesti näiteks võiks aga käsitleda eraldi setusid, kes on suhteliselt arvukas ja suurte erisustega rühm, või mõnda muudki murderühma. Niisugustel puhkudel lahendataksegi asi reeglina rahvusvaheliselt, aga lisatakse omalt poolt mingid detailid. See kõik jäi paraku, nagu eespool öeldud, viimase Eesti rahvaloenduse puhul tegemata.


Kui metoodilised materjalid moodustavad kogu ühe poole, siis mis moodustab teise?

Konkreetsed andmekandjad, mis sisaldavad infot isiku kohta. Demograaf peab teadma, kust näiteks on võetud andmestik, mis on kantud konkreetsele surmalehele või abielulehele, kust statistika lõppkokkuvõttes oma andmed ammutab.

Esiteks sisaldab andmepank neid lehtede vorme endid. Tavaliselt toimubki nende koostamine andmepanga juures ja ka Eesti Rahvastikuandmepank on osalenud kõikide praegu Eestis käibivate isikustatistiliste lehtede koostamisel. Ent olulised pole mitte ainult lehed, vaid ka dokumendid, mille alusel need lehed täidetakse. Lihtsakoeliselt öeldes – passid ja teised samalaadsed dokumendid. Erinevus andmepanga ja mõne muu riigiasutuse vahel seisneb aga selles, et kui riigiasutus annab täna välja Eesti passi sellisel kujul, nagu see käibel on, siis andmepangas peab olemas olema pass ka niisugusel kujul, nagu see käibis 19. sajandil, Saksa ja paljudel muudelgi aegadel, või vähemalt vastav teave. Uurijal peavad need näidised olema, muidu ei saa andmeid võrrelda, öelda, kas ühe või teise dokumendi nii- või naasugune muutmine on andmete täpsust vähendanud või kasvatanud. Ja kui midagi niisugust on juhtunud, siis miks ja millal.

Näiteks juba nimetatud koostöös Prantsuse Demograafia Instituudiga surmapõhjuste vallas pidasid prantslased vajalikuks lisada uurimusele näidised ja selgitus sellegi kohta, mismoodi kirjutati surma põhjusele viitavaid seletusi 17. sajandil. Uurijad peavad välja selgitama, kuidas arenes surmapõhjuste registreerimine, kui kindel see süsteem oli ja kas sealt võis keegi ka näiteks välja jääda. Tuleb kindlaks teha, kui palju oli niisuguste dokumentide täitjaid, milline oli nende kvalifikatsioon – kas see annab alust arvata, et andmed on täpsed või mitte.

Rahvastikuandmepangas leidub alati teavet, mida pank pole ise kogunud, osa sellest on korjatud isegi sada aastat tagasi, aga alati peab olema ülevaade selle töö põhimõtetest.
Ajakiri Horisont läbi aegade. PDF formaadis fail ~4 MB