onsdag 28 januari 2009

Nu händer det saker

Jag har inte skrivit något på ett tag. Det betyder dock inte att arbetet skulle stått stilla. Snarare tvärt om.

Läget just nu;
Jag har jämfört födelsehandlingarna från både GHF och Åsa Jansson och fått fram en lång lista där dessa två är kombinerade. Både när det gäller alternativa datum och namn. Alla dessa namn har blivit grunden till ett personarkiv med runt 7000 personer.

Jag har också konverterat in alla dödsböcker jag har till mitt förfogande. Från slutet av 1600-talet fram till 1920. Det saknas dock några år i mitten av 1800-talet. Därefter har jag skrivit av alla döda från 1947 till 2006, vilket gör listan av personer ännu längre.

Sen har jag byggt ett litet program som hjälper till att koppla ihop dödsbok-notiserna med rätt person. Detta fungerar dock inte automatiskt, och ska inte heller göra det. Gör man det automatiskt kan man ge sig sjutton på att det kommer att bli fel. Och har man lagt så här mycket tid hittills vill man ju inte smutsa ner datan med felaktiga uppgifter.
Nej, istället krävs att man sitter och klickar igenom namn för namn för namn för namn och parar ihop rätt, lägger till eventuell extra information osv.

Jag började från uppifrån, dvs från 2006 och betar mig nedåt. Jag började igår och ligger på 1982 just nu. Varje år tar väl en 10 minuter att gå igenom så om någon vecka kanske jag är klar.

En annan kul grej är att UNT ska skriva om Gräsöarkivet. Borde komma vilken dag som helst. Spännande.

torsdag 15 januari 2009

GHF klart

Nu har jag konverterat alla födelsehandlingar från GHF också.
Två versioner av allt. Varje år.
Började att sitta och jämföra med det är ju ett galet stort arbete det med. Frågan är om det går att automatisera på något sätt. Att flytta celler i Excel är inte riktigt vad jag har planerat.

måndag 5 januari 2009

Två versioner

Nu har jag suttit och klippt och klistrat i Excelark så att jag blivit helt snurrig i pallet. Jag klockade och kom fram till att det tog runt 14 timmar totalt.

När jag börjar gå igenom allt upptäckte jag det hemska; mellan åren 1805 och 1900 så har jag fått två versioner av kyrkoböckerna för födda. Dels från Åsa Jansson, dels från Gräsö Hembygdsförening.

Jag valde Åsas avskrifter eftersom hon kompletterat med en hel del av föräldrarnas födelsedatum. Det skulle göra det enklare att para ihop barn med föräldrar i ett senare skede tänkte jag. För hur mycket kunde det skilja, det är ju samma handlingar som är avskrivna liksom.

Men tyvärr visade det sig att en hel del skilde. Närmare 1000 personer. Hur kommer det sig då? GHF har lagt till alla personer som flyttat till Gräsö, men som alltså inte är födda här. Personer som flyttat till ön, som bosatt sig här men alltså är födda på någon annan plats.

Dessa personer behöver jag ju också ha med; syftet med arbetet just nu är ju en lista på alla som bott på ön, inte bara de som är födda.

Dessutom så skiljer det sig en del rörande vissa namn, ibland står det Cajsa i en version när det står Carin i en annan. Samma person, men olika namn. Sånt var ju inte så noga förr i tiden, som alla släktforskare vet.

Ytterligare så skiljer sig en del datum. Säkert felläsningar från något håll, men vilket datum är rätt? Båda datumen är ju viktiga i arbetet framöver.

Så nu sitter jag här med en version där jag lagt ner en ENORM mängd tid på, för att upptäcka att den inte är komplett. Jag måste göra exakt samma arbete en gång till, men då med Hembygdsföreningens avskrifter.

Det här projektet lär ta betydligt mer tid i anspråk än vad jag hade tänkt.
Ge mig lite uppmuntran!

fredag 2 januari 2009

Wordfilerna sammanslagna

Sådär. Nu har jag lyckats trycka ihop alla Wordfiler i en enda, samt stoppat in lite "styrtecken" på valda platser. Nu på kvällen lyckades jag importera över allt till Excel, med en "handling" på varje rad.
Dryga 10 timmar tog det, med en hel del pysslade och klippande och klistrande.

Fortfarande är det dock en HEL DEL som inte riktigt lirar. Saker ligger i fel kolumner och vissa andra saker är helt fel. Men det är ett steg på vägen. Ett litet steg i alla fall.

Vad är egentligen problemet?

I mitt huvud låter det här egentligen ganska enkelt. Alla fall i det första steget. Bunta ihop en mängd Word-filer till ett enda stort Excel-ark. Väl där är det inga problem att trycka in det i en databas där resten av trolleriet kan ske. (jo, jag vet att det resterande trolleriet är gigantiskt, men skulle jag tänka mer på det nu skulle jag nog lägga ner hela projektet).

Men tillbaka till den första delen. Hur svårt kan det vara?
Låt mig visa det så här;

Här är en slumpvis vald person från materialet;

Födda 1795, 3 Mars
Johan
Föräldrar: Torparen Olof Jansson och Brita Ersdotter, senast fylld 28 år, boende vid Svepholmen


Såg alla "poster" ut så här vore det enklare. Men alla poster ser inte ut så här. I vissa fall saknas datumet, i vissa fall saknas pappans namn. I vissa fall finns uppgifter om den ena förälderns ålder, i vissa fall inte alls. I vissa fall står det var dom bodde, medan för vissa står inget alls.

Vad jag behöver göra är att försöka dela upp varje post i mindre delar, så att varje del hamnar i en ruta i Excel. Dagen i en ruta, månaden i en. Barnets namn i en ruta och föräldrarna i egna rutor. Typ så här;

17950303TorparenJohanOlofJanssonBritaErsdotter28Svepholmen


För att i ett senare läge kunna matcha ihop just den här personen, med andra personer måste jag ha lite mer data. Materialet sträcker sig från 1700 till 1919, så är Johans föräldrar födda på Gräsö finns dom rimligtvis med i något annat Word-dokument. Vidare, har Johan senare i livet fått några barn finns han också med senare i dokumenten.
För att kunna hitta Johan i senare dokument räcker det inte att han "bara" heter Johan. Han måste ha ett efternamn. Här måste jag skapa ett efternamn åt honom. Eftersom vi vet pappans namn i det här fallet är det enkelt. Det är troligt att han kommer att heta Olofsson när vi hittar honom nästa gång. Det borde fungera, åtminstone så länge patronymikon används, vilket borde vara fram till sista halvan av 1800-talet.
Sen står det ju att mamman är 28 år gammal när hon föder Johan. Med hjälp av det kan vi räkna ut att hon borde vara född mellan 1756 och 1758. Alla som sysslat med släktforskning vet att det kan vara lite si och så korrektheten med dessa åldrar, därav att spannet är hela tre år.

Så, sammantaget behöver jag alltså justera ovanstående tabell med dessa nya data. En "färdig" tabell borde alltså se ut något som den här;
17950303TorparenJohanOlofssonOlofJansson
BritaErsdotter2817561758Svepholmen


Det gäller att göra rätt från början. Att sitta och gå igenom materialet "för hand" kommer att ta riktigt lång tid. Överslagsräknat kan man lätt konstatera att om man lägger 30 sekunder på varje post för att kolla att allt ser rätt ut (det kan lätt bli mer), så med närmare 7000 namn så blir det runt 3500 minuter, dvs nästan 60 timmars arbete. Bara i det här läget.

Hmm. Bäst att jag sätter igång direkt.