vrijdag 29 januari 2021

Zwitserse voorouders: Genève

Zwitserland geldt voor familiegeschiedenis als een rijk onderzoeksgebied. In mijn kwartierstaat zijn ook - zeker verder terug - flink wat Zwitsers te vinden, die allen het gevolg zijn van de komst van de volgende drie voorouders naar Nederland:
  1. Jan Rijsch, (misschien Rösch), vermoedelijk uit het kanton Zürich, militair te Heusden in 1706.
  2. Abraham de Fernex, geboren te Genève in 1677, sergeant te Rossum.
  3. Johannes Jacobus Slaterus, (Schlatter), geboren te Zürich in 1671, onder meer conrector van de Latijnse school te Zutphen, later rector te Kampen.
In dit artikel bekijk ik de mogelijkheden die er zijn om vanuit huis te zoeken in bronnen uit Genève. Dit doe ik aan de hand van voorvader Abraham de Fernex.

Het duurde even voordat ik bij de familie De Fernex terecht kwam; na enkele generaties was de naam via Vernee verbasterd tot Van Ee. Abraham werd burger van Genève in 1702. Hij trad te Rossum in 1713 in het huwelijk met Jenneke de Groot, kleindochter van een Zweedse militair. Op dat moment was Abraham een "gegageerd soldaat-sergeant in het regiment van de graaf van Dohna". Het betreft hier het Regiment Zwitsers dat in 1693 werd opgericht; ook voorvader Jan Rijsch behoorde tot dit regiment, en familielid Franz (of François) Schlatter was er commandant van geweest.

De familie De Fernex is een oude familie afkomstig uit Ferney ten noorden van Genève en werd al in 1829 beschreven door Galiffe. Abraham werd in 1677 gedoopt in de Saint-Pierre-kathedraal in Genève als zoon van Philippe de Fernex, een veloutier (fluweelwerker) en Marie Clerc (bron: L. Rossellat). De doop-, trouw- en begraafregisters zelf zijn helaas niet vanuit huis in te zien, maar het repertorium hierop wel.

Om het repertorium te raadplegen zijn de volgende stappen noodzakelijk:
- ga naar de website van het archief in Genève en zoek links naar het kopje Effectuer des recherches.
- klik vervolgens op de categorie Base de données, hierna op Accéder à la base de données Adhémar en kies voor de categorie Répertoires de l'État Civil.

In het repertorium op de dopen van 1676-1688 vinden we het volgende:

"S.P. (= Saint-Pierre-kathedraal), 22e Août 1677, Abraham, f.d. Philippe de Fernex".

Deze inschrijving komt overeen met wat bekend is.

De doop van Abrahams moeder, Marie Clerc, dochter van Jacques Clerc, vinden we op 1 oktober 1654, eveneens in de Saint-Pierre-kathedraal. Uit het repertorium op de huwelijken blijkt ook dat haar vader Jacques Clerc, zoon van Jacques, op 17 oktober 1647 in de Saint-Pierre-kathedraal gehuwd is. Het repertorium vermeldt hierbij niet de naam van de echtgenote. Via de Société Génévois de Généalogie  kom ik erachter dat het gaat om Perrine Fol. Inderdaad vermeldt het repertorium dat "Perrine Fol, dochter van Aimé" op 17 oktober 1647 in de Saint-Pierre-kathedraal gehuwd is. Enigszins laveren tussen het repertorium en het onderzoek van de Société levert meer informatie op over de achtergrond van Perrine Fol, wier vader blijkbaar uit Tours afkomstig was. De afkomst van Jacques blijft onduidelijk: hij was beslist niet de enige met zijn naam, en alleen de volledige doop- en trouwinschrijvingen zouden meer duidelijkheid kunnen geven.

Van Abrahams betovergrootvader Mamad Court vind ik een trouwinschrijving op 15 december 1583 in de Madeleine-kerk. Ook hier ontbreekt de naam van zijn echtgenote. Er zit niets anders op dan door het repertorium te bladeren op zoek naar haar. Twee vrouwen zijn die dag in dezelfde kerk gehuwd: Marguerite, dochter van Antoine Porcher en Susanne, dochter van Bastien Vernou. Ook een Pierre Pontevin trouwde daar die dag. Het wordt niet duidelijk wie bij wie hoort; in het repertorium op de begraafregisters vind ik hen niet terug - meestal staat de naam van de echtgenoot hier wel tussen. Wel kom ik achter de naam van Mamads moeder, Mamade, weduwe van George Court, die tussen 1591 en 1600 overleed.

Op de site van het archief van Genève zijn meer archieven te raadplegen, ook van omliggende parochies. Er valt heel wat te vinden, maar het blijft wel lastig zolang de DTB-registers zelf niet inzichtelijk zijn.


woensdag 27 januari 2021

Dubbele voorouders

Iedere onderzoeker zal het vroeg of laat tegenkomen: dubbele voorouders. Soms is dit het gevolg van bewuste of noodzakelijke endogamie, zoals bij de hogere elite of de joden. In onze contreien zullen de meeste dubbelen echter voorkomen onder de plattelandsbevolking. Endogamie was ongebruikelijk onder de West-Europese bevolking, maar huwelijkspartners kwamen meestal uit dezelfde streek en waren onvermijdelijk op veel manieren verwant aan elkaar. Hoe verder je teruggaat, hoe meer dubbelen er in een kwartierstaat zullen voorkomen. Het aantal theoretische voorouderplekken in mijn kwartierstaat in generatie 27 (mensen geboren rond 1200) bedraagt ca. 67 miljoen, ongeveer gelijk aan het aantal inwoners dat toen in Europa leefde. In de tijd van Karel de Grote zijn er zelfs zo'n 500 miljard theoretische voorouderplekken die door hooguit 25 miljoen mensen opgevuld moeten worden; iedere Europeaan uit die tijd zou, indien gelijkmatig verdeeld, zo'n 20.000 maal in de kwartierstaat voor kunnen komen, en dit is nog een onderschatting, omdat een deel van deze mensen géén kinderen had, en een ander deel tot hetzelfde gezin behoorde. De Zwitserse onderzoeker Rübel-Blass schreef al eens over de dubbelen in zijn kwartierstaat (die deels met de mijne overlapt).

Ik moet terug tot generatie 10 om dubbelen te vinden: de 512 theoretische voorouderplekken in deze generatie worden door hooguit 508 mensen ingevuld. Tel ik het aantal dubbelen tot aan generatie 20 (mensen geboren rond 1400), dan zouden de ca. 524.000 theoretische plekken door hooguit 504.000 enkelen en 20.000 dubbelen ingevuld worden. Hierbij moet ik nog rekening houden met alle mogelijke dubbelen die op kunnen duiken onder de nog onbekende voorouders (meer dan 99% van mijn voorouders in generatie 20 is immers nog onbekend). In dat geval kom ik uit op zo'n 374.000 enkelen en 150.000 dubbelen. Elke generatie komt er zo'n 4% aan dubbelen bij. Dit percentage is echter nogal afhankelijk van het type voorouders dat mij bekend is uit de bronnen: naarmate ik verder terug ga, zijn de stedelijke voorouders steeds meer oververtegenwoordigd en die uit het platteland ondervertegenwoordigd. Het percentage wordt in de oudere generaties dus sterk onderschat.

Het is lastig een schatting te maken van het aantal dubbelen dat werkelijk in generatie 20 voorkomt. Mocht de toename van het aantal dubbelen constant blijven tussen ca. 4% in generatie 15 en het 20.000 keer voorkomen van individuen in generatie 40, dan kom ik op zo'n grofweg 225.000 enkelen en 299.000 dubbelen (ca. 57% van het totaal) in generatie 20. Van de dubbelen zouden dan ca. 128.000 individuen tweemaal voorkomen, 73.000 driemaal, 42.000 viermaal etc. Ongeveer 1400 individuen zouden meer dan tien keer voor moeten komen en een klein groepje meer dan twintig keer. Ik denk dat het aantal dubbelen nog hoger is dan dat, omdat ook de groeifactor waarschijnlijk zal groeien naarmate het aantal voorouders een steeds groter percentage van de totale bevolking uitmaakt verder terug in de tijd (er zijn dan steeds minder enkelen beschikbaar). Van de plattelandsbevolking zou de meerderheid waarschijnlijk dubbel of nog vaker voorkomen. Kandidaten in mijn kwartierstaat die twintig maal of meer voorkomen zijn vermoedelijk met name in de Betuwe of de Zuid-Hollandse eilanden te vinden. Ik denk hierbij aan de stamvaders van de familie Cranendonck of het geslacht van Doen Beijensz op IJsselmonde of een oude familie als Van Steenis of De Bie in de Tielerwaard.

Duidelijke conclusies zal ik niet verbinden aan dit onderwerp. Het kan in ieder geval gezegd worden dat het aantal dubbelen sterk toeneemt naarmate we verder terug gaan, en waarschijnlijk ligt het werkelijke aantal veel hoger dan we denken; onze middeleeuwse voorouders waren immers niet gelijkmatig over geheel Europa verdeeld, maar meer geconcentreerd in bepaalde streken, met enkele uitlopers naar buiten. 

woensdag 20 januari 2021

Een DNA-test voor genealogie: vragen en antwoorden

Voor wie overweegt een DNA-test te doen, is het een goed idee om jezelf voor te bereiden. Lees jezelf eerst in, zeker als je géén idee hebt wat DNA eigenlijk is en hoe het werkt. In deze post enkele overwegingen.

Is het geschikt voor iedereen?

Iedereen die geïnteresseerd is kan een test doen. Bij het interpreteren van de resultaten is het wel handig als je enige kennis hebt van DNA en een enigszins technische blik hebt.

Wat is je doel?

Voordat je begint met een test, is het belangrijk om je doel te bepalen. Wil je weten waar je vandaan komt? Wil je verre familie opsporen of je voorouders "verifiëren"? Ben je op zoek naar een onbekende vader? Wil je meer weten over je gezondheid en erfelijke aandoeningen? Denk hier eerst over na. Wanneer je doel is om je stamboom uit te zoeken, is het beter om, indien mogelijk, eerst "papieren onderzoek" te doen. Een DNA-test kan dan als aanvulling dienen.

Waar testen?

Het is niet altijd even makkelijk om je weg te vinden op de uitgebreide markt voor DNA-testen. Houd het makkelijk en ga voor één van de bekende leveranciers, MyHeritage, FamilyTree DNA, 23andMe of Ancestry. Elk bedrijf is net even wat anders: MyHeritage is met name in ons land goed voor het vinden van DNA-matches, FamilyTreeDNA heeft zeer gedetailleerde tests voor de rechte mannelijke en vrouwelijke lijn (Y-DNA en mt-DNA), 23andMe heeft een goede en transparante etniciteitsschatting en Ancestry heeft de grootste database (maar is minder inzichtelijk). Neem gewoon een kijkje op de websites en houd je doel in je achterhoofd bij het maken van een keuze. Voor een gerichte vaderschapstest of test op reeds bekende erfelijke aandoeningen kan het beter zijn om langs een medische instelling te gaan.

Hoe lang duurt een test?

De testduur verschilt per bedrijf en type test en is ook afhankelijk van de snelheid waarmee de testkit verstuurd wordt. Een uitslag is er waarschijnlijk binnen vier weken tot drie maanden. In een zeer klein deel van de gevallen mislukt een test, vaak omdat er onvoldoende materiaal verzameld is.

Hoe ziet een uitslag van een autosomale test er globaal gezien uit? 

Tegenwoordig is een autosomale test de meest voorkomende test. Hierbij worden alle chromosomenparen (exclusief de geslachtschromosomen) onderzocht. Het eigenlijke resultaat vormt een file van ongeveer 20 Mb, waarin ongeveer een half miljoen DNA-letters (ca. 0,1% van het totaal) staan vermeld. Op basis hiervan schat een bedrijf je etniciteit en geeft het je een lijst met DNA-matches.

Hoe moet ik een etniciteitsschatting interpreteren?

Een etniciteitsschatting werkt als volgt: de tester wordt vergeleken met een aantal referentiegroepen. Op basis hiervan volgt een lijst met percentages, die de gelijkenis van de tester met deze referentiegroepen weergeeft. Deze lijst is meestal vrij globaal en kan per bedrijf verschillen. De schatting is afhankelijk van de referentiegroepen. Wanneer als referentiegroepen Britten, Denen en Luxemburgers worden gebruikt, zal een autochtone Nederlandse tester meestal verschillende percentages van die groepen krijgen. Dit betekent niet dat de tester een Britse, Deense of Luxemburgse afkomst heeft; dit betekent slechts dat er sprake is van een genetische gelijkenis. Neem de etniciteitsschatting dus niet letterlijk en klamp jezelf er niet te veel aan vast. Over de gelijkenis en overlap van Nederlanders met omliggende bevolkingsgroepen heb ik hier geschreven.
Om deze beperkingen van de etniciteitsschatting te overwinnen, maken 23andMe, MyHeritage en Ancestry gebruik van aanvullende "genetische groepen", waarbij vaak specifieke DNA-stukken in specifieke bevolkingsgroepen kunnen worden aangewezen. De bedrijven zijn hiermee tegenwoordig zeker in staat om specifieke landen, provincies, en in de laatste update van MyHeritage, specifieke streken aan te wijzen. Het gebruik van deze genetische groepen vormt zo een zeer waardevolle aanvulling die ten goede komt van de nauwkeurigheid van de test. Tot slot, onthoud dat je je DNA-file ook zelf nader kunt analyseren als je hier iets vanaf weet; het is niet noodzakelijk om voor de interpretatie volledig afhankelijk te zijn van de bedrijven.

Hoe moet ik de DNA-matches interpreteren?

Een belangrijk onderdeel van een test is de lijst met DNA-matches. Momenteel zullen dit een paar duizend mensen zijn. Het is vaak mogelijk om te zien op welk stuk DNA je matcht. Op deze manier kun je voorouders verifiëren. Soms heb je het geluk dat er een nabije verwant, zoals een neef of achternicht, tussen staat. Een groot deel van de matches is een "verre verwant", en deelt wellicht een voorouder die te lang geleden leefde om gevonden te kunnen worden. Een ander deel matcht op zogenaamde "pile-up regions", stukken DNA die op een of andere manier veel voorkomen. MyHeritage vormt voor mij de makkelijkste manier om echte verwanten te vinden, omdat hier veel Nederlanders zitten en omdat veel mensen daar hun stamboom hebben. MyHeritage heeft echter wel vrij veel "pile-up" matches, bijvoorbeeld op het begin van chromosoom 15, waar je wat minder mee kunt. Houd bij de interpretatie van de DNA-matches rekening met verrassingen: misschien duikt er een onbekende halfzus op of was je opa toch niet je opa.

Wat te doen bij mogelijke genetische afwijkingen?

Het is mogelijk dat uit een test blijkt dat er sprake is van een "slecht" gen dat meer kans op een bepaalde aandoening kan geven. Wanneer dit het geval is, raak dan niet in paniek, en neem indien gewenst contact op met een arts om dit verder uit te zoeken.

Hoe staat het met de privacy?

Privacy is voor de hierboven genoemde bedrijven, evenals voor andere ondernemingen die met private gegevens werken, een belangrijk punt. De bedrijven kennen hun klant (de leiders van FamilyTreeDNA en MyHeritage zijn gepassioneerde genealogen) en weten dat de klant hier prijs op stelt. Er zijn ook genoeg klanten met een ICT-achtergrond of met een groot lezerspubliek die de bedrijven op dit punt in de gaten houden. Alleen de tester zelf of werknemers na verzoek van de tester hebben toegang tot (een deel van) de gegevens. Gegevens worden niet doorverkocht aan derden. Bij een onderneming als 23andMe is het mogelijk mee te doen aan medisch-wetenschappelijk onderzoek. Hierbij worden onderzoeksgegevens zodanig bewerkt (door elkaar gehusseld met anderen) dat deze niet op specifieke individuen terug te herleiden zijn. In enkele gevallen hebben opsporingsdiensten gebruik gemaakt van databanken bij de zoektocht naar daders van zeer ernstige misdrijven (bijv. moord) of bij ongeïdentificeerde slachtoffers. Dit kan slechts na toestemming van de rechter. Hierbij krijgen zij een lijst met DNA-matches van het te onderzoeken profiel te zien. De honderdduizenden testers die niet matchen, specifiek onder de GDPR vallen of anderszins privé wensen te blijven, staan daar niet tussen. Opsporingsdiensten hebben géén toegang tot de specifieke DNA-files van matches. Bij derde partijen kunnen privacy-regels verschillen. Een databank als GEDMatch zou bijvoorbeeld weleens mogen werken aan het afschermen van email-adressen. Het valt niet uit te sluiten dat hackers pogingen wagen om op zoek te gaan naar persoonsgegevens bij één van deze bedrijven. Veelal gaat het hier om namen, email-adressen, wachtwoorden en bankgegevens met als doel om fraude of oplichting te plegen. Deze staan over het algemeen op andere servers dan de DNA-gegevens. Houd er ten slotte rekening mee dat u zelf een belangrijke verantwoordelijkheid hebt t.o.v. uw eigen gegevens en die van uw naasten die u beheert. Upload niet zomaar alles naar elke willekeurige derde partij en kies voor unieke wachtwoorden of indien mogelijk voor 2FA.

dinsdag 19 januari 2021

Apostolisch

Ik ben niet religieus. Toch had het weinig gescheeld of ik behoorde tot de Katholiek Apostolische Gemeente, een kerkgenootschap waar in ons land ongeveer 1000 leden van zijn.

In het begin van de negentiende eeuw ontstond onder verscheidene groepen christenen een opleving van religieuze energie. Het gevoel dat de kerk een flets karakter had gekregen na de eeuw van de Verlichting en de snelle veranderingen in de maatschappij droegen hieraan bij. In deze tijd kwamen groepen gelovigen bij elkaar in energetische religieuze bijeenkomsten, waarbij men tijdens intense gebedssessies hoopte op de uitstorting van de Heilige Geest. Soms kwam er bij deze sessies glossolalie (het spreken in tongen) voor en meende men profetieën te horen. Het fijne weet ik er niet van. In 1832 ontstond de Katholiek Apostolische Kerk. Een kenmerk van deze kerk was het herstel van de kerkelijke ambten, zoals vermeld in Efeziërs 4:11. Zo ontstonden o.a. de ambten van profeet, engel en apostel. De invulling van deze ambten werd vaak tijdens - vermeende - profetieën openbaard. Vrij spoedig verspreidde de kerk zich in Groot-Brittannië. Gedurende de negentiende eeuw ontstonden problemen in de opvolging van de apostelen, omdat men vond dat deze niet zomaar aangewezen konden worden en doofde de kerk langzaam uit. Tegelijkertijd ontstonden vele afscheidingen en nieuwe bewegingen die zich apostolisch noemden.

Mogelijk Lambertus Scheepers
(1834-1880)
In Nederland ontstond de - traditionele - Katholiek Apostolische Gemeente (KAG) toen de Britse apostel King-Church halverwege de jaren 1860 naar ons land kwam. In 1867 ontstond de eerste gemeente in Den Haag, in 1868 volgde Rotterdam. Hoewel géén nieuwe apostelen werden aangewezen groeide de gemeente in het begin van de twintigste eeuw tot ongeveer tweeduizend leden.

In 1869, één jaar na de opening van de Rotterdamse gemeente, trad mijn bet-betovergrootvader Lambertus Scheepers met zijn gezin toe tot de KAG. Hij was opgegroeid in het hervormde geloof, terwijl zijn vader een katholieke achtergrond had. Wat sprak hem zo aan in deze kerk? Leidde het verschil tussen de religie van zijn ouders tot twijfel? Sprak de religieuze energie tot zijn verbeelding? Hij was er in ieder geval snel bij. Binnen de Rotterdamse gemeente bekleedde hij - voor zover ik gehoord heb - de ambten van priester en engel. In mijn bezit bevind zich nevenstaande foto, afkomstig uit het begin van de jaren 1870, waarvan ik denk dat het weleens Lambertus kan zijn.

Veel van Lambertus' nakomelingen behoren tot op deze dag tot de KAG. Mijn grootmoeder is er ca. 1950 vertrokken. De KAG werd voor haar, zeker sinds de ontkerkelijking van de jaren die volgden, een verre herinnering.

donderdag 14 januari 2021

Een som van segmenten

In mijn vorige post ging ik op zoek naar de genetische oorsprong van mijn grootmoeder met behulp van G25-coördinaten en het destilleren van verschillende genetische componenten. Voor de kleinste component, die ~5% Indiaas is, werkte deze methode niet goed omdat de foutmarges en ruis in de modellen te hoog werden. Het beste zou zijn om een puur segmentele analyse uit te voeren, d.w.z. het vergelijken van deze segmenten met mensen die toevallig op deze stukken matchen; op deze manier is een verwantschap binnen de laatste vierhonderd jaar aannemelijk en kunnen hopelijk geografische locaties aan de segmenten worden toegevoegd. Zo'n analyse is voor mij niet uit te voeren, want ik heb geen beschikking over uitgebreide testgroepen en naast bekende nakomelingen van de familie Pike, de grootste bron van onze Zuid-Aziatische genen, zijn er vooralsnog géén anderen die op deze segmenten matchen; de markt voor genetische genealogie is nog altijd beperkt buiten Amerika en West-Europa.

Het zou daarom interessant kunnen zijn om een oracle-based methode te gebruiken voor deze segmenten. Door specifiek naar deze segmenten te kijken i.p.v. deze component uit het totaal te destilleren, hoop ik de foutmarges te verkleinen. Omdat er geen G25 coördinaten beschikbaar zijn per segment, gebruik ik de oudere K36 componentenanalyse m.b.v. DIY Dodecad die ik ook eerder heb gebruikt bij de analyse van een chromosoom. Er zijn een stuk of 10 segmenten met een waarschijnlijke Zuid-Aziatische herkomst. Dat is maar goed ook, want had ik maar één segment gehad, dan zou ik niet gedetailleerder dan "Zuid-Azië" kunnen komen; afzonderlijke segmenten geven vanwege hun relatief geringe omvang te extreme percentages van één component. De tien segmenten bij elkaar dempen deze extremiteiten enigszins.

Zeven van de tien segmenten heeft een "extreem" hoge Zuid-Aziatische component, één van de tien heeft een veel hogere Zuid-Centraal-Aziatische component, en twee segmenten vertonen een gemengd beeld. Wat bij deze segmenten voornamelijk interessant is, is de verhouding tussen deze twee componenten. De Zuid-Aziatische component is het hoogst onder de Tamil uit Sri Lanka en in het zuiden van India; de Zuid-Centraal-Aziatische component piekt onder Pakistaanse bevolkingsgroepen. De gebieden hiertussen vormen een overgangsgebied. 

De taalgebieden van Telugu (links) en
Tamil (rechts) (bron: wikimedia commons)
Bij de Tamil is de verhouding tussen de Zuid-Aziatische en Zuid-Centraal-Aziatische component ongeveer 4 op 1. Ook bij hen is de Zuid-Centraal-Aziatische component dus aanwezig. Bij de Telugu, die met name aan de Zuidoostkust in Andhra Pradesh wonen, is de verhouding tussen deze componenten ongeveer 2 op 1. Bij mijn grootmoeders segmenten vind ik een verhouding van 3 op 1, minder zuidelijk dan bij de Tamil, maar zuidelijker dan bij de Telugu. Een positie tussen de Tamil en de Telugu is aannemelijk; de moeder van Mary Anne Pike kwam uit Andhra Pradesh, en zou weleens nauw verwant aan de Telugu kunnen zijn. Mary Anne's vader had voorouders uit de V.O.C.-gemeenschap aan de Coromandelkust, waaronder waarschijnlijk ook Tamil-sprekende voormoeders. Het blijft mogelijk dat een klein gedeelte van de segmenten toch uit Noord-India afkomstig is. Om hier écht zekerheid over te verkrijgen is het noodzakelijk - bij gebrek aan de nabijheid van de voormoeders in kwestie - dat er toevallig mensen uit India met een lokale herkomst op deze segmenten matchen.

woensdag 13 januari 2021

Synthetische schimmen

In mijn vorige bericht concludeerde ik dat oracle-based methodes niet geschikt zijn om dicht aan elkaar verwante etnische groepen, zoals Nederlanders, Duitsers en Engelsen van elkaar te onderscheiden. Ook zijn deze testen niet zo geschikt voor mensen met een gemengde achtergrond, wanneer van tevoren niet duidelijk is waar de mix uit bestaat. De kans is namelijk aanwezig dat de test bevolkingsgroepen aanwijst die tussen de werkelijke mix in liggen; iemand met een Russische vader en Chinese moeder zou bijvoorbeeld als een Kazach uit de test tevoorschijn kunnen komen. Een gerichte test zou dit wel kunnen aanwijzen, maar de bedrijven hebben natuurlijk niet de capaciteit om dit voor al hun honderdduizenden testers te doen - als de testers al weten in welke hoek ze het moeten zoeken.

Een gerichte test m.b.v. Global 25 coördinaten kan interessant zijn om meer te weten te komen over een gemengde achtergrond, zoals ik ook eerder heb uitgezocht. Hoewel ook Global 25 oracle-based is, kent het een grote database, zodat het - zeker bij een gerichte test - vrij goed mogelijk is om een gedetailleerd onderzoek te doen. Deze keer bekijk ik de afkomst van mijn grootmoeder, waarbij ik gebruik maak van de visualisatiemogelijkheden van Vahaduo.

Door middel van de "afpelmethode" kom ik m.b.v. de dataset van Global 25 (populatiegemiddelden) tot de volgende redelijke schatting voor mijn grootmoeders afkomst:

distance: 1.5196%
38.0 Dutch
26.0 Sicilian_East
16.0 Indonesian_Java
15.0 German_East
5.0 Uttar_Pradesh

Dit komt aardig overeen met mijn schatting van ~53% West-Europees, ~25% Joods, ~17% Indonesisch en ~5% Indiaas, waarmee ik verder zal rekenen.

Ik zal nu deze vier componenten op zichzelf bekijken door ze uit het geheel te "destilleren". Dit doe ik door de coördinaten van de overige componenten - in het gewenste percentage - van het totaal af te trekken en het restant te delen door het percentage dat overblijft. Op deze manier ontstaat er een synthetische voorouder, een genetische "schim" uit het verleden die de te onderzoeken component vertegenwoordigt. Hoe kleiner de component, hoe groter de foutmarge.

Laat ik beginnen met de West-Europese component. Kijk ik puur naar de papieren stamboom, dan zou deze ongeveer voor 2/3 Nederlands moeten zijn, voor 1/4 Duits en voor de rest met name Belgisch, Frans en Engels. De synthetische West-Europese voorouder, die ik X1 noem, lijkt op een mengsel van Brits en Duits wanneer ik populatiegemiddelden gebruik. De individuen van de bevolkingsgroepen rondom de Noordzee overlappen echter nogal met elkaar. In figuur 1, de Noordwest-Europese grafiek, die ik in mijn vorige bericht liet zien, is X1 in het midden van de Nederlandse groep te vinden:

Figuur 1: Synthetische voorouder X1 
in de Noordwest-Europese genetische ruimte.

Dat X1 in het midden van het Nederlandse gebied terecht komt is niet zo vreemd, want een groot deel van zijn achtergrond is Nederlands. Het Duitse deel zal hem iets naar het noorden en oosten getrokken hebben, het Franse en het Engelse deel naar het zuiden en westen, en als gevolg hiervan lijkt hij weer in het midden terechtgekomen te zijn. Om de andere componenten te destilleren, zie ik geen noodzaak om naast Nederlands ook Oost-Duits - zoals in de eerste schatting - mee te nemen bij de berekening.

Figuur 2: Synthetische voorouder X2
in de Mediterraanse genetische ruimte.

De tweede component die ik wil visualiseren is de Joodse component, die door de synthetische voorouder X2 vertegenwoordigd wordt. Op papier is deze een mix van 3/4 Asjkenazisch en 1/4 Sefardisch (waaronder vermoedelijk wat Italiaans-Joods). In figuur 2 zien we de genetische ruimte van het (oostelijke) Middellandse Zeegebied, dat van Midden-Italië (links) via Zuid-Italië en de Griekse eilanden naar Cyprus en de Levant (rechts) loopt. Dat Zuid-Italië zo op de Griekse eilanden lijkt, komt voor een groot deel door de Griekse kolonisatie van het gebied in de oudheid. De Europese Joodse bevolkingsgroepen lijken voor het grootste deel te bestaan uit een mix van Levantse, Griekse en Romeinse invloeden en liggen hierom ook in dezelfde genetische ruimte. We zien X2 net onder de Asjkenazische en Kretenzische clusters, ergens halverwege Campanië (de streek rondom Napels). Ik vind dat de positionering van X2 in deze grafiek vrij goed overeenkomt met wat we van de papieren stamboom mogen verwachten, zeker wanneer we rekening houden met enige foutmarges. De precieze plek in de grafiek is niet zozeer belangrijk; ook hier overlappen individuen van verschillende bevolkingsgroepen met elkaar. Het gaat er mij om dat de context duidelijk wordt waarin gezocht moet worden.

Figuur 3: Synthetische voorouders X3 en X4
in de Zuidoost-Aziatische genetische ruimte.


In figuur 3 zien we de Zuidoost-Aziatische genetische ruimte. Rechtsboven zien we de Mlabri en Htin Mal, twee kleine bevolkingsgroepen in Laos (en Thailand), die beide een Austro-Aziatische taal spreken. Het wordt aangenomen dat de Austro-Aziatische bevolkingsgroepen zich verspreid hebben d.m.v. de landbouw over een groot deel van Zuidoost-Azië, waaronder Indonesië. Rechtsonder in de grafiek vinden we de Dusun en Murut, bevolkingsgroepen uit het noorden van Borneo, die een grotendeels Austronesische afkomst hebben. Ook de Austronesiërs verspreidden zich vanuit het noorden over Indonesië. De Javanen liggen genetisch halverwege de Austro-Aziatische en Austronesische groepen. Linksboven zien we de Thaise en Vietnamese individuen, die zich van de rest onderscheiden door een extra Chinese component. Synthetische voorouder X3 bestaat uit de som van de Aziatische componenten, en is rechtsboven te vinden in het Austro-Aziatische cluster. Het is niet vreemd dat meerdere bedrijven die een oracle-based test gebruiken hier tot de conclusie komen dat er sprake kan zijn van voorouders uit Laos of Cambodja (iets dat ik vaker bij Indo's heb gezien; bij een mengsel van Indonesisch en Chinees wordt soms aan Thailand gedacht), want hoe moet zo'n model - zonder afzonderlijke segmenten te bekijken - nu weten dat deze Aziatische component óók een mengsel is? 

In dezelfde grafiek zien we synthetische voorouder X4, die de Zuidoost-Aziatische component vertegenwoordigt, aan de rand van het Javaanse cluster. Er lijkt, rekening houdend met enige foutmarges, niet veel sprake van enig Chinees bloed. Ook ontbreekt een extra Austronesische tendens, zoals deze in het binnenland van Borneo te vinden is. Een etniciteitsschatting van X4 geeft dan ook voor het grootste deel Javaans aan, eventueel met enkele procenten Lebbo (een bevolkingsgroep op Borneo). Dit suggereert voor mij, voor zover het mogelijk is om dat te beweren, dat onze Borneo'se voormoeders met name uit het zuidelijk kustgebied kwamen en niet uit het binnenland.

Figuur 4: Synthetische voorouder X5
in de Zuid-Aziatische genetische ruimte.

In figuur 4 wordt de Zuid-Aziatische genetische ruimte weergegeven. Links staan de meest Dravidische bevolkingsgroepen (grotendeels uit het zuiden en midden van India), rechts zien we de meer Indo-Arische groepen. De genetische diversiteit in India wordt niet alleen door geografische patronen, maar ook door het casten-stelsel vormgegeven en is hierdoor voor de buitenstaander nogal ingewikkeld. Synthetische voorouder X5, die de Zuid-Aziatische component moet vertegenwoordigen, staat het dichtst bij Brahmins uit Noord- en Oost-India, maar staat ook enigszins buiten de rest. Bij een etniciteitsschatting van X5 vormen verscheidene Noord- én Zuid-Indiase groepen het hoofdbestanddeel, maar zou ook een flink deel bestaan uit West-Aziatische of Oost-Afrikaanse bevolkingsgroepen. Ik vermoed dat het niet goed mogelijk is om deze component goed te destilleren omdat het een klein percentage van het geheel vertegenwoordigt; het kan zijn dat er nog een halve procent van een andere component tussen zit; in ieder geval groeien zowel de foutmarge als de genetische ruis in de modellen. Precieze details over de Zuid-Aziatische component lijken lastig te achterhalen d.m.v. deze methode.

Ik concludeer dat het mogelijk is om m.b.v. Global 25 (G25) coördinaten de genetische componenten bij mensen met een gemengde achtergrond in een genetische context te plaatsen en te visualiseren, mits deze componenten genoeg van elkaar verschillen, maar dat deze methode niet geschikt is voor gedetailleerd onderzoek naar componenten die een klein percentage (ca. 5%) van het geheel uitmaken omdat dan de invloed van ruis in de modellen te groot wordt.

maandag 11 januari 2021

Nederland in genetische testen

Één van de populaire onderdelen van DNA-testen waarmee ook uitgebreid geadverteerd wordt is de etniciteitsschatting, en dit is nu net het minst concrete en definitieve onderdeel van zo'n test. De schatting hangt voor een groot deel af van welke groepen als referentie worden gebruikt om de tester mee te vergelijken. Omdat een groot deel van de markt zich in Amerika en Groot-Brittanië afspeelt, gebruiken de meeste bedrijven wel een groep "Brits" of soortgelijk. De rest van West-Europa wordt dan in groepen zoals "Noordwest-Europees" of "Scandinavisch" gestopt. Mensen met een Nederlandse afkomst krijgen hierdoor meestal een mix van Brits, Scandinavisch en Noordwest-Europees als resultaat, soms aangevuld met iets Zuid-Europees. Dit betekent dus niet letterlijk dat iemand uit die gebieden stamt, maar dat zij volgens het algoritme lijken op die door het bedrijf gebruikte en gelabelde categorieën. Hiernaast speelt de gebruikte methode een rol. Bij een oracle-based methode, zoals gebruikt door MyHeritage of FamilyTreeDNA, wordt de tester omgezet in een coördinaat, of een punt op een (meerdimensionale) grafiek, waarna het algoritme met behulp van de referentiegroepen een zo goed mogelijke benadering probeert te krijgen van de tester. Dat dit niet de beste methode is, kan wat mij betreft het beste duidelijk worden gemaakt in een grafiek:

De genetische ruimte in Noordwest-Europa


In deze grafiek, gemaakt met behulp van Vahaduo heb ik een deel van de Global 25 dataset van Eurogenes weergegeven. De grafiek toont globaal gezien de genetische ruimte van Noordwest-Europa, waarbij elk punt een individu is. In het midden zien we de Nederlanders, overlappend met de Engelsen, Ieren, Belgen en Zweden. Om de grafiek rustig te houden, heb ik de Denen en de West-Duitsers weggelaten - het moge duidelijk zijn dat Nederlanders ook sterk met hen overlappen. Een specifiek Nederlands genetisch cluster is met deze methode niet aan te wijzen; er is zodanig veel overlap tussen verschillende individuen uit de verschillende landen van Noordwest-Europa, dat een oracle-based methode niet goed in staat is om specifieke details van iemands afkomst te achterhalen. Dit betekent echter niet dat de test incorrect of onnauwkeurig is; een Noordwest-Europeaan zal als zodanig worden neergezet, al is het in wat globale zin.

Het is volgens mij beter om een segment-based methode te gebruiken, zoals 23andMe doet. Hierbij wordt elk chromosoom stukje voor stukje afgelopen om zo te zien bij welke genetische referentiegroep deze het beste past. Ook hier zijn er grenzen aan de etniciteitsschatting: hoe kleiner het te onderzoeken stukje chromosoom, hoe ouder en wijder verspreid het is. Ook 23andMe blijft hierom vrij globaal, maar vaak wel nauwkeuriger, in de etniciteitsschatting. Wat zij echter wél hebben gedaan is het toevoegen van "genetische regio's", waarbij sommige DNA-segmenten duidelijk wijzen op specifieke gebieden, en hierbij zijn zij in staat om specifieke provincies in Nederland aan te wijzen, zoals zij ook bij mij hebben weten te doen. Ook MyHeritage heeft onlangs genetische regio's geïntroduceerd. Deze maken dus geen onderdeel uit van de oracle-based etniciteitsschatting, maar worden afgeleid op basis van specifieke DNA-segmenten die in specifieke regio's vaak worden gedeeld. De namen van de regio's hebben zij gebaseerd op de stambomen van de deelnemers.

Genetische regio's MyHeritage

In bovenstaande afbeeldingen drie van de genetische regio's die MyHeritage aan mijn - geüploade - file toeschrijft, van links naar rechts: Noord-Brabant (ik zie de contouren van de Meierij), Zuid-Holland/Utrecht (ofwel het Groene Hart) en Utrecht/Gelderland. Ook geven zij mij o.a. Friesland en Rotterdam. Ik heb inderdaad voorgeslacht uit deze gebieden, in hoeverre dit betekent dat de gebieden accuraat zijn, moeten we nog afwachten. Deze methode, die specifieke lokale DNA-segmenten bekijkt, leidt in ieder geval tot specifiekere conclusies dan de globale etniciteitsschattingen, en kan naar mijn mening interessant zijn om de genetische geschiedenis van Nederland nader te onderzoeken.



vrijdag 1 januari 2021

Het nieuwe jaar

Een vreemd jaar is voorbij, een nieuw - misschien ook wel vreemd - jaar is begonnen. Hoe kijk ik terug op het afgelopen stamboomjaar?

Ik heb tot mijn tevredenheid mijn kwartierstaat bijgewerkt zodat bij elk echtpaar een bron en een datum van laatste wijziging staat. Dit komt m.i. ten goede van de kwaliteit en verantwoording. Ik probeer hier volledig, maar compact te zijn: hierom vermeld ik géén volledige gezinnen of álle bronnen waarin iemand voorkomt. Niet alle conclusies komen direct uit bronnen voort; ook logische beredeneringen hebben hun functie. Ik heb ook enkele generaties uit de late middeleeuwen toegevoegd. Ik weet nog niet of ik daarmee verder ga; het is mogelijk, maar je raakt al snel verstrikt in de talloze middeleeuwse families die op ontelbare manieren met elkaar verweven zijn. Niet alle gegevens in de kwartierstaat zullen kloppen: zo heb ik afgelopen jaar afscheid genomen van hofrabbijn Abraham Senior, die ik al tien jaar had vermeld. Ik vermoed dat ook gegevens over Waalse of Noord-Franse families uit de vijftiende en zestiende eeuw niet altijd even correct zijn: vaak gaat het hier om families die eind negentiende eeuw voor het laatst onderzocht zijn. De kwartierstaat is groot en bevat veel informatie. Je zou misschien kunnen zeggen dat het uit de hand gelopen is. Tegelijkertijd groeit de hoeveelheid informatie mee met alle bronnen die vaak digitaal beschikbaar komen. Zonder deze ontwikkelingen - en een redelijk volhardende geestdrift - had ik nooit zoveel gegevens bij elkaar kunnen verzamelen. Voorbeelden van grote uitgewerkte kwartierstaten die ik mooi vind zijn die van mijn verre achterneven dhr. K.J. Slijkerman en dhr. Zuiderent die met name handig zijn voor onderzoek op de Zuid-Hollandse eilanden. In dit verband wil ik ook de kwartierstaat van mevr. J. Bos noemen. Ook interessant zijn de kwartierstaten van dhr. Lapikás en dhr. van der Tas. Hoe uitgebreid ook, volledig zal het nooit zijn: van de voorouders die rond het begin van de Gouden Eeuw geboren zijn, ken ik 7/8 (nog) niet.

In de tweede helft van dit jaar heb ik mij veel beziggehouden met mijn Portugees-Joodse kant, waarbij ik een aantal basis-genealogieën heb opgesteld. Ik heb hierbij onder meer kennis gemaakt met de bronnen van de Spaanse en Portugese Inquisitie. Ook de gegevens van het notarieel archief van Amsterdam zijn bij dit onderzoek van groot belang geweest. Hoewel er al veel is gedigitaliseerd, is nog 90% van deze notarissen niet op naam doorzoekbaar. Ik heb bij Velehanden meegewerkt aan de digitalisering hiervan, hoewel ik mijn doel van tien akten per dag bij lange na niet gehaald heb. We zullen in de toekomst zien welke schatten nog verborgen zijn in dit archief.

Een belangrijke doorbraak is de vondst van de huwelijksinschrijving van mijn (hoogstwaarschijnlijke) stamvader Claes Arijens (van der Heijden), zodat ik Uden als nieuwe plaats van oorsprong van mijn vaderlijn moet beschouwen. Kijk ik verder m.b.v. genetica, dan lijkt een Italiaans-Romeinse oorsprong van mijn vaderlijn steeds aannemelijker. Het veld van de genetische genealogie heeft zich het afgelopen jaar slechts langzaam doorontwikkeld. Ik weet nu zeker dat ik grotendeels Noordwest-Europees ben, stukken Joods, Zuidoost-Aziatisch én Zuid-Aziatisch bloed heb, en dat ál mijn betovergrootouders mij stukken DNA hebben nagelaten. De zoektocht naar welke voorouder mij welk stuk DNA gegeven heeft is nog altijd in volle gang. Sommige vragen staan nog open: wie was toch de vader van mijn betovergrootmoeder, de man die haar moeder, toentertijd dienstmeid in Deil, bezwangerde? Mogelijk kan de oudere generatie mij helpen om hier meer antwoorden op te vinden.

Waar kijk ik naar uit komend jaar? Met name naar de verdere digitalisering van het Amsterdamse nationaal archief. Hiernaast hoop ik ook op meer Duitse bronnen. Op Archion en Matricula komt steeds meer beschikbaar, maar snel gaat het allemaal niet. Ik heb een aantal onderzoeksideeën in mijn hoofd voor dit jaar, zowel op het gebied van genealogie als op genetica. Zoveel tijd als ik afgelopen jaar had, heb ik dit jaar niet, want ik ga binnenkort weer meer aan het werk - ook belangrijk!