donderdag 14 januari 2021

Een som van segmenten

In mijn vorige post ging ik op zoek naar de genetische oorsprong van mijn grootmoeder met behulp van G25-coördinaten en het destilleren van verschillende genetische componenten. Voor de kleinste component, die ~5% Indiaas is, werkte deze methode niet goed omdat de foutmarges en ruis in de modellen te hoog werden. Het beste zou zijn om een puur segmentele analyse uit te voeren, d.w.z. het vergelijken van deze segmenten met mensen die toevallig op deze stukken matchen; op deze manier is een verwantschap binnen de laatste vierhonderd jaar aannemelijk en kunnen hopelijk geografische locaties aan de segmenten worden toegevoegd. Zo'n analyse is voor mij niet uit te voeren, want ik heb geen beschikking over uitgebreide testgroepen en naast bekende nakomelingen van de familie Pike, de grootste bron van onze Zuid-Aziatische genen, zijn er vooralsnog géén anderen die op deze segmenten matchen; de markt voor genetische genealogie is nog altijd beperkt buiten Amerika en West-Europa.

Het zou daarom interessant kunnen zijn om een oracle-based methode te gebruiken voor deze segmenten. Door specifiek naar deze segmenten te kijken i.p.v. deze component uit het totaal te destilleren, hoop ik de foutmarges te verkleinen. Omdat er geen G25 coördinaten beschikbaar zijn per segment, gebruik ik de oudere K36 componentenanalyse m.b.v. DIY Dodecad die ik ook eerder heb gebruikt bij de analyse van een chromosoom. Er zijn een stuk of 10 segmenten met een waarschijnlijke Zuid-Aziatische herkomst. Dat is maar goed ook, want had ik maar één segment gehad, dan zou ik niet gedetailleerder dan "Zuid-Azië" kunnen komen; afzonderlijke segmenten geven vanwege hun relatief geringe omvang te extreme percentages van één component. De tien segmenten bij elkaar dempen deze extremiteiten enigszins.

Zeven van de tien segmenten heeft een "extreem" hoge Zuid-Aziatische component, één van de tien heeft een veel hogere Zuid-Centraal-Aziatische component, en twee segmenten vertonen een gemengd beeld. Wat bij deze segmenten voornamelijk interessant is, is de verhouding tussen deze twee componenten. De Zuid-Aziatische component is het hoogst onder de Tamil uit Sri Lanka en in het zuiden van India; de Zuid-Centraal-Aziatische component piekt onder Pakistaanse bevolkingsgroepen. De gebieden hiertussen vormen een overgangsgebied. 

De taalgebieden van Telugu (links) en
Tamil (rechts) (bron: wikimedia commons)
Bij de Tamil is de verhouding tussen de Zuid-Aziatische en Zuid-Centraal-Aziatische component ongeveer 4 op 1. Ook bij hen is de Zuid-Centraal-Aziatische component dus aanwezig. Bij de Telugu, die met name aan de Zuidoostkust in Andhra Pradesh wonen, is de verhouding tussen deze componenten ongeveer 2 op 1. Bij mijn grootmoeders segmenten vind ik een verhouding van 3 op 1, minder zuidelijk dan bij de Tamil, maar zuidelijker dan bij de Telugu. Een positie tussen de Tamil en de Telugu is aannemelijk; de moeder van Mary Anne Pike kwam uit Andhra Pradesh, en zou weleens nauw verwant aan de Telugu kunnen zijn. Mary Anne's vader had voorouders uit de V.O.C.-gemeenschap aan de Coromandelkust, waaronder waarschijnlijk ook Tamil-sprekende voormoeders. Het blijft mogelijk dat een klein gedeelte van de segmenten toch uit Noord-India afkomstig is. Om hier écht zekerheid over te verkrijgen is het noodzakelijk - bij gebrek aan de nabijheid van de voormoeders in kwestie - dat er toevallig mensen uit India met een lokale herkomst op deze segmenten matchen.

Geen opmerkingen:

Een reactie posten