vrijdag 27 november 2020

Nieuwe etniciteitsschattingen

Om de zoveel tijd komen de genetische bedrijven met updates van hun etniciteitsschattigen, In sommige gevallen is er sprake van een aanzienlijke verbetering, in andere gevallen wordt het er niet beter op.

FamilyTreeDNA

Waar FamilyTreeDNA nog altijd heer en meester is wat betreft analyse van het Y-chromosoom en het mitochondrisch DNA, lopen zij nog wat achter wat betreft analyse van het autosomale DNA. Na jaren van MyOrigins 2.0 is FamilyTreeDNA begonnen met het uitrollen van versie 3.0. Ik had hier positieve verwachtingen over, in het bijzonder omdat zij een forse uitbreiding van hun genetische regio's én een chromosome painter aankondigden, waardoor het erop leek dat zij het meest nauwkeurig en transparant zouden worden in hun schattingen. De uitrol van 3.0 voor zover ik die heb kunnen zien valt echter tegen.

De precieze methode die zij gebruiken ken ik niet, maar hun uitkomst lijkt veel op wat verwacht kan worden bij een "oracle-based" analyse, een algoritme gebaseerd op genetische afstand. Hierbij wordt een genoom omgezet in een punt op een veel-dimensionale grafiek met bijbehorende coördinaten. Elke referentiegroep heeft ook zijn eigen coördinaten. Door middel van een berekening wordt een bepaalde mix van deze referentiegroepen bepaald waarvan de coördinaten zo dicht mogelijk bij die van de tester liggen. Eventueel worden aanvullende parameters toegevoegd om onwaarschijnlijke uitkomsten te vermijden (bijvoorbeeld: iemand met een Engelse vader en een Chinese moeder moet natuurlijk niet als "Centraal Aziaat" uit de test komen).

Voor mensen met een enkelvoudige afkomst is de oracle-based analyse vrij nauwkeurig: binnen Europa worden de resultaten dan ook steeds nauwkeuriger. Voor mensen met een gemengde afkomst, in het bijzonder met een afkomst uit verschillende werelddelen, lijkt de oracle-based methode zoals FamilyTreeDNA deze toepast, minder geschikt. Bij verschillende mensen heb ik gehoord en gezien dat hun (Oost-)Aziatische component zeer sterk wordt onderschat ten opzichte van de Europese componenten en bovendien in veel gevallen onterecht wordt ondergebracht in de component "Oost-India" i.p.v. een Zuid-Oost-Aziatische component. Redenen hiervoor zijn volgens mij de groei van het aantal referentiegroepen waardoor het aantal mogelijke uitkomsten veel groter is, de neiging van het algoritme om groepen te kiezen die dichter bij elkaar liggen dan die ver uit elkaar liggen, een sterke focus op Europa en het ontbreken van een gerichte analyse. Hiernaast vraag ik mij af waar de "Oost-India"-referentiegroep uit bestaat, die omliggende gebieden lijkt op te slokken. Oracle-based analyse kan zeer nauwkeurig zijn, zeker voor mensen met een gemengde achtergrond, wanneer gerichte analyse plaatsvindt, bijvoorbeeld met G25-coördinaten. Het bedrijf heeft echter niet de capaciteit om dit voor enkele miljoenen mensen te doen.

De oracle-based analyse blijkt ook wel uit het ontbreken van een chromosome-painter: een overzicht van de chromosomen waarop de etniciteiten zijn weergegeven. Indien zij dit wél hadden gedaan, hadden zij makkelijk moeten kunnen zien dat ik ongeveer 1/16 Joods-gerelateerd DNA heb: deze groep is immers zeer makkelijk waar te nemen vanwege de vele specifieke DNA-matches. Zij gaven mij echter, ondanks hun uitbreiding naar maar liefst vier joodse referentiegroepen, 6% van een willekeurige Zuidoost-Europese referentiegroep; in een random oracle-based analyse geeft dit namelijk een soortgelijke genetische afstand tot mijn coördinaten.

23andMe

Meer succes heb ik bij 23andMe. Hoewel dit bedrijf zich steeds meer richt op de medische genetica, waar meer toekomstperspectief in zit, is hun etniciteitsschatting voor mensen met een gemengde achtergrond naar mijn mening onovertroffen. Zij gebruiken een "segment-based" analyse. Dit betekent dat zij elk chromosoom stukje voor stukje aflopen om te zien welke referentiegroep het dichtste in de buurt komt. Het is ook mogelijk om segmentele analyse zelf te doen, mits men handig genoeg is. Bij de nieuwste schatting hebben zij "smoothing" toegepast. Wanneer de etniciteit van een bepaald segment niet zeker is, wordt er gekeken naar de etniciteit van direct naastliggende segmenten. Ik ben tevreden: naast een grotendeels Noordwest-Europese afkomst, waarbij zij zelfs Nederland aanmerken als meest waarschijnlijke plek van afkomst, schatten zij mij op zo'n 4,5% Indonesich(-achtig), 1,5% (Noord-)India en 5% Asjkenazisch. Hiermee zijn zij het enige bedrijf dat ál mijn etnische regio's nauwkeurig heeft kunnen bepalen met percentages die passen bij wat ik in de papieren stamboom vind.

Segment-based analyse heeft echter ook zijn limieten: hoe kleiner het segment, hoe ouder het is, en hoe wijdverbreider het is. Zo kom je al gauw bij middeleeuwse of nog oudere segmenten aan, die misschien rond de gehele Noordzee verspreid zijn. Hierdoor krijgen Nederlanders naast Continentaal Noordwest-Europees vrijwel altijd een percentage Brits of Scandinavisch. Het gebruik van smoothing is dan weer onhandig voor veel Amerikanen die uit een goed gehusseld Engels/Duits mengsel bestaan: door de smoothing kunnen zij ofwel heel Brits, ofwel heel Continentaal uit de schatting komen.

Welk bedrijf?

Voor mij persoonlijk is 23andMe van de "grote vier" momenteel het beste bedrijf wat betreft etniciteitsschatting. Wat tegen hen pleit, is dat zij mensen die op een oude chip getest hebben vaak niet updaten. FamilyTreeDNA is dan weer het beste voor het testen van het Y-chromosoom en het mt-DNA. MyHeritage is het beste voor Europeanen om DNA-matches te vinden. Met Ancestry heb ik geen ervaring: zij hebben een grote database, maar maken het moeilijk om te zien hoe je precies met elkaar matcht. LivingDNA begon veelbelovend in Europa, maar lijkt toch moeite te hebben met het veroveren van een plek op de markt. Hiernaast zijn er vele andere testbedrijven. Omdat zij hun naam echter nog niet gevestigd hebben, zou ik daar voorzichtig mee zijn. Ten slotte heb ik het idee dat het nog altijd beter is om zelf de analyse en interpretatie te doen van de "ruwe data" die zij mij leveren: het blijft maatwerk.

Geen opmerkingen:

Een reactie posten