Test mtDNA y yDNA de FTDNA

En este post resumo los tests mtDNA e yDNA que ofrece Family Tree DNA.

Tests mtDNA

¿Quién puede realizar este test? Mujeres y hombres.

mtDNA+ (HVR1+HVR2) 

Este test nos permite obtener nuestro haplogrupo maternal. Técnicamente lo que realiza es analizar dos zonas del mitocondrial donde se “codifican” las mutaciones identificadas para los haplogrupos.

¿A quien se lo recomiendo? A todo aquel que tenga interés de saber su haplogrupo maternal.

mtDNA FMS (HVR1 + HVR2 + Coding Region)
Este test es el complemento al mtDNA+ incluyendo el Coding Region. El Coding Region del mitocondrial es el lugar donde existe mutaciones más recientes y permiten relacionarnos con parientes cercanos en un rango generacional de 1 a 30 generaciones atrás. Para genealogía nos permite dar unas pinceladas de que matches tienen relación con nosotros, pero a niveles prácticos vamos a tener que realizar investigación con el autosomal.

¿A quien se lo recomiendo? A todo aquel que tenga interés de saber su haplogrupo maternal y este buscando por el lado materno matches que en varias generaciones atrás tuvo relación con su familia.

Tests yDNA

¿Quién puede realizar este test? Sólo hombres. Las mujeres no tienen el cromosoma Y.

El test yDNA nos permite encontrar el linaje paternal, además de su haplogrupo. Al existir cierta correlación entre apellido y linaje paternal, es muy posible encontrar matches genéticos con mismo apellido paterno.

Existen varios tests Y12, Y25, Y37, Y67, Y111. El número tras el “Y” significa el número de marcadores relevantes de cara a matching genético. Cuanto más alto, más preciso y más cercanía genética con dichos matches. Recomiendo empezar en Y37, a menos que la economía no lo permita, ya que el Y12 y Y25 te darán un haplogrupo demasiado alto nivel y matches genéticos de varios siglos atras (practicamente irrelevante).

Y37

Este test nos permite obtener 37 marcadores del cromosoma Y con los cuales obtenemos:

  • Matching de relativos genéticos con una diferencia de 8-10 generaciones
  • Haplogrupo paternal básico

Matching Generaciones: 8

Y67

Este test es el siguiente a realizar después del Y37 una vez encontremos matches relevantes en Y37. Si en Y37 no tenemos matches relevantes, no merecerá la pena invertir dinero en él. ¿El motivo? En una explicación sencilla, si con 37 “letras” de un frase, la frase no coincide, por incluir el restante hasta 67 no vamos a lograr más que confirmar que no coincidimos con nadie. Si matcheamos con alguien a este nivel, tendremos una posibilidad de tener una ancestro en común hasta 6 generaciones atrás.

Matching Generaciones: 6

Y111

Similar a lo comentado en Y67, pero con el detalle de 111 marcadores. Si en Y67 hemos conseguido una serie de matches relevantes, este tests nos permitirá confirmar una mayor cercanía generacional (4 generaciones).

Matching Generaciones: 4

Y500

Este tests es la conjunción de Y111 y BIG-Y. Conseguimos 500 marcadores de matching genético y 100.000 SNPs. Con ello obtendremos el máximo detalle (real) de nuestro haplogrupo paterno y el máximo grado de matching paternal con relativos genéticos que ofrece FTDNA.

Matching Generaciones: Practicamente actual

 

Advertisements

Convert 23andme V5 RAW to MyHeritage and Gedmatch classic valid format

Did you tested in 23andme? Are you frustrated with MyHeritage and Gedmatch Classic does not accept 23andme V5 files (>Aug. 2017)? There is a solution that I have developed to solve this problem. Read more here

Cálculo de Oracle una población con Excel

Hoy vamos a realizar una sesión práctica de cómo funcionan las calculadoras Oracle de Gedmatch.

admix

Como habréis visto, tras meter tu número de kit y recibir los resultados en formato % y la gráfica de tarta, tienes un botón denominado Oracle y Oracle 4 dónde te saca una aproximación de poblaciones en combinaciones de 1, 2, 3 y 4 poblaciones.

Oracle 1 Población de Eurogenes K15

Sin entrar en detalles profundos de matemática, explicaremos el cálculo de una población del Oracle.

Para ello, vamos a ver lo que es una distancia Euclídea y Manhattan, respecto a las poblaciones del Spreadsheet que nos ofrece las calculadoras junto al botón Oracle y Oracle 4.

En la captura veis que hay una serie de poblaciones con un reparto porcentual de pesos por componente K.

spreadsheetk15

Dado esto, si queremos compararnos con estas poblaciones de referencia y ver lo cerca o lejos que estamos de cada una de ellas (distancia), podemos calcular la distancia Euclidiana (usada por Gedmatch) o Manhattan para este cometido.

Distancia Euclidiana 

Esta fórmula calcula (usada por Gedmatch) una distancia mediante el sumatorio de la diferencia entre el porcentaje que nos dio a nosotros en cada uno de los 15 componentes y las de la población de referencia para luego realizar el cuadrado de dicha diferencia, haciendo finalmente la raíz cuadrada de la suma.

euclidean

Distancia Manhattan

Podemos alternativamente, usar la distancia Manhattan aplicaríamos esta fórmula (esta no la usa Gedmatch). Que trata de sacar el sumatorio de los valores absolutos de la diferencia entre cada componente.

manhattan

El resultado por cada comparación entre nuestro resultado y población del Spreadsheet nos dará una distancia, siendo cercano a 0 más cercano/mayor similitud, y cuando más alejado de 0 menor similitud.

Si lo aplicamos al spreadsheet entero del K15 nos salen 206 distancias. Si la ordenamos de menor a mayor, ya tenemos nuestro Oracle 1. Fácil, no?

populationlist

Conclusiones

Como veis la matemática básica nos puede dar unos detalles relativamente interesantes de nuestra herencia de ADN.

Os adjunto un Excel para que calcular en casa vuestras poblaciones de K15. Los valores de distancias pueden variar por la precisión de decimales.

Descargar Excel de Oracle 1 Populations

Mejorar el mtDNA y yDNA de 23andme

Si habéis testeado padres e hijos en 23andme podeis mejorar la calidad de los marcadores leídos del mtDNA y yDNA (solo en hombres) mediante el uso de mi herramienta DNA Kit Studio. Con ello podremos obtener un mejor subclado en las páginas de James Lick (predictor de mtDNA) y Morley (predictor de yDNA).

El motivo es que al testearnos en cualquier compañia, en este caso 23andme, del mtDNA y yDNA solo leen N números de marcadores. De este N número de marcadores, el sistema de genotipado puede “fallar” en la lectura hasta un 4% para que sea admisible en los estándares de calidad. Estos fallos hacen que un marcador no sea lea, por lo que no se puede saber que valor tiene.

Dado que los haplogrupos dependen de que existan unos determinados marcadores, si un marcador no ha sido leído, el predictor de haplogrupo no tendrá información suficiente como para determinar con detalle el haplogrupo.

Algunos de los marcadores que no se leen no son significativos, pero otros sí son significativos y pueden hacer que los predictores no puedan decidir entre dos haplogrupos y se quede un subclado superior.

Por lo tanto y como imaginas, si unimos varios RAW de la misma familia, la probabilidad de corregir estos fallos aleatorios es bastante alta.

Ejemplo

Imaginemos que en una familia se han testeado dos hermanos y sus padres en 23andme, cada uno tiene un fichero RAW. Dado que los hijos tienen el mismo mtDNA que su madre y si son varones, tendrán el yDNA de su padre, podremos refinar el resultado mtDNA y yDNA uniendo los ficheros de hermanos + padre y/o madre.

  • yDNA mejorado = Padre + Hermano 1 + Hermano 2
  • mtDNA mejorado = Madre + Hermano 1 + Hermano 2

El fichero resultante de cada mejora nos servirá para subirlo a las páginas de predicción de subclados y obtener un detalle más acertado y preciso ;).

Reglas

Mejorar mtDNA

  • Unir ficheros RAW de hijos (tanto mujeres como hombres, ya que comparten el mtDNA los hijos indistintamente del sexo) con el de la madre

Mejorar yDNA

  • Unir ficheros RAW de padre con hijos varones. No mezclar el de hijas ya que simplemente no aporta ningún valor dado que las mujeres no tiene yDNA.

Instrucciones

  1. Descarga mi aplicación DNA Kit Studio y descomprime en un carpeta
  2. Descomprime los ficheros RAW de 23andme (solo 23andme nos vale)
  3. Abrir DNA Kit Studio y localizar la sección Merge RAW Files
  4. Seleccionar:
    1. Raw Data First: El primer RAW que queramos unir
    2. Raw Data Second: El otro fichero RAW que queramos unir
    3. Raw Data Output: Seleccionamos el nombre del fichero unido resultante
    4. Output Format: Seleccionamos el formato de salida. Es necesario que sea 23andme para poder subirlo a las páginas mencionadas.
    5. Merge SNPs: Dejar marcado
  5. Hacer clic en Merge
  6. Esperar unos segundos y el proceso finalizará
  7. Procedemos con el resto de RAW siguiendo las reglas expuestas en este artículo. Para ello, volvemos al paso 4 y el RAW Data First ponemos el fichero resultante del paso anterior y en el RAW Data Second el siguiente fichero RAW. Como RAW Data Output ponemos el nombre otro nombre de fichero para el resultante del merge
  8. Si has hecho mejora de mtDNA, sube el fichero a James Lick (predictor de mtDNA)
    Si has hecho mejora de yDNA, sube el fichero a Morley (predictor de yDNA).

Espero que os sea de ayuda.

Unir ficheros DNA RAW

Si nos hemos testeado en varias compañías de ADN, podemos unir los ficheros RAW para mejorar la precisión de matches y estimaciones étnicas en GEDMatch.

Esto es debido a que al unir los ficheros se producen dos escenarios muy interesantes:

  • Los SNPs (marcadores) por regla general no son 100% comunes entre dos compañías, por lo que nos puede interesar unirlos para que el fichero resultante tenga tanto los marcadores del fichero A como los del fichero B. Por ejemplo, en el caso de unir un 23andme V5 (683.000 SNPs) con un FTDNA (700.000 SNPs), obtendremos un fichero resultante de aproximadamente de 1.300.000 de SNPs.
  • Los SNPs (marcadores) que una compañia no haya podido leer (NoCalls) lo podemos rellenar con el fichero de la otra compañía.

Instrucciones

  1. Descarga mi aplicación DNA Kit Studio y descomprime en un carpeta
  2. Descomprime los ficheros RAW para obtener los ficheros TXT/CSV:
    1. FTDNA/MyHeritage: Usar el fichero 37_XXXX_Auto.csv
    2. 23andme: Usar el fichero RAW
    3. Ancestry: Usar el fichero AncestryDNA
  3. Abrir DNA Kit Studio y localizar la sección Merge RAW Files
  4. Seleccionar:
    1. Raw Data First: El primer RAW que queramos unir
    2. Raw Data Second: El otro fichero RAW que queramos unir
    3. Raw Data Output: Seleccionamos el nombre del fichero unido resultante
    4. Output Format: Seleccionamos el formato de salida. Por compatibilidad recomiendo 23andme
    5. Merge SNPs: Dejar marcado
  5. Hacer clic en Merge
  6. Esperar unos segundos y el proceso finalizará
  7. Si deseamos unir el fichero resultante con otro fichero RAW, simplemente tenemos que volver al paso 4 y el RAW Data First ponemos el fichero resultante del paso anterior y en el RAW Data Second el siguiente fichero RAW. Como RAW Data Output ponemos el nombre otro nombre de fichero para el resultante del merge
  8. El fichero resultante lo podremos subir a Gedmatch para tener una mejor estimación étnica y matching

Espero que os sea de ayuda.

23andme > Improvements

I will keep this list updated with any improvement that I thing can be useful for 23andme webpage.

  • DNA Relative CSV file should include the date when it is generated
  • Display the mtDNA and yDNA haplogroups in the DNA relative list
  • Display a filter box with the common mtDNA and yDNA haplogroups found in your relatives
  • In chromosome browser (triangulation) overlap / display the ancestral composition identified segments
  • Clicking on the mtDNA / yDNA of our relatives matches should open the mtDNA / yDNA haplogroup information (as in one’s ancestral composition report)
  • One should receive an email when he gets a new close relative
  • In the relative in common list, there should be an option multiselect several matches and open the triangulation display
  • Allow download “Relative-in-common” list to CSV
  • Display when a relative was added to the relative list
  • DNA Relative: Filter by ancestral composition