Los avances en genética humana en los últimos años han sido impulsados en gran medida por la secuenciación de próxima generación (NGS); sin embargo, el descubrimiento de mutaciones genéticas relacionadas con enfermedades se ha sesgado hacia el exoma porque las regiones grandes y muy repetitivas que caracterizan el genoma no codificante siguen siendo difíciles de alcanzar con esa tecnología. Para las ataxias espinocerebelosas autosómicas dominantes (SCA), se han identificado 28 genes, pero sólo cinco SCA se originan a partir de mutaciones no codificantes. Sin embargo, más de la mitad de las familias afectadas por SCA siguen sin un diagnóstico genético. Utilizamos análisis de ligamiento de todo el genoma, NGS y análisis de repetición para identificar una inserción (ATTTC)n en una repetición ATTTT apolimórfica en DAB1 en la región cromosómica 1p32.2 como la causa de SCA autosómica dominante; esta región ha estado previamente vinculada a SCA37. Los alelos patógenos y no patógenos tienen las configuraciones [(ATTTT)7–400] y [(ATTTT)60–79(ATTTC)31–75(ATTTT)58–90], respectivamente. Las inserciones (ATTTC)n están presentes en un haplotipo distinto y muestran una correlación inversa entre el tamaño y la edad de aparición. En la cadena orientada a DAB1, (ATTTC)n se encuentra en 50 intrones UTR de transcripciones específicas del cerebelo que surgen principalmente durante el desarrollo del cerebro fetal humano a partir del uso de promotores alternativos, pero se mantiene en el cerebelo adulto. La sobreexpresión de la inserción transfectada (ATTTC)58, pero no de (ATTTT)n, conduce a una acumulación anormal de ARN nuclear. Los embriones de pez cebra inyectados con ARN de la inserción (AUUUC)58, pero no con (AUUUU)n, mostraron malformaciones letales en el desarrollo. En conjunto, estos resultados establecen una inserción repetida inestable en DAB1 como causa de degeneración cerebelosa; Sobre la base de la evidencia genética y fenotípica, proponemos esta mutación como la base molecular de SCA37.
A Pentanucleotide ATTTC Repeat Insertion in the Non-coding Region of DAB1, Mapping to SCA37, Causes Spinocerebellar Ataxia
Advances in human genetics in recent years have largely been driven by next-generation sequencing (NGS); however, the discovery of disease-related gene mutations has been biased toward the exome because the large and very repetitive regions that characterize the non-coding genome remain difficult to reach by that technology. For autosomal-dominant spinocerebellar ataxias (SCAs), 28 genes have been identified, but only five SCAs originate from non-coding mutations. Over half of SCA-affected families, however, remain without a genetic diagnosis. We used genome-wide linkage analysis, NGS, and repeat analysis to identify an (ATTTC)n insertion in apolymorphic ATTTT repeat in DAB1 in chromosomal region 1p32.2 as the cause of autosomal-dominant SCA; this region has been previously linked to SCA37. The non-pathogenic and pathogenic alleles have the configurations [(ATTTT)7–400] and [(ATTTT)60–79(ATTTC)31–75(ATTTT)58–90], respectively. (ATTTC)n insertions are present on a distinct haplotype and show an inverse correlation between size and age of onset. In the DAB1-oriented strand, (ATTTC)n is located in 50 UTR introns of cerebellar-specific transcripts arising mostly during human fetal brain development from the usage of alternative promoters, but it is maintained in the adult cerebellum. Overexpression of the transfected (ATTTC)58 insertion, but not (ATTTT)n, leads to abnormal nuclear RNA accumulation. Zebrafish embryos injected with RNA of the (AUUUC)58 insertion, but not (AUUUU)n, showed lethal developmental malformations. Together, these results establish an unstable repeat insertion in DAB1 as a cause of cerebellar degeneration; on the basis of the genetic and phenotypic evidence, we propose this mutation as the molecular basis for SCA37.