Skip navigation
Universidade Federal da Bahia |
Repositório Institucional da UFBA
Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/41781
Registro completo de metadados
Campo DCValorIdioma
dc.creatorHermisdorff, Ísis da Costa-
dc.date.accessioned2025-04-13T21:01:31Z-
dc.date.available2025-04-13T21:01:31Z-
dc.date.issued2020-07-30-
dc.identifier.urihttps://repositorio.ufba.br/handle/ri/41781-
dc.description.abstractImputation accuracy among other things depends on the size of the reference panel, the marker's minor allele frequency (MAF), and the correct placement of variants on the reference genome assembly. Using high-density genotypes of 3938 Nellore cattle from Brazil, we investigated the accuracy of imputation from 50K to 777K SNP density, using map positions determined according to the bovine genome assemblies UMD3.1 and ARS-UCD1.2. We assessed the effect of reference and target panel sizes on the prephasing-based imputation quality using ten-fold cross-validation. Further, we compared the reliability of the model-based imputation quality score (Rsq) from Minimac3 to empirical imputation accuracy. The overall accuracy of imputation measured as the squared correlation between true and imputed allele dosages (R2dose) was virtually identical using either the UMD3.1 or ARS-UCD1.2 genome assembly. When the size of the reference panel increased from 250 to 2000, R2dose increased from 0.845 to 0.917, and the number of polymorphic markers in the imputed data set increased from 586,701 to 618,660. Advantages in both accuracy and marker density were also observed when larger target panels were imputed, likely resulting from more accurate haplotype inference. Imputation accuracy and the marker density in the imputed data increased from 0.903 to 0.913 and from 593,239 to 595,570 when haplotypes were inferred in 500 and 2900 target animals, respectively. The model-based imputation quality scores from Minimac3 (Rsq) were highly correlated to but systematically higher than empirically 23 estimated accuracies. The correlation between these metrics increased with the size of the reference panel and MAF of imputed variants. Accurate imputation of BovineHD BeadChip markers is possible in Nellore cattle using the new bovine reference genome assembly ARS-UCD1.2. The use of large reference and target panels improves the accuracy of the imputed genotypes and provides genotypes for more markers segregating at low frequency for downstream genomic analyses. The model-based imputation quality score from Minimac3 (Rsq) can be used to detect poorly imputed variants but its reliability depends on the size of the reference panel used and MAF of the imputed variants.pt_BR
dc.languageporpt_BR
dc.publisherUNIVERSIDADE FEDERAL DA BAHIApt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectARS-UCD1.2pt_BR
dc.subjectFaseamento de haplótipospt_BR
dc.subjectBos taurus indicuspt_BR
dc.subjectGenoma bovino de referênciapt_BR
dc.subjectVariantes raras e de baixa frequênciapt_BR
dc.subjectBovine genomept_BR
dc.subjectHaplotypept_BR
dc.subjectSex chromosomespt_BR
dc.subjectRare Coding Variantept_BR
dc.subjectPreconcitypt_BR
dc.subject.otherARS-UCD1.2pt_BR
dc.subject.otherHaplotype phasingpt_BR
dc.subject.otherBos taurus indicuspt_BR
dc.subject.otherPre-phasing-basedpt_BR
dc.subject.otherBovine genome assemblypt_BR
dc.subject.otherRare and low-frequency variantspt_BR
dc.titleAnálise de imputação e efeito do cromossomo x na característica reprodutiva em bovinos da Nelorept_BR
dc.typeTesept_BR
dc.publisher.programPrograma de Pós-Graduação em Zootecnia (PPGZOO)pt_BR
dc.publisher.initialsUFBApt_BR
dc.publisher.countryBrasilpt_BR
dc.subject.cnpqCNPQ::CIENCIAS AGRARIASpt_BR
dc.contributor.advisor1Costa, Raphael Bermal-
dc.contributor.referee1Costa, Raphael Bermal-
dc.contributor.referee2Bocchi, Adriana Luize-
dc.contributor.referee3Magalhães, Ana Fabrícia Braga-
dc.contributor.referee4Silva, Fabiane de Lima-
dc.contributor.referee5Feitosa, Fabieli Loise Braga-
dc.creator.Latteshttp://lattes.cnpq.br/7534459132790074pt_BR
dc.description.resumoA precisão da imputação, entre outras coisas, depende do tamanho do painel de referência, da frequência alélica (MAF) do marcador e do posicionamento correto das variantes no conjunto do genoma de referência. Usando genótipos de alta densidade de 3938 bovinos Nelore do Brasil, investigamos a precisão da imputação da densidade SNPs de 50K a 777K, usando as posições determinadas de acordo com os conjuntos de genoma bovino UMD3.1 e ARS-UCD1.2. Avaliamos o efeito dos tamanhos dos painéis de referência e alvo na qualidade da imputação baseada em pré-faseamento usando a validação cruzada de dez vezes. Além disso, avaliamos a confiabilidade do Índice de qualidade de imputação (Rsq) do Minimac3, o comparando com diferentes medidas de precisão empírica da imputação. A precisão geral da imputação medida como a correlação quadrática entre as doses dos alelos verdadeiros e imputados (R2dose) foi praticamente idêntica usando o conjunto do genoma UMD3.1 ou ARS-UCD1.2. Quando o tamanho do painel de referência aumentou de 250 para 2000, a R2dose aumentou de 0,845 para 0,917 e o número de marcadores polimórficos no conjunto de dados imputados aumentou de 586.701 para 618.660. Também foram observadas vantagens tanto na precisão quanto na densidade do marcador quando foram imputados painéis-alvo maiores, provavelmente resultantes da inferência dos haplótipos mais precisa. A precisão da imputação e a densidade do marcador nos dados imputados aumentaram de 0,903 para 0,913 e de 593,239 para 595,570 quando haplótipos foram Research article submitted to the BMC genomics 121 inferidos em 500 e 2900 animais-alvo, respectivamente. Os escores de qualidade de imputação baseados no modelo do Minimac3 (Rsq) foram altamente correlacionados, mas sistematicamente mais altos do que as precisões empiricamente estimadas. A correlação entre as medidas aumentou com o tamanho do painel de referência e do MAF das variantes imputadas. É possível uma imputação precisa dos marcadores BovineHD BeadChip em bovinos Nelore usando o novo conjunto de genoma de referência bovino ARS-UCD1.2. O uso de grandes painéis de referência e alvo melhora a precisão dos genótipos imputados e fornece genótipos para mais marcadores segregando em baixa frequência para análises genômicas a jusante. O escore de qualidade de imputação baseada no modelo do Minimac3 (Rsq) pode ser usada para detectar variantes mal imputadas, mas sua confiabilidade depende do tamanho do painel de referência usado e do MAF das variantes imputadas.pt_BR
dc.publisher.departmentEscola de Medicina Veterinária e Zootecniapt_BR
dc.type.degreeDoutoradopt_BR
Aparece nas coleções:Tese (PPGZOO)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Isis da Costa Hermisdorff.pdf1,66 MBAdobe PDFVisualizar/Abrir
Mostrar registro simples do item Visualizar estatísticas


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.