Prozess der Genvorhersage und Zählung

Prozess der Genvorhersage und Zählung!

Annonation ist ein Prozess, der Gene, ihre regulatorischen Sequenzen und mögliche Funktionen identifiziert. Annonation bezeichnet die Nicht-Protein-Codierungsgene, Codierungsgene für r-RNA, t-RNA und Kern-RNAs, mobile genetische Elemente und sich im Genom befindende repetitive Sequenzfamilien.

Die Annonationsaufgabe beginnt erst, nachdem die Genomsequenz erhalten wurde. Die Genvorhersage ist ein wichtiges Problem für die Computerbiologie, und es gibt verschiedene Logarithmen, die zur Genvorhersage verwendet werden können, wobei identifizierte Gene als Trainingsdatensatz verwendet werden.

Das Zählen von Genen wird schwierig, obwohl die Position der Gene in einem Genom bekannt ist. Das Vorhandensein überlappender Gene und Spleißvarianten erschwert die Aufgabe. Es wird schwierig vorherzusagen, welche Teile der DNA als gleiche oder viele verschiedene Gene betrachtet werden sollten.

6.70. Eine SNP-Karte

Viele Gene in Eukaryoten tragen ein Muster von Exons (kodierende Regionen), gefolgt von Introns (nicht kodierende Regionen). Daher sind Gene nicht als kontinuierliche ORFs (offene Leserahmen) organisiert. Ein ORF hat eine Reihe von Codons, die eine Aminosäuresequenz spezifizieren.

Zweite Gene in Eukaryoten sind normalerweise weit voneinander entfernt, so dass sie mehr Chancen haben, falsche Gene zu finden. Neue Techniken der ORF-Scansoftware für eukaryotische Gene machen das Scannen jedoch effizienter. Jetzt können wir die Gene eines Organismus (mit einigen experimentellen Fehlern) zählen.

Es wird gesagt, dass 99, 8% von 3, 2 Milliarden Basenpaaren zwischen zwei Menschen gleich sind und nur 0, 2% unterschiedlich sind. Für jeweils 500 Nukleotide unterscheidet sich nur ein Nukleotid zwischen zwei Individuen. Dies bedeutet, dass Abweichungen an einigen Stellen der DNA-Sequenz zu schweren Erkrankungen und unterschiedlichen Charakteren beim Menschen führen können.

Genomähnlichkeit, SNPs und vergleichende Genomik:

Wie bereits gesagt, sind 99, 8% eines jeden menschlichen Genoms jedem anderen menschlichen Genom ähnlich und 0, 2% unterschiedlich. Dies bedeutet, dass sich zwei Personen nur an 6 Millionen Standorten von 3, 2 Milliarden Standorten unterscheiden.

Wenn diese Orte wenig Wirkung haben, sind zwei Menschen identisch. Menschen sind mehr als 98% ähnlich wie Schimpansen. Daher führt der Unterschied an wenigen Stellen in der DNA dazu, dass das Individuum einzigartig ist. Für jeweils 500-1000 Nukleotide unterscheidet sich ein Nukleotid zwischen zwei Individuen.

Wichtige Variationen in einzelnen Genomen sind Einzelnukleotidpolymorphismen oder SNPs, die sowohl in kodierenden als auch in nicht kodierenden Regionen des Genoms beobachtet wurden. SNPs sind im Wesentlichen Änderungen in einer einzelnen Base, dh A, C, G oder T, was zu DNA-Variationen führt, die dazu führen, dass an solchen Positionen verschiedene Buchstaben vorhanden sind. Die Art des Nukleotids oder der Base, die sich an einem bestimmten Ort auf einem Chromosom befindet, kann bei verschiedenen Personen variieren.

Es wird gesagt, dass - 90% der Sequenzabweichung beim Menschen auf das Vorhandensein von SNPs zurückzuführen ist. Somit liefern SNPs einen molekularen Marker, der in hoher Dichte vorliegt.

Beim DNA-Fingerprint in besonders nicht kodierenden Teilen des Genoms werden solche genetischen Variationen zwischen verschiedenen Menschen ausgenutzt.

Solche genetischen Variationen sind auch für die Schwere der Erkrankung und die Reaktion des Körpers auf die Behandlung verantwortlich. Ein einzelner Basendifferenz im Apo-E-Gen führt zur Alzheimer-Krankheit und eine Deletion innerhalb des CCRS (Chemokinrezeptor-Gens) ist für die Resistenz von HW und AIDS verantwortlich.

SNPs werden verwendet, um Gene zu kartieren, die an menschlichen Krankheiten beteiligt sind. Durch die Verwendung von SNPs als Marker kann jedes Gen im menschlichen Genom abgebildet werden. SNPs befinden sich entweder innerhalb des Gens oder können eine enge Verknüpfung aufweisen.

Sequenzdaten werden in Datenbanken gespeichert und werden analysiert, um die SNPs zu kennen. DNA-Chips und Microarrays wurden zur Identifikation von SNPs entwickelt. Ärzte können mithilfe von DNA-Proben von Patienten das Muster des SNP-Genotyp-Profils identifizieren. So können sie die Reaktion der Patienten auf bestimmte Arten von Medikamenten angeben.

Der Zweig der Medizin, der die Auswirkungen der genetischen Variation auf die Anfälligkeit der Krankheit und die Reaktion der Medizin untersucht, wird als Pharmakogenomik bezeichnet.

Da sich wenige SNPs in verschiedenen Populationen in ihrer Häufigkeit unterscheiden, kann die SNP-Analyse zur Untersuchung der Populationsgenetik verwendet werden.

Es ist interessant festzustellen, dass die Genome von Maus und Mensch sich sehr ähneln (etwa 97, 5%). Das Genom von Schimpansen und Menschen unterscheidet sich nur im Verhältnis von 1 - 3%. Daraus lässt sich der Schluss ziehen, dass der gemeinsame Vorfahr vor 100 Millionen Jahren geteilt wurde und dass sich im Genom nicht viel verändert hat.

Aus diesen kleinen genetischen Unterschieden ergibt sich die menschliche Vielfalt wie Unterschiede in der Sehkraft, der Haarfarbe, der Fußgröße usw. Einige der SNPs hängen mit bestimmten menschlichen Bevölkerungen zusammen und geben Aufschluss über die vor einigen Jahren stattgefundenen Migrationen von Menschen sowie über die weiter entfernte evolutionäre Vergangenheit .