Táto sekcia vyžaduje-jemné doladenie v súlade s odporúčaniami edycyjnymi.
Potrebuje zlepšiť: nedokonalé podnecovanie en.wiki, niepolskie poznámky pod čiarou, ktoré nie sú v texte.
Podrobnejšie informácie o tom, čo potrebuje k zlepšeniu, bude prípad možno nájsť na diskusnú stránku tohto článku v jemné doladenie --
Akonáhle ste sa dostali von nedostatky v hornej časti stránky, prosíme neumožňujú modelu (()) čalúnením z kódu v tomto článku.
V bioinformatyce, upraviť poradie je tak, aby zodpovedali ich primárna štruktúra DNA, RNA, proteíny alebo na identifikáciu regiónov, ukazujúci paralelu, čo môže byť dôsledkom funkčné, štrukturálne, alebo evolučné vzťah medzi reťazcami. Usporiadaných sekvencií nukleotidov alebo aminokyselín sú spravidla prezentované v matici riadky. Zvyšok sú zapísané uprostred prestávku, pravdu v tom, že zvyšok sekvencie podobné každej inej formy ďalšieho stĺpca.
Zápas poradí, v blízkosti pomoci programu ClustalW dva ľudské bielkoviny s motívom zinok prst. (Obrázok: Zinok-finger-seq-alignment2.png)
Ak je niekoľko zhodných sekvencií majú spoločných predkov, nesúladu možno interpretovať ako bod mutácií, a praskne ako INDEL (mutácií alebo vymazaniu inserci), ktorá sa objavila v jednom alebo v dvoch riadkoch od okamihu, keď obaja poskromiony rozdelenie. V prípade zodpovedajúcich sekvencií proteínov, aminokyselín polovice objemu podobnosť sa týkali konkrétne položky, prípad bol vytvorený surová opatrenia, kde nie je stanovená konzervatívny alebo stimul. Pozbavenie spôsobilosti na nahradenie alebo účasť iba konzervatívny substitúcia (tj previesť na inú odpočinku, ale s podobnými chemickými vlastnosťami) v určitom poradí v tomto regióne svedčia o tom, že je dôležité, konštrukčne alebo funkčne. Nahrávam sekvencie pravdepodobne byť použité na uloženie sekvencie biologickej, ako je napríklad finančné údaje, alebo sekvencie nájdený v prirodzenom jazyku.
Veľmi krátke, alebo veľmi podobné sekvencie môže byť kompenzované rukou. Ale veľmi často je potrebné vhodnosť rad veľmi dlhý a variabilné sekvencie, ktorá nemôže byť zameraná len na, a to iba ľudským úsilím. Na oplátku, že kmeň, ktorý znie v operačnom algoritmov, ktoré umožnia vysoko-kvalitný zápas, alebo na zavedenie zmien, že získané vo výstupe výsledkov (najmä v prípade nukleotidových sekvencií). Všeobecne platí, že prístup k výpočtovej zodpovedajúce sekvencie môžu byť dvoch typov: globálne a lokálne zápasy zápasy. Výpočet miestnej zápas je formou globálnej optimalizácie, ktoré musia byť udržiavané v vhodnosť obsiahnuť celú úsek zo všetkých analyzovaných sekvencií. V kontraste s tým, úprava miestnych identifikáciu podobných oblastí v dlhej sekvencie, ktoré - ako celok - nie nevyhnutne uzewnętrzniać významné podobnosti. Zhodné sú uprednostňovaných obvykle miestnej, ale ich Bill môže byť ťažšie, pretože na ďalší provokácii určenie regiónov, ktoré majú ukázať ich dodržiavanie. Rôzne algorymy boli použité na sled zápasov, vrátane pomalé, ale formálne optimalizačné metódy, pri plánovaní dynamické, tiež efektívny heuristická azalka probablistyczne určené pre širokú škálu komplexné prehliadky databáz.
Obsah
/ /
Spôsoby, ako prezentovať
Zhodné sú často prezentované ako graficky, ak a formátovanie textu. V takmer všetky spôsoby, aby predložila zodpovedajúce sekvencie sú uložené v riadkoch, usporiadaných skutočne zvyšok zápasu forme vedľajšom stĺpci. Formáty textu, zodpovedajúce stĺpec obsahujúce zhodné alebo rovnomenná symboly (zvyšok) sú označené pečiatkou konserwatywności s uvedením sumy. Keď vo snímky nad kruh (ewnentualnie svislítko "I") sa používajú, aby bolo možné zistiť totožnosť oboch úsekov v danej pozícii, menej často používané symboly sú v hrubom čreve povedať konzervatívny substitúcie a pupínek na podstawień semikonserwatywnych. Bezpočet programy wizualizujących sekvencií pomocou farieb na dôstojnosť jednotlivých prvkov sekvencie. V prípade DNA a RNA uvariť k zaradeniu každého nukleotydowi inej farby. V dopasowniach sekvencia proteínov, zatiaľ čo rycinie up, farby sú často používajú na oznczenia vlastnosti aminokyselín, takže je jednoduchšie posúdiť konserwatywności o substitúciu. V prípade viacerých zodpovedajúcich sekvencií, je často posledný riadok sekvencie konsensusową; reťazec konsensusowa je tiež často prezentované graficky v podobe sekvenčného značky, v ktorých kalibr jednotlivých nukleotidov alebo aminokyselín, stanovenie listy odpovedať na stupeň jej zachovanie.
Nahrávam sekvencie môžu byť uložené v rôznych súborov v textovom formáte, ktoré na niemiara bola vyvinutá v spojení s konkrétny program, aby sa zmestili.
Zápas na globálne a lokálne
Ilustračné foto globálne a lokálne zápasov, čo ukazuje na prestávku v dopasowaniach globálnej pravdepodobné, že stojím ako sekvencie nie sú dostatočne podobné
Zápas v celosvetovom meradle, a to vrátane kompletnej profil všetky sekvencie, je veľmi užitočná, pretože zostavujú sekvencie sú podobné a podobné časti. (To neznamená, že hoci nemusia zhodovať s globálnym konci s prerušením). Všeobecné poznatky o globálnych technických zápas je známy ako vzor Needlemane-Wunsch a je založený na dynamickom programovaní. Miestne zápasu s väčšou intenzitou sú užitočné pre sekvencie, ktoré nevykazovali väčšiu podobnosť v plnom rozsahu, u ktorých existuje podozrenie, že obsahujú podobné subsekwencje azalka motywy.Algorytm Smith-Waterman je všeobecná technika pre miestne zápas, založených na dynamickom programovaní. V prípade, že ide o sled dosť podobné, výsledky zápasov globálnej i miestnej úrovni, sú rovnaké.
Zmiešané metódu, ktorá je známa ako semiglobalne pokúša odhaliť čo možno najlepšie primeranosť, vrátane prvej pravidlo a kolaps jedného alebo druhého v poradí. Môžu byť veľmi užitočné, když česť 3 'koniec jednej sekvencie na strane 5' konca na druhý sled. V tomto prípade, ani globálneho, ani miestnej vhodnosti je plne vhodné metódy pre globálny starałoby, ktoré by nútili zodpovedajúci podiel na kraji okrem oblasti prekrývajú, v ktorého priebehu sa miestne zápas nemohol plne pokryť oblasť prekrýva.
Prispôsobenie by postupnosti
Metód použije zhoda sekvencie sú k nájdeniu najlepšie zápasy miestnej alebo globálne dva analyzované sekvencie. Tieto metódy môžu byť použité na spojenie dvoch paralelných sekvencií, ale ich výpočet je veľmi dobre a vykonávajú sa často používajú, keď nie je potreba vysoká presnosť (napríklad pri vyhľadávaní v databáze sekvencie s významným homologii hľadiska našej postupnosti. Tromi hlavnými prístupu k zápasu, ktoré sekvencie dot-maticové metódy, plánovanie a dynamické metódy "k" - riadky (metódy založené na slov). Spôsoby párovanie mnohých sekvenciami môže byť použitá na spojenie a par. V žiadnom prípade žiadnu z metód má svoje slabé silné a okolí, všetky tri zápasy a postupnosť metódy majú ťažkosti pravdepodobne repetytywnymi sekvencií s nízkym mnoľstvo informácií - najmä v situáciách, keď objem opakovanie v dvoch sekvencií sú rôzne. Jedným zo spôsobov, ako vyjadriť kvantitatívne użyteczneości zápas pár sekvencie je 'maximálna jedinečný zápas', aka najdlhšiu subsekwencja, ktorá sa vyskytuje v oboch zodpovedajúcich sekvencií. Dlhšie zvyčajne vyjadrujú aj užší vzťah.
Metódy dot-matic
DNA dot plot s obsahom ľudského faktora transkrypcyjnego spôsobiť zinok prsty (GenBank ID NM_002383), naznačujúce, regionálnej samopodobieństwo. Hlavná diagonálnej úprava súčasnej sekvencii, ktorá sa sama o sebe; liniek, bez ohľadu na jeho súčasnej repetetywne možná podobné vzory v sekvencii.
-Dot matrice, ktoré poskytujú rodinné zápasy pre každý región v poradí, je jednoduchý jednoduché kvalitatívny prístup, ale výsledky rezanie vo veľkom meradle, je čas-náročné. Niektoré funkcie sekvencie - po vložení, zmazanie, opakovanie jednoduché zvrátiť azalka - sú ľahko viditeľné na grafické dot-matic vizualizácia. Constructing takúto vizualizáciu, s výnimkou našich dvoch úsekov, z dôvodu v prvom riadku a prvom stĺpci, dvoch-rozmerné matice matice. V zodpovedajúcich identické / podobné pozície vo dvoch sekvencií sa odhadujú na škvrna. Niektoré implementácia rozlišovať medzi priemerom alebo intenzitu bodky na vzťah medzi mierou podobnosti v ich pozícií, ktoré je povolené substitúcia vyššie rozlíšenie a menej konzervatívny. V prípade pozoruhodne podobné sekvencie na matrike bodky usporiadané v jednom riadku vedľa hlavného priestoru.
Takáto matica môže byť použitá pre odhad repetytywności jedinej sekvencie. V tej dobe, rovnaký reťazec je uložený v prvý riadok / stĺpec, a oblastí s významným podobnosť sa okrem hlavnej liniek budú tvoriť prehliadnuť. S takú situáciu, ktorej čelíme, je-li proteín je zložený z mnohých podobných štrukturálnych domén.
Dynamické plánovanie
Techniky dynamického programovania budú pravdepodobne použité pri zápasu globálny projekt Needlemane-Wunsch, miestne zápasov, ktoré Smith-Waterman. Spravidla platí, že zodpovedajúce proteín pomocou vnútornej nahrádzanie, vrátane spolupráce identické aminokyseliny a rôzne náhrady za zápas, a sankcie za prestávky, tj podobnosti v sekvencii aminokyselín z jedného z przwerwą v druhom. Nahrávam DNA a RNA možno kŕmiť krajine svojho detstva rokov, napriek tomu často pripísať len na náklady spojené s dopasowaniom je pozitívne, negatívne niedopasowanio, ako je uvedené vyššie, je pre pauzu.
Dynamické programovanie môže byť užitočné v blízkosti zodpovedajúcich sekvencií nukleotidov v sekvencii bielkoviny, bráni to, že akúkoľvek požiadavku, aby sa mutácie spôsobujúce zmenu čítania snímky (vkladanie alebo mazanie). Metódy framesearch vytvoriť rad globálne alebo lokálne zápasy v sekvencii - za predpokladu, sekvencie nukleotidov v prešetrovaní a hľadaný súbor bielkovín sekvencie, alebo naopak. Mimochodom, tento postup je veľmi pomalý, je to užitočné pre sekvencie obsahujúce INDEL poklad, ktorý pravdepodobne bude nesmierne ťažké sa prispôsobiť, keď ste pripravení na použitie na vyššej sadzby, efektívne metódy heuristické. V praxi sa táto metóda vyžaduje veľkú silu, alebo obliczniowej systém, ktorý systém je zameraný na dynamické plánovanie.
Poznámky pod čiarou
- ↑ Schneider TD, Stephens RM. Sekvenčné log: nový spôsob zobrazenia vysporiadania sekvencií. Nucleic Acids Res. 1990, 18, 6097-6100. . DOI: 10.1093/nar/18.20.6097. PMID 2172928.
- ↑ špinavé M, Maldá S, A Poliakov, že CB, Couronne O Dubchak I Batzoglou S. Glocal zarovnanie: hľadanie prestavaniu počas zarovnávanie. Bioinformatika. 2003, 19 Suppl 1, I54-62. . DOI: 10.1093/bioinformatics/btg1005. PMID 12855437.
- ↑ Mount DM.: Bioinformatika: sekvencie genómu a analýza 2. vyd .. Laboratória Cold Spring Harbor Press: Cold Spring Harbor, NY. 2004. ISBN 0-87969-608-7.
































