Lahendatud: kuidas teha biopythonis fasta joondust

Bioinformaatika maailmas on DNA, RNA ja valkude jรคrjestuste analรผรผsimine ja vรตrdlemine hรคdavajalik รผlesanne. Jadade joondamine on selle oluline osa ja selles artiklis kรคsitleme seda, kuidas FASTA-faile BioPythoni abil joondada. BioPython on avatud lรคhtekoodiga raamatukogu, mis pakub tรถรถriistu arvutusbioloogia ja bioinformaatika jaoks. See vรตimaldab hรตlpsalt kรคsitseda jadaandmeid ja pakub erinevat tรผรผpi jรคrjestuste joondusi. Kรคime protsessi samm-sammult lรคbi, alustades vajalike teekide importimisest, FASTA-failide lugemisest ja lรตpuks joonduste tegemisest.

Teekide importimine ja FASTA-failide lugemine

Esmalt impordime BioPythonis jรคrjestusandmetega tรถรถtamiseks vajalikud teegid. Meil lรคheb vaja SeqIO moodul FASTA failide lugemiseks ja PairwiseAligner moodul jรคrjestuste joondamiseks.

from Bio import SeqIO
from Bio.Align import PairwiseAligner

Nรผรผd, kui meil on vajalikud teegid imporditud, saame jรคtkata meie jadaandmeid sisaldavate FASTA-failide lugemisega. Selles nรคites eeldame, et teil on kaks FASTA-faili, jรคrjestus1.fasta ja jรคrjestus2.fastaja soovite need joondada.

sequence1 = SeqIO.read("sequence1.fasta", "fasta")
sequence2 = SeqIO.read("sequence2.fasta", "fasta")

รœlaltoodud kood loeb FASTA-faile ja salvestab jadad muutujates "sequence1" ja "sequence2" SeqRecord objektidena.

Jรคrjestuste joonduste sooritamine

Kui oleme oma jadad importinud, on aeg joondamine lรคbi viia. BioPythoni teek pakub erinevaid joondusalgoritme, kuid selles nรคites kasutame PairwiseAligner klass paariliseks joondamiseks.

aligner = PairwiseAligner()
alignment = aligner(sequence1.seq, sequence2.seq)

รœlaltoodud kood initsialiseerib PairwiseAligner klassi eksemplari ja joondab muutujatesse "sequence1" ja "sequence2" salvestatud jadad. Saadud joondusobjekt sisaldab joondatud jรคrjestusi ja nende joondusskoore.

Joondustulemuste visualiseerimiseks saate joondusi lรคbi vaadata ja printida vormindatud jadad koos nende skooridega.

for i, a in enumerate(alignment):
    print("Alignment", i + 1, " score:", a.score)
    print(a)

See koodilรตik itereerib lรคbi kรตik joondused objektis "joondus", printides joondusnumbri, joondusskoori ja joondatud jadad.

Mitme jรคrjestuse joondusega tรถรถtamine

Mรตnel juhul vรตite soovida joondada korraga rohkem kui kaks jรคrjestust, mida tuntakse ka mitme jรคrjestuse joondamisena (MSA). BioPython pakub moodulit nimega AlignIO mitme jรคrjestuse joondusega tรถรถtamiseks. Saate integreerida AlignIO meie eelmisesse nรคitesse, importides selle ja tehes jรคrgmised toimingud:

1. Lugege ja salvestage loendisse mitu jรคrjestust.
2. Kasutage MultipleSeqAlignment klassi MSA objekti loomiseks.
3. Viige joondus lรคbi sobiva algoritmi, nt Clustal Omega or MUSCLE.

Jรคrgmine on nรคide selle kohta, kuidas saate kasutada AlignIO moodul mitme jรคrjestuse joondamiseks:

from Bio import AlignIO
from Bio.Align.Applications import ClustalOmegaCommandline

sequence_list = [SeqIO.read("sequence1.fasta", "fasta"), SeqIO.read("sequence2.fasta", "fasta")]

clustalo_cline = ClustalOmegaCommandline(infile="my_sequences.fasta", outfile="aligned_sequences.aln", force=True)
clustalo_cline()

MSA = AlignIO.read("aligned_sequences.aln", "clustal")
print(MSA)

Jรคrgides selles artiklis kirjeldatud samme, saate jรคrjestusi BioPythoni teeki kasutades edukalt joondada. BioPythoni teek pakub paindlikke ja vรตimsaid tรถรถriistu jรคrjestusandmetega tรถรถtamiseks, alates paarilisest joondamisest kuni mitme jรคrjestuse joondamiseni, vรตimaldades laias valikus rakendusi bioinformaatikas ja arvutusbioloogias.

Seonduvad postitused:

Jรคta kommentaar