Bioinformaatika maailmas on DNA, RNA ja valkude jรคrjestuste analรผรผsimine ja vรตrdlemine hรคdavajalik รผlesanne. Jadade joondamine on selle oluline osa ja selles artiklis kรคsitleme seda, kuidas FASTA-faile BioPythoni abil joondada. BioPython on avatud lรคhtekoodiga raamatukogu, mis pakub tรถรถriistu arvutusbioloogia ja bioinformaatika jaoks. See vรตimaldab hรตlpsalt kรคsitseda jadaandmeid ja pakub erinevat tรผรผpi jรคrjestuste joondusi. Kรคime protsessi samm-sammult lรคbi, alustades vajalike teekide importimisest, FASTA-failide lugemisest ja lรตpuks joonduste tegemisest.
Teekide importimine ja FASTA-failide lugemine
Esmalt impordime BioPythonis jรคrjestusandmetega tรถรถtamiseks vajalikud teegid. Meil lรคheb vaja SeqIO moodul FASTA failide lugemiseks ja PairwiseAligner moodul jรคrjestuste joondamiseks.
from Bio import SeqIO from Bio.Align import PairwiseAligner
Nรผรผd, kui meil on vajalikud teegid imporditud, saame jรคtkata meie jadaandmeid sisaldavate FASTA-failide lugemisega. Selles nรคites eeldame, et teil on kaks FASTA-faili, jรคrjestus1.fasta ja jรคrjestus2.fastaja soovite need joondada.
sequence1 = SeqIO.read("sequence1.fasta", "fasta") sequence2 = SeqIO.read("sequence2.fasta", "fasta")
รlaltoodud kood loeb FASTA-faile ja salvestab jadad muutujates "sequence1" ja "sequence2" SeqRecord objektidena.
Jรคrjestuste joonduste sooritamine
Kui oleme oma jadad importinud, on aeg joondamine lรคbi viia. BioPythoni teek pakub erinevaid joondusalgoritme, kuid selles nรคites kasutame PairwiseAligner klass paariliseks joondamiseks.
aligner = PairwiseAligner() alignment = aligner(sequence1.seq, sequence2.seq)
รlaltoodud kood initsialiseerib PairwiseAligner klassi eksemplari ja joondab muutujatesse "sequence1" ja "sequence2" salvestatud jadad. Saadud joondusobjekt sisaldab joondatud jรคrjestusi ja nende joondusskoore.
Joondustulemuste visualiseerimiseks saate joondusi lรคbi vaadata ja printida vormindatud jadad koos nende skooridega.
for i, a in enumerate(alignment): print("Alignment", i + 1, " score:", a.score) print(a)
See koodilรตik itereerib lรคbi kรตik joondused objektis "joondus", printides joondusnumbri, joondusskoori ja joondatud jadad.
Mitme jรคrjestuse joondusega tรถรถtamine
Mรตnel juhul vรตite soovida joondada korraga rohkem kui kaks jรคrjestust, mida tuntakse ka mitme jรคrjestuse joondamisena (MSA). BioPython pakub moodulit nimega AlignIO mitme jรคrjestuse joondusega tรถรถtamiseks. Saate integreerida AlignIO meie eelmisesse nรคitesse, importides selle ja tehes jรคrgmised toimingud:
1. Lugege ja salvestage loendisse mitu jรคrjestust.
2. Kasutage MultipleSeqAlignment klassi MSA objekti loomiseks.
3. Viige joondus lรคbi sobiva algoritmi, nt Clustal Omega or MUSCLE.
Jรคrgmine on nรคide selle kohta, kuidas saate kasutada AlignIO moodul mitme jรคrjestuse joondamiseks:
from Bio import AlignIO from Bio.Align.Applications import ClustalOmegaCommandline sequence_list = [SeqIO.read("sequence1.fasta", "fasta"), SeqIO.read("sequence2.fasta", "fasta")] clustalo_cline = ClustalOmegaCommandline(infile="my_sequences.fasta", outfile="aligned_sequences.aln", force=True) clustalo_cline() MSA = AlignIO.read("aligned_sequences.aln", "clustal") print(MSA)
Jรคrgides selles artiklis kirjeldatud samme, saate jรคrjestusi BioPythoni teeki kasutades edukalt joondada. BioPythoni teek pakub paindlikke ja vรตimsaid tรถรถriistu jรคrjestusandmetega tรถรถtamiseks, alates paarilisest joondamisest kuni mitme jรคrjestuse joondamiseni, vรตimaldades laias valikus rakendusi bioinformaatikas ja arvutusbioloogias.