BIOINFORMATIKA PROTEIN
1. Pengertian bioinformatika
Bioinformatika berasal dari kata bioinformatics (inggris)
yakni ilmu yang mempelajari penerapan teknik komputasional untuk mengelola dan menganalisis informasi biologis. Bionformatika
sendiri merupakan ilmu yang lahiir dari perkembangan biologi molecular modern
yang merupakan salah satu bentuk peningkatan pemahaman manusia dalam bidang
genomic yang terdapat dalam molekul DNA. Bidang bioinformatika mencakup
penerapan metode-metode matematika, statistika, dan informatika untuk
memecahkan masalah biologis, penyejajaran sekuens, prediksi struktur protein,
analisis filogenetik, analisis ekspresi gen, sampai struktur sekunder RNA.
2. Sejarah perkembangan bioinformatika
Istilah bioinformatics mulai dikemukakan pada
pertengahan era 1980-an untuk mengacu pada penerapan komputer dalam biologi. Namun demikian, penerapan bidang-bidang
dalam bioinformatika (seperti pembuatan basis data dan pengembangan algoritma untuk analisis sekuens biologis) sudah
dilakukan sejak tahun 1960-an.
Kemajuan teknik biologi molekular dalam mengungkap sekuens biologis dari
protein (sejak awal 1950- an) dan asam nukleat (sejak 1960-an)
mengawali perkembangan basis data dan teknik analisis sekuens biologis. Basis
data sekuens protein mulai dikembangkan pada tahun 1960-an di Amerika Serikat, sementara basis data sekuens DNA
dikembangkan pada akhir 1970-an di Amerika Serikat dan Jerman (pada European
Molecular Biology Laboratory, Laboratorium Biologi Molekular Eropa). Penemuan teknik sekuensing DNA yang lebih cepat pada pertengahan 1970-an
menjadi landasan terjadinya ledakan jumlah sekuens DNA yang berhasil
diungkapkan pada 1980-an dan 1990-an, menjadi salah satu pembuka
jalan bagi proyek – proyek pengungkapan genom, meningkatkan kebutuhan akan pengelolaan dan
analisis sekuens, dan pada akhirnya menyebabkan lahirnya bioinformatika. 3.
3. Bidang-bidang terkait
bioinformatika
- Biophysics
Biologi molekul sendiri merupakan pengembangan yang
lahir dari biophysics. Biophysics adalah sebuah bidang yang mengaplikasikan
teknik- teknik dari ilmu Fisika untuk memahami struktur dan fungsi biologi (British
Biophysical Society ). Sesuai dengan definisi tersebut, bidang ini
merupakan suatu bidang yang luas. Namun secara langsung disiplin ilmu ini
terkait dengan Bioinformatika karena penggunaan teknik-teknik dari ilmu Fisika
untuk memahami struktur.
- Computational Biology
Computational biology merupakan bagian dari
Bioinformatika (dalam arti yang paling luas) yang paling dekat dengan bidang
Biologi umum klasik. Fokus dari computational biology adalah gerak evolusi,
populasi, dan biologi teoritis daripada biomedis dalam molekul dan sel. Tak
dapat dielakkan
bahwa Biologi Molekul cukup penting dalam computational biology, namun itu bukanlah inti dari disiplin ilmu ini. Pada penerapan
computational biology, model-model statistika
untuk fenomena biologi lebih disukai dipakai dibandingkan dengan model
sebenarnya. Dalam beberapa hal cara
tersebut cukup baik mengingat pada kasus tertentu eksperimen langsung pada fenomena biologi cukup sulit. Tidak
semua dari computational biology merupakan
Bioinformatika, seperti contohnya Model Matematika bukan merupakan Bioinformatika, bahkan meskipun dikaitkan dengan
masalah biologi.
- Medical Informatics
Medical
informatics lebih memperhatikan struktur dan algoritma untuk pengolahan data
medis, dibandingkan dengan data itu sendiri. Disiplin ilmu ini, untuk alasan
praktis, kemungkinan besar berkaitan dengan data-data yang didapatkan pada
level biologi yang lebih “rumit” – yaitu informasi dari sistem-sistem
superselular, tepat pada level populasi di mana sebagian besar dari
Bioinformatika lebih memperhatikan informasi dari sistem dan struktur
biomolekul dan selular.
- Cheminformatics
Cheminformatics
adalah kombinasi dari sintesis kimia, penyaringan biologis, dan pendekatan
data-mining yang digunakan untuk penemuan dan pengembangan obat (Cambridge
Healthech
Institute’s Sixth Annual Cheminformatics conference).
Pengertian disiplin ilmu yang disebutkan di atas lebih merupakan identifikasi
dari salah satu aktivitas yang paling populer dibandingkan dengan berbagai
bidang studi yang mungkin ada di bawah bidang ini.
Salah satu
contoh penemuan obat yang paling sukses sepanjang sejarah adalah penisilin,
dapat menggambarkan cara untuk menemukan dan mengembangkan obat-obatan hingga
sekarang meskipun terlihat aneh. Cara untuk menemukan dan mengembangkan obat
adalah hasil dari kesempatan, observasi, dan banyak proses kimia yang intensif
dan lambat. Sampai beberapa waktu yang lalu, desain obat dianggap harus selalu
menggunakan kerja yang intensif, proses uji dan gagal (trial-error process).
Ruang
lingkup pembelajaran dari cheminformatics ini sangat luas. Contoh bidang
minatnya antara lain: Synthesis Planning, Reaction and Structure Retrieval, 3-D
Structure Retrieval, Modelling, Computational Chemistry, Visualisation Tools
and Utilities.
- Genomics
Genomics
adalah bidang ilmu yang ada sebelum selesainya sekuen genom, kecuali dalam
bentuk yang paling kasar. Genomics
adalah setiap usaha untuk menganalisa atau membandingkan seluruh komplemen genetik dari satu spesies atau
lebih. Secara logis tentu saja mungkin untuk membandingkan genom-genom dengan membandingkan kurang lebih suatu
himpunan bagian dari gen di dalam genom.
- Proteomics
Istilah
proteomics pertama kali digunakan untuk menggambarkan himpunan dari
protein-protein yang tersusun (encoded ) oleh genom. Ilmu yang mempelajari
proteome, yang disebut proteomics, pada saat ini tidak hanya memperhatikan
semua protein di dalam sel yang diberikan, tetapi juga himpunan dari semua
bentuk isoform dan modifikasi dari semua protein, interaksi diantaranya,
deskripsi struktural dari protein-protein dan kompleks-kompleks orde tingkat
tinggi dari protein.
Mengkarakterisasi
sebanyak puluhan ribu protein-protein yang dinyatakan dalam sebuah tipe sel
yang diberikan pada waktu tertentu – apakah untuk mengukur berat molekul
atau nilai-nilai isoelektrik protein-protein tersebut - melibatkan tempat
penyimpanan dan perbandingan dari data yang memiliki jumlah yang sangat besar,
tak terhindarkan lagi akan memerlukan Bioinformatika.
- Pharmacogenomics
Pharmacogenomics
adalah aplikasi dari pendekatan genomik dan teknologi pada identifikasi dari
target-target obat. Contohnya meliputi menjaring semua genom untuk penerima
yang potensial dengan menggunakan cara Bioinformatika, atau dengan menyelidiki
bentuk pola dari ekspresi gen di dalam baik patogen maupun induk selama
terjadinya infeksi, atau maupun dengan memeriksa karakteristik pola-pola
ekspresi yang ditemukan dalam tumor atau contoh dari pasien untuk kepentingan
diagnosa (kemungkinan untuk mengejar target potensial terapi kanker).
- Pharmacogenetics
Tiap
individu mempunyai respon yang berbeda-beda terhadap berbagai pengaruh obat;
sebagian ada yang positif, sebagian ada yang sedikit perubahan yang tampak pada
kondisi mereka dan ada juga yang mendapatkan efek samping atau reaksi alergi.
Sebagian dari reaksi-reaksi ini diketahui mempunyai dasar genetik.
Pharmacogenetics adalah bagian dari pharmacogenomics yang menggunakan metode
genomik/Bioinformatika untuk mengidentifikasi hubungan-hubungan genomik,
contohnya SNP (Single Nucleotide Polymorphisms), karakteristik dari profil
respons pasien tertentu dan menggunakan informasi-informasi tersebut untuk
memberitahu administrasi dan pengembangan terapi pengobatan.
4. Penerapan utama bioinformatika
- Basis data sekuens biologis
Sesuai dengan jenis informasi biologis yang
disimpannya, basis data sekuens biologis dapat berupa basis data
primer untuk menyimpan sekuens primer asam nukleat maupun protein, basis
data sekunder untuk menyimpan motif sekuens protein,
dan basis data struktur untuk menyimpan data struktur protein maupun asam
nukleat.
Basis data utama untuk sekuens asam nukleat saat ini
adalah GenBank (Amerika Serikat), EMBL (Eropa),
dan DDBJ(Inggris)
(DNA Data Bank of Japan, Jepang). Ketiga basis data tersebut
bekerja sama dan bertukar data secara harian untuk menjaga keluasan cakupan
masing-masing basis data. Sumber utama data sekuens asam nukleat adalah submisi
langsung dari periset individual, proyek sekuensing genom, dan pendaftaran paten. Selain berisi sekuens asam nukleat, entri
dalam basis data sekuens asam nukleat umumnya mengandung informasi tentang
jenis asam nukleat (DNA atau RNA), nama organisme sumber asam nukleat tersebut, dan pustaka yang
berkaitan dengan sekuens asam nukleat tersebut.
Sementara
itu, contoh beberapa basis data penting yang menyimpan sekuens primer protein adalah PIR (Protein
Information Resource, Amerika Serikat), Swiss-Prot (Eropa), dan TrEMBL (Eropa). Ketiga basis data tersebut telah digabungkan
dalam UniProt (yang didanai terutama oleh Amerika Serikat). Entri dalam UniProt
mengandung informasi tentang sekuens protein,
nama organisme sumber protein, pustaka yang berkaitan, dan komentar yang umumnya berisi penjelasan mengenai fungsi protein
tersebut.
BLAST (Basic Local Alignment
Search Tool) merupakan perkakas bioinformatika yang berkaitan erat dengan penggunaan basis data sekuens biologis.
Penelusuran BLAST (BLAST search) pada basis
data sekuens memungkinkan ilmuwan untuk mencari sekuens asam nukleat maupun protein yang mirip dengan sekuens tertentu yang
dimilikinya. Hal ini berguna misalnya untuk menemukan gen sejenis pada
beberapa organisme atau untuk
memeriksa keabsahan hasil sekuensing maupun untuk
memeriksa fungsi gen hasil sekuensing. Algoritma yang
mendasari kerja BLAST adalah penyejajaran
sekuens.
PDB
(Protein Data Bank, Bank Data Protein) adalah basis data tunggal yang menyimpan
model struktural tiga dimensi protein dan asam nukleat hasil
penentuan eksperimental (dengan kristalografi sinar-X, spektroskopi NMR dan mikroskopi elektron). PDB menyimpan data struktur
sebagai koordinat tiga dimensi yang menggambarkan posisi atom-atom dalam protein ataupun asam
nukleat.
- Penyejajaran sekuens
Penyejajaran sekuens (sequence alignment) adalah
proses penyusunan/pengaturan dua atau lebih sekuens sehingga persamaan
sekuens-sekuens tersebut tampak nyata. Hasil dari proses tersebut juga disebut
sebagai sequence alignment atau alignment saja. Baris sekuens dalam
suatu alignment diberi sisipan (umumnya dengan tanda " –")
sedemikian rupa sehingga kolom-kolomnya memuat karakter yang identik atau sama
di antara sekuens-sekuens tersebut. Berikut adalah contoh alignment DNA dari
dua sekuens pendek DNA yang berbeda, "ccatcaac" dan
"caatgggcaac" (tanda "|" menunjukkan kecocokan atau match
di antara kedua sekuens).
Sequence alignment merupakan metode dasar dalam
analisis sekuens. Metode ini digunakan untuk mempelajari evolusi sekuens-sekuens dari leluhur yang sama (common
ancestor). Ketidakcocokan (mismatch) dalam alignment diasosiasikan dengan
proses mutasi, sedangkan kesenjangan (gap, tanda
"
–") diasosiasikan dengan proses insersi atau
delesi. Sequence alignment memberikan hipotesis atas proses evolusi yang terjadi dalam sekuens-sekuens tersebut.
Misalnya, kedua sekuens dalam contoh alignment di atas bisa jadi berevolusi
dari sekuens yang sama "ccatgggcaac". Dalam kaitannya dengan hal ini,
alignment juga dapat menunjukkan posisi-posisi yang dipertahankan (conserved)
selama evolusi dalam sekuens-sekuens protein, yang menunjukkan bahwa posisi-posisi
tersebut bisa jadi penting bagi struktur atau fungsi protein tersebut.
Selain itu, sequence alignment juga digunakan untuk
mencari sekuens yang mirip atau sama dalam basis data sekuens. BLAST adalah salah satu metode
alignment yang sering digunakan dalam penelusuran basis data sekuens. BLAST
menggunakan algoritma heuristik dalam penyusunan
alignment.
Beberapa metode alignment lain yang merupakan
pendahulu BLAST adalah metode "Needleman-Wunsch" dan
"Smith-Waterman". Metode Needleman-Wunsch digunakan untuk menyusun
alignment global di antara dua atau lebih sekuens, yaitu alignment atas
keseluruhan panjang sekuens tersebut. Metode Smith-Waterman menghasilkan
alignment lokal, yaitu alignment atas bagian-bagian dalam sekuens. Kedua metode
tersebut menerapkan pemrograman dinamik (dynamic
programming) dan hanya efektif untuk alignment dua sekuens (pairwise alignment).
Clustal adalah
program bioinformatika untuk alignment multipel (multiple alignment), yaitu
alignment beberapa sekuens sekaligus. Dua varian utama Clustal adalah ClustalW dan ClustalX.
Metode
lain yang dapat diterapkan untuk alignment sekuens adalah metode yang
berhubungan dengan Hidden Markov Model
("Model Markov Tersembunyi", HMM). HMM merupakan model statistika yang mulanya digunakan dalam ilmu komputer untuk mengenali pembicaraan manusia (speech recognition). Selain digunakan untuk
alignment, HMM juga digunakan dalam metode-metode analisis sekuens lainnya, seperti prediksi daerah pengkode protein
dalam genom dan prediksi struktur sekunder protein.
- Prediksi struktur protein
Secara
kimia/fisika, bentuk struktur protein diungkap dengan kristalografi sinar-
X ataupun spektroskopi NMR, namun
kedua metode tersebut sangat memakan waktu dan relatif mahal. Sementara itu, metode sekuensing protein relatif lebih mudah mengungkapkan sekuens asam amino protein.
Prediksi struktur protein berusaha meramalkan struktur tiga dimensi protein berdasarkan sekuens asam aminonya (dengan
kata lain, meramalkan struktur tersier
dan struktur sekunder berdasarkan struktur primer protein). Secara umum, metode prediksi struktur protein yang ada saat
ini dapat dikategorikan ke dalam dua kelompok,
yaitu metode pemodelan protein komparatif dan metode pemodelan de novo.
Pemodelan
protein komparatif (comparative protein modelling) meramalkan struktur suatu protein berdasarkan struktur protein lain yang sudah
diketahui. Salah satu penerapan metode ini
adalah pemodelan homologi (homology modelling), yaitu prediksi struktur tersier
protein berdasarkan kesamaan struktur
primer protein. Pemodelan homologi didasarkan pada teori
bahwa dua protein yang homolog memiliki struktur yang sangat mirip satu sama lain. Pada metode ini, struktur suatu protein (disebut
protein target) ditentukan berdasarkan struktur protein lain (protein templat) yang sudah diketahui dan memiliki
kemiripan sekuens dengan protein target
tersebut. Selain itu, penerapan lain pemodelan komparatif adalah protein threading yang didasarkan pada kemiripan struktur
tanpa kemiripan sekuens primer. Latar belakang
protein threading adalah bahwa struktur protein lebih dikonservasi daripada
sekuens protein selama evolusi;
daerah-daerah yang penting bagi fungsi protein dipertahankan strukturnya. Pada pendekatan ini, struktur yang
paling kompatibel untuk suatu sekuens asam amino dipilih dari semua jenis struktur tiga dimensi protein yang ada.
Metode-metode yang tergolong dalam
protein threading berusaha menentukan tingkat kompatibilitas tersebut.
Dalam pendekatan de
novo atau ab initio, struktur protein ditentukan dari sekuens
primernya tanpa membandingkan dengan struktur protein lain. Terdapat banyak
kemungkinan dalam pendekatan ini, misalnya dengan menirukan proses pelipatan
(folding) protein dari sekuens primernya menjadi struktur tersiernya (misalnya
dengan simulasi dinamika molekular), atau dengan
optimisasi global fungsi energi protein. Prosedur-prosedur ini cenderung
membutuhkan proses komputasi yang intens, sehingga saat ini hanya digunakan
dalam menentukan struktur protein-protein kecil. Beberapa usaha telah dilakukan
untuk mengatasi kekurangan sumber daya komputasi tersebut, misalnya dengan superkomputer (misalnya superkomputer Blue Gene [1] dari IBM) atau komputasi terdistribusi (distributed computing, misalnya
proyek Folding@home) maupun komputasi grid.
- Analisis ekspresi gen
Ekspresi gen dapat ditentukan dengan
mengukur kadar mRNA dengan berbagai macam teknik (misalnya dengan microarray ataupun Serial Analysis of Gene Expression ["Analisis Serial Ekspresi
Gen", SAGE]). Teknik-teknik tersebut umumnya diterapkan pada analisis
ekspresi gen skala besar yang mengukur ekspresi banyak gen (bahkan genom) dan menghasilkan data skala besar.
Metode-metode penggalian data (data mining) diterapkan pada data tersebut untuk
memperoleh pola-pola informatif. Sebagai
contoh, metode-metode komparasi digunakan untuk membandingkan ekspresi di antara gen-gen, sementara metode-metode
klastering (clustering) digunakan untuk
mempartisi data tersebut berdasarkan kesamaan ekspresi gen.
5. Penerapan pada bidang lainnya
- Bioinformatika dalam bidang klinis
Perananan
Bioinformatika dalam bidang klinis ini sering juga disebut sebagai informatika
klinis (clinical informatics). Aplikasi dari clinical informatics ini adalah
berbentuk manajemen data-data klinis dari pasien melalui Electrical Medical
Record (EMR) yang dikembangkan oleh Clement J. McDonald dari Indiana University
School of Medicine pada tahun 1972.
McDonald
pertama kali mengaplikasikan EMR pada 33 orang pasien penyakit gula (diabetes).
Sekarang EMR ini telah diaplikasikan pada berbagai penyakit. Data yang disimpan
meliputi data analisa diagnosa laboratorium, hasil konsultasi dan saran, foto
ronsen, ukuran detak jantung, dll. Dengan data ini dokter akan bisa menentukan
obat yang sesuai dengan kondisi pasien tertentu. Lebih jauh lagi, dengan
dibacanya genom manusia, akan memungkinkan untuk mengetahui penyakit genetik
seseorang, sehingga personal care terhadap pasien menjadi lebih akurat.
Sampai saat ini telah diketahui beberapa gen yang
berperan dalam penyakit tertentu beserta posisinya pada kromosom. Informasi ini
tersedia dan bisa dilihat di home page National Center for Biotechnology
Information (NCBI) pada seksi Online Mendelian in Man (OMIM) (http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM). OMIM adalah search tool untuk gen manusia dan penyakit
genetika. Selain berisikan informasi tentang lokasi gen suatu penyakit, OMIM
ini juga menyediakan informasi tentang gejala dan penanganan penyakit tersebut
beserta sifat genetikanya. Dengan demikian, dokter yang menemukan pasien yang
membawa penyakit genetika tertentu bisa mempelajarinya secara detil dengan
mengakses home page OMIM ini.
- Bioinformatika untuk penemuan obat
Usaha
penemuan obat biasanya dilakukan dengan penemuan zat/senyawa yang bisa menekan perkembangbiakan suatu agent penyebab penyakit.
Karena banyak faktor yang bisa mempengaruhi
perkembangbiakan agent tersebut, faktor-faktor itulah yang dijadikan target. Diantara faktor tersebut adalah enzim-enzim yang
diperlukan untuk perkembangbiakan suatu agent.
Langkah pertama yang dilakukan adalah analisa struktur dan fungsi enzim-enzim tersebut. Kemudian mencari atau mensintesa
zat/senyawa yang bisa menekan fungsi dari enzim-enzim tersebut. Penemuan
obat yang efektif adalah penemuan senyawa yang berinteraksi dengan asam amino yang berperan untuk aktivitas (active site) dan untuk
kestabilan enzim tersebut.
Karena itu
analisa struktur dan fungsi enzim ini biasanya difokuskan pada analisa asam
amino yang berperan untuk aktivitas (active site) dan untuk kestabilan enzim
tersebut. Analisa ini dilakukan dengan cara mengganti asam amino tertentu dan
menguji efeknya. Sebelum perkembangan bioinformatika, analisa penggantian asam
amino ini dilakukan secara random sehingga memakan waktu yang lama. Dengan
adanya Bioinformatika, data-data protein yang sudah dianalisa bebas diakses
oleh siapapun, baik data sekuen asam amino-nya seperti yang ada di SWISS-PROT (http://www.ebi.ac.uk/swissprot/) maupun
struktur 3D-nya yang tersedia di Protein Data Bank (PDB) (http://www.rcsb.org/pdb/). Dengan database yang
tersedia ini, enzim yang baru ditemukan bisa dibandingkan sekuen asam
amino-nya, sehingga bisa diperkirakan asam amino yang berperan untuk active
site dan kestabilan enzim tersebut. Hasil perkiraan kemudian diuji di
laboratorium. Dengan demikian, akan lebih menghemat waktu dari pada analisa
secara random.
- Bioinformatika dalam Virologi
Sebelum
kemajuan bioinformatika, untuk mengklasifikasikan virus kita harus melihat morfologinya terlebih dahulu. Untuk melihat morfologi
virus dengan akurat, biasanya digunakan
mikroskop elektron yang harganya sangat mahal sehingga tidak bisa dimiliki oleh
semua laboratorium. Selain itu, kita
harus bisa mengisolasi dan mendapatkan virus itu sendiri. Isolasi virus adalah suatu pekerjaan yang tidak
mudah. Banyak virus yang tidak bisa dikulturkan, apalagi diisolasi. Virus hepatitis C (HCV), misalnya, sampai saat ini
belum ada yang bisa mengkulturkannya,
sehingga belum ada yang tahu bentuk morfologi virus ini. Begitu juga virus hepatitis E (HEV) dan kelompok virus yang termasuk ke
dalam family Calliciviridae, dimana sampai
saat ini belum ditemukan sistem pengkulturannya. Walaupun untuk beberapa virus bisa dikulturkan, tidak semuanya bisa diisolasi
dengan mudah. Oleh karena itu, sebelum
perkembangan bioinformatika, kita tidak bisa mengidentifikasi dan mengklasifikasikan virus-virus semacam ini. Dengan kemajuan teknik isolasi DNA/RNA, teknik
sekuensing dan ditunjang dengan kemajuan bioinformatika,
masalah diatas bisa teratasi. Untuk mengidentifikasi dan mengklasifikasikan virus, isolasi virus tidak lagi menjadi suatu hal
yang mutlak. Kita cukup dengan hanya melakukan
sekuensing terhadap gen-nya. Ini adalah salah satu hasil kemajuan bioinformatika
yang nyata dalam bidang virologi.
sumber:
Nama : Nanda Fitriya Hayati
Npm : 54410908
Anggota Kelompok :
- Bagus Dian
- M. Rifai
- M. Yoga Adhiasta
- Ni putu yuan
Tidak ada komentar:
Posting Komentar