Pertimbangan dalam Disaster Recovery Planning
Untuk itu, hal-hal berikut perlu perlu dipertimbangkan dalam
pembuatan disaster recovery planning:
1.
Libatkan manajemen
puncak
Manajemen puncak sangat berkepentingan
dengan kelangsungan bisnis perusahaan. Oleh karena itu mereka juga perlu
terlibat dengan semua rencana disaster recovery ini.
Manajemen puncak harus terlibat dari awal sampai akhir pembuatan rencana disaster
recovery. Keterlibatan manajemen puncak terutama Chief
Information Officer (CIO), Chief
Technology Officer (CTO), Chief
Financial Officer (CFO) dan Chief
Executive Officer (CEO) sangat penting dalam eksekusi
rencana disaster recovery ini.
2.
Bentuk komite
perencanaan
Komite perencanaan ini merupakan wakil
dari seluruh bagian perusahaan. Umumnya yang terlibat di sini adalah bagian
umum dan sumber daya manusia (general affair and human resource
department). Selain itu, yang terlibat antara lain
juga dari departemen keuangan atau finance. Di
sini yang terlibat adalah bagian teknologi informasi atau information
technology. Bagian Tl sangat berkepentingan untuk
mengamankan operasi bisnis perusahaan yang sangat tergantung dengan teknologi
informasi. Oleh karena itu umumnya bagian teknologi informasi berperan sebagai
pemimpin di dalam komite perencanaan ini.
3.
Lakukan analisis
resiko
Komite perencanaan perlu melakukan
analisis resiko, untuk mengetahui apa saja risiko yang bisa menimpa perusahaan.
Risiko yang terkecil sampai terbesar perlu dipertimbangkan. Selain itu penyebab
risiko tersebut perlu dianalisis, apakah disebabkan oleh alam atau karena
kecerobohan manusia. Seberapa besar dampak risiko tersebut terhadap
kelangsungan bisnis perusahaan? Seberapa sanggup perusahaan berjalan jika
risiko tersebut terjadi?
4.
Susun prioritas proses
dan kegiatan
Saat bencana terjadi, perlu
dipertimbangkan kegiatan apa yang masih bisa berlangsung dan mana yang bisa
ditunda. Hal ini juga tergantung seberapa besar bencana yang terjadi. Jika
terjadi bencana karena kerusakan file server misalnya,
kegiatan bisnis masih bisa berjalan. Berbeda jika terjadi kebakaran pada sebuah
data center, rencana pemulihan bencana
dititikberatkan pada pengembalian operasi perusahaan secepat mungkin. Tentu
saja perusahaan sudah memiliki rencana yang matang dan menggunakan semua sumber
daya yang ada.
5.
Tentukan strategi
pemulihan
Di sini perlu ditentukan strategi apa
yang diperlukan untuk memulihkan operasi bisnis perusahaan. Strategi pemulihan
ini perlu disesuaikan dengan seluruh aset yang dimiliki oleh perusahaan seperti
perangkat keras, perangkat lunak, jaringan komunikasi, file data,
media penyimpanan, dan sebagainya. Perangkat keras dan perangkat lunak mungkin
ada gantinya, namun tidak demikian dengan data dan informasi. Replikasi data
sangat penting bagi konsistensi data dan informasi perusahaan. Lokasi
penyimpanan salinan data ini biasanya merupakan data
center kedua yang berada jauh atau remote
site. Di sini bisa dilakukan replikasi secara tersinkronisasi
untuk melakukan pertukaran data secara real-time atau
asinkronus untuk yang tidak real-time. Ada beberapa
tipe replikasi yang bisa dipilih antara lain, database
ke database, host ke host dan
juga disk ke disk.
Pemilihan ini tergantung teknologi yang didukung oleh
perangkat keras atau perangkat lunak yang bersangkutan.
6.
Lakukan pengumpulan
data
Perusahaan perlu melakukan pengumpulan
data atas seluruh aset yang dimilikinya seperti perangkat keras, perangkat
lunak, jaringan komunikasi, serta data dan informasi. Perangkat lunak meliputi
perangkat lunak sistem operasi, perangkat lunak aplikasi, utilities,
dan driver, dan
perangkat lunak lainnya. Perangkat keras meliputi server,
workstation, personal computer, laptop/notebook, PC tablet,
smartphone, hub/switch, kabel jaringan, modem, router,
firewall, dan sebagainya. Jaringan komunikasi mencakup layanan dari service
provider seperti LAN, WAN, VPN, dan Internet. Data dan informasi
berupa arsip backup dan
sebagainya. Hasil pengumpulan data dilakukan untuk melakukan rencana pemulihan
ini.
7. Buat dokumen tertulis
Rencana
yang tidak tertulis hanya menghasilkan angan-angan. Oleh karena itu rencana
pemulihan bencana haruslah didokumentasikan dalam bentuk tertulis. Dokumen ini
dibuat dalam bentuk terstruktur dan jelas. Isinya mencakup tujuan dan sasaran
pemulihan, tata letak tempat di dalam perusahaan, atau lokasi mana saja yang
perlu dipulihkan
jika terjadi bencana, siapa pemegang wewenang atau siapa yang
berhak memimpin rencana pemulihan, rincian struktur tugas mencakup tugas dan
fungsi anggota tim pemulihan, siapa saja yang menjalankan rencana pemulihan,
dan bagaimana menghubunginya (apakah itu pegawai internal, pihak ketiga atau
vendor, maupun pihak pemerintahan yang terkait). Dokumen ini juga harus
mencantumkan hal-lain yang diperlukan untuk pemulihan bencana ini. Dalam
menyusun rencana pemulihan bencana diperlukan metode yang spesifik untuk
mengorganisasi dan menuliskannya.
8. Buatlah prosedur dan kriteria pengujian
Rencana pemulihan yang sudah dibuat dan
ditulis perlu diuji untuk memastikan bahwa semua rencana bisa dijalankan.
Berdasarkan temuan Symantec dalam penelitian tentang disaster
recovery satu dari empat rencana pemulihan bencana gagal dalam
pengujian. Paling tidak ada empat jenis pengujian yang disarankan seperti uji checklist,
pengujian simulasi, pengujian paralel, dan pengujian penuh.
Uji checklist merupakan pengujian yang paling
sederhana, bukan pengujian yang sesungguhnya. Hal ini karena pengujian ini hanya
memeriksa daftar apa saja yang perlu dipulihkan. Pengujian simulasi bertujuan
untuk memeriksa sejauh mana kesiapan tim pemulihan bencana, apakah sudah
benar-benar paham dengan prosedur yang dituliskan dalam rencana pemulihan
bencana. Uji paralel memastikan bahwa perusahaan masih bisa beroperasi
sementara infrastruktur dipulihkan, sedangkan uji penuh langsung menghentikan
operasi bisnis perusahaan di data center utama
dan menjalankan operasi perusahaan dari data center kedua.
Proses perpindahan operasi ini akan memakan waktu tertentu.
9.
Sahkan dari manajemen
Rencana
pemulihan bencana yang sudah jadi tersebut harus mendapat pengesahan dari
manajemen puncak agar dapat dipakai sebagai peraturan yang sah dan berlaku di
perusahaan.
Disaster
recovery plan yang benar-benar terstruktur akan
berpengaruh langsung terhadap kemampuan recovery suatu
organisasi. Isi dari rencana yang disusun harus sistematis dan mudah
dimengerti. Pengorbanan usaha dan waktu yang sungguh-sungguh diperlukan dalam
menyusun rencana. Rencana yang ditulis dengan baik akan memudahkan pembacaan
dan pemahaman prosedur sehingga kemungkinan berhasilnya akan lebih besar saat
digunakan.
Skema disaster recovery
Beberapa
hal berikut ini merupakan hal yang bisa dilakukan untuk melakukan pemulihan
sistem
1.
Menggunakan Backup Restore Offline dan Replikasi
Data merupakan aset perusahaan yang sangat penting. Ketersediaan data saat terjadinya bencana merupakan kunci bagi perusahaan untuk bisa beroperasi kembali. Pengamanan data ini bisa dicapai menggunakan dua cara yaitu backup restore dan replikasi. Backup merupakan proses untuk membuat salinan data secara offline dari penyimpanan utama (primary storage) misalnya harddisk atau storage ke media penyimpanan tambahan seperti fape. Hasil penyimpanan data ini didistribusikan secara off site atau di luar lokasi data center utama. Jika terjadi bencana, hasil backup tersebut bisa di-restore ke data center lain.
Replikasi data merupakan proses untuk membuat salinan ke
suatu lokasi yang terpisah dari data center utama. Proses ini bisa berlangsung
secara terus menerus atau hanya pada waktu tertentu. Hasil replikasi data ini
bisa digunakan untuk proses disaster recovery. Replikasi sinkronus akan
melakukan replikasi data secara real time atau langsung. Begrtu data berubah
pada data center utama, pada saat yang bersamaan data yang berada di lokasi
lain juga berubah. Dari sisi disaster recovery, kemampuan ini sangat
menguntungkan karena datan yang lengkap dan juga mudah diterapkan . Namun dari
sisi biaya, implementasi replikasi sinkronus ini cukup mahal. Ini berbeda
dengan replikasi asinkronus yang berbiaya rendah, namun rumit diimplementasikan
dengan data yang kurang lengkap.
2.
Menggunakan redundansi dalam data center
Mencegah adalah lebih baik daripada mengobati. Pada prinsipnya, Anda harus melindungi data center dari kemungkinan bencana. Karena itu semua yang terdapat pada data center dibuat redundant atau ganda.
Misalnya, Anda tidak cukup memiliki sumber daya listrik yang
berasal dari satu sumber saja. Anda harus memiliki listrik dari berbagai sumber
selain PLN, misalnya pembangkit solar atau premium yang dioperasikan sendiri.
Bisa juga listrik yang berasal dari sumber daya matahari atau solar cell. Jika
hanya satu sumber listrik, saat terjadi masalah pasokan daya, data center Anda
pasti akan terancam.
Uninterruptible power supply atau UPS merupakan perangkat
yang biasanya menggunakan baterai backup sebagai catuan daya alternatif, yang
bisa memberikan suplai daya tanpa terputus untuk perangkat elektronik yang
terpasang. UPS merupakan sistem penyedia daya listrik yang sangat penting dan
diperlukan sekaligus sebagai benteng kegagalan daya. Dapat dibayangkan berapa
besar kerugian yang timbul akibat kegagalan daya listrik tanpa UPS. Oleh karena
itu sebaiknya Anda memiliki UPS redundant yang menggunakan sumber listrik berbeda.
Harddisk redundant pada server dan storage juga sangat
diperlukan untuk menjaga keamanan data. Teknologi RAID (Redundant Array of
Inexpensive Disk) bisa mengakomodasi kebutuhan akan hal ini. RAID menggunakan
lebih dari satu harddisk untuk menjaga kelangsungan data. RAID 1 atau Mirror
membuat salinan (copy) yang identik pada harddisk yang berbeda, sedangkan RAID
5 menggabungkan tiga atau lebih harddisk untuk membentuk disk array
berkapasitas lebih besar. Jika satu disk mengalami kegagalan fungsi, data akan
masih bisa diselamatkan menggunakan informasi parity yang tersebar pada disk
lainnya.
Selain itu koneksi jaringan dan koneksi antara server dan
storage juga dibuat redundant. Hal ini untuk mengantisipasi masalah di sisi
jaringan.
Menggunakan high avalability solution (mirror
dan cluster server)
Problem
yang sering terjadi pada server misalnya restart, pembaruan (update), patching
dan sebagainya akan mengakibatkan down time. Paling tidak dibutuhkan waktu down
time selama 5 hingga 15 menit. Jika kerusakan yang timbul fatal, downtime tentu
akan berlangusng bisa lebih lama lagi. Karena itu kita bisa menggunakan
teknologi server mirror dan clustering untuk menekan downtime ini.
Clustering
merupakan teknologi untuk menggabungkan dua buah server fisik atau lebih
menjadi satu server andal. Secara fisik, sistem ini terdiri dari beberapa
server. Namun oleh sistem operasi, perangkat ini hanya dikenal sebagai satu
buah server. Aplikasi yang bisa dijadikan cluster antara lain adalah e-mail
server, database server, dan file server. Jika satu node atau host yang menjadi
anggota cluster mengalami masalah (down), perannya akan diambil alih oleh
anggota cluster yang lain secara otomatis. Penngambil-alihan ini dilakukan
hanya hitungan detik. User atau client tidak akan merasakan pengaruh yang
berarti. Ini berbeda dengan konsep mirror, yang membuat perpindahan layanan
harus dilakukan manual dengan bantuan adminstrator.
Menggunakan cloud computing
Cloud computing boleh jadi merupakan salah satu alternate untuk disaster recovery. Pada cloud computing, perusahaan tidak perlu melakukan investasi untuk membangun infrastruktur teknologi informasinya. Semua perangkat keras (hardware), perangkat lunak (software) dan tenaga operasional (brainware) semua sudah disediakan oleh service provider. Seluruh tanggung jawab terhadap infrastruktur teknologi informasi tersebut diambil alih penyedia jasa, termasuk jika terjadi bencana. Perusahaan tinggal membayar dan memakai. Provider akan menawarkannya dalam bentuk software as a service (Saas), platform as a service, maupun infrastructure as a service. Selain itu ada tiga jenis layanan cloud, yaitu public cloud, hybrid cloud, dan juga private cloud.
Public cloud
merupakan model yang mendasar dari cloud computing. Penyedia
jasa membuat aplikasi dan penyimpanan yang bisa diakses siapa saja melalui
Internet. Ini berbeda dengan private
cloud yang membatasi layanannya dalam
jumlah tertentu dan untuk pihak tertentu. Sementara hybrid cloud merupakan
gabungan kedua jenis layanan tadi. Data perusahaan seperti informasi sistem
keuangan dan sumber daya manusia disimpan dalam private cloud. Layanan yang
bisa menggunakan model public cloud
contohnya adalah e-mail, instant messaging dan portal. Google, Hotmail dan Facebook merupakan contoh
nyata public cloud.
Menggunakan Virtualisasi
Virtualisasi pada dasarnya adalah bentuk virtual dari
sesuatu yang bersifat fisik, misalnya sistem operasi, jaringan dan perangkat
penyimpanan data. Dibandingkan infrastruktur fisik, pembangunan infrastruktur
virtual ini memiliki banyak kelebihan. Pertama, aplikasi virtual membutuhkan
sumber daya listrik yang lebih sedikit. Jika ada sepuluh server fisik yang
masing-masing memakan daya 500 VA misalnya, dengan virtualisasi kita hanya
perlu membuat sepuluh mesin virtual yang total hanya membutuhkan daya sebesar
500 VA. Jelas virtualisasi ini mengusung konsep green energy. Kedua,
perusahaan tidak perlu membeli hardware yang identik untuk solusi disaster recovery. Mesin
virtual bisa pindahkan ke hardware yang berbeda sekali pun. Jelas ini sangat portabel.
Ketiga, menurunkan biaya investasi. Perusahaan tidak perlu
membeli banyak hardware untuk menjalankan banyak aplikasi. Cukup satu atau dua hardware yang sanggup
menjalankan banyak mesin virtual. Keempat, menyederhanakan proses backup dan recovery. Selain itu
pengujian disaster recovery juga bisa dijalankan secara otomatis.
Contoh
perangkat lunak yang bisa digunakan untuk membangun virtualisasi ini antara
lain adalah Hyper-V buatan Microsoft dan VMWare buatan VMWare Inc.
Dalam
penerapannya, dua atau lebih server fisik yang menjalankan mesin virtual akan
dijadikan cluster untuk solusi disaster
recovery nya. Site Recovery Manager (SRM)
besutan VMWare merupakan solusi disaster
recovery yang bagus sekali. SRM bisa
melakukan eksekusi otomatis terhadap recovery plan,
memangkas habis proses yang manual dan
lambat seperti yang terjadi pada disaster
recovery tradisional. Selain itu SRM juga
memastikan proses recovery berlangsung sesuai dengan yang diharapkan.
Setiap solusi disaster
recovery memiliki kelebihan dan kekurangan
masing-masing. Di sinilah pelaku teknologi informasi khususnya level manajemen
dituntut lebih bijaksana untuk memilih. Umumnya solusi yang andal harganya
mahal. Namun ini dibayar dengan ketersediaan layanan sistem yang meningkat dan
bisnis yang bisa terus berjalan. Di sinilah kita harus pintar-pintar memilih.
Tidak ada komentar:
Posting Komentar