Selasa, 30 Oktober 2012

Pemulihan Dari Bencana

Pemulihan dari bencana saat ini menjadi kosakata yang sangat penting bagi pelaku teknologi informasi. Apalagi, konsep "bencana" kini berubah total. Dahulu, pemulihan bencana hanya berlaku jika terjadi bencana alam seperti banjir dan gempa. Sekarang tidak berlaku lagi. Bencana bisa terjadi karena kegagalan perangkat keras dan perangkat lunak, serangan virus, worm, trojan, hacker, sampai kegagalan sumber daya listrik.




Pertimbangan dalam Disaster Recovery Planning
Untuk itu, hal-hal berikut perlu perlu dipertimbangkan dalam pembuatan disaster recovery planning:

1.   Libatkan manajemen puncak
Manajemen puncak sangat berkepentingan dengan kelangsungan bisnis perusahaan. Oleh karena itu mereka juga perlu terlibat dengan semua rencana disaster recovery ini. Manajemen puncak harus terlibat dari awal sampai akhir pembuatan rencana disaster recovery. Keterlibatan manajemen puncak terutama Chief Information Officer (CIO), Chief Technology Officer (CTO), Chief Financial Officer (CFO) dan Chief Executive Officer (CEO) sangat penting dalam eksekusi rencana disaster recovery ini.

2.   Bentuk komite perencanaan
Komite perencanaan ini merupakan wakil dari seluruh bagian perusahaan. Umumnya yang terlibat di sini adalah bagian umum dan sumber daya manusia (general affair and human resource department). Selain itu, yang terlibat antara lain juga dari departemen keuangan atau finance. Di sini yang terlibat adalah bagian teknologi informasi atau information technology. Bagian Tl sangat berkepentingan untuk mengamankan operasi bisnis perusahaan yang sangat tergantung dengan teknologi informasi. Oleh karena itu umumnya bagian teknologi informasi berperan sebagai pemimpin di dalam komite perencanaan ini.

3.   Lakukan analisis resiko
Komite perencanaan perlu melakukan analisis resiko, untuk mengetahui apa saja risiko yang bisa menimpa perusahaan. Risiko yang terkecil sampai terbesar perlu dipertimbangkan. Selain itu penyebab risiko tersebut perlu dianalisis, apakah disebabkan oleh alam atau karena kecerobohan manusia. Seberapa besar dampak risiko tersebut terhadap kelangsungan bisnis perusahaan? Seberapa sanggup perusahaan berjalan jika risiko tersebut terjadi?

4.   Susun prioritas proses dan kegiatan
Saat bencana terjadi, perlu dipertimbangkan kegiatan apa yang masih bisa berlangsung dan mana yang bisa ditunda. Hal ini juga tergantung seberapa besar bencana yang terjadi. Jika terjadi bencana karena kerusakan file server misalnya, kegiatan bisnis masih bisa berjalan. Berbeda jika terjadi kebakaran pada sebuah data center, rencana pemulihan bencana dititikberatkan pada pengembalian operasi perusahaan secepat mungkin. Tentu saja perusahaan sudah memiliki rencana yang matang dan menggunakan semua sumber daya yang ada.

5.   Tentukan strategi pemulihan
Di sini perlu ditentukan strategi apa yang diperlukan untuk memulihkan operasi bisnis perusahaan. Strategi pemulihan ini perlu disesuaikan dengan seluruh aset yang dimiliki oleh perusahaan seperti perangkat keras, perangkat lunak, jaringan komunikasi, file data, media penyimpanan, dan sebagainya. Perangkat keras dan perangkat lunak mungkin ada gantinya, namun tidak demikian dengan data dan informasi. Replikasi data sangat penting bagi konsistensi data dan informasi perusahaan. Lokasi penyimpanan salinan data ini biasanya merupakan data center kedua yang berada jauh atau remote site. Di sini bisa dilakukan replikasi secara tersinkronisasi untuk melakukan pertukaran data secara real-time atau asinkronus untuk yang tidak real-time. Ada beberapa tipe replikasi yang bisa dipilih antara lain, database ke database, host ke host dan juga disk ke disk. Pemilihan ini tergantung teknologi yang didukung oleh perangkat keras atau perangkat lunak yang bersangkutan.

6.   Lakukan pengumpulan data  
 Perusahaan perlu melakukan pengumpulan data atas seluruh aset yang dimilikinya seperti perangkat keras, perangkat lunak, jaringan komunikasi, serta data dan informasi. Perangkat lunak meliputi perangkat lunak sistem operasi, perangkat lunak aplikasi, utilities, dan driver, dan perangkat lunak lainnya. Perangkat keras meliputi server, workstation, personal computer, laptop/notebook, PC tablet, smartphone, hub/switch, kabel jaringan, modem, router, firewall, dan sebagainya. Jaringan komunikasi mencakup layanan dari service provider seperti LAN, WAN, VPN, dan Internet. Data dan informasi berupa arsip backup dan sebagainya. Hasil pengumpulan data dilakukan untuk melakukan rencana pemulihan ini.
7.   Buat dokumen tertulis
Rencana yang tidak tertulis hanya menghasilkan angan-angan. Oleh karena itu rencana pemulihan bencana haruslah didokumentasikan dalam bentuk tertulis. Dokumen ini dibuat dalam bentuk terstruktur dan jelas. Isinya mencakup tujuan dan sasaran pemulihan, tata letak tempat di dalam perusahaan, atau lokasi mana saja yang perlu dipulihkan jika terjadi bencana, siapa pemegang wewenang atau siapa yang berhak memimpin rencana pemulihan, rincian struktur tugas mencakup tugas dan fungsi anggota tim pemulihan, siapa saja yang menjalankan rencana pemulihan, dan bagaimana menghubunginya (apakah itu pegawai internal, pihak ketiga atau vendor, maupun pihak pemerintahan yang terkait). Dokumen ini juga harus mencantumkan hal-lain yang diperlukan untuk pemulihan bencana ini. Dalam menyusun rencana pemulihan bencana diperlukan metode yang spesifik untuk mengorganisasi dan menuliskannya.
8.     Buatlah prosedur dan kriteria pengujian
Rencana pemulihan yang sudah dibuat dan ditulis perlu diuji untuk memastikan bahwa semua rencana bisa dijalankan. Berdasarkan temuan Symantec dalam penelitian tentang disaster recovery satu dari empat rencana pemulihan bencana gagal dalam pengujian. Paling tidak ada empat jenis pengujian yang disarankan seperti uji checklist, pengujian simulasi, pengujian paralel, dan pengujian penuh. Uji checklist merupakan pengujian yang paling sederhana, bukan pengujian yang sesungguhnya. Hal ini karena pengujian ini hanya memeriksa daftar apa saja yang perlu dipulihkan. Pengujian simulasi bertujuan untuk memeriksa sejauh mana kesiapan tim pemulihan bencana, apakah sudah benar-benar paham dengan prosedur yang dituliskan dalam rencana pemulihan bencana. Uji paralel memastikan bahwa perusahaan masih bisa beroperasi sementara infrastruktur dipulihkan, sedangkan uji penuh langsung menghentikan operasi bisnis perusahaan di data center utama dan menjalankan operasi perusahaan dari data center kedua. Proses perpindahan operasi ini akan memakan waktu tertentu.
9.   Sahkan dari manajemen
Rencana pemulihan bencana yang sudah jadi tersebut harus mendapat pengesahan dari manajemen puncak agar dapat dipakai sebagai peraturan yang sah dan berlaku di perusahaan.
Disaster recovery plan yang benar-benar terstruktur akan berpengaruh langsung terhadap kemampuan recovery suatu organisasi. Isi dari rencana yang disusun harus sistematis dan mudah dimengerti. Pengorbanan usaha dan waktu yang sungguh-sungguh diperlukan dalam menyusun rencana. Rencana yang ditulis dengan baik akan memudahkan pembacaan dan pemahaman prosedur sehingga kemungkinan berhasilnya akan lebih besar saat digunakan.
Skema disaster recovery
Beberapa hal berikut ini merupakan hal yang bisa dilakukan untuk melakukan pemulihan sistem
1.   Menggunakan Backup Restore Offline dan Replikasi

Data merupakan aset perusahaan yang sangat penting. Ketersediaan data saat terjadinya bencana merupakan kunci bagi perusahaan untuk bisa beroperasi kembali. Pengamanan data ini bisa dicapai menggunakan dua cara yaitu backup restore dan replikasi. Backup merupakan proses untuk membuat salinan data secara offline dari penyimpanan utama (primary storage) misalnya harddisk atau storage ke media penyimpanan tambahan seperti fape. Hasil penyimpanan data ini didistribusikan secara off site atau di luar lokasi data center utama. Jika terjadi bencana, hasil backup tersebut bisa di-restore ke data center lain.

Replikasi data merupakan proses untuk membuat salinan ke suatu lokasi yang terpisah dari data center utama. Proses ini bisa berlangsung secara terus menerus atau hanya pada waktu tertentu. Hasil replikasi data ini bisa digunakan untuk proses disaster recovery. Replikasi sinkronus akan melakukan replikasi data secara real time atau langsung. Begrtu data berubah pada data center utama, pada saat yang bersamaan data yang berada di lokasi lain juga berubah. Dari sisi disaster recovery, kemampuan ini sangat menguntungkan karena datan yang lengkap dan juga mudah diterapkan . Namun dari sisi biaya, implementasi replikasi sinkronus ini cukup mahal. Ini berbeda dengan replikasi asinkronus yang berbiaya rendah, namun rumit diimplementasikan dengan data yang kurang lengkap.

2.   Menggunakan redundansi dalam data center

Mencegah adalah lebih baik daripada mengobati. Pada prinsipnya, Anda harus melindungi data center dari kemungkinan bencana. Karena itu semua yang terdapat pada data center dibuat redundant atau ganda.

Misalnya, Anda tidak cukup memiliki sumber daya listrik yang berasal dari satu sumber saja. Anda harus memiliki listrik dari berbagai sumber selain PLN, misalnya pembangkit solar atau premium yang dioperasikan sendiri. Bisa juga listrik yang berasal dari sumber daya matahari atau solar cell. Jika hanya satu sumber listrik, saat terjadi masalah pasokan daya, data center Anda pasti akan terancam.

Uninterruptible power supply atau UPS merupakan perangkat yang biasanya menggunakan baterai backup sebagai catuan daya alternatif, yang bisa memberikan suplai daya tanpa terputus untuk perangkat elektronik yang terpasang. UPS merupakan sistem penyedia daya listrik yang sangat penting dan diperlukan sekaligus sebagai benteng kegagalan daya. Dapat dibayangkan berapa besar kerugian yang timbul akibat kegagalan daya listrik tanpa UPS. Oleh karena itu sebaiknya Anda memiliki UPS redundant yang menggunakan sumber listrik berbeda.

Harddisk redundant pada server dan storage juga sangat diperlukan untuk menjaga keamanan data. Teknologi RAID (Redundant Array of Inexpensive Disk) bisa mengakomodasi kebutuhan akan hal ini. RAID menggunakan lebih dari satu harddisk untuk menjaga kelangsungan data. RAID 1 atau Mirror membuat salinan (copy) yang identik pada harddisk yang berbeda, sedangkan RAID 5 menggabungkan tiga atau lebih harddisk untuk membentuk disk array berkapasitas lebih besar. Jika satu disk mengalami kegagalan fungsi, data akan masih bisa diselamatkan menggunakan informasi parity yang tersebar pada disk lainnya.

Selain itu koneksi jaringan dan koneksi antara server dan storage juga dibuat redundant. Hal ini untuk mengantisipasi masalah di sisi jaringan.

Menggunakan high avalability solution (mirror dan cluster server)

Problem yang sering terjadi pada server misalnya restart, pembaruan (update), patching dan sebagainya akan mengakibatkan down time. Paling tidak dibutuhkan waktu down time selama 5 hingga 15 menit. Jika kerusakan yang timbul fatal, downtime tentu akan berlangusng bisa lebih lama lagi. Karena itu kita bisa menggunakan teknologi server mirror dan clustering untuk menekan downtime ini.

Clustering merupakan teknologi untuk menggabungkan dua buah server fisik atau lebih menjadi satu server andal. Secara fisik, sistem ini terdiri dari beberapa server. Namun oleh sistem operasi, perangkat ini hanya dikenal sebagai satu buah server. Aplikasi yang bisa dijadikan cluster antara lain adalah e-mail server, database server, dan file server. Jika satu node atau host yang menjadi anggota cluster mengalami masalah (down), perannya akan diambil alih oleh anggota cluster yang lain secara otomatis. Penngambil-alihan ini dilakukan hanya hitungan detik. User atau client tidak akan merasakan pengaruh yang berarti. Ini berbeda dengan konsep mirror, yang membuat perpindahan layanan harus dilakukan manual dengan bantuan adminstrator.

Menggunakan cloud computing


Cloud computing boleh jadi merupakan salah satu alternate untuk disaster recovery. Pada cloud computing, perusahaan tidak perlu melakukan investasi untuk membangun infrastruktur teknologi informasinya. Semua perangkat keras (hardware), perangkat lunak (software) dan tenaga operasional (brainware) semua sudah disediakan oleh service provider. Seluruh tanggung jawab terhadap infrastruktur teknologi informasi tersebut diambil alih penyedia jasa, termasuk jika terjadi bencana. Perusahaan tinggal membayar dan memakai. Provider akan menawarkannya dalam bentuk software as a service (Saas), platform as a service, maupun infrastructure as a service. Selain itu ada tiga jenis layanan cloud, yaitu public cloud, hybrid cloud, dan juga private cloud.

Public cloud merupakan model yang mendasar dari cloud computing. Penyedia jasa membuat aplikasi dan penyimpanan yang bisa diakses siapa saja melalui Internet. Ini berbeda dengan private cloud yang membatasi layanannya dalam jumlah tertentu dan untuk pihak tertentu. Sementara hybrid cloud merupakan gabungan kedua jenis layanan tadi. Data perusahaan seperti informasi sistem keuangan dan sumber daya manusia disimpan dalam private cloud. Layanan yang bisa menggunakan model public cloud contohnya adalah e-mail, instant messaging dan portal. Google, Hotmail dan Facebook merupakan contoh nyata public cloud.

Menggunakan Virtualisasi



Virtualisasi pada dasarnya adalah bentuk virtual dari sesuatu yang bersifat fisik, misalnya sistem operasi, jaringan dan perangkat penyimpanan data. Dibandingkan infrastruktur fisik, pembangunan infrastruktur virtual ini memiliki banyak kelebihan. Pertama, aplikasi virtual membutuhkan sumber daya listrik yang lebih sedikit. Jika ada sepuluh server fisik yang masing-masing memakan daya 500 VA misalnya, dengan virtualisasi kita hanya perlu membuat sepuluh mesin virtual yang total hanya membutuhkan daya sebesar 500 VA. Jelas virtualisasi ini mengusung konsep green energy. Kedua, perusahaan tidak perlu membeli hardware yang identik untuk solusi disaster recovery. Mesin virtual bisa pindahkan ke hardware yang berbeda sekali pun. Jelas ini sangat portabel.

Ketiga, menurunkan biaya investasi. Perusahaan tidak perlu membeli banyak hardware untuk menjalankan banyak aplikasi. Cukup satu atau dua hardware yang sanggup menjalankan banyak mesin virtual. Keempat, menyederhanakan proses backup dan recovery. Selain itu pengujian disaster recovery juga bisa dijalankan secara otomatis.
Contoh perangkat lunak yang bisa digunakan untuk membangun virtualisasi ini antara lain adalah Hyper-V buatan Microsoft dan VMWare buatan VMWare Inc.

Dalam penerapannya, dua atau lebih server fisik yang menjalankan mesin virtual akan dijadikan cluster untuk solusi disaster recovery nya. Site Recovery Manager (SRM) besutan VMWare merupakan solusi disaster recovery yang bagus sekali. SRM bisa melakukan eksekusi otomatis terhadap recovery plan, memangkas habis proses yang manual dan lambat seperti yang terjadi pada disaster recovery tradisional. Selain itu SRM juga memastikan proses recovery berlangsung sesuai dengan yang diharapkan.



Setiap solusi disaster recovery memiliki kelebihan dan kekurangan masing-masing. Di sinilah pelaku teknologi informasi khususnya level manajemen dituntut lebih bijaksana untuk memilih. Umumnya solusi yang andal harganya mahal. Namun ini dibayar dengan ketersediaan layanan sistem yang meningkat dan bisnis yang bisa terus berjalan. Di sinilah kita harus pintar-pintar memilih.

Tidak ada komentar:

Posting Komentar