Basis Data Tersebar Dengan OGSA-DQP

Grid muncul sebagai suatu infrastruktur yang mendukung pencarian dan penggunaan dari sumber daya komputasi yang tersebar. Suatu pandangan berorientasi layanan dari perangkat keras dan perangkat lunak pada Grid memunculkan pertanyaan, bagaimana sistem pengelolaan basis data (database) dapat diterapkan pada lingkungan ini. Salah satu alternatif adalah Distributed Query Processing (DQP) yang dibangun berdasarkan Open Grid Service Architecture (OGSA). Makalah ini akan melakukan kajian terhadap OGSA-DQP sebagai kerangka kerja untuk basis data pada sistem Grid beserta tinjauan dari aplikasi yang telah dibuat.


1. PENDAHULUAN

Pendekatan berbasis layanan seperti Web Services (WS) dan Open Grid Service Architecture (OGSA) mendapat perhatian penting dalam mendukung pengembangan aplikasi tersebar, khususnya pada e-bussiness dan e-science. Hal tersebut merupakan solusi yang memadai dalam pemodelan organisasi virtual sebagai sebuah sistem tersebar. OGSA sendiri menawarkan kaidah dan antarmuka dalam pembuatan layanan Grid, yang memungkinkan penciptaan dinamis dari layanan sumber daya komputasi, ketika ditemukan dan dibutuhkan.

Meskipun awalnya komputasi Grid menggunakan penyimpanan data berbasis file, kebutuhan akan suatu basis data yang memadai semakin penting. OGSA-DQP (Distributed Query Processing) dalam hal ini bertujuan memenuhi kebutuhan tersebut, yaitu sebagai suatu basis layanan pemrosesan query tersebar menurut kaidah dari OGSA-DAI (Data Access & Integration). OGSA-DQP pada prinsipnya dapat digunakan oleh suatu aplikasi Grid yang bermaksud menggabungkan dan menganalisa suatu koleksi data terstruktur, serta menyediakan akses yang konsisten terhadap operasi basis data. Dilakukan pula penyesuaian terhadap teknik basis data paralel dalam menyediakan paralelisme implisit atas permintaan data yang kompleks dan intensif.

Makalah ini akan menyajikan kajian dari OGSA-DQP sebagai suatu teori dan penerapan basis data pada sistem Grid. Tinjuan literatur Grid, OGSA, OGSA-DAI dan OGSA-DQP dapat dilihat pada bagian 2. Tinjauan kasus dan pembahasan dari penerapan OGSA-DQP terdapat di bagian 3. Penutup akan disampaikan pada bagian 4.

2. TINJAUAN PUSTAKA

2.1. Grid dan OGSA

Teknologi komputasi Grid adalah suatu cara penggabungan sumber daya yang dimiliki banyak komputer yang terhubung dalam suatu jaringan sehingga terbentuk suatu kesatuan sistem komputer dengan sumber daya komputasi yang besar [1]. Komputasi Grid menekankan pada koordinasi pembagian sumber daya dan pemecahan masalah secara dinamis, dalam multi-institusional organisasi maya. Konsep kuncinya adalah kemampuan untuk menegosiasikan pengaturan sumber daya bersama antara pihak-pihak yang terlibat (penyedia dan pemakai) dan menggunakannya untuk suatu keperluan.

Suatu Grid harus memenuhi aspek penting berikut [2] :

  1. Mengatur sumber daya yang tidak ditujukan untuk dikendalikan secara terpusat.
  2. Menggunakan protokol dan antarmuka yang baku, terbuka dan dapat digunakan untuk berbagai keperluan.
  3. Memberikan Quality of Service (QoS) yang sungguh-sungguh (non-trivial), disesuaikan dengan kebutuhan pengguna.

clip_image002

Gambar 1. Arsitektur Komputasi Grid.

Gambar 1 menunjukkan rancangan arsitektur infrastruktur komputasi Grid. Grid computing dibangun dengan menggabungkan sistem-sistem komputasi Grid yang berada di institusi-institusi penelitian (GRID-2, 3, 4) menjadi satu kesatuan. Konfigurasi perangkat keras dan perangkat lunak masing-masing sistem di tingkat institusi dapat berbeda, tetapi dengan mengoperasikan teknologi Grid computing seperti Globus Toolkit 4 (GT4) pada simpul-simpul penghubung dari masing-masing cluster, keseluruhan sistem membentuk satu kesatuan infrastruktur komputasi Grid. Pengguna di suatu institusi dapat memanfaatkan sumber daya komputasi yang berada di luar institusinya.

OGSA adalah arsitektur berorientasi layanan, untuk memenuhi kebutuhan standarisasi, dengan mendefinisikan suatu kemampuan pokok dan cara kerja yang menjadi perhatian utama dari sistem Grid [3]. OGSA menunjukkan proses evolusi menuju sistem Grid yang berbasiskan konsep dan teknologi Web Sevices. Sebagian besar kaidah OGSA adalah produk dari komunitas Grid dan menjadi pembicaraan utama dalam Global Grid Forum (GGF). Anggota-anggota dari Globus Alliance mempunyai andil besar dalam pengembangan OGSA.

Dalam OGSA versi 1.0, disebutkan 10 persyaratan dasar yaitu: a) Interoperabilitas, mendukung lingkungan yang dinamis dan heterogen; b) Pembagian sumber daya lintas organisasi; c) Optimisasi sumber daya sesuai kebutuhan; d) Jaminan kualitas layanan; e) Pengerjaan tugas; f) Layanan data; g) Keamanan; h) Pengurangan biaya administratif; i) Skalabilitas; j) Ketersediaan; k) Kemudahan penggunaan dan pengembangan.

Secara garis besar, arsitektur OGSA dapat dibagi menjadi 3 lapisan :

  1. Lapisan dasar: layanan Grid. Berupa antar muka baku dan tata cara perihal sistem terdistribusi, seperti penamaan, layanan, waktu hidup, dan pemberitahuan. Suatu Grid service adalah sebuah Web service.
  2. Spesifikasi layanan baku. Berupa kesepakatan, akses data dan integrasi, alur kerja, keamanan, kebijakan, dan diagnosa. Hal ini merupakan sasaran dari kerja GGF saat ini dan masa datang.
  3. Layanan khusus sesuai aplikasi, berdasarkan definisi dari poin 1, dan 2 serta hal-hal pendukung lain.

Sejak terbitnya Globus Toolkit 3.0, Globus Project menawarkan koleksi open source dari layanan Grid yang mengikuti prinsip arsitektural OGSA. Globus Toolkit juga menawarkan lingkungan pengembangan untuk menghasilkan layanan Grid baru sesuai prinsip OGSA. Keterangan ini dapat dilihat pada situs http://www.globus.org/ogsa/.

2.2. OGSA-DAI

OGSA-DAI bertujuan untuk menyediakan antarmuka layanan yang seragam untuk akses data dan integrasi ke basis data pada sistem Grid, menyembunyikan perbedaan seperti teknologi driver, format data, dan mekanisme pengiriman [4]. Melalui OGSA-DAI, sumber data dan sumber daya yang terpisah dan bermacam-macam dapat tersedia sebagai layanan yang terintegrasi penuh dengan layanan OGSA lain. Dengan demikian OGSA-DAI menyediakan operasi dasar bagi layanan pada lapisan di atasnya, sehingga memberikan fungsionalitas lebih besar seperti federasi data dan query tersebar.

clip_image004

Gambar 2. Kerangka kerja OGSA-DAI

Aspek-aspek penting dari arsitektur OGSA-DAI sebagai berikut:

  1. Standarisasi antarmuka. Keuntungan yang dibawa OGSA-DAI dibanding model konektivitas basis data lain adalah antar muka yang konsisten tanpa memandang teknologi yang mendasarinya. Sebagai contoh, OGSA-DAI mendukung banyak sistem basis data relasional (RDBMS), penyimpan XML, maupun sistem file. Tidak hanya perintah query, tetapi berkembang pada operasi data yang umum, seperti transaksi dan pemuatan borongan (bulk load).
  2. Metadata. OGSA-DAI menyediakan metadata dari DBMS, tanpa terikat pada basis data tertentu. Sehingga baik itu Oracle, DB2, MySQL, dan lain-lain, dapat disajikan bagi sistem Grid.
  3. Session. Session adalah penting dalam sistem basis data, misalnya saat mengaitkan suatu query dalam konteks transaksi tertentu. Sehingga dibutuhkan suatu cara mengelompokkan query-query sesuai periode waktu. OGSA-DAI menyediakan tata cara baku bagi pemakai untuk membuat session atas sumber daya data.
  4. Keamanan. OGSA-DAI menyediakan autentikasi sederhana, terdiri dari RoleMap file dan suatu kelas penerapan, yang melakukan pemetaan aturan kewenangan Grid untuk mengakses sistem.
  5. Pengelompokan permintaan. Suatu antar muka berorientasi dokumen untuk melakukan banyak permintaan operasi basis data dalam satu waktu, sehingga mengurangi jumlah pesan dan banyak data saat terjadi interaksi.
  6. Pilihan penyampaian data. Disediakan cara penyampaian data yang dapat dipilih oleh aplikasi Grid, misalnya permintaan sinkron atau asinkron (serempak atau tidak serempak).

clip_image006

Gambar 3. Layanan dasar OGSA-DAI.

Dalam melakukan permintaan basis data, disediakan Grid Data Service (GDS), berupa antarmuka berorientasi dokumen, berisikan aktivitas-aktivitas yang saling terkait, untuk dioperasikan pada satu waktu dan didapatkan hasilnya. Aktivitas ini dapat terdiri dari berbagai kegiatan, seperti sqlQueryStatement (pernyataan), xslTransform (penerjemahan), dan deliverToGFTP (penyampaian). Aktivitas ini dapat dibuat sendiri dan didaftarkan pada sistem. Dokumen aktivitas berformat XML, seperti contoh di bawah.

<?xml version=”1.0″ encoding=”UTF-8″?>

<Perform … >

<documentation>

</documentation>

<deliverFromGDT name=”parameters”>

<fromGDT resourceName=”OracleDataResource”

streamId=”someOutputStream” mode=”block”> http://www.uwindsor.ca:8088/wsrf/services/ogsadai/DataService1

</fromGDT>

<toLocal name=”parametersOutput”/>

</deliverFromGDT>

<sqlQueryStatement name=”statement”>

<sqlParameter position=”1″ from=”parametersOutput”/>

<sqlParameter position=”2″ from=”parametersOutput”/>

<expression>

select * from littleblackbook where id &gt; ? and id &lt;= ?

</expression>

<webRowSetStream name=”statementOutput”/>

</sqlQueryStatement>

</Perform>

2.3. OGSA-DQP

OGSA Distributed Query Processor (DQP) adalah sebuah produk open source berbasiskan layanan yang mendukung query dan analisis terhadap koleksi data jarak jauh dan tersebar [7]. OGSA-DQP menggunakan Grid Data Services (GDS) yang disediakan OGSA-DAI dalam menyembunyikan keberagaman sumber data dan memastikan akses yang konsisten atas data dan metadata. OGSA-DQP menyediakan dua jenis layanan, Grid Distributed Query Services (GDQS) dan Grid Query Evaluation Services (GQES). GDQS tampak oleh pemakai dengan suatu program berbentuk GUI, sedangkan GQES berupa mesin query, berinteraksi dengan layanan lain (seperti GDS, Web Services, GQES lain) dan bertugas menjalankan rencana query yang dibuat GDQS.

clip_image008

Gambar 4. Arsitektur dari OGSA-DQP.

OGSA-DQP dapat dilihat sebagai suatu komponen mediator dari pembungkus OGSA-DAI, dengan menekankan pada eksekusi query yang efisien dibanding penggabungan sumber data yang berbeda-beda. Karakter pembeda dari OGSA-DQP adalah kemampuan dalam memetakan rencana evaluasi query menjadi sekumpulan layanan evaluasi paralel secara implisit yang dijalankan terhadap sumber daya OGSA-DAI dan Web service. OGSA-DQP menggunakan referensi penerapan dari OGSA dan Globus Toolkit terhadap sumber daya virtual (dirujuk sebagai Grid Services), memungkinkan alokasi dinamis dari sumber daya untuk melakukan evaluasi yang efisien dari query tersebar.

OGSA-DQP menghasilkan kerangka kerja sebagai berikut:

  • Mendukung query-query deklaratif terhadap banyak GDS dengan membuat gabungan skema basis data dari sumber data yang tersedia.
  • Mendukung panggilan terhadap WS luar melalui penyisipan atas operasi WS tersebut menjadi sebuah query, dengan demikian menggabungkan akses data dengan analisis data.
  • Mengambil teknik dari basis data paralel dalam menyediakan paralelisme implisit untuk permintaan data yang kompleks.
  • Otomatisasi konfigurasi sistem yang rumit dan penggunaan sumber daya sesuai kepentingan pemakai melalui modul optimisasi query.

clip_image010

Gambar 5. Setting dan pengerjaan query pada OGSA-DQP

BAB 3. STUDI KASUS DAN PEMBAHASAN

3.1. Spesifikasi Program OGSA-DQP

Penerapan dari OGSA-DQP berupa sebuah program berlisensi Open Source dapat diunduh pada situs http://www.ogsadai.org.uk/. Program didistribusikan dalam bentuk source program dan perlu dikompilasi sebelum digunakan. Saat makalah ini dibuat pada bulan Desember 2008 telah tersedia versi 3.2.1. Komponen dari OGSA-DQP, yaitu koordinator dan evaluator, harus diinstalasi secara terpisah.

Terdapat 2 skenario pengembangan yang didukung OGSA-DQP 3.2, yaitu sesuai dengan OGSA-DAI 3.0 menggunakan Apache Axis 1.2.1 (kode axis121) atau Globus Toolkit 4.0.5 Web Services (kode gt4). Demi kelancaran operasi antar pihak, seluruh WS yang terlibat saat penyebaran pengerjaan query wajib menggunakan versi axis yang sama (baik oleh Apache atau GT4).

Query Evaluator Service (QES) merupakan sebuah stateful WS, bertugas mengevaluasi query berformat XML yang dikirim oleh koordinator. Prasyarat minimal yang dibutuhkan yaitu Java versi 1.4.2, Jakarta Ant versi 1.6.5, dan Apache Tomcat versi 5.0.28. Apache Axis sudah terdapat dalam pustaka OGSA-DQP. Koordinator diwujudkan dalam suatu kumpulan OGSA-DAI data dan aktivitas, yang dihimpun dalam suatu Factory Data Resource. Prasyarat yang dibutuhkan adalah Java, Apache Tomcat, Jakarta Ant, dan OGSA-DAI versi 3.0.

Program client tersedia dalam 2 jenis, yaitu berupa baris perintah berbasis teks atau berwujud tampilan grafis (GUI). Prasyarat keduanya sama dengan prasyarat evaluator dan koordinator. Pada versi 3.2 ini OGSA-DQP telah mendukung sebagian dari sintaks SQL, termasuk tambahan pemanggilan fungsi-fungsi dari WS melalui query. Mengingat banyak komponen berbasis Java yang terlibat, jenis data pada basis data yang didukung dipetakan sesuai Java, misalnya varchar = java.lang.String, decimal = double, dan integer = int.

3.2. Penilaian Kinerja OGSA-DQP

Dalam suatu makalah dibahas penilaian kinerja dari OGSA-DQP, dibandingkan terhadap operasi basis data menggunakan koneksi JDBC dan OGSA-DAI GDS [8]. Basis data yang digunakan merupakan bagian dari aplikasi bioinformatics, dengan operasi table scan dan table join. Sumber data diolah dalam server basis data MySQL, terpasang pada 2 mesin berbeda yang terhubung melalui jaringan.

Mengingat OGSA-DQP masih dalam tahap penelitian dan pengembangan, sasaran utama dari penilaian bukan tercepat dibanding JDBC maupun OGSA-DAI, mengingat ODP bertujuan membangun infrastrutur Grid yang lebih kompleks. Pada kenyataannya hasil dari OGSA-DQP lebih lambat dari JDBC dan sedikit lebih cepat dari OGSA-DAI. Hasil investigasi melihat pada sisi efisiensi pengerjaan query (waktu yang paling banyak dihabiskan) dan efektivitas paralelisme eksekusi dari sumber daya yang tersebar.

Analisis dari siklus pemrosesan dibagi menjadi 4 bagian:

  1. Biaya akses GDS, yaitu biaya dari penarikan blok tuple dari GDS (lewat GDT port type), dan biaya pemrosesan blok XML. Dinyatakan sebagai TABLE_SCAN.
  2. Biaya transfer data, yaitu saat pengepakan dan pengiriman data dari evaluator tingkat bawah ke tingkat di atasnya. Dinyatakan sebagai EXCHANGE.
  3. Biaya penerjemahan data, yaitu penghitungan saat data diolah di evaluator penerima. Ini berkaitan dengan waktu thread penerima saat pertukaran data (exchange).
  4. Biaya penyampaian, yaitu saat pengiriman blok data dari evaluator induk kepada GDQS. Dalam hal ini berupa panggilan service-to-service menggunakan SOAP dari GQES kepada GDQS.

clip_image012

Gambar 6. Waktu eksekusi pada operasi join query pada JDBC, GDS dan OGSA-DQP.

Penelitian lebih lanjut akan mengamati pengaruh lapisan service berganda antara penyedia basis data dan OGSA-DQP. Penarikan data berupa tuple-tuple dari service yang tersedia dapat dilakukan per blok, menggunakan fungsionalitas block aggregation dari OGSA-DAI, sehingga beban lebih akibat banyaknya lapisan dapat ditekan. Selain itu, pengolahan data dalam bentuk XML (baik data masuk maupun keluar) cukup membebani CPU. Pemecahan hal ini adalah menggunakan format pengolahan data dengan SAX ketimbang DOM XML, yang sudah tersedia di OGSA-DQP 2.0. Di masa mendatang akan diujikan mekanisme penyampaian yang lebih baru dan lebih baik dari OGSA-DAI.

3.3. OGSA-DQP Dinamis dengan DynaSOAr

DynaSOAr merupakan suatu infrastruktur yang mengembangkan WS secara dinamis pada sistem Grid [9]. Kerangka kerja DynaSOAr memandang komputasi Grid sebagai sekumpulan WS yang dibangun secara dinamis ketika dibutuhkan, pada simpul atau sumber daya yang tersedia. DynaSOAr memungkinkan struktur sistem berkembang dinamis pada berbagai tingkat atau kedalaman. Tidak hanya menambah fungsionalitas pada WS, DynaSOAr juga dapat dikembangkan pada lingkungan mesin maya seperti VMWare, Microsoft Virtual PC dan .NET.

Komponen dari DynaSOAr terbagi 2 komponen inti (1, 2) dan 2 komponen tambahan (3, 4):

  1. DynaSOAr Web Service Provider, merupakan entitas di mana pemakai berinteraksi. Ia memberitahukan layanan yang tersedia, menerima pesan berbentuk SOAP dari pemakai yang mengajukan layanan, dan bertanggungjawab dalam menyusun dan mengerjakan permintaan.
  2. Host Provider, bertanggungjawab mengendalikan sumber daya komputasi, seperti cluster atau Grid, di mana service dapat dibangun, dan permintaan pada service dikerjakan. Pesan berbentuk SOAP diterima dari WS Provider dan dikirim balik setelah permintaan dikerjakan.
  3. Registry Service, bertugas menyimpan informasi service yang tersedia pada seluruh simpul. Metadata dari service simpan dalam bentuk triplet RDF.
  4. Service Repository, bertugas mengelola program service, baik upload maupun download.

Saat pesan sampai pada Host Provider, terdapat 2 macam pola interaksi berdasarkan ketersediaan service yang diinginkan:

  • Bila service telah tersedia pada suatu simpul, maka Host Provider menyampaikan permintaan pada simpul tersebut. Informasi ketersediaan dan beban pada simpul-simpul dicatat, sebagai acuan untuk permintaan serupa di waktu selanjutnya.
  • Bila service belum tersedia, Host Provider mengirim pesan pada suatu simpul untuk membangun service yang dibutuhkan. Simpul tersebut lalu mengunduh program yang tersedia pada Service Repository, membuat service, dan mengerjakan permintaan.

Fitur OGSA-DQP dan persyaratan untuk pengerjaan query secara tersebar, merupakan kandidat utama dari penggunaan DynaSOAr. Untuk memungkinkan hal tersebut persyaratan mendasar adalah membuat struktur serupa dengan 4 komponen dari DynaSOAr, yang dalam OGSA-DQP terdapat dalam Grid Distributed Query Services (GDQS). Dengan penambahan kemampuan menganalisa service pada GDQS, berdasarkan kerangka kerja DynaSOAr, service akan dibuat secara dinamis pada simpul-simpul yang sesuai.

clip_image014

Gambar 7. OGSA-DQP dinamis dengan DynaSOAr.

Ketika service baru telah dibangun, informasi ini tersimpan dalam registry, permintaan lain terhadap service yang sama tinggal menggunakan kembali service tersebut. Hal ini menjadi keunggulan penting dari DynaSOAr dibanding job-based pada sistem Grid, yaitu service bertahan setelah pengerjaan tugas selesai, hingga secara eksplisit dihapus atau server tidak tersedia. Filosofi ini dalam DynaSOAr disebut ‘bangun sekali gunakan berkali-kali’ (deploy once user many times).

clip_image016

Gambar 8. Perbandingan OGSA-DQP (remote) dan DynDQP (local).

Percobaan OGSA-DQP dinamis menggunakan DynaSOAr (DynaDQP) pada makalah membandingkan analisa data mendekati data fisiknya (local service) dibanding analisa data melalui query yang disediakan oleh OGSA-DQP (remote service). Hasilnya DynaDQP memiliki kinerja jauh lebih baik dibanding OGSA-DQL, terutama bila sistem Grid tersebar dalam wilayah terpisah dengan beban komunikasi yang tinggi (misalnya bandwidth yang kecil). Dengan demikian DynaDQP, yang mengoptimalkan kerja local service pada data, dapat digunakan lebih lanjut dalam pengembangan OGSA-DQP selanjutnya. Pemodelan biaya sederhana yang ada pada OGSA-DQP, dengan penjadwalan statis, dengan demikian dapat diperbaiki menjadi penjadwalan secara dinamis. Perkembangan lebih lanjut hal ini menjadi topik penelitian tentang adative DQP.

3.4. ISPIDER Menggunakan OGSA-DQP

In Silico Poteome Integrated Data Environment Resource (ISPIDER) adalah suatu proyek yang bertujuan membangun suatu landasan terintegrasi pada sumber daya mengenai proteomics, bioinformatics dan e-Science [10]. Terdapat 2 keuntungan besar dari integrasi ini, yaitu a) akses pada data yang lebih banyak meningkatkan keandalan analisa; b) menggabungkan sumber daya terkait akan meningkatkan keluasan informasi. Demi memenuhi kebutuhan ini dibuat suatu arsitektur sistem yang menggabungkan OGSA-DQP, dan AutoMed.

AutoMed adalah suatu transformasi data dan integrasi sistem yang heterogen, yang menawarkan kemampuan untuk menangani data maya, termaterialisasi, termasuk penggabungan data campuran antar berbagai model data. AutoMed mendukung aras bawah Hypergraph based Data Model (HDM) dan menyediakan fasilitas untuk menentukan bahasa pemodelan (M) tingkat lebih tinggi menurut pengertian pada HDM. Tersedia kumpulan transformasi skema sederhana yang dapat digunakan pada perancangan skema dalam M.

clip_image018

Gambar 9. Penggabungan OGSA-DQP dan AutoMed.

Penggabungan OGSA-DQP dengan AutoMed memungkinkan baik transformasi dan integrasi dari data dan query tersebar pada sistem Grid. AutoMed-DAI mengimpor informasi skema dari suatu sumber data, melalui OGSA-DAI, ke dalam AutoMed Metadata Repository. Fungsionalitas transformasi / integrasi skema dapat digunakan untuk membentuk satu atau lebih skema maya global, berikut transformasi data di antara mereka dan menampilkan skema sumber data. Query yang merujuk skema maya global dikirimkan ke AutoMed-QP, untuk selanjutnya berinteraksi dengan OGSA-DQP dalam melaksanakan query tersebut. Pada akhirnya, AutoMed dan OGSA-DQP menghasilkan suatu kerangka kerja dalam memetakan skema sumber daya data yang beraneka-ragam.

3.5. Pembahasan

OGSA-DQP yang bertujuan melakukan pemrosesan query secara tersebar merupakan tugas yang kompleks, terdiri dari banyak komponen, di atas landasan sistem Grid yang sedang berkembang. OGSA-DQP adalah salah satu dari yang pertama melakukan teknik ini. Pengembangan dan perbaikan akan selalu dilakukan melalui riset dan penelitian lanjutan, yang hasilnya berupa program terbaru dari OGSA-DQP yang tersedia di situsnya.

Dari spesifikasi instalasi OGSA-DQP terlihat digunakannya produk-produk Open Source, mayoritas berbasis Java. Keuntungan dari produk Open Source adalah tersedia source program untuk dikembangkan lebih lanjut oleh banyak pihak. Namun demikian melihat banyaknya program-program terkait yang dibutuhkan, seperti OGSA-DAI, Java, Jakarta Ant Apache Tomcat, Apache Axis, dan Globus Toolkit, membuat proses instalasi menjadi rumit, terdapat begitu banyak file konfigurasi dan rentan terhadap kesalahan ataupun ketidaksesuaian setting. Termasuk pula kebutuhan sistem yang meningkat, misalnya penggunaan Java yang membutuhkan sumber daya komputasi cukup besar.

OGSA-DQP, seperti halnya komponen Grid lainnya, dalam operasinya berorientasi service dan menggunakan bahasa pengolahan standar yaitu XML. Pada sistem Grid yang terdiri dari banyak sumber daya yang heterogen hal ini merupakan suatu upaya untuk melakukan standarisasi dalam penggunaan sumber daya bersama. Namun banyaknya lapisan komponen menimbulkan beban tambahan (overhead) tersendiri, termasuk juga beban pemrosesan berbasis XML. Perlu diupayakan standarisasi yang lebih efisien dan diterima secara umum, yang saat ini sedang berjalan dalam kerangka OGSA-DAI.

Kemampuan OGSA-DQP menjalankan query tersebar dari berbagai basis data yang tersedia, seperti MySQL, MS-SQL, Oracle, dan menjalankan perintah untuk Web Service merupakan suatu keuntungan. Namun melihat laporan hasil uji coba kinerja hal ini belum berjalan secara efisien dan optimal. Kinerja pengerjaan query dari berbagai basis data secara tersebar hasilnya masih berbeda jauh dari query pada satu basis data. Perlu dilakukan optimasi secara mendalam untuk mengatasi hal ini, misalnya blok transfer yang optimal, sifat adaptif terhadap sumber data (seperti di DynaSOAr) dan membuat efisiensi skema global dengan AutoMed.

Perkembangan sistem Grid yang cepat membuat berbagai spesifikasi dan teknologi yang ada merupakan sasaran yang bergerak (moving target). Misalnya OGSA-DQP pada versi-versi awalnya mendukung Object Query Language (OQL), tetapi pada versi terakhir diubah menjadi SQL. Untuk mengakomodasi WSI (misalnya Apache Axis) dan WSRF (misalnya Globus Toolkit), perlu diadakan penyesuaian terhadap OGSA-DQP. Persyaratan dan spesifikasi sistem yang berubah-ubah membuat ketidaksesuaian terhadap publikasi penelitian yang ada, yang menyebabkan kebingungan tersendiri. Di sisi lain dalam tataran global sistem Grid juga mengalami penyesuaian terhadap kebutuhan dan kondisi yang ada, misalnya dalam kerangka OGSA, sehingga penyesuaian harus selalu dilakukan.

Fokus utama dari OGSA-DQP yang menekankan pada efisiensi pengerjaan query secara tersebar ketimbang menyatukan sumber data yang beraneka-ragam, di mana di antaranya perlu penarikan skema dari basis data. Hal ini cocok untuk suatu organisasi yang tersebar, terdefinisi dengan jelas struktur datanya dan tersedia akses yang lengkap. Namun untuk situasi di mana basis data bersifat multi-organisasi dan memiliki otonomi masing-masing, OGSA-DQP tidak sesuai untuk keperluan tersebut.

4. PENUTUP

OGSA-DQP merupakan salah satu upaya untuk melakukan operasi basis data secara tersebar pada sistem Grid. Meskipun belum merupakan suatu sistem yang optimal dari efisiensi pengerjaan dan pengolahan data, tetapi fungsionalitas atas operasi basis data telah memadai, seperti pada aplikasi bioinformatics. Penelitian dan pengembangan OGSA-DQP berjalan dengan baik, seperti update program secara berkelanjutan pada situsnya, disesuaikan terhadap perkembangan teknologi dan spesifikasi pada sistem Grid, terutama dalam konteks OGSA-DAI. Adaptasi lebih lanjut OGSA-DQP menjadi bagian dari OGSA-DAI akan membuatnya diterima secara luas sebagai salah satu alternatif pengoperasian basis data secara tersebar pada sistem Grid.

REFERENSI

  1. Foster I., Kesselman C., Tuecke S., The Anatomy of the Grid: Enabling Scalable Virtual Organizations. International Journal of Supercomputer Applications, 2001.
  2. Ian Foster. What is the Grid? A Three Point Checklist. Argonne National Laboratory & University of Chicago, 2002.
  3. Global Grid Forum. The Open Grid Services Architecture, Version 1.0. 2005.
  4. Foster, Kesselman, Nick, Tuecke. The Physiology of the Grid: An Open Grid Services Architecture for Distributed Systems Integration. 2002.
  5. Jim Smith, Anatasios Gounaris, Paul Watson, Norman W. Patton, Alvaro A. A. Fernandes, Rizos Sakellariou. Distributed Query Processing on the Grid. International Journal of High Performance Computing Applications 17, 2003.
  6. M. Antonioletti, M. Atkinson, et all. The design and implementation of Grid database services in OGSA-DAI. Concurrency and Computation: Practice and Experience, Volume 17, Issue 2-4, Feb 2005.
  7. M. Nedim Alpdemir et al. OGS-DQP: A Service Based Distributed Query Processor for the Grid. Proceedings of UK e-Science All Hands Meeting Nottingham, 2003.
  8. N. Alpdemir, A. Gounaris, A. Mukherjee, D. Fitzgerald, N. Paton, P. Watson, A. Fernandes, and J. Smith, “Experience on Performance Evaluation with OGSA-DQP,” in All Hands Meeting, 2005.
  9. Arijit Mukherjee, Paul Watson. Adding Dynamism to OGSA-DQP: Incorporating the DynaSOAr Framework in Distributed Query Processing. Euro-Par 2006 Workshop, 2006.
  10. Lucas Zamboulis, Hao Fan, et al.. Data Access and Integration in the SPIDER Proteomics Grids. Data Integration for the Life Sciences (DILS) 2006.

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s