Pemerintah Telah Siap Melakukan Filtering

A> addicted, bisa dilimitasi, kalau perlu dieliminasi manual, wong toh
A> ngelacaknya gampang karena jumlahnya tidak sebanyak yang umum.
A> Kita lakukan mana yang efektif saja dulu. Begitu.

image Saya sepakat dengan anda, yaitu perlu usaha memadai dari pemerintah untuk melakukan upaya menjamin kebebasan informasi yang sehat. Bila ada payung hukum untuk melakukan suatu hal, mengapa tidak? Bagi yang merasa keberatan, lakukan juga secara hukum, misalnya mengadakan ‘class action’ atau menggugat ke PTUN.

Melakukan filtering mendekati ideal jelas bukan hal mudah, namun juga bukan alasan untuk tidak melakukannya. Salah satu pendekatan bisa juga dengan melakukan filter dengan transparent proxy, mengingat beberapa ISP sudah memiliki proxy ini, hanya tidak mencegat secara default. Tentu didukung dengan redirect port-port tertentu yang ditenggarai sebagai proxy (meminimalkan jalur web dibelokkan).

Bila kita melihat software antispam, di sana sudah cukup modern dalam melakukan classification, hingga mampu membedakan mana yang spam mana yang bukan. Ini sudah menggunakan teknik-teknik yang lazim digunakan di Artificial Intellegence (AI), terutama dalam topik Machine Learning atau Data Mining. Bila digunakan dalih tidak mungkin, Gmail atau Yahoo boleh jadi selalu bulan-bulanan dengan spam.

Saya lihat para periset juga mulai melakukan pendekatan AI ini terhadap citra / image, misalnya mendeteksi obyek tertentu (seperti muka). Bisa dicari via Google dengan kata ‘OpenCV’. Suatu hari nanti suatu gambar bisa dikenali atau tidak sebagai pornografi oleh mesin dan dapat dilakukan tindakan yang seharusnya.

a> ngomong apa-apa🙂 kecuali anda-anda bisa menunjukkan semacam
a> whitepaper mengenai antispam  di yahoo/gmail, yang mungkin bisa
a> diimplementasikan untuk content filtering web (me-Nasional), yang

Barangkali URL berikut bisa membantu (termasuk komentar-komentarnya):
http://googlesystem.blogspot.com/2007/10/how-gmail-blocks-spam.html.

Bila anda cermati, baik Google, Yahoo, dll, yang memiliki fasilitas ‘identify as spam’ itu sudah menggunakan teknik-teknik AI. Penjelasan lebih lanjut silakan buka buku-buku tentang AI, DM, ML, NN, dst. Terkait whitepaper dsb, tentu adalah internal mereka dan tidak dirilis ke publik.

Produk-produk open source juga ada yang menggunakan teknik ini, misalnya dengan ‘bayesian spam filtering’. Whitepaper / URL tentang ini silakan cari di Google.

S> capek deh… coba dong baca titlenya Pak Taka…:
S> Bill Gates says Internet censorship won’t work

Orang yang sama pernah bicara begini (dan sangat populer): "640K ought to be enough for anybody."

Terkait apa yang dilakukan Menkominfo, ternyata membuka mata kita bahwa apa yang dilakukan tersebut telah jauh-jauh hari dipraktekkan negara-negara lain. Mulai dari China, Singapore, USA, Perancis, hingga Australia. Studi kasus beberapa negara ada di sini: http://opennet.net/. Misalnya untuk China: "China’s Internet filtering regime is the most sophisticated effort of its kind in the world. Compared to similar efforts in other states, China’s filtering regime is pervasive, sophisticated, and effective."

Di Australia, "ISPs have been required to make one or more "scheduled" filtering products available to their customers", URL: http://www.efa.org.au/Issues/Censor/cens2.html. Untuk Indonesia, berhubung ISP di sini bagaikan ‘kerbau dicucuk hidungnya’, koordinasi teknis yang intensif antara Depkominfo dan ISP sangat diperlukan.

Tentu content filtering memiliki sisi pro dan kontra, kutipan berikut cukup baik sebagai bahan pemikiran: "Anti-censorship advocates insist on waging war on all forms of content filtering; but if people have the right to publish WHATEVER they want on the internet – the same internet that my children use for studying and staying in touch with their friends – then I do reclaim the right for my children to surf the web safely.", http://www.radiance.m6.net/.

a> lah .. skrg saya yang dibilang membandingkan filtering web pakai
a> model filtersing spam gmail/yahoo .. hi..hi..

Web filtering yang kita bicarakan berawal dari pemblokiran terhadap Fitna dan terkait (payung hukum lainnya) UU ITE. Jadi saya jelaskan berulang-ulang kealpaan anda atas kalimat "biarkan pengguna yang memutuskan!". Yang benar adalah *dilarang/diblok* bukan *dipilih*.

a> sekali lagi ini konteksnya web: seleksi/filtering konten secara
a> heuristik, digabung dengan username/password, itu sama dengan
a> mimpi. saya sudah sebutkan mengapa ini tidak mungkin di email saya

Sulit berdiskusi bila dalam pikiran anda adalah non-sense, mustahil, mimpi, dst, ibarat palu yang melihat pemikiran lain sebagai paku.

Sebagai contoh dan bukan mimpi, silakan cek PureSight, "PureSight for WinGate is a content recognition system that scans incoming traffic for inappropriate content. Using an artificial intelligence technology from Icognito, PureSight for WinGate gives administrators the ability to block sites that contain references to sex or gambling, based on level of certainty that the page being accessed contains such content." http://www.ccsoftware.ca/wingate/content_filter/.

image

Contoh web content filtering yang berbasis OSS adalah POESIA, http://www.poesia-filter.org/, dan DansGuardian http://dansguardian.org/. Seleksi bukan sekedar heuristik (DansGuardian), tapi bisa berupa AI (POESIA). Dibaca langsung dari situs yang bersangkutan agar jelas.

a> spam filter di yahoo.com/gmail.com itu kurang lebih untuk satu
a> message  diterima, diproses, dan diputuskan apakah itu spam atau
a> bukan (kata kunci:  seluruh message). ide mengenai pemberian
a> password untuk manula untuk  mengakses situs-situs tertentu,
a> tentunya hanya melihat URL _saja_. jadi,  kembali soal penerapan,
a> yang katanya pakai AI (ini mesti tanya ke google/yahoo),  tidak bisa
a> dilakukan karena message belum didownload, bahkan connected ke
a> situs tujuan saja belum. ini menurut spec protokol http.

Saya kutipkan kalimat di atas secara utuh agar terbaca lengkap. Ada kata kunci yang hilang di situ: proxy, alias monkey in the middle. User request URL via (transparent) proxy, ditahan, didownload, diseleksi, direject / redirect bila perlu. URL memang langkah awal pemfilteran, database URL ini bisa dibangun secara pasif berdasar permintaan user, atau aktif dengan web-crawler. Tidak ada hal yang tidak bisa di sini.

a> itu soal mail filtering. Anda sepertinya enggan meng-grab the
a> whole picture, saya jadi kesulitan berdiskusi dengan anda.

Saya cukup mengerti masalahnya, prakteknya saya sendiri menggunakan mail filtering (bayessian filter) sebagai anti-spam di kantor. Bagaimana bila saya balik, andaikan web filtering dengan AI memungkinkan "biarkan pengguna yang memutuskan!", apakah ini sesuai dengan payung hukum yang saya sebut? Misalnya saya membuka situs yang masuk daftar hitam, lalu muncul peringatan "Situs ini tidak dapat diakses. Silakan buka melalui URL berikut untuk melanjutkan". Lalu apa gunanya filter?

a> Itu adalah komentar saya untuk pendapat anda bahwa: "user/pass
a> bisa dipakai untuk ‘mengemulasikan’ bulk/spam folder". Ini saya
a> yang salah atau anda yang (sengaja?) mengubah-ubah alur diskusi?

Lho, anda khan bilang "… itu sama dengan mimpi. saya sudah sebutkan mengapa ini tidak mungkin di email saya sebelumnya." Maka dari itu saya kutip secara utuh agar jelas. Dari situ saya dapatkan "… tidak bisa dilakukan karena message belum didownload, bahkan connected ke situs tujuan saja belum. ini menurut spec protokol http." Saya jadi bertanya-tanya, apakah anda benar-benar mengerti cara kerja proxy?

a> Makanya saya mengundang siapa saja yang berminat mengangkat
a> buzzword ‘artificial intelegent’ untuk ‘content filtering’. Tapi
a> berdiskusi dengan anda terlanjur membuat saya capek. Lagi pula

Sebenarnya hal-hal yang menjadi keberatan anda sudah terakomodasi dengan baik, misalnya ‘false positive’, dengan redirect ke proxy terbatas. Ini hanya masalah threshold saja, yaitu bila tingkat keyakinan rendah dan menghindari salah blokir. Barangkali tingkat pemahaman kita berbeda.

Mengenai AI, hal ini memang sedang saya pelajari. Tampaknya itu menjadi masa depan kita semua, di mana komputer bisa belajar menjadi manusia. Bila berminat, coba anda buka misalnya ‘OpenCV’ (Computer Vision). Dengan memberikan contoh 2000 wajah, software tersebut mampu mengenali bentuk-bentuk wajah menusia. Memang akurasinya belum sesuai harapan, tergantung juga posisi wajahnya.

Dalam UU ITE juga dinyatakan, informasi dalam bentuk elektronis sebagai alat bukti hukum yang sah. Prakteknya, seperti dalam transaksi kartu kredit via telpon, rekaman suara sudah dianggap suatu bukti. Nah, apakah sudah ada software yang bisa membuktikan kemiripan suatu suara? Manusia memang ‘mudah’ saja mengenali itu suara siapa, tapi tingkat subyektivitasnya juga tinggi. Ini contoh lain tantangan dalam bidang AI.

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s