Highly compressed. Itulah yang sering kali kita temui di internet. Semua heran, bagaimana bisa file sebesar sekian gigabyte itu bisa menjadi hanya sekian megabyte? Yang lebih mengherankan lagi, format filenya hanya ZIP atau 7z. Kalau formatnya KGB sih, wajar. :D
Belum banyak yang tahu jika sebagian besar file seperti itu adalah 'FAKE', 'HOAX, 'PALSU', atau apalah. Lagipula, algoritma kompresi biasa manapun tidak bisa dimanipulasi untuk mencapai rasio kompresi ‘super tinggi’. Jadi kemungkinan besar, file-nya lah yang dimodifikasi oleh oknum nakal yang sekedar mencari rating di internet.
Algoritma dasar dari sebuah software archiver adalah mengelompokkan data yang sama menjadi data yang lebih pendek. Misalnya data seperti berikut ini..
Data yang memiliki banyak deretan sama lebih mudah dikompresi. Contohnya saja di atas, data sebesar 13 byte, bisa dikompres menjadi 6 byte. Begitupun berlaku sebaliknya, data yang memiliki banyak nilai acak sangat sulit dikompresi dengan algoritma manapun. Contohnya saja, file MP3 dan gambar. Bagaimana dengan teks? Pernah coba mengompres file yang berisikan teks? Jika pernah, maka anda melihat bahwa file tersebut memiliki rasio yang tinggi. Ini karena teks memiliki susunan bit yang mudah ditebak, sehingga lebih efektif untuk dikompres. Salah satu algoritma yang efektif untuk mengompres teks adalah ‘huffman’.
Kita ambil contoh sebuah gambar berukuran 344 KB. Lihatlah, betapa banyaknya data yang berderetan secara acak. Dan, sampel kedua berupa bilangan yang penuh dengan deretan 00 berukuran lebih dari 209 MB. Untuk, membuktikan efektifitas kompresi teks, saya juga menyertakan sampel teks acak berukuran 111 KB.
Ingin tahu, apa yang terjadi setelah saya kompres menjadi ZIP?
Wow, amazing…
Jadi, sekarang anda tahu kan apa yang dilakukan oleh oknum itu sekarang? :v
Ini file yang sudah saya kompres, coba extract dan lihat sendiri hasilnya..
0 comments