Diary of Sacred Fox - November 04, 2001

The Quintetには通算 179067 人(今日:0, 昨日:1)のお客様が来場しています

2001/11/04

いろいろ考える

このWebは実は旧用語集など1用語につき1ファイル使用していた細かいファイルがいっぱいなので1ファイルあたりの最低容量が結構大きいFAT管理人がデータを運搬するのに用いているメディアMOに書くとこれは執筆時点の値, 2002/11現在は7.5MB(日記の量がかなり増えているが)に収まっている8MBを超えていたりする(CGI化などの結果, 2002/11現在1.5MB実質の中身は1.7MB程度)
これを圧縮してみたらどのくらい小さくなるのか興味を持ったので実験してみることにした

これが無い実験ノートは大きく減点されるらしい実験目的: 執筆時点で管理人が所有していたLHMeltingと言うアーカイバが圧縮に対応していた形式LHA, ZIP, CAB, TARの各形式の圧縮率の差を調べる

実験条件

LHAはlh5, lh6, lh7の混在を許す解析圧縮モード
ZIPはWinZipで最高圧縮率を設定
CABはLZX形式でレベルは最大
TARはGZIP方式でレベルは最大
つまり出来る限り高圧縮率をはじき出すように設定した
圧縮するファイルはこの文を書く直前のThe Quintet全体
(html以外のファイルや隠しドキュメント含む)

結果(とこれにばっかり凝ってしまう管理人は実験のパートナーに迷惑をかけ続けている追実験)

LHAとZIPは約900KBまで圧縮した
CABは約620KBと最高の圧縮率を見せた
一般にCABは圧縮が遅いとされているがLZHやZIPも最高圧縮に設定しているためかたいした違いは感じられなかった
特筆すべきはTAR(.tar.gzと同義…だったはずTGZ)である
圧縮後のサイズは約690KBと結構いい線に行っているうえに圧縮が今までのに比べて結構早かった, でも数秒はかかっている一瞬で終わってしまった
管理人はエラーでも起こったのかと思い試しに別の場所に展開してみたが全く正常である
おそるべしTGZ
速さの原因は分からないが圧縮率の高さの原因は一旦無圧縮のTAR書庫に結合してからGZIP圧縮をかけている点にあるのだろう
そこでLHA, ZIPについて2重圧縮を行ってみた
LHAは何の努力もなしにlh0(無圧縮)として終了
ZIPはなんとか930KB→885KBに落としただけ
やはり圧縮してからの2重圧縮は効果がないのだろう
そこで無圧縮のTARを作ってそれを各形式に圧縮するとどうなるか実験してみた
無圧縮TARを作った時点でのファイルサイズは約2MB(ファイルの位置情報等を含むため飛躍的にファイルは大きくなる)
それを各圧縮形式で圧縮した結果は…

今度は圧縮方式の優秀さが直に出た形となった
やっぱりCABの圧縮率はいいのである
(TGZのファイルサイズが微妙にずれているのは最初の実験では1KB=1000bytesの近似を行った後10KB単位で四捨五入をしている管理人の怠慢からのもの,実際にはファイルサイズは同じ)

思ったより楽しい実験になったがとても容量を食ってしまうな…製作日記をUPするたびい笛続けてきた脚注ファイルのこと, 一応一掃したのだが…この文も…

Comments (0):