この日記のあるサーバに入って
$ file diary/*
とやってみた
殆どの日記が『UTF-8 Unicode text, with CRLF line terminators』と, 内部的には, (古いのはまとめたりしているけど, )基本的に1記事1ファイル, plain text実態に合ったファイルタイプを返してくれたのだが, 別物と判断されたものがちらほら, リンクはそのデータに対応する日記, 偶然にも全て1日に2つ書いた記事の2つ目が引っかかっている
- UTF-8 Unicode English text, with CRLF line terminators
日本語が混じってるように見えるんだけどなぁ
- UTF-8 Unicode text, with very long lines, with CRLF line terminators
悪かったね(やつあたりぎみに)
そんな判定までしているのかと驚いてみる
(注記) 本文を見るとあまり長くは無い様に見えるが, 1行にtitle属性のついた<a>タグが3つも連続しているところがあるのでそこが引っかかったのかと
- DOS executable (COM)
ということで, COMファイルのヘッダってどんなものかと思ってWikipediaを漁ってみた, 要するにメモリイメージそのままなのね, あっさりしすぎていて清々しい
で, 共通点は最初のバイトが『e9』であること, これはx86のjmp命令に相当していて, 最初の命令がjmpというのはCOMファイルによくある形なのでこのようにCOMファイルと判断されたということらしい
因みに元のファイルに日付情報を付加しただけで, やはりplain text複数の日記をまとめたファイルは, 『Bennet Yee's "face" format』と判定された, これが何なのかは調べてもよく分からなかった, どうせ冒頭に登場するデリミタの"!!"が引っかかったのだろう
(追記)ついでに過去日記の記述を一部修正したらRSSの天辺に這い出てきてしまったので先頭だけでも復帰させるために空更新