付帯情報を失った大量の画像データは何の意味も持たない
ツイート
壊れてしまったHDDは物理的にどうにもならないので、以前バックアップを取っていたHDDにファイル救出ソフトをかけて、jpegデータを丸々抜き出してみました。そしたら日付もファイル名も失った90000枚強のjpegファイルが出てきました。
試しにプレビューで開いてみると、それは過去のブラウザのキャッシュだったり、何かのアプリのヘルプ画面のような画像だったり、自分がブログに貼り付けようとしてキャプチャした小さな画像だったりして、完全に収拾がつきません。何かの条件づけでソートできないものかと試行錯誤しましたが、根本的に、ファイル名は全てただの数字の連番、フォルダ分けもされておらず、日付は全て今日。ファイルサイズも、240*180ピクセルなのに20Mもあるような壊れた画像が大量に混じってしまっていて、画像そのもの以外に個々のファイルを識別できる要素は完全に失われていました。
で、いくつか開いて、無関係の画像を手作業で消してみようかと思ったのですが、1時間かかって最初の10000枚を荒く選り分けたところで、これは完全に徒労だと思い、諦めました。
最初は何とかなりそうな気もしたのですが、残す側のファイル、例えば旅行の風景なんかの同じ写真が、繰り返し繰り返し何度も出てきて、並び方もランダムだし画像サイズも数種類あって、一枚ずつ開かないと確認できなかったり、iPodやMacの開封写真なんかも、小さなプレビュー画面では、ブラウザのキャッシュなのか僕が撮影した写真なのか判別できなかったり、とにかく画像データは、何らかのタグ情報が付帯して初めてデータとして生きるのだと改めて考えさせられました。
画像検索は、近い将来実用化されてくると思うのですが、画像に付帯させる有効なタグ情報とか、効率良く画像にタグを付けてくれるツールなんかも、まだまだ開発の余地があるんじゃないかな、と思いました。
GPSなんかは、近いうちに全てのデジカメに標準装備されるような気がします。あるいは、撮影時、もしくはPCへの取り込み時に画像を解析して、人物か風景か、室内か屋外か、室内だったらなんという建物か、とか、同じ人物が映っている画像に同じタグを付けるみたいな事はできるような気がします。
タグといえば、漫画なんかはネットで配信する時はDRMで課金するのが主流だけど、なんか広告効果があるようなタグを付けて、その漫画を読んだら、その画像に付いているタグがどこかにキャッシュされて、その後ネットで見る広告に反映させるようなシステムができて、漫画をネットで無料で配信できたりするといいかなあと思います。まあ、別に漫画じゃなくても何でもそうですが。
試しにプレビューで開いてみると、それは過去のブラウザのキャッシュだったり、何かのアプリのヘルプ画面のような画像だったり、自分がブログに貼り付けようとしてキャプチャした小さな画像だったりして、完全に収拾がつきません。何かの条件づけでソートできないものかと試行錯誤しましたが、根本的に、ファイル名は全てただの数字の連番、フォルダ分けもされておらず、日付は全て今日。ファイルサイズも、240*180ピクセルなのに20Mもあるような壊れた画像が大量に混じってしまっていて、画像そのもの以外に個々のファイルを識別できる要素は完全に失われていました。
で、いくつか開いて、無関係の画像を手作業で消してみようかと思ったのですが、1時間かかって最初の10000枚を荒く選り分けたところで、これは完全に徒労だと思い、諦めました。
最初は何とかなりそうな気もしたのですが、残す側のファイル、例えば旅行の風景なんかの同じ写真が、繰り返し繰り返し何度も出てきて、並び方もランダムだし画像サイズも数種類あって、一枚ずつ開かないと確認できなかったり、iPodやMacの開封写真なんかも、小さなプレビュー画面では、ブラウザのキャッシュなのか僕が撮影した写真なのか判別できなかったり、とにかく画像データは、何らかのタグ情報が付帯して初めてデータとして生きるのだと改めて考えさせられました。
画像検索は、近い将来実用化されてくると思うのですが、画像に付帯させる有効なタグ情報とか、効率良く画像にタグを付けてくれるツールなんかも、まだまだ開発の余地があるんじゃないかな、と思いました。
GPSなんかは、近いうちに全てのデジカメに標準装備されるような気がします。あるいは、撮影時、もしくはPCへの取り込み時に画像を解析して、人物か風景か、室内か屋外か、室内だったらなんという建物か、とか、同じ人物が映っている画像に同じタグを付けるみたいな事はできるような気がします。
タグといえば、漫画なんかはネットで配信する時はDRMで課金するのが主流だけど、なんか広告効果があるようなタグを付けて、その漫画を読んだら、その画像に付いているタグがどこかにキャッシュされて、その後ネットで見る広告に反映させるようなシステムができて、漫画をネットで無料で配信できたりするといいかなあと思います。まあ、別に漫画じゃなくても何でもそうですが。
- 関連記事
-
- AppleTV分解 (2007/04/22)
- 付帯情報を失った大量の画像データは何の意味も持たない (2007/04/20)
- 泥縄バックアップ (2007/04/19)
スポンサーサイト
コメントの投稿
デジカメで撮ったJPEGなら、exifは残っているような気が。
自分は
フリーウェアで同一ファイルの削除→
種類別に振り分け→容量や画面サイズや削除
等、で切り抜けました。
復帰時の連番は、復帰ソフトの物にも依りますが
基本的に並びは名前順とかと変わってなかったりします。
お役に立てれば光栄ですが。
フリーウェアで同一ファイルの削除→
種類別に振り分け→容量や画面サイズや削除
等、で切り抜けました。
復帰時の連番は、復帰ソフトの物にも依りますが
基本的に並びは名前順とかと変わってなかったりします。
お役に立てれば光栄ですが。
いや、断片化したファイルの継ぎはぎなので、240*180ピクセルで20kのファイルもあれば20Mのファイルもあったりして(これは表示はされるけどファイルとしては壊れているのだと思う)、付帯した情報は全部消えているみたいです。
そんなわけで、種別に振り分ける事も、ファイルサイズや画像サイズで振り分ける事も不可能です。復旧時に日付順になってくれたりしていると助かるのですが、日付もバラバラですし、同じ写真だけどファイルサイズがちょっとずつ違うのが数十種類あったりして、手の付けようがないですね。まあ、手作業でこつこつやるしかないです。
そんなわけで、種別に振り分ける事も、ファイルサイズや画像サイズで振り分ける事も不可能です。復旧時に日付順になってくれたりしていると助かるのですが、日付もバラバラですし、同じ写真だけどファイルサイズがちょっとずつ違うのが数十種類あったりして、手の付けようがないですね。まあ、手作業でこつこつやるしかないです。
毎回災難に遭われ、なんと申してよいものやら…‥
え、と。
exif情報でしたら、別ファイルで無くjpegファイル自身の中に在るはずですので、
画像として正常に表示出来る未編集ファイルでしたら読み出せるかと思います。
断片化して壊れていたり、編集してexifが無くなっているファイルは無理でしょうけれど。
具体的にどのアプリがexifを上手く抜き出して整理に役立つかは存じませんが。
それと、以前富士通辺りで画像の類似度で整理してくれるアプリが在りました。
名前を思い出せないので、ぬか喜び情報ですけれど。
画像サイズ(ピクセル数)に関わらず、似た画像を近くに配置する(表現しにくいです)
画像ビューワの一種だったと思います。
それと同一ファイルの整理でしたらUNDUPと言うアプリが便利かと思います。
え、と。
exif情報でしたら、別ファイルで無くjpegファイル自身の中に在るはずですので、
画像として正常に表示出来る未編集ファイルでしたら読み出せるかと思います。
断片化して壊れていたり、編集してexifが無くなっているファイルは無理でしょうけれど。
具体的にどのアプリがexifを上手く抜き出して整理に役立つかは存じませんが。
それと、以前富士通辺りで画像の類似度で整理してくれるアプリが在りました。
名前を思い出せないので、ぬか喜び情報ですけれど。
画像サイズ(ピクセル数)に関わらず、似た画像を近くに配置する(表現しにくいです)
画像ビューワの一種だったと思います。
それと同一ファイルの整理でしたらUNDUPと言うアプリが便利かと思います。
いや、exifについては一応理解しています。僕が言っているのは、HDDは完全に破損してもうマウントもできないので、少し前に消去してしまったバックアップHDDの消えてしまったデータを復元したら、ほとんどのデータからexif情報が消えてしまっていてどうにもならない、という話です。
で、きれいに修復できるわけではないので、全く同じ画像データでもファイルサイズがちょっとずつ違う、少しずつゴミのついた同じ写真が数十枚あって、ファイル名も日付も消えてしまっているのでソートができないんです。
まあ、今AppleTVをばらしてHDDからデータを抜いてきたので、こちらはファイル名は書き変わってしまっていますがexifは残っているので、一部のデータは復元できそうです。
で、きれいに修復できるわけではないので、全く同じ画像データでもファイルサイズがちょっとずつ違う、少しずつゴミのついた同じ写真が数十枚あって、ファイル名も日付も消えてしまっているのでソートができないんです。
まあ、今AppleTVをばらしてHDDからデータを抜いてきたので、こちらはファイル名は書き変わってしまっていますがexifは残っているので、一部のデータは復元できそうです。
みよう絵
状況がよ~く分かりました。
復旧(出来た)ファイルが、きちんと成っているのではなく、クラスタ単位で
画像ファイル風?に疑似復元されている(モノが多い)のですね。
おまけにexifの有る画像が(比較的)少ないと。
先に書いた類似度で表示するアプリは「みよう絵」でした。
現バージョンではexifも参照するようです。
先の投稿ではお騒がせ致しました。
復旧(出来た)ファイルが、きちんと成っているのではなく、クラスタ単位で
画像ファイル風?に疑似復元されている(モノが多い)のですね。
おまけにexifの有る画像が(比較的)少ないと。
先に書いた類似度で表示するアプリは「みよう絵」でした。
現バージョンではexifも参照するようです。
先の投稿ではお騒がせ致しました。
http://www.vector.co.jp/magazine/softnews/010224/n0102241.html
みよう絵
画像の類似度に従ってサムネイルを立体的に並べ替えてくれる“3次元画像ブラウザ”
みよう絵
画像の類似度に従ってサムネイルを立体的に並べ替えてくれる“3次元画像ブラウザ”