YES-ONLINE SPECIAL
 ネコちゃん
   ウォッチング
 花火ウォッチング
 桜ウォッチング
 イベント
  ウォッチング
 夢の充電器
  開発プロジェクト

電池活用技術研究会
 公開資料室
 電子工作室
 研究室(会員専用)

電子ファイリングの基礎知識

電子ファイリングって何のこと?

 紙の文書を文房具店で買ってきた各種のファイルに綴じて整理・保管することを、ファイリングと呼びます。

ハードディスクの威力!

 初期のハードディスクの容量は10MB〜100MB程度でしたが、今では20GB〜1000GBと10000倍の容量に達しています。80GBのハードディスクを例に、コピー用紙何枚分のデータが入るか計算してみましょう。
 A4サイズページを白黒でスキャナ入力し、圧縮すると、50KB〜500KB程度になります。200KB(小さな文字が多い場合)と仮定すると、約40万ページです。

 

コピー用紙

ハードディスク

数量

 500枚入×
 800冊


 80GB×
 1台

重量

 2Kg×800
  =
1600Kg
 600g×1
  =
0.6Kg

積み上げると

 4.5cm×800
  =
36m
 2.5cm×1
  =
2.5cm

価格

 500×800
  =
400,000円
 15,000×1
  =
15,000円

比較

 重量2666倍
 高さ1440倍
 
←こんな
 感じね
 新聞等を全部この方式で保管すると、大きな倉庫が一杯になってしまいますから、新聞社や図書館ではマイクロフィルムというものが使われています。特殊な高解像度の白黒フィルムで紙面や書籍を撮影して、小さなフィルムに保管する方式です。

 コンピュータ時代の今は、イメージスキャナ↓という便利な道具が有ります。

←ADF付フラットベッド型スキャナの例

ADF:
自動原稿
給紙装置

 FAXの原稿読み取り部分も、イメージスキャナの一種ですが、シートフィーダー型と呼ばれるタイプです。シートフィーダー型は複数ページを連続して読み取れますが、書籍はそのままでは読み取れません。
 フラットベッド型スキャナはその逆の特徴を持ちます。ADF付の場合は、両方の利点を兼ね備えます。
 以前は低価格機ではUSB(1.0)接続、高級機ではSCSI接続が使われていま したが、今はUSBの高速版USB2.0接続が主流です。

 イメージスキャナを使うと、紙の文書を読み取って、コンピュータの中の記憶装置(ハードディスクやCD-R)にデジタルデータとして保存することが出来ます。必要なときにはプリンタで印刷して紙に戻すことも出来ます。このようにしてコンピュータを使って、文書を保管・管理することを電子ファイリングと呼びます。
 雑誌や新聞の記事のページの一部分を選択して保存する場合は、記事を切り抜いて貼り付けるスクラップブックにちなんで、電子スクラップと呼んでいますが、電子ファイリングの一種です。

単位の説明

DPI

dot per inch の略
1inch当たりのドット数
1inch(インチ)=25.4mmm

 イメージスキャナ(あるいは画像データ)の解像度を現します。
 通常の印刷文書は、300DPIの解像度でスキャナ入力すると細かい文字まで読み取れます。

pixel

ピクセル

画素数の単位(dotとほぼ同じ意味)

 DPIの代わりに、PPIが使われることがありますが、同じ意味です。

bit

ビット

2進法の桁数の単位

 コンピュータの内部回路は0と1の組み合わせで全ての数値を表現する2進法で動作しています。そのために基本的な単位として、bitを使用します。1bitのメモリ(記憶装置)では、0と1の2つの値を記憶できます。

byte
BYTE

バイト

1byte=8bit
8bitで10進法の0〜255を表現できる

 コンピュータのメモリは一般的に8bit単位で読み書きします。そこで8bitをbyteという単位で現します。英語の基本的な文字は、1文字を7〜8bitで表現出来ますから、byteは文字数の単位にもなります。日本語は文字の種類が多いので、2byteで1文字を現します。

KB

キロ
バイト

1KB=1024BYTE
K=2の10乗=1024(10進法)
         =10000000000(2進法)

 コンピュータは2進法なので、
K=1000ではなく1024が使われます。
 フロッピーディスクの記憶容量は、720KB、1440KB等の種類が有ります。

MB

メガ
バイト

1MB=1024KB=1048576BYTE

 コンピュータのメモリ容量やCD-R(CD-RW)の記憶容量の単位として使われています。CD-R1枚は、約650MBの記憶容量です。
 A4サイズの文書を300DPI(白黒)でスキャナ入力すると約1MBの容量になります(圧縮すると100KB程度)。

GB

ギガ
バイト

1GB=1024MB=1048576KB

 ハードディスクやDVD-RAM(DVD-R)の記憶容量の単位として使われています。DVD-RAM1枚は、約4.7GBの記憶容量です。最新のハードディスクは80GB程度の容量がありますから、A4サイズの文書を8万〜80万ページ格納出来ます。

TB

テラ
バイト

1TB=1024GB=1048576MB

 今はまだほとんど使われていない単位ですが、将来はハードディスクの記憶容量の単位として使われるようになるでしょう。

注意:
ハードディスク等の記憶容量は、
K=1000(M=1000K,G=1000M)で計算して表示しているメーカーもあります(容量が大きく見えるため)。

電子ファイリングの効果

 紙の文書をそのままファイリングして保管すると、大きな書棚あるいは保管庫が必要です。
 もう一つ困るのが、必要な書類を探し出すのに非常に労力を要することです。
 しかも大量の文書を扱う場合は、手元に置き場所の無くなった古い文書はダンボール箱に入れて倉庫にしまいこむことになりますから、古い文書が必要になったときに大変な苦労をすることになります。

 電子ファイリングなら、ハードディスク(略称HD)一台の中に膨大な文書を格納することが出来ますから、保管スペースが激減するだけでなく、探し出すのもパソコンの前に座ったまま簡単に行えます。

ハードディスクの安全使用法

 ハードディスクは、固定ディスクとも呼ばれ、データを記録する磁性体(メディア)が密封容器に格納されています。埃が入らないので基本的には信頼性が高いのですが、長時間連続使用するので結果的に寿命が短くなります。

 パソコン本体には通常、安価なIDE(最近はSATA)接続のハードディスクが内蔵されています。プログラムとデータを1台の内蔵ハードディスクに一緒に格納すると、プログラムが暴走したときにデータが壊れる危険性が大きくなります。
 パソコン本体に2台目のハードディスクを増設することも出来ますが、発熱が増えてパソコン本体の温度が上がり故障し易くなります。
 そこで、外付けハードディスクを増設して、データ保存専用に使用すると、データの安全性が高くなります(パソコン本体が故障してもデータが無事に残る可能性が高くなります)。

データのバックアップ

 記憶媒体(メディア)が交換出来ないハードディスクに対して、交換出来る装置を、リムーバルディスクと呼びます。記憶媒体と駆動装置を区別するために、駆動装置の方は○○ディスクドライブと呼びます。

 電子ファイリングは利点だらけのようですが、欠点も有ります。それは、ハードディスクが故障した時に、全てのデータが失われる危険性が有るということ(便利さの反面)です。紙のファイリングなら、汚れたりしてもそのページが読めなくなるだけですから、特別重要な文書は印刷した上で、紙の形でも保存しておくというのも一つの安全手段です。
 通常は、CD-RやDVD-R等のリムーバルディスクに、定期的にハードディスクの全データをコピーして保存しておきます。この作業をデータのバックアップと呼びます。
 最近はハードディスクが安価になったので、予備の外付けハードディスクを接続してバックアップ用とする方法もあります。この方法が最も簡単で、高速に実行出来ます。

リムーバルディスクの種類

FD

フロッピー
ディスク

 720KB
 1.2MB
 1.44MB

Zip

ジップ
ディスク

 100MB
 250MB

MO

光磁気
ディスク

 128MB
 230MB
 640MB
 1.3GB
 2.3GB

CD-R
CD-RW
DVD-R
DVD-RW

CD-R/RW
 650MB
 700MB

DVD-R/RW
 4.7GB

データの種類

 ワープロソフトで作成した文書は文字コードを格納しているのでテキストデータ、イメージスキャナで読み込んだ文書はイメージ(画像)を格納しているのでイメージデータ(画像データ)と呼びます。イメージデータを分析してテキストデータに変換するソフトはOCRソフトと呼びます。OCRソフトを使用すると、データサイズを激減することが出来ますが、誤変換部分を手作業で修正する必要が有るので、非常に手間がかかります。大量の文書を電子ファイリングする場合は、イメージデータのまま格納する方法が適しています。

 電子ファイリングでは、デジタルカメラによる写真撮影の場合のフルカラーデータ(1pixel当たり24bit)と違って、白黒2値画像(1pixel当たり1bit)のデータが基本になります。フルカラーデータで文書を保存するとデータサイズが大きくなりすぎて実用的ではないからです。
 白黒2値画像であっても、ハーフトーンモード(細かいドットの密度の大小で濃淡を表現する方法)を使うと白黒写真を記録することが出来ます。プリンタは通常、ハーフトーンモードと同様の原理で写真を印刷しています(最近のプリンタは解像度が高いためドットが目立たなくなりました)。

ファイル形式

 Windowsでは、ファイル名の後ろの「.」の後の3文字(拡張子)でファイルのデータ記録形式(ファイル形式)を区別します。ViewFastは白黒専用なのでJPG形式は使用しません。

拡張子

ファイル形式の説明

BMP

 Windowsの標準画像ファイル形式。
 主に圧縮無し(非圧縮)画像データを格納します。1ファイルに1ページだけ格納します。

TIF

 数社が共同で作成したTIFF規格の画像ファイル形式。
 主に圧縮無し(非圧縮)とMH/MR/MMR圧縮の画像データを格納します。1ファイルに複数ページを格納するマルチページ形式も使用出来ます。

JPG

 国際標準規格のJPEG圧縮の画像ファイル形式。
 JPEG圧縮はフルカラー写真画像用の圧縮方式です。圧縮時に多少画像の細部がぼけて劣化するので、元の非圧縮データに展開したときに、完全に元には戻りません。このような圧縮方式は非可逆圧縮と呼ばれます(元に戻せる圧縮方式は可逆圧縮)。

MH
MH1
MH2

 ViewFast独自の画像ファイル形式。最後の数字は解像度を現しています。
MH:300DPI MH1:180DPI MH2:240DPI
 MH圧縮を改良した圧縮方式です。ハーフトーン画像データの場合TIFFよりも適しています。1ファイルに複数ページを格納するマルチページ形式も使用出来ます。

VFB

 ViewFastで作成した電子ブック(ブックファイル)のファイル形式。
 画像データは、自動的に選択された最適な圧縮方式で圧縮されて格納されています。1ファイルに全ページのデータが格納されています。

VFX

 ViewFastで作成した電子ブックのインデックスファイルのファイル形式。
 インデックスファイルは、画像データファイルのファイル名のリストが格納されているだけで、画像データそのものは含まれていません。

()

 ViewFastで作成したコメントが格納されたファイル(コメントファイル)のファイル形式。
 コメントファイルは、テキストデータが格納されているので、(Windowsのメモ帳等の)テキストエディタで編集することが出来ます。

 

データの圧縮方法

 FAXは白黒2値画像で通信するので、白黒2値画像の圧縮方式のほとんどはFAXの国際標準規格(CCITT)として制定されています。標準規格なので無償で利用することが出来ます(最近登場したJBIG方式は特許料の支払いが必要です)。白黒2値画像の圧縮方式は画像の劣化の無い可逆圧縮方式ですから、圧縮後のデータだけ保存して、圧縮前のデータを消去しても問題ありません。

 白黒2値画像は、画像の水平線(ライン)上で白のドット数と黒のドット数を交互に数えて記録することで効率良く圧縮出来ます。さらに出現頻度が高い数値に短い符号を割り当てるハフマンコードを組み合わせて圧縮率を高くした方式が、MH方式です。
 さらに、1ライン分前のデータと現在のラインを比較して、相対的な変化位置を記録することで圧縮率を高くした方式を2次元圧縮と呼びます(MHは1次元圧縮)。
 2次元圧縮には、通信エラーの影響が少ないMR方式と、圧縮率が一番高いMMR方式があります。電子ファイリングでは通信エラーの問題が無いのでMMR方式が主に使われます。
 通常の文字を中心とした原稿の場合、MHで10分の1(10%)、MMRで20分の1(5%)程度に圧縮されます。
 MH、MR、MMRのどの方式もハーフトーンモードデータに対しては圧縮効果がありません。そのため、ViewFastはハーフトーンモードデータに適した独自圧縮方式も併用しています。

 FAXの規格の名称に合わせて、MHはCCITT-G3(1D)、MRはCCITT-G3(2D)、MMRはCCITT-G4(2D)と呼ぶこともあります。

データの表示方法

 モニタテレビの解像度には、VGA(640×480)、SVGA(800×600)、XGA(1024×768)、SXGA(1280×1024)、UXGA(1600×1200)、等の種類がありますが、電子ファイリングにはSXGA以上の解像度が適しています。

 A4サイズの文書を300DPIの解像度でスキャナ入力すると、約2500×3500ドットもの画像データサイズになります。このままではパソコンのディスプレイ(モニタテレビあるいは液晶ディスプレイ)装置に表示出来ませんから縮小処理をして表示します。
 例えば、2分の1に縮小する場合、縦横2×2=4ドットのうち3ドットを間引いて1ドットだけ表示します。画像編集ソフトで、縮小表示すると細い線が消えてしまうのはこのためです↓。

こ ぼ れ 話

その1、電子ファイリング、は、
         
辞書に無い!?

 会社を設立する時に、定款の目的に「電子ファイリング請負業務」と書くと、辞書に無い言葉なので他の言葉で表現出来ませんか?なんて言われてしまいました(体験談、結局「電子ファイリング」を認めてもらいました)。電子ファイリングが普及するのはこれからです。

その2、電子○○は誰のもの?

 パソコンが広く普及した現在、電子○○という言葉がいっぱい出現しています。電子出版、電子ブック、電子政府、電子郵便・・・。そのほとんどが従来の手書き文書や印刷物を使った業務をコンピュータやインターネットで置き換えることを意味していますから、誰でも自然に思い付きます(自然発生的に広く使われています)。一部の電子○○は登録商標になっていますが、誰でも思い付き広く使われる言葉を早い者勝ちで登録商標にするのは、宣伝効果の面(商品を連想しない)でも、倫理的にも(他社の事業を妨害するので)良くありません。

 

 電子ファイリングソフトはこれでは実用になりません(文字がかすれて読めません)から、4ドットの明るさの平均値から縮小後の1ドットの明るさを計算して表示します。細い線は薄く表示されるだけで、消えません。この方法では前述の方法に比べて表示速度が遅くなりますが、ViewFastは高度なプログラム技術で高速な表示を実現しています。しかも目が疲れないようにペーパーカラー調整機能がついています↓。