バイナリファイルとテキストファイルの違い

ファイルの種類

テキストファイル

プログラムのソースコード(プログラムの動作を記した設計図のようなもの)は、一般的にテキストファイルで作成します。テキストファイルとは、文字(テキスト)で構成されたファイルです。ファイル内のデータは本来1と0の二進表現の情報ですが、テキストファイルでは、これを文字コード表に対応させることによって、人が読める文字情報として扱えるようになります。

文字コードについて詳しく知りたい方はコチラ

バイナリファイル

一方、テキストファイルに対してバイナリファイルがあります。バイナリファイルとは、文字コード表に対応していないファイルを指します。

テキストファイルとバイナリファイル、どちらのファイル?

様々なファイルは、バイナリファイルとテキストファイルのどちらかに分けることが出来ます。よく使われるファイルはバイナリなのかテキストなのか、把握しておくとよいでしょう。

もし、あるファイルをテキストエディタ(文字編集ソフト)で開いても、正しく読めるような状態でない時は、2パターンの状況が考えられます。

ファイルの中身が読めない状態
  • エディタ指定の文字コードと対応していないテキストファイルである
  • バイナリファイルである

テキストエディタの文字コードの設定を変えても依然として読めない状況であれば、テキストデータが壊れているか、もともとがバイナリファイルであることを疑いましょう。

バイナリファイルの中身を確認する方法

バイナリファイルの中身を確認するためには、バイナリファイル編集専用のバイナリエディタを使うと、2進数や16進数で中身を確認することができます。

無料で使えるバイナリエディタもあるので、中身を確認してみるとよいでしょう。

一般的なバイナリファイルの種類

一般的なバイナリファイルは、画像データ、音声データ、圧縮データ、プログラムの実行ファイルなどが該当します。中身は0と1で構成されています。

画像データ

BMP形式、PNG形式、GIF形式、JPEG形式の画像データは、WEBブラウザやビューワ(表示・閲覧ソフト)を通さないと見ることができません。

音声データ

MPEG形式、WAV形式などの音声や映像を扱うデータもオーサリングソフト(編集・制作ソフト)を使うものなので、バイナリデータです。

圧縮データ

ZIPファイルなどの、容量を小さくしたデータもバイナリデータです。

その他のデータ

C言語で作られたプログラムや、アプリケーションを構成するファイルにもバイナリデータが多く存在しています。

一般的なテキストファイルの種類

WEBページのHTMLファイル、拡張可能なマークアップ言語であるXMLファイル、プログラミングで扱うソースコード(PHPやJavaScriptのファイル)は、ほぼテキストファイルです。

カンマでデータを区切ったCSVファイル、JavaScriptとの相性がよいJSONファイル、YAMLファイル、等々、テキストファイルはプログラミング中によく登場するので覚えておくとよいでしょう。

まとめ

ファイルの種類まとめ
  • ファイルにはテキストファイルとバイナリファイルの二種類がある
  • テキストファイルのデータは文字コード表に対応し、中身をテキストエディタで編集できる
  • バイナリファイルは、テキストエディタで編集できないファイル

にほんブログ村 IT技術ブログへ
にほんブログ村