(1) テキストファイルは、文字、数字、画面表示可能な記号からなるファイルです。 含まれる制御コードは、 改行(CR: carriage return) 16進数 0D 復帰(LF: line feed) 16進数 0A のみです。 なお、テキストファイルの末尾には、制御コード(16進数 1A)が付加されます。 通常は、アプリケーションが自動的に付加しますので、私たちは気づきません。 (2) ファイルの拡張子は、通常、txt となっています。 ドキュメントの意味で、 doc となっている場合もあります。 しかし、拡張子docは Microsoft Wordのファイルの拡張子ですから、 最近はテキストファイルの拡張子には、docとは付けません。 (3) ホームページ用のファイルはテキストファイルです。 拡張子は一般に、 .html, .htm です。 拡張子の付け方は、Webサーバで指示されます。 (4) プログラミングのファイルはテキストファイルです。 FORTRAN, C++, Perl, Java, JavaScript のプログラムはテキストファイルに 落とします。 拡張子は、 FORTRAN .for C .c C++ .cpp perl .pl .cgi Java .java JavaScript .html .htm です。 このような次第で、パソコンの上級者ほどテキストファイルやテキストエディタを 多用するといえましょう。
テキストファイルとは
Windows95/98/NTに付属しているものとしては、 notepad wordpad があります。 市販の高機能エディタとしては MIFES があります。 UNIXでは vi, emacs があります。
テキストエディタ
・プログラミングにはエディタが必需品です。 ・もちろん、一太郎やWordでもプログラミングは可能ですが、 テキストエディタがあれば、快適、効率的、正確にプログラムを書 くことができます。 扱うファイルの数が多い場合、一つのファイルが大きければ大き いほど威力を発揮します。 プログラミングにおいては、 ・20行や30行のコピーといったコピー回数が多い、 ・ファイルの丸ごと挿入もある、 ・ファイル間移動が多い、 ・16進数も扱う、 ・制御文字自体の編集もある、 ・バイナリーファイルの編集も可能、 ・C言語のプログラミングでは、キーワードを色分けして表示して くれますから、入力ミスの防止に役立ちます。 ・HTMLファイルの編集においてタグやキーワードを色分けして表示して くれますから、入力ミスの防止に役立ちます。 といったことで、ワープロソフトでは機能不足+スピード不足です。 エディタは、プログラミングばかりでなく、 ・日常作業における文章入力に便利、 ・複数ファイルを参照しながら一つのファイルを作成するのに便利、 ・論文の下書きに便利、 ・論文作成用のTeXファイルもテキストファイルで便利、 ・計量経済用のTSPのプログラムを書くのに便利、 といった点でも利点を有しています。
プログラミングとエディタ
初心者ほど 機能満載、操作が難解なワープロソフトで苦戦し、 上級者ほど、 スピーディで操作が簡単なエディタで仕事をこなします。 この理由は、 初心者は、一つのソフトで仕事を済まそうとする、 上級者は、ソフトが持つ機能を使い分け、正確、スピーディに 仕事をやろうとする、 ことにあるようです。
エディタの長所 ・文字列のカット&ペーストが簡単でスピーディ ・行間ジャンプがスピーディ ・ファイル間移動がスピーディ ・検索・置換機能が豊富 ・マクロ機能が豊富 ・同時に編集可能なファイル数が多い ・編集可能なファイルサイズが大きい ・バイナリーファイルの編集が可能 ・キーワードのチェックをしてくれる。(C言語などで) エディタの短所 ・印刷機能が弱い ・フォント、図形の編集ができない
エディタの長所と短所
・文章の基本は文字と記号だということがよく分かってくる。 文字のフォントを変えるのは、プリンターにそのフォントを 用いた印字命令を与えるに過ぎない。 ・JIS, S-JIS, EUC の各コードの違いも分かってきます。 EUCコードで書いた日本語がJISで読めないのは漢字コードが 異なるからに他なりません。 ・CRとLFの違いもわかって来ます。 例えば、「改行記号」といっても、 Windows95/NT: CR+LF UNIX: LF Mac: CR といった具合に異なります。 したがって、他のOSで書いたテキストファイルを読み込ん だら行揃えが滅茶苦茶になる現象はこれから生じるのです。 ・文字化けの原理も分かってきます。 日本語のコードが、JIS、S−JIS、EUCで異なりますから 他のOSで書いたファイルを読み込むと文字化けします。 例えばS-JISの場合で、「表」、「能」、「予」など幾つかの漢字 では、2バイト目は16進数5C(0x5C)です。これはエスケープ記号 (日本語のOSでは円マーク)であって特殊記号として認識されま すから、文字化けの原因になります。
エディタを使う利点
私はテキストエディタとして、 MIFES for Windows Ver5.0 を使用しています。 Windows95/98/NT対応です。 MIFESを長年使用している理由は、 ・MS-DOSの時代の昔(MIFESが出た当初)から使って慣れている、 ・C言語やFORTRAN、Perlなどプログラミングに不可欠、 ・計量経済分析のためのデータの編集やTSP用のプログラム作成に有用、 (例えば、8桁30行のデータが横方向に10列並んでいるとき、 3列目のデータ(8桁30行)だけを切り取り、張り付けられます。 このような作業は、Excelのデータをテキストファイルに落とし、それをTSPの データとして使うときに行います。) ・原稿の下書きに重宝、 などがあります。 MS-DOS Ver6.2では SEDIT というエディタが標準添付されていますが、 これが MIFES の機能縮小版に他なりません。これからわかるように、 Microsoftも MIFES の性能と安定性を認めています。
MIFESについて