エディタ
テキストファイルとは
(1) テキストファイルは、文字、数字、画面表示可能な記号からなるファイルです。
含まれる制御コードは、
改行(CR: carriage return) 16進数 0D
復帰(LF: line feed) 16進数 0A
のみです。
なお、テキストファイルの末尾には、制御コード(16進数 1A)が付加されます。
通常は、アプリケーションが自動的に付加しますので、私たちは気づきません。
(2) ファイルの拡張子は、通常、txt となっています。
ドキュメントの意味で、 doc となっている場合もあります。
しかし、拡張子docは Microsoft Wordのファイルの拡張子ですから、
最近はテキストファイルの拡張子には、docとは付けません。
(3) ホームページ用のファイルはテキストファイルです。
拡張子は一般に、 .html, .htm です。
拡張子の付け方は、Webサーバで指示されます。
(4) プログラミングのファイルはテキストファイルです。
FORTRAN, C++, Perl, Java, JavaScript のプログラムはテキストファイルに
落とします。
拡張子は、
FORTRAN .for
C .c
C++ .cpp
perl .pl .cgi
Java .java
JavaScript .html .htm
です。
このような次第で、パソコンの上級者ほどテキストファイルやテキストエディタを
多用するといえましょう。
テキストエディタ
Windows95/98/NTに付属しているものとしては、
notepad
wordpad
があります。
市販の高機能エディタとしては MIFES があります。
UNIXでは vi, emacs があります。
プログラミングとエディタ
・プログラミングにはエディタが必需品です。
・もちろん、一太郎やWordでもプログラミングは可能ですが、
テキストエディタがあれば、快適、効率的、正確にプログラムを書
くことができます。
扱うファイルの数が多い場合、一つのファイルが大きければ大き
いほど威力を発揮します。
プログラミングにおいては、
・20行や30行のコピーといったコピー回数が多い、
・ファイルの丸ごと挿入もある、
・ファイル間移動が多い、
・16進数も扱う、
・制御文字自体の編集もある、
・バイナリーファイルの編集も可能、
・C言語のプログラミングでは、キーワードを色分けして表示して
くれますから、入力ミスの防止に役立ちます。
・HTMLファイルの編集においてタグやキーワードを色分けして表示して
くれますから、入力ミスの防止に役立ちます。
といったことで、ワープロソフトでは機能不足+スピード不足です。
エディタは、プログラミングばかりでなく、
・日常作業における文章入力に便利、
・複数ファイルを参照しながら一つのファイルを作成するのに便利、
・論文の下書きに便利、
・論文作成用のTeXファイルもテキストファイルで便利、
・計量経済用のTSPのプログラムを書くのに便利、
といった点でも利点を有しています。
初心者ほど
機能満載、操作が難解なワープロソフトで苦戦し、
上級者ほど、
スピーディで操作が簡単なエディタで仕事をこなします。
この理由は、
初心者は、一つのソフトで仕事を済まそうとする、
上級者は、ソフトが持つ機能を使い分け、正確、スピーディに
仕事をやろうとする、
ことにあるようです。
エディタの長所と短所
エディタの長所
・文字列のカット&ペーストが簡単でスピーディ
・行間ジャンプがスピーディ
・ファイル間移動がスピーディ
・検索・置換機能が豊富
・マクロ機能が豊富
・同時に編集可能なファイル数が多い
・編集可能なファイルサイズが大きい
・バイナリーファイルの編集が可能
・キーワードのチェックをしてくれる。(C言語などで)
エディタの短所
・印刷機能が弱い
・フォント、図形の編集ができない
エディタを使う利点
・文章の基本は文字と記号だということがよく分かってくる。
文字のフォントを変えるのは、プリンターにそのフォントを
用いた印字命令を与えるに過ぎない。
・JIS, S-JIS, EUC の各コードの違いも分かってきます。
EUCコードで書いた日本語がJISで読めないのは漢字コードが
異なるからに他なりません。
・CRとLFの違いもわかって来ます。
例えば、「改行記号」といっても、
Windows95/NT: CR+LF
UNIX: LF
Mac: CR
といった具合に異なります。
したがって、他のOSで書いたテキストファイルを読み込ん
だら行揃えが滅茶苦茶になる現象はこれから生じるのです。
・文字化けの原理も分かってきます。
日本語のコードが、JIS、S−JIS、EUCで異なりますから
他のOSで書いたファイルを読み込むと文字化けします。
例えばS-JISの場合で、「表」、「能」、「予」など幾つかの漢字
では、2バイト目は16進数5C(0x5C)です。これはエスケープ記号
(日本語のOSでは円マーク)であって特殊記号として認識されま
すから、文字化けの原因になります。
MIFESについて
私はテキストエディタとして、
MIFES for Windows Ver5.0
を使用しています。
Windows95/98/NT対応です。
MIFESを長年使用している理由は、
・MS-DOSの時代の昔(MIFESが出た当初)から使って慣れている、
・C言語やFORTRAN、Perlなどプログラミングに不可欠、
・計量経済分析のためのデータの編集やTSP用のプログラム作成に有用、
(例えば、8桁30行のデータが横方向に10列並んでいるとき、
3列目のデータ(8桁30行)だけを切り取り、張り付けられます。
このような作業は、Excelのデータをテキストファイルに落とし、それをTSPの
データとして使うときに行います。)
・原稿の下書きに重宝、
などがあります。
MS-DOS Ver6.2では SEDIT というエディタが標準添付されていますが、
これが MIFES の機能縮小版に他なりません。これからわかるように、
Microsoftも MIFES の性能と安定性を認めています。