========================= 日本語かなコード変換ツール カナカナ7(セブン) ver0.99 CopyRight MIYAMA. 2007 SEP-OCT kaz_kimijima@yahoo.co.jp http://kimijima.at.infoseek.co.jp 機能画面へ ========================= 1 はじめに このユーティリティはテキスト形式の文書のカナ文字 を任意の形式に一括に変換するプログラムです 例 半角カナ アイウエオ を全角かな あいうえお へ 例によって自分の作業に同等の変換作業が必要になっ たのですが 最初はUNIXのSEDのyオプションで一括変換できるのだ ろうと簡単に考えていましたが半角カナのコード形式は なんと濁音が二文字にわかれることを発見し 例 ガ > カ ゙ ツールの設計としてはゼロからの発想が必要なことを 認識してしまいました ほかの複数の理由をも含めてそのような意味では今回 のツールは素朴な意味で独創的なやり方で作られました 専門的なソフトハウスが提供するものをのぞいてはた ぶんこのようなツールはWEB上には存在しないのかもし れません ということでこのツールも公開することにしたいと思 います 2 動作機種条件 インターネットエクスプローラ5.0以上が動作する AT互換機WINDOWSマシンで動作します:95以上のWIND OWSが必要です マシンスペックはintel486以上メモリは64メガでも 大丈夫です エクスプローラのバージョンが低い場合は要求する内 部関数のライブラリが存在しないので使用できません しかしそのような機種はおそらく今から10年程度昔 のマシンでありほとんど実務空間には存在していないで しょうし またエクスプローラのバージョンをあげると一部のプ ログラムが動作しなくなる場合もあるのであまりおすす めしません 購買時WINDOWS XPのマシンであればプログラムとし ては問題はないでしょう ただし例外処理の関係上プログラムはやや重いプログ ラムとなっています データベースから引っ張ったような数メガの大きさの テキストなどは処理に数分以上かかるかもしれません 3 使用権利条件 フリーウェアです 常識的な使用の範囲では利用配布に制限はありません 4 具体的な操作方法 圧縮アーカイブKANA7.EXEをダブルクリックしてく ださい ひとつのファイルが出てきます KANA7.HTM README兼実行ファイルですインターネッ トエクスプローラのHTMLテキスト画面の形を取ってい ます KANA7.HTMをクリックして操作画面を立ち上げてくだ さい 4−1操作画面の詳細 ========================= ライセンス 使用モード選択 ・なにもしない ・半角カナを全角ひらがなへ ・半角カナを全角カタカナへ ・全角ひらがなを全角カタカナへ ・全角ひらがなを半角カナへ ・全角カタカナを全角カタカナへ ・全角カタカナを半角カナへ オプションモード □入出力をファイルにするか入出力窓をつかうのか 切り替え ONで入出力窓使用 読み込みファイル名入力窓 実行ボタン データ張り付け窓:入力用in text データ切り出し用窓 :出力用out text ================= 出力ファイルはつねにデスクトップのOUTPUT.TXTです 画面読み込み時の基本設定は上から ・なにもしない ・入力は読み込みファイル ・出力はデスクトップのOUTPUT.TXT です 読み込みファイルはテキスト形式のファイルであるこ とが必要です 拡張子の目安でTXT CSV HTM HTMLなどです WINDOWSが拡張子を表示しない設定になっている場合 にはコントロールパネルで設定を変更してください ただしmachntoshで作成したテキストは改行コードの 種類が違うので操作できません EXCLEで作成した文書はCSV WORDで作成した文書はTXT形式保存が必要です。 ちいさい大きさのファイルであれば MACのテキストをWINDOWS形式に変換するツールが拙作に もあります transmacで検索してください(google) 読み込み用のテキストのファイルは必ずデスクトップ 上においてください これはエクスプローラがつねにファイルの所在をデス クトップを基準に考えているためです ファイルが存在しないとメッセージが出る場合にはフ ァイルの拡張子やその名前を確認してください ファイルの名前は単純な名前をおすすめします 実行ボタンを押すと出力結果がOUTPUT.TXTとして出力 されます内容を確認してください 4−2選択オプション 入力形式の選択をクリックすると張り付け窓に直接デ ータをカットアンドペーストで張り付けることができま す この場合自動的にファイルからの読み込み機能はoff になります 出力形式の選択も出力をファイルにするか窓にするか を選択できます EXCELなどで作業中、カラムや段のデータなどを一括 してカナ変換したいときに便利です EXCELのデータをsheetから直接コピー張りする場合は EXCEL自体やインターネットエクスプローラーが自動的 にセルの区切り(ここではタブコード)を認識しますの で 逐一データをファイルに保存する必要がありません EXCELから張り込む場合は EXCEL上でシートの任意の範囲をctrl+Cでコピーし kana7側にctrl+Vをつかって張り込んで goボタンを押し込んで処理し EXCEL側にはりもどす際には kana7からctrl+Cでコピーしたデータを シート上の選択範囲のいちばん左上のセルを選択し ctrl+Vでペーストしてください ctrl+ぺけぺけの操作はコントロールキーと任意のキ ーの同時押しを意味します WINDOWSやEXCELのショートカットキー関係の書籍に 詳しく載っています 5 注意事項 作者はこのユーティリティを使用して生じたあらゆる 不具合について責任を持ちません 使用は自己責任においてお願いいたします 特に大事なデータを処理にかけるときにはバックアッ プをとり また業務上重要なマシンでこのユーティリティを使用 することは絶対におやめください 5−1 変換に際しての注意 一般の小規模の使用においてはさほど問題になるとは 思われませんが 特殊なカナ文字に関しては文字コードが必ずしも一対 一で変換対応していませんので一部の文字を変換しない ことがあります 把握している範囲での対象文字 ・二ヶ 1ヵ所 などの小文字の カケ この文字は全角カタカナしかありません 半角側は大文字カケにするように設定しましたが 全角ひらがなには変換しないことにしました ・ヴァイキング1号の ヴ 上記と同じです半角にはヴとして出力します ひらがなには変換しません ・ゑとヱ 半角側には大きなエとして出します ・ゐとヰ 半角側には大きなイとして出します ・ 小文字の "ゎ","ヮ", 半角側には大きな"ワ"として出力します 6 余談 今回のプログラムは論理の作成に時間がかかりました はじめにも書きましたが1バイト半角かなと2バイト 全角かなでは濁音の処理が異なることもそうですが もともとカナが50文字から70文字もある論理的に は比較的広いデータ領域なので例外処理をどのように回 避するかがこのツールとしての課題でした さすがに全角カナには例外部位はないだろうと思って 調べてみるとカタカナ ム のとなりに一つ予約コード があるようです またコード規格の設計上たとえば は ば ぱ は連続したコードとして登録されており、このことは 半角全角間で単純にアスキーコードを差異定数でまるご との単純なシフトしたい願望を見事に打ち砕いてしまい ました これはたぶんコード草案者が実務経験者でないことを 暗示しているのでしょう 諮問委員会を作るときは必ずしも委員が専門家でない 危険があるのでその恣意はつねにばくちですというのは 一般論としての余談です 個別の文字ごとに変換条件を記述していては条件論理 部が70行近くにもなってしまいます それだけのデータを手打ちで入力するのは納期が押し ている場合をのぞいてできるだけやりたくありません そこで今度は 例外の中に規則性を見いだし その例外を含んだ形の逐一文字処理表を打ち出すコー ド・ジェネレーターを作成し それを加工してツールのプログラム本体にする方法を 採りました 非常に特異的な例外だけ手修正で完成です なんかやっている途中遺伝子工学の実験をしているよ うな気になりました まあやっとできました ・「なにもしない」機能について 最初はカナカナシックス というツール名にしようと したのですが ゴロが悪いので機能を一つ追加しセブンにしたわけで す そういう商品のネーミングの気遣いというのは以外に 大事だったりします笑 敬老の日に記す そろそろ年寄のMIYAMA. ========================= ============================================================================================================= KANAKANA7 CopyRight MIYAMA. 2007 処理の選択 なにもしない 半角カナを全角ひらかなへ 半角カナを全角カタカナへ 全角ひらがなを全角カタカナへ 全角ひらがなを半角カナへ 全角カタカナを全角ひらがなへ 全角カタカナを半角カナへ On Click Window to Window Source File name in text out text