Delving into the longstanding reliance on kanji conversion in Japanese computing, this blog post explores whether this practice has hindered productivity and how modern language models might transform it.
相模原市で IoT 設計を受託しているファームロジックスです。
皆さんがパソコンを利用するとき、こんなことを考えたりしませんか?
漢字を利用する文化圏の人間は、とりわけ欧米人に比べて、IT の生産性で不利だよなあ。
コンピュータで日本語を使う難しさが語られるようになってから、既に半世紀以上にはなるかと思いますが、その中でも「かな漢字変換」あるいは「日本語変換」という文化は、日本人の IT 生産性に大きな影響を与えているはずです。
しばらく昔話(TL; DR)
私にとって、1983年頃に NEC PC-8801 でワープロソフトを使ったのが、かな漢字変換の最初の思い出です。されに歴史をひもとくと、1978年に東芝が初の日本語ワードプロセッサを発売したのが、産業史における、かな漢字入力の起源となるようです。
それより昔となると、印刷所の植字工さんや日本語タイプライターのように、必要な文字を盤面から拾うという文化がありましたが、コンピュータに QWERTY 配列のキーボード(テレタイプ)が繋げられてからというもの、日本文字でコンピュータを利用する人にとっては、「かな漢字変換」という文化は切り離せないものとなり、もはや誰も疑問に思う人はいなくなりました。
最近は、Apple の Siri で知られるようになったような、音声認識による日本語入力技術もありますが、たとえばオフィスや学校、はたまた電車など公共交通機関の中などで、日本語を入力するために声を出して話す、というのは現実的でないでしょう。そもそも、パソコンとの長い付き合いを経て、喋るよりはキーボードでタイプするほうがずっと早い(速い)、というビジネスマンは多いはずです。
先日の拙日記で書いたように、パソコンの日本語入力では、MS-IME、ATOK などの日本語変換ソフトが主流ですが、最近の大規模言語モデル(LLM)AI の実力を見るにつれ、かな漢字変換のオーバーヘッドが IT における日本人の生産性を下げているのではないか、と改めて再認識したのは私だけではないかと思います。
これから、世の中はどうなっていくのでしょう。日本人が IT 機器に日本語文字を入力するというプロセスは、これから大きく変化していくのでしょうか。
ChatGPT と日本語で会話するのに FEP は要らない、という現実
昨日の実験では、簡単な評価しかしませんでしたが、もう少し踏み込んでみましょう。今日も、ChatGPT Plus の GPT-4.5 Turbo を利用します。
私:
これからはローマ字で入力しますので、まずそれを漢字仮名交じり文にして確認してから、回答してください。
ChatGPT:
了解しました。ローマ字で入力された文を漢字仮名交じり文に変換して確認した後、回答します。何か質問があれば、ローマ字で入力してください。
私:
anata no version ha ikutsu desuka?
ChatGPT:
「あなたのバージョンはいくつですか?」という質問ですね。
私はOpenAIによって訓練されたGPT-4モデルを基にしています。具体的なバージョン番号はありませんが、最新の技術と知識をもって設計されています。何か他にお知りになりたいことがありますか?
どうでしょう。ChatGPTに「これからはローマ字で入力しますので、まずそれを漢字仮名交じり文にして確認してから、回答してください。」と指示しておけば、このように、日本語入力 FEP を使うことなく、ChatGPT と会話できるのです。うまくやれば、Custom Instructions 機能を使って、同様の指示ができるかも知れません。
将来が楽しみです
皆様も、ぜひお試しください。私が試したみたところでは、日頃の FEP を使う習慣からか、つい、文節末で Enter キーを押してしまうのが悩みですが、これも昨日紹介した ChatGPT Ctrl+Enter Sender(Google Chrome、Mozilla Firefox で利用可能)を使えば、なんとかしのげるはずです。