日本語とワープロ

YOMIURI PC編集部『パソコンは日本語をどう変えたかー日本語処理の技術史』(2008年、講談社ブルーバックス)が、勉強になりました。
かつて、ワープロを作る際に、日本語が科学的に分析できていなくて、技術者が苦労したという話を聞きました。どのように、文字を入力するかです。アルファベットを使っている言語は、26文字を、キーボードで入力すればいいのです。タイプライターです。もちろん、大文字と小文字やコンマやピリオド、改行なども必要です。
しかし、日本語は、ひらがな、カタカナ、漢字を使うので、これら3種類が必要なのと、漢字が膨大で、キーボードで入力できないのです。日本語タイプライターは、普及しませんでした。現在は、ローマ字で入力して変換する方法が、主流です。でも、変換が、これまた難しいのです。同音異字がたくさんあります。
その次に、皆さんも経験あるでしょうが、変な語句に変換されることです。漢字を一つ一つ変換していけば、そんなことは起こりません。しかし、それでは面倒です。一つの文章や、文節で変換すると、「え~」というような変換が起こります。
「バブル」と打った後に、「のじだい」と入れると、「野路代」と変換された経験をお持ちでしょう。今は、「の時代」となりますがね。
名詞が主で、その後に付く助詞は従なのです。話している時も、「の」はその後の「時代」につくのではなく、その前の「バブル」に付くのですよね。同音異字・同音異義語の変換をどうしたら早くできるか。文脈の中で最適の語をどうして探すか。このような分析は、国文学は役に立たず、技術者が解決していったのです。
わたしは、かつて、音声入力を使っていたこともあります。マイクに向かって読み上げると、パソコンが文章に変換してくれるのです。その際にわかったのは、一語一語では、変換できないのです。前後の文脈からパソコンが良さそうな語を探してくれます。「のじだい」では、パソコンは困ってしまいます。「の」「じ」「だ」「い」と区切って発音したら、パソコンはさらに困ってしまいます。文章は、単語が単に順番に並んでいるのではなく、前後の意味の中で並んでいるのです。
日本語がワープロを進化させ、ワープロが日本語を分析しました。そのほかにも、興味深いことが書かれています。