WIREDにこんな記事がある。従来の人工知能は文法ルールや単語の意味を「言語学的に」徹底的に教え込んで来たが、新しい人工知能は「統計学的」に言語を理解する、というものだ。
これは二つの言語で書かれた文章を比較し、その間にある共通点を探しながら少しずつ二つの言語の間の関係性を理解し、学習していくというものらしい。ディープラーニングを使った手法だとは思うが、どこか考古学的な古代文字の解読に似ている。
その言語を扱うものが完全に失われてしまった古代文字の解読は極めて難しい。現状解読されている古代文字の多くが、既に解読済みの言語と併記されていたために何とか解読できたというだけで0から解読した古代言語は殆ど無い。
賢者の石と呼ばれるロゼッタ・ストーンが好例だが、「多言語併記」の文書は言語的には知識の塊なのだ。しかしそう言った文書がない場合、解読は困難極まる。その言語を扱っていた人々の習俗や歴史、制度などを調べ、それらを踏まえた上で頻出する単語の種類や順序などをそれこそ「統計学的に」解読していかなければならない。
その作業には途方も無い労力が必要とされ、今もまだ解読されていない古代言語が多数存在している。
ただ、これは古代言語の話であって、人工知能に教える言語は文法も単語も解読されている。簡単に教えられるはずだと考えたくなる。だが、これはあくまでその人間が「母語」を持っている事が前提となる。
文法や単語の意味から文章の内容を把握していく「言語学的な」手法の学習は、その多くが学びたい言語と母語の照らしあわせによって行われる。母語との類似が多ければ多いほど学習は簡単になり、母語との類似が少なければ少ないほど学習が難しい。
英語話者がフランス語やドイツ語を学ぶことに比べて、日本語や中国語を学ぶのは大変だ。中国語で使われている単語は英語とは全く異なっているし、日本語に至っては文法も大きく異なっている。逆に中国語と日本語は使われている単語や発音に類似があり、流暢に話すのはともかく、単語の意味を覚えるだけなら比較的簡単だ。
日本人は英語を学校で学んでいるので、中には「フランス語の方が学びやすい」と感じる人もいるだろう。それなら、キリル文字を扱うロシア語やアラビア文字のアラビア語をイメージすると良い。何をどう読めば良いのから全く分からないはずだ。
しかしそれでも人間の扱う言語であり、人間の扱う言語としての共通点は非常に多い。二つの言語を理解し読解・翻訳できる人間が、その共通点を使って十分に時間をかけて説明をすれば必ず理解できるようになるだろう。
ところが人工知能は違う。機械は人間とは全く異なる言語体系を持つ存在であり、「機械言語」を駆使して「人類言語」を学ぶというのは非常に難しい。そこで、古代言語を理解するときに使われるような統計学的なアプローチが有効になる。
人工知能の言語理解の話が急に古代言語の理解に繋がるというのもおかしな話だが、これはある意味当然のことかもしれない。人工知能にとっての人類言語は人間にとっての古代言語と同じだ。人類言語が古代言語扱いされるのは癪だが、少なくとも人工知能の中に人類言語の完璧な話者はいない。まだまだ学習途上であり、人類言語を正しく理解し翻訳できる機械はいない。
そもそも人工知能にとって人類言語の翻訳は相当面倒な話で、人類言語を機械言語で理解し、機械言語から人類言語に直さなければならない。これは翻訳で言えば、英語をフランス語に翻訳する際に日本語を挟むようなもので、精度が落ちるのも至極当然。
学習能力が向上した人工知能はいずれ人類言語を巧みに扱えるようになるはずだが、彼らが非常に険しい道程を歩んできたことは理解しておくべきなのではないだろうか。