敏感の彼方に

HSPエンジニアがお送りする、前のめりブローグ

[英語の翻訳]TOEIC 900点超えの人工知能(AI)と人間の未来

 

 

機械翻訳(自動翻訳)の発想は、およそ 70 年前に誕生したと言われています。

 

その約 40 年後、単語の翻訳や並べ替えの確率を統計的に学習する統計的機械翻訳(SMT:Statistical Machine Translation)を IBM のグループが研究し始め、機械翻訳の一時代を築きました。

 

さらにその 20~25 年後、統計翻訳(SMT)の研究が頭打ちとなる中、ニューラル機械翻訳(NMT:Neural Machine Translation)という新しい手法が登場しました。

 

ニューラル機械翻訳(NMT)とは?

ニューラル機械翻訳(NMT)は、人間の脳(神経回路網)の働きをモデル化して機械に置き換えたものであり、自動運転などの分野でも利用されている人工知能(AI:Artificial Intelligence)のディープラーニング(深層学習)という機械学習の一手法を応用したものです。

f:id:nezujiro:20171216045856j:plain 

およそ1年前、Google(グーグル)翻訳がこのニューラル翻訳(NMT)を採用し、大きな話題となりました。NMT の採用により、SMT の頃と比べて、Google 翻訳はとても「流暢」になったと思います。

 

ただし、NMT にも課題はあります。

 

翻訳する言語(日本語 ⇔ 英語、日本語 ⇔ 中国語 など)にも依りますが、「訳抜け」がそこそこの頻度で発生する、ということです。そして、翻訳結果が流暢であることが災いして、翻訳結果だけを見ていても「訳抜け」に気付けない、という問題もあります。

 

SMT の場合、翻訳に失敗したら明らかにおかしな結果が出力されますので、失敗したことにすぐ気付きます。でも、NMT では、そこそこの頻度で発生する誤訳に気付けない場合があります。重要な書類を読む場合などには致命的な欠陥なのですが、それほど、流暢な翻訳が可能になったということでもあります。

※ そもそも重要な書類(国家機密、特許、IR 情報、個人情報など)を翻訳するのに海外の翻訳システムを利用するのは危険です。その情報をネット経由で根こそぎ持っていかれます。そのため、日本独自の翻訳システムが急ぎ足で整備されようとしています。

 

また、NMT のおかげで自動翻訳の品質が向上したとは言え、海外のニュースサイトなどを翻訳してみると、意味はほぼ分かるのですが、まだまだ読むのにストレスが掛かります。内容が自然と頭に入ってくる、というレベルには達していません。

 

これらの課題を解決するには、アルゴリズムの改良・調整が必要であり、各社がしのぎを削っている部分でもあります。

 

ちなみに、機械翻訳の質は、アルゴリズムのほか、人工知能(AI)が学習するデータの量にも依ります。Google などがその翻訳サービスを無償で提供しているのは、多くの人に使ってもらうことで人工知能(AI)の学習データの量を増やすことが1つの目的です(それで正しい学習データが集まるのか、疑問点もありますが・・・)。

 

その点、世界で最も多くの人が使っている中国語や、ビジネスシーンで使われることの多い英語は、集まる学習データが必然的に増えますから、将来的には、「中国語 ⇔ 英語」の翻訳精度が格段に向上していくと考えられます。

 

「ほんやくコンニャク」に向かって

Google 翻訳などの NMT では、訳抜けなどの問題があるとは言え、流暢な翻訳結果が瞬時に出力されます。すでに人間の能力を超えています。

 

その Google は先日、新型スマートフォン「Pixel 2(ピクセル2)」の発表イベントで、以前から噂になっていた同社初のワイヤレスイヤホン「Pixel Buds(ピクセル・バズ)」を発表しました。

f:id:nezujiro:20171216052935j:plain

このイヤホン、Pixel 2 と一緒に使用すれば、自動翻訳機にもなる優れものです。

 

ドラえもんのひみつ道具「ほんやくコンニャク」がほぼ実現したようなものです。

www.overthesensitivity.com

 

 

また、会議や打ち合わせなどのビジネスシーンに関しては、同時通訳が機械翻訳(自動翻訳)の最終目標と考えられますので、雑音の影響をどのように抑えるか、翻訳結果を音声だけではなくモニタにテキスト表示した方が確実ではないか、といったインターフェースの検討が必要になりますが、すでにその実験レベルには達しつつあります。

 

あと5~10 年もすれば、少なくとも会話レベルの言語の壁はなくなるんでしょうね。

 

機械翻訳(自動翻訳)の実力

巷では、このようなニューラル翻訳の実力が TOEIC に換算して、既に 800 ~ 900点とも言われています。肌感覚になりますが、誤訳などを含めても、すでにそのレベルにあるように感じます。

f:id:nezujiro:20171216061439j:plain

 

上に書いた通り、世界中でアルゴリズムの開発競争が起こっていますし、日々集まる学習データもますます増えていきますので、この実力は高くなるばかりです。もう、TOEIC 換算で 900点前後の実力と考えておくぐらいが丁度良いのかもしれません。

 

デバイスやツールがもう少し揃えば、まったく英語ができなくても留学や海外赴任できてしまうレベルです(少なくとも、「英語が分からなくて困る」ことはなくなりそうです。ただし、友人関係を築いたり交渉事をまとめたりするには、やはり人間としての信頼関係が大切ですので、デバイスやツールに頼らない英語力が必要でしょう)。

 

一方、これまで、社会の中で外国語(英語)の得手不得手が何らかの格差をもたらしていたとするなら、機械翻訳の発達によって、そのような格差は徐々に小さくなり、やがて無くなることも期待できます。

 

英語の学習 | 人生が 3,000 時間長くなる?

このように機械翻訳のレベルが上がってくると、苦労して外国語を勉強する意味やモチベーションがなくなってしまいます。実際、機械翻訳を利用すれば一瞬で解決してしまうようなことに、青春時代の膨大な時間を費やして何の意味があるのでしょうか?

 

今まで当たり前のようにやってきた外国語の勉強をいきなり辞めるのは勇気がいることですが、将来的にはその方向になるのではないかと感じています。

 

ガスや電気が通って、柴刈りの必要はなくなりました。洗濯機が開発されて、川で洗濯する必要はなくなりました。自動車が発明されて、馬車は不要になりました。電卓の登場により、算盤はソロバン教室ぐらいでしか見掛けなくなりました。

 

でも、どれも完全にはなくなっていません。実用上は不要になっても、趣味、宗教上の理由、文化保全、学力向上などの目的で残っています。

 

外国語についても、絶対に必要な人や趣味・教養として身に付けたい人だけが学ぶものになっていくのが自然な流れですね。

 

ちなみに、学習指導要領などを参考にすると、中学校での英語の学習時間は、かなりアバウトですが、家庭学習の時間も含めて3年で 500時間にもなります。

 

高校での英語の学習時間は、進む学科などによって大幅に異なりますが、こちらも学習指導要領などを参考にすると、少なく見積もって3年で 500時間程度になります。

 

大学に進んだ場合、そこで英語の学習に費やす時間を算出するのは至難のわざですが、研究などで英語の論文を解読する時間なども含めて、適当に 1,000時間と仮定します。

 

働き始めてから英語に費やされる時間も、勤め先や職種に応じて実にさまざまですから簡単には算出できませんが、こちらも適当に 1,000時間と仮定します。

 

「TOEIC が 900点以下なら英語なんて勉強する必要がない!」と、ちょっとした疎外感のような、悲しいような気持になりますが、モノは考えようです。これまで英語に費やしてきた時間を別のことに使えるようになるわけです。その時間は、ざっと

3,000時間

です。その分、人生が長くなるようなものです(👍)。

 

 ただ、このように予想される未来を子どもたちに話す勇気はまだありません(汗)。

 

 

 

機械翻訳(自動翻訳)を有効活用する

人生を 3,000時間長くするため、機械翻訳(自動翻訳)にすべて委ねてしまうのも1つの手ですが、機械翻訳を上手く取り入れるやり方もあります。

 

■ コミュニケーションの補助

外国人とのコミュニケーションは、度胸が半分以上と思うのですが、「世界の果てまでイッテQ」の出川さんのように誰もが振る舞えるわけではありません。

 

そこで、機械翻訳の結果を自分の口で発してみたり、伝えたいことを機械翻訳で補足してみたりすることで、「場慣れ」していくことができます。これを繰り返せば、心理面のハードルが相当低くなるのではないでしょうか。

 

■ 論理力を鍛える

現在のところ、機械翻訳に正しい翻訳結果(たとえば英語)を出力させるには、元の言語(たとえば日本語)を正しく入力するのが一番です。主語や目的語、述語がはっきりした文章です。

 

ですので、機械翻訳を活用するうちに、正確な日本語を組み立てる「論理力」が自然と身に付くはずです。そうすれば、物事を論理的に考える力が備わり、言語学習も含めた学習能力全般が向上する可能性があります。

 

未来の人間の役割

f:id:nezujiro:20171216094456j:plain

上に書いたように、会話レベルでの言語の壁は、そう遠くない未来になくなる可能性が高いとしても、友人関係を築いたり交渉事をまとめたりするには、やはり生身の人間としての信頼関係が大切です。

 

また、技術文献などを読んでいて、「この英語(日本語)は、人工知能(AI)には翻訳できないだろうな」と思う文章によく出会います。

 

文構造が複雑になり、定型文がないような状況では、関係代名詞や前置詞の掛かる先を文章からだけでは判断しようがないケースが多々あります。

 

そのような場合は、たとえば構造技術に関するものであれば、頭の中で構造を分解したり組み立てたりして、技術的に正しい訳を考えます。あるいは、技術的な「意味」を考えて、完成した訳文が技術的におかしくないかどうかを判断します。身体がなく、意味を理解していない人工知能(AI)には、なかなか厳しいことですし、このあたりに人間の役割があります。

 

また、当たり前のことですが、機械翻訳の研究・開発に従事する人は、言語学の素養がある程度ないと、研究・開発自体がままならないでしょう。

 

機械翻訳の登場で「翻訳」という職業がなくなるとも言われていますが、そうは思いません。上に書いたように、身体的に意味を理解していなければ訳せない複雑な文章が多々存在するからです。また、特に IT などのテクノロジ分野では、英語を日本語に訳す際など、まだ日本語にない言葉を「創る」作業が頻繁に生じます。既存の言葉を参考にして、ニュアンスが最もしっくりくる言葉を創る作業は、やはり人工知能(AI)にはなかなか難しいことです。

 

言語を扱うのが好きな人はそのような職業に従事し、そうでもない人は機械翻訳を目一杯使えるようになれば、各人の得意分野で人的資源を有効に利用できるようになります。

 

【おまけ】英語のジャングルを彷徨いたい人におススメ

最後に、ボクの英語観が大きく変わった書籍を一冊。

 

過去に読んだ英語本の中で一番面白かった、「日本人の英語」(マーク・ピーターセン著)です。有名な本なので、知ってる人もたくさんいることでしょう。

 

英語ネイティブの著者が、日本での生活から見えた日本人の英語問題を、ネイティブの感覚で、「日本語」でつづっている点が、この本の面白いところ。

 

著者のピーターセンさん、「続・日本人の英語」「実践 日本人の英語」「心にとどく英語」などなど、よほど日本人の英語が気に入らないらしく(大汗)、たくさんの著書があります。

 

どれも非常に面白いのですが、重複する内容があったり、ご趣味の映画や俳句に深入りしていったり、複雑な構文になっていったりと、少し込み入った話になってきます。

 

やはり、1988年に出版された最初の「日本人の英語」こそ、日本人の英語問題の核心を捉えています。ボクが特に気に入ったのは、2章~4章に書かれている「冠詞」と「単数/複数」の話です。

 

日本の授業では、冠詞(a、an、the)や単複の重要性があまり強調されませんが、ネイティブにとっては、どの冠詞を使うか、単数なのか複数なのか、といったことがどれほど重要なことかが分かります。

 

たとえば、シェイクスピアの喜劇に「The Comedy of Errors」というのがありますが、これは、「Comedy」と「Error」のそれぞれについて、定冠詞(単数、複数)、不定冠詞、複数、無冠詞の5通りがあり、5×5=25 通りに書き換えることができます。

 

日本語ではあり得ないことですが、ネイティブにとっては 25通りの意味があります。どう書くかで頭の中に浮かび上がる情景が異なるわけですが、日本人の場合はほとんどが「間違いの喜劇」と訳すであろう、と述べられています。

 

この本を読んでから、英文を読む機会に、冠詞と単複の組み合わせがどうなっているかを見るのがすごく楽しみになったことを覚えています。組み合わせ次第で、いろんなニュアンスを表現できることがとても面白いです。

 

その他、名詞の可算/不可算、前置詞、時制、先行詞、能動態/受動態、副詞などなど、さまざまな事例を導きながら、日本人が苦手な部分、日本人が間違いやすい部分、日本人が把握しにくい感覚を、丁寧な日本語で紹介してくれます。

 

この本を最初から最後まで、何度も何度も読み返せば、英語の感覚がすごく身に付きます(身に付いたような気になります)。随分前の本ですから、現代の英語と異なる用法も見られますが、冠詞や前置詞などの「感覚」を身に付けるには絶好の書です。

 

子どもたちが英語を学ぶようになったら、この本を是非プレゼントしたいですね(高校生ぐらいが丁度良いかな)。「イラナイ」と言われる可能性が高い気もしますが・・。

 

 

- 敏感の彼方に -