エンジニアとして、仕様書や特許明細書、論文の翻訳を発注する側も受注する側も経験してきましたが、最近の自動翻訳(人工知能(AI)翻訳)の技術進歩には目を見張るものがあります。ほんの10年ほど前まで、機械翻訳の結果というのは笑いのネタにしかなっていませんでしたからね。
少し前に、Google 翻訳と 中国の検索大手・搜狗(Sogou)の実力を比較したことがありますが、このときは、搜狗(Sogou)の流暢な翻訳結果にとても感心しました。
最近は、NICT(国立研究開発法人・情報通信研究機構)のライセンスを受けた『みらい翻訳』の実力がメキメキと伸びてきているようですね。「機械翻訳サービスの和文英訳がプロ翻訳者レベルに、 英文和訳はTOEIC960点レベルを達成」という触れ込みです。
翻訳というのは、単なる言語の変換ではなく、新しいテクノロジの輸入/輸出や、外国との文化・思想の橋渡し役を担う重要な分野であり、そのプラットフォームを外国企業に依存するのはかなり危険な行為です。
そこで、和製プラットフォームである「みらい翻訳 」と自動翻訳の代名詞である「Google 翻訳」とを、100点満点の点数で評価してみたいと思います(10個の文章をそれぞれ10点満点で評価し、その合計で比較します)。なお、「みらい翻訳」は、2,000文字まで入力できる無料の「お試し翻訳」を利用します。
エンジニアですので、特許明細書や論文など、技術文書で比較することにしましょう。ただし、ネット上や公開文献として日本語と英語がペアでオープンになっているものは、すでに翻訳エンジンの学習に使われている可能性が高いため、そのような文章は基本的に除外します。
和訳対決(英語 ⇒ 日本語)
対決1:タバコ容器関連
評価 : みらい翻訳 6点 vs. グーグル翻訳 5点
対決2:半導体関連
評価 : みらい翻訳 7点 vs. グーグル翻訳 5点
対決3:コンピュータ筐体関連
評価 : みらい翻訳 4点 vs. グーグル翻訳 7点
対決4:航空機関連
評価 : みらい翻訳 6点 vs. グーグル翻訳 8点
対決5:ナビゲーション関連
評価 : みらい翻訳 7点 vs. グーグル翻訳 4点
英訳対決(日本語 ⇒ 英語)
対決6:半導体関連
評価 : みらい翻訳 7点 vs. グーグル翻訳 8点
対決7:MEMS関連
評価 : みらい翻訳 7点 vs. グーグル翻訳 7点
対決8:建築関連
評価 : みらい翻訳 7点 vs. グーグル翻訳 6点
対決9:乾燥機関連
評価 : みらい翻訳 9点 vs. グーグル翻訳 6点
対決10:LED関連
評価 : みらい翻訳 8点 vs. グーグル翻訳 6点
総合評価
ででんッ!
まとめ
簡単な文章であれば、ほぼ確実な翻訳結果が出てくることは分かっていますので、構文や係りが少しややこしい文章をあえて選びました。また、単語(専門用語)については、ユーザ辞書や分野ごとの翻訳エンジンの利用により、容易に改善可能ですから、単語の間違いは評価の対象外としました。
あくまでも主観的な評価として、みらい翻訳が 68点、Google翻訳が 62点と少し辛口の結果となりましたが、内容を把握する用途なら、どちらも問題ないレベルにあることを確認しました。印象としては、「みらい翻訳」の方が圧倒的に流暢な訳文を返してくれます。
「みらい翻訳」は、日本語を中心として多言語対応を目指す和製プラットフォームですから、翻訳元言語と翻訳先言語のいずれかが日本語の場合は、当然有利に働きます。また、NICT を中心にオールジャパン体制で技術開発しており、特許明細書や学術論文など、割りと複雑で堅めの文章も豊富に学習している印象です。
スピードは圧倒的に Google ですし、無料でブラウザ(chrome)にも拡張可能ですから、利便性の面では、Google翻訳を利用したくなりますね。「みらい翻訳」は、複雑な文章を翻訳する場合や内容を正確に理解したい場合などに有用と考えられます。
一方、翻訳精度がかなり向上しているとはいえ、統計的な言語処理の限界も見られます。以下のような場合は、人間の助けやチェックがどうしても必要になります。
- 構文や係りが複雑で、複数の解釈が可能な内容を翻訳する場合
- 前後の文脈からしか判断できない内容を翻訳する場合
- モノの構造や位置関係など、経験的に把握している「常識」でしか判断できない内容(身体的感覚に基づく内容)を翻訳する場合
- 意味を理解していないと解釈できない内容を翻訳する場合(元の文章の質が悪い場合なども含む)
- 契約書や特許明細書など、権利や責任が発生する内容を翻訳する場合
- 翻訳先言語の素養がまったくない人物が作成した文章を翻訳する場合(たとえば、英語の素養がある日本人が作成した日本語の文章は、割りと簡単に英訳できます)
現在のアルゴリズムでは克服できない課題もありそうですが、果たして、人間が言語の壁を全く意識しなくても済むようになるには、あと何年かかるのでしょうね。生きているうちに、そういう世界を見てみたいものです。
www.overthesensitivity.com