あの「Google翻訳」を超えた、「DeepL翻訳」のすごさを検証!

最近の機械翻訳はマジですごい

機械翻訳といえば、一昔前は「再翻訳(日本語を英語に翻訳し、さらにそれを日本語に翻訳すること)をするとめちゃくちゃな文になるwww」と散々ネタにされていました。

しかし、今の機械翻訳はもはや昔の機械翻訳とは全くの別物です。
ディープラーニングやビッグデータといった最新鋭のテクノロジーを総動員し、非常に精度が高い翻訳文を作ることができます。


最強の機械翻訳、「DeepL」

ドイツのテクノロジー企業であるDeepLは機械翻訳専門の会社で、DeepL翻訳と呼ばれる無料の機械翻訳ツールを公開しています。

これが世界中で「翻訳が驚くほど自然」と大絶賛されています。

ということで早速Google翻訳とバトらせてみました。Google翻訳も、とても精度の高い機械翻訳です。

今回は以下の検証をしました。
英→日、日→英の両方向で、Google翻訳とDeepL翻訳のどっちが自然か比べます。

  1. 英語→日本語
    → 文章の自然さをチェックします。
  2. 日本語→英語
    → Grammarlyによる文法チェックで採点します。
  3. 総合力
    → 再翻訳にかけ、文章の自然さをチェックします。
    

1回戦: 英語→日本語の比較

今回検証に使う文章はこちらです。

Japanese is an East Asian language spoken by about 128 million people, primarily in Japan, where it is the national language. It is a member of the Japonic (or Japanese-Ryukyuan) language family, and its relation to other languages, such as Korean, is debated. Japonic languages have been grouped with other language families such as Ainu, Austroasiatic, and the now-discredited Altaic, but none of these proposals has gained widespread acceptance. (Wikipediaの「Japanese language」より抜粋。便宜上、一部注釈を排除) 

Google翻訳

先攻はGoogle先生です!結果はこちら!

日本語は約1億2,800万人が話せる東アジアの言語であり、主に日本で国語として使用されています。 これは、日本語(または日本語-琉球)言語ファミリーのメンバーであり、韓国語などの他の言語との関係については議論されています。 ジャポニック言語は、アイヌ語、オーストロアシア語、そして現在では信用されていないアルタイ語などの他の言語族とグループ化されていますが、これらの提案はどれも広く受け入れられていません。

ね、言ったでしょ? 今の機械翻訳はすごいんです。
普通に英文の意味を理解する分には全く不足ありません。
若干直訳っぽさが目立ちますが、日→英翻訳の場合は意味が分かれば良いのでOKです。


DeepL翻訳

後攻はDeepL翻訳、結果はこちら!
日本語は、東アジアの言語で、1億2800万人が話す言語で、主に日本では国語となっている。ジャポニック語(または和琉語)の一族に属し、韓国語など他の言語との関係は議論されているジャポニック語は、アイヌ語、アウストロアジア語、アルタイ語などの他の言語族とグループ化されてきましたが、いずれも広く受け入れられていません

こちらも、若干直訳っぽさが目立ちますね。
あと欲を言えば「です・ます」調と「だ・である」調を統一して欲しかったですが、英文の意味を理解する上では全く支障ありません。

日→英翻訳に関しては、両者引き分けです。


2回戦: 日本語→英語の比較

今度は、日→英翻訳にかけてみます。
検証に使う文章はこちらです。
この文章を英語に翻訳したあと、文法チェックアプリGrammarlyで点数を比較します。→関連記事

日本語は、主に日本国内や日本人同士の間で使用されている言語である。
日本は法令によって公用語を規定していないが、法令その他の公用文は全て日本語で記述され、各種法令において日本語を用いることが規定され、学校教育においては「国語」として学習を課されるなど、事実上、唯一の公用語となっている。
使用人口について正確な統計はないが、日本国内の人口、および日本国外に住む日本人や日系人、日本がかつて統治した地域の一部住民など、約1億3千万人以上と考えられている。統計によって前後する場合もあるが、この数は世界の母語話者数で上位10位以内に入る人数である。
日本で生まれ育ったほとんどの人は、日本語を母語とする。日本語の文法体系や音韻体系を反映する手話として日本語対応手話がある。
2019年4月現在、インターネット上の言語使用者数は、英語、中国語、スペイン語、アラビア語、ポルトガル語、マレー語/インドネシア語、フランス語に次いで8番目に多い。 (Wikipediaの「日本語」より抜粋。便宜上、一部注釈を排除)


Google翻訳 → 判定:82点


まずまずの結果です!Grammary先生の指摘は以下のとおりです。
  • Japanese → the Japanese
  • In factは不要かもしれないよ
  • and → ,and (コンマがないよ)
人の目で見ると、謎の「There is.」が挿入されてますね。

DeepL翻訳 → 判定:96点


ほぼ完璧な点数が出ました!Grammarly先生曰く、

  • documents, → documents(コンマ要らないよ)
  • there are more than 130 million people living → 冗長な表現になってるから、言葉を変えたほうがいいかも
  • Japanese → the Japanese

だそうです。人の目で見ても、たしかに自然な英文になっています。


日→英翻訳対決は、点数の高いDeepL翻訳の勝ちです。


3回戦:総合力

再翻訳をすれば、その機械翻訳の実力がひと目で分かります。
2回戦の英文を、そのまま英→日翻訳にかけてみます。

Google翻訳

日本語は、主に日本および日本語で使用される言語です。
日本では公用語を法律で定めていませんが、法令等はすべて日本語で記載されており、様々な法令で日本語を使用することが定められています。実際、それは唯一の公用語です。
人口の正確な統計はありませんが、日本国内の人口、国外の日本人や日系人、かつては日本統治下にあった地域など、1億3千万人を超えるとされています。有る。統計に応じて、この数は、世界のネイティブスピーカーの数のトップ10にいる人の数です。
日本で生まれ育ったほとんどの人は母国語として日本語を話します。日本語手話は、日本語の文法体系と音韻体系を反映した手話です。
2019年4月の時点で、インターネット上の言語ユーザーの数は、英語、中国語、スペイン語、アラビア語、ポルトガル語、マレー語/インドネシア語、フランス語に次いで8番目に多いです。

日→英翻訳時の「There is.」のせいで「有る。」が挿入されちゃっていますが、再翻訳でこのクオリティは凄いと思います。 


DeepL翻訳

日本語は、主に日本で、日本人の間で使われている言語である。
日本には法律上の公用語はありませんが、法令やその他の公文書ではすべて日本語で書かれており、実質的には日本で唯一の公用語となっています。
人口に関する正確な統計はないが、日本には1億3,000万人以上の人が住んでいると推定されており、日本以外の国に住む日本人や日系アメリカ人、旧日本軍に占領されていた地域の住民もいる。統計にもよりますが、この数は世界の母語話者のトップ10に入っています。
日本で生まれ育った人のほとんどが日本語を母国語としています。日本の文法・音韻体系を反映した手話があり、それが日本語対応手話です。
2019年4月現在、インターネット上で使用されている言語としては、英語、中国語、スペイン語、アラビア語、ポルトガル語、マレー語/インドネシア語、フランス語に次いで8番目に多い。

やはり「です・ます」調と「だ・である」調がバラバラですが、全体として非常にわかりやすい日本語に仕上がっています。
特に「この数は世界の母語話者のトップ10に入っています」がとても自然ですね。


DeepL翻訳が対応している言語

DeepL翻訳は以下の11言語に対応しています。(2020年9月現在)
  • 日本語
  • 英語
  • ドイツ語
  • フランス語
  • スペイン語
  • ポルトガル語
  • イタリア語
  • オランダ語
  • ポーランド語
  • ロシア語
  • 中国語
だいたいのメジャーどころは抑えていますが、ヒンドゥー語、マレー語、アラビア語、韓国語とかは未対応です。
以上の11言語以外の言語を翻訳したい場合は、Google翻訳を使いましょう。
Google翻訳はほぼすべての言語に対応しています。


まとめ

Google翻訳も健闘していますが、自然さでいえばDeepL翻訳に軍配が上がるのではないでしょうか。
ぜひ使ってみてください。きっと翻訳文の自然さに驚くはずです。