自動翻訳サイト frengly.com を試してみた。

自動翻訳サイトというのは大抵の場合ろくでもない出力しか返さないことに決まっているのであるが、しかし概要を掴むには便利なのも事実であって、また技術の進歩は私の知らないところでおこっていて、いつか超絶自動翻訳エンジンがわれわれ日々の労苦から解放してくれるのではないかという淡い夢を私はどうも捨て切れないらしく、翻訳エンジンと聞けばうかうかと試してみるのである。

今回みつけたのは http://www.frengly.com/ というサイト。日英仏伊西独中韓露など24の言語に対応した翻訳サイト -frengly.com | コリス で紹介されていた。24言語とわりあい多数の言語を扱える。ほとんどはヨーロッパ語だが、日本語・中国語・朝鮮語・ヒンズー語も扱える。また altavista などでは手で英語を経由しないといけない英語以外から別の英語以外の言語が(インターフェイス上では)直接に翻訳できるという。

さっそく試してみた。ちょうど私の手元にはウィキメディア財団の年末恒例寄付募集キャンペーン(http://wikimediafoundation.org/wiki/Donate/ja でみなさまの浄財をお受けしております)のおかげで、翻訳エンジンに食わせて検証する短い多言語のサンプルがたんと溜まっている。

寄付キャンペーンページの一節。というかエレメント。英語である。以下、http://meta.wikimedia.org/wiki/Fundraising_2008/core_messages の各言語のページ(英語とドイツ語)から取ってきている。これくらいの量を翻訳させれば、翻訳エンジンの場合、だいたいの力量はわかる。

Support Wikipedia

* 70. Donate Now
* 71. Millions of people around the world will learn something new on Wikipedia today. As a non-profit supporting a global volunteer community, we strive to bring more and better information in all languages to people everywhere, free of charge, and free of advertising.
* 72. Your donation will help us to continue Wikipedia's operations, and to make it more useful to you.
* 73. Wikipedia is supported by The Wikimedia Foundation, a 501(c)(3) tax exempt charitable corporation based in San Francisco, California. In the United States, you may deduct donations from your federally-taxable income. All credit card donations are completed by PayPal.

ナンバーが打ってあるのは、テンプレートにはめこんでいく際の符牒である。あまり気にしないでください。翻訳されることを前提とした文章なので、出来るだけ複雑な構文を使わず、またお金に関することなので難解な語句は使わずに書いてある。つまりあまり難しいことはいっていない。自動翻訳に食わせる文章としてはかなり筋のよい文章のはずだ。ただ、翻訳をしているときに、ボランティアから質問が多出した箇所がひとつ含まれている。"completed by PayPal" という部分で、クレジットカードでの送金手続きが最終的には PayPal 上の取引として行われるということをいっているのだが、さて、自動翻訳ではどうなるか。

まず日本語*1

サポートウィキペディア

* 70 。寄付する
* 71 。今日、世界中の何百万人のウィキペディアに何か新しいことを学ぶ。は、非営利の世界的なボランティアコミュニティの支援、我々の人々至る所には、無料ですべての言語情報をより向上させるには、努力と広告は無料です。
* 72 。あなたの寄付Wikipediaの事業を継続し、参考となるように、よりお客様に便利になります。
* 73 。 Wikipediaウィキメディア財団は、 501条( c ) ( 3 )公益法人税の免除サンフランシスコ、カリフォルニア州に本拠を置くでサポートされています。米国では、お客様の連邦政府が課税所得から寄付金を差し引くことがあります。すべてのクレジットカードの寄付はPayPalまでに完成されています。

……何かをいおうとしてがんばっていることは伝わる程度の出力である。だがこれが理解できるのは原文を読んで理解しているからかもしれない。人様にみせる文章としては使い物にならない。「お客様の連邦政府」ってのはなんだろうね(原文は your federally-taxable income つまり「あなたの連邦税課税対象となる所得」である。このくらいの複雑な、また即興的な表現には対処できないようだ)。英語から日本語は期待しないほうがよさそうである。問題の箇所は「すべてのクレジットカードの寄付はPayPalまでに完成」……これで分かる人がいたらすごいなあと思う。

この手の翻訳エンジンで、「英語から他の印欧語」は比較的使い物になるという話があって、Google Translation もまあ我慢できるくらいの出力を返していた。というわけで、英語からドイツ語と、同じ文章をドイツ人が英語から訳したものをもう一度食わせるということをやってみる。

まず英語からドイツ語。

Support der Wikipedia

* 70. Jetzt Spenden
* 71. Millionen von Menschen auf der ganzen Welt lernen etwas Neues auf Wikipedia heute. Als Non-Profit-Unterstützung einer globalen Freiwilligen-Community, wir streben, um mehr und bessere Informationen in allen Sprachen zu den Menschen überall, kostenlos und frei von Werbung.
* 72. Ihre Spende hilft uns, weiterhin Wikipedia-Operationen, und, um es mehr nützlich für Sie ist.
* 73. Wikipedia wird von der Wikimedia Foundation, eine 501 (c) (3) steuerfrei karitative Unternehmen mit Sitz in San Francisco, Kalifornien, USA. In den Vereinigten Staaten, können Sie abziehen Spenden von Ihrem eidgenössisch-steuerpflichtigen Einkommens. Alle Kreditkarten-Spenden sind von PayPal.

のっけから、Support der Wikipedia って何やねん、Support はドイツ語ちゃうぞと思うが、うんと好意的に解釈すると、Support を名詞ととり、der Wikipedia は女性属格で「ウィキペディアの支援」といっているのかもしれないが、まあそれはないな。ていうか元の文章はたんなる命令形なんだからそれを訳せないのは、ちょっとへたれな感じがする。

とはいえ、日本語に訳したときよりははるかによい感じで、非文ではない文もところどころ見えている(非文もある、たとえば71の二番目の文はそうだ。これは定動詞倒置でなければならない)。問題の PayPal 云々の箇所は "Alle Kreditkarten-Spenden sind von PayPal." 「すべてのクレジットカードによる寄付は PayPal による」とでも訳そうか、舌足らずだけど「PayPalにより完成される」よりはましな気がする。なお人間が訳したバージョンでは上の文章はこうなっている。

Support Wikipedia

* 70. Jetzt spenden
* 71. Millionen Menschen auf der ganzen Welt werden heute etwas neues auf Wikipedia erfahren. Als gemeinnützige Stiftung, die eine weltweite Gemeinschaft von Freiwilligen unterstützt, streben wir danach, mehr und bessere Informationen in allen Sprachen für alle Menschen bereitzustellen – kosten- und werbefrei.
* 72. Ihre Spende hilft uns, den Betrieb der Wikipedia sicherzustellen und sie noch nützlicher zu machen.
* 73. Wikipedia wird von der Wikimedia Foundation betrieben, eine steuerbefreite gemeinnützige Organisation mit Sitz in San Francisco, Kalifornien. In den Vereinigten Staaten können Spenden an die Foundation steuerlich geltend gemacht werden. Spenden per Kreditkarten werden über PayPal abgewickelt.

frengly.com の英語→ドイツ語翻訳のひとつの癖は、訳すべき動詞を忘れてしまうことにあるようだ。たとえば 71の後半は「より多くのより良い情報をすべての言語であらゆる地域の人々へ、無料、広告なしで提供できるように私達は努めています」といっていて、だから「提供する」という動詞が出てくるはずである。人間が訳したバージョンでは bereitzustellen (zu 不定詞だが、分離動詞なので zu が途中に入る)がそれにあたる。ところが frengly.com のバージョンでは、streben のあとには動詞が出てこない。どこかに呑まれて消えてしまっている。同じことは 73の最初の文、「ウィキペディアウィキメディア財団……により支援されています」でも起こる。これは受動文なので人間バージョンでは "Wikipedia wird von der Wikimedia Foundation betrieben"*2となるのだが、frengly.com バージョンでは"Wikipedia wird von der Wikimedia Foundation, eine 501 (c) (3) steuerfrei karitative Unternehmen mit Sitz in San Francisco, Kalifornien, USA." と wird のあとに出てくるべきメインの動詞が出てこない。どうも、これでは大まかな意味を取るのも難しいのじゃないか、ある意味「サポートされています」とメインの動詞を訳した日本語の方がまだましなんじゃないかとも思えてくる。

気を取り直して、ドイツ語→英語の逆変換をやってみる。ドイツ語は上の引用をそのまま食わせる。

Support Wikipedia

* 70

* 71st donate now Millions of people around the world are now something new to learn on Wikipedia. As a nonprofit foundation, a worldwide community of volunteers, we strive for more and better information in all languages available for all people - cost and ad-free.

* 72nd Your donation helps us to understand the operation of Wikipedia and ensure they are still useful to make.

* 73rd Wikipedia is used by the Wikimedia Foundation, a tax-exempt charitable organization based in San Francisco, California. In the United States can donations to the Foundation for tax enforcement. Donations via credit cards through PayPal settled.

なんか気を利かせてもとの文では基数だったナンバリングを序数にしている。余計なことをするなといいたいが、まあ瑣末なことではあるので文法的なことをみにいく。とそれ以前に、70のあとにすぐ続くべき donate now がなぜか71のあとに送られていて、ぐんにゃりする。

71以下も微妙にひどい気がする。71の前半、"people ... are now something new to learn" ってどうみても「人々が新しいことを学んでいます」には読めない。71の後半は非文にはなっていないようだが、これは cost- and ad-free じゃないとまずいんじゃないだろうか、って英語でもそういうかどうかは知らない(ドイツ語だと普通の語法)。72の "Your donation helps us to understand the operation of Wikipedia" も微妙である。sicherzustellen は ensure に訳されたとみるのが自然かと思うのだが、understand がどこから出てきたのかは謎。ていうかもとの文の zu 不定詞がふたつあった構文を解析できているのに、そこで使われる動詞がなんだかずれている(to ensure ... and (to) make にならなければおかしい)。73もまた微妙で第1文「運営されています」が「使われています」(is used by)になるのはだいぶ辞書が気が狂っているのではないだろうか。あとも似たようなものなので細かく見ていくのはやめにする。

ドイツ語→日本語も試してみる。「第○○」等の出力から判断するに、内部でいちど英語をくぐらせているような気がする。Google Translation と同じやりかたですね。二回の翻訳がなされている分、文の壊れ方も英語から翻訳したときより、さらにひどくなっている気がする。が、まあ、ハナモゲラよりは何をいっているかはわかるだろう……

サポートウィキペディア

* 70
* 第七十一今すぐ寄付する現在、世界中の何百万人のWikipediaの新しい何かを学ぶことがあります。非営利の基盤として、ボランティアの世界的なコミュニティは、すべての人々のために利用できるすべての言語より、より良い情報のために努力する-コストと広告なし。
* 第七十二お客様のご寄付ウィキペディアの運営を理解し、彼らはまだ有用であることを確認することができます。
* 第七十三Wikipediaウィキメディア財団は、課税対象外の慈善団体サンフランシスコ、カリフォルニア州に本拠を置くで使用されます。税の施行は、米国では、財団の寄付をすることができます。 PayPalのクレジットカード経由での寄付を通じて和解した。

completed by をどう訳すかが見所のはずだったのだが、そこへ行くまでに気力が尽きかけました。ここでは「和解する」っていってますね。もうなんだかわけがわからなくなっている。まあ、とはいえ、Free Tibet を「無料チベット」と訳す Google Translation よりは、数倍ましな気はする。だけれど、やはり実用には適さない、少なくともこれを使って何かを正確に理解したり翻訳する訳にはまだ当分立たないような気がする。いっぽうで何が話題になっているのか概略を掴むには、そこそこ訳にたちそうな気はする。まあ、なにか面白そうな記事を見つけてひとりでこっそり楽しんだり、相手に詳しい説明を求める前の情報収集に使う分にはいいんじゃないでしょうか。

さて、ウィキメディアのほうは今週から寄付キャンペーンの第二フェーズに入った。すでに英語版では新しく追加したバナーもある。今週末にかけてその翻訳作業なのだけれど、夢を見ずに地道に作業し、ボランティアのみなさまに声をかけて回ることにしますわ……。

関連サイト:

一日一チベットリンク。桜庭薫「ダライ・ラマ、仏大統領と会談 中仏関係に影響不可避」、日経、2008年12月7日。

*1:引用時に改行を補い、整形した。

*2:受動態助動詞 werden (3人称単数現在なので wird)+定動詞の過去分詞 betrieben。