■■━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━■■ 英日翻訳ソフト = チューニングすればこんなに良くなる! No.036 2006.12.15 http://www.aptransways.net/ ■■━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━■■ バックナンバー → http://www.aptransways.net/mmagtop.htm 読者の皆様、ご購読ありがとうございます。 メルマガ発行者の kawa です。 今回は、コンピュータ関係の技術文を翻訳してみます。 この例文は、構造的に決してむずかしい英文ではないのですが、 翻訳ソフトの弱点がいくつか表面化してしまう要素を持っています。 今回の例文とその目標訳 ∞∞∞∞∞∞∞∞∞∞∞ 【例文】 With this utility, you can select and display log records based on their type, the data they contain, or their sequential positions in the data set. 【目標訳】 このユーティリティを使用すると、ログレコードのタイプ、ログレコード に含まれるデータ、またはデータセット内のログレコードの順次位置に 基づいてログレコードを選択し表示することができます。 ∞∞∞∞∞∞∞∞∞∞∞ 上の例文を翻訳ソフト(T社製)の初期設定で翻訳すると、次のような 訳文が出力されました。 【初期設定での翻訳結果】 「このユーティリィティで、それらのタイプ、それらが含んでいるデータ あるいはデータセット中のそれらの連続する位置に基づいた丸木レコード を選択し表示することができます。」 △△ 「それら」って何???...、という疑問がまず生じると思います。 こんなにわかりにくい日本語になってしまった原因は、英語と日本語で 語順が大きく逆転してしまったにもかかわらず、指示代名詞の「それら」 が直訳のままになっているからです。英日翻訳ソフトではよくあること です。 「それら」とは "log records" のことであるわけですが、英語を読ま ないとそれがわからないような困った翻訳結果だと言えます。 指示代名詞が何を意味するかまで解析して翻訳結果に反映させる技術が、 翻訳ソフト開発の将来の課題になっているという話を、十数年前に聞いた ことがありますが、それが達成された例を筆者はまだ見たことがありま せん。それだけむずかしいことなのでしょう。 今回の例文の場合は、"based on" の直前で文を切って、2 文に分けて 訳すことで日本語をわかりやすくする方法もあるかと思いますが、翻訳 ソフトはなかなかそこまでできないので、その手法は別の機会に譲りたい と思います。 とりあえず、単語レベルでの問題を解消するために、 以下の単語(複合語)をユーザー辞書に登録します。 このとき、必要に応じて訳語選択や学習機能も使用します。 utility (名詞) ユーティリティ (←学習) sequential position (名詞) 順次位置 log record (名詞) ログレコード すると、翻訳結果が次のように変化します。 【ユーザー辞書登録後の翻訳結果】 「このユーティリティで、それらのタイプ、それらが含んでいるデータ またはデータセット中のそれらの順次位置に基づいたログレコードを選択 し表示することができます。」 ↑ 単語レベルでの問題はなくなったと思いますが、根本的な構造上の 問題は残っています。 もう少しどうにかして目標訳に近づけたいと思っても、ユーザー側で できる翻訳結果のチューニングは、普通はここまでです。 -------------------------------------------- (注) 高額な翻訳ソフトが装備する翻訳メモリー機能(ファジーマッチ 機能)や、変数指定型例文登録機能(パターンマッチ機能)などを使用し て翻訳結果をチューニングする方法もありますが、このメールマガジン では、あくまでも翻訳エンジンとユーザー辞書を使用した翻訳方法に限定 した場合に、どこまでできるかをテーマとしたいと思います。 -------------------------------------------- 通常は、この結果で妥協するしかないわけですが、これをもう少し読みや すくするために、ここで筆者の Web サイトに用意した訳出文リライト ツール(試作版)を使ってこの訳文を書き直してみます。 上記の翻訳結果(訳出文)を以下の URL にあるテキストエリアに貼り付 けて、[リライト実行] ボタンをクリックしてみてください。 http://aptransways.net/APT.htm すると、訳文が次のように書き直されます。 【訳文の自動リライト結果】 「このユーティリティでは、ログレコードのタイプ、ログレコードに含ま れるデータ、またはデータセット中のログレコードの順次位置に基づいた (基づいて)ログレコードを選択し表示することができます。」 いかがでしょうか?。少しはわかりやすくなったのではないでしょうか。 3 箇所にあった指示代名詞の「それら」を具体的な単語に置き換える リライトルールを作ってみました。 あと、英語の "... based on 〜" を、連体修飾(〜に基づいた...)で 訳すべきか連用修飾(〜に基づいて...)で訳すべきかについても、翻訳 ソフトはよく誤って判断します。 このミスを訳出文リライトツールで自動的かつ正確に修正するのは ほとんど不可能に近いので、連体修飾の表記と連用修飾の表記を並記して おいて、あとは人間の判断に委ねる形にしました。 つまり、これ以上はユーザーが必要に応じて再修正することになります。 訳出文リライトツールには多少の柔軟性を持たせてありますので、試しに 名詞や動詞などを別の単語に変更してみるとどうなるか、遊んでみてくだ さい。 【翻訳ソフトを持っていない方は......】 ∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞ 今現在、手元に翻訳ソフトを持っていない方は、次の方法を試してみて ください。 (1) 今回の例文を、以下の無料翻訳サイトで日本語に翻訳させる。 ・So-net 翻訳 (powered by AMiKAi) http://www.so-net.ne.jp/translation/ ・fresh EYE 英日・日英翻訳 (supported by The 翻訳) http://www.fresheye.com/translate/ (2) 翻訳結果(日本語)を、以下のページで自動リライトする。 ・T社製翻訳ソフト対応リライトツール(Tバージョン) http://aptransways.net/APT.htm 辞書のチューニングができない分、翻訳結果に問題が残りますが、それで も少しは翻訳結果が改善するのを確認できると思います。 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ■「メルマガ相互紹介」募集中です! ご希望の方はこちらまでご連絡ください。 kawa@aptransways.net 発行部数にはこだわりません。 創刊後であれば OK です。 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ―――――――<このメールマガジンについて>―――――――――――\n このメールマガジンでは、毎回さまざまな英文を翻訳ソフトに翻訳させて、 ユーザー辞書のチューニングや自作ツールによって翻訳品質が大幅に改善 する事例を紹介しています。例文は、一般文、時事英文(ニュース記事)、 技術文(IT 分野を中心とした理科系全般)など、さまざまな分野の英文 から選んでいます。 バックナンバー: http://www.aptransways.net/mmagtop.htm ご意見・ご感想・ご要望は → kawa@aptransways.net ―――――――――――――――――――――――――――――――――\n □―――――――□ 編集後記 □―――――――□ このメルマガでも使っているN社製翻訳ソフト(本格翻訳)をバージョン アップし、旧バージョンと新バージョンを比較してみました。その比較 結果について筆者のブログ(AP Blog!)に書きましたので、興味のある方 はどうぞ(12/11 記)。 AP Blog! → http://blog.aptransways.net/ 次回は、12月22日(金)から12月29日(金)の間のどこかで配信する予定\nです(ひょっとすると年を越すかも?)。 ∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞ 英日翻訳ソフト = チューニングすればこんなに良くなる! No.036 発行者: kawa サイト: http://www.aptransways.net/ メール: kawa@aptransways.net バックナンバー: http://www.aptransways.net/mmagtop.htm 発行システム: 『まぐまぐ!』『Melma!』『独自配信』 配信解除: 以下のアドレスから読者様ご自身でお願いいたします。 ○まぐまぐ(ID:0000185648) http://www.mag2.com/m/0000185648.html ○Melma!(ID:150733) http://www.melma.com/backnumber_150733/ ○独自配信の方は、このメルマガに対して「配信解除希望」という件名の 空メールを返信していただければ、配信を停止いたします。 無断転載禁止ですが、メール転送は OK です。 ∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞∞