2023年9月15日金曜日

【AI翻訳アカデミー】#塩貝香織 疑わしい翻訳講座の見破り方



 また出てきました。AIに翻訳を任せれば「英語力不問」で翻訳家になれるという講座です。
 
 実はこの講座は、2019年から2020年にかけて問題になった講座と同じ販促業者が後ろで糸を引いている講座です。以前問題になった講座については2020年2月25日火曜日のこちらの記事の記事と2020年11月7日土曜日のこちらの記事の記事をご参照ください。

「英語力ゼロでも即収入」は誇大広告|機械翻訳の訳文を修正する仕事は日本語だけ見て直すのではない

「英語力ゼロでも即収入」という広告に惹かれて、機械翻訳の訳文を修正する仕事に応募したいと考えた人も多いでしょう。しかし、この仕事(機械翻訳の後編集、いわゆるポストエディット)は日本語だけを見て手直しする作業ではありません。英語と日本語を照らし合わせながら間違って訳されているところはないかを「クロスチェック」する作業です。

 機械翻訳は完璧ではなく、文法や固有名詞、意味など(例:否定と肯定が逆になるなど)に誤りがあることがあります。そのため、訳文を修正するには、原文の英語を理解して、正しく修正する必要があります。英語力がないと、原文や訳文の意味が分からなかったり、間違った修正をしたりする恐れがあります。また、この仕事は納期や品質に厳しい要求があることも多く、簡単に収入を得られるというものではありません。機械翻訳の訳文を修正する仕事は、英語力や翻訳スキルが必要な専門的な仕事です。誇大広告に騙されないように注意したいものです。


疑わしい翻訳講座の見破り方

以下は、これまでに出てきては消えた、複数の疑わしい翻訳講座の主な特徴です

----------------------------------------------------------------------------

・英語力が低くても(ゼロでも)翻訳者になれると誇大広告している

お試しレッスンや授業見学の類が一切ない。あるのは宣伝動画内のダミーの受講生の体験談だけ

・LINEのLステップというしくみを使い、申し込みページを開いた瞬間に「あと●日〇時間△分■秒と、カウントダウンが始まる(焦って契約させようとする)

・高額な2種類の講座を勧めた後(約50万円、約30万円)、サポートなしの動画教材(約7~8万円)を売り出し始める

・人数限定のはずなのに、当初の予定人数を超えてもいつまでも締め切らず、参加者の数が膨れ上がっている

・結果、少ない人数で大量の受講生の相手をしているのでサービスの質が落ち、質問しても課題を出しても全然返事が来ない

・資料請求のページもなく、講師のプロフィールが一人分しかない(一人で対応できない数の受講生を受け入れている)

・教材の詳しい内容が書かれていない

・翻訳者になった場合のメリットばかりを強調する(デメリットについては言わない)

・翻訳の基本的な知識や技術を教えずに、経歴詐称、もしくは詐称スレスレの「実績の書き方」を勧める

・翻訳は簡単にできるのだとやたら強調する

・翻訳でいくら稼げると、やたらと金額の話ばかり強調する

・ランディングページの一部に札束、または一万円札の画像が入っている(new!)

・講師が自分の年収の話をやたらと自慢する

・講師が過去の実績を実際のクライアントの実名を出して語っている(秘密保持契約違反の可能性)

契約書や教材を交付しない、または不備がある

・「特定商取引法に基づく表記」欄に「本商品に示された表現や再現性には個人差があり、必ずしも利益や効果を保証したものではございません」という一文、またはそれに類似した文言が入っている。

特定商取引法に基づく表記」欄に「インターネットによる通信販売では、特定商取引法に定められたクーリングオフの対象外となります」という一文が入っている

・返金や解約に応じない、または返金条件が異様に(常識の範囲を超えて)厳しい

・講座の中の様子を外部に漏洩した場合、異様に高額の違約金(受講料以上の金額であるなど)が課せられる(違約金の合理性については弁護士などに法律相談してください)

----------------------------------------------------------------------------

いかがでしたか?あなたが気になっている講座の特徴にいくつ当てはまりましたか?


AIは言語を「理解」していない

 でも、「AIを使えば英語力がなくても翻訳できるのでは?」と考える人もいるかもしれません。無料動画(③)で講師がこのように述べていますので、そこに惹かれた人も多いと思います。しかし、これは事実ではありません。



AI(人工知能)は原文を「理解」していません。過去に読み込んだ大量のコーパス(対訳データ)から近似値をはじき出しているだけです。運が良ければ高い精度の訳文のように見える結果が出ますが、そうでないときは「もっともらしい嘘(ハルシネーション)」を吐き出すこともあります。



AI、機械翻訳の誤りは「ぎこちなさ」だけではない

 なぜ、AIに翻訳を任せてもその修正作業をする人間に語学力が必要なのか、説明しないと納得できない人もいらっしゃると思いますのでお話しします。

  AIや機械翻訳の品質を評価する際に、大きく分けて「流暢性」と「正確性」という2つの評価軸があります(実際には他にも評価軸はありますがここでは省略します)。この2つを介して評価すると、訳文には以下の4パターンが考えられます。

①表現はぎこちないが内容は正確に訳されている(流暢性=×、正確性=〇)

②表現は滑らかで読みやすいが内容に誤りがある(流暢性=〇、正確性=×)

③表現もぎこちないし内容自体にも誤りがある(流暢性=×、正確性=×)

④表現も滑らかで読みやすく、内容も正しく訳されている(流暢性=〇、正確性=〇)

 翻訳のこと、AIのこと、機械翻訳の現在の精度について詳しく知らない一般の人々のなかには、「機械翻訳がここまで進んだ!」「効率が上がった!」という記事や投稿を目にして、①のような訳文を手直しすればいいと勘違いしている人が多いようです。

 つまり、AIの吐き出す訳文は多少ぎこちないが、人間がちょっと手を入れれば英語が分からない人でも正しく修正できるレベルだと勘違いしている人もいるということです。しかし、これは誤りです。実際にはそこまで楽な作業ではありません。

 確かに、分野によってはそのレベルに近いものも出てきていますが、実際の汎用エンジンの機械翻訳の現在の精度は②や③のレベルのものがまだまだ多い印象です。日本語が流暢であるばかりに意味が違っていることが見過ごされている「隠れ誤訳」が多く散見されます。実はこういった誤訳こそが重大なのですが、これに気付くには当然のことながら原文を読んで理解するだけの語学力が求められます。

 多少の誤りであれば全体の意味に大きく影響を及ぼさないケースもあると言う人もいるかもしれませんが、中には肯定と否定が逆になっている、構文の係り受けの解釈ミスで全く違う意味になっているなどの重要な間違いが含まれているケースもあります。

 機械翻訳の後編集、いわゆるポストエディット(MTPE)という仕事では、出力された訳文の正確性は保証されていないため、原文と訳文をしっかり照らし合わせて点検するクロスチェックの作業が必須です。

 上であげた①~③のパターンのどれか分からない、合っているか間違っているかも分からない訳文を、④のレベルにまで仕上げることを要求されているのがポストエディターの仕事です(「AI翻訳家」などという珍妙な職業名は少なくとも私はこれまでに聞いたことがありません)。

 興味を惹かれるのは理解できます。英語力がなくてもできるかもしれない、やってみなくちゃ分からないじゃないか、という気持ちは分からなくはありません。しかし、一度振り込んでしまったらお金を取り返すのは本当に大変です。50万円というお金は決して安いお金ではありません。それでもこの大博打に賭けてみたいという方、止めはしません。結果的にお金を稼ぐことができなくても構わないというなら仕方ありません。そのお金は戻ってこない覚悟で、申し込んでください。

 この通り、鬼のように厳しい返金条件ですから、ほぼ返ってこないと見て間違いないでしょう。


 ※広告の内容と実際のサービスの中身が違う「景品表示法違反」、事実と違うことを伝えられて錯誤状態で契約させられた「消費者契約法に該当する事例」等で契約解除、返金交渉をしたいという方は相談に乗ります。こちらからご連絡ください。

 

2023年7月7日金曜日

新ブログページ「翻訳個人事業主の仕事 Season 2」へ引っ越しします。

 2017年に開始したブログも、ここ最近では更新頻度も減り、話題もあちらこちらへ飛んでしまっているので、1度投稿の種類によって自分のもっている媒体を整理したいと思うようになりました。

 このブログは当初、「翻訳の仕事を始める人のために、翻訳回りの庶務的なことをまとめたページにしたい」という思いで始めたものですが、このブログの他にも翻訳の仕事についてまとめた「翻訳者スタートガイド.net」を立ち上げたり、Kindle本を出版したり、翻訳の仕事の探し方情報に特化したnoteアカウントを作ったりなどしてきたので、今後、ブログでは「純粋に自分が翻訳者として考えていることを書く場所にしたい」という思いが強くなりました。

 新しいブログのURLはこちらです。始めるにあたってどういうコンセプトでいきたいのか、少しですが書いていますので、よほどお時間があるようであればご覧ください。(笑)

 ただ、古くなった記事も読み返せば「当時はそういう状況だったのだな」と分かるアーカイブ資料でもありますし、部分的には役に立つ場合もあるかもしれないので、こちらのブログはこのまま置いておきます。

 それでは新旧ブログをどうぞよろしくお願い致します!

2023年5月18日木曜日

断言しない

 これまでTwitterやこのブログで翻訳者の手にまだ残る仕事がある、と言うと

一部の人から
・「業界の保身に聞こえる」
・「年配で(過去に)儲かりやすかった人が翻訳の価値を謳うことが多い」
・「機械翻訳はかなり進化している。自分の分野での進化を確かめてみては」

...のコメントを頂戴してきました(エアリプの場合もあり)。

 自分の働く業界を守っていったい何が悪いのかと思いますが、産業革命の時のラッダイト運動(機械打ちこわし運動)のように思われているのではないか、つまり自分たちの雇用を守るために機械翻訳やAIの進化を邪魔しているのではないかと考える人たちが、「翻訳者たちが『何とかしなければ』と声をあげること」自体を破壊的な行為とみなしているということでもあるのではないか、と思います。

ですから翻訳者の仕事は残ります、と「断言」してしまうと、

「(こんなに精度があがったのに翻訳者ごときが)まだAIのことをディスっているのか!」と怒る人が一定数いるように感じられるので、未来のことについて何事も断言できないということを肝に銘じる必要があるかもしれないと思いました。

ですから、今後は例外的な場合を除いて常に「...可能性がある」という言い方にしようと現時点では思っています。

・翻訳者の手には機械翻訳、AIの限界に関連してまだ仕事が残される「可能性があります

・少なくともまだ数年は語学に関連した仕事に就ける「可能性があります

と言えば、ただ可能性の話をしているだけなので誰からも文句は出ないのではないかと。

つまりは決めつけない、一般化しない、主語を大きくしない、いつの話をしているのか明確にする(現時点の話であるなら「少なくとも現時点では」と面倒でもいちいち言う)ということですね。

まあ、ものを書かせていただき、どこかの誰かにお読みいただく以上、当然のお作法かもしれないですが、正直、めんどくさいですね。

2023年4月23日日曜日

Word Connection社主催Human Powered2023「ChatGPTは翻訳を変えるのか」参加感想

 マイアットかおりさんの会社、Word Connection主催Human Powered2023「ChatGPTは翻訳を変えるのか」に参加しました。

・前半はITコンサルタントの酒匂寛さんによるプレゼンテーション、

・後半は奈良先端科学技術大学院大学(通称NAIST)准教授の須藤克仁先生によるプレゼンテーション、

・休憩をはさんでマイアットかおりさんのプレゼンテーション、

・最後に三方による事前質問への回答+ディスカッションという構成でした。

 前半の酒匂さんのプレゼンテーションの情報量は圧巻でした。特に印象に残ったのは「CharGPTに『翻訳』を頼むのではなく「伝えたい事」を教えて作⽂してもらうという戦略」というところでした。原文をそのまま入れて「翻訳してください」と言っても上手くいかなかった文章も、そもそもやりたいことが「翻訳」ではなく何かを伝えることなのであれば、「こういう文章を作ってください」と命令すれば作文してくれる、という使い方ができる、という視点です。

 (ここからは私の意見ですが、こうした使い方をすれば今後、自治体などで災害時の避難情報を多言語翻訳する際に、原文として日本語で作文してから機械翻訳に入れるのではなく、例えば「〇〇川流域の住民に対し、速やかに非難するよう促す警告文を英語、スペイン語、ポルトガル語、中国語、韓国語の5カ国語で作成してください」などとプロンプトを入れれば作成できるだろうなと思いました。気になったので実際、このようなプロンプトでChatGPTに命令してみたところ、それっぽい文章を各言語で出してきました。英語以外の言語は私は理解できないので、それぞれDeepLで英語に逆翻訳したところ、特に重大な誤訳をしている可能性が感じられる箇所は見当たりませんでした)

 後半の須藤先生のプレゼンテーションは、生成系AIに関する中身の詳しい話で、かなりテクニカルな話で正直私には難しく、途中でついていけなくなってしまったのですが(雑な感想ですいません)、最後に「言葉のチカラは重要。平均値の言葉で埋め尽くされるのはディストピアだと思っている」というお考えを聞いて、私を含め多くの翻訳者と(おそらく)向いている方向は同じだと感じました。

 マイアットかおりさんのプレゼンテーションでは、実際にご自身で使ってみた結果などをシェアしてくださり、翻訳に関連してChatGPTでどんなことができるのか解説してくださいました。また、守秘義務の観点から情報流出の懸念があるため顧客から預かった資料をAIに入れることはできない点、出力に信憑性がないためリサーチには使えない(不安が残る)などの懸念についても言及されていました。

 もともと私も、自分でも使ってみたりしていて「すごいものが出てきたなあ」と思っていたところだったので、「ChatGPTなんて嘘ばっかりつくし大したことない」などと言うつもりは毛頭なく、この話題の生成系AIでどんなことができるのか、ということを三人の方が膨大な情報量とともに解説してくださって、非常に興味深く有意義なセッションでした。今後少しずついろんなことが大きく変わっていくのは確実だろうと思いました。

 改めて感じたのは酒匂さんが説明してくださっていた「翻訳でなく文そのものの生成をChatGPTに依頼する」という使い方により、自治体など予算がタイトな現場では今後、これまでのDeepLに変わってChatGPTのような生成AIが多言語翻訳に活用されるケースが想定されると感じました(外国語できちんとした文章にしないと伝わらず人命にかかわるなどと翻訳の意義を説明しても、無い袖は振れぬ場面では結局、人間翻訳者への外注が発生しないのはこれまで通りだろうという思い)。そうなると人間の翻訳は「贅沢品」として、そのニーズはますます「機械ではどうしても生成できない訳文の創出」という限られた範囲での発生になっていくのかな、という風に感じました。

 私としてはそれでもまだどこかでどうにかして言語にかかわる仕事を続けたいと思っているので(この仕事が面白いので)、このすごい発明品の後にやってくる(と思われる)業界地図の塗り替わりの後も、自分にできる仕事をできる範囲でやりたいという思いを新たにしました。そのためには、「人間にしかできない言語関連サービス需要の掘り起こし」という観点で自分の仕事の可能性を探り続けたいと思いました。

 なんかすごい世界になってきたなあという感じですが、まだまだリンギストたちにはやれることがたくさんあるだろうという思いは捨てていません。 

(P.S.ちなみに今日はこのセッションの前にJATの交流イベントもあってダブルヘッダーだったのですが、JATの交流イベントの感想は4/28の宮原さんとのインスタライブでお話しする予定です!インスタライブをお聞きくださる方は宮原さんのInstagramアカウントをフォローください。配信が始まると通知が届きます)

2023年3月3日金曜日

機械翻訳に適した原文・適さない原文

 以前このブログで記事を書いて炎上した、「機械翻訳の精度が今以上に向上したら人間の翻訳者は要らなくなるのかという問い」に再度向き合ってみたいと思います。

 この問いは職業翻訳者にとっては「明日の生活の糧が消えるのかどうなのか」という切実な問題であると同時に、機械翻訳の開発側・売り手側にとっては「人間翻訳者の活躍の場が残されている=機械翻訳が完全ではないことの証明」だと指摘しているように捉えられる可能性もあり、生半可な気持ちで手を出すと再びほうぼうから袋だたきに遭う可能性があります。

 にもかかわらずこの問いに再び挑む理由は、「翻訳者は最終的にいらなくなる」という認識をこれ以上広めると、本当に困るのは実は翻訳者ではなく、社会全体だと考えるからですこれから新しく翻訳業界に入ってくる人がいなくなり、業界から去っていく人が増えて人材不足に陥ると、社会のどこかで必ず困る人が出てきます。その理由について「機械翻訳にはそれに適した原文・適さない原文がある」ということを論じ、それを通じて業界内外の人に対し納得できる説明をする、というのが今回の記事の目指すところです。うまくいくか分かりませんので気持ちと時間にゆとりのある方はお付き合いください。
 前回の記事は「誰に何を言いたいのか明確でない」という指摘がありましたが、業界内外の人たち、広く一般に向けて書いていました。今回も同様です。翻訳業界の未来に一ミリも興味のない方にとっては「実益が一ミリもない」記事であって時間を損する可能性がありますのであらかじめご承知おきください。

目次

1. 機械翻訳に適した原文
2. 機械翻訳に適さない原文
3. 職業翻訳者を社会に残さなければならない理由
4. 将来に向けた提言(商業的成功の追求・政治的支援の可能性)


 前置きが長くなりましたが、大前提として、機械翻訳の精度は実際非常に高くなりました。これは紛れもない事実です。我々翻訳者もまずはここを認める必要があります。

 機械翻訳がこれだけ発展しても人間の翻訳者に活躍の場所が残されているのは、機械翻訳の「精度が不十分」だからではありません。そこが誤解されていると思います。「翻訳者なんかいずれはいらなくなる職業なのにまだ『機械翻訳はダメだ』と騒いでいる人たちがいる。それは機械翻訳の精度が低いからだ。機械翻訳もっと頑張れ」などと言う人がいますが、その認識は間違っていると思います。

 機械翻訳という道具はその性質上、どこまで精度を高めてもそれだけでどんな原文でも必ず訳せるというものではありません。ボタンひとつでどんな会話も文章も発言者の意図した通りに適切に翻訳されるというのはSFの世界です。発言にはほとんどの場合に文脈があります。人間の言語活動はそれほど単純なものではありません。機械翻訳には必ずそれに適した原文と適さない原文があります。

 機械翻訳に適した原文とはどういうものなのか。機械翻訳に適さない原文とはどういうものなのか。まずはその点についてそれぞれに分けて具体的に例を挙げて説明したいと思います。

1. 機械翻訳に適した原文


 機械翻訳に適した原文とは、ひと言で言うと文字通り訳(リテラル訳)に適した文章のことです(世間一般に言ういわゆる「直訳」のことです)。言外の意味が含まれていないローコンテクストな(文脈に依存しない)文章とも言えます。
 
 例えば、以下のように事実を平易に述べた文は機械翻訳に適しています。長いですが構文は平易で難解な表現や成句はなく、言外の意味が含まれる箇所もないので文字通りに訳せば比較的そのまま意味が通るので機械翻訳が得意とする文章です。これを二大MTに入れてみましょう。

Financial statements are written records that convey the business activities and the financial performance of a company. Financial statements are often audited by government agencies, accountants, firms, etc. to ensure accuracy and for tax, financing, or investing purposes.


【DeepL訳】
財務諸表とは、企業の事業活動や財務成績を伝えるための記録文書です。財務諸表は、政府機関、会計士、企業などによって、正確性を確認するため、また税務、融資、投資のために、しばしば監査される。

常体と敬体が混じっていますが、意味は通ります。常体か敬体のどちらかに統一するという微調整で済むので、MTPEで対応できる文です。)

【Google翻訳】
財務諸表は、企業の事業活動と財務実績を伝える書面による記録です。 財務諸表は、政府機関、会計士、企業などによって、正確性を確保するため、および税務、資金調達、または投資目的で監査されることがよくあります。

意味はギリギリ分かるので語順を入れ替えるなどして整えれば比較的読めると思います。ぎこちなさがあるのでこれを読みやすくするにはポストエディターにはそれなりに負荷はかかりそうですが、これぐらいのぎこちなさなら修正せずにそのまま使う、という選択肢もあります

 次は変化球です。一見、訳しづらいと思われる会話表現です。例えば、うどん屋さんに行って「私はきつねで」と言ったのをDeepLに入れたらこうなったとします。




 これはある意味、誤訳ではありませんし、「精度が低い」と言って笑うべきではありません。なぜなら文字通りにきちんと訳されているからです。精度という観点で言えばむしろ高いです。これが翻訳として機能しないのは、この文脈
(うどん屋でのオーダーという状況)において発話者の意図した内容が伝わっていないからです。つまり、これはこのままでは原文が機械翻訳に適さないということです。しかし、これは原文を機械が訳しやすいように編集することで解決できます。



 「きつね」ではなく「きつねうどん」とフルで言い換えています。きつねうどんをどうするのかについて「オーダーします」という動詞を補っています。しかしそれでも「きつねうどん」は"kitsune udon"としか訳されなかったのでこれでは通じないと思い、きつねうどんの説明をカッコ書きにして原文に追加しています。すると、「油揚げ」は"deep-fried tofu"ときちんと訳されています。これで英語圏の人にもkitsune udonがどのようなものか、おおよそは伝わると思います。

 このような作業のことを「プリエディット」と言います。このようにして「機械が訳しやすいように原文を編集」することによって機械翻訳はかなり高い精度で適切な訳文を生成します。

 教師データが多い分野や企業内で専用で動かしているエンジンなどではこの「きつねうどん」にあたるデータが機械学習されており、カッコ書きの説明を入れなくても発話者の意図した通りの訳文を出してくることもあります。

 実際、このようにすれば機械翻訳はかなり便利に使うことができます。英語が全く分からない人には十分に使いこなせないかもしれませんが、「自分で英作文はできないけれど出てきた英語の良し悪しは判断できる」という程度の英語力のある人が使えば、機械翻訳は非常に強い味方です。プリエディットしてから原文を機械翻訳に入れ、出てきた訳文を少し自分で修正すれば、平易な文章であれば外部の翻訳会社に依頼しなくても訳せるかもしれません。

 実際に、一部の企業ではそのようにして機械翻訳を社内で使うように奨励したり、上のような「プリエディット/ポストエディットのコツ」のようなことを外部講師を呼んで社員研修を実施するなどして、現場で積極的に機械翻訳を導入して業務効率化しようという動きもあるようです。そうした動きは今後ますます加速するでしょう。

 特にIR資料など、翻訳に即時性が求められる場面においては、「機械翻訳による翻訳です」という免責事項を記載することにより、機械翻訳による訳文の活用が広がっていくと思われます。

2. 機械翻訳に適さない原文


 一方、機械翻訳に適さない原文というのはどのような文章でしょうか。端的に言えば上記と正反対の文章ということになります。つまり、構文が複雑、または言外の意味を含む、文脈依存度が高い、という文章がそれに当たります。

  We all have vast potential inside of us, untapped levels of strength, intelligence, and focus, and the key to activating these superpowers is unlimiting yourself.

 この文章のように
 ①構文が取りづらいもの
 ②事実の伝達ではなく概念・思想のようなもの

 は機械翻訳に適さないことが多いです。

 これはTwitterで「なるいくん」(https://twitter.com/naruikun)さんが2023年2月20日の「今日のパンチライン」という投稿で紹介されていた原文です。
「なるいくん」さんはこのように訳されていました。(掲載にはご本人の了承を得ています)

人は皆、計り知れない潜在能力を秘めている。力、知性、集中力といった眠っている能力を開花する鍵は、自身に限界を作らないことだ。

 "activate"を「開花する」と訳すなど、辞書では見つからない訳語が採用されていますが原文のエッセンスが非常によく伝わる名訳だと思いました。

 この原文を日本語に訳す際の難しさはとくに、"vast potential inside of us" と、"untapped levels of strength, intelligence, and focus"が同格になっているところです。なるいくんさんは「計り知れない潜在能力」と「力、知性、集中力といった眠っている能力」が同格になっていることを意識し、読者にそのつながりが分かるように見せたうえで読みやすくするためにあえて文を切っています。

 このように少し読み取りづらい構文が含まれていると機械翻訳は誤読する確率が高い傾向にあります。この原文をさきほどと同じようにDeepLとGoogle翻訳に入れてみます。
 
【DeepL訳】
私たちは皆、自分の中に大きな可能性を持っています。力、知性、集中力など、未開発のレベルです。

構文が取れておらず、and 以降の後半部分がごっそりと欠落しています。原文の意味が正しく翻訳されていません。精度は低いと言えます) 

【Google翻訳】
私たちは皆、自分の中に無限の可能性を秘めています。未開拓のレベルの強さ、知性、集中力を備えています。これらの超大国を活性化する鍵は、自分自身を制限しないことです。
単語レベルでは前から順に忠実に」文字列変換してきているのでDeepLの訳よりはマシなように見えますが、件の箇所が同格であることが無視されています。また、"superpower"の意味を取り違えて文脈に合わない訳語(「超大国」)になっているほか、全体的に直訳調で日本語として読みづらい文章です

 ちなみにこの原文は、調べてみるとジム・クウィック(Jim Kwik)という著者の『LIMITLESS 超加速学習: 人生を変える「学び方」の授業』という書籍の一節でした。邦訳本のなかでの訳し方はまた違ったアプローチでした。どちらが良いという話ではないのでここには載せませんが、気になる方は書籍で確認してください。原書は『Limitless: Upgrade Your Brain, Learn Anything Faster, and Unlock Your Exceptional Life』です。この文は結構序盤で出てきます。

 さて、この2つの機械翻訳にかけた原文ですが、機械翻訳の精度の話をしているのではなく、こういうタイプの原文はそもそも機械翻訳では扱いにくい、という話をしています。頭から順番に単語を置き換えたただけでは意味をなさないからです。こういう文章は他にもたくさんあります。

 例えば契約書などのように、一文が10数行にも及ぶような長い文を含む文章です。条件節が複雑に挿入されていて、丁寧に読まないと係り受けを把握できない文章は機械翻訳が苦手とするところです。短く切ってすべて単文にしてから機械に入れれば訳せることもありますが、節と節の関連性が失われて意味不明になることもあります。

 また、構文は取れていても辞書にある言葉で文字通りに訳すと意味が伝わらないという原文も機械翻訳に適さないと言えます。上の例で言うとactivateは辞書にある言葉の中から起動する、有効化する、作動させるなどと訳すと原文の意図するところが伝わらないので、英英辞典を引くなどして単語の元の意味を理解してから文脈に合う日本語を自分で探すもしくは当てはめる必要があります。上の例以外にもいわゆる偉人の名言のような文やことわざのような類も、この条件にあてはまりやすいと思います。

 問題はこのような原文の「機械翻訳の適用性」という観点において、一つの文章全体が100%適用外とか100%適用可ということはないことです。文章にはほとんどの場合、この両方が混在しています。例えば800ワード程度の原文があるとして、100文程度の文で構成されているとします。このうち、何%が適用外で何%が適用可であるかは毎回原文の種類によって異なり、明確な判断基準は現在のところ(私の知る限り)存在しません。

 しかし驚くことにというか困ったことにというか(喜ばしいことにという人もいるかもしれません)、機械翻訳はこのように本来適用外の原文であっても、まれに偶発的に「良い訳文」を出してくることがあります。これは人間の翻訳行動をなぞって機械学習しているために、過去のパターンに寄せて訳文を生成したらたまたま良い訳になった(原文を理解して人間が訳した結果と偶然似たような出力になった)ということがあるからです。これがあるから機械翻訳に適した原文と適さない原文の区別が現状、つきにくくなっています。これが機械翻訳についての評価が人によって分かれていることの要因の一つになっていると思います。

 私が考える現状の機械翻訳運用における問題点は、こうした機械翻訳に適した原文と適さない原文を混在させたまま、一律に機械翻訳にかけて処理し「人間によるポストエディット」で一から訳した場合と同品質を求めようとしているところです。

 機械翻訳がマッチした箇所をポストエディット料金、マッチしなかった箇所を通常の翻訳料金、と分けて設定するなどということには時間もコストもかかり、(判断基準もないため)実際、技術的に不可能だとは思いますが、現状そこのところは「みんなうすうす分かっていながらそんなことを言いだしたら面倒だから」見ないふりをしているのではないでしょうか。

3. 職業翻訳者を社会に残さなければならないと私が考える理由


 さて、こうした現状があるなか、仮に冒頭で述べたように「翻訳者は最終的にいらなくなる」という言葉を信じて多くの翻訳者が廃業して別の仕事に就き、新たに業界に入ってくる人がいなくなる、という状況が実際に起き、最終的に「翻訳者」がいなくなり「翻訳会社」がなくなったとしたら、実際に困るのは誰でしょうか。

 まず、社内などで発生する翻訳の場合、社内や組織に翻訳のできる人を抱えることで解決すると思われるかもしれません。実際にポストエディターの求人案件は増えているという情報も耳にしました。しかし、翻訳や翻訳の修正は経験の浅い人にやらせていきなりうまくできるものではないので、翻訳のプロでない人に作業させてすぐに満足の行く訳が手に入ることはまれだと思います。機械翻訳で「一見正解に近いように見える訳」が手に入っても、それを「正確で読みやすい」という人間レベルの翻訳に修正するには翻訳者と同等もしくはそれ以上の能力がないとできないからです。ポストエディターを雇ったとしても一定の訓練期間を要するでしょう。そうなると結局、外注していた翻訳者を社内で雇うのとほぼ同じコストがかかることになります。人件費を減らそうとしてスポットで外注していた翻訳作業に対し、仕事があるときもないときもあるのに一人分の雇用が発生することになり、派遣社員や臨時社員として雇ったとしても却ってコスト増になる可能性もあります。

 次に、書籍翻訳などの場合。仮に文芸翻訳者や出版翻訳者がゼロになった場合、外国語で書かれた文章を読者が各自機械翻訳に通して読むことになるでしょう。現状でも人気があるのになかなか邦訳されない海外の漫画などが、しびれを切らしたファンたちによって機械翻訳を通して読まれていることはあるようです。しかし、エンタメのセリフや文章には特に上のような機械翻訳に適さない文が含まれているケースも多いと思うので、機械翻訳の結果では意味が分からないケースが多発するでしょう。そういうページは飛ばして読むか、前後から推測するか、または自分で語学を勉強して読むことになります。読みたい本があるのに日本語では一切出ていない世界。大勢の一般読者が困ると思います。

 また、講演などのスピーカーはどうでしょう。翻訳の話から少しだけずれて通訳の話になりますが、仮に運営側から「人間の通訳者はコストがかかるので廃止しました。発話と同時に機械翻訳で前のスライドに訳を表示しますので、できるだけ機械が訳しやすいように話してください」と言われたらどうでしょう。話の内容が機械で訳せる範囲に制限されます。スピーカーも話を広げようがなく困ると思いますし、せっかく面白い話を聞けるはずだった聴衆も、機械に訳しやすいように制限のかけられた話を聞くことになって面白さが半減して残念な思いをする可能性もあります。

 このように、翻訳のプロたちを社会から抹消すると、どこかで困る人が必ず出ると思います。だからゼロにはしないけど今より数は減るんじゃないかという指摘もありますが、それも「現在訳されているものだけを全部機械に置き換えた場合」の話だと思います。実際にはそれほど減らない、減らせないと思います。機械翻訳で対応できる部分はすべて機械に置き換えていっても、機械でどうしても訳せない部分で人間の需要が発生しますから、人間が担当する原文の種類が変わるだけです。機械でもできるような簡単な仕事しか担当していなかった人、そういう仕事しかできない人の仕事はなくなるかもしれませんが、機械以上に複雑な処理をできる人の仕事はなくならないと思います。また、何度も言うように、機械の翻訳結果が不満足に終わるケースは機械翻訳の「精度」がまだ低いからではなく、そもそも原文が機械翻訳にマッチしていないからです。そういう意味では人間の活躍の場が残されているのはどういうフィールドなのか、翻訳者は時代の潮目を常に読む必要があるということです。需要がなくなる可能性の高い分野にいつまでも留まるのは危険ですが、変化に合わせてこちらも変化することで自分の仕事を守ることができます。

 
4. 将来に向けた提言(商業的成功の追求・政治的支援の可能性)

 最後に将来に向けた提言ですが、まず、翻訳者は世の中で機械翻訳の使用頻度が高まることを嘆いていても始まりません。うまく使えば便利な道具であれば皆が使うのは当然のことです。そのような流れのなかで翻訳者は「無料でかつ秒で出るサービス」と戦っているのだということを自覚する必要があります。その上で、「タダで手に入るものとは違うサービス」を、付加価値を付けて売っていくという意識が重要です。機械翻訳を使って訳した場合に起こりうるリスクを啓発するより(それももちろん大事ですが)、自分に発注してもらったらどんな実利があるのかを、一人一人が明確に打ち出し、職業翻訳者たちがビジネスとして商業的成功を目指していく必要があります。

 それと同時に、商業的成功を目指すことで「儲かる仕事しか残らない」という方向に物事が加速度的に進んでいく可能性があります。コストをかけて人間が訳しても誰も読まない、売れない、という本は誰も訳さなくなる、という未来は簡単に予想が付きます。しかし、機械にも訳せないような文を正確に読みやすく訳す、という翻訳技術は後の世代に受け継いでいかなければ必ず社会のどこかで困る人が出てきます。商業的なうまみがない分野で学術的にまたは文化継承のためなどに必要な翻訳をできる人材を残すという意味で、例えば「翻訳者という文化財を守る」みたいなことを政治を動かしてやる、という活動があってもいいのではないかと思います。すでにそういう動きがあるのかどうか、勉強不足で分かりませんが、そうしていく必要性は非常にあると思います。

 巻物のように長いブログとなってしまいましたが、機械翻訳と翻訳者の未来について、現時点で思うところをだいたいですが盛り込めたと思います。いかがでしたでしょうか。

 ご質問・ご意見がある方はTwitterなど私が公開している各SNSから直接ご連絡ください。匿名での批判は非常にメンタルを傷つけられますので、今回はコメント欄は無効とさせていただきます。

2022年11月11日金曜日

字面訳と意味が通じる訳の違い

 私は以前から「字面で訳しても意味が通じなくては訳す意味がない」という話をしてきました。翻訳を商品として考えた場合、「意味が通じる」というのは最低限保証されるべき品質だと思いますが、発注者が軽い気持ちで「意味が通じればいいから」と言った場合、どこまでの品質を求めているのか、発注者側と翻訳者側(翻訳会社を含む)の間でズレが生じているような気がするので今回このブログを書くことにしました。

 機械翻訳等でときどき散見される「字面で訳した文章」と翻訳者が「原文の意味を考えて訳した文章」は具体的にどう違うのでしょうか。例を挙げたいと思います。

例えばこういう一文があったとします。

Many legal things are often considered unethical. 

(Macmillan Skillful Second Edition Level 3 Reading & Writing Student's Bookより引用)

 これは大学生用のリーディングのテキストからの引用です。"It's legal, but is it ethical?"という見出しのエッセイで、文脈としてはこの文(第6段落)より前の導入部分(第1段落)に

・「社会において、善悪の判断基準には法律的、宗教的、倫理的な解釈がある (There are legal, religious, and ethical interpretations that are commonly used in many societies to decide between what is good and bad.) 」

・「すべての非倫理的な行動が違法だとは限らないし、すべての合法な行動が倫理的だとは限らない(Not all unethical behavior is illegal and not all legal behavior is ethical.)」

という記述があります。

 これをヒントに、冒頭の英語を日本語に訳してみたいと思います。

「字面訳」との比較のため、試しにDeepLとGoogle翻訳にこの原文を入れてみます。

1.【DeepL訳】:多くの法的なことは、しばしば非倫理的とみなされます。—レベル①

2.【Google翻訳】:多くの合法的な事柄は、しばしば非倫理的と見なされます。—レベル②

 上の2つの訳は、文法的にはエラーはないように見えます。

 しかし「意味が分かるか」という観点で考えると私は上記2つの例はどちらも「字面訳」だと考えます。一応日本語になっているので、これでもなんとか理解できる人もいるのかもしれません。しかし、原文が訴えている内容がこれで伝わっているでしょうか。私はこれでは意味が分からないと思います。

 まず、主語の"many legal things"ですが、述部で"often considered unethical"と受けているため法律と倫理の比較という文脈ですから、ここで①のDeepL訳のようにlegal thingsを「法的なこと」と訳すと意味が通じません。Google翻訳のように「合法的な」と訳すべきだと思います。(DeepLよりGoogle翻訳の方が良いとか悪いとかいう話ではありません。機械翻訳の出力は毎回偶然の産物ですから「良し悪し」はその時によります)

 ではlegalを「合法的な」と訳した②のGoogle翻訳の訳で「ひとまずは通じる」と言えるでしょうか。私は微妙なところだなと思います。

 仮にこれをポストエディットするとなると、どこを「編集」すれば「より意味が通じる」文章になるでしょうか。

 語順を少し変えて

 3.合法的な事柄であって、しばしば非倫理的と見なされるものは多くあります。—レベル③

 としたらどうでしょうか。「多くの~」という表現を「~は多い」とした方が多少分かりやすくなったでしょうか。

 でもこれもまだ「原文が何を言っているか」を訳者がしっかり腹に落として訳していない、という印象があります。

 そうです、つまりこの文章は、「合法か違法かの境界線」と「倫理的にアリかナシかの境界線」は違う、と言っていて、合法の範囲内でも倫理的にはNGなものというのは世の中にたくさんありますよ、いうのが私が原文から受け取ったメッセージです。

ですから例えば私はこのように訳してみます。

【拙訳】

4. 合法なものの中には、しばしば倫理的に問題があるとされるものも多くあります。—レベル④(人手による翻訳

まだ硬いかもしれません。もっと踏み込めば次のようにも訳せるでしょう。

5. ものごとには、たとえ合法であっても倫理的には問題があるとみなされることは少なくありません。—レベル④'(レベル④の変形)

6. 世の中には、違法でなくとも道義的にはアウトだと判断されることは意外にたくさんあります。—レベル④"(レベル④の変形)

 いかがでしょうか。もちろん、10人いれば10通りの訳出があると思いますから、他にもいろいろと訳し方はあると思います。

 原文の意味を考えて訳したほうが分かりやすいのは、「うまく訳そう」と思って訳したのではなくて「どうすれば原文の内容をうまく伝えられるか」を考えて日本語を書いたからです。このように「分かりやすく訳す」ためには「原文を理解する」というプロセスが不可欠です。

 ですから翻訳者が原文の著者に「意味が取れないと訳せないので教えてください」と質問したときに、「意味なんて分からなくていいから直訳してくれればいいんだよ」と指示すると、全く意味が分からない訳文になりますよ、ということなのです。

 また、機械翻訳に入れても意味が分からなかったものを、翻訳者に依頼したら意味が分かりやすくなった、というのはこういう過程を経て翻訳しているからなのです。

 分野に限らず、ほとんどの職業翻訳者はこのように「内容・概念・イメージ」をつかみとってから訳出先の言語に落とし込んでいると私は思います。

 発注者が「意味が分かればいいから(そこまで手をかけて凝った訳文にしなくていいから=安くして欲しいor早くして欲しい)」という場合、上の①~④のどのレベルを求めているのだろうというところが現状、曖昧だと思います。

 これについては公的な基準を私が知る限りでは見たことがないのであくまで私の感覚ですが、

①は私の感覚では誤訳。

②はぎこちない訳? 

③はポストエディット? 

④が通常の人手翻訳

 だと思いますが、誰かが決めたわけではないので分かりません。

 発注者が「最低限意味が分かればいいから」「過剰品質は求めていない」と言ったとしても④のレベルを求めている場合はフルの人手翻訳の工数と料金がかかります。④以上にする段階で既に原文の解析は終えているので、④を④’にしたり④”にするのも実はそれほど手間は変わりません。もっと言うと、機械翻訳の②を③に修正する手間の間に④や④'にできてしまいます。

 翻訳者が翻訳に時間がかかるのは「訳文を無駄にこねくり回して品質を過剰にしている」せいではないのです。「最低限意味が通るようにする」ためには原文の理解、背景の調査、訳出対象言語での表現の決定、という一連の工程を経ているため、そこまでの作業ですでに翻訳作業の10割近くが終わっています。

 ですから作家のような文才が求められるような芸術的な文章でもない、特に産業翻訳のような場面では翻訳に「過剰な品質」などほぼ起こりえないのではないかと思います。職業翻訳者は日々、厳しい納期に追われながら「意味がしっかり伝わる文章」にするために精一杯の仕事をしています。それ以上無駄な時間をかけて訳文をひねりにひねっている時間はない人がほとんどではないでしょうか。

2022年10月8日土曜日

自分はなぜ翻訳をやっているのか

 JTF翻訳祭(#JTF31fesカセツウさん、テリーさん、佳月さんのセッションをリアルタイムで視聴。翻訳者のキャリアパスのどのステージにいる人にも刺さった内容だったのではないかと思います。


●自分はなぜ翻訳をやっているのか
を、改めて考える機会になった人も多いと思います。私はテリーさんに近くて、「翻訳をやりたいから翻訳をやっている」と思います。

別の場所で話したこともありますが、私は以前通訳者を目指していました。通訳学校に断続的に計10年通ったのですが同時通訳者は自分には無理だと悟り、結婚・出産を機に見切りをつけて翻訳に大きく舵を切ったという経緯があります。ですから「自分が本当にやりたいことは何か」という質問は私にとって普段触れないにようにしている禁断の質問でもあります。

ですが、今日のように刺さるセッションを視聴すると「自分にとって仕事とは何かという問いに向き合わざるを得なくなります。

私は小学6年生の時、当時テレビで放映されていた「夜のヒットスタジオ」という番組で毎週登場する海外アーチストについて出てくる通訳者の田中まこさんという方を見て「かっこいい!あの人になりたい!」と衝撃を受け、英語の道を志しました。地元の公立中学校で普通の英語の授業を受けて高校受験を迎えましたが、そのころから英語を集中的に学びたいという思いが高じて当時誰も出身中学から受験した生徒のいなかった「名東高校 英語科」を志望しました。受験データがないので担任の先生からも部活の顧問の先生からも反対されましたがどうしても受けたいと言って、私立のすべり止めを確保してから受けることを条件に挑戦し、合格しました。そうして英語漬けの高校生活を送り、大学も地元の県立大学の外国語学部に進み(ここでなぜかオードリー・ヘプバーンに憧れてフランス学科を目指してしまうのですが)、卒業後の進路も英語を使うことを条件に選んできて、人生の半分以上を語学屋として費やしてきました。

25歳で通訳学校の門をたたき、37歳で通訳者になることを諦めるまでの12年間、いつも私は「未来のために頑張る生活」を続けていました。人生の最終目標である「同時通訳者」になるまでは自分の人生を生きている感じがしていませんでした。時間にもお金にも気持ちにも余裕がなく、使うお金と時間と精神的余裕はすべて通訳者になるための教材や機会や勉強に費やしていて、遊んだりダラダラしたり無駄遣いしたりすることに常に罪悪感を持っていました。

最終的に諦めたのは、仕事と睡眠と食事(と入浴など日々の生活に必要な最低限の諸々のこと)以外のすべての時間を勉強と通訳学校の予習に充てるという半狂乱のような半年を過ごしても同時通訳のクラスで進級できなかった時です。脇目もふらずに勉強してもなお、自分には到達できない領域があると知り、挑戦を止める決意をしました。自分としてはもうこれ以上できないというくらい頑張ったので、清々しい気持ちでした。

それから翻訳一本に絞って12年が過ぎました。以前の顧客から通訳をやりませんか(アテンド通訳など、逐次の仕事です)と連絡が来ても子育てを理由に断ってきました。「外に出られないので」という理由で断ってきたのですが、コロナで事情が変わりました。

以前通訳学校で一緒だった勉強仲間はその後も頑張って勉強を続けてクラスを卒業し、同時通訳者として活躍しています。子育て期間を経た人もいますが、コロナ禍を経て機材も揃えて自宅からリモートで通訳の仕事をすることもあるようです。

そうなると「家から出られないので」という物理的理由がなくなります。子育てを理由に通うのをやめてしまっていた通訳学校にもオンラインでなら通えることになります。実際、コロナ禍が始まった当初の2020年は通訳学校にオンラインで復帰することも考えました。

しかしやはり、「自分なりに最善を尽くした結果、限界を見たので撤退することにした」という自分の気持ちも大切にしたいという思いがありました。「好きなことをできればそれで幸せ」だけでは、子どももいる今の生活を守れないと思ったのです(余談ですがコロナ禍直前の2019年暮れに離婚して現在はシングルマザーです)。

私にとって仕事は自己実現の手段のひとつではありますが、同時に日々の糧を得る手段でもあります。「夢だった同時通訳者になるまでは、何がなんでも諦めない」という30代の時の気持ちのまま突っ走ればそのまま老いて死んでしまうかもしれません。

今、私が目指しているのは「仕事の中に少しでも楽しみを見つけられて、それで自分と子どもの生活に必要な日々のお金を賄うことができて、体を壊すほど無理して仕事をしなくても、それなりに趣味や遊びに使う時間もある生活」であるので、大好きな仕事をできればそれだけで幸せというステージは過ぎたのかなあと思っています。

フリーランスとして自宅で翻訳をするという生活では、受注が切れないように顧客の新規開拓を怠らずいただける仕事に誠実に取り組み、体を壊しそうだと思えば時には仕事をお断りしたりして調整することによって、自宅で好きなドラマを見たり映画館に出かけたりする程度には余暇の楽しみも確保したいと思います。

同時通訳者という最終目標に向かってがむしゃらに努力していた頃より肩の力は抜けていて、バランスの良い生活ができているとは思うのですが、ふとした瞬間に「子どもの頃からやりたいと思っていたことを手放してしまって良かったのだろうか」という思いがよぎることもあります。

結局、どんな仕事をしてどんな仕事を断って生きていけば自分が一番納得できるのか、考えるのを止める日は来ないのだと思います。現在進行形で悩みながらこれからも生きていくのかと思うと、40歳で不惑だなんて、一体誰が言ったんだよと思います(笑)。

話はそれましたが、冒頭の自分はなぜ翻訳をやっているのかの話に戻ります。

私は映画字幕翻訳家の戸田奈津子さんのように「映画が好きだから映画の字幕の翻訳者になった」とか「●●が好きだからそれを訳すようになった」のではなく、「英語から日本語に」「日本から英語に」訳すプロセスそのものが好きだから翻訳をしています。

それは通訳をしていたころも同じです。話している内容そのものに自分はあまり興味がない場合でも、誰かにとっては大事なお仕事の話であり研究の話ですから、自分がその内容を上手く伝えることで両側にいる人たち(英語話者と日本語話者)の利益につながるところに自分の存在意義を感じていました。

それが書き言葉になっても同じく、原文の内容をいかに損なわずに等価のまま訳文に移すかという作業そのものに楽しみとやりがいを感じます。

ですから、翻訳者としての仕事を始めたころは「何を訳しても楽しい」と感じていました。

ところが、翻訳者としてキャリアを重ねてくると自分にも得意分野と不得意分野があることに気づき始めてきます。もっと言うと、好きな分野嫌いな分野があることに。経験値や自分の適性とは別のところで、「好きな分野は速く訳せる」「集中できるから効率も上がってクオリティも高くなる」ことに気づき始めました。

また、不思議なことに(まあ、不思議でもないですが)、報酬の高い仕事の方がやる気が高まり楽しくなる、ということにも気づき始めました。これは私自身、報酬の高いもの・低いもの、内容が好きなもの・嫌いなもの、と雑多なものを訳してきた経験からなのですが、「いくら楽しい内容の仕事でも報酬が理不尽に低いとムカついてきて楽しくなくなる」という気持ちも経験しました。

コロナ禍以降、それまで子育てを理由に同業者と交流してこなかった私も、オンラインでのつながりを経て色々な方と知り合って色々な情報を得るようになりました。翻訳者という働き方についてモヤモヤとしたものを常に胸の中に抱えてきたのですが、このブログを始めとして自分の考えたことをその都度書いたり口に出したりして自分の気持ちの棚卸しをする機会にも恵まれてきました。

自分が本当にやりたいことってなんだろう」と自分に問うとき、若いころは(未婚の頃は)経済的な見返りも自分の生活を成り立たせることも度外視で「どんな職業につきたいか」という理想ばかりを追いかけていたのですが、今は同じ質問(自分のやりたいこと)を問うとき、その答えは「どんな生活を送れれば自分は幸せなのだろうか」に対する答えなのかなと思っています。

今の私にとって、自分が幸せであるためには
・仕事の内容
・報酬
・仕事の時間(余暇に割くことのできる時間)

はどれも欠くことのできない条件です。ただやりたいことを目指すのであれば、歌手になりたかった、お好み焼屋さんを開いてみたかった、移動販売でコーヒーとクレープを出す店をやってみたかった、フランチャイズでドトールの加盟店になってみたかった、とかいろいろあります。でも人生残りあと数十年で全部に手を出すことは不可能です。やっぱり自分には一番好きな語学を生かした仕事で最大限幸せを追求するのが現時点では最適解だと思っています。

●仕事のやめどき
セッションの後半で「翻訳のやめどき」の話になりました。自分にとって翻訳の仕事を辞めるのはいつだろうという問いに対して、テリーさんは「勉強の意欲が失せて良い訳文が生成できなくなったとき」「市場から自分が必要とされなくなったとき」というようなことをおっしゃっていましたが、私もそれに近いと思いました。自分が世の中の役に立てなくなったときが潮時だろうと思いますし、そうなる頃には仕事の打診も来なくなるだろうと思います。

それは未来の話ですが、過去に実際、仕事を辞めたくなったときを振り返ると(翻訳をやめたいと思ったときの話)、私の場合はオーバーワークになりすぎた時に嫌気がさして辞めたくなっていました。つい最近もありました。あちらにもこちらにもいい顔をしようとして仕事を受けていると、慢性的に徹夜になって体調にも精神にも異常をきたします。

私にとって翻訳は楽しいことであると同時に仕事でもあるので、ロボットのように休みもなく働き続けることはできないと改めて思いました(改めなくても気付けよ私)。

仕事はあくまでもビジネスですから、生活が成り立たないほどの低報酬で働くべきではないと思います。単純に疲れてしまいますし、自分にとっての幸せからも遠のいていくと思います。

3人のセッションでは翻訳のクオリティの高め方や単価交渉のお話などそのほかにもメモとりまくりの内容の濃いお話が続きましたが、このブログではここまでにします。気になるかたはアーカイブセッションをどうぞ。ちなみに翻訳祭は今からでも申し込めるようですよ。(10月18日まで)



翻訳祭などのイベントは翻訳業界の入り口に立っている人だけでなく、私のように中に入ってからまあまあ長い人(笑)にとっても、新しい気づきや知見の得られる素晴らしい機会だと思います。素晴らしいセッションをありがとうございました。

—今日はここまで—

2022年10月3日月曜日

翻訳で食べていけるのかという話

ここ数日間、あるユーザーによるTwitter投稿がきっかけとなり、翻訳の時給の話や翻訳で実際食べていけるのか、といったトピックが話題になりました。私もTwitterで「#翻訳で生計は立てられます」というハッシュタグをつけて投稿するなどしてこの話題に乗っかりました。

確かに様々な要因が重なって「重労働×低報酬」になり、かかった時間で試しに割り算してみたら時給換算で数百円になってしまった、ということは実際にあると思います。でも、そういう場合があるからといって、翻訳業界全体がそうであるとか翻訳が儲からない仕事であるかのように一部の人から言われるのは放っておけないと思いました。

翻訳者はフリーランスの方が多いので、やりようによってはすごく儲かる人も全然儲からない人もいると思います。でも、先を歩いている私たち現役翻訳者たち自身が夢のない話ばかりして「参入障壁」になるべきではないと思います。

翻訳の仕事はバラ色だとは限りませんが、地獄ばかり見ているわけではありません。ああ本当に面白い仕事ができたなあとか、お客さんがものすごく喜んでくれたなあとか、ちょうどいい時に大きめの仕事が入ってきてくれて(経済的に)助かったなあとか、良いこともたくさんあります。

腕を磨いて営業活動もしてしっかりと顧客をつかめば受注の切れない翻訳者になれますし、自分にしかない売りがあれば高単価で条件の良い取り引き先をつかむことも夢物語ではありません。

反対に、いくら翻訳の勉強をしても資格を取っても翻訳学校を卒業しても、仕事を獲得する努力をしなければ仕事は来ません。

翻訳の腕を磨くことと仕事を取るための努力は、どちらか一方だけでは仕事は来ません。両輪で努力していかなければ翻訳で食べていくことはできないと思います。

実力がある人も最初から実力があったわけではないでしょうし、有名な人も最初から有名だったわけではないと思います。

少なくとも今有名だったり実力者と思われたりしている人は、何も努力せずに今の場所にいるわけではないと思います。親が有名だったり生まれ持った特別な才能があったり幼少期に海外で過ごしたなどの幸運が重なった人も中にはいるかもしれませんが、そんなラッキーな人ばかりではないと思います。

ベテランにも初心者の頃は必ずあったわけですし、今翻訳スピードが速い人も駆け出しの頃は何をどう調べたら良いか分からず数百ワードの翻訳にまる一日かかったなんていうこともあったかもしれません。

私が一番言いたいのは翻訳を仕事にしているわけでもない人が、翻訳は儲かるとか儲からないとかテキトーなことを言わないでもらいたいということです。

翻訳を仕事にしたいと思っている人は、外野がやいやい言ってくるだけのなんとか知恵袋やなんちゃらGoo!とかで質問していないで、SNSで現役翻訳者をフォローしたり業界誌を読むなどして正しい情報を収集することをお勧めします。

2022年8月19日金曜日

機械翻訳に対する現時点(2022年8月)での私の認識

字幕翻訳スクールがAI字幕翻訳ツールを開発したというニュース

 数日前に字幕翻訳スクールがAI字幕翻訳ツールを開発したというニュースが流れ、翻訳者たちの間に衝撃が広がりました。これを受けて翻訳者の堂本秋次さんがYouTubeで緊急動画を配信され、それを見たローズ三浦さんの発案で堂本さん、ローズさん、私の3人で機械翻訳の現状についてライブ配信することになりました。当日の告知にもかかわらず30名以上に方々にライブでご視聴いただき、その場でコメントもたくさんいただき成功裡にイベントは終了しました。(3人のトークイベントの動画はこちら:https://www.youtube.com/watch?v=L09NEJLBNzU

普段「機械翻訳についてどう思いますか」と聞かれるわりに回答にこれほど長い時間をいただけることはなかったので、司会の堂本さんが用意してくださったテーマでお2人と話すことで私自身としても改めて機械翻訳について自分がどう認識しているのか考えを深めることができて、非常に良い機会となりました。

話題は多岐にわたったので2時間半の長丁場となった議論を全部ここに文字起こしすることはしませんが、記憶が新鮮なうちに議論を通して感じたことを書き留めておきたいと思います。

議論で深まった自分の思考

まず、件のAI字幕翻訳ツールが登場したというニュースを受けて堂本さんが素早く出された動画がこちらです(https://www.youtube.com/watch?v=_qqDGSc0Yhg&t=6s)。これを見て、ああ、自分の言いたいことはほとんど言ってくれているなあという印象だったのですが、それを踏まえていてもやはり3人で話をして配信中の視聴者からのコメントも見ながら議論すると1人で話したり考えたりしている時よりもいろいろな考えが浮かんで自分なりに思考が整理されたように感じます。

同配信では以下のようなテーマについて話しました。

・機械翻訳の性能について

・機械翻訳は人間の翻訳の価値にどう影響するか

・ツールとしての機械翻訳の有用性とFP(フルポストエディット)やLP(ライトポストエディット)について

・機械翻訳だけで成り立つ業界は生まれるか?

・ビッグデータの取得経路について

・機械翻訳との共存に翻訳者は何ができるか?

機械翻訳を個人的に使う人と仕事として請ける翻訳者とでは見ているものが違う

最初のテーマで話を振られた時、3人とも現在の機械翻訳については「かなり精度は上がってきていると思う」という回答をしました。しかし、そのあとポストエディットに話が及ぶと「機械翻訳の出力をエディット(編集)することで必ずしも作業負荷は軽減されていない」という実感を口にしました。見る人には早速矛盾を起こしているように聞こえたかもしれませんが、このように話したのには理由があります。

例えば会社の中でDeepLやGoogle翻訳などを使っている人と、「MTPE(機械翻訳のポストエディット)」を案件として受注している翻訳者またはポストエディターとの間では見ているものが違うということです。

会社員や個人が会社や自宅で外国語で書かれた資料やニュース記事をDeepLやGoogle翻訳に入れた場合、「あ、結構いい訳が出るじゃないか」と感じるだろうと思います。ここまでは私も同じ感想を持ちます。(2016年にGoogle翻訳にニューラル翻訳が導入されて以来機械翻訳の精度は劇的に上がりました。)

しかし、機械翻訳に入れてみて「まあまあの精度だった」ものは、その場で「ああよかった。結構使える訳が出るじゃないか。じゃあこれをこのまま使おう」と言って資料やその他の文章に使い、それで終わっていきます。

翻訳者やポストエディターにわざわざ「お金を支払って」エディット(編集)して欲しい、というのは大半が「機械に入れてみたけどどうしようもなかったもの」です。主語がないものや固有名詞が頻出するもの、前後の文脈を知っていなければ訳せない内容のもの、構文が複雑すぎて機械では読み取れなかったもの等様々ですが、こういった「機械翻訳では全然意味が分からなかったからお願い」と、いわば駆け込み寺のようにして持ち込まれたものを私たちは現場で相手にしているわけです。このレベルになると、「ちょっと修正すれば済む」という話ではなく、ほとんどの場合全部消してイチから訳し直しになります。

このような現状を多くの人は知らないので、「翻訳者たちは自分たちの仕事がなくなると困るから『機械翻訳の出力なんかダメだ』と言ってるだけじゃないのか。DeepLの出力はこんなにも良いのに」と不信感を募らせるのだと思います。

しかし上で説明したように両者は見ているものが違うのです。そこが食い違っているから一般の人と翻訳者との間で機械翻訳に対する認識が食い違っているように感じるだけだと思います。

翻訳を職業にしていなくても社内に英語ができる人材を多く抱える会社も少なくありませんから、「機械翻訳にかけてみてだいたい良さそうだけど正しいかどうか不安だから念のため確認して欲しい。間違っていたら修正して欲しい」という案件もあるにはありますが、まれです。その程度の確認で済む話であれば社内で語学の堪能な人がチェックして微修正すればいい話だからです。多くの人はこの作業を翻訳者が担っていると誤解していると思います。

しかし、機械翻訳で良い偶然が重なって偶発的に良い訳文が出力されれば、社内の人がチェックして終わることが大半なので、そもそもその案件が市場に出てくることはほとんどありません

多くの発注者が「だめだこりゃ」と思って人間の翻訳者に依頼してくる案件がポストエディットと名がついた訳し直し案件なのです。

機械翻訳が台頭してきたことによる翻訳者への直接的な影響として、翻訳市場に上がってくる案件の難易度が上がっていることが挙げられます。

2016年のNMT(ニューラル機械翻訳)導入以前は例えば「この商品の納期はいつごろになりそうですか」「先日はありがとうございました」などといった簡単な内容がクラウド翻訳サイトに翻訳依頼案件としてあがっていました。学生アルバイトや翻訳者としてのキャリアをスタートさせたばかりの人たちがこうした案件をクラウドで受注して小遣いを稼ぐことはそのころはまだ可能だったのです。

しかし、現在はそのようなシンプルな内容であれば一般の人が無料で使える機械翻訳サービスでそこそこの翻訳結果が得られるため、わざわざお金を払ってまで発注するケースはまれになりました。ですから一時期隆盛だったクラウドソーシングサービスからも簡単な内容の翻訳案件は姿を消すことになりました。

機械翻訳でどうにもならなかった出力を何とか生かして作業負荷を減らすなどということはできるはずもありません。機械翻訳で単価を減らされても翻訳者が楽になるのは「手を入れなくても使えるレベルの高精度の出力が多く含まれる」場合に限ります。

「意味は分かるけどこんな言い方はしないからゼロから良い表現を頭で考えなければならない」

「一応これで意味は合っているけど業界でこの表現でいいのか(客先でこの用語が使われているのか)確かめなければ使えない」

「固有名詞は一応訳されているけどこれで合っているのかどうかは裏が取れていないので会社のウェブサイトに行って確かめなければならない」

「なんとなくそれっぽく訳されていて原文を見なければこれで良さそうに見えてしまうけど原文と突き合わせて確認したら意味が全く違ってしまっている」

こういうケースは山のようにあります。

機械が訳した出力を確認して修正して欲しい、という場合、訳文だけを見て直しているわけではなく原文と突き合わせて正しく訳されているか確認しながら(正確性を担保)、日本語の文章として(あるいはその他のターゲット言語の文章として)読みやすいように編集する(流暢性を担保する)作業は、インターネットでの調査、それを含めた原文の理解、ターゲット言語で読みやすい文章を再構築するという工程を通りますから通常の翻訳と何ら変わらないのです。(それどころか、機械の出力を確認しなければならない分、通常の翻訳より作業負荷は大きくなります)そこを「ポストエディットなんだから安くしてよ」と言われても単なる値切り行為としか感じられないため、多くの翻訳者がポストエディット案件を敬遠するのです。

翻訳者が「機械翻訳のポストエディットで作業は楽になっていない」というと「本当は楽になっているのにお金が欲しいから機械翻訳の出力がまずいとおおげさに言っているんじゃないの」「翻訳の仕事を機械に奪われたくないからポジショントークをしているんじゃないの」と言われるだろうと思っていたので、どう説明すれば一般の人にもわかってもらえるのだろうか、とずっと頭を悩ませてきたのですが、今回配信の中で自分がふと発した「一般の人と我々では同じ機械翻訳と言っても見ているものが違うんですよ」ということでかなり説明がついたのではないかなと思っています。

良い文を良いと思う人が減れば減るほど翻訳文化が死んでいく

8月16日の動画の中で堂本さんがおっしゃっていた「良い文を良いと思う人が減れば減るほど翻訳文化が死んでいく」という言葉が印象的だったのですが、本当にその通りだなと思います。原文を正しく解釈して原文が伝える内容を等価のまま訳文に反映させるという翻訳の仕事には思考を伴います。しかし、機械は過去データから似たようなケースを導き出して「たぶんこれなんでしょ」という結果を偶発的に提示してきているに過ぎないので、「細かいことを言えばちょっと違うけどまあいいか、タダだから(安いから)」と妥協して使うことが増えると、別に一生懸命正しく翻訳しなくても良い、ということになり、世の中にテキトーな翻訳めちゃくちゃな翻訳がはびこることになります。きちんとした翻訳をする翻訳者に正当な対価が支払われなくなると場合によっては生計が立てられず廃業する翻訳者も出てくると、まともに訳せる翻訳者が市場からいなくなり、究極的には翻訳文化が死んでいきます。


機械が訳しやすいような原文を書け、という流れが加速すると言語活動が狭まり、日本語文化が衰退していく

このまま機械翻訳の導入が加速していくと、現場で「機械が訳しやすいように原文を書く」という流れも加速していくだろうと思います。そのようなことは一部で現実に起きています。ご承知の通り機械は基本的にこれまで蓄積されてきたビッグデータの統計とそれをもとにした機械学習の成果からしか訳を導き出せないので、新たな概念、新たな用語、新たな内容は訳すことができません。仮に人間の翻訳者を一切排除して機械翻訳だけでも良いものが完成しましたという未来がきた場合、新しい言葉を入れると機械は訳せないから機械が訳せないような原文を書くのはやめてくれということになると、原文のライターに著しい制約が課されることになります。産業翻訳の場面でシンプルで分かりやすい説明が求められる現場ならまだしも、文学やエンタメ、新しい研究結果を伝える論文などで「機械が訳せる範囲の言葉しか使ってはならない」ということになると、大げさな話ではなく言語が衰退していきます。

英語に訳す前提で書いてくれ、となると単語やフレーズレベルではなく、英語に訳しにくいことは書かないように、言わないようにしなければならなくなって言語活動が縮小していきます。

新しく出てくるはずの美しい言葉、面白い言葉、感動する言葉をこれから先も守っていくために、「どんな概念が出てきてもなんとか訳をひねり出してみせます」という人間の翻訳者の存在は絶対に確保しなければ、日本語が貧しくなっていくのです。これは絶対に阻止しなければなりません。

ホンヤクこんにゃくは人類の希望

機械翻訳は実際、便利です。私も好きな韓国スターの発言を読みたくてGoogle翻訳を使いますし、ネット通販を使ったら意図せず中国から商品が送られてきて中国語のマニュアルしかついていなかったらスマホのカメラ翻訳機能を使って説明書を読むこともあります。

自分が学習していない言語を日本語に訳せるというのは素晴らしいことです。この技術の進歩を誰も止めることはできないですし、「まだまだ機械翻訳の性能は低いから大丈夫ですよ」などというつもりはありません。

そうではなくて、機械で訳せるものも多くなったけれど、「機械でどうにもならなかった部分」は必ずこれからも存在して、決してゼロになることはない、というなのです。

そこにまだまだ翻訳者が活躍する道が残されているとみるか、他の仕事へ徐々に軸足を移すのか、それとも「機械にできることは機械にゆずって人間は人間にしかできないクリエイティブな内容の翻訳に今後は注力していくべき」ととらえるのか、現状認識の方法は複数あると思います。

機械翻訳の精度を過大評価していると翻訳者が言う理由

「機械翻訳メーカーや販売者が機械翻訳を過大評価している」と翻訳者たちが言うと、「翻訳者たちは自分たちの仕事を守りたいだけなんだろう」と思う層も一定数いると思います。それは仕方がないことです。先にも述べたように、極めて幸運なケースでは、良い翻訳結果が得られることも多いからです。

しかし、仮にどこかの機械翻訳の営業担当者が仮に「弊社の機械翻訳は精度95%です」と言った場合、お金をいただいて仕事をする我々のところに回ってくる案件は「残りの5%ばかりを濃縮した苦い汁」なのだと説明すれば分かっていただけるでしょうか。

機械翻訳に入れてみたけどどうにもならなかったケースは一般の人も間違いなく目にしているはずです。

幸運にも上手く訳せている箇所は場合によっては「翻訳対象外」としてマーキングされて支払い対象から外されているというケースもあります。CATツール(翻訳支援ツール)などでは「セグメントをロックする」という機能もありますが要は「ここは訳さなくていいですよ」とは「ここは機械がうまく訳せているのでお金を払いませんよ」ということです。

苦み成分を濃縮した罰ゲームのお茶のようなものを称して「ポストエディット」として正規の翻訳料金の7掛け、5掛け、場合によっては3掛けといったような案件を打診されて泣く泣く受注している翻訳者も少なくありません。

私も時々MTPEの打診を受けるのですが数年前から基本的には断っていて、先日久しぶりに打診があったので「そろそろ精度が良くなったのか見てみたい」という好奇心もあって受注したところ相変わらず「だめだこりゃ」案件でした。しかも、多少これなら使えそうだなというセグメントにはすべてロックがかかっていて、どうにもならない出力結果ばかりの「機械翻訳結果」をため息をつきながら再翻訳しました。報酬は翻訳料金の6割程度でした。これから先も数年はMTPE案件は受けないと思います。

まとめますと私が言いたいのは、世間で思っているほど機械翻訳の精度が上がっていない、と私たち翻訳者が言うとき、一般の人が言う「結構良い出力が出るようになってきた」という場合の良い方の出力の話をしているわけではない、ということです。

翻訳者が自分の仕事を残したいから嘘を言っているわけではないことは最後にもう一度強調しておきます。

—終—