プロジェクト:翻訳検証/コンテンツ翻訳レビュースペース
このページのノートに、このページに関する議論があります。(2022年2月) 議論の要約:1月の暫定集計、および今後の運用について |
コンテンツ翻訳レビュースペースでは、Wikipedia日本語版においてコンテンツ翻訳を使用して作成された記事の検証を行います。具体的には、コンテンツ翻訳内で提供されている機械翻訳に頼りすぎて必要な修正を経ないまま公開されていないか(Google翻訳、Yandex. Translateなど)、またWikipediaの文書に使用できる機械翻訳であることが判明しておらず、その使用により著作権侵害を起こす恐れがある機械翻訳ツールが使われていないか(DeepL翻訳、みらい翻訳など)を確認します。
翻訳記事の内容や翻訳の質については、原則検証しません(#ウィキペディアでは検閲は行われません)。ただし、機械翻訳が使われているか確証がとれなくとも、未訳部が大幅に残されていたり、明らかに日本語として意味が取れなかったりする記事(ケースGによる削除対象)がある場合は、ぜひ注記してください。それ以外の削除に相当する問題が発見された場合は、通常の削除依頼手続きを取ってください。
本ページでの検証結果は、Wikipedia:井戸端/subj/コンテンツ翻訳内の機械翻訳機能を制限できないかにおける、コンテンツ翻訳内の機械翻訳機能に関する議論に役立てられます。また問題があると判明したページは、同議論に支障をきたさない範囲で、順次改訳または削除依頼の提出を行うことになります。
道具箱
[編集]- コンテンツ翻訳で作成されたページの一覧
- 英語版で2016年に行われたレビュー
- Wikipediaで使用できる機械翻訳ツールの一覧
- Google翻訳 ※傾向:基礎知識がある分野なら、流し読みして大意を掴める水準の訳文。きちんと読むと文章が成立していなかったり、訳しきれなかったカタカナ語が大量に残っていたりする。
- Yandex. Translate ※傾向:流し読みも難しいほどに文章が壊れている。
- 有道翻訳 ※傾向:日本語への翻訳は中国語専用、日本語話者ならなんとか理解はできるか?
- LingoCloud(彩雲科技) ※傾向:日本語への翻訳は中国語専用、中国語の記載を翻訳しないことも多い。日本語話者ならなんとか理解はできるか?
- Wikipediaで使用できない機械翻訳ツール
- 著作権侵害の拡大を防ぐため、以下の機械翻訳を使った翻訳文を本ページおよびサブページに貼り付けないよう注意。
- DeepL翻訳 (Wikipediaで利用可否不明→ケースB-1削除案件) ※傾向:比較的読みやすい日本語を出力する。しかしよく読めば不自然で、固有名詞や慣用句に弱い部分もある。訳すべき単語やフレーズを無視していたり、本来の文意と真逆の訳し方をしている場合もある。
- みらい翻訳 (Wikipediaで利用不可→ケースB-1削除案件) ※傾向:DeepL翻訳と同様で、比較的強めに意訳していることがある。
- エキサイト翻訳 (Wikipediaで利用不可→ケースB-1削除案件) ※傾向:流し読みも難しいほどに文章が壊れている。文脈を無視して単語を直訳することが多い。
- Weblio翻訳 (Wikipediaで利用不可→ケースB-1削除案件) ※傾向:訳文として大きく間違ってはいないが、不自然な文章になる。
- Bing翻訳 (Wikipediaで利用可否不明→ケースB-1削除案件) ※傾向:訳文として大きく間違ってはいないが、不自然な文章になる。
- 百度翻訳 (Wikipediaで利用可否不明→ケースB-1削除案件) ※傾向:中国語からの翻訳では一般的な語を当てはめるため大きく壊れることは少ないが、同じ文字で意味が異なるケースや多義語に弱い。日本語でも同じ熟語が存在する場合は意味が異なってもそのまま用いることがある。
作業手順
[編集]リスト追加
[編集]現在このリスト追加手順はbot化が完了しているため、人力作業する必要はありません。
コンテンツ翻訳で作成されたページの一覧を使い、コンテンツ翻訳で作成された記事を古い順にリスト化してください[注釈 1]。共同作業を円滑に進めるため、1日ごとに節を作ってください。
=== ○月○日 === # {{Page|記事名}} (翻訳元言語タグ): # {{Page|記事名}} (翻訳元言語タグ): # {{Page|記事名}} (翻訳元言語タグ):
レビュー
[編集]次のような形で1件ずつレビューを行います。
# {{Page|記事名}} (翻訳元言語タグ):{{レ/×}} コメント--~~~~
手順は以下の通りです。
- 翻訳元のページ・版を開き[注釈 2]、任意の一文をコピーします。選択範囲内に複数の文が含まれたり、脚注記号([1]や[注釈1]など)が含まれたりしないように注意してください(DeepL翻訳などは広い範囲を一度に翻訳したり記号が紛れたりすると翻訳結果が変わってしまうため)。
- 機械翻訳ツールにコピーしてきた翻訳元文をペーストします。
- 翻訳先(日本語版)初版[注釈 3]の対応する文と一致していないか見比べます。明らかに異なる場合は可、完全に一致していたり「ですます調」などの微修正にとどまっていたりする場合は不可[注釈 4]、単語単位で微修正がみられる場合は要検証と判断します(機械翻訳をベースにしつつ人の手を加えていることが分かるが、文構造上の誤訳が残っている可能性があるため)。
- 不可であることが明らかである場合(どう見ても人力で訳した文章ではない、など)でなければ、最低3か所、離れた場所からサンプルを取って1~3を繰り返してください。記事の冒頭部だけ人力翻訳の体裁を整え、後半は機械翻訳コピペのまま放置している例も少なくありません。
- 検証結果を記事名の後ろに続けて書き、最後に署名してください。「可」判定でいずれの機械翻訳も使われていないと判断できた場合は ({{レ}})、「不可」判定の場合は、({{×}})マークをつけてください。一部の機械翻訳ツールしか試しておらず、さらなる検証が必要と思われる場合は、 を付けないでください。
- NGを付けた場合、マークの後に使用されたと思われる機械翻訳ツールの頭文字を太字括弧書きで付記してください。例えばGoogle翻訳なら(G)、みらい翻訳なら(み)とします。複数の機械翻訳が組み合わさっている場合、特定できたツールをすべて記載してください。なお「要検証」判定の場合は不要です。
- 他のレビュアーが検証したものを再検証し、異議があったり追記したりしたい場合は、前のレビュアーのコメントを消さずに続けてコメントしてください。
例
[編集]- ○○○(ノート / 履歴 / ログ / リンク元) (en): いずれの機械翻訳のコピー&ペーストでもなく、適切に翻訳されていることを確認しました。--(署名)
- (G)●●●(ノート / 履歴 / ログ / リンク元) (de): Google翻訳のコピペ。「概要」節の文章は修正されていません。--(署名)
- △△△(ノート / 履歴 / ログ / リンク元) (en):要検証。機械翻訳で一通り検証して一致するものがありませんでしたが、明らかに文章が不自然です。--(署名)
NG対処
[編集](機械翻訳ベース記事の検証手順は未設定です)
検証の結果NGとされた記事については、改訳する、立項者へ注意喚起する[注釈 5]、最悪の場合「ケース G: 他言語・翻訳についての問題がある場合」として削除依頼を提出する必要があります。レビュースペースを見てこれら具体的な対応を取った方、あるいは対応が行われているのを確認した方は、各項目ごとに報告をお願いします。
- 改訳開始や注意喚起の実施、削除依頼提出など、まだ完全な対処に至っていない場合は 作業中({{作業中}})アイコンと共に報告します[注釈 6]。
- 改訳が完了したり、削除が実施されたりして問題が完全に解消された場合は 完了({{完了}})アイコンと共に報告します。作業中報告が付いていなくとも、一足飛びに完了報告をして構いません。
- 他の利用者による対処についてコメントしたい場合は コメント({{コメント}})アイコンと共に追記してください。
- 翻訳の改善と直接関係ないものの、検証作業に影響すると思われる動きを報告する場合(記事の移動・統合、削除依頼の保留的却下)は 報告({{報告}})アイコンと共に追記してください。
例
[編集]- (G)●●●(ノート / 履歴 / ログ / リンク元) (de): Google翻訳のコピペ。「概要」節の文章は修正されていません。--(署名)
- 作業中 改訳を開始しました。12月31日までを目標に進めます。--(署名)
- 作業中 改訳が完了しました。第三者の検証待ちです。--(署名)
- 作業中 立項者の会話ページ(利用者-会話:○○○○#機械翻訳の濫用はおやめください)にて、機械翻訳の濫用を控え、早急に改稿を実施するよう要請しました--(署名)
- 作業中 Wikipedia:削除依頼/●●●を、ケースG-3として提出しました。--(署名)
- 報告 現在この記事は○○○に統合されています。--(署名)
- 完了 改訳が終了し、人力で適切に翻訳されていることが確認されました。--(署名)
- 完了 Wikipedia:削除依頼/●●●により削除されました。--(署名)
# {{×}}'''(G)'''{{Page|●●●}} (de): Google翻訳のコピペ。「概要」節の文章は修正されていません。--(署名) #* {{作業中}} 改訳を開始しました。12月31日までを目標に進めます。--(署名) #** {{コメント}} 予告期日を過ぎましたが、まだ改訳版が公開されていないようです。これ以上かかるようであれば、現在の記事はいったん削除する方向で進めても良いのでは?--(署名)
一覧
[編集]注釈
[編集]- ^ 利用者サンドボックスに公開されたものは対象外です。
- ^ コンテンツ翻訳で作成された記事は、履歴の要約に翻訳元の版指定ハイパーリンクが生成されています。これをクリックすることで、翻訳元になった版にすぐにたどり着けます。翻訳元の最新版と内容が変わっている可能性もあるため、注意してください。
- ^ 初版がWikipediaで使用できる機械翻訳ツールで未修正のまま公開されていても、同じ利用者がすぐに修正を重ねている場合は、その修正が完了した版を検証してください(初版利用者が機械翻訳文の問題点を理解し、修正する前提で初版を公開したと見なせるため)。日本語版の最新版が問題ない記事になっていても、それが初版翻訳者と異なる利用者が修正した結果なのであれば、その修正編集以前の内容を確認してください(初版翻訳者が機械翻訳文のまま放置するのが問題であるため)。
- ^ 機械翻訳文の問題点を修正せず放置してしまう利用者の存在を検証する場ですので、単に「機械翻訳がベースになっている」というだけでは「不可」にしないでください。利用可能な機械翻訳を使用している記事について「不可」を出す場合、明らかに文章が不自然なのに初版翻訳者が訂正していない部分を具体的に示してください。
- ^ Template:機械翻訳の濫用を使用することもできます。
- ^ あくまでも「作業が進んでいる」という客観的な報告に過ぎません。「作業中」を貼ったからその案件の面倒を見なければいけない、あるいは他の人が「作業中」を貼ったから手を出してはいけないというわけではありません。むしろ「作業中」が貼られている記事については、解決に向けて、多人数で積極的に関与した方が好ましいでしょう。