コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

利用者:Omotecho/sandbox/cx2(私論)

CX2はどこで作って、何を目ざしているのか

[編集]

これは私見なのでご参考になるかどうかなのですが、書き留めます。

メタウィキとは

誰でも飛び込んでくるから、どちらかというと対応が親身だし、見回りが手厚いと思います。感想や疑問点を投稿した場合、「何がわからないのか」と畳み掛けるように質問返しされ、しんどい思いをされた利用者を見かけます。英語という言葉の特性もありますが、ウィキの脳というのか、知りたいことがあるなら何を知りたいのか聞き出して、ちゃんと答えてやりたいという、共助が仇になる。

ですから詰問された印象を与え、「これがわからない」と説明し直す前に挫折され、二度と出張するものかと思わせてしまう。これが「恐ろしい目にあった」と書いた部分の意味です。なんというか、難しいのですが、日本語で書くようにお勧めするほかないかと思うほど、「問うこと」「答えること」の文化摩擦を感じます。技術者との対話は、この人はこのタグを監視しているらしいと当てずっぽうで質問するばかりです。ハズレならハズレと切ってくるし、たまには質問の整理と分解を試みてくれるなど、年に4、5回、こちらに益になる返事が来ます。質問が下手だからです。

ポータルで機械翻訳を導入、対日本語ではポンコツの実証になるか?

職員にも言葉の壁に不自由を感じ、同じ思いがあるのか、実験的にポータルをメタウィキの外に置きました。機械翻訳ボタンをつけ、互いに母語でもなんでも、書ける言葉で投稿する仕掛けです。もちろん日本語に訳したのも、日本語から訳出したのも、片目をつぶりたくなるほどですが、そうか、実証実験ですから、「日本語ってなんでこんな変な英語になる?」と実感する人が増えるチャンスでもあります(発話者がいかれていると思わないでもらえるなら)。

折から、9月6日〆切の2022年理事会選挙で、日本語コミュニティに皆さん、興味津々です。毎度、日本語コミュニティの投票行動は謎であるそうで、過去には期日前の雪崩を打つような駆け込み投票があまりに特異だったから、今回も密かに期待されている様子。

助成金の対象として研究課題になりませんか?

逆説的ながら、日本人が書いたものを読みたいから機械翻訳使ったけど、役に立たないよねという声を増やせないものでしょうか。そのためには、機械翻訳を採用した場所に、書き散らさなければならないのか? 私の作戦負けは巧妙を焦り日本語で書いていません。こんなゲリラ戦で、何が動くのか? 

ところが、ウィキメディア財団研究基金が10月にも立ち上がり、助成金が出ることになりました。論文発表まで熟さなくても、仮説を立てて実証するという論文の手法に、資金が出ます。たいへんな手間のかかる事例収集とその分析を、公共財にできるかもしれない。集めた素材データはCC-BY-SA(著作権の帰属と継承)を明記し、諸権利を守れるから学会発表とも両立するのではないか[注 1]

CX2で投稿した記事は、自動的にトークページに「翻訳告知」を出力できないのか

書くうちに思いつきました。CX2から直接の投稿を制限する件で、「翻訳告知」の自動生成も併願できないでしょうか? CX2から出力するときにスイッチか何かが働くならば、誰にでもわかる目印として翻訳告知する。人力やボットで変更履歴を検索する労力も時間も省けると思うのです。

メディアウィキを覗いてみて、どう感じられましたか? 

メタウィキと違い、質問者の技術知能度が「並み」かどうか線引きがあるかもしれません。技術用語を理解し、技術者のペースで対話できるか。また、実験なり開発のお題にできる文脈で書いてないと、返事は社交辞令に近いとも思います。

それなのに、CX2利用者が「疑問や苦情」を書き込めるボタン=「目安箱」は、メディアウィキに直結です。何語で投稿しても構いません、お題が翻訳機能だからでしょうか。これは、私には一つの奇跡に近いです(大げさながらほぼミラクル)。そしてその場の様子はというと、話者コミュニティの小さいところから、おそらくは独学に近い英語でどんどん飛び込んで質問し、考え、また質問している人がいます。(未完)

脚注

[編集]
  1. ^ 既存の学位論文一覧、CiNii、93件[1]。石渡[2]によると機械翻訳システムを評価するMosesという有償システムがあるらしい[3]
出典
  1. ^ CiNii Dissertations 検索 - 機械翻訳”. ci.nii.ac.jp. 2022年9月15日閲覧。
  2. ^ 石渡, 祥之佑; Ishiwatari, Shonosuke (2019). Translation and Description Methods for Multilingual Text Understanding. https://ci.nii.ac.jp/naid/500001477069. 
  3. ^ Moses - Main/HomePage”. www2.statmt.org. 2022年9月15日閲覧。

--Omotecho会話) 2022年9月15日 (木) 04:35 (UTC) 機械翻訳、その評価について。参考資料を注書き。/ Omotecho会話) 2022年9月4日 (日) 15:33 (UTC)


CX2の世評(ウィキメディア全体)

[編集]

ウィキメディアでどうCX2を位置付けているか、世評なり知りたくなってメタウィキとメディアウィキを拾い読みしました。日本語版ウィキペディア、あるいはプロジェクト‐ノート:翻訳検証のスレッドでOmotechoが感じたことに当てはめます。下線部は説明が尽くせていません。

  1. CX2はたいへん便利という触れ込み(メディアウィキの解説)だが、日本語をうまく処理できない。出力する文章は、日本語版ウィキペディアの品質・信頼性を落とすリスクがある(要データ)。それを防止・処理するにはこれこれの手間がかかる(要データ)。しかし自動化できない処理であり、工数が多い(要データ)。
  2. 処理に手間がかかり経験値を要する(要データ)ため、リソース(マンパワー)を増やせない。よって運用は善意の協力者におもねていて公平性を欠く。

1 を申し入れるなら、ファブリケーターという、技術面で困っていることをボランティア、あるいは拡張機能の担当者に開示する場所があります。言語学に踏み込まず、説得できるか? 技術者が書いた、機械翻訳と日本語の相性(?)の論文はCiNiiにあったと記憶します。

2 はかなり政治的な展開を予想します。というのも、財団が2030年をにらみ、喫緊の課題(優先すべきイニシアティブ)として上げていることと、深く関わると見ています。編集者の人数がしぼむという恐れがあり、新規登録済み利用者(未訳)を増やすことにリソースを当てるそうです(予算案があったはず)。

その反面と言いますか、現場ではウィキ「メ」ディアすなわちメタウィキの翻訳に核となる言語を定めており、専用の翻訳用ウェブサイトと連携させています。最近、その作業窓の右に、G社の機械翻訳出力を表示するようになりました。コミュニケーション委員会/小委員会/翻訳/核となる言語#ウィキメディアの編集コミュニティ ウィキメディアの編集コミュニティ(英語)を見ると、課題はここが検討する由。日本語版ウィキ「メ」ディアは優先順位第2位とのことながら、CX2の問題点は別扱いのはずです。

以下は話がずれますが、「2」で財団が進めようとしていることを日本語コミュニティが理解した上で、ローカルの困難解決に当たっているという姿勢を説明できるかと思います。

3 財団=まだウィキ群が訴求していない地域・言語版への展開と、そのために新規参加者の拡大をどうするか。→▲:日本語版ウィキペディアは該当しないが、分野によっては人手不足はどの言語版にもある。

4 財団=CX2は、新規参加者獲得と定着の秘策。ウィキペディア25言語版にコンテンツ翻訳拡張機能のヘルプページあり(ウィキデータ)。何か新しい記事を書きおろす実力はなくても、新規記事を立項できる=デビューして既存の編集者との交流が具体的に進む。→……性善説ではあります。ただし他言語の編集者に参加のチャンスを授けるのに役立つじゃないかと言われたら、どう抗弁するか?=母語が日本語ではない利用者の参加促進のツールと言われると憶測。

5 財団=CX2は、参加者の少ない言語版が記事数を増やすツール。→▲日本語版ウィキペディアは該当しない。

別件です。「こういう対応をしているところ」もあるとわかりました。いずれも日本語版コミュニティにないことは、困っている度合い、方策不足の説明の補足になるかもしれません。藪蛇のリスクはあろうとも、コミュニティの実態だし選択なので踏み込んでこないはず。スレッドの上部で言及された、東南・南アジア圏の反応は未確認です。

6 コミュニティでCX2容認のところに、以前から初学者に対応する専用ページが見られる(英語版ウィキペディアの「茶店」Teahouse、井戸端の分室?)。

7 かつウィキペディア26言語版は、後輩の面倒を見る先輩との縁組制度 (ウィキデータ) で補完している(しばらく前はメンター制度と呼んでいたか。WP:AAU、WP:ADOPT、WP:ADOPTION、WP:WIKIADOPT)。

もしかして「この記事は翻訳みたいだけれど、内容が今いちだ」と感じた時に、個人対個人の紛争に発展させないで、コミュニティに改善が必要と伝えるには何かできないか。CX2を使った記事だけとは言えないものの、記事の品質を編集者に伝える査定は、英語版・フランス語版・ドイツ語版でパイロット企画を実施したところ、150万件の投稿があった由 。記事の評価イニシアティブという財団主導の活動目標はおよそ10年前に終了しました。(実施は2010年-2013年、終了報告書) --Omotecho会話) 2022年9月12日 (月) 14:52 (UTC)