利用者:Anaka Satamiya
ユーザーボックス |
---|
バベル |
---|
言語別の利用者 |
2021年4月21日Bot使用申請
2021年4月22日テスト運用開始
2021年6月29日リンク修正Botとしてフラグ付与
2021年10月5日 Wikipedia:Bot作業依頼作業を追加承認
申請内容
- ボット名/Bot: Anakabot (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
- 運用者/Operator: Anaka Satamiya (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
- 作業間隔/Interval: 60秒
- 作業内容/Function:
- Main page containing links with broken anchorsより対象となるセクション切れのページのリストをPetScanよりページとリンク切れ日時を取得
- 第一条件:Template:Broken anchorsが貼られた日時の古いものから再結合先を確認し、ページ、古いセクション文字列、新しいセクション文字列の表作成。なお、セクションリンク切れ1件に対して対象ページが50件以上はこちらの作業軽減のためBot作業依頼を検討
- 表を元に、Template:Broken anchorsが貼り付け後、1ヶ月を経過したものからreplace.pyを使いページ及びノートの修正
- 運転方法/Operation: 3(1週間に500回程度を想定)のみ自動
- ソフト/Software: pywikibot(3)、Petscan(1)、EXCEL(2)。最終的にはpywikibotのみに改良。
- 連絡/Contact: Anaka Satamiya
- ボットフラグ/Has bot flag(s) on: なし
- コメント/Comment:気軽に見出しを変更する方も多いため、4/18現在セクションリンク切れページが日々増加しており放置状態のページも多い。地道な作業ですができる限り修正していきたいと思います。一度に200回以上の編集をする可能性があることからBot申請することにしました。Anakabotはセクション切れ修正作業専用とし、それ以外はAnaka Satamiyaを使用します。AnakaSata(会話) 2021年4月24日 (土) 07:05 (UTC)
2024年10月26日、種別D作業を申請(Anakabot 20241026)。 2024年10月31日、種別D作業を申請(Anakabot 20241031)、2024年11月17日承認。 2024年10月26日、種別Z作業を申請(Anakabot 20241104)。
申請内容(Anakabot 20241026)
- ボット名/Bot: Anakabot (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
- 運用者/Operator: Anaka_Satamiya (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
- 作業間隔/Interval: 15
- 作業種別/Type(s) of task(s):
- 種別D(ウィキ文法エラーの修正-Cite web|和書のメンテナンス)
- 運転方法/Operation: 手動
- ソフト/Software: pywikibot、PAWS
- 連絡/Contact: 利用者‐会話:Anaka_Satamiya
- ボットフラグ/Has bot flag(s) on: あり
- コメント/Comment:去年、Cite webテンプレートの和書引数付加Bot作業を担当した中で、文法エラーや表記揺れが目立ったため、Cite webのうち和書引数が指定されているテンプレートのメンテナンス作業を行いたい。内容は以下のとおり。
調査対象記事数は351,246件(insource:"Cite web|和書",2024/10/26現在)
1.対象テンプレートのチェックをBotにて行う
- author引数の修正 - author引数にリンクをはる場合内部リンクでなく、authorlink引数によると指定されており、author=○○をauthor=○○|authorlink=○○に、author=△△をauthor=△△|authorlink=○○に変更する。複雑なauthor=○○××やauthor=○○××等は作業対象除外。
- 重複するパイプの修正- 引数が指定されていない重複パイプ(||)の解消
- 1文字目が大文字となっている引数の修正 - Author=○○ → author=○○
- date引数・archivedate引数(archive-date引数)・accessdate引数(access-date引数)の修正 - YYYY-M-D、YYYY-MM-D、YYYY-M-DD、YYYY/MM/DD、YYYY/M/D、YYYY/M/DD、YYYY/MM/D、YYYY.MM.DD、YYYY.M.D、YYYY.MM.D、YYYY.M.MD、英語版の日付形式など1つまたは複数のテンプレートにおいて違う形式で指定されているものが多い。このメンテナンスで将来の和書モード実装も睨みISO 8601の拡張形式に準拠した標準表記様式のYYYY-MM-DDに変更する。値が日付+複雑な文字列の場合は作業対象除外
- 上記修正が行われたテンプレートについてのみ空白引数の修正 - ひな形からコピーしてきただけで値が空白となっている引数の除去
2.以上の項目を置換前テンプレート・置換後テンプレートとしてリストアップし、目視確認
- 使用可能でない引数(newspaper=,editor=,)は他の引数変更を検討
- urlやlanguage引数を確認し和書表記が適切でないと気づいたとき- Cite web|和書 → Cite webに変更
- その他 - 目視で明らかに誤字・エラー(|web site=、date=20241026など)と分かる部分の修正
3.置換後テンプレートに対し重複引数チェックプログラム実施後、Botにて置換作業。 置換対象は5万件程度(35万件の15%、ランダムサンプリング実績により)・作業期間3ヶ月と予測している。--AnakaSata(会話) 2024年10月26日 (土) 10:15 (UTC)[返信]
申請内容(Anakabot 20241026)
- ボット名/Bot: Anakabot (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
- 運用者/Operator: Anaka_Satamiya (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
- 作業間隔/Interval: 60
- 作業種別/Type(s) of task(s):
- 種別D(ウィキ文法エラーの修正 - [[リンク|リンク]]の修正、見出しにボールド体の修正)
- 運転方法/Operation: 不定期・手動
- ソフト/Software: pywikibot、PAWS
- 連絡/Contact: 利用者‐会話:Anaka_Satamiya
- ボットフラグ/Has bot flag(s) on: あり
- コメント/Comment: Check Wikipediaの[[リンク|リンク]]の修正を行う。1ページに20個あった場合は手で20回書き込むのは不効率のため1回で済むBotを利用したい。内容は以下のとおり。
- (修正前)1.置換対象[[A|B]]をBotにて調査。AとBが同じであることを確認。曖昧さ回避など同じでないものは別途手作業。2.ボールド体はボールドの除去。
- (修正後)1.置換対象[[A|A]]をBotにて調査。AとAが同じであることを確認し[[A]]に変更。2.ボールド体はボールドの除去。
3.Botにて置換作業。
申請内容(Anakabot 20241104)
- ボット名/Bot: Anakabot (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
- 運用者/Operator: Anaka_Satamiya (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
- 作業間隔/Interval: 30
- 作業種別/Type(s) of task(s):
- 種別Z(6ヶ月を経過した提案・統合・分割テンプレートの除去 - ここ2年担当Bot不明の上、稼働もしていないため、私が運用アカウントで作業していたが、対象の洗い出しと書込にBotと使いたいため申請する。
- 運転方法/Operation: 月1回不定期・手動
- ソフト/Software: pywikibot、PAWS
- 連絡/Contact: 利用者‐会話:Anaka_Satamiya
- ボットフラグ/Has bot flag(s) on: あり
- コメント/Comment: 内容は以下のとおり。
1.Botにより7ヶ月以上前のテンプレートを抽出
2.目視作業 - 各提案に記載されていないもので、ノートに1ヶ月以上議論の書込もしくは賛成反対があっても合意形成成立の書込がないものを対象にする。記事からテンプレート除去する、ノートには自動失効貼付(再提案の手順も添えて)を貼りつける。
3.Botにて記事とノートに書き込む
セクション(見出し)切れ修正作業(案)について
セクションリンクはとても便利な機能です。その機能は以下の2つです。
- 記事の見出しに直接飛ぶことが出来ます。長い記事ではとても便利です。
- id属性を活用し、記事内参考文献に飛ぶことが出来ます。文献の確認に役立ちます。
記事を編集する際、記事Aの見出し(以降セクションとする)を変更するとそのセクションに飛ぶように設定されていたページBは見出しを見失い、ページAの先頭に飛ぶようになります。本作業はその切れたセクションを再結合するのが目的です。 本来ならページA編集者やページB編集者が担って頂けるとよいのですが、周知徹底まではまだ時間がかかりそうです。 作業は以下の通りです。
- {{Broken anchors}}がノートに貼られたページと時間をPetScanを使い、表にまとめる。
- 日時の古いものからページを閲覧しリンク先を調査する。基準は以下の通り。
- 旧セクションの文言のみが変更され新セクションになっている場合 → この新セクションにリンク
- 旧セクションの文言が本文に格落ちになっている場合 → その本文が含まれる新セクションにリンク
- 旧セクションの文言が分割されて新ページになっている場合 → そのページにリンク
- 旧セクションの文言がページ検索でも出てこず消滅している場合 → 旧セクションのみ削除
- 正常に参考文献に跳ぶセクションを目視にて確認したときは変更しない。正常に跳べない場合は{{sfnRef}}{{Harvnb}}等にこちらで変更
- 正常にid要素に跳ぶセクションを目視にて確認したときは変更しない。正常に跳べない場合は{{Anchors}}{{Visible anchor}}等にこちらで変更
- 見出しに脚注・外部リンクが付けられている場合は、セクション切れを起こす(WP:MSH#NOLINK参照)ため、見出しの下にコメント(リンク移動のお願い)を挿入。複数既出している出典など削除が簡単に判断できる場合は削除
- その他の例が出てきた場合はその時判断。問い合わせ等が発生する案件はBot作業より人間作業がよいのでAnaka_Satamiyaアカウントで作業。
- 2ヶ月以上未修正のページから調査を行い、置換前・置換後を決定し、置換作業はpywikibotを使いページとノートの修正を行う。
Botと人間の作業分担は以下の通り。bot:人間の作業比率は2:8程度。
- Bot: PetScanにより切れたセクションのリストアップ
↓
- 人間:調査・置換案の決定
↓
- Bot: pywikibotによる書込
(2021-07-23改訂)
修正作業の今後について
- 7月の集中作業により14,000から1,900弱(おおよそ6/30以降新規及び追加テンプレート貼り付けページは除く)まで減少。今後はセクション切れが発生するペースを2000件/月と仮定し、当初案通り500回/週で作業し様子を見る。(2021/6/30修正)
- 2022年より記事への{{Broken anchors}}貼り付けが無くなり、自動的に修正が行われるようになったため作業を中断し今後の方針を立案中です。(2022-1-19改訂)
Category:修正が必要なページの修正
手作業にて作業。
- Petscan:21279763 Formatnumの引数に数値以外が入っているページ
- テンプレートを正しく使用していないページ
- Petscan:21279771 テンプレート呼び出しエラーのあるページ/Template:Infobox Settlement/不明な引数
- Petscan:21279773 テンプレート呼び出しで引数が重複しているページ
- Petscan:21557047 出典テンプレートの呼び出しエラーがある記事/accessdate、access date (短)、archive、url
- Petscan:21557040 出典の日付が正しくないページ