コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

利用者:Anakabot

Anakabot このアカウントはBotです.
(会話 · 投稿記録)
運用者: Anaka Satamiya
使用申請: 申請済
フラグ: あり (確認
作業内容: セクションリンク切れの修復、Bot作業依頼
動作間隔: 1回/分
動作する時間帯: 週1回500ページ程度を想定
自動/手動: 手動
プログラミング言語: pywikibot、PAWSを利用
ソースの公開状況: 公開なし
緊急停止ボタン: なし

セクション切れ修復の作業を主に行っています。

2021年4月21日Bot使用申請

2021年4月22日テスト運用開始

2021年6月29日リンク修正Botとしてフラグ付与

2021年10月5日 Wikipedia:Bot作業依頼作業を追加承認

2023年10月30日 1万件以上の作業が必要なWikipedia:Bot作業依頼で使用可能なToolforge資格付与

  • ボット名/Bot: Anakabot (会話投稿記録SUL1SUL2他P)
  • 運用者/Operator: Anaka Satamiya (会話投稿記録SUL1SUL2他P)
  • 作業間隔/Interval: 60秒
  • 作業内容/Function:
    1. Main page containing links with broken anchorsより対象となるセクション切れのページのリストをPetScanよりページとリンク切れ日時を取得
    2. 第一条件:Template:Brokenanchorが貼られた日時の古いものから再結合先を確認し、ページ、古いセクション文字列、新しいセクション文字列の表作成。なお、セクションリンク切れ1件に対して対象ページが50件以上はこちらの作業軽減のためBot作業依頼を検討
    3. 表を元に、Template:Brokenanchor貼り付け後、1ヶ月を経過したものからreplace.pyを使いページ及びノートの修正
  • 運転方法/Operation: 3(1週間に500回程度を想定)のみ自動
  • ソフト/Software: pywikibot(3)、Petscan(1)、EXCEL(2)。最終的にはpywikibotのみに改良。
  • 連絡/Contact: Anaka Satamiya
  • ボットフラグ/Has bot flag(s) on: なし
  • コメント/Comment:気軽に見出しを変更する方も多いため、4/18現在セクションリンク切れページが日々増加しており放置状態のページも多い。地道な作業ですができる限り修正していきたいと思います。一度に200回以上の編集をする可能性があることからBot申請することにしました。Anakabotはセクション切れ修正作業専用とし、それ以外はAnaka Satamiyaを使用します。AnakaSata会話) 2021年4月24日 (土) 07:05 (UTC)

●追加申請内容(2021年10月5日)

  • ボット名/Bot: Anakabot (会話投稿記録SUL1SUL2 • 他P)
  • 運用者/Operator: Anaka Satamiya (会話投稿記録SUL1SUL2 • 他P)
  • 作業間隔/Interval: 30秒
  • 作業内容/Function:
    1. Wikipedia:Bot作業依頼作業
  • 運転方法/Operation: 手動
  • ソフト/Software: pywikibot、PAWS(2022/03/17追加)、Toolforge(2023/10/30追加)
  • 連絡/Contact: Anaka Satamiya
  • ボットフラグ/Has bot flag(s) on: あり
  • コメント/Comment:セクションリンク切れ作業が軽減されましたので、置換作業を主とするBot作業依頼のお手伝いをさせていただきたく思います。

2024年10月26日、種別D作業を申請

申請内容

  • ボット名/Bot: Anakabot (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
  • 運用者/Operator: Anaka_Satamiya (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
  • 作業間隔/Interval: 15
  • 作業種別/Type(s) of task(s):
種別D(ウィキ文法エラーの修正-Cite web|和書のメンテナンス)
  • 運転方法/Operation: 手動
  • ソフト/Software: pywikibot、PAWS
  • 連絡/Contact: 利用者‐会話:Anaka_Satamiya
  • ボットフラグ/Has bot flag(s) on: あり
  • コメント/Comment:去年、Cite webテンプレートの和書引数付加Bot作業を担当した中で、文法エラーや表記揺れが目立ったため、Cite webのうち和書引数が指定されているテンプレートのメンテナンス作業を行いたい。内容は以下のとおり。

調査対象記事数は351,246件(insource:"Cite web|和書",2024/10/26現在)

1.対象テンプレートのチェックをBotにて行う

  1. author引数の修正 - author引数にリンクをはる場合内部リンクでなく、authorlink引数によると指定されており、author=○○をauthor=○○|authorlink=○○に、author=△△をauthor=△△|authorlink=○○に変更する。複雑なauthor=○○××やauthor=○○××等は作業対象除外。
  2. 重複するパイプの修正- 引数が指定されていない重複パイプ(||)の解消
  3. 1文字目が大文字となっている引数の修正 - Author=○○ → author=○○
  4. date引数・archivedate引数(archive-date引数)・accessdate引数(access-date引数)の修正 - YYYY-M-D、YYYY-MM-D、YYYY-M-DD、YYYY/MM/DD、YYYY/M/D、YYYY/M/DD、YYYY/MM/D、YYYY.MM.DD、YYYY.M.D、YYYY.MM.D、YYYY.M.MD、英語版の日付形式など1つまたは複数のテンプレートにおいて違う形式で指定されているものが多い。このメンテナンスで将来の和書モード実装も睨みISO 8601の拡張形式に準拠した標準表記様式のYYYY-MM-DDに変更する。値が日付+複雑な文字列の場合は作業対象除外
  5. 上記修正が行われたテンプレートについてのみ空白引数の修正 - ひな形からコピーしてきただけで値が空白となっている引数の除去

2.以上の項目を置換前テンプレート・置換後テンプレートとしてリストアップし、目視確認

  1. 使用可能でない引数(newspaper=,editor=,)は他の引数変更を検討
  2. urlやlanguage引数を確認し和書表記が適切でないと気づいたとき- Cite web|和書 → Cite webに変更
  3. その他 - 目視で明らかに誤字・エラー(|web site=、date=20241026など)と分かる部分の修正

3.置換後テンプレートに対し重複引数チェックプログラム実施後、Botにて置換作業。 置換対象は5万件程度(35万件の15%、ランダムサンプリング実績により)・作業期間3ヶ月と予測している。--AnakaSata(会話) 2024年10月26日 (土) 10:15 (UTC)[返信]


セクション(見出し)切れ修正作業(案)について

セクションリンクはとても便利な機能です。その機能は以下の2つです。

  1. 記事の見出しに直接飛ぶことが出来ます。長い記事ではとても便利です。
  2. id属性を活用し、記事内参考文献に飛ぶことが出来ます。文献の確認に役立ちます。

 記事を編集する際、記事Aの見出し(以降セクションとする)を変更するとそのセクションに飛ぶように設定されていたページBは見出しを見失い、ページAの先頭に飛ぶようになります。本作業はその切れたセクションを再結合するのが目的です。  本来ならページA編集者やページB編集者が担って頂けるとよいのですが、周知徹底まではまだ時間がかかりそうです。  作業は以下の通りです。

  1. {{Broken anchors}}がノートに貼られたページと時間をPetScanツールPetscan:20067000を使い、表にまとめる。
  2. 日時の古いものからページを閲覧しリンク先を調査する。基準は以下の通り。
    1. 旧セクションの文言のみが変更され新セクションになっている場合 → この新セクションにリンク
    2. 旧セクションの文言が本文に格落ちになっている場合 → その本文が含まれる新セクションにリンク
    3. 旧セクションの文言が分割されて新ページになっている場合 → そのページにリンク
    4. 旧セクションの文言がページ検索でも出てこず消滅している場合 → 旧セクションのみ削除
    5. 正常に参考文献に跳ぶセクションを目視にて確認したときは変更しない。正常に跳べない場合は{{sfnRef}}{{Harvnb}}等にこちらで変更
    6. 正常にid要素に跳ぶセクションを目視にて確認したときは変更しない。正常に跳べない場合は{{Anchors}}{{Visible anchor}}等にこちらで変更
    7. 見出しに脚注・外部リンクが付けられている場合は、セクション切れを起こす(WP:MSH#NOLINK参照)ため、見出しの下にコメント(リンク移動のお願い)を挿入。複数既出している出典など削除が簡単に判断できる場合は削除
    8. その他の例が出てきた場合はその時判断。問い合わせ等が発生する案件はBot作業より人間作業がよいのでAnaka_Satamiyaアカウントで作業。
  3. 2ヶ月以上未修正のページから調査を行い、置換前・置換後を決定し、置換作業はpywikibotを使いページとノートの修正を行う。

Botと人間の作業分担は以下の通り。bot:人間の作業比率は2:8程度。

  • Bot: PetScanにより切れたセクションのリストアップ     

    ↓

  • 人間:調査・置換案の決定  

    ↓ 

  • Bot: pywikibotによる書込

(2021-07-23改訂)

修正作業の今後について

  • 7月の集中作業により14,000から1,900弱(おおよそ6/30以降新規及び追加テンプレート貼り付けページは除く)まで減少。今後はセクション切れが発生するペースを2000件/月と仮定し、当初案通り500回/週で作業し様子を見る。(2021/6/30修正)
  • 2022年より記事への{{Broken anchors}}貼り付けが無くなり、自動的に修正が行われるようになったため作業を中断し今後の方針を立案中です。(2022-1-19改訂)
  • 2022年3月17日より作業再開する。(2022-3-25改訂)

編集記録

次回は3月30日頃編集予定