利用者:Anakabot
Anakabot | |
---|---|
(会話 · 投稿記録) | |
運用者: | Anaka Satamiya |
使用申請: | 申請済 |
フラグ: | あり (確認) |
作業内容: | セクションリンク切れの修復、Bot作業依頼 |
動作間隔: | 1回/分 |
動作する時間帯: | 週1回500ページ程度を想定 |
自動/手動: | 手動 |
プログラミング言語: | pywikibot、PAWSを利用 |
ソースの公開状況: | 公開なし |
緊急停止ボタン: | なし |
セクション切れ修復の作業を主に行っています。
このアカウントは Anaka Satamiya (会話) によって管理されている Bot です。
手作業で処理するのが煩わしい大量の編集を自動化するために導入されています。ソックパペットではありませんので注意してください。 |
2021年4月21日Bot使用申請
2021年4月22日テスト運用開始
2021年6月29日リンク修正Botとしてフラグ付与
2021年10月5日 Wikipedia:Bot作業依頼作業を追加承認
2023年10月30日 1万件以上の作業が必要なWikipedia:Bot作業依頼で使用可能なToolforge資格付与
この Bot は Wikimedia Toolforge 上で動作しています。(ツールアカウント: anakabot01) 1万件以上の作業が必要なBot作業依頼が対象 管理者の方へ: 誤作動のためブロックが必要な場合、自動ブロックを無効にしてください。(解説) |
- ボット名/Bot: Anakabot (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
- 運用者/Operator: Anaka Satamiya (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
- 作業間隔/Interval: 60秒
- 作業内容/Function:
- Main page containing links with broken anchorsより対象となるセクション切れのページのリストをPetScanよりページとリンク切れ日時を取得
- 第一条件:Template:Brokenanchorが貼られた日時の古いものから再結合先を確認し、ページ、古いセクション文字列、新しいセクション文字列の表作成。なお、セクションリンク切れ1件に対して対象ページが50件以上はこちらの作業軽減のためBot作業依頼を検討
- 表を元に、Template:Brokenanchor貼り付け後、1ヶ月を経過したものからreplace.pyを使いページ及びノートの修正
- 運転方法/Operation: 3(1週間に500回程度を想定)のみ自動
- ソフト/Software: pywikibot(3)、Petscan(1)、EXCEL(2)。最終的にはpywikibotのみに改良。
- 連絡/Contact: Anaka Satamiya
- ボットフラグ/Has bot flag(s) on: なし
- コメント/Comment:気軽に見出しを変更する方も多いため、4/18現在セクションリンク切れページが日々増加しており放置状態のページも多い。地道な作業ですができる限り修正していきたいと思います。一度に200回以上の編集をする可能性があることからBot申請することにしました。Anakabotはセクション切れ修正作業専用とし、それ以外はAnaka Satamiyaを使用します。AnakaSata(会話) 2021年4月24日 (土) 07:05 (UTC)
●追加申請内容(2021年10月5日)
- ボット名/Bot: Anakabot (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
- 運用者/Operator: Anaka Satamiya (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
- 作業間隔/Interval: 30秒
- 作業内容/Function:
- 運転方法/Operation: 手動
- ソフト/Software: pywikibot、PAWS(2022/03/17追加)、Toolforge(2023/10/30追加)
- 連絡/Contact: Anaka Satamiya
- ボットフラグ/Has bot flag(s) on: あり
- コメント/Comment:セクションリンク切れ作業が軽減されましたので、置換作業を主とするBot作業依頼のお手伝いをさせていただきたく思います。
2024年10月26日、種別D作業を申請
申請内容
- ボット名/Bot: Anakabot (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
- 運用者/Operator: Anaka_Satamiya (会話 • 投稿記録 • SUL1 • SUL2 • 他P)
- 作業間隔/Interval: 15
- 作業種別/Type(s) of task(s):
- 種別D(ウィキ文法エラーの修正-Cite web|和書のメンテナンス)
- 運転方法/Operation: 手動
- ソフト/Software: pywikibot、PAWS
- 連絡/Contact: 利用者‐会話:Anaka_Satamiya
- ボットフラグ/Has bot flag(s) on: あり
- コメント/Comment:去年、Cite webテンプレートの和書引数付加Bot作業を担当した中で、文法エラーや表記揺れが目立ったため、Cite webのうち和書引数が指定されているテンプレートのメンテナンス作業を行いたい。内容は以下のとおり。
調査対象記事数は351,246件(insource:"Cite web|和書",2024/10/26現在)
1.対象テンプレートのチェックをBotにて行う
- author引数の修正 - author引数にリンクをはる場合内部リンクでなく、authorlink引数によると指定されており、author=○○をauthor=○○|authorlink=○○に、author=△△をauthor=△△|authorlink=○○に変更する。複雑なauthor=○○××やauthor=○○××等は作業対象除外。
- 重複するパイプの修正- 引数が指定されていない重複パイプ(||)の解消
- 1文字目が大文字となっている引数の修正 - Author=○○ → author=○○
- date引数・archivedate引数(archive-date引数)・accessdate引数(access-date引数)の修正 - YYYY-M-D、YYYY-MM-D、YYYY-M-DD、YYYY/MM/DD、YYYY/M/D、YYYY/M/DD、YYYY/MM/D、YYYY.MM.DD、YYYY.M.D、YYYY.MM.D、YYYY.M.MD、英語版の日付形式など1つまたは複数のテンプレートにおいて違う形式で指定されているものが多い。このメンテナンスで将来の和書モード実装も睨みISO 8601の拡張形式に準拠した標準表記様式のYYYY-MM-DDに変更する。値が日付+複雑な文字列の場合は作業対象除外
- 上記修正が行われたテンプレートについてのみ空白引数の修正 - ひな形からコピーしてきただけで値が空白となっている引数の除去
2.以上の項目を置換前テンプレート・置換後テンプレートとしてリストアップし、目視確認
- 使用可能でない引数(newspaper=,editor=,)は他の引数変更を検討
- urlやlanguage引数を確認し和書表記が適切でないと気づいたとき- Cite web|和書 → Cite webに変更
- その他 - 目視で明らかに誤字・エラー(|web site=、date=20241026など)と分かる部分の修正
3.置換後テンプレートに対し重複引数チェックプログラム実施後、Botにて置換作業。 置換対象は5万件程度(35万件の15%、ランダムサンプリング実績により)・作業期間3ヶ月と予測している。--AnakaSata(会話) 2024年10月26日 (土) 10:15 (UTC)[返信]
セクション(見出し)切れ修正作業(案)について
セクションリンクはとても便利な機能です。その機能は以下の2つです。
- 記事の見出しに直接飛ぶことが出来ます。長い記事ではとても便利です。
- id属性を活用し、記事内参考文献に飛ぶことが出来ます。文献の確認に役立ちます。
記事を編集する際、記事Aの見出し(以降セクションとする)を変更するとそのセクションに飛ぶように設定されていたページBは見出しを見失い、ページAの先頭に飛ぶようになります。本作業はその切れたセクションを再結合するのが目的です。 本来ならページA編集者やページB編集者が担って頂けるとよいのですが、周知徹底まではまだ時間がかかりそうです。 作業は以下の通りです。
- {{Broken anchors}}がノートに貼られたページと時間をPetScanツールPetscan:20067000を使い、表にまとめる。
- 日時の古いものからページを閲覧しリンク先を調査する。基準は以下の通り。
- 旧セクションの文言のみが変更され新セクションになっている場合 → この新セクションにリンク
- 旧セクションの文言が本文に格落ちになっている場合 → その本文が含まれる新セクションにリンク
- 旧セクションの文言が分割されて新ページになっている場合 → そのページにリンク
- 旧セクションの文言がページ検索でも出てこず消滅している場合 → 旧セクションのみ削除
- 正常に参考文献に跳ぶセクションを目視にて確認したときは変更しない。正常に跳べない場合は{{sfnRef}}{{Harvnb}}等にこちらで変更
- 正常にid要素に跳ぶセクションを目視にて確認したときは変更しない。正常に跳べない場合は{{Anchors}}{{Visible anchor}}等にこちらで変更
- 見出しに脚注・外部リンクが付けられている場合は、セクション切れを起こす(WP:MSH#NOLINK参照)ため、見出しの下にコメント(リンク移動のお願い)を挿入。複数既出している出典など削除が簡単に判断できる場合は削除
- その他の例が出てきた場合はその時判断。問い合わせ等が発生する案件はBot作業より人間作業がよいのでAnaka_Satamiyaアカウントで作業。
- 2ヶ月以上未修正のページから調査を行い、置換前・置換後を決定し、置換作業はpywikibotを使いページとノートの修正を行う。
Botと人間の作業分担は以下の通り。bot:人間の作業比率は2:8程度。
- Bot: PetScanにより切れたセクションのリストアップ
↓
- 人間:調査・置換案の決定
↓
- Bot: pywikibotによる書込
(2021-07-23改訂)
修正作業の今後について
- 7月の集中作業により14,000から1,900弱(おおよそ6/30以降新規及び追加テンプレート貼り付けページは除く)まで減少。今後はセクション切れが発生するペースを2000件/月と仮定し、当初案通り500回/週で作業し様子を見る。(2021/6/30修正)
- 2022年より記事への{{Broken anchors}}貼り付けが無くなり、自動的に修正が行われるようになったため作業を中断し今後の方針を立案中です。(2022-1-19改訂)
- 2022年3月17日より作業再開する。(2022-3-25改訂)
編集記録
- 2021年07月04日 切れたセクションリンク修正 - 編集記録:80件
- 2021年07月05日 切れたセクションリンク修正 - 編集記録:502件
- 2021年07月06日 切れたセクションリンク修正 - 編集記録:386件
- 2021年07月07日 切れたセクションリンク修正 - 編集記録:699件
- 2021年07月10日 切れたセクションリンク修正 - 編集記録:813件
- 2021年07月11日 切れたセクションリンク修正 - 編集記録:258件
- 2021年07月12日 切れたセクションリンク修正 - 編集記録:1439件
- 2021年07月13日 切れたセクションリンク修正 - 編集記録:2409件
- 2021年07月14日 切れたセクションリンク修正 - 編集記録:1731件
- 2021年07月15日 切れたセクションリンク修正 - 編集記録:1395件
- 2021年07月16日 切れたセクションリンク修正 - 編集記録:1801件
- 2021年07月17日 切れたセクションリンク修正 - 編集記録:655件
- 2021年07月18日 切れたセクションリンク修正 - 編集記録:100件
- 2021年07月19日 切れたセクションリンク修正 - 編集記録:534件
- 2021年07月20日 切れたセクションリンク修正 - 編集記録:297件
- 2021年07月21日 切れたセクションリンク修正 - 編集記録:625件
- 2021年07月22日 切れたセクションリンク修正 - 編集記録:418件
- 2021年07月23日 切れたセクションリンク修正 - 編集記録:1328件
- 2021年07月24日 切れたセクションリンク修正 - 編集記録:1452件
- 2021年07月25日 切れたセクションリンク修正 - 編集記録:1567件
- 2021年07月26日 切れたセクションリンク修正 - 編集記録:1546件
- 2021年07月27日 切れたセクションリンク修正 - 編集記録:2173件
- 2021年07月28日 切れたセクションリンク修正 - 編集記録:1355件
- 2021年07月29日 切れたセクションリンク修正 - 編集記録:1961件
- 2021年07月30日 切れたセクションリンク修正 - 編集記録:1059件
- 2021年08月06日 切れたセクションリンク修正 - 編集記録:1014件
- 2021年08月07日 切れたセクションリンク修正 - 編集記録:546件
- 2021年08月10日 切れたセクションリンク修正 - 編集記録:513件
- 2021年08月11日 切れたセクションリンク修正 - 編集記録:871件
- 2021年08月13日 切れたセクションリンク修正 - 編集記録:457件
- 2021年08月20日 切れたセクションリンク修正 - 編集記録:901件
- 2021年08月27日 切れたセクションリンク修正 - 編集記録:880件
- 2021年09月04日 切れたセクションリンク修正 - 編集記録:1042件
- 2021年09月10日 切れたセクションリンク修正 - 編集記録:215件
- 2021年09月18日 切れたセクションリンク修正 - 編集記録:143件
- 2021年09月24日 切れたセクションリンク修正 - 編集記録:590件
- 2021年10月02日 切れたセクションリンク修正 - 編集記録:1870件
- 2021年10月09日 切れたセクションリンク修正 - 編集記録:632件
- 2021年10月16日 切れたセクションリンク修正 - 編集記録:427件
- 2021年10月22日 切れたセクションリンク修正 - 編集記録:1492件
- 2021年10月29日 切れたセクションリンク修正 - 編集記録:824件
- 2021年11月05日 切れたセクションリンク修正 - 編集記録:412件
- 2021年11月13日 切れたセクションリンク修正 - 編集記録:594件
- 2021年11月20日 切れたセクションリンク修正 - 編集記録:737件
- 2021年11月25日 切れたセクションリンク修正 - 編集記録:910件
- 2021年12月04日 切れたセクションリンク修正 - 編集記録:1151件
- 2021年12月16日 切れたセクションリンク修正 - 編集記録:525件
- 2022年03月19日 切れたセクションリンク修正 - 編集記録:761件
- 2022年04月15日 切れたセクションリンク修正 - 編集記録:984件
- 2022年04月27日 切れたセクションリンク修正 - 編集記録:235件
- 2022年04月30日 切れたセクションリンク修正 - 編集記録:855件
- 2022年05月01日 切れたセクションリンク修正 - 編集記録:571件
- 2022年05月05日 切れたセクションリンク修正 - 編集記録:454件
- 2022年05月13日 切れたセクションリンク修正 - 編集記録:565件
- 2022年05月15日 切れたセクションリンク修正 - 編集記録:288件
- 2022年05月18日 切れたセクションリンク修正 - 編集記録:335件
- 2022年07月05日 切れたセクションリンク修正 - 編集記録:266件
- 2022年07月06日 切れたセクションリンク修正 - 編集記録:440件
- 2022年07月07日 切れたセクションリンク修正 - 編集記録:772件
- 2022年07月10日 切れたセクションリンク修正 - 編集記録:750件
- 2022年07月12日 切れたセクションリンク修正 - 編集記録:1442件
- 2022年07月14日 切れたセクションリンク修正 - 編集記録:622件
- 2022年07月16日 切れたセクションリンク修正 - 編集記録:308件
- 2022年07月19日 切れたセクションリンク修正 - 編集記録:520件
- 2022年07月20日 切れたセクションリンク修正 - 編集記録:923件
- 2022年07月21日 切れたセクションリンク修正 - 編集記録:284件
- 2022年08月20日 切れたセクションリンク修正 - 編集記録:124件
- 2022年11月18日 切れたセクションリンク修正 - 編集記録:356件
- 2023年01月04日 切れたセクションリンク修正 - 編集記録:249件
- 2023年05月08日 切れたセクションリンク修正 - 編集記録:50件
- 2023年05月19日 切れたセクションリンク修正 - 編集記録:1050件
- 2023年10月23日 切れたセクションリンク修正 - 編集記録:25件
- 2023年12月21日 切れたセクションリンク修正 - 編集記録:110件
- 2024年02月17日 切れたセクションリンク修正 - 編集記録:35件
- 2024年03月24日 切れたセクションリンク修正 - 編集記録:454件
- 2024年10月26日 切れたセクションリンク修正 - 編集記録:4件
次回は3月30日頃編集予定