用于 bangumi wiki 的脚本合集。依赖官方 Archive。
- download_bangumi_archive.py:获取最新 Archive
- find_duplicate_isbns.py:查找重复 ISBN 的条目
- 限定了 9784 开头(日本),因为大陆出版物很多用丛书号
- 可指定汇报帖以排除已汇报 ISBN
- 可以通过修改查找重复的脚本中的 WHITE_LIST,设置丛书号等不参与查找的 ISBN 的白名单
- filter_by_fields.py:查找指定字段含有指定文本/符合指定正则表达式/有无指定关联/有无指定标签的条目,输出相应 csv 表格和 jsonlines,可结合 Excel 和下方脚本使用
- wikiBatch.user.js:在 https://next.bgm.tv 根据含有 ID 和字段列的 csv 批量审核编辑,需要维基权限,不完善,请谨慎使用,注意审核
当前执行的自动任务:
- 每周二 UTC 21:30 (官方 Archive 更新后约半小时),拉取最新 Archive,查找重复 ISBN 条目,上传最新结果:duplicate_check_results.txt
- 待完善:
- 小说/漫画系列与单行本类型不一致
- 有序号的单行本未关联系列
- 书籍只关联而未填写作者
- 书籍的小说/漫画标签
- 书籍已填写连载结束而没有已完结标签
- 写了 ISBN 的系列
- 过于便宜/昂贵的书籍(可能是亚马逊抓取未检查/ISBN填写到错误栏目)
- 发售日比连载开始还早

