健壮 Bangumi Data 匹配与合并工具，修复相关问题 by wan0ge · Pull Request #289 · huangxd-/danmu_api

wan0ge · 2026-04-27T18:21:12Z

📝 PR 描述

变更类型

🐛 Bug 修复 (bug)
🚀 优化/重构 (perf/refactor)

变更内容

本次 PR 主要修复了各源站（Bahamut、Dandan、Animeko）的标题匹配遗漏与别名传递丢失问题，优化了底层的全局匹配引擎，并进一步提升了网络请求的健壮性与本地数据的内存利用率。具体变更如下：

修复 Bahamut 源的标题误杀问题 (bahamut.js)
- 问题：在开启 USE_BANGUMI_DATA 时，网络结果成功对齐本地数据后，主标题会被本地优选标题覆盖，导致后续基于用户搜索词的标题匹配规则校验失败，进而错杀有效搜索结果。
- 修复：在标题被覆盖前，将巴哈姆特的原始标题备份至别名池（aliases）中；同时重构过滤阶段的匹配逻辑，利用短路求值特性，在主标题匹配失败时自动降级验证别名池，确保源站特征不丢失。
优化 Bangumi Data 检索精度与性能 (bangumi-data-util.js)
- 优化：为 searchBangumiData 函数新增了搜索词的简繁体转换兜底支持，以实现更高精度的精确匹配。
- 实现细节：为了应对庞大的本地缓存数据，采用 Set 对原词、简体词和繁体词进行提前聚合与去重。在遍历数据源时，通过双重 some 逻辑进行极简的短路碰撞，在提升匹配准确率的同时，保证了遍历操作的性能。
优化全局标题匹配引擎，引入简繁双向容错 (common-util.js)
- 问题：原有的全站通用标题匹配逻辑（titleMatches）不具备简繁体转换能力。当遇到如“终末起点第二季”与“終末起點第二季”这种仅存在简繁字形差异的情况时，无论是包含匹配还是相似度匹配都会因为字符不一致导致评分骤降，引发跨源误杀。
- 优化：在底层工具中引入简繁转换依赖。在函数顶层将单搜索词扩展为“原词、简体、繁体”的去重变种池（qList），让包含匹配与相似度匹配兜底策略共享该词池。在维持原有代码层级与防错逻辑不变的前提下，消除了简繁体匹配的死角。
修复 Dandan 与 Animeko 源的别名传递丢失与内存污染隐患 (dandan.js, animeko.js)
- 问题：在触发本地 Bangumi-Data 拦截时，伪造返回的数据对象中漏传了 aliases 字段，导致下游 handleAnimes 构建比对池时缺少关键线索。此外，animeko.js 中存在直接覆盖别名数组的隐患。
- 修复：在本地拦截返回时，通过展开语法（[...m.titles]）将多国译名浅拷贝注入到 aliases 中；修复了 animeko 的继承丢失问题。此举保证了本地别名能送达匹配校验层，并阻断了下游逻辑操作对全局缓存库的内存污染风险。
重构 Bangumi Data 缓存与加载机制，降低常驻内存与磁盘占用 (bangumi-data-util.js)
- 问题：原逻辑将约 7MB 的全量数据文件直接进行流式磁盘缓存或整体内存解析。完整 JSON 经 V8 引擎解析为对象树后，会产生较高的常驻内存占用，增加了 Serverless 环境下的 OOM 风险；同时，全量文件读取也增加了进程冷启动时的 JSON.parse() 耗时。
- 优化：改变原有直接写盘的流式处理逻辑，在下载完成后引入同步数据精简步骤（pruneBangumiData）。针对原始 JSON 结构执行精确剔除，仅保留项目中实际调用的 9 个目标站点（如 bilibili、tmdb、anidb 等），并丢弃不包含这些站点的无用条目及冗余字段（如 broadcast、officialSite 等）。
- 实现细节：并发获取数据的同时，独立的 Promise 节点记录各自的解析与精简耗时。竞速胜出后，将精简后的轻量级对象结构写入磁盘并挂载至内存变量。此举在不影响数据完整性的前提下，大幅减少了本地缓存文件的体积与运行时的内存堆积。

📋 提交前检查清单

无需

vercel · 2026-04-27T18:21:16Z

@wan0ge is attempting to deploy a commit to the huangxd's projects Team on Vercel.

A member of the Team first needs to authorize it.

netlify · 2026-04-27T18:21:17Z

👷 Deploy request for danmuapi pending review.

Visit the deploys page to approve it

Name	Link
🔨 Latest commit	`039a652`

Added aliases to the data structure and improved title matching logic.

修复开启 Bangumi Data 匹配后弹弹源始终不返回“终末起点第二季”结果（因为 Bangumi Data 数据这一部使用的是繁体）

* 修复开启 USE_BANGUMI_DATA 后《加油！中村同学！！》对齐 Bangumi-Data 数据后结果被抛弃 * 命中数据流程进行简繁转换，提升准确度 * Update bahamut.js * bahamut.js：补全 retries: 1 重试参数，避免反代场景的一定风控 * dandan.js：补全 retries: 1 重试参数，避免接口不稳定 * merge-util.js：修复“终末起点”合并问题，并在判断季时深入到别名池 * animeko.js：补全别名传递 * dandan.js：补全别名传递 Added aliases to the data structure and improved title matching logic. * common-util.js：引入繁简转化工具，用于标题匹配路由提升可靠性修复开启 Bangumi Data 匹配后弹弹源始终不返回“终末起点第二季”结果（因为 Bangumi Data 数据这一部使用的是繁体） * Update common-util.js * bangumi-data-util.js：精简裁切Bangumi Data 数据结构，大幅减少硬盘与内存占用

wan0ge added 2 commits April 28, 2026 02:11

修复开启 USE_BANGUMI_DATA 后《加油！中村同学！！》对齐 Bangumi-Data 数据后结果被抛弃

7fc40e3

命中数据流程进行简繁转换，提升准确度

1769d10

wan0ge added 8 commits April 28, 2026 02:28

Update bahamut.js

5bb20ea

bahamut.js：补全 retries: 1 重试参数，避免反代场景的一定风控

96833ce

dandan.js：补全 retries: 1 重试参数，避免接口不稳定

74f1616

merge-util.js：修复“终末起点”合并问题，并在判断季时深入到别名池

bcf6b99

animeko.js：补全别名传递

dd33009

dandan.js：补全别名传递

1f7e53f

Added aliases to the data structure and improved title matching logic.

common-util.js：引入繁简转化工具，用于标题匹配路由提升可靠性

689a3fa

修复开启 Bangumi Data 匹配后弹弹源始终不返回“终末起点第二季”结果（因为 Bangumi Data 数据这一部使用的是繁体）

Update common-util.js

953fc76

wan0ge changed the title ~~修复开启 Bangumi Data 匹配后巴哈搜索“加油！中村同学！！”无结果~~ 健壮 Bangumi Data 匹配与合并工具，修复相关问题 Apr 28, 2026

bangumi-data-util.js：精简裁切Bangumi Data 数据结构，大幅减少硬盘与内存占用

039a652

huangxd- merged commit b50af1f into huangxd-:main Apr 30, 2026
0 of 2 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

健壮 Bangumi Data 匹配与合并工具，修复相关问题#289

健壮 Bangumi Data 匹配与合并工具，修复相关问题#289
huangxd- merged 11 commits intohuangxd-:mainfrom
wan0ge:bangumi-data1.5

wan0ge commented Apr 27, 2026 •

edited

Loading

Uh oh!

vercel Bot commented Apr 27, 2026

Uh oh!

netlify Bot commented Apr 27, 2026 •

edited

Loading

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

wan0ge commented Apr 27, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

📝 PR 描述

变更类型

变更内容

相关 Issue

📋 提交前检查清单

Uh oh!

vercel Bot commented Apr 27, 2026

Uh oh!

netlify Bot commented Apr 27, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

👷 Deploy request for danmuapi pending review.

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

wan0ge commented Apr 27, 2026 •

edited

Loading

netlify Bot commented Apr 27, 2026 •

edited

Loading