Shells Family 是 AI 安全海洋中的「第一道防波堤」,如同贝壳坚硬的外壳,在输入与输出的关口快速阻拦风险,为模型提供轻量却高效的基础防御:
- ⚡ 轻量拦截:针对输入与输出进行快速分析,低延迟、高性能地阻断明显违规内容
- 🛡️ 基础护栏:作为安全生态的最前线,优先过滤危险提示、恶意指令、敏感信息泄露等
- 🌊 前置屏障:在更复杂的防御机制前,先行消除高概率威胁,保障后续防御层的稳定性
🐚 "安全的海岸线,始于坚固的第一道贝壳"
Shells Family 由多个轻量防御组件构成,每个贝壳模块专注于不同的安全拦截场景:
| 贝壳名称 | 防护场景 | 功能描述 | 核心贡献者 | 贡献组织 |
|---|---|---|---|---|
| 🐚 Shell-Guard | 输入过滤 | 对用户输入进行快速违规检测与拦截,阻止危险请求进入模型 | xxx | 阿里巴巴 |
| 🐚 Shell-Filter | 输出过滤 | 在模型输出阶段筛除违规或敏感信息,防止不安全内容返回用户 | xxx | 阿里巴巴 |
| 🐚 NDM | 文生图色情检测防护 | 基于早期预测噪声监控输入,并在识别风险意图时进行正向引导,从源头抑制色情内容 | 孙一彤 | 北京航空航天大学,阿里巴巴 |
# 安装 Shells 核心套件
pip install shells-family
# 启动轻量防御
from shells import ShellOrchestrator
shell_orchestrator = ShellOrchestrator(
target_model="your-ai-model",
defenses=["input_filter", "output_filter"] # 启用指定贝壳
)
shell_orchestrator.activate_shells() # 启动贝壳防护阵