AI Security Testing Playbook

A practical, defensive playbook for testing and securing LLM-powered apps (chatbots, RAG systems, agentic tools, code assistants) in authorized environments.

This repository focuses on:

How to test AI systems for common security failures
What to log + measure
How to mitigate issues with practical patterns
Hands-on labs you can run locally

⚠️ Ethics & Scope: This repo is for security testing on systems you own or have explicit permission to test. See docs/scope-and-ethics.md.

Quick links

Playbooks → playbooks/
Checklists → checklists/
Mitigation patterns → patterns/mitigation-patterns.md
Local lab → labs/prompt-injection-toy-app/
Threat modeling → docs/threat-modeling.md

The Top 10 LLM App Security Risks (practical)

Prompt injection (direct + indirect via docs)
Tool abuse (unsafe actions, privilege misuse)
Tool-output injection (model trusts tool output as instructions)
RAG overexposure (retrieves sensitive docs / too-broad scope)
RAG poisoning (malicious documents / source spoofing)
Sensitive data leakage (system prompts, memory, logs)
Authz gaps (model can access data the user shouldn’t)
Insecure AI-generated code (weak crypto, injection, auth flaws)
Unsafe defaults in production (no rate limits, no monitoring)
Evaluation blind spots (no regression tests for security failures)

Use the checklists here to systematically test each category.

Reference architecture (where attacks happen)

            Untrusted Inputs
   (user, files, URLs, tool outputs)
                  |
                  v
            +-------------+
            |  LLM APP     |  <-- prompt assembly, policy, routing
            +-------------+
             |     |     |
             |     |     +--> RAG (retrieval + docs)
             |     +--------> Tools (APIs / actions)
             +--------------> Response (user)

Key idea: treat anything untrusted as data, and strictly control how it reaches prompts and tools.

What’s inside

Quickstart

Read the guardrails:

docs/scope-and-ethics.md

Run a lab locally:

labs/prompt-injection-toy-app/README.md

Use a checklist during reviews:

checklists/llm-app-security-review.md

Optional: GitHub Pages docs (MkDocs)

This repo includes an MkDocs config so you can publish docs via GitHub Pages easily:

mkdocs.yml
docs/index.md

To build locally:

pip install -r docs-requirements.txt
mkdocs serve

Contributors

GitHub	Role
@Jerrycyborg	Creator & Maintainer

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
.github/workflows		.github/workflows
assets		assets
checklists		checklists
docs		docs
examples		examples
labs		labs
patterns		patterns
playbooks		playbooks
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
SECURITY.md		SECURITY.md
docs-requirements.txt		docs-requirements.txt
mkdocs.yml		mkdocs.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI Security Testing Playbook

Quick links

The Top 10 LLM App Security Risks (practical)

Reference architecture (where attacks happen)

What’s inside

Playbooks

Checklists

Patterns & Metrics

Labs (local)

Quickstart

Optional: GitHub Pages docs (MkDocs)

Contributors

Contributing

License

Examples

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

AI Security Testing Playbook

Quick links

The Top 10 LLM App Security Risks (practical)

Reference architecture (where attacks happen)

What’s inside

Playbooks

Checklists

Patterns & Metrics

Labs (local)

Quickstart

Optional: GitHub Pages docs (MkDocs)

Contributors

Contributing

License

Examples

About

Topics

Resources

License

Code of conduct

Contributing

Security policy

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages