Quickbench 🏃‍♂️

Stop guessing if your agent works. Run reproducible, sovereign evaluations locally.

🚀 Quick Start (2 minutes)

npm install quickbench
npm run demo

See signed report instantly with accuracy, latency, fairness metrics.

📊 Metrics Explained

Metric	Description	Formula
Accuracy	Exact match rate	`correct/total`
Latency	Response time	Mean + P95 (ms)
Fairness	Demographic parity	StdDev(accuracy per demographic)
Cost	Token cost	Placeholder (future LLM)

📖 Full Usage

import { runEvaluation, createMockAgent } from 'quickbench';
import { loadDataset } from 'quickbench';

const agent = (input: string) => 'your agent logic';
const dataset = await loadDataset('./my-data.csv');

const result = await runEvaluation({ agent, dataset });
console.log(result.scores.accuracy); // 0.87

🔒 Security Model

Zero Cloud: No APIs, no telemetry
Local Signing: HMAC-SHA256 receipts
No PII: Metadata-only tracking
Deterministic: Fixed seeds, reproducible

🗂️ Dataset Format (CSV)

input,expected,metadata
"This is great!",positive,{"region":"en","demographic":"A"}
"Awful service.",negative

🧪 Example Output

=== Quickbench Signed Report ===
scores:
  accuracy: 0.7
  latency: 
    mean: 2ms
    p95: 5ms
  fairness:
    demographicParity: 0.02
signature: abc123...

🛠️ Capkit Integration

npm i capkit quickbench
# Secure agent with capkit, eval with quickbench

Part of the Agent Builder Suite
→ capkit: Scoped capabilities for agents
→ quickbench: Reproducible agent evaluation
→ edge-run: Offline-first orchestration (coming soon)
→ connector-starter: Generate adapters fast (coming soon)

Built for builders who ship. MIT licensed. Local-first by design.

🤝 License

MIT - Ships sovereign, stays sovereign.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
@types		@types
demo		demo
dist		dist
node_modules		node_modules
src		src
test		test
.dockerignore		.dockerignore
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
Dockerfile		Dockerfile
README.md		README.md
jest.config.js		jest.config.js
package-lock.json		package-lock.json
package.json		package.json
quickbench-report.json		quickbench-report.json
run-demo.sh		run-demo.sh
tsconfig.json		tsconfig.json
types.d.ts		types.d.ts

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Quickbench 🏃‍♂️

🚀 Quick Start (2 minutes)

📊 Metrics Explained

📖 Full Usage

🔒 Security Model

🗂️ Dataset Format (CSV)

🧪 Example Output

🛠️ Capkit Integration

🤝 License

About

Uh oh!

Releases 1

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Quickbench 🏃‍♂️

🚀 Quick Start (2 minutes)

📊 Metrics Explained

📖 Full Usage

🔒 Security Model

🗂️ Dataset Format (CSV)

🧪 Example Output

🛠️ Capkit Integration

🤝 License

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages