lkevincc0

Jin lkevincc0

Popular repositories Loading

comp20008-assignment2 comp20008-assignment2 Public archive

COMP20008 Assignment

Jupyter Notebook
fastllm-glm47-dev fastllm-glm47-dev Public

Forked from ztxz16/fastllm

fastllm是后端无依赖的高性能大模型推理库。同时支持张量并行推理稠密模型和混合模式推理MOE模型，任意10G以上显卡即可推理满血DeepSeek。双路9004/9005服务器+单显卡部署DeepSeek满血满精度原版模型，单并发20tps；INT4量化模型单并发30tps，多并发可达60+。

C++
ktransformers ktransformers Public

Forked from kvcache-ai/ktransformers

A Flexible Framework for Experiencing Heterogeneous LLM Inference/Fine-tune Optimizations

Python
reap-step3p5 reap-step3p5 Public

Forked from CerebrasResearch/reap

REAP: Router-weighted Expert Activation Pruning for SMoE compression

Python
TradingGYM TradingGYM Public

matching engine + rl practice

Rust
cs336-assignments cs336-assignments Public

CS336 self-study assignments.

Python