Development Roadmap (2025 Q4)

# KTransformers Roadmap - 2025 Q4


 
## Focus
- Usability: Easy installation on x86 + NV GPU, more documents and FQA. 
- Model Coverage: K2-Thinking INT4 native support, Qwen3 Finetune. 
 
## Usability
- Refactoring KTransformers structure. #1581   @SkqLiao  
- Docker start of sglang-kt inference. @SkqLiao 
- Local quantization scripts. @ouqingliang  
- Documents: installation guide, coverage infomation, contribution guide and FAQ. @SkqLiao  @ErvinXie   
 
## Model Coverage
- K2 Thinking INT4 native support #1598 . @ouqingliang @chenht2022  
- Support Qwen3 series finetune. @JimmyPeilinLi  and community contributors. #1575 #1602 
- Qwen3 VL inference support, TDB. 
 
## Performance / Features
- Layerwise prefill. @chenht2022 
- AVX2 Support for inference and finetune. @SkqLiao  @JimmyPeilinLi  
- AMD Adaption @KMSorSMS #1601
- EPLB for inference @chenht2022  
 
## Contribution / Maintenance
- Build CI workflow for kt-kernel. TBD 
- Merge KT-SFT and kt-kernel @JimmyPeilinLi  
- Bi-weekly Office Hour @KMSorSMS 

---
Any contribution is welcomed, please email ervinxie@qq.com if you want to join development WeChat group.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Development Roadmap (2025 Q4) #1582

KTransformers Roadmap - 2025 Q4

Focus

Usability

Model Coverage

Performance / Features

Contribution / Maintenance

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Development Roadmap (2025 Q4) #1582

Description

KTransformers Roadmap - 2025 Q4

Focus

Usability

Model Coverage

Performance / Features

Contribution / Maintenance

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions