模型选择指南

MLX 优化模型 (Apple Silicon 专用)

如果你使用 Apple Silicon 和 MLX,强烈推荐使用 mlx-community 的量化模型:

4-bit 量化版本

内存占用更小,速度更快:

Qwen2.5-1.5B-Instruct-4bit
- 模型 ID: mlx-community/Qwen2.5-1.5B-Instruct-4bit
- 大小: ~1GB
- 特点: 极致性能,几乎无损
Qwen2.5-7B-Instruct-4bit
- 模型 ID: mlx-community/Qwen2.5-7B-Instruct-4bit
- 大小: ~4GB
- 特点: 在 M1 Pro 及以上流畅运行

8-bit 量化版本

更好的质量:

Qwen2.5-7B-Instruct-8bit
- 模型 ID: mlx-community/Qwen2.5-7B-Instruct-8bit
- 大小: ~8GB
- 特点: 质量与效率兼顾

模型对比

模型	参数量	内存占用	中文能力	英文能力	推荐场景
Qwen2.5-1.5B	1.5B	~3GB	⭐⭐⭐⭐	⭐⭐⭐	学习测试
Qwen2.5-3B	3B	~6GB	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	日常使用
Qwen2.5-7B	7B	~14GB	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	专业工作
Llama-3.2-3B	3B	~6.5GB	⭐⭐⭐	⭐⭐⭐⭐⭐	英文为主

如何切换模型

方法 1: 命令行参数

python main.py --model Qwen/Qwen2.5-7B-Instruct

方法 2: 修改配置文件

编辑 config/config.yaml:

model:
  default_model: "Qwen/Qwen2.5-7B-Instruct"

方法 3: 环境变量

export DEFAULT_MODEL="Qwen/Qwen2.5-7B-Instruct"
python main.py

模型下载

自动下载 (推荐)

首次运行时,模型会自动从 HuggingFace 下载:

python main.py

手动下载

如果自动下载失败,可以手动下载:

# 使用 huggingface-cli
pip install huggingface-hub
huggingface-cli download Qwen/Qwen2.5-1.5B-Instruct

使用本地模型

如果已经下载了模型到本地:

python main.py --model /path/to/local/model

性能优化建议

Apple Silicon

使用 MLX 框架
选择 mlx-community 的量化模型
确保系统更新到最新版本

NVIDIA GPU

使用最新的 CUDA 版本
启用 Flash Attention (可选)
使用 bitsandbytes 量化

CPU

选择较小的模型 (1.5B-3B)
减少 max_new_tokens
使用量化模型

模型评测数据

Qwen2.5 系列

C-Eval (中文综合): 1.5B: 67.9 | 7B: 83.5
MMLU (英文综合): 1.5B: 60.9 | 7B: 70.3
HumanEval (代码): 1.5B: 37.8 | 7B: 61.6

Llama 3.2 系列

MMLU: 3B: 63.4
HumanEval: 3B: 52.4

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

模型选择指南

推荐模型

入门级 (8GB RAM)

进阶级 (16GB RAM)

专业级 (32GB RAM / 8GB+ VRAM)

MLX 优化模型 (Apple Silicon 专用)

4-bit 量化版本

8-bit 量化版本

模型对比

如何切换模型

方法 1: 命令行参数

方法 2: 修改配置文件

方法 3: 环境变量

模型下载

自动下载 (推荐)

手动下载

使用本地模型

性能优化建议

Apple Silicon

NVIDIA GPU

CPU

模型评测数据

Qwen2.5 系列

Llama 3.2 系列

推荐配置

日常使用

创意写作

代码生成

更多资源

FilesExpand file tree

model_guide.md

Latest commit

History

model_guide.md

File metadata and controls

模型选择指南

推荐模型

入门级 (8GB RAM)

进阶级 (16GB RAM)

专业级 (32GB RAM / 8GB+ VRAM)

MLX 优化模型 (Apple Silicon 专用)

4-bit 量化版本

8-bit 量化版本

模型对比

如何切换模型

方法 1: 命令行参数

方法 2: 修改配置文件

方法 3: 环境变量

模型下载

自动下载 (推荐)

手动下载

使用本地模型

性能优化建议

Apple Silicon

NVIDIA GPU

CPU

模型评测数据

Qwen2.5 系列

Llama 3.2 系列

推荐配置

日常使用

创意写作

代码生成

更多资源