使用VLM实现相册图像分类
- 简单网页界面
- 自定义分类
- 复杂图片处理策略:
- 非常规比例图片(图像处理策略)
- 大量文字图片(使用其他模型分析图片文字内容)
- 图像脱敏:
- 去除图像附带信息
- 本地部署模型( )
思路:
-
vlm决定分类:自己创建最终文件夹,然后让模型决定这个应该分类到哪里
- 缺点:类别描述不清晰容易导致模型分类错
-
小型多层分类器:自行编写分类json,模型主要用于捕捉特征,根据特征决定放入的类别
- 缺点:多次模型调用,对钱包不友好
-
特征完全提取:提示词工程提取所有特征,用模糊匹配或者其他大模型决定分类。