Skip to content

自用工具, 图像预处理, 包括按关键词分组, 按图像相似度自动区分为训练集和测试集

License

Notifications You must be signed in to change notification settings

MAGICSCIENTIST/imgPretreatment

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

imgPretreatment

自用工具, 图像预处理, 包括按关键词分组, 按图像相似度自动区分为训练集和测试集

How to use

install

npm i 

use

let filter = require('../src/index')
let config = {
    output: './splitResults3', //输出到哪里
    entry: 'D:\\BaiduNetdiskDownload\\大桂山', //需要处理的数据在哪里    
    //筛选关键字
    exceptList: [  
        "白鹇", "山斑鸠", "松鼠", "野猪", "黄鼠狼", "黄猄", "猕猴", "小灵猫", "豹猫", "紫啸鸫", "果子狸"
    ],
    checkSimlier: true, //是否区分训练和测试
    maxSimilarCount: 2 //相似图片取多少当训练,  取一半, 但不超过这个数字
}

var _f = new filter(config)

// 从头开始初始化
// _f.start().then(x => {
//     console.log(`一共搞定了 ${x.length} 个文件`)
// })

//从分好的地方开始区分训练集和测试集
var pathList = _f.readDir("D:\\work\\daguishan\\daguishan_imgfIlter\\splitResults3", { recursive: true, returnAll: false })
// var pathList = _f.readDir("D:\\work\\daguishan\\daguishan_imgfIlter\\splitResults3\\黄猄", { churecursive: true, returnAll: false })
pathList = pathList.filter(x => {
    return !x.match("测试") && !x.match("训练")
})
_f.splitSimilerData(pathList).then(x=>{    
    console.log(`已处理${x.length}个文件`);    
})

Todo(很有可能鸽的列表)

  • 把之前写的支持正则的代码移过来
  • 控制台支持
  • 进度条显示, 容错处理和测试
  • 做可以像乐高一样拼进流程的图像处理常用逻辑模块, 包括:
  • resie
  • 灰度
  • 二值
  • 根据templateMatch自动截取

About

自用工具, 图像预处理, 包括按关键词分组, 按图像相似度自动区分为训练集和测试集

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published