Skip to content

Coffeeps/BigDataAnalysis

Repository files navigation

BigDataAnalysis

contributor: datamonday

github repo: https://github.com/datamonday/BigDataAnalysis

csdn: datamonday

公众号:datazero

qrcode


1. Data Analysis and Pre-processing

数据分析和数据预处理相关。

1.1 Visualization

可视化工具的用法,包括:

  • Matplotlib
  • Seaborn
  • Plotly

2. Association Data Mining

关联数据挖掘算法的Pipeline。


3. Classification and Regression

常用的分类和回归算法Pipeline。


4. Clustering

常用的聚类算法总结及代码实现。

4.1 Distance Metrics

  • 12种常用的距离度量原理及代码实现

4.2 K-Means


5. Anomaly Detection

异常检测算法实现。

5.1 One-Class SVM

5.2 Isolation Forest

5.3 Histogram

5.4 Kernel Density


6. Dimention Reduction

降维与度量学习。


Competition Kernel

包含一些Kaggle、天池的比赛Kernel,主要涉及预测、聚类和异常检测。

About

数据挖掘、大数据分析及可视化

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors