```
v0.3.3
1.修复了varGroupReport中report_iv与report_ks在输入数据重复时产生的bug
2.修复了EDAreport在某类报告为None时产生的写出bug
3.在varSingleReport、varReport、varGroupReport中加入正则化设定参数regularization
4.在诸多涉及提升模型与贝叶斯优化的模块中加入了并行控制参数n_jobs以便合理使用CPU资源
5.更新单元测试脚本,更新部分代码说明
6.更新example
```

```
v0.3.2
1.binSelector加入分类变量levels的检查，过高的levels可不进行分箱
2.修复了binFreq中字符列处理的bug
3.修复了shapCheck的bug并增加woe编码数据原始参数
4.更新单元测试脚本,更新部分代码说明
5.更新example
```

```
v0.3.1
1.加入L1正则logit回归
2.在特征报告模块中加入了lift指标的特定报告
3.补充了部分文档与单元测试脚本
4.更新单元测试脚本,更新部分代码说明
5.更新example
```


```
v0.3.0
1.在特征报告模块中加入了lift指标
2.调整了特征报告模块中的规则，若speical或missing频数为0时，其woe将被调整为0
3.修复了woeTransform中特殊值woe调整的bug
4.在多个类中移除了对Sklearn的基类BaseEstimator的继承以防止bug
5.补充了部分文档与单元测试脚本
6.更新单元测试脚本,更新部分代码说明
7.更新example
```

```
v0.2.9
1.加入数据离散化函数binTransformer
2.在分箱算法\报告的诸多模块中加入对breaks_list的浮点数分箱点的长度限制(小数点后三位)以防止个别错误(临界点)的分箱结果
3.修复了stepLogit中无法使用样本权重的bug
4.补充了部分文档与单元测试脚本
5.更新单元测试脚本,更新部分代码说明
6.更新example
```


```
v0.2.8
1.stepLogit中加入向前逐步法、向后逐步法
2.修改了stepLogit的部分入参名与含义
3.修复了stepLogit在变量过少情况下无法进行逐步法的bug
4.修复了prefitModel中部分列全部缺失后可能产生的bug
5.修复了perfEval中加入样本权重后产生的索引报错的bug
6.补充了部分文档与单元测试脚本
7.更新example
```

```
v0.2.7
1.重新修复了binAdjust中数值分箱输入乱序情况下报错的问题
2.为避免因浮点数据类型混乱而造成bug,全局加入对数值浮点数据dtype类型的校验,要求所有输入数据的浮点类型必须为float64
3.移除了多个模块中的浮点型数类型控制参数
4.修复了base中参数校验与变量值校验的部分bug
5.int及bool类型数据在dtypeAllocator中将被转换为float64类型,dtypeAllocator的参数dtype_dict中移除了键'int'
6.更新单元测试脚本,更新部分代码说明
7.更新example
```

```
v0.2.6
1.更新单元测试脚本，加入了代码覆盖率
2.现在preSelector中若存在任何步骤筛选掉所有特征，将停止下一步筛选并输出结果
3.移除preSelector中特征筛选方法Permutation Importance和Leave One Feature Out Importance
4.修复EDAReport的bug,删除了参数category_col与numeric_col参数，加入参数missing_values
4.修复了nanTransformer中indicator为True时产生的缺失值指代列列名重复的bug
5.修复了preSelector,dtypeAllocator中object类型问题，生成方式由astype('object')变为astype('str')
6.修复了LgbmPISelector中选择贝叶斯优化且样本权重为None时会报错的bug
7.在varGroupsReport中加入因rowlimit设定过高而导致无法产生报告的错误提示
```

```
v0.2.5
1.加入了新的单元测试脚本，移除旧test脚本
2.修复faSelector的bug，在计算距离矩阵前将移除constant特征
3.优化代码，在部分模块中加入对Series的name检查
4.修复preSelector在windows平台下的乱码错误
5.修复perfeval在plotnine 0.9.0下图例显示问题
```

```
v0.2.4
1.新增了二分类决策模型评估函数perfEval2
2.stepLogit中加入标准化回归系数属性
3.修复了binAdjust绘图数据显示的bug
4.修复了varGroupsReport绘图数据显示的bug
5.修复了EDAReport中分类特征频数统计中的缺失值问题
6.修复了binAdjust中数值分箱输入乱序情况下报错的问题
7.修复了stepLogit中单变量模型的vif报错问题
8.补充了部分函数的文档
```

```
v0.2.3
1.新增审批决策报表函数GainsTable
2.优化了shapCheck代码
3.修复了LgbmShapRFECV中可能导致分类特征dtype变为category的bug
4.相关文档维护
```

```
v0.2.2
1.新增特征筛选方法LgbmShapRFESelector和LgbmPISelector
2.优化了preSelector代码
3.移除特征筛选方法_fliterByShuffle,LgbmRFESelector
4.移除BayesianXGBTuner,BayesianLGBMTuner,BayesianCBTuner
5.修复了网格参数优化、减半参数优化、贝叶斯优化中early_stopping的bug
6.相关文档维护
```

```
v0.2.1
1.在网格参数优化、减半参数优化、贝叶斯优化中加入对Catboost的支持
2.在网格参数优化、减半参数优化、贝叶斯优化中加入early_stopping参数
3.优化贝叶斯优化代码使之能够支持设定随机数实现模型复现
4.优化贝叶斯优化代码使之能够支持更多参数选择，并加入固定参数
5.LgbmRFESelector更名为LgbmRFECVSelector
6.dtypeAllocator中的number类型以float和int进行了进一步的区分
7.修复了outliersTransformer中的后非number类型列的丢失问题
8.修复了减半参数优化中模型无法通过随机数复现的bug
9.相关文档维护
```

```
v0.2.0
1.加入特征筛选方法LgbmRFESelector和LgbmSeqSelector
2.删除了corrSelector
3.优化代码
4.文档维护
```

```
v0.1.9.1
1.更新了demo:4.经典Logistic评分卡.ipynb
2.修复了诸多bug
3.文档维护
```

```
v0.1.9
1.加入perfEval模块，支持二分类排序模型评估常见的评估图ks、roc、gini、gain、lorenz、f1、pr、density
2.优化了部分模块
3.修复bug
4.文档维护
```

```
v0.1.8
1.加入binAdjuster模块，支持单特征、组特征的交互式分箱
2.优化了woe_plot的制图
3.修复了诸多bug
4.文档维护
```

```
v0.1.7
1.修复了float低精度类型的分箱导致少数结果不准确的问题
2.加入woe_plot模块,支持单特征、组特征的特征分析报告的绘图
3.修复varGroupReport中的bug
4.文档维护
```

```
v0.1.6
1.重构代码结构
2.在preSelector中加入新的特征筛选方法filterByShuffle
3.修复bug
4.文档维护
```


```
+ 涵盖数据清洗、数据探索、特征工程、评分卡制作、模型评估、统计学逐步回归、机器学习模型及其参数优化等内容
+ 在准确性和运行效率的前提下集成了诸多流行的三方库，包括sklearn,xgboost,lightgbm,statsmodels等
+ 本模块的评分卡开发部分参考了R::scorecard(https://github.com/ShichenXie/scorecard)
    - 功能上几乎与其一致并增加了更多的拓展，例如单调最优分箱算法
    - 支持sklearn、statsmodel的logit回归模型的评分卡制作
    - 在分箱算法、报告制作、评分转换上的本模组运行效率更优  
+ 部分功能都基于sklearn.base的TransformerMixin与BaseEstimator进行构建，可支持pipeline
+ 模块中对列的数据处理进行了并行优化
+ 工具包总体上还在早期开发中

功能介绍:

+ 数据清洗与数据预处理

    - BDMLtools.dtStandardization:数据规范化，解决实体重复,索引等问题
    - BDMLtools.dtypeAllocator:特征类型分配，将原始数据中的列类型转换为适合进行分析与建模的数据类型
    - BDMLtools.nanTransformer:缺失值处理，缺失值填补
    - BDMLtools.outliersTransformer:异常值处理
    - BDMLtools.prefitModel:预拟合数据，在不进行任何特征工程的前提下使用全量特征预拟合数据以预估模型表现

+ 特征工程/评分卡

    - BDMLtools.preSelector:特征预筛，按照缺失值、唯一值、方差、卡方值、f值、树模型、iv等进行特征预筛
    - BDMLtools.faSelector:变量聚类筛选器
    - BDMLtools.woeTransformer:WOE编码，对原始数据进行woe编码
    - BDMLtools.binSelector:分箱筛选器，提供等频、决策树、卡方、单调等分箱算法并依据分箱结果进行特征筛选
    - BDMLtools.binAdjuster:分箱调整器,支持单特征、组特征的交互式分箱及分箱调整
    - BDMLtools.stepLogit:统计逐步回归筛选器，提供基于aic/bic与statsmodel的logit-reg的逐步法进行筛选特征与模型构建
    - BDMLtools.LassoLogit:Lasso-logit回归,加入L1正则、使用交叉验证、无统计检验的logit回归
    - BDMLtools.cardScorer:制作评分卡
    - BDMLtools.LgbmSeqSelector:Lgbm逐步式特征选择筛选器
    - BDMLtools.LgbmShapRFECVSelector:Lgbm递归式特征消除筛选器
    - BDMLtools.LgbmPISelector:Lgbm组合重要性除筛选器
    
+ 报告

    - BDMLtools.EDAReport:数据质量报告
    - BDMLtools.varReportSinge:单特征分析报告 
    - BDMLtools.varReport:特征分析报告
    - BDMLtools.varGroupsReport:分群特征分析报告


+ 机器学习-分类算法

    - BDMLtools.gridTuner:网格优化与随机优化的xgb、lgbm、catboost
    - BDMLtools.BayesianCVTuner:贝叶斯优化的xgb、lgbm、catboost
    - BDMLtools.hgridTuner:scucessive halving优化的xgb、lgbm、catboost

+ 机器学习-异常发现算法
    - 待补充
    
    
+ 模型评估 
    - BDMLtools.perfEval:二分类排序模型评估，包含绘制图ks、roc、gini、gain、lorenz、f1、pr、density的功能
    - BDMLtools.perfEval2:二分类决策模型评估，包含绘制混淆矩阵与计算相应指标的功能
```

