中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
鲲鹏小智

使用步骤

  1. 使用smartctl指令每天采集硬盘(包括正常盘与故障盘)SMART数据,并标记是否故障,并整理成指定格式的待训练数据文件fault_train.csv(详细可参见数据采集方法输入文件格式)。fault_train.csv由fault列标记了是否故障盘。
  2. 导入BoostKit_KSML相关函数。
    from BoostKit_KSML.ssd_fault_detect import fault_train
    from BoostKit_KSML.ssd_fault_detect import fault_update
    from BoostKit_KSML.ssd_fault_detect import fault_predict
  3. 调用fault_train接口,输入步骤1得出的待训练数据文件,得到一个二进制训练模型model.pkl。
    fault_train(r'fault_train.csv', r'model.pkl')
  4. 可选:(可选)使用smartctl指令每天采集硬盘(包括正常盘与故障盘)SMART数据,并标记上是否故障,并整理成指定格式的待增量训练数据文件fault_update.csv(详细可参见数据采集方法输入文件格式),fault_update.csv由fault列标记了是否故障盘。
  5. 调用fault_update接口,输入待增量训练数据文件fault_update.csv,增量训练已有的模型数据model.pkl(可选),生成一个更新后的模型new_model.pkl。
    fault_update(r'fault_update.csv', r'model.pkl', r'new_model.pkl')
  6. 使用smartctl指令每天采集待预测硬盘SMART数据,并整理成指定格式的待预测数据文件fault_predict.csv(详细可参见数据采集方法输入文件格式),进行预测。fault_predict.csv为待预测数据集,未进行标注。
  7. 调用fault_predict接口,输入待预测数据文件fault_predict.csv与已有的模型数据model.pkl。
    fault_predict(r'fault_test.data', r'model.pkl')

接口日志将会通过子logger输出到log_file参数指定的文件中去(参数信息详见参数包)。但是logging模块直接配置并修改RootLogger,会导致所有子logger的日志输出全部向上传播到RootLogger并输出。