显示特征重要性

1
2
3
4
5
6
import pandas as pd

f_importance = xbg_reg.get_booster().get_score(importance_type='gain')

importance_df = pd.DataFrame.from_dict(data=f_importance, orient='index')
importance_df.plot.bar()

辅助数据文件:组输入 适用于排序任务中的pairwise和listwise;组文件自动加载,若数据文件为train.txt,则组文件为train.txt.group;组文件为单列数字,按顺序指示数据文件中每个组的实例数。

辅助数据文件:样本权重 针对训练数据分配每个实例的权重;权重文件自动加载,若数据文件为train.txt,则权重文件为train.txt.weight;权重文件为单列数字,权重值为[0,1],数字越大则影响越大。 另一种配置权重的方式:在数据文件的标签后加上:<权重>