决策树在 sklearn 中的实现 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
yoggieCDA
V2EX    科技

决策树在 sklearn 中的实现

  •  1
     
  •   yoggieCDA 2019-03-13 11:48:24 +08:00 2700 次点击
    这是一个创建于 2459 天前的主题,其中的信息可能已经有所发展或是发生改变。

    小伙伴们大家好~o( ̄ ̄)ブ,首先声明一下,我的开发环境是Jupyter lab,所用的库和版本大家参考:

    Python 3.7.1 (你的版本至少要 3.4 以上

    Scikit-learn 0.20.0 (你的版本至少要 0.20

    Graphviz 0.8.4 (没有画不出决策树哦,安装代码 conda install python-gaphviz

    Numpy 1.15.3, Pandas 0.23.4, Matplotlib 3.0.1, SciPy 1.1.0

    用 SKlearn 建立一棵决策树

    这里采用的数据集是 SKlearn 中的红酒数据集。

    1 导入需要的算法库和模块
    from sklearn import tree #导入 tree 模块 from sklearn.datasets import load_wine #导入红酒数据集 from sklearn.model_selection import train_test_split #导入训练集和测试集切分包 
    2 探索数据
    wine = load_wine() wine.data wine.data.shape wine.target wine.target.shape 

    运行的结果是这样子的:

    红酒数据集 data

    data 就是该数据集的特征矩阵,从运行结果可以看出,该红酒数据集一共有 178 条记录,13 个特征。

    红酒数据集 target

    特征矩阵中有 178 条记录,相对应的标签 Y 就有 178 个数据。

    如果 wine 是一张表,应该长这样:

    import pandas as pd pd.concat([pd.DataFrame(wine.data),pd.DataFrame(wine.target)],axis=1) 

    DF_wine

    这是数据集特征列名和标签分类

    wine.feature_names wine.target_names 

    wine 列名和标签

    3 分训练集和测试集

    这里选取 30%作为测试集。切分好之后,训练集有 124 条数据,测试集有 54 条数据。

    Xtrain, Xtest, Ytrain, Ytest = train_test_split(wine.data,wine.target,test_size=0.3) Xtrain.shape Xtest.shape 

    wine-train-test

    4 建立模型
    clf = tree.DecisionTreeClassifier(criterion="entropy") #初始化树模型 clf = clf.fit(Xtrain, Ytrain) #实例化训练集 score = clf.score(Xtest, Ytest) #返回预测的准确度 score 

    wine-score

    5 画出一棵树吧
    feature_name = ['酒精','苹果酸','灰','灰的碱性','镁','总酚','类黄酮','非黄烷类酚类','花青素','颜色强度','色调','od280/od315 稀释葡萄酒','脯氨酸'] import graphviz dot_data = tree.export_graphviz(clf ,out_file=None ,feature_names= feature_name ,class_names=["琴酒","雪莉","贝尔摩德"] ,filled=True ,rounded=True ) graph = graphviz.Source(dot_data) graph 

    决策树

    6 探索决策树
    #特征重要性 clf.feature_importances_ [*zip(feature_name,clf.feature_importances_)] 

    探索决策树

    到现在为止,我们已经学会建立一棵完整的决策树了。有兴趣的话,动手建立一棵属于自己的决策树吧~

    目前尚无回复
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2740 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 35ms UTC 11:20 PVG 19:20 LAX 03:20 JFK 06:20
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86