字体:大 中 小
护眼
关灯
上一章
目录
下一章
第十六章:网友 (1 / 4)
旁白:周启源的QQ是默认头像——企鹅。为此,他给人的印象总是停留在八十年代。虽然他明确标明了是99年出身,但许多人依旧不相信他是个刚满20岁的大男孩,至少在技术上是如此。QQ也是周启源的一个开源“基地”,他经常混迹在一个叫“AI机器学习”的群上。某一天,他发现有为网友“兔子啦”问了一个技术问题。
场景:QQ群(群名:AI机器学习)
兔子啦:“能不能请教下随机森林过拟合一般怎么处理,训练集R方0.8,测试集R方为负值。”
余军(网名):“减少叶子数,迭代次数,树个数等”
(注:随机森林是多个决策树模型集成在一起的,决策树也是一种,能够根据输入,预测输出的机器学习模型。余军网友,说的是解决决策树,过拟合的方法。)
[第二天]
周启源(网名:显然):“嗯,其实集成模型的过拟合,应该可以从集成模型、基模型的正则化来解决,比如集成模型的话,可以用Dropout正则化;基模型的话,就用决策树的剪枝处理呗,随机森林说到底是一种Bagging集成吧”
兔子啦:“设置了树最大深度,特征随机比例是0.8,树的个数增加到500个,但是对于未来的数据还是没有预测能力。数据取了7到11月的数据,11月的数据做了检测集”
周启源:“是不是是数据的问题了?你的数据是否是时序的呢?”
兔子啦:“嗯”
周启源:“随机森林是静态模型啊,用于时序数据,会很糟糕的”
兔子啦:“那有什么办法呢?”
周启源:“你考虑一些时序模型吧。比如:隐马尔可夫模型、条件随机场,或者LSTM神经网络”
内容未完,下一页继续阅读
更多完整内容阅读登陆
《墨缘文学网,https://wap.mywenxue.org》
上一章
目录
下一章