字体:大 中 小
护眼
关灯
上一章
目录
下一章
第十七章:携手 (6 / 7)
兔子啦:“哦,那这个项目是根据用户的信息,然后计算其信用度,并根据信用度,考虑是否给他贷款。这个,应该是宁可把信用高的归错,也不能误给信用低的贷款咯”
周启源:“是的,所以你应该用召回率(查全率),recall,作为筛选模型的指标”
兔子啦:“(⊙o⊙)…,我灵魂都碎一地了”
周启源:“我觉得,不要认为某人是博士后,就一定要向他看齐。因为AI是新兴技术,他们有些故步自封,早已被淘汰。人们碍于其威望,不愿告诉他这个事实罢了。当然,我们心照不宣,不说也行”
兔子啦:“嗯嗯”
周启源:“人们总是看重资历,因为老酒醇,老姜辣。但是,他们在看重资历的时候,总无法想起岁月是一把杀猪刀。老人们比年轻人积累得多,但他们未必不会忘得比较多。老人们虽然学的东西多,但未必接受新事物的能力强于年轻人。老人们比年轻人多出一些东西,但同时年轻人也比老人多另一些东西。但事实往往是人们忽略了年轻人的东西,而看重老年人的东西。”
“特别是在AI这个领域,我认为年轻人的多出的东西,远远比老年人多出的东西,价值要大。可是,陈腐的观念,永远是带着放大镜,放大年轻人的缺点,老年人的优点。我真心希望,你不要戴着这种有色眼镜看待别人,看待自己。”
兔子啦:“听君一席话,胜读十年书[抱拳]”
周启源:“好啦,你试试用分类问题能不能解决呗”
兔子啦:“看了一下数据分布,感觉低分群体的样本量太少了,用过采样行吗?”
(注:低分群体少,意味着类别不均衡。类别不均衡,就可能导致模型效果差。比如一个样本中,类别一和类别二的样本量比值为99:1,那么一个只会点头的模型,就有可能达到99%的准确率。这里的过采样,就是要将类别二的样本数量增多,解决类别不均衡问题。)
周启源:“我的建议,先欠采样删样本容量多的,再过采样,加少的。类别不均衡问题的话,可以用一个叫imblearn的模块,里面有现成的代码”
“不过,欠采样、过采样也要好多方法的额。。你有得学了”
兔子啦:“[哭]他们什么破服务器哟,不让联外网,pipinstall用不起”
内容未完,下一页继续阅读
更多完整内容阅读登陆
《墨缘文学网,https://wap.mywenxue.org》
上一章
目录
下一章