字体:大 中 小
护眼
关灯
上一章
目录
下一章
第十章:志民 (1 / 3)
旁白:郑志民是周启源隔壁宿舍的基友。跟周启源一样,他的技术亦是炉火纯青。不过,他主攻嵌入式这一块。学院的《电机学》是非常难的一门课,可他去听了几次,觉得自己去教这门课,简直绰绰有余。对于《模电》、《数电》、《电力电子》,更是一次都没去上过。
然而,他与周启源一样,也因为综合测评不够,觉得拿奖学金无望,就“堕落”成为了补考边缘的人士。而且较之周启源,其成绩之低,可谓岌岌可危,当真是有过之而无不及。
不过,他也和周启源一样,是一个把开源挂在嘴上的人。例如,他把宿舍门锁,改装成了“指纹解锁”。难能可贵的是,他把PCB图、元件参数、以及实物图和视频都上传到哔哩哔哩、我爱电子网等平台上。不仅如此,他笔下的作品还有“手机遥控车”,“自动送水机器人”,“感光自动窗帘”等等,大部分都开源到网上。
最近,他们的联系更加频繁了。在认识到人工智能,结合嵌入式开发的重大前景下,他们两个人,早已是自习室里的常客。有一次,楼管阿姨夜尿,看到两人通宵达旦,还以为闹了鬼,搞出不少笑话。
某一天,郑志民来照例在午睡时间,来找周启源,其他舍友已经见怪不怪。
场景:周启源宿舍,下午2:00不到
郑志民把周启源拉出门外
郑志民:“老周啊,最近有什么项目吗?”
周启源:“有,我参加了泰迪杯,选了一道NLP的题目。里面有一道文本分类,你应该会感兴趣。”
(注:NLP即自然语言处理。对于中文,又叫汉语言处理。主要包括:文本分类、文本聚类、自动摘要、语法分析、关键词提取技术等。)
郑志民:“说来听听?”
周启源:“文本分类嘛,就是输入文本,然后电脑自动分类。”
郑志民:“这好像要用到,动辄一个G大小的,什么.....Word2vec,还有神经网络之类的啊。单片机可放不下这种东西。”
周启源:“不对不对,你们错了。神经网络在计算机视觉领域效果是很好,但在NLP领域,效果其实不是很好。”
“我有一个新的解决办法,就是简单粗暴地用二元语法,把连续两个汉字,作为一个特征。然后用词袋模型,加上卡方检验,过滤掉一些特征,再用普通的机器学习模型,效果居然出乎意料的好!你知道吗?模型在测试集上的F1值接近0.9了!”
内容未完,下一页继续阅读
更多完整内容阅读登陆
《墨缘文学网,https://wap.mywenxue.org》
上一章
目录
下一章