第十六章:网友 (3 / 4) 首页

字体:      护眼 关灯

上一章 目录 下一章

第十六章:网友 (3 / 4)
        落幕

        第二幕

        旁白:秉持着开源的原则,在参加完泰迪杯之后,周启源就将其论文上传到了开源论坛上,反响不小。这天,就有一个取名为“haonanqumingzi”的网友,前来询问。

        场景:论坛私信(haonanqumingzi&周启源)

        haonanqumingzi:“您好,我想请问一下类似今年泰迪杯C题这类文本处理的数据挖掘题,使用什么软件会比较合适呢?类似的参考文献查找有什么比较推荐的渠道吗?”

        周启源:“文本挖掘呀,当然用Python语言比较好。你可以用Python的HanLP模块(最新的,国人开发的,推荐)。如果是英文的NLP(自然语言处理),可以用Python的NLTK”

        [提示消息:对方尚未回复你,你只能发送3条消息](注:开源论坛的限制)

        周启源:“参考文献的话,在汉语言处理这一块,建议何晗的《自然语言处理入门》这本书”

        “参考文献的渠道:百度学术、googleschor、bing,都是比较好的论文搜索引擎”

        haonanqumingzi:“谢谢你!”

        周启源::“自然语言处理是比较难的,一般用Matb做不出来。所以如果是要做NLP之类的项目,特别是汉语言,建议用HanLP。”

        “如果是工程开发的话,可以用Java的HanLP。不过科学工作的话,及其建议用Python”

        haonanqumingzi:“因为我Python基础比较薄弱,算是小白,想问一下有什么能够比较快速掌握文本数据挖掘方法吗?因为现在要处理数据所以其实挺急的”

        内容未完,下一页继续阅读

更多完整内容阅读登陆

《墨缘文学网,https://wap.mywenxue.org》
加入书签我的书架


上一章 目录 下一章