字体:大 中 小
护眼
关灯
上一章
目录
下一章
第279章 未雨绸缪 (2 / 4)
“传媒这块吧,我也没有很好的想法,不太清楚该怎么做。
嗯……其实可以去问问林筱笑的导师,看看能不能从浦外的新闻系那里找人才……之前没想到……”
停下思考了一会儿,陆道升想到了另一个事情。
“对了,说道传媒我想到另外一个事儿,反爬虫。
今后做了内容发布到网上肯定会被搜索引擎爬取嘛,我们需要未雨绸缪,提前进行反爬虫技术的研发。
琦哥,这事儿交给你了。”
话说谷歌在国内已经没有几天好蹦跶了,今后嘉盛在国内面对的搜索引擎除了自家的寻知,就剩下百度,未来可能会有360搜索引擎,如果自己没来得及彻底剿灭周教主的话。
不论是百度搜索引擎还是360搜素引擎,在陆道升看来都不是什么好鸟,提前防范一下很有必要。
要提供搜索引擎服务,需要解决数据的搜集和数据的组织两个大问题。
其中数据的搜集即指的是使用爬虫来对互联网网站内容进行爬取,搜集到自家的后台中。
数据的组织即如何将爬取下的海量数据进行处理,以使得用户能通过搜索快速获得高相关性的结果。
陆道升要提前做好针对准备的就是百度的数据搜集过程,即通过反爬虫机制来限制百度对嘉盛旗下网站的内容爬取。
这并不是对百度的进攻性策略,而是一种自保的防御手段。
前世曾爆出国内某搜索引擎大量采用快照的形式来承接用户的点击跳转,大量屏蔽了用户对原网站的访问的事件。
内容未完,下一页继续阅读
更多完整内容阅读登陆
《墨缘文学网,https://wap.mywenxue.org》
上一章
目录
下一章