字体:大 中 小
护眼
关灯
上一章
目录
下一章
第一百零六章 闷头大干,百歌搜索上线 (3 / 5)
搜索引擎主要分为几大块,爬取,索引,收录。
爬取,顾名思义就是乱来爬。把网络上浅层的和深层的内容通过特定的爬虫算法给抓取下来了。
俗话说的好嘛,只要爬虫学得好,刑罚判得早。
所以爬虫可以爬,但是不能乱来爬。
索引,搜索引擎之所以可以搜的那么快,都是索引的功劳。索引是一种专门针对搜索优化的结构。而怎么索引、怎么索引的好、怎么索引的快,这又是一个复杂的问题了。
在数据结构里面,有大量的关于索引查找的方法以及探讨,可见快、准、狠的索引,是一个研究的大难题。
收录嘛,也叫搜索。搜索是将根据查询词,搜索索引内匹配的内容,然后展示出来。符合查询词的结果多了的时候怎么办呢,这就涉及到排序的问题,排序也是个天大的难题,在数据结构里面有专门的探讨排序的章节。
如何排序、如何合理的排序、如何排序的好、如何排序的快,这也是一个大大滴难题。
所以林森在开始敲代码的时候,脑颅之中也在不断的闪过各种需要构建和搭建的问题。
最大的两个问题就是索引和排序的问题。
索引的问题比较好解决,因为林森的脑里有超过这个时代的编程知识也原理,随便找一个出来都可以吊打当代。
而且……
在这个网速普遍较低的状况下,索引的效率快和慢,也没有差多少。
所以林森随便搞了个索引算是完事了。
内容未完,下一页继续阅读
更多完整内容阅读登陆
《墨缘文学网,https://wap.mywenxue.org》
上一章
目录
下一章