第424章 幻当程序员小白用自然语言编程时会怎样? (1 / 3) 首页

字体:      护眼 关灯

上一章 目录 下一章

第424章 幻当程序员小白用自然语言编程时会怎样? (1 / 3)
        =数据卡尺=

        如何用统计学的知识,来应用在数据上呢?

        -第一步-

        要弄明白统计学和数据之间的共性和非共性。

        统计学:每一个数据无论其数值是多少,其本身就作为一个数值独占的存在体,然而统计学本身就有意和无意的忽略了各个数值的先后排列。

        数据:每一个数据无论其数值是多少,其本身就作为一个数值独占的存在体,然而数据本身很注重各个数值的先后排列。

        比如:ABRACADABRA

        用统计学来表示,就是A出现了5次,B出现了2次,C出现了1次,D出现了1次,R出现了2次。

        用数据来表示,就是ABRACADABRA。

        那么如何把数据快速的解压缩出来呢?可以使用分段压缩方式,比如把一个大文件,分割成一个个片段,例如:

        ABRACADABRATHEFOXJUMP.张三和李四一起去喝酒。

        那么,就可以根据前面的数据,本身就是采用英文的方式,也就是最多是52进制(区分大小写),而后面的中文可就麻烦了,毕竟中文本身进制相当大,那么就需要进行大进制处理。

        用统计学的方法,就是把数据平均分,然后分割成可以互相对齐的数据个体,然后统计这些数据个体各出现了多少次。

        然后进行统计,把统计数据记录下去。

        也就是说,把大英百科全书的纯文本内容用统计学的方式记录下来,就能对应到大小写英文字母+符号+空格+换行+换页……

        内容未完,下一页继续阅读

更多完整内容阅读登陆

《墨缘文学网,https://wap.mywenxue.org》
加入书签我的书架


上一章 目录 下一章