128 发现与被发现 (1 / 6) 首页

字体:      护眼 关灯

上一章 目录 下一章

128 发现与被发现 (1 / 6)
        孟云来到此前在沃伦族新兵营缴获的那个联络阵器的架子前,将这些联络阵器中的兑换通通导入电脑。

        厽厼。这些对话以通用语为主,但也偶尔有沃伦语。

        加上此前的格波特的笔记本,以及格波特的联络阵器,孟云获得了大量沃伦语语料。

        有了语料之后,接下来便是要确定模型,自然语言处理问题,使用马尔可夫模型最为合适。

        “碧微同学!”

        “我在!”

        “帮我使用这些语料,通过马尔可夫模型进行机器学习!”

        “好!”

        说起来好像很困难,实际上并不复杂。

        一般情况下,在语料相似的情况下同样的词出现的频率应该是相似的。并且一个词的与其后所跟随的词,在词性上也有一定的规律。

        所谓自然语言处理,很大程度上就是揭示这种规律,本质上就是用机器处理复杂的概率学问题。

        孟云在这里一共有三份语料,沃伦语的聊天记录、通用语的聊天记录还有就是沃伦族的笔记信息。

        同时,他本身就是AI工程师,同样保存了一些中英文的公开语料库。

        碧微同学通过对比这些数据中,每个词的出现频率以及每个词所跟随的前后词,很快就得出了一些词意的猜测,并且标明了这种意思的概率。

        通过这个,还是能大致判断每个句子究竟是什么意思的。

        内容未完,下一页继续阅读

更多完整内容阅读登陆

《墨缘文学网,https://wap.mywenxue.org》
加入书签我的书架


上一章 目录 下一章