您好,欢迎来到二三四教育网。
搜索
您的当前位置:首页基于马尔科夫的二元语言模型

基于马尔科夫的二元语言模型

来源:二三四教育网

马尔科夫假设

随意一个词出现的概率只与它前面出现的有限的一个或者几个词有关。

一元语言模型

如果一个词的出现与它周围的词是独立的,那么我们就称之为unigram也就是一元语言模型:

p(s)=p(w_1)p(w_1)p(w_1)\dotsp(w_n)

这个式子成立的条件是有一个假设,就是条件无关假设,我们认为每个词都是条件无关的。

二元语言模型

p(s)=p(w_1)p(w_2|w_1)p(w_3|w_2)\dotsp(w_{i-1}|w_n)

为了计算这个概率可以先进行计数:

c(w_{i-1},w_i) 表示 w_{i-1}和w_i同时出现的次数\
c(w_{i-1}) 表示出现 w_{i-1}的次数\
p(w_{i-1}|w_i)=\frac{c(w_{i-1},w_i)}{c(w_{i-1})}

由此可以求出s的概率了。

Copyright © 2019- how234.cn 版权所有 赣ICP备2023008801号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务