推荐习题

RNN是一种什么样的神经网络

介绍一下LSTM的结构(各种gate等…),为什么LSTM能缓解BPTT中的gradient vanish

word2vec是否与autoEncoder有关系

混淆矩阵

Fasttext 了解么, 原理是什么, 他和 word2vec 有什么区别?

判断(正确在后面填T,错误填F)(注意:这里并不要求对凸集进行严格的数学定义)   对任意x,y>(x-2)^2定义了一个凸集。______   y=x^2(1+lnx)是凸函数。______

假设一个地区的艾滋病发病率是千分之一。 某种测试手段出现真阳性(确实患有hiv,且检查结果为阳性)概率为100%;出现假阳性(误诊为阳性) 概率为5% 如果目前有一个未知病史的人被测出 HIV 阳性,那么这个人真携带 HIV 的可能性是多少?______

在词性标注问题中,我们观测值为字词,而字词的可能标记范围为隐状态。 具体拿"^start 自行车 没 锁 ^end",为例,对其做词性标注时,观测值是“自行车 没 锁” 其中,单个字词的标注范围在下给出,后面小数为在全体语料库中观测值与其对应标注出现的联合概率: 自行车:         n(名词)   0.0033 没:         d(副词)   0.0474         v(动词)   0.0099 锁:         n         0.0013         v         0.0009 词性转移矩阵如下: n     d     v n 42947 12529 34836 d 307   4042  29677 v 34362 4988  30472 以307为例,指上一状态为副词而下一状态为名词的子序列在语料库中的出现次数。 在语料库中,词频如下: n:237124 d:47714 v:184620 试计算得到最可能的标记序列__________________(请依次在每个空中填入n,d,v中的一个,对应于你的序列计算结果)。注意,你只需要使用题目中给出的数据计算。