返回顶部

请问不加TimeDistributed的Attention,每个句子都有一套LSTM和Att的参数么,比如[batch_size,seq_len,embedding=50],比如:这辆车50万 吴亦凡被逮捕 这两句话LSTM参数是不同的吗

3

0/300

评论 1

初生

如果不用这个的话,就是一对一,如果用了,就是多对一,不管输入啥,输出都是一样的。你理解的对着呢,如果不加TimeDistributed,每个句子一套参数,加了的话就是不管几个句子,就共享一套参数

2021-08-20 18:37:25

- 没有更多了 -