/
返回顶部
自然语言处理
416浏览
235内容
慢羊羊啊
2021-08-05 16:47:51
Bert和ALBert v2有什么不同?
展开
1
0
4
2021-08-05 16:47:21
ALBert v2为什么不适用dropout呀?
2021-08-05 16:46:17
如果知道训练数据有错误,可以对你的深度学习代码做什么改变?
2021-08-05 16:45:39
BatchNorm和LayerNorm的区别是什么呀?
3
2021-08-05 16:45:16
在多任务学习中,软、硬参数共享的区别是什么?
2
2021-08-05 16:44:58
AdamW和Adam有什么不同?
2021-08-05 16:44:38
Adam optimizer的局限性是什么?
冒蓝火的加特林
2021-08-05 16:44:06
为什么self-attention这么厉害?
2021-08-05 16:43:34
transformer的时间复杂度是多少?
2021-08-05 16:42:25
LSTM的复杂度是多少?
秋园
2021-08-05 16:41:38
带bias的LSTM模型的参数个数?
2021-08-05 16:41:16
LSTM的hidden和cell存储的信息时什么?
浅梦轻尝
2021-08-05 16:40:53
使用SVD学习潜在特征和使用深度网络获取嵌入向量有什么区别?
秋名山coder
2021-08-05 16:40:30
ReLu存在的问题是什么?
木子QAQRU
2021-08-04 17:27:28
什么perplexity?它在NLP中的地位是什么?
2021-08-04 17:25:40
如何减少训练好的神经网络的推理时间?
2021-08-04 17:25:21
LSTM和Transformer 时间复杂度能说下吗
2021-08-04 17:24:49
word2vec和fastText对比有什么区别
2021-08-04 17:24:28
elmo、GPT、bert三者之间有什么区别?
小小大魔王OP
2021-08-04 17:24:09
会用正则表达式吗?re.match() 和 re.search() 有什么区别?
知识、问题、经验、心得
发动态
图片
0/600