返回顶部

我想问下,为什么bert的最大处理长度是512呢

8

0/300

评论 1

Andre老师@小象学院

这个就是定好的,原生bert限制了只能输入512个,实际上是510个,因为还会加一个cls与sep,后面有些改进版本就没有限制了,我感觉可能是因为这个长度效果会好些。还有一个可能就是长度再大,硬件条件要求也会更高,训练难度可能就更高了

2021-08-27 18:47:15

- 没有更多了 -