问题描述
- 利用word2vec进行词向量训练内存溢出问题
-
请问大家一下:
利用word2vec进行词向量进行训练时,所用语料进行分词后,还需要去除标点符号吗?我利用搜狗新闻语料(分词后2.09G)进行词向量训练时,出现Exception in thread "main" java.lang.OutOfMemoryError: Java heap,我设置了jvm heap的大小,还是出现这个错误,该怎么解决呢?谢谢解答!**
解决方案
内存设置还是太小,我使用这个参数 -Xmx6048M 可运行成功。
解决方案二:
利用 word2vec 训练的字向量进行中文分词
时间: 2024-07-28 12:47:44