文本分类问题怎么做data augmentation?

  统计/机器学习 自然语言处理 数据预处理 开放问题    浏览次数:511        分享
0

图像分类问题经常会用data augmentation,那文本分类问题怎么做data augmentation?有类似的方法吗?

 

niiii   2020-06-07 23:03



   1个回答 
1

文本分类有很多数据增强的方法:

比如随机打乱、随机删除、随机插入、回译等等

SofaSofa数据科学社区DS面试题库 DS面经

lee   2020-10-22 09:22



  相关主题

如果不去除stop words,word2vec的结果会受到影响吗?   1回答

数据批量分析提取,求指点迷津   4回答

请问NLP中这种编码方式有没有什么术语?   1回答

怎么理解nlp里的good-turing smooth?   1回答

word2vec怎么处理一词多义的情况?   3回答

怎么识别“的”“地”“得”是否用错?   1回答

自然语言处理中的分词是什么意思?   1回答

NLP里的OOV是什么意思?   2回答

求python里得到n-grams的包?   2回答

自定义CountVectorizera中默认的英语stop_words   1回答

如何对中文部分进行独热处理(one-hot)   1回答

python去掉中文文本中所有的标点符号   3回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!