全部问题问题热门未解答所有标签标签收藏收藏我要提问

文本分类问题怎么做data augmentation？

统计/机器学习自然语言处理数据预处理开放问题浏览次数：2096 分享

二维码

手机扫描二维码

面试中常见简答题？

图像分类问题经常会用data augmentation，那文本分类问题怎么做data augmentation？有类似的方法吗？

niiii 2020-06-07 23:03

1个回答

文本分类有很多数据增强的方法：

比如随机打乱、随机删除、随机插入、回译等等

SofaSofa数据科学社区 DS面试题库 DS面经

lee 2020-10-22 09:22

相关讨论

数据批量分析提取，求指点迷津

NLP里的OOV是什么意思？

怎么理解nlp里的good-turing smooth？

请问NLP中这种编码方式有没有什么术语？

机器学习中文数据的训练集的预处理

怎么识别“的”“地”“得”是否用错？

自然语言处理中的分词是什么意思？

自定义CountVectorizera中默认的英语stop_words

如何对中文部分进行独热处理（one-hot）

python去掉中文文本中所有的标点符号

随便看看

凸优化中局部最优解就是全局最优解吗？

为什么样本方差是除以n-1

huber loss是什么？什么时候用？

numpy里生成单位矩阵？

模型调参时常用到的Grid Search是什么意思？