python使用MFCC特征训练GMMHMM模型

  统计/机器学习 监督式学习 无监督学习 特征选择 Python    浏览次数:2541        分享
0

如题,我现在有很多段音频,每个音频的每一帧单独标记了它是伴奏还是浊音和清音,我现在知道每一帧音频的MFCC39维特征,三种状态的初始概率,三种状态转移矩阵,我想通过这三个条件来训练GMMHMM模型,我尝试用sklearn.mixture来分别训练三种状态的MFCC序列,得出三个GMM模型,但是效果一直不理想,我不知道我的方法是否错误,希望各位能指导我一下GMM在音频训练时的过程,另外我尝试用hmmlearn来直接建模时不知道如何下手

 

Risklong   2018-04-15 19:06



   2个回答 
0

你的目的是?判断下一帧是三种类型的哪一种吗?


SofaSofa数据科学社区DS面试题库 DS面经

sasa   2018-04-16 02:47

是的,给出一段新的音频文件,然后通过这个模型来判断新文件的每一帧属于哪个状态,主要是我不熟悉如何训练,请您指点 - Risklong   2018-04-17 21:32
0

为什么只用初始概率和状态转移矩阵呢?我觉得音频本身的信息更重要啊

把它们的信息结合在一起然后搞个时间序列模型应该是不错的选择


SofaSofa数据科学社区DS面试题库 DS面经

数据痴汉   2018-04-20 23:13

原谅我直言,请去多了解一些语音分离的知识吧,或者看完题再回答 - Risklong   2018-04-24 18:48


  相关主题

关于K均值聚类的权重问题   2回答

分类问题 特征怎么选择   1回答

使用uci的社区犯罪率做回归,怎么选择因变量呢   2回答

在分类问题中,有什么方法可以得到特征的重要性?   2回答

partial dependence是什么意思?   1回答

SHAP可以解释二元分类模型吗?   0回答

一个特征有两个可选的值,只需满足其中一个即可,该如何处理?   1回答

什么情况下需要做特征选择?   1回答

wrapper特征选择法是什么意思?   1回答

对于组合特征怎么理解?   1回答

python中如何产生交互项?   2回答

kNN用来做异常点检测?   3回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!