基于局部特征优化的语音情感识别 | |
其他题名 | Sample optimization based on local features in speech emotion recognition |
隋小芸1,2; 朱廷劭1; 汪静莹1,2 | |
第一作者 | 隋小芸 |
通讯作者邮箱 | tszhu@psych.ac.cn |
心理所单位排序 | 1 |
摘要 | 情感识别在人机交互领域具有广阔前景。由于情感表达在时间上具有一定的持续性,统计特征更能体现不同情绪语音的差异和动态变化,大多数语音情感识别研究都使用全局特征( 如最大值、最小值等) ,并没有充分挖掘局部特征( 如单帧的短时能量、过零率等) 中的信息。提出一种基于局部特征优化的方法,对每个情感语音样本做进一步提纯,通过聚类分析对情感特征相对不显著的帧进行过滤,在此基础上进行统计计算和分类,以提高预测的准确率。实验结果表明,基于优化后的样本进行情感分类,3 个语料库的平均准确率提高5% ~ 17%。进一步的研究发现这种优化方法可能更适合于语音长度较长的情感识别场景。 |
其他摘要 | Emotion recognition is one of the most prospective technics in human-machine interaction process. Most researches prefer statistical functional features because these features are more consistent with the speech variation as emotion changes. However,local features,i. e. ,short-term or temporal features extracted from single frame also contain useful information. In this work,a new approach is proposed to optimize samples via local features. To achieve this,a K-means cluster is employed to cluster each sample with 2 groups: frames with obvious emotion and frames with emotion which is not that obvious. It is hypothesized that the cluster with more frames should be emotionally obvious. It is observed in the results that the classification performs better on optimized samples than on original ones. The method was tested on 3 corpora and the classification accuracy increases by 5%-17%. It is also found the improvement increases as speech length grows,which implies the optimization approach may be more applicable to the longer speech recognition. |
关键词 | 语音情感识别 局部特征 全局特征 聚类分析 数据优化 |
2017 | |
语种 | 中文 |
DOI | 10. 7523 /j. issn. 2095-6134. 2017. 04. 004 |
发表期刊 | 中国科学院大学学报 |
ISSN | 2095-6134 |
卷号 | 34期号:4页码:431-438 |
URL | 查看原文 |
收录类别 | CSCD |
CSCD记录号 | CSCD:6028216 |
资助机构 | 国家重点基础研究发展( 973) 计划( 2014CB744600) 资助 |
引用统计 | |
文献类型 | 期刊论文 |
条目标识符 | http://ir.psych.ac.cn/handle/311026/21769 |
专题 | 社会与工程心理学研究室 |
通讯作者 | 朱廷劭 |
作者单位 | 1.中国科学院心理研究所 2.中国科学院大学心理学系 |
第一作者单位 | 中国科学院心理研究所 |
通讯作者单位 | 中国科学院心理研究所 |
推荐引用方式 GB/T 7714 | 隋小芸,朱廷劭,汪静莹. 基于局部特征优化的语音情感识别[J]. 中国科学院大学学报,2017,34(4):431-438. |
APA | 隋小芸,朱廷劭,&汪静莹.(2017).基于局部特征优化的语音情感识别.中国科学院大学学报,34(4),431-438. |
MLA | 隋小芸,et al."基于局部特征优化的语音情感识别".中国科学院大学学报 34.4(2017):431-438. |
条目包含的文件 | ||||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
基于局部特征优化的语音情感识别_隋小芸.(409KB) | 期刊论文 | 出版稿 | 限制开放 | CC BY-NC-SA | 请求全文 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[隋小芸]的文章 |
[朱廷劭]的文章 |
[汪静莹]的文章 |
百度学术 |
百度学术中相似的文章 |
[隋小芸]的文章 |
[朱廷劭]的文章 |
[汪静莹]的文章 |
必应学术 |
必应学术中相似的文章 |
[隋小芸]的文章 |
[朱廷劭]的文章 |
[汪静莹]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论