古力努尔· 艾尔肯1,索帅红1∗ ,哈妮克孜· 伊拉洪2
(1. 新疆财经大学 公共管理学院,新疆 乌鲁木齐 830012;
2. 新疆大学 计算机科学与技术学院,新疆 乌鲁木齐 830046)
关键词:语音情感分析;CASIA数据集;梅尔频率倒谱系数特征提取;音频特征;系统设计
doi:10.20149/j.cnki.issn1008-1739.2026.01.
001
引用格式:古力努尔·艾尔肯,索帅红,哈妮克孜·伊拉洪.基于Python的语音情感分析系统设计与实现[J]. 计算机与网络,2026,52(1):1-7.
语音情感分析作为人机交互核心技术,在智能服务、医疗监测等领域需求迫切。在当前中文语音情感分析研究中,模型对声学特征的挖掘深度不足、分类稳定性与泛化能力有待提升,一定程度上影响技术落地效果。针对上述挑战,利用Python构建了面向中文场景的语音情感分析系统。以CASIA中文语音数据集为基础,采用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)提取声学特征,传统机器学习支持向量机(Support Vector Machine,SVM)作为核心分类器,并引入随机森林算法作为对比验证。通过构建多决策树集成学习机制,降低模型方差,提升分类稳定性与泛化能力。基于卷积神经网络(Convolutional Neural Network,CNN)的特征提取框架,结合长短时记忆网络(Long Short-Term Memory,LSTM)的门控机制,捕捉语音序列的长时依赖关系,有效规避传统循环神经网络(Recurrent Neural Network,RNN)的梯度消失问题。通过设计CNN-LSTM混合模型,实现语音情感特征的层次化、深度挖掘与精准分类,涵盖语音信号预处理、特征提取、情感分类等核心环节的语音情感分析系统。
声 明
欢迎转载、转发本号原创内容,转载信息请与本号联系授权,标注原作者、信息来源为《计算机与网络》。本号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。如涉及作品内容、版权和其他问题,请在20日内与本号联系,我们将在第一时间处理。《计算机与网络》拥有最终解释权。
联 系 我 们
投稿:jsjywlqk@cetc.com.cn
联系电话:0311-86924962
通信地址:河北省石家庄市中山西路589号
邮编:050081