1、读取音频。
2、提取音频数据d,这个数据是二进制形式,还需要转换为数组形式,e。
3、绘制波形图。
4、处理音频数据:先进性绝对值处理,使得所有数据都是非负数;再区分声音和绝对静音的时间段。
5、绘制此时的波形图,可以看到,杂乱的数据变整齐了,0代表静音,1代表说话。
6、这样,就可以根据静音,把音频分割为时间轴,每段都对应一句话。
1、读取音频。
2、提取音频数据d,这个数据是二进制形式,还需要转换为数组形式,e。
3、绘制波形图。
4、处理音频数据:先进性绝对值处理,使得所有数据都是非负数;再区分声音和绝对静音的时间段。
5、绘制此时的波形图,可以看到,杂乱的数据变整齐了,0代表静音,1代表说话。
6、这样,就可以根据静音,把音频分割为时间轴,每段都对应一句话。