[人工智能] ffmpeg 采集pcm音频数据重采样编码后播放

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> ffmpeg 采集pcm音频数据重采样编码后播放 -> 正文阅读

[人工智能]ffmpeg 采集pcm音频数据重采样编码后播放

本实验需要AAC编码器，需要 libfdk-aac 包

大致数据流程：

PCM数据 --> 
重采样数据输入缓冲区 --> 进行重采样 -->重采样数据输出缓冲区 -->
AVFrame编码器输入数据缓冲区 --->AAC编码器 ----> AVPacket码器输出数据缓冲区 --->AAC数据文件

#include <stdio.h>
#include <string.h>
#include "libavutil/avutil.h"
#include "libavdevice/avdevice.h"
#include "libavformat/avformat.h"
#include "libavcodec/avcodec.h"
#include "libswresample/swresample.h"


/* 将音频帧数据 送给 编码器进行编码 ，将编码后的数据 写到目标文件中
参数1 AVCodecContext *ctx  编码器上下文
参数2 AVFrame *frame 编码前的音频帧数据输入给编码器
参数3 AVPacket *pkt  编码器编码后的音频帧数据
参数4 FILE *output   编码后的音频帧写到目标文件
*/
static void encode(AVCodecContext *ctx,
            AVFrame *frame,
            AVPacket *pkt,
            FILE *output){
				
				
	int ret = 0;
	
	//将数据送给编码器 (将一帧的音频送给编码器处理)
	/*
	参数1：编码器上下文
	参数2：需要编码的音频数据
	*/
	ret = avcodec_send_frame(ctx, frame);
	
	//如果ret>=0说明数据送给编码器成功，此后 我们才能从编码器中去获取编码好的音频帧数据
	while(ret >= 0){
		
		//获取编码后的音频数据,如果成功，需要重复获取，直到失败为止
		/*
		我们向编码器送一帧音频帧数据的时候，编码器不一定就会马上返回一个AVPacket音频帧。
		有可能是我们送了很多帧音频数据后，编码器才会返回一个编码好的AVPacket音频帧。也有
		可能同时返回多个编码好的AVPacket音频帧。
		
		参数1：编码器上下文
		参数2：编码器编码后的音频帧数据
		*/
		ret = avcodec_receive_packet(ctx, pkt);

		/*
		ret > 0  表示本次获取成功，然后继续循环获取，因为有可能后面还有编码好的数据需要获取
		ret == AVERROR(EAGAIN) : 表示当前编码没有任何问题，但是输入的音视频帧不够，所以当前没有packet输出，需要继续送入frame进行编码码
		ret == AVERROR_EOF ：内部缓冲区中数据全部编码完成，不再有编码后的数据包输出。编码到最后了 没有任何数据了
		other ,ret < 0 && ret!= AVERROR(EAGAIN) && ret!=AVERROR_EOF  :编码错误 直接退出
		*/
		if(ret == AVERROR(EAGAIN)){
			printf("data is not enough\n");
			return;
		} 
		if(ret == AVERROR_EOF){
			printf("encoding end\n");
			return;
		}else if( ret < 0){ // 编码错误直接退出
			printf("Error, encoding audio frame\n");
			exit(-1);
		}
		
		//write file 将编码后的音频帧数据 写到 output文件
		fwrite(pkt->data, 1, pkt->size, output);
		fflush(output);
	}

	return;
}

//创建，初始化 上下文
SwrContext* init_swr(){
    
	//创建 重采样 上下文
    SwrContext *swr_ctx = NULL;
    

	/*创建 并 设置 重采样上下文实例(输入，输出格式信息)，返回上下文信息
	
	参数1: 重采样的上下文，可以是已经创建好的上下文，如果之前没有上下文 可以设置为NULL
	参数2: 重采样后输出目标 通道的布局：立体声，如放几个喇叭。 AV_CH_LAYOUT_STEREO(左前方和右前方）
	参数3：输出数据的采样格式
	参数4：采样率 44100
	参数5：输入的 通道的布局：立体声，AV_CH_LAYOUT_STEREO(左前方和右前方)
	参数6：输入的采样格式  32位浮点型
	参数7：输入数据的采样率
	参数8 9 :log 相关，暂时不用
	*/
    swr_ctx = swr_alloc_set_opts(NULL,                //ctx
                                 AV_CH_LAYOUT_STEREO, //输出channel布局
                                 AV_SAMPLE_FMT_S16,   //输出的采样格式 AV_SAMPLE_FMT_S16
                                 48000,               //采样率
                                 AV_CH_LAYOUT_STEREO, //输入channel布局
                                 AV_SAMPLE_FMT_S16,   //输入的采样格式 AV_SAMPLE_FMT_FLT 
                                 48000,               //输入的采样率
                                 0, NULL);
    
    if(!swr_ctx){
        //失败
    }
    
	/*
	创建设置 重采样上下文实例后，初始化 重采样上下文实例
	*/
    if(swr_init(swr_ctx) < 0){
        //失败
    }
    
	//返回 初始化好的 重采样上下文实例
    return swr_ctx;
}

/* 打开编码器
获取编码器，创建编码器上下文，设置编码器上下文，打开编码器
返回编码器上下文
*/
static AVCodecContext* open_coder(){
    
    //打开编码器
	/*
	通过 ID 查找获取编码器
	或者
	通过名字 查找获取编码器
	*/
    //avcodec_find_encoder(AV_CODEC_ID_AAC); 
    AVCodec *codec = avcodec_find_encoder_by_name("libfdk_aac");
	if(codec == NULL){
		printf("codec creat failed\n");
		exit(1);
	}
    
    //创建 编码器codec 上下文
    AVCodecContext *codec_ctx = avcodec_alloc_context3(codec);
    
	/*
	设置编码器上下文
	*/
    codec_ctx->sample_fmt = AV_SAMPLE_FMT_S16;          //输入音频数据的采样大小
    codec_ctx->channel_layout = AV_CH_LAYOUT_STEREO;    //输入音频的通道布局 channel layout:立体声，AV_CH_LAYOUT_STEREO(左前方和右前方)
    codec_ctx->channels = 2;                            //输入音频 channel 个数
    codec_ctx->sample_rate = 44100;                     //输入音频的采样率
	/*
		需要注意的是，只有当 bit_rate属性为0的时候  ffmpeg才会查找 profile属性值，并确认是哪个编码器，并会设置他们各自对应的默认的码率。
	*/
    codec_ctx->bit_rate = 0; //码率大小 AAC_LC: 128K, AAC HE: 64K, AAC HE V2: 32K
    codec_ctx->profile = FF_PROFILE_AAC_HE_V2; //选择 AAC HE V2 编码器
    
    //打开编码器
	/*
	参数1: 编码器上下文
	参数2: 获取的编码器
	参数3：其他选项 暂时不用
	*/
    if(avcodec_open2(codec_ctx, codec, NULL)<0){
        //
        return NULL;
    }
    
    return codec_ctx;
}

void rec_audio() {
    
    int ret = 0;
    char errors[1024] = {0, };
    int count = 0;

    //重采样输入缓冲区 地址 大小
    uint8_t **src_data = NULL;
    int src_linesize = 0;
    
    uint8_t **dst_data = NULL;
    int dst_linesize = 0;
    
    //音频数据上下文
    AVFormatContext *fmt_ctx = NULL;
    AVDictionary *options = NULL;
    
    //pakcet
    AVPacket pkt;
    
    //[[video device]:[audio device]]
    //音频输入设备  我的ubuntu系统下音频设备是  hw:0,0
    char *devicename = "hw:0";
    
    //set log level
    av_log_set_level(AV_LOG_DEBUG);
    
    //register audio device  向ffmpeg注册设备
    avdevice_register_all();
    
    //设置采集方式，对于不同的平台，采集数据的方式不同  linux系统是 
    /*
    返回值：输入格式
    */
    AVInputFormat *iformat = av_find_input_format("alsa");
    
    //打开音频设备
    /*
	参数1 获得 音频数据上下文 AVFormatContext
	参数2 网络地址/本地文件(设备名)
	参数3 输入格式
	参数4 其他参数 这里为NULL
    */
    if((ret = avformat_open_input(&fmt_ctx, devicename, iformat, &options)) < 0 ){
        av_strerror(ret, errors, 1024);
        fprintf(stderr, "Failed to open audio device, [%d]%s\n", ret, errors);
        return;
    }
    
    //创建输出的音频文件  将音频数据写到该文件
    char *out = "/home/mhr/Desktop/video/audio_test/audio.aac";
    FILE *outfile = fopen(out, "wb+");
	
	//打开编码器
	/*
	获取编码器,创建编码器上下文,设置编码器上下文,打开编码器
	返回编码器上下文
	*/
    AVCodecContext *c_ctx = open_coder();
    if(!c_ctx){
		printf("open coder failed\n");
		exit(1);
    }
    
	//创建上下文，并初始化
    SwrContext* swr_ctx = init_swr();
	
	//AAC音频输入数据 空间初始化
	//初始化 AVFrame 结构，它用于存放未编码的音频数据的空间
	AVFrame *frame = av_frame_alloc();
	if(!frame){
        printf("Error, No Memory!\n");
        goto __ERROR;
    }
    
	
	
	//设置 AVFrame 结构 信息
    frame->nb_samples     = 512;                //单通道一个音频帧的采样数
    frame->format         = AV_SAMPLE_FMT_S16;  //采样的大小
    frame->channel_layout = AV_CH_LAYOUT_STEREO; //通道布局 立体声 channel layout
    
	/* 为 AVFrame 结构 分配空间，用于存放未编码的音频数据的空间
	他也是根据 前面三个参数 得知需要的缓冲区大小 = 采样大小*采样频率*通道数
	参数1: AVFrame
	参数2: 对齐方式	
	*/
    av_frame_get_buffer(frame, 0); // 512 * 2 * 2= 2048  所以音频编码之前的数据就是2048
    if(!frame->data[0]){
        printf("Error, Failed to alloc buf in frame!\n");
        //内存泄漏
        goto __ERROR;
    }
	
	
	//AAC音频输出数据 空间初始化
	//分配 编码后数据空间
	AVPacket *newpkt = av_packet_alloc(); 
    if(!newpkt){
        printf("Error, Failed to alloc buf in frame!\n");
        goto __ERROR;
    }
    
	
    //创建重采样数据输入缓冲区
	/*
	参数1：生成的缓冲区
	参数2：生成的缓冲区大小
	参数3：通道数
	参数4：单通道采样个数  : 4096/4=1024/2=512   采集每一帧音频数据的数据量(字节单位)/采集格式32位(4字节)/通道数
	参数5：采样格式  32位浮点型 AV_SAMPLE_FMT_FLT
	参数6：对齐
	*/
    av_samples_alloc_array_and_samples(&src_data,         //输入缓冲区地址
                                       &src_linesize,     //缓冲区的大小
                                       2,                 //通道个数
                                       512,               //单通道采样个数
                                       AV_SAMPLE_FMT_S16, //采样格式 AV_SAMPLE_FMT_FLT AV_SAMPLE_FMT_S32
                                       0);
    
    //创建重采样数据输出缓冲区
    av_samples_alloc_array_and_samples(&dst_data,         //输出缓冲区地址
                                       &dst_linesize,     //缓冲区的大小
                                       2,                 //通道个数
                                       512,               //单通道采样个数
                                       AV_SAMPLE_FMT_S16, //采样格式  AV_SAMPLE_FMT_S16
                                       0);
									   

	/* read data from device  获取音频数据 到pkt
	参数1: 音频数据上下文
	参数2: 音频数据存放的目标地址
	*/
    while((ret = av_read_frame(fmt_ctx, &pkt)) == 0) {
        
    av_log(NULL, AV_LOG_INFO,"packet size is %d(%p)  count=%d\n", pkt.size, pkt.data,count);

		if(count < 32){	
		//进行内存拷贝，按字节拷贝的   放到 重采样输入缓冲区数组的第一个缓冲区
	       	memcpy((void*)(src_data[0]+count*pkt.size), (void*)pkt.data, pkt.size);
			if(count < 31){
				count++;
				continue;
			}
			
		}
        printf("store %d data\n",count*pkt.size);
        //在写之前 对每一帧数据进行重采样，重采样之后 再将数据写入文件中。
		/*
		参数1：重采样上下文
		参数2：重采样后 输出的位置
		参数3：输出数据的每个通道的采样个数
		参数4：输入数据 存储位置
		参数5：输入单个通道的采样数
		*/

        swr_convert(swr_ctx,                    //重采样的上下文
                    dst_data,                   //重采样数据输出缓冲区
                    512,                        //每个通道的采样数
                    (const uint8_t **)src_data, //输入缓冲区
                    512);                       //输入单个通道的采样数
        
		//将重采样的数据拷贝到 AAC音频输入数据 空间frame 中，交给编码器用于编码
        memcpy((void *)frame->data[0], dst_data[0], dst_linesize);
       
		/* 将音频帧数据 送给 编码器进行编码 ，然后将编码后的数据 写到目标文件中
		参数1 AVCodecContext *ctx  编码器上下文
		参数2 AVFrame *frame 编码前的音频帧数据输入给编码器
		参数3 AVPacket *pkt  编码器编码后的音频帧数据
		参数4 FILE *output   编码后的音频帧写到目标文件
		*/
		encode(c_ctx, frame, newpkt, outfile);
		
        av_packet_unref(&pkt); //release pkt

		count = 0;
    }
	
	/*再次调用编码器，强制让编码器编码缓存中剩下的音频帧数据 并吐出
	此时不送数据到编码器，让编码器对缓冲区中剩下的数据进行编码并吐出
	*/
	encode(c_ctx, NULL, newpkt, outfile);
  
__ERROR:  
    //close file
    fclose(outfile);
    
    //释放输入输出缓冲区
    if(src_data){
        av_freep(&src_data[0]);
    }
    av_freep(src_data);
    
    if(dst_data){
        av_freep(&dst_data[0]);
    }
    av_freep(dst_data);
    
    //释放重采样的上下文
    swr_free(&swr_ctx);
	
	//释放 AVFrame 和 AVPacket
    if(frame){
        av_frame_free(&frame);
    }
    
    if(newpkt){
        av_packet_free(&newpkt);
    }
    
    
    //关闭设备 并 释放音频数据上下文
    avformat_close_input(&fmt_ctx);

    av_log(NULL, AV_LOG_DEBUG, "finish!\n");
    
    return;
}

int main(int argc, char *argv[])
{
    rec_audio();
    return 0;
}

播放：ffmplay audio.aac