[移动开发] (Android-RTC-8)分析HardwareVideoEncoder

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 移动开发 -> (Android-RTC-8)分析HardwareVideoEncoder—BitrateAdjuster -> 正文阅读

[移动开发](Android-RTC-8)分析HardwareVideoEncoder—BitrateAdjuster

一、前提回顾

稍微回顾一下之前的内容，以编码DefaultVideoEncoderFactory为入口，createEncoder是由HardwareVideoEncoderFactory 和 SoftwareVideoEncoderFactory各自创建出来，然后回传到PeerConnectionClient。

@Nullable
public VideoEncoder createEncoder(VideoCodecInfo info) {
    VideoEncoder softwareEncoder = this.softwareVideoEncoderFactory.createEncoder(info);
    VideoEncoder hardwareEncoder = this.hardwareVideoEncoderFactory.createEncoder(info);
    if (hardwareEncoder != null && softwareEncoder != null) {
        return new VideoEncoderFallback(softwareEncoder, hardwareEncoder);
    } else {
        return hardwareEncoder != null ? hardwareEncoder : softwareEncoder;
    }
}

对于HardwareVideoEncoderFactory??createEncoder创建硬解器，大概如下：

@Nullable
@Override
public VideoEncoder createEncoder(VideoCodecInfo input) {
    VideoCodecMimeType type = VideoCodecMimeType.valueOf(input.name);
    MediaCodecInfo info = findCodecForType(type);

    String codecName = info.getName();
    String mime = type.mimeType();
    Integer surfaceColorFormat = MediaCodecUtils.selectColorFormat(
            MediaCodecUtils.TEXTURE_COLOR_FORMATS, info.getCapabilitiesForType(mime));
    Integer yuvColorFormat = MediaCodecUtils.selectColorFormat(
            MediaCodecUtils.ENCODER_COLOR_FORMATS, info.getCapabilitiesForType(mime));
    if (type == VideoCodecMimeType.H264) {
        boolean isHighProfile = H264Utils.isSameH264Profile(
                input.params, MediaCodecUtils.getCodecProperties(type, /* highProfile= */ true));
        boolean isBaselineProfile = H264Utils.isSameH264Profile(
                input.params, MediaCodecUtils.getCodecProperties(type, /* highProfile= */ false));
        if (!isHighProfile && !isBaselineProfile) {
            return null;
        }
        if (isHighProfile && !isH264HighProfileSupported(info)) {
            return null;
        }
    }
    return new HardwareVideoEncoder(new MediaCodecWrapperFactoryImpl(), codecName, type,
            surfaceColorFormat, yuvColorFormat, input.params, getKeyFrameIntervalSec(type),
            getForcedKeyFrameIntervalMs(type, codecName), createBitrateAdjuster(type, codecName),
            sharedContext);
}

createEncoder的流程在?Android-RTC-6?分析VideoEncoderFactory进行过较为详细的分析，这次深入HardwareVideoEncoder。

二、BitrateAdjuster

事不宜迟，赶紧进入分析，首先是初始化操作。

@Override
public VideoCodecStatus initEncode(Settings settings, Callback callback) {
    // ...
    useSurfaceMode = canUseSurface();
    if (settings.startBitrate != 0 && settings.maxFramerate != 0) {
        bitrateAdjuster.setTargets(settings.startBitrate * 1000, settings.maxFramerate);
    }
    adjustedBitrate = bitrateAdjuster.getAdjustedBitrateBps();
    return initEncodeInternal();
}

private VideoCodecStatus initEncodeInternal() {
    lastKeyFrameNs = -1;
    try {
        codec = mediaCodecWrapperFactory.createByCodecName(codecName);
    } catch (IOException | IllegalArgumentException e) {
        Logging.e(TAG, "Cannot create media encoder " + codecName);
        return VideoCodecStatus.FALLBACK_SOFTWARE;
    }
    final int colorFormat = useSurfaceMode ? surfaceColorFormat : yuvColorFormat;
    try {
        MediaFormat format = MediaFormat.createVideoFormat(codecType.mimeType(), width, height)
        format.setInteger(MediaFormat.KEY_BIT_RATE, adjustedBitrate);
        format.setInteger(KEY_BITRATE_MODE, VIDEO_ControlRateConstant);
        format.setInteger(MediaFormat.KEY_COLOR_FORMAT, colorFormat);
        format.setInteger(MediaFormat.KEY_FRAME_RATE, bitrateAdjuster.getCodecConfigFramerate()
        format.setInteger(MediaFormat.KEY_I_FRAME_INTERVAL, keyFrameIntervalSec);
        if (codecType == VideoCodecMimeType.H264) {
            String profileLevelId = params.get(VideoCodecInfo.H264_FMTP_PROFILE_LEVEL_ID);
            if (profileLevelId == null) {
                profileLevelId = VideoCodecInfo.H264_CONSTRAINED_BASELINE_3_1;
            }
            switch (profileLevelId) {
                case VideoCodecInfo.H264_CONSTRAINED_HIGH_3_1:
                    format.setInteger("profile", VIDEO_AVC_PROFILE_HIGH);
                    format.setInteger("level", VIDEO_AVC_LEVEL_3);
                    break;
                case VideoCodecInfo.H264_CONSTRAINED_BASELINE_3_1:
                    break;
                default:
                    Logging.w(TAG, "Unknown profile level id: " + profileLevelId);
            }
        }
        codec.configure(
                format, null /* surface */, null /* crypto */, MediaCodec.CONFIGURE_FLAG_ENCODE);
        if (useSurfaceMode) {
            textureEglBase = EglBase.createEgl14(sharedContext, EglBase.CONFIG_RECORDABLE);
            textureInputSurface = codec.createInputSurface();
            textureEglBase.createSurface(textureInputSurface);
            textureEglBase.makeCurrent();
        }
        codec.start();
        outputBuffers = codec.getOutputBuffers();
    } catch (IllegalStateException e) {
        Logging.e(TAG, "initEncodeInternal failed", e);
        release();
        return VideoCodecStatus.FALLBACK_SOFTWARE;
    }
    running = true;
    outputThreadChecker.detachThread();
    outputThread = createOutputThread();
    outputThread.start();
    return VideoCodecStatus.OK;
}

1、initEncode都是一些MediaCodec的常规操作，就是封装得比较完善，看见一个bitrateAdjuster，主要意义用于码率调整适配器。是HardwareVideoEncoderFactory->createEncoder创建HardwareVideoEncoder对象的时候通过createBitrateAdjuster传递的一个对象。

2、initEncode还根据profileLevelId设置了profile / level，关于profileLevelId的相关知识，已在?Android-RTC-6?分析过，大家可以去看看。

这次让我们深入浅出的看看这个BitrateAdjuster是如何工作的。

private BitrateAdjuster createBitrateAdjuster(VideoCodecMimeType type, String codecName) {
    if (codecName.startsWith(EXYNOS_PREFIX)) {
        if (type == VideoCodecMimeType.VP8) {
            // Exynos VP8 encoders need dynamic bitrate adjustment.
            return new DynamicBitrateAdjuster();
        } else {
            // Exynos VP9 and H264 encoders need framerate-based bitrate adjustment.
            return new FramerateBitrateAdjuster();
        }
    }
    // Other codecs don't need bitrate adjustment.
    return new BaseBitrateAdjuster();
}

一图看懂BitrateAdjuster的继承关系。主要工作是FramerateBitrateAdjuster 和?DynamicBitrateAdjuster。

class FramerateBitrateAdjuster extends BaseBitrateAdjuster {
    private static final int INITIAL_FPS = 30;

    @Override
    public void setTargets(int targetBitrateBps, int targetFps) {
        if (this.targetFps == 0) {
            // Framerate-based bitrate adjustment always initializes to the same framerate.
            targetFps = INITIAL_FPS;
        }
        super.setTargets(targetBitrateBps, targetFps);

        this.targetBitrateBps = this.targetBitrateBps * INITIAL_FPS / this.targetFps;
    }

    @Override
    public int getCodecConfigFramerate() {
        return INITIAL_FPS;
    }
}

先看FramerateBitrateAdjuster，写法有点绕，其实就是固定帧率=30。然后根据设置的码率求调整后的帧率对应的码率。（占百分比的关系，多数用于固定带宽的场景。）

class DynamicBitrateAdjuster extends BaseBitrateAdjuster {
    private static final double BITS_PER_BYTE = 8.0;

    // Change the bitrate at most once every three seconds.
    private static final double BITRATE_ADJUSTMENT_SEC = 3.0;
    // Maximum bitrate adjustment scale - no more than 4 times.
    private static final double BITRATE_ADJUSTMENT_MAX_SCALE = 4;
    // Amount of adjustment steps to reach maximum scale.
    private static final int BITRATE_ADJUSTMENT_STEPS = 20;
    // How far the codec has deviated above (or below) the target bitrate (tracked in bytes).
    private double deviationBytes;
    private double timeSinceLastAdjustmentMs;
    private int bitrateAdjustmentScaleExp;

    @Override
    public void setTargets(int targetBitrateBps, int targetFps) {
        if (this.targetBitrateBps > 0 && targetBitrateBps < this.targetBitrateBps) {
            // Rescale the accumulator level if the accumulator max decreases
            deviationBytes = deviationBytes * targetBitrateBps / this.targetBitrateBps;
        }
        super.setTargets(targetBitrateBps, targetFps);
    }

    @Override
    public void reportEncodedFrame(int size) {
        if (targetFps == 0) {
            return;
        }

        // Accumulate the difference between actual and expected frame sizes.
        double expectedBytesPerFrame = (targetBitrateBps / BITS_PER_BYTE) / targetFps;
        deviationBytes += (size - expectedBytesPerFrame);
        timeSinceLastAdjustmentMs += 1000.0 / targetFps;

        // Adjust the bitrate when the encoder accumulates one second's worth of data in excess or
        // shortfall of the target.
        double deviationThresholdBytes = targetBitrateBps / BITS_PER_BYTE;

        // Cap the deviation, i.e., don't let it grow beyond some level to avoid using too old data for
        // bitrate adjustment.  This also prevents taking more than 3 "steps" in a given 3-second cycle.
        double deviationCap = BITRATE_ADJUSTMENT_SEC * deviationThresholdBytes;
        deviationBytes = Math.min(deviationBytes, deviationCap);
        deviationBytes = Math.max(deviationBytes, -deviationCap);

        // Do bitrate adjustment every 3 seconds if actual encoder bitrate deviates too much
        // from the target value.
        if (timeSinceLastAdjustmentMs <= 1000 * BITRATE_ADJUSTMENT_SEC) {
            return;
        }

        if (deviationBytes > deviationThresholdBytes) {
            // Encoder generates too high bitrate - need to reduce the scale.
            int bitrateAdjustmentInc = (int) (deviationBytes / deviationThresholdBytes + 0.5);
            bitrateAdjustmentScaleExp -= bitrateAdjustmentInc;
            // Don't let the adjustment scale drop below -BITRATE_ADJUSTMENT_STEPS.
            // This sets a minimum exponent of -1 (bitrateAdjustmentScaleExp / BITRATE_ADJUSTMENT_STEPS).
            bitrateAdjustmentScaleExp = Math.max(bitrateAdjustmentScaleExp, -BITRATE_ADJUSTMENT_STEPS);
            deviationBytes = deviationThresholdBytes;
        } else if (deviationBytes < -deviationThresholdBytes) {
            // Encoder generates too low bitrate - need to increase the scale.
            int bitrateAdjustmentInc = (int) (-deviationBytes / deviationThresholdBytes + 0.5);
            bitrateAdjustmentScaleExp += bitrateAdjustmentInc;
            // Don't let the adjustment scale exceed BITRATE_ADJUSTMENT_STEPS.
            // This sets a maximum exponent of 1 (bitrateAdjustmentScaleExp / BITRATE_ADJUSTMENT_STEPS).
            bitrateAdjustmentScaleExp = Math.min(bitrateAdjustmentScaleExp, BITRATE_ADJUSTMENT_STEPS);
            deviationBytes = -deviationThresholdBytes;
        }
        timeSinceLastAdjustmentMs = 0;
    }

    private double getBitrateAdjustmentScale() {
        return Math.pow(BITRATE_ADJUSTMENT_MAX_SCALE,
                (double) bitrateAdjustmentScaleExp / BITRATE_ADJUSTMENT_STEPS);
    }
    @Override
    public int getAdjustedBitrateBps() {
        return (int) (targetBitrateBps * getBitrateAdjustmentScale());
    }
}

再看DynamicBitrateAdjuster，复写了reportEncodedFrame，此方法传入的参数是编码输出的实际字节大小。我们来看看其中的算法逻辑。

// 期望的每帧分配码率，转换大Byte为单位。
double expectedBytesPerFrame = (targetBitrateBps / BITS_PER_BYTE) / targetFps;
// 统计实际帧大小和预期帧大小之间的差异。
deviationBytes += (size - expectedBytesPerFrame);
// 期望的码率值(Byte)
double deviationThresholdBytes = targetBitrateBps / BITS_PER_BYTE;

/**
?* 限制偏差，也就是说，不要让偏差超过某个级别，以避免使用太旧的数据进行比特率调整。
?* 这还可以防止在给定的3秒周期内采取超过3个“调整级别”。
?*/
// 3s内的期望码率
double deviationCap = BITRATE_ADJUSTMENT_SEC * deviationThresholdBytes;
// 把实际与期望的偏差控制在-3s ~ +3s的期望码率内。
deviationBytes = Math.min(deviationBytes, deviationCap);
deviationBytes = Math.max(deviationBytes, -deviationCap);

// 统计时间，调整码率调控时间 (3s一次)
timeSinceLastAdjustmentMs += 1000.0 / targetFps;
if (timeSinceLastAdjustmentMs <= 1000 * BITRATE_ADJUSTMENT_SEC) {
? ? return;
}

if (deviationBytes > deviationThresholdBytes) {
? ? // 编码器产生的比特率太高-需要按比例减小。
? ? int bitrateAdjustmentInc = (int) (deviationBytes / deviationThresholdBytes + 0.5);
? ? bitrateAdjustmentScaleExp -= bitrateAdjustmentInc;
? ? // 不要让调整比例降到低于 -BITRATE_ADJUSTMENT_STEPS.
? ? // 这保证(bitrateAdjustmentScaleExp / BITRATE_ADJUSTMENT_STEPS)最小指数设置为-1
? ? bitrateAdjustmentScaleExp = Math.max(bitrateAdjustmentScaleExp, -BITRATE_ADJUSTMENT_STEPS);
? ? deviationBytes = deviationThresholdBytes;
} else if (deviationBytes < -deviationThresholdBytes) {
? ? // 编码器生成的比特率太低-需要按比例增加。
? ? int bitrateAdjustmentInc = (int) (-deviationBytes / deviationThresholdBytes + 0.5);
? ? bitrateAdjustmentScaleExp += bitrateAdjustmentInc;
? ? // 不要让调整比例超过 BITRATE_ADJUSTMENT_STEPS.
? ? // 这保证(bitrateAdjustmentScaleExp / BITRATE_ADJUSTMENT_STEPS)最大指数设置为1.
? ? bitrateAdjustmentScaleExp = Math.min(bitrateAdjustmentScaleExp, BITRATE_ADJUSTMENT_STEPS);
? ? deviationBytes = -deviationThresholdBytes;
}
timeSinceLastAdjustmentMs = 0;

关键逻辑就是根据情况算出bitrateAdjustmentScaleExp，得出合适的getBitrateAdjustmentScale。这个DynamicBitrateAdjuster场景在哪呢？就是客户端千变万化的网络场景，特别是弱网网络，根据探测的上行网络带宽，适当的调整编码输出码率，便于传输。

三、Encode

在AppWebRTC的demo当中，我们可以看到HardwareVideoEncoder的createOutputThread。执行deliverEncodedImage函数，其中就是在dequeueOutputBuffer输出编码数据后，通过bitrateAdjuster.getAdjustedBitrateBps()实时的调整码率。

private Thread createOutputThread() {
    return new Thread() {
        @Override
        public void run() {
            while (running) {
                deliverEncodedImage();
            }
            releaseCodecOnOutputThread();
        }
    };
}
// Visible for testing.
protected void deliverEncodedImage() {
    outputThreadChecker.checkIsOnValidThread();
    try {
        MediaCodec.BufferInfo info = new MediaCodec.BufferInfo();
        int index = codec.dequeueOutputBuffer(info, DEQUEUE_OUTPUT_BUFFER_TIMEOUT_US);
        if (index < 0) {
            if (index == MediaCodec.INFO_OUTPUT_BUFFERS_CHANGED) {
                outputBuffersBusyCount.waitForZero();
                outputBuffers = codec.getOutputBuffers();
            }
            return;
        }
        ByteBuffer codecOutputBuffer = outputBuffers[index];
        codecOutputBuffer.position(info.offset);
        codecOutputBuffer.limit(info.offset + info.size);
        if ((info.flags & MediaCodec.BUFFER_FLAG_CODEC_CONFIG) != 0) {
            Logging.d(TAG, "Config frame generated. Offset: " + info.offset + ". Size: " + info.size);
            configBuffer = ByteBuffer.allocateDirect(info.size);
            configBuffer.put(codecOutputBuffer);
        } else {
            bitrateAdjuster.reportEncodedFrame(info.size);
            if (adjustedBitrate != bitrateAdjuster.getAdjustedBitrateBps()) {
                updateBitrate();
            }
            final boolean isKeyFrame = (info.flags & MediaCodec.BUFFER_FLAG_SYNC_FRAME) != 0;
            if (isKeyFrame) {
                Logging.d(TAG, "Sync frame generated");
            }
            // ...
        }
    } catch (IllegalStateException e) {
        Logging.e(TAG, "deliverOutput failed", e);
    }
}

有输入才有输出，我们看看encode的输入：

@Override
public VideoCodecStatus encode(VideoFrame videoFrame, EncodeInfo encodeInfo) {
    encodeThreadChecker.checkIsOnValidThread();
    if (codec == null) {
        return VideoCodecStatus.UNINITIALIZED;
    }
    final VideoFrame.Buffer videoFrameBuffer = videoFrame.getBuffer();
    final boolean isTextureBuffer = videoFrameBuffer instanceof VideoFrame.TextureBuffer;
    // If input resolution changed, restart the codec with the new resolution.
    final int frameWidth = videoFrame.getBuffer().getWidth();
    final int frameHeight = videoFrame.getBuffer().getHeight();
    final boolean shouldUseSurfaceMode = canUseSurface() && isTextureBuffer;
    if (frameWidth != width || frameHeight != height || shouldUseSurfaceMode != useSurfaceMode) {
        VideoCodecStatus status = resetCodec(frameWidth, frameHeight, shouldUseSurfaceMode);
        if (status != VideoCodecStatus.OK) {
            return status;
        }
    }
    if (outputBuilders.size() > MAX_ENCODER_Q_SIZE) {
        // Too many frames in the encoder.  Drop this frame.
        Logging.e(TAG, "Dropped frame, encoder queue full");
        return VideoCodecStatus.NO_OUTPUT; // See webrtc bug 2887.
    }
    boolean requestedKeyFrame = false;
    for (EncodedImage.FrameType frameType : encodeInfo.frameTypes) {
        if (frameType == EncodedImage.FrameType.VideoFrameKey) {
            requestedKeyFrame = true;
        }
    }
    if (requestedKeyFrame || shouldForceKeyFrame(videoFrame.getTimestampNs())) {
        requestKeyFrame(videoFrame.getTimestampNs());
    }
    // Number of bytes in the video buffer. Y channel is sampled at one byte per pixel; U and V are
    // subsampled at one byte per four pixels.
    int bufferSize = videoFrameBuffer.getHeight() * videoFrameBuffer.getWidth() * 3 / 2;
    EncodedImage.Builder builder = EncodedImage.builder()
            .setCaptureTimeNs(videoFrame.getTimestampNs())
            .setEncodedWidth(videoFrame.getBuffer().getWidth())
            .setEncodedHeight(videoFrame.getBuffer().getHeight())
            .setRotation(videoFrame.getRotation());
    outputBuilders.offer(builder);
    final VideoCodecStatus returnValue;
    if (useSurfaceMode) {
        returnValue = encodeTextureBuffer(videoFrame);
    } else {
        returnValue = encodeByteBuffer(videoFrame, videoFrameBuffer, bufferSize);
    }
    // Check if the queue was successful.
    if (returnValue != VideoCodecStatus.OK) {
        // Keep the output builders in sync with buffers in the codec.
        outputBuilders.pollLast();
    }
    return returnValue;
}

其中BlockingDeque<EncodedImage.Builder> outputBuilders；是输出对象队列，用于打时间戳、旋转角度等各种非必要的编码信息。其中看到encodeTextureBuffer /?encodeByteBuffer两个输入方法。

encodeTextureBuffer代码的模式和上一节的?Android-RTC-7?介绍的是一样的。这里就不再详细展开；encodeByteBuffer 也比较简单，着重关注方法里面的fillInputBuffer，根据当前的yuvColorFormat，底层调用libyuv进行格式转换，然后填入MediaCodec。

下一章分析WebRTC的关键点：?PeerConnection。新年假期简单码了一篇文章，也算是对得起自己之前承诺的保持学习，每月保持原创输出。在这新的虎年打算保持Android-RTC的产出，还打算输出Android有关于HDR实战专栏。希望能帮助大家。