antkeeper
/
superbuild


#include "config.h"

#include "converter.h"

#include <algorithm>
#include <cmath>
#include <cstdint>
#include <iterator>
#include <limits.h>

#include "albit.h"
#include "albyte.h"
#include "alnumeric.h"
#include "fpu_ctrl.h"

struct CTag;struct CopyTag;

namespace {
constexpr uint MaxPitch{10};
static_assert((BufferLineSize-1)/MaxPitch > 0, "MaxPitch is too large for BufferLineSize!");static_assert((INT_MAX>>MixerFracBits)/MaxPitch > BufferLineSize,    "MaxPitch and/or BufferLineSize are too large for MixerFracBits!");
/* Base template left undefined. Should be marked =delete, but Clang 3.8.1
 * chokes on that given the inline specializations. */template<DevFmtType T>inline float LoadSample(DevFmtType_t<T> val) noexcept;
template<> inline float LoadSample<DevFmtByte>(DevFmtType_t<DevFmtByte> val) noexcept{ return val * (1.0f/128.0f); }template<> inline float LoadSample<DevFmtShort>(DevFmtType_t<DevFmtShort> val) noexcept{ return val * (1.0f/32768.0f); }template<> inline float LoadSample<DevFmtInt>(DevFmtType_t<DevFmtInt> val) noexcept{ return static_cast<float>(val) * (1.0f/2147483648.0f); }template<> inline float LoadSample<DevFmtFloat>(DevFmtType_t<DevFmtFloat> val) noexcept{ return val; }
template<> inline float LoadSample<DevFmtUByte>(DevFmtType_t<DevFmtUByte> val) noexcept{ return LoadSample<DevFmtByte>(static_cast<int8_t>(val - 128)); }template<> inline float LoadSample<DevFmtUShort>(DevFmtType_t<DevFmtUShort> val) noexcept{ return LoadSample<DevFmtShort>(static_cast<int16_t>(val - 32768)); }template<> inline float LoadSample<DevFmtUInt>(DevFmtType_t<DevFmtUInt> val) noexcept{ return LoadSample<DevFmtInt>(static_cast<int32_t>(val - 2147483648u)); }

template<DevFmtType T>inline void LoadSampleArray(float *RESTRICT dst, const void *src, const size_t srcstep,    const size_t samples) noexcept{    const DevFmtType_t<T> *ssrc = static_cast<const DevFmtType_t<T>*>(src);    for(size_t i{0u};i < samples;i++)        dst[i] = LoadSample<T>(ssrc[i*srcstep]);}
void LoadSamples(float *dst, const void *src, const size_t srcstep, const DevFmtType srctype,    const size_t samples) noexcept{#define HANDLE_FMT(T)                                                         \
    case T: LoadSampleArray<T>(dst, src, srcstep, samples); break    switch(srctype)    {        HANDLE_FMT(DevFmtByte);        HANDLE_FMT(DevFmtUByte);        HANDLE_FMT(DevFmtShort);        HANDLE_FMT(DevFmtUShort);        HANDLE_FMT(DevFmtInt);        HANDLE_FMT(DevFmtUInt);        HANDLE_FMT(DevFmtFloat);    }#undef HANDLE_FMT
}

template<DevFmtType T>inline DevFmtType_t<T> StoreSample(float) noexcept;
template<> inline float StoreSample<DevFmtFloat>(float val) noexcept{ return val; }template<> inline int32_t StoreSample<DevFmtInt>(float val) noexcept{ return fastf2i(clampf(val*2147483648.0f, -2147483648.0f, 2147483520.0f)); }template<> inline int16_t StoreSample<DevFmtShort>(float val) noexcept{ return static_cast<int16_t>(fastf2i(clampf(val*32768.0f, -32768.0f, 32767.0f))); }template<> inline int8_t StoreSample<DevFmtByte>(float val) noexcept{ return static_cast<int8_t>(fastf2i(clampf(val*128.0f, -128.0f, 127.0f))); }
/* Define unsigned output variations. */template<> inline uint32_t StoreSample<DevFmtUInt>(float val) noexcept{ return static_cast<uint32_t>(StoreSample<DevFmtInt>(val)) + 2147483648u; }template<> inline uint16_t StoreSample<DevFmtUShort>(float val) noexcept{ return static_cast<uint16_t>(StoreSample<DevFmtShort>(val) + 32768); }template<> inline uint8_t StoreSample<DevFmtUByte>(float val) noexcept{ return static_cast<uint8_t>(StoreSample<DevFmtByte>(val) + 128); }
template<DevFmtType T>inline void StoreSampleArray(void *dst, const float *RESTRICT src, const size_t dststep,    const size_t samples) noexcept{    DevFmtType_t<T> *sdst = static_cast<DevFmtType_t<T>*>(dst);    for(size_t i{0u};i < samples;i++)        sdst[i*dststep] = StoreSample<T>(src[i]);}

void StoreSamples(void *dst, const float *src, const size_t dststep, const DevFmtType dsttype,    const size_t samples) noexcept{#define HANDLE_FMT(T)                                                         \
    case T: StoreSampleArray<T>(dst, src, dststep, samples); break    switch(dsttype)    {        HANDLE_FMT(DevFmtByte);        HANDLE_FMT(DevFmtUByte);        HANDLE_FMT(DevFmtShort);        HANDLE_FMT(DevFmtUShort);        HANDLE_FMT(DevFmtInt);        HANDLE_FMT(DevFmtUInt);        HANDLE_FMT(DevFmtFloat);    }#undef HANDLE_FMT
}

template<DevFmtType T>void Mono2Stereo(float *RESTRICT dst, const void *src, const size_t frames) noexcept{    const DevFmtType_t<T> *ssrc = static_cast<const DevFmtType_t<T>*>(src);    for(size_t i{0u};i < frames;i++)        dst[i*2 + 1] = dst[i*2 + 0] = LoadSample<T>(ssrc[i]) * 0.707106781187f;}
template<DevFmtType T>void Multi2Mono(uint chanmask, const size_t step, const float scale, float *RESTRICT dst,    const void *src, const size_t frames) noexcept{    const DevFmtType_t<T> *ssrc = static_cast<const DevFmtType_t<T>*>(src);    std::fill_n(dst, frames, 0.0f);    for(size_t c{0};chanmask;++c)    {        if LIKELY((chanmask&1))        {            for(size_t i{0u};i < frames;i++)                dst[i] += LoadSample<T>(ssrc[i*step + c]);        }        chanmask >>= 1;    }    for(size_t i{0u};i < frames;i++)        dst[i] *= scale;}
} // namespace

SampleConverterPtr CreateSampleConverter(DevFmtType srcType, DevFmtType dstType, size_t numchans,    uint srcRate, uint dstRate, Resampler resampler){    if(numchans < 1 || srcRate < 1 || dstRate < 1)        return nullptr;
    SampleConverterPtr converter{new(FamCount(numchans)) SampleConverter{numchans}};    converter->mSrcType = srcType;    converter->mDstType = dstType;    converter->mSrcTypeSize = BytesFromDevFmt(srcType);    converter->mDstTypeSize = BytesFromDevFmt(dstType);
    converter->mSrcPrepCount = 0;    converter->mFracOffset = 0;
    /* Have to set the mixer FPU mode since that's what the resampler code expects. */    FPUCtl mixer_mode{};    auto step = static_cast<uint>(        mind(srcRate*double{MixerFracOne}/dstRate + 0.5, MaxPitch*MixerFracOne));    converter->mIncrement = maxu(step, 1);    if(converter->mIncrement == MixerFracOne)        converter->mResample = Resample_<CopyTag,CTag>;    else        converter->mResample = PrepareResampler(resampler, converter->mIncrement,            &converter->mState);
    return converter;}
uint SampleConverter::availableOut(uint srcframes) const{    int prepcount{mSrcPrepCount};    if(prepcount < 0)    {        /* Negative prepcount means we need to skip that many input samples. */        if(static_cast<uint>(-prepcount) >= srcframes)            return 0;        srcframes -= static_cast<uint>(-prepcount);        prepcount = 0;    }
    if(srcframes < 1)    {        /* No output samples if there's no input samples. */        return 0;    }
    if(prepcount < MaxResamplerPadding        && static_cast<uint>(MaxResamplerPadding - prepcount) >= srcframes)    {        /* Not enough input samples to generate an output sample. */        return 0;    }
    auto DataSize64 = static_cast<uint64_t>(prepcount);    DataSize64 += srcframes;    DataSize64 -= MaxResamplerPadding;    DataSize64 <<= MixerFracBits;    DataSize64 -= mFracOffset;
    /* If we have a full prep, we can generate at least one sample. */    return static_cast<uint>(clampu64((DataSize64 + mIncrement-1)/mIncrement, 1,        std::numeric_limits<int>::max()));}
uint SampleConverter::convert(const void **src, uint *srcframes, void *dst, uint dstframes){    const uint SrcFrameSize{static_cast<uint>(mChan.size()) * mSrcTypeSize};    const uint DstFrameSize{static_cast<uint>(mChan.size()) * mDstTypeSize};    const uint increment{mIncrement};    auto SamplesIn = static_cast<const al::byte*>(*src);    uint NumSrcSamples{*srcframes};
    FPUCtl mixer_mode{};    uint pos{0};    while(pos < dstframes && NumSrcSamples > 0)    {        int prepcount{mSrcPrepCount};        if(prepcount < 0)        {            /* Negative prepcount means we need to skip that many input samples. */            if(static_cast<uint>(-prepcount) >= NumSrcSamples)            {                mSrcPrepCount = static_cast<int>(NumSrcSamples) + prepcount;                NumSrcSamples = 0;                break;            }            SamplesIn += SrcFrameSize*static_cast<uint>(-prepcount);            NumSrcSamples -= static_cast<uint>(-prepcount);            mSrcPrepCount = 0;            continue;        }        const uint toread{minu(NumSrcSamples, BufferLineSize - MaxResamplerPadding)};
        if(prepcount < MaxResamplerPadding            && static_cast<uint>(MaxResamplerPadding - prepcount) >= toread)        {            /* Not enough input samples to generate an output sample. Store
             * what we're given for later.             */            for(size_t chan{0u};chan < mChan.size();chan++)                LoadSamples(&mChan[chan].PrevSamples[prepcount], SamplesIn + mSrcTypeSize*chan,                    mChan.size(), mSrcType, toread);
            mSrcPrepCount = prepcount + static_cast<int>(toread);            NumSrcSamples = 0;            break;        }
        float *RESTRICT SrcData{mSrcSamples};        float *RESTRICT DstData{mDstSamples};        uint DataPosFrac{mFracOffset};        auto DataSize64 = static_cast<uint64_t>(prepcount);        DataSize64 += toread;        DataSize64 -= MaxResamplerPadding;        DataSize64 <<= MixerFracBits;        DataSize64 -= DataPosFrac;
        /* If we have a full prep, we can generate at least one sample. */        auto DstSize = static_cast<uint>(            clampu64((DataSize64 + increment-1)/increment, 1, BufferLineSize));        DstSize = minu(DstSize, dstframes-pos);
        for(size_t chan{0u};chan < mChan.size();chan++)        {            const al::byte *SrcSamples{SamplesIn + mSrcTypeSize*chan};            al::byte *DstSamples = static_cast<al::byte*>(dst) + mDstTypeSize*chan;
            /* Load the previous samples into the source data first, then the
             * new samples from the input buffer.             */            std::copy_n(mChan[chan].PrevSamples, prepcount, SrcData);            LoadSamples(SrcData + prepcount, SrcSamples, mChan.size(), mSrcType, toread);
            /* Store as many prep samples for next time as possible, given the
             * number of output samples being generated.             */            uint SrcDataEnd{(DstSize*increment + DataPosFrac)>>MixerFracBits};            if(SrcDataEnd >= static_cast<uint>(prepcount)+toread)                std::fill(std::begin(mChan[chan].PrevSamples),                    std::end(mChan[chan].PrevSamples), 0.0f);            else            {                const size_t len{minz(al::size(mChan[chan].PrevSamples),                    static_cast<uint>(prepcount)+toread-SrcDataEnd)};                std::copy_n(SrcData+SrcDataEnd, len, mChan[chan].PrevSamples);                std::fill(std::begin(mChan[chan].PrevSamples)+len,                    std::end(mChan[chan].PrevSamples), 0.0f);            }
            /* Now resample, and store the result in the output buffer. */            const float *ResampledData{mResample(&mState, SrcData+(MaxResamplerPadding>>1),                DataPosFrac, increment, {DstData, DstSize})};
            StoreSamples(DstSamples, ResampledData, mChan.size(), mDstType, DstSize);        }
        /* Update the number of prep samples still available, as well as the
         * fractional offset.         */        DataPosFrac += increment*DstSize;        mSrcPrepCount = mini(prepcount + static_cast<int>(toread - (DataPosFrac>>MixerFracBits)),            MaxResamplerPadding);        mFracOffset = DataPosFrac & MixerFracMask;
        /* Update the src and dst pointers in case there's still more to do. */        SamplesIn += SrcFrameSize*(DataPosFrac>>MixerFracBits);        NumSrcSamples -= minu(NumSrcSamples, (DataPosFrac>>MixerFracBits));
        dst = static_cast<al::byte*>(dst) + DstFrameSize*DstSize;        pos += DstSize;    }
    *src = SamplesIn;    *srcframes = NumSrcSamples;
    return pos;}

void ChannelConverter::convert(const void *src, float *dst, uint frames) const{    if(mDstChans == DevFmtMono)    {        const float scale{std::sqrt(1.0f / static_cast<float>(al::popcount(mChanMask)))};        switch(mSrcType)        {#define HANDLE_FMT(T) case T: Multi2Mono<T>(mChanMask, mSrcStep, scale, dst, src, frames); break
        HANDLE_FMT(DevFmtByte);        HANDLE_FMT(DevFmtUByte);        HANDLE_FMT(DevFmtShort);        HANDLE_FMT(DevFmtUShort);        HANDLE_FMT(DevFmtInt);        HANDLE_FMT(DevFmtUInt);        HANDLE_FMT(DevFmtFloat);#undef HANDLE_FMT
        }    }    else if(mChanMask == 0x1 && mDstChans == DevFmtStereo)    {        switch(mSrcType)        {#define HANDLE_FMT(T) case T: Mono2Stereo<T>(dst, src, frames); break
        HANDLE_FMT(DevFmtByte);        HANDLE_FMT(DevFmtUByte);        HANDLE_FMT(DevFmtShort);        HANDLE_FMT(DevFmtUShort);        HANDLE_FMT(DevFmtInt);        HANDLE_FMT(DevFmtUInt);        HANDLE_FMT(DevFmtFloat);#undef HANDLE_FMT
        }    }}