antkeeper
/
superbuild


#include "config.h"

#include "uhjfilter.h"

#include <algorithm>
#include <iterator>

#include "alcomplex.h"
#include "alnumeric.h"
#include "opthelpers.h"
#include "phase_shifter.h"


namespace {
const PhaseShifterT<UhjFilterBase::sFilterDelay*2> PShift{};
} // namespace


/* Encoding UHJ from B-Format is done as:
 * * S = 0.9396926*W + 0.1855740*X * D = j(-0.3420201*W + 0.5098604*X) + 0.6554516*Y * * Left = (S + D)/2.0 * Right = (S - D)/2.0 * T = j(-0.1432*W + 0.6512*X) - 0.7071068*Y * Q = 0.9772*Z * * where j is a wide-band +90 degree phase shift. 3-channel UHJ excludes Q, * while 2-channel excludes Q and T. * * The phase shift is done using a linear FIR filter derived from an FFT'd * impulse with the desired shift. */
void UhjEncoder::encode(float *LeftOut, float *RightOut,    const al::span<const float*const,3> InSamples, const size_t SamplesToDo){    ASSUME(SamplesToDo > 0);
    float *RESTRICT left{al::assume_aligned<16>(LeftOut)};    float *RESTRICT right{al::assume_aligned<16>(RightOut)};
    const float *RESTRICT winput{al::assume_aligned<16>(InSamples[0])};    const float *RESTRICT xinput{al::assume_aligned<16>(InSamples[1])};    const float *RESTRICT yinput{al::assume_aligned<16>(InSamples[2])};
    /* Combine the previously delayed S/D signal with the input. Include any
     * existing direct signal with it.     */
    /* S = 0.9396926*W + 0.1855740*X */    auto miditer = mS.begin() + sFilterDelay;    std::transform(winput, winput+SamplesToDo, xinput, miditer,        [](const float w, const float x) noexcept -> float        { return 0.9396926f*w + 0.1855740f*x; });    for(size_t i{0};i < SamplesToDo;++i,++miditer)        *miditer += left[i] + right[i];
    /* D = 0.6554516*Y */    auto sideiter = mD.begin() + sFilterDelay;    std::transform(yinput, yinput+SamplesToDo, sideiter,        [](const float y) noexcept -> float { return 0.6554516f*y; });    for(size_t i{0};i < SamplesToDo;++i,++sideiter)        *sideiter += left[i] - right[i];
    /* D += j(-0.3420201*W + 0.5098604*X) */    auto tmpiter = std::copy(mWXHistory.cbegin(), mWXHistory.cend(), mTemp.begin());    std::transform(winput, winput+SamplesToDo, xinput, tmpiter,        [](const float w, const float x) noexcept -> float        { return -0.3420201f*w + 0.5098604f*x; });    std::copy_n(mTemp.cbegin()+SamplesToDo, mWXHistory.size(), mWXHistory.begin());    PShift.processAccum({mD.data(), SamplesToDo}, mTemp.data());
    /* Left = (S + D)/2.0 */    for(size_t i{0};i < SamplesToDo;i++)        left[i] = (mS[i] + mD[i]) * 0.5f;    /* Right = (S - D)/2.0 */    for(size_t i{0};i < SamplesToDo;i++)        right[i] = (mS[i] - mD[i]) * 0.5f;
    /* Copy the future samples to the front for next time. */    std::copy(mS.cbegin()+SamplesToDo, mS.cbegin()+SamplesToDo+sFilterDelay, mS.begin());    std::copy(mD.cbegin()+SamplesToDo, mD.cbegin()+SamplesToDo+sFilterDelay, mD.begin());}

/* Decoding UHJ is done as:
 * * S = Left + Right * D = Left - Right * * W = 0.981532*S + 0.197484*j(0.828331*D + 0.767820*T) * X = 0.418496*S - j(0.828331*D + 0.767820*T) * Y = 0.795968*D - 0.676392*T + j(0.186633*S) * Z = 1.023332*Q * * where j is a +90 degree phase shift. 3-channel UHJ excludes Q, while 2- * channel excludes Q and T. */void UhjDecoder::decode(const al::span<float*> samples, const size_t samplesToDo,    const size_t forwardSamples){    ASSUME(samplesToDo > 0);
    {        const float *RESTRICT left{al::assume_aligned<16>(samples[0])};        const float *RESTRICT right{al::assume_aligned<16>(samples[1])};        const float *RESTRICT t{al::assume_aligned<16>(samples[2])};
        /* S = Left + Right */        for(size_t i{0};i < samplesToDo+sFilterDelay;++i)            mS[i] = left[i] + right[i];
        /* D = Left - Right */        for(size_t i{0};i < samplesToDo+sFilterDelay;++i)            mD[i] = left[i] - right[i];
        /* T */        for(size_t i{0};i < samplesToDo+sFilterDelay;++i)            mT[i] = t[i];    }
    float *RESTRICT woutput{al::assume_aligned<16>(samples[0])};    float *RESTRICT xoutput{al::assume_aligned<16>(samples[1])};    float *RESTRICT youtput{al::assume_aligned<16>(samples[2])};
    /* Precompute j(0.828331*D + 0.767820*T) and store in xoutput. */    auto tmpiter = std::copy(mDTHistory.cbegin(), mDTHistory.cend(), mTemp.begin());    std::transform(mD.cbegin(), mD.cbegin()+samplesToDo+sFilterDelay, mT.cbegin(), tmpiter,        [](const float d, const float t) noexcept { return 0.828331f*d + 0.767820f*t; });    std::copy_n(mTemp.cbegin()+forwardSamples, mDTHistory.size(), mDTHistory.begin());    PShift.process({xoutput, samplesToDo}, mTemp.data());
    /* W = 0.981532*S + 0.197484*j(0.828331*D + 0.767820*T) */    for(size_t i{0};i < samplesToDo;++i)        woutput[i] = 0.981532f*mS[i] + 0.197484f*xoutput[i];    /* X = 0.418496*S - j(0.828331*D + 0.767820*T) */    for(size_t i{0};i < samplesToDo;++i)        xoutput[i] = 0.418496f*mS[i] - xoutput[i];
    /* Precompute j*S and store in youtput. */    tmpiter = std::copy(mSHistory.cbegin(), mSHistory.cend(), mTemp.begin());    std::copy_n(mS.cbegin(), samplesToDo+sFilterDelay, tmpiter);    std::copy_n(mTemp.cbegin()+forwardSamples, mSHistory.size(), mSHistory.begin());    PShift.process({youtput, samplesToDo}, mTemp.data());
    /* Y = 0.795968*D - 0.676392*T + j(0.186633*S) */    for(size_t i{0};i < samplesToDo;++i)        youtput[i] = 0.795968f*mD[i] - 0.676392f*mT[i] + 0.186633f*youtput[i];
    if(samples.size() > 3)    {        float *RESTRICT zoutput{al::assume_aligned<16>(samples[3])};        /* Z = 1.023332*Q */        for(size_t i{0};i < samplesToDo;++i)            zoutput[i] = 1.023332f*zoutput[i];    }}

/* Super Stereo processing is done as:
 * * S = Left + Right * D = Left - Right * * W = 0.6098637*S - 0.6896511*j*w*D * X = 0.8624776*S + 0.7626955*j*w*D * Y = 1.6822415*w*D - 0.2156194*j*S * * where j is a +90 degree phase shift. w is a variable control for the * resulting stereo width, with the range 0 <= w <= 0.7. */void UhjStereoDecoder::decode(const al::span<float*> samples, const size_t samplesToDo,    const size_t forwardSamples){    ASSUME(samplesToDo > 0);
    {        const float *RESTRICT left{al::assume_aligned<16>(samples[0])};        const float *RESTRICT right{al::assume_aligned<16>(samples[1])};
        for(size_t i{0};i < samplesToDo+sFilterDelay;++i)            mS[i] = left[i] + right[i];
        /* Pre-apply the width factor to the difference signal D. Smoothly
         * interpolate when it changes.         */        const float wtarget{mWidthControl};        const float wcurrent{unlikely(mCurrentWidth < 0.0f) ? wtarget : mCurrentWidth};        if(likely(wtarget == wcurrent) || unlikely(forwardSamples == 0))        {            for(size_t i{0};i < samplesToDo+sFilterDelay;++i)                mD[i] = (left[i] - right[i]) * wcurrent;        }        else        {            const float wstep{(wtarget - wcurrent) / static_cast<float>(forwardSamples)};            float fi{0.0f};            size_t i{0};            for(;i < forwardSamples;++i)            {                mD[i] = (left[i] - right[i]) * (wcurrent + wstep*fi);                fi += 1.0f;            }            for(;i < samplesToDo+sFilterDelay;++i)                mD[i] = (left[i] - right[i]) * wtarget;            mCurrentWidth = wtarget;        }    }
    float *RESTRICT woutput{al::assume_aligned<16>(samples[0])};    float *RESTRICT xoutput{al::assume_aligned<16>(samples[1])};    float *RESTRICT youtput{al::assume_aligned<16>(samples[2])};
    /* Precompute j*D and store in xoutput. */    auto tmpiter = std::copy(mDTHistory.cbegin(), mDTHistory.cend(), mTemp.begin());    std::copy_n(mD.cbegin(), samplesToDo+sFilterDelay, tmpiter);    std::copy_n(mTemp.cbegin()+forwardSamples, mDTHistory.size(), mDTHistory.begin());    PShift.process({xoutput, samplesToDo}, mTemp.data());
    /* W = 0.6098637*S - 0.6896511*j*w*D */    for(size_t i{0};i < samplesToDo;++i)        woutput[i] = 0.6098637f*mS[i] - 0.6896511f*xoutput[i];    /* X = 0.8624776*S + 0.7626955*j*w*D */    for(size_t i{0};i < samplesToDo;++i)        xoutput[i] = 0.8624776f*mS[i] + 0.7626955f*xoutput[i];
    /* Precompute j*S and store in youtput. */    tmpiter = std::copy(mSHistory.cbegin(), mSHistory.cend(), mTemp.begin());    std::copy_n(mS.cbegin(), samplesToDo+sFilterDelay, tmpiter);    std::copy_n(mTemp.cbegin()+forwardSamples, mSHistory.size(), mSHistory.begin());    PShift.process({youtput, samplesToDo}, mTemp.data());
    /* Y = 1.6822415*w*D - 0.2156194*j*S */    for(size_t i{0};i < samplesToDo;++i)        youtput[i] = 1.6822415f*mD[i] - 0.2156194f*youtput[i];}