antkeeper
/
superbuild



								#include "config.h"


								#include "alcomplex.h"


								#include <algorithm>

								#include <cassert>

								#include <cmath>

								#include <cstddef>

								#include <utility>


								#include "albit.h"

								#include "alnumbers.h"

								#include "alnumeric.h"

								#include "opthelpers.h"


								namespace {


								using ushort = unsigned short;

								using ushort2 = std::pair<ushort,ushort>;


								/* Because std::array doesn't have constexpr non-const accessors in C++14. */

								template<typename T, size_t N>

								struct our_array {

								    T mData[N];

								};


								constexpr size_t BitReverseCounter(size_t log2_size) noexcept

								{

								    /* Some magic math that calculates the number of swaps needed for a

								     * sequence of bit-reversed indices when index < reversed_index.

								     */

								    return (1u<<(log2_size-1)) - (1u<<((log2_size-1u)/2u));

								}


								template<size_t N>

								constexpr auto GetBitReverser() noexcept

								{

								    static_assert(N <= sizeof(ushort)*8, "Too many bits for the bit-reversal table.");


								    our_array<ushort2, BitReverseCounter(N)> ret{};

								    const size_t fftsize{1u << N};

								    size_t ret_i{0};


								    /* Bit-reversal permutation applied to a sequence of fftsize items. */

								    for(size_t idx{1u};idx < fftsize-1;++idx)

								    {

								        size_t revidx{0u}, imask{idx};

								        for(size_t i{0};i < N;++i)

								        {

								            revidx = (revidx<<1) | (imask&1);

								            imask >>= 1;

								        }


								        if(idx < revidx)

								        {

								            ret.mData[ret_i].first  = static_cast<ushort>(idx);

								            ret.mData[ret_i].second = static_cast<ushort>(revidx);

								            ++ret_i;

								        }

								    }

								    assert(ret_i == al::size(ret.mData));

								    return ret;

								}


								/* These bit-reversal swap tables support up to 10-bit indices (1024 elements),

								 * which is the largest used by OpenAL Soft's filters and effects. Larger FFT

								 * requests, used by some utilities where performance is less important, will

								 * use a slower table-less path.

								 */

								constexpr auto BitReverser2 = GetBitReverser<2>();

								constexpr auto BitReverser3 = GetBitReverser<3>();

								constexpr auto BitReverser4 = GetBitReverser<4>();

								constexpr auto BitReverser5 = GetBitReverser<5>();

								constexpr auto BitReverser6 = GetBitReverser<6>();

								constexpr auto BitReverser7 = GetBitReverser<7>();

								constexpr auto BitReverser8 = GetBitReverser<8>();

								constexpr auto BitReverser9 = GetBitReverser<9>();

								constexpr auto BitReverser10 = GetBitReverser<10>();

								constexpr al::span<const ushort2> gBitReverses[11]{

								    {}, {},

								    BitReverser2.mData,

								    BitReverser3.mData,

								    BitReverser4.mData,

								    BitReverser5.mData,

								    BitReverser6.mData,

								    BitReverser7.mData,

								    BitReverser8.mData,

								    BitReverser9.mData,

								    BitReverser10.mData

								};


								} // namespace


								void complex_fft(const al::span<std::complex<double>> buffer, const double sign)

								{

								    const size_t fftsize{buffer.size()};

								    /* Get the number of bits used for indexing. Simplifies bit-reversal and

								     * the main loop count.

								     */

								    const size_t log2_size{static_cast<size_t>(al::countr_zero(fftsize))};


								    if(unlikely(log2_size >= al::size(gBitReverses)))

								    {

								        for(size_t idx{1u};idx < fftsize-1;++idx)

								        {

								            size_t revidx{0u}, imask{idx};

								            for(size_t i{0};i < log2_size;++i)

								            {

								                revidx = (revidx<<1) | (imask&1);

								                imask >>= 1;

								            }


								            if(idx < revidx)

								                std::swap(buffer[idx], buffer[revidx]);

								        }

								    }

								    else for(auto &rev : gBitReverses[log2_size])

								        std::swap(buffer[rev.first], buffer[rev.second]);


								    /* Iterative form of Danielson-Lanczos lemma */

								    const double pi{al::numbers::pi * sign};

								    size_t step2{1u};

								    for(size_t i{0};i < log2_size;++i)

								    {

								        const double arg{pi / static_cast<double>(step2)};


								        /* TODO: Would std::polar(1.0, arg) be any better? */

								        const std::complex<double> w{std::cos(arg), std::sin(arg)};

								        std::complex<double> u{1.0, 0.0};

								        const size_t step{step2 << 1};

								        for(size_t j{0};j < step2;j++)

								        {

								            for(size_t k{j};k < fftsize;k+=step)

								            {

								                std::complex<double> temp{buffer[k+step2] * u};

								                buffer[k+step2] = buffer[k] - temp;

								                buffer[k] += temp;

								            }


								            u *= w;

								        }


								        step2 <<= 1;

								    }

								}


								void complex_hilbert(const al::span<std::complex<double>> buffer)

								{

								    inverse_fft(buffer);


								    const double inverse_size = 1.0/static_cast<double>(buffer.size());

								    auto bufiter = buffer.begin();

								    const auto halfiter = bufiter + (buffer.size()>>1);


								    *bufiter *= inverse_size; ++bufiter;

								    bufiter = std::transform(bufiter, halfiter, bufiter,

								        [inverse_size](const std::complex<double> &c) -> std::complex<double>

								        { return c * (2.0*inverse_size); });

								    *bufiter *= inverse_size; ++bufiter;


								    std::fill(bufiter, buffer.end(), std::complex<double>{});


								    forward_fft(buffer);

								}