latest/doxygen_dev/FlatIdxContainer_8hpp_source.html

/* Copyright 2024 Andrea Bocci, René Widera

 * SPDX-License-Identifier: MPL-2.0

 */


#pragma once


#include "alpaka/Vec.hpp"

#include "alpaka/api/api.hpp"

#include "alpaka/core/Dict.hpp"

#include "alpaka/core/PP.hpp"

#include "alpaka/core/common.hpp"

#include "alpaka/mem/ThreadSpace.hpp"

#include "alpaka/onAcc/layout.hpp"

#include "alpaka/tag.hpp"

#include "alpaka/utility.hpp"


#include <cstdint>

#include <functional>

#include <memory>

#include <ranges>

#include <sstream>


namespace alpaka::onAcc

{


    template<typename T_IdxRange, typename T_ThreadSpace, typename T_IdxMapperFn, alpaka::concepts::CVector T_CSelect>


    class FlatIdxContainer : private T_IdxMapperFn

    {


        void _()

        {

            static_assert(std::ranges::forward_range<FlatIdxContainer>);

            static_assert(std::ranges::borrowed_range<FlatIdxContainer>);

            static_assert(std::ranges::range<FlatIdxContainer>);

            static_assert(std::ranges::input_range<FlatIdxContainer>);

        }


    public:

        using IdxType = typename T_IdxRange::IdxType;

        static constexpr uint32_t dim = T_IdxRange::dim();

        using IdxVecType = Vec<IdxType, dim>;


        ALPAKA_FN_ACC inline FlatIdxContainer(

            T_IdxRange const& idxRange,

            T_ThreadSpace const& threadSpace,

            T_IdxMapperFn idxMapping,

            T_CSelect const& = T_CSelect{})

            : T_IdxMapperFn{std::move(idxMapping)}

            , m_idxRange(idxRange)

            , m_threadSpace{threadSpace}

        {

            //  std::cout << "iter:" << m_idxRange.toString() << " " << m_threadSpace.toString() << std::endl;

        }


        constexpr FlatIdxContainer(FlatIdxContainer const&) = default;

        constexpr FlatIdxContainer(FlatIdxContainer&&) = default;


        class const_iterator;


        /** special implementation to define the end

         *

         * Only a scalar value must be stored which reduce the register footprint.

         * The definition of end is that the index is behind or equal to the extent of the slowest moving dimension.

         */


        class const_iterator_end

        {

            friend class FlatIdxContainer;


            void _()

            {

                static_assert(std::forward_iterator<const_iterator_end>);

                static_assert(std::input_iterator<const_iterator_end>);

            }


            ALPAKA_FN_ACC inline const_iterator_end(IdxType const& end) : m_extentSlowDim{end}

            {

            }


            constexpr IdxType operator*() const

            {

                return m_extentSlowDim;

            }


        public:


            constexpr bool operator==(const_iterator_end const& other) const

            {

                return (m_extentSlowDim == other.m_extentSlowDim);

            }


            constexpr bool operator!=(const_iterator_end const& other) const

            {

                return !(*this == other);

            }


            constexpr bool operator==(const_iterator const& other) const

            {

                return (m_extentSlowDim <= other.slowCurrent());

            }


            constexpr bool operator!=(const_iterator const& other) const

            {

                return !(*this == other);

            }


        private:

            IdxType m_extentSlowDim;

        };


        class const_iterator

        {

            friend class FlatIdxContainer;

            friend class const_iterator_end;


            static constexpr uint32_t iterDim = T_CSelect::dim();

            using IterIdxVecType = Vec<IdxType, iterDim>;


            void _()

            {

                static_assert(std::forward_iterator<const_iterator>);

                static_assert(std::input_iterator<const_iterator>);

            }


            constexpr const_iterator(

                alpaka::concepts::Vector auto offsetMD,

                IdxType const current,

                IdxType const stride,

                IdxType const end,

                alpaka::concepts::Vector auto const extentMD,

                alpaka::concepts::Vector auto const strideMD)

                : m_offsetMD{offsetMD}

                , m_current{current}

                , m_end{end}

                , m_stride{stride}

                , m_extentMD{extentMD}

                , m_strideMD{strideMD}

            {

            }


            ALPAKA_FN_ACC constexpr IdxType slowCurrent() const

            {

                return m_current;

            }


        public:


            constexpr IdxVecType operator*() const

            {

                auto result = m_offsetMD;

                result.ref(T_CSelect{}) += mapToND(m_extentMD, m_current) * m_strideMD;

                return result;

            }


            // pre-increment the iterator


            ALPAKA_FN_ACC inline const_iterator& operator++()

            {

                m_current += m_stride;

                return *this;

            }


            // post-increment the iterator


            ALPAKA_FN_ACC inline const_iterator operator++(int)

            {

                const_iterator old = *this;

                ++(*this);

                return old;

            }


            constexpr bool operator==(const_iterator const& other) const

            {

                return ((**this) == *other);

            }


            constexpr bool operator!=(const_iterator const& other) const

            {

                return !(*this == other);

            }


            constexpr bool operator==(const_iterator_end const& other) const

            {

                return (slowCurrent() >= *other);

            }


            constexpr bool operator!=(const_iterator_end const& other) const

            {

                return !(*this == other);

            }


        private:

            IdxVecType m_offsetMD;

            // modified by the pre/post-increment operator

            IdxType m_current;

            // non-const to support iterator copy and assignment

            IdxType m_end;

            IdxType m_stride;

            IterIdxVecType m_extentMD;

            IterIdxVecType m_strideMD;

        };


        ALPAKA_FN_ACC inline const_iterator begin() const

        {

            constexpr auto selectedDims = T_CSelect{};

            auto [threadIdx, numThreads] = m_threadSpace.mapTo(selectedDims);


            if constexpr(std::is_same_v<T_IdxMapperFn, layout::Strided>)

            {

                auto groupOffset = threadIdx * m_idxRange.m_stride;

                groupOffset.ref(selectedDims) -= groupOffset[selectedDims];


                auto begin = m_idxRange.m_begin + groupOffset;


                auto linearCurrent = linearize(numThreads[selectedDims], threadIdx[selectedDims]);

                auto linearStride = numThreads[selectedDims].product();

                auto strideMD = m_idxRange.m_stride[selectedDims];

                auto extentMD = divCeil(m_idxRange.distance()[selectedDims], strideMD);


                return const_iterator(begin, linearCurrent, linearStride, extentMD.product(), extentMD, strideMD);

            }

            else if constexpr(std::is_same_v<T_IdxMapperFn, layout::Contiguous>)

            {

                auto groupOffset = threadIdx * m_idxRange.m_stride;

                groupOffset.ref(selectedDims) -= groupOffset[selectedDims];


                auto begin = m_idxRange.m_begin + groupOffset;


                auto strideMD = m_idxRange.m_stride[selectedDims];

                auto extentMD = divCeil(m_idxRange.distance()[selectedDims], strideMD);


                auto threadCountMD = m_threadSpace.m_threadCount[selectedDims];


                auto numWorkerSlots = threadCountMD.product();

                auto linearSlotIdx = linearize(threadCountMD, threadIdx[selectedDims]);


                auto logicalExtent = extentMD.product();


                // elements per slot

                auto base = logicalExtent / numWorkerSlots;

                // remainder elements will be given to the slots with id lower than rem

                auto rem = logicalExtent % numWorkerSlots;


                auto nextLinearSlotIdx = linearSlotIdx + IdxType{1};


                auto linearCurrent = linearSlotIdx * base + std::min(linearSlotIdx, rem);

                auto linearEnd = nextLinearSlotIdx * base + std::min(nextLinearSlotIdx, rem);


                return const_iterator(

                    begin,

                    linearCurrent,

                    IdxType{1u},

                    std::min(linearEnd, logicalExtent),

                    extentMD,

                    strideMD);

            }

        }


        ALPAKA_FN_ACC inline const_iterator_end end() const

        {

            constexpr auto selectedDims = T_CSelect{};

            auto [threadIdx, numThreads] = m_threadSpace.mapTo(selectedDims);


            if constexpr(std::is_same_v<T_IdxMapperFn, layout::Strided>)

            {

                auto extentMD = divCeil(m_idxRange.distance()[selectedDims], m_idxRange.m_stride[selectedDims]);

                return const_iterator_end(extentMD.product());

            }

            else if constexpr(std::is_same_v<T_IdxMapperFn, layout::Contiguous>)

            {

                auto strideMD = m_idxRange.m_stride[selectedDims];

                auto extentMD = divCeil(m_idxRange.distance()[selectedDims], strideMD);


                auto numWorkerSlots = numThreads[selectedDims].product();

                auto linearSlotIdx = linearize(numThreads[selectedDims], threadIdx[selectedDims]);


                auto logicalExtent = extentMD.product();


                // elements per slot

                auto base = logicalExtent / numWorkerSlots;

                // remainder elements will be given to the slots with id lower than rem

                auto rem = logicalExtent % numWorkerSlots;


                auto nextLinearSlotIdx = linearSlotIdx + IdxType{1};

                auto linearEnd = nextLinearSlotIdx * base + std::min(nextLinearSlotIdx, rem);


                return const_iterator_end(std::min(linearEnd, logicalExtent));

            }

        }


        ALPAKA_FN_HOST_ACC constexpr auto operator[](alpaka::concepts::CVector auto const iterDir) const

        {

            return FlatIdxContainer<T_IdxRange, T_ThreadSpace, T_IdxMapperFn, ALPAKA_TYPEOF(iterDir)>(

                m_idxRange,

                m_threadSpace,

                T_IdxMapperFn{});

        }


    private:

        T_IdxRange m_idxRange;

        T_ThreadSpace m_threadSpace;

    };


} // namespace alpaka::onAcc

Dict.hpp

PP.hpp

ThreadSpace.hpp

Vec.hpp

api.hpp

alpaka::onAcc::FlatIdxContainer::const_iterator_end
special implementation to define the end
Definition FlatIdxContainer.hpp:65

alpaka::onAcc::FlatIdxContainer::const_iterator_end::m_extentSlowDim
IdxType m_extentSlowDim
Definition FlatIdxContainer.hpp:105

alpaka::onAcc::FlatIdxContainer::const_iterator_end::operator==
constexpr bool operator==(const_iterator_end const &other) const
Definition FlatIdxContainer.hpp:84

alpaka::onAcc::FlatIdxContainer::const_iterator_end::operator*
constexpr IdxType operator*() const
Definition FlatIdxContainer.hpp:78

alpaka::onAcc::FlatIdxContainer::const_iterator_end::const_iterator_end
ALPAKA_FN_ACC const_iterator_end(IdxType const &end)
Definition FlatIdxContainer.hpp:74

alpaka::onAcc::FlatIdxContainer::const_iterator_end::FlatIdxContainer
friend class FlatIdxContainer
Definition FlatIdxContainer.hpp:66

alpaka::onAcc::FlatIdxContainer::const_iterator_end::operator==
constexpr bool operator==(const_iterator const &other) const
Definition FlatIdxContainer.hpp:94

alpaka::onAcc::FlatIdxContainer::const_iterator_end::_
void _()
Definition FlatIdxContainer.hpp:68

alpaka::onAcc::FlatIdxContainer::const_iterator_end::operator!=
constexpr bool operator!=(const_iterator_end const &other) const
Definition FlatIdxContainer.hpp:89

alpaka::onAcc::FlatIdxContainer::const_iterator_end::operator!=
constexpr bool operator!=(const_iterator const &other) const
Definition FlatIdxContainer.hpp:99

alpaka::onAcc::FlatIdxContainer::const_iterator
Definition FlatIdxContainer.hpp:109

alpaka::onAcc::FlatIdxContainer::const_iterator::const_iterator
constexpr const_iterator(alpaka::concepts::Vector auto offsetMD, IdxType const current, IdxType const stride, IdxType const end, alpaka::concepts::Vector auto const extentMD, alpaka::concepts::Vector auto const strideMD)
Definition FlatIdxContainer.hpp:122

alpaka::onAcc::FlatIdxContainer::const_iterator::m_stride
IdxType m_stride
Definition FlatIdxContainer.hpp:192

alpaka::onAcc::FlatIdxContainer::const_iterator::operator!=
constexpr bool operator!=(const_iterator const &other) const
Definition FlatIdxContainer.hpp:171

alpaka::onAcc::FlatIdxContainer::const_iterator::operator++
ALPAKA_FN_ACC const_iterator & operator++()
Definition FlatIdxContainer.hpp:152

alpaka::onAcc::FlatIdxContainer::const_iterator::operator++
ALPAKA_FN_ACC const_iterator operator++(int)
Definition FlatIdxContainer.hpp:159

alpaka::onAcc::FlatIdxContainer::const_iterator::operator==
constexpr bool operator==(const_iterator const &other) const
Definition FlatIdxContainer.hpp:166

alpaka::onAcc::FlatIdxContainer::const_iterator::m_end
IdxType m_end
Definition FlatIdxContainer.hpp:191

alpaka::onAcc::FlatIdxContainer::const_iterator::m_extentMD
IterIdxVecType m_extentMD
Definition FlatIdxContainer.hpp:193

alpaka::onAcc::FlatIdxContainer::const_iterator::slowCurrent
ALPAKA_FN_ACC constexpr IdxType slowCurrent() const
Definition FlatIdxContainer.hpp:138

alpaka::onAcc::FlatIdxContainer::const_iterator::operator!=
constexpr bool operator!=(const_iterator_end const &other) const
Definition FlatIdxContainer.hpp:181

alpaka::onAcc::FlatIdxContainer::const_iterator::IterIdxVecType
Vec< IdxType, iterDim > IterIdxVecType
Definition FlatIdxContainer.hpp:114

alpaka::onAcc::FlatIdxContainer::const_iterator::m_offsetMD
IdxVecType m_offsetMD
Definition FlatIdxContainer.hpp:187

alpaka::onAcc::FlatIdxContainer::const_iterator::_
void _()
Definition FlatIdxContainer.hpp:116

alpaka::onAcc::FlatIdxContainer::const_iterator::operator*
constexpr IdxVecType operator*() const
Definition FlatIdxContainer.hpp:144

alpaka::onAcc::FlatIdxContainer::const_iterator::m_current
IdxType m_current
Definition FlatIdxContainer.hpp:189

alpaka::onAcc::FlatIdxContainer::const_iterator::FlatIdxContainer
friend class FlatIdxContainer
Definition FlatIdxContainer.hpp:110

alpaka::onAcc::FlatIdxContainer::const_iterator::iterDim
static constexpr uint32_t iterDim
Definition FlatIdxContainer.hpp:113

alpaka::onAcc::FlatIdxContainer::const_iterator::operator==
constexpr bool operator==(const_iterator_end const &other) const
Definition FlatIdxContainer.hpp:176

alpaka::onAcc::FlatIdxContainer::const_iterator::m_strideMD
IterIdxVecType m_strideMD
Definition FlatIdxContainer.hpp:194

alpaka::onAcc::FlatIdxContainer::const_iterator::const_iterator_end
friend class const_iterator_end
Definition FlatIdxContainer.hpp:111

alpaka::onAcc::FlatIdxContainer::FlatIdxContainer
constexpr FlatIdxContainer(FlatIdxContainer const &)=default

alpaka::onAcc::FlatIdxContainer::operator[]
ALPAKA_FN_HOST_ACC constexpr auto operator[](alpaka::concepts::CVector auto const iterDir) const
Definition FlatIdxContainer.hpp:285

alpaka::onAcc::FlatIdxContainer::FlatIdxContainer
ALPAKA_FN_ACC FlatIdxContainer(T_IdxRange const &idxRange, T_ThreadSpace const &threadSpace, T_IdxMapperFn idxMapping, T_CSelect const &=T_CSelect{})
Definition FlatIdxContainer.hpp:42

alpaka::onAcc::FlatIdxContainer::end
ALPAKA_FN_ACC const_iterator_end end() const
Definition FlatIdxContainer.hpp:253

alpaka::onAcc::FlatIdxContainer::m_idxRange
T_IdxRange m_idxRange
Definition FlatIdxContainer.hpp:294

alpaka::onAcc::FlatIdxContainer::begin
ALPAKA_FN_ACC const_iterator begin() const
Definition FlatIdxContainer.hpp:197

alpaka::onAcc::FlatIdxContainer::_
void _()
Definition FlatIdxContainer.hpp:29

alpaka::onAcc::FlatIdxContainer::m_threadSpace
T_ThreadSpace m_threadSpace
Definition FlatIdxContainer.hpp:295

alpaka::onAcc::FlatIdxContainer::IdxType
typename T_IdxRange::IdxType IdxType
Definition FlatIdxContainer.hpp:38

alpaka::onAcc::FlatIdxContainer::dim
static constexpr uint32_t dim
Definition FlatIdxContainer.hpp:39

alpaka::onAcc::FlatIdxContainer::FlatIdxContainer
constexpr FlatIdxContainer(FlatIdxContainer &&)=default

alpaka::onAcc::FlatIdxContainer::IdxVecType
Vec< IdxType, dim > IdxVecType
Definition FlatIdxContainer.hpp:40

common.hpp

ALPAKA_FN_ACC
#define ALPAKA_FN_ACC
All functions that can be used on an accelerator have to be attributed with ALPAKA_FN_ACC or ALPAKA_F...
Definition common.hpp:31

ALPAKA_FN_HOST_ACC
#define ALPAKA_FN_HOST_ACC
All functions that can be used on an accelerator have to be attributed with ALPAKA_FN_ACC or ALPAKA_F...
Definition common.hpp:32

alpaka::concepts::CVector
Concept to check if a type is a CVector.
Definition Vec.hpp:75

alpaka::concepts::Vector
Concept to check if a type is a vector.
Definition Vec.hpp:54

layout.hpp

alpaka::onAcc
functionality which is usable on the accelerator compute device from within a kernel.
Definition executor.hpp:38

alpaka::divCeil
ALPAKA_FN_HOST_ACC constexpr auto divCeil(Integral a, Integral b) -> Integral
Returns the ceiling of a / b, as integer.
Definition utility.hpp:34

alpaka::linearize
constexpr T_IntegralType linearize(Vec< T_IntegralType, T_dim - 1u, T_Storage > const &dim, Vec< T_IntegralType, T_dim, T_OtherStorage > const &idx)
Give the linear index of an N-dimensional index within an N-dimensional index space.
Definition Vec.hpp:839

alpaka::mapToND
constexpr Vec< T_IntegralType, T_dim > mapToND(Vec< T_IntegralType, T_dim, T_Storage > const &extents, T_IntegralType linearIdx)
Maps a linear index to an N-dimensional index.
Definition Vec.hpp:880

std
STL namespace.

alpaka::Vec
Definition Vec.hpp:179

tag.hpp

utility.hpp