Du paramétrage de la granularité du calcul et de la localité des données des implémentations sur GPU - Expérimentations OpenCL
Abstract
OpenCL est un framework permettant la programmation unifiée de plateformes parallèles, notamment les GPU. Cependant, le nombre de plateformes programmables avec ce framework rend difficile l'optimisation des programmes pour améliorer les performances de manière portable. Le paramétrage de la granularité du calcul et de la localité spatiale des données reste possible et l'utilisation avertie de ces paramètres peut permettre d'accélérer une implémentation parallèle. Ce papier décrit comment l'utilisation des ressources de calcul a travers OpenCL peut permettre d'améliorer les performances du programme sur différentes plateformes parallèles, en particulier sur un CPU et un GPU.