Алгоритмы QD арифметики высокой точности на CUDA для работы с матрицами
Аннотация:
Исследована эффективность библиотеки QD для работы с числами с длинной мантиссой на графических ускорителях Tesla C1060, GeForce GTX480, Tesla C2050. К библиотеке добавлены алгоритмы на CUDA для основных операций линейной алгебры. Алгоритмы оптимизированы для получения максимальной производительности. Получено, что Tesla C2050 может ускорять вычисления с матрицами в арифметике высокой точности до 100 раз; результат близок к предельному, поскольку почти такое же ускорение имеют и сами арифметические операции с quad-double.