Skip to content

lzyrapx/LeetGPU

Folders and files

NameName
Last commit message
Last commit date

Latest commit

ย 

History

106 Commits
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 

Repository files navigation

๐Ÿš€ LeetGPU Solutions & Progress Tracker

๐Ÿ”— Profile:lzyrapx on LeetGPU | ๐ŸŽฏ Challenges: LeetGPU Challenges

Progress Summary: Actively conquering GPU programming challenges across multiple frameworks. Currently focusing heavily on CUDA and PyTorch, with ongoing explorations into modern compilers and languages like Triton, Mojo, and TinyGrad.


๐Ÿงฎ Matrix & Linear Algebra

Core BLAS operations, matrix manipulation, and quantized variations.

Problems CUDA PyTorch Triton Mojo TinyGrad Cute DSL
Batched Matrix Multiplication โœ… โœ…
Dot Product โœ… โœ…
FP16 Batched Matrix Multiplication โœ…
FP16 Dot Product โœ…
GEMM (FP16) โœ… โœ…
INT8 Quantized MatMul โœ… โœ…
Matrix Addition โœ…
Matrix Copy โœ… โœ… โœ…
Matrix Multiplication โœ… โœ… โœ… โœ… โœ… โœ…
Matrix Power โœ…
Matrix Transpose โœ… โœ… โœ… โœ… โœ…
Sparse Matrix-Vector Multiplication โœ… โœ…

๐Ÿง  Deep Learning & Neural Network Layers

Attention mechanisms, normalizations, activations, and modern LLM kernels.

Problems CUDA PyTorch Triton Mojo TinyGrad Cute DSL
Attention with Linear Biases โœ…
Batch Normalization โœ…
Categorical Cross Entropy Loss โœ… โœ…
Gaussian Error Gated Linear Unit โœ…
Leaky ReLU โœ… โœ… โœ…
Linear Self-Attention โœ…
LoRA Linear โœ…
Mean Squared Error โœ… โœ…
Multi-Head Self-Attention โœ…
ReLU โœ… โœ… โœ…
RMS Normalization โœ…
Rotary Positional Embedding โœ…
Sigmoid Activation โœ…
Sigmoid Linear Unit โœ…
Simple Inference โœ…
Sliding Window Self-Attention โœ…
Softmax โœ… โœ…
Softmax Attention โœ… โœ…
Swish-Gated Linear Unit โœ…
Weight Dequantization โœ…

๐Ÿ–ผ๏ธ Convolutions, Image & Signal Processing

Filtering, FFT, max pooling, and spatial transformations.

Problems CUDA PyTorch Triton Mojo TinyGrad Cute DSL
1D Convolution โœ… โœ… โœ… โœ… โœ…
2D Convolution โœ… โœ…
2D Max Pooling โœ…
3D Convolution โœ…
Color Inversion โœ… โœ… โœ… โœ…
Fast Fourier Transform โœ…
Gaussian Blur โœ… โœ…
RGB to Grayscale โœ…

๐Ÿงฉ Core Algorithms, Memory & Arrays

Parallel reductions, prefix sums, sorting, and array manipulations.

Problems CUDA PyTorch Triton Mojo TinyGrad Cute DSL
2D Subarray Sum โœ…
3D Subarray Sum โœ…
Count Array Element โœ… โœ…
Count 2D Array Element โœ… โœ…
Count 3D Array Element โœ…
Histogramming โœ… โœ…
Interleave Arrays โœ…
Max Subarray Sum โœ…
Merge Sorted Arrays โœ…
Parallel Merge โœ…
Prefix Sum โœ… โœ…
Radix Sort โœ… โœ…
Reduction โœ… โœ…
Reverse Array โœ… โœ… โœ…
Sorting โœ… โœ…
Subarray Sum โœ…
Top-K Selection โœ… โœ…
Value Clipping โœ…
Vector Addition โœ… โœ… โœ… โœ… โœ… โœ…

โš™๏ธ Machine Learning, Graph & Others

Stencils, regressions, graph traversal, and simulation algorithms.

Problems CUDA PyTorch Triton Mojo TinyGrad Cute DSL
2D Jacobi Stencil โœ…
All-Pairs Shortest Paths โœ…
BFS Shortest Path โœ…
K-Means Clustering โœ…
Linear Recurrence โœ…
Logistic Regression โœ… โœ…
Monte Carlo Integration โœ… โœ… โœ…
Multi-Agent Simulation โœ…
Nearest Neighbor โœ…
Ordinary Least Squares โœ… โœ…
Password Cracking โœ…
Rainbow Table โœ… โœ… โœ…

About

๐ŸŒˆ Solutions of LeetGPU

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors