Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

RelaxingSnorlax updated a model about 23 hours ago

inference-optimization/dflash-DeepSeek-V4-Flash-all-swa-muon-speculators-online-500k

RelaxingSnorlax published a model about 23 hours ago

inference-optimization/dflash-DeepSeek-V4-Flash-all-swa-muon-speculators-online-500k

kylesayrs updated a collection 1 day ago

View all activity

Collections 2

models 186

inference-optimization/dflash-DeepSeek-V4-Flash-all-swa-muon-speculators-online-500k

2B • Updated about 23 hours ago

inference-optimization/GLM-5.2-0.8B-A0.8B

Text Generation • 0.8B • Updated 1 day ago

inference-optimization/Ornith-1.0-9B-FP8-Dynamic

Text Generation • 9B • Updated 1 day ago

inference-optimization/Qwen3.5-397B-A17B-FP8-dynamic-speculator.dflash

2B • Updated 1 day ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-muon-ckpt5

2B • Updated 1 day ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step420136

2B • Updated 3 days ago • 56

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-muon-ckpt4

2B • Updated 4 days ago • 17

inference-optimization/Qwen3-8B-FP8-Dynamic

Text Generation • 8B • Updated 4 days ago • 15

inference-optimization/Qwen3-8B-speculator.dflash.fullattn-qwen235b-instruct-bs16-ckpt0

2B • Updated 4 days ago • 23

inference-optimization/dflash-DeepSeek-V4-Flash-swa-muon-speculators-50k

2B • Updated 5 days ago • 125

View 186 models

datasets 26

inference-optimization/every-eval-ever-demo

Viewer • Updated 17 days ago • 1 • 59

inference-optimization/DeepSeek-V4-Flash-responses

Viewer • Updated 17 days ago • 508k • 50

inference-optimization/Qwen3.5-4B-responses

Viewer • Updated 23 days ago • 7.47k • 102

inference-optimization/Qwen3.5-0.8B-responses

Viewer • Updated 29 days ago • 7.47k • 175

inference-optimization/Qwen3.5-9B-responses

Viewer • Updated 29 days ago • 7.67k • 79

inference-optimization/Qwen3-8B-Regenerated-Collection

Preview • Updated about 1 month ago • 179

inference-optimization/Qwen3-30B-A3B-responses

Preview • Updated about 1 month ago • 64

inference-optimization/gpt-oss-120b-responses

Preview • Updated about 1 month ago • 21

inference-optimization/Qwen3-32B-responses

Preview • Updated about 1 month ago • 43

inference-optimization/ctest-Qwen3.6-27B-speculator-dataset

Viewer • Updated May 28 • 5.61k • 50 • 1

View 26 datasets