parameter optimization | Digital Mind News

NVIDIA

Zyphra's ZAYA1-8B achieves GPT-5 performance with just 760M active parameters, while Subquadratic claims 1,000x efficiency gains…

2026-05-11

AI

Researchers introduce Train-to-Test scaling laws that optimize AI models by jointly considering training costs and inference…

2026-04-23

AI

Researchers introduce Train-to-Test scaling laws that optimize AI model architecture by jointly considering training and inference…

2026-04-22

AI

Researchers introduce Train-to-Test scaling laws that optimize AI model efficiency by training smaller models on more…

2026-04-20