H200 GPU Archives - LT Tech Blog

Chips for AI (NVIDIA/AMD/TPU) GenAI (models, assistants)

vLLM large-scale serving hits 2.2k tok/s per H200 with Wide-EP

TL;DR vLLM’s V1 engine and a set of runtime optimizations pushed multi-node DeepSeek-style MoE inference to 2.2k tokens/second per H200…

January 14, 2026

You missed

AI & Machine Learning AI Regulation & Safety

How Major AI Labs Shifted Toward US Military Partnerships, 2024–25

January 14, 2026

Consumer Tech & Gadgets Reviews

Merach Vibration Plate Review: A Hilarious, Surprisingly Useful Vibe Workout

January 14, 2026

Big Tech Consumer Tech & Gadgets

I’m Hunting for Dumb Tech in 2026 — Time to Choose Simpler Devices

January 14, 2026

MBCompass: Tiny FOSS Compass and Navigation App for Android (<2MB)

January 14, 2026