eurosys－Haibin's blog

标签： eurosys article list

2 articles

Eurosys24 Orion – GPU Kernel Scheduling for ML Inference

Paper Orion: Interference-aware, Fine-grained GPU Sharing for ML Applications Github eth-easl/orion: An interference-aware scheduler for fine-grained GPU sharing Abstract GPUs are critical for maximiz

Paper Reading
Haibin
2025-10-10
874 Views
0 Comments

Eurosys 25 Skyserve

来自大名鼎鼎的UCB Sky Computing Lab 他们尝试在云里运行LLM Serve 然后他们考虑的场景是 Spot inference。这个场景类似于云的instance很吃紧，然后会经常的扩增和缩小。在这种动态场景下做一个能fault tolerance, load balance的一个推理引擎调度系统。 AI也是微服务 Sky serve 首先把LLM服务当成微服务看待。在这种情况

Paper Reading
Haibin
2025-07-30
295 Views
0 Comments