Blogs | Hao AI Lab @ UCSD

STA Sliding visialization

Fast Video Generation with Sliding Tile Attention

February 18, 2025

Peiyuan Zhang, Yongqi Chen*, Runlong Su*, Hangliang Ding, Ion Stoica, Zhengzhong Liu, Hao Zhang

demo-dynasor

Dynasor: More Efficient Chain-of-Thought Through Certainty Probing

February 16, 2025

Yichao Fu*, Junda Chen*, Yonghao Zhuang, Zheyu Fu, Ion Stoica, Hao Zhang

ai_space_escape

GameArena: Evaluating LLM Reasoning through Live Computer Games

February 10, 2025

Game Arena Team

llm-ltr-cover

Efficient LLM Scheduling by Learning to Rank

January 13, 2025

Yichao Fu, Siqi Zhu, Runlong Su, Aurick Qiao, Ion Stoica, Hao Zhang

MuxServe

MuxServe: Flexible Spatial-Temporal Multiplexing for Multiple LLM Serving

May 20, 2024

Jiangfei Duan, Runyu Lu, Haojie Duanmu, Xiuhong Li, Xingcheng Zhang, Dahua Lin, Ion Stoica, Hao Zhang

jacobi trajectory

Consistency Large Language Models: A Family of Efficient Parallel Decoders

May 6, 2024

Siqi Kou*, Lanxiang Hu*, Zhezhi He, Zhijie Deng, Hao Zhang

DistServe

Throughput is Not All You Need: Maximizing Goodput in LLM Serving using Prefill-Decode Disaggregation

March 17, 2024

Junda Chen, Yinmin Zhong, Shengyu Liu, Yibo Zhu, Xin Jin, Hao Zhang