Publications

Selected Publications

WWW.Serve: Interconnecting Global LLM Services through Decentralization
Huanyu Wang, Ziyu Xia, Zhuoming Chen, Beidi Chen
ICML 2026 Conference Submission

2026.01
Fourier-VLM: Compressing Vision Tokens in the Frequency Domain for Large Vision-Language Models
Huanyu Wang, Jushi Kai, Haoli Bai, Lu Hou, Bo Jiang, Ziwei He, Zhouhan Lin
[Paper]

2025.08

One Size Does Not Fit All: Token-Wise Adaptive Compression for KV Cache
Liming Lu, Kaixi Qiu, Jiayu Zhou, Jushi Kai, Haoyan Zhang, Huanyu Wang, Jingwen Leng, Ziwei He, Zhouhan Lin
[Paper]

2026.03
LoMo: Longer and More Videos Benchmark for Understanding and Temporal Grounding Tasks
Chengyang Hu, Xinyu Zhou, Huanyu Wang, Danyu Shen, Ran Yi, Mengtian Li, Lizhuang Ma
[Dataset]

2025.05