Conferences | USENIX

Search results

Title	Conference	Speaker(s)
PPipe: Efficient Video Analytics Serving on Heterogeneous GPU Clusters via Pool-Based Pipeline Parallelism	USENIX ATC '25	Z. Jonny Kong, Qiang Xu, Y. Charlie Hu
Voltrix: Sparse Matrix-Matrix Multiplication on Tensor Cores with Asynchronous and Balanced Kernel Optimization	USENIX ATC '25	Yaqi Xia, Weihu Wang, Donglin Yang, Xiaobo Zhou, Dazhao Cheng
GREYHOUND: Hunting Fail-Slows in Hybrid-Parallel Training at Scale	USENIX ATC '25	Tianyuan Wu, Wei Wang, Yinghao Yu, Siran Yang, Wenchao Wu, Qinkai Duan, Guodong Yang, Jiamang Wang, Lin Qu, Liping Zhang
LEOCraft: Towards Designing Performant LEO Networks	USENIX ATC '25	Suvam Basak, Amitangshu Pal, Debopam Bhattacherjee
Fast Distributed Transactions for RDMA-based Disaggregated Memory	USENIX ATC '25	Haodi Lu, Haikun Liu, Yujian Zhang, Zhuohui Duan, Xiaofei Liao, Hai Jin, Yu Zhang
Katz: Efficient Workflow Serving for Diffusion Models with Many Adapters	USENIX ATC '25	Suyi Li, Lingyun Yang, Xiaoxiao Jiang, Hanfeng Lu, Dakai An, Zhipeng Di, Weiyi Lu, Jiawei Chen, Kan Liu, Yinghao Yu, Tao Lan, Guodong Yang, Lin Qu, Liping Zhang, Wei Wang
CrossPipe: Towards Optimal Pipeline Schedules for Cross-Datacenter Training	USENIX ATC '25	Tiancheng Chen, Ales Kubicek, Langwen Huang, Torsten Hoefler
Unveiling Compiler Faults via Attribute-Guided Compilation Space Exploration	USENIX ATC '25	Jiangchang Wu, Yibiao Yang, Maolin Sun, Yuming Zhou
Understanding and Detecting Fail-Slow Hardware Failure Bugs in Cloud Systems	USENIX ATC '25	Gen Dong, Yu Hua, Yongle Zhang, Zhangyu Chen, Menglei Chen
Para-ksm: Parallelized Memory Deduplication with Data Streaming Accelerator	USENIX ATC '25	Houxiang Ji, Minho Kim, Seonmu Oh, Daehoon Kim, Nam Sung Kim
DSA-2LM: A CPU-Free Tiered Memory Architecture with Intel DSA	USENIX ATC '25	Ruili Liu, Teng Ma, Mingxing Zhang, Jialiang Huang, Yingdi Shan, Zheng Liu, Lingfeng Xiang, Zhen Lin, Hui Lu, Jia Rao, Kang Chen, Yongwei Wu
Turbocharge ANNS on Real Processing-in-Memory by Enabling Fine-Grained Per-PIM-Core Scheduling	USENIX ATC '25	Puqing Wu, Minhui Xie, Enrui Zhao, Dafang Zhang, Jing Wang, Xiao Liang, Kai Ren, Yunpeng Chai
ShieldReduce: Fine-Grained Shielded Data Reduction	USENIX ATC '25	Jingyuan Yang, Jun Wu, Ruilin Wu, Jingwei Li, Patrick P. C. Lee, Xiong Li, Xiaosong Zhang
Separate but Together: Integrating Remote Attestation into TLS	USENIX ATC '25	Carsten Weinhold, Muhammad Usama Sardar, Ionuț Mihalcea, Yogesh Deshpande, Hannes Tschofenig, Yaron Sheffer, Thomas Fossati, Michael Roitzsch
SpaceExit: Enabling Efficient Adaptive Computing in Space with Early Exits	USENIX ATC '25	Jiacheng Liu, Xiaozhi Zhu, Tongqiao Xu, Xiaofeng Hou, Chao Li
XRT: An Accelerator-Aware Runtime for Accelerated Chip Multiprocessors	USENIX ATC '25	Neel Patel, Mohammad Alian
Revealing Floating-Point Accumulation Orders in Software/Hardware Implementations	USENIX ATC '25	Peichen Xie, Yanjie Gao, Yang Wang, Jilong Xue
IRHash: Efficient Multi-Language Compiler Caching by IR-Level Hashing	USENIX ATC '25	Tobias Landsberg, Johannes Grunenberg, Christian Dietrich, Daniel Lohmann
On-Demand Container Partitioning for Distributed ML	USENIX ATC '25	Giovanni Bartolomeo, Navidreza Asadi, Wolfgang Kellerer, Jorg Ott, Nitinder Mohan
Universal Checkpointing: A Flexible and Efficient Distributed Checkpointing System for Large-Scale DNN Training with Reconfigurable Parallelism	USENIX ATC '25	Xinyu Lian, Sam Ade Jacobs, Lev Kurilenko, Masahiro Tanaka, Stas Bekman, Olatunji Ruwase, Minjia Zhang
SAVE: Software-Implemented Fault Tolerance for Model Inference against GPU Memory Bit Flips	USENIX ATC '25	Wenxin Zheng, Bin Xu, Jinyu Gu, Haibo Chen
Resource Multiplexing in Tuning and Serving Large Language Models	USENIX ATC '25	Yongjun He, Haofeng Yang, Yao Lu, Ana Klimovic, Gustavo Alonso
Colocating ML Inference and Training with Fast GPU Memory Handover	USENIX ATC '25	Jiali Wang, Yankui Wang, Mingcong Han, Rong Chen
Tigon: A Distributed Database for a CXL Pod	OSDI '25	Yibo Huang, Haowei Chen, Newton Ni, Yan Sun, Vijay Chidambaram, Dixin Tang, Emmett Witchel
Achieving Low-Latency Graph-Based Vector Search via Aligning Best-First Search Algorithm with SSD	OSDI '25	Hao Guo, Youyou Lu

Pages

Printable Calendar | Google Calendar