北京大学数据与智能实验室(pku-dair) 2025年度总结
2025年,实验室在科研创新与团队协作方面持续深耕,取得一系列扎实成果。师生在探索与实践中共同成长,多个项目获得重要进展。感谢各位朋友一直以来的支持,期待新一年继续携手前行!
2025年1月回顾
2025年1月,我组成员7项成果被录用。
【论文录用】
- 我组博士生刘新一、王驭捷等合作的一篇论文被iclr 2025录用;
- 我组博士生覃彦钊的一篇论文被iclr 2025录用;
- 我组博士生杨灵的两篇论文被iclr 2025录用;
- 我组科研实习生王子豪的一篇论文被iclr 2025录用;
- 我组博士生王驭捷和硕士生竺沈涵等合作的两篇论文被asplos 2025录用。
【论文汇总】
- xinyi liu, yujie wang, fangcheng fu, xupeng miao, shenhan zhu, xiaonan nie, bin cui: "netmoe: accelerating moe training through dynamic sample placement", iclr 2025 (spotlight)
- yanzhao qin, tao zhang, tao zhang, yanjun shen, wenjing luo, haoze sun, yan zhang, yujing qiao, weipeng chen, zenan zhou, wentao zhang, bin cui:" sysbench: can large language models follow system messages?", iclr 2025
- xinchen zhang, ling yang, guohao li, yaqi cai, jiake xie, yong tang, yujiu yang, mengdi wang, bin cui: "itercomp: iterative composition-aware feedback learning from model gallery for text-to-image generation", iclr 2025
- ling yang, zhaochen yu, tianjun zhang, minkai xu, joseph e. gonzalez, bin cui, shuicheng yan, "supercorrect: supervising and correcting language models with error-driven insights", iclr 2025
- zihao wang, bin cui, shaoduo gan,"squeezeattention: 2d management of kv-cache in llm inference via layer-wise optimal budget", iclr 2025
- yujie wang, shenhan zhu, fangcheng fu, xupeng miao, jie zhang, juan zhu, fan hong, yong li, bin cui: spindle: "efficient distributed training of multi-task large models via wavefront scheduling", asplos 2025
- yujie wang, shiju wang, shenhan zhu, fangcheng fu, xinyi liu, xuefeng xiao, huixia li, jiashi li, faming wu, bin cui: "flexsp: accelerating large language model training via flexible sequence parallelism", asplos 2025
2025年2月回顾
2025年2月,我组成员2项成果被录用。
【论文录用】
- 我组博士生李昊洋,硕士生葛浩等合作的一篇论文被sigmod 2025录用;
- 我组博士生张海林,硕士生季晓东等合作的一篇论文被sigmod 2025录用。
【论文汇总】
- haoyang li, fangcheng fu, hao ge, sheng lin, xuanyu wang, jiawen niu, yujie wang, hailin zhang, xiaonan nie, bin cui: malleus: "straggler-resilient hybrid parallel training of large-scale models via malleable data and model parallelization", sigmod 2025
- hailin zhang, xiaodong ji, yilin chen, fangcheng fu, xupeng miao, xiaonan nie, weipeng chen, bin cui: "pqcache: product quantization-based kvcache for long context llm inference", sigmod 2025
2025年3月回顾
2025年3月,我组成员2项成果被录用。
【论文录用】
- 我组博士生黄世悦,硕士生王子威等的论文被tkde录用;
- 我组2024届博士沈彧,硕士生徐贝澄、博士生陆宇鹏等合作的一篇论文被icde 2025录用。
【论文汇总】
- shiyue huang, ziwei wang, yinjun wu, yaofeng tu, jiankai wang, bin cui: "opdiag: unveiling database performance anomalies through query operator attribution", tkde 2025
- yu shen, beicheng xu, yupeng lu, donghui chen, huaijun jiang, zhipeng xie, senbo fu, nan zhang, yuxin ren, ning jia, xinwei hu, bin cui: "a-tune-online: efficient and qos-aware online configuration tuning for dynamic workloads", icde 2025
【荣誉奖项】
祝贺我组博士生张海林、陈伯轩等发表于sigmod 2024的论文荣获sigmod 2024 honorable mention for best artifact奖。
sigmod会议是数据库领域最具影响力的顶级国际学术会议之一,与vldb和icde并称为数据库领域的三大顶级会议。pku-dair实验室发表于sigmod 2024的研究成果《cafe: towards compact, adaptive, and fast embedding for large-scale recommendation models》荣获sigmod 2024 honorable mention for best artifact奖,该奖项每年仅授予至多三篇文章,旨在表彰那些在可复现性、灵活性和可移植性方面表现卓越的研究工作。
【学术活动】
2025年3月30日至4月3日,我组博士生王驭捷、硕士生竺沈涵前往荷兰鹿特丹参加国际学术会议asplos 2025,并在会议期间就其研究成果进行学术报告。

图1. asplos 2025会议合影
2025年4月回顾
2025年4月,我组成员2项成果被录用。
【论文录用】
- 我组硕士生林晟、博士生李昊洋等合作的一篇论文被vldb 2025论文录用。
- 我组硕士生葛浩的一篇论文被sigcomm 2025论文录用。
【论文汇总】
- sheng lin, fangcheng fu, haoyang li, hao ge, xuanyu wang, jiawen niu, yaofeng tu, bin cui:"lobra: multi-tenant fine-tuning over heterogeneous data", vldb 2025
- hao ge, junda feng, qi huang, fangcheng fu, xiaonan nie, lei zuo, haibin lin, bin cui, xin liu: "bytescale: communication-efficient scaling of llm training with a 2048k context length on 16384 gpus", sigcomm 2025
【学术活动】
2025年4月24日至28日,我组博士生王驭捷、覃彦钊与刘新一前往新加坡参加国际学术会议iclr 2025,并在会议期间就其研究成果进行学术报告。

图2. iclr 2025会议合影
2025年5月回顾
2025年5月,我组成员2项成果被录用。
【论文录用】
- 我组博士生盛则昂的一篇论文被kdd 2025 录用;
- 我组博士后赖沛超的一篇论文被acl 2025录用;
【论文汇总】
- zeang sheng, weiyang guo, yingxia shao, wentao zhang, bin cui: "llms are noisy oracles! llm-based noise-aware graph active learning for node classification", kdd 2025
- peichao lai, zhengfeng zhang, wentao zhang, fangcheng fu, bin cui: "enhancing unsupervised sentence embeddings via knowledge-driven data augmentation and gaussian-decayed contrastive learning", acl 2025
【学术活动】
2025年5月19日至5月23日,我组硕士生沈思绮、徐贝澄前往中国香港参加国际学术会议icde 2025,并在会议期间就其研究成果进行学术报告。

图3. 沈思绮在icde 2025作学术报告

图4. 徐贝澄在icde 2025作学术报告
2025年6月回顾
2025年6月,我组成员1项成果被录用。
【论文录用】
我组博士生夏义扉、本科生凌宿寒等合作的一篇论文被iccv 2025录用。
【论文汇总】
- yifei xia, suhan ling, fangcheng fu, yujie wang, huixia li, xuefeng xiao, bin cui: "training-free and adaptive sparse attention for efficient long video generation", iccv 2025
【学术活动】
2025年6月22日至6月27日,我组博士生李昊洋、硕士生季晓东前往德国柏林参加国际学术会议sigmod 2025,会议期间就其研究成果进行学术报告。

图5. sigmod 2025会议合影
2025年7月回顾
2025年7月,我组成员获得多个荣誉奖项。
【荣誉奖项】
- 我组博士生张海林获评北京大学2025年优秀博士学位论文,指导教师为崔斌教授。
- 我组本科生凌宿寒获评信息科学技术学院2021级本科生“十佳”优秀毕业论文,指导教师为崔斌教授。

图6. 张海林(左)与导师崔斌教授(右)

图7. 凌宿寒(左)与崔斌教授(右)
【学术活动】
2025 年7月27日至8月1日,我组博士后赖沛超前往奥地利维也纳参加国际学术会议acl 2025, 会议期间就其研究成果进行学术报告。

图8. 赖沛超参加acl 2025会议
2025年8月回顾
2025年8月,我组成员2项成果被录用。
【论文录用】
- 我组博士生李昊洋,硕士生林晟等合作的一篇论文被sigmod 2026录用;
- 我组博士后赖沛超的一篇论文被emnlp 2025录用。
【论文汇总】
- haoyang li, fangcheng fu, sheng lin, hao ge, xuanyu wang, jiawen niu, jinbao xue, yangyu tao, di wang, jie jiang, bin cui: "hydraulis: balancing large transformer model training via co-designing parallel strategies and data assignment",sigmod 2026
- peichao lai, jiaxin gan, feiyang ye, wentao zhang, fangcheng fu, yilei wang, bin cui:"improving low-resource sequence labeling with knowledge fusion and contextual label explanations",emnlp 2025
【学术活动】
2025年8月3日至8月7日,我组博士生盛则昂前往加拿大多伦多参加国际学术会议kdd 2025,会议期间就其研究成果进行学术报告。

图9. kdd 2025会议留影
2025年9月回顾
2025年9月,我组成员1项成果被录用。
【论文录用】
- 我组博士生杨灵的一篇论文被neurips 2025录用。
【论文汇总】
- ling yang, xinchen zhang, ye tian, shiyi zhang, chenming shang, minghao xu, wentao zhang, bin cui: "hermesflow: seamlessly closing the gap in multimodal understanding and generation", neurips 2025
【学术活动】
2025年9月1日至9月5日,我组硕士生林晟前往英国伦敦参加国际学术会议 vldb 2025,会议期间就其研究成果进行学术报告。

图10. vldb 2025会议合影
2025年10月回顾
【学术活动】
2025年10月19日-10月23日,我组博士生夏义扉前往美国夏威夷参加国际学术会议iccv 2025,会议期间就其研究成果进行学术报告。

图11. 夏义扉参加iccv 2025会议
2025年11月回顾
2025年11月,我组成员2项成果被录用,参与多项学术活动。
【论文录用】
- 我组硕士生徐贝澄、硕士生刘玮、丁克尧等合作的一篇论文被 aaai 2026论文录用;
- 我组硕士生王煊宇、博士生李昊洋等合作的一篇论文被ppopp 2026录用。
【论文汇总】
- beicheng xu, wei liu, keyao ding, yupeng lu, bin cui: "pseo: optimizing post-hoc stacking ensemble through hyperparameter tuning", aaai 2026 (oral)
- xuanyu wang, fangcheng fu, haoyang li, hao ge, sheng lin , jiawen niu, bin cui: "elastor: elastic and efficient model partitioning and checkpointing for fault-tolerant distributed training", ppopp 2026
【学术活动】
- 2025 年11月5日至11月9日,我组博士后赖沛超前往中国苏州参加国际学术会议emnlp 2025,会议期间就其研究成果进行学术报告。

图12. 赖沛超参加emnlp 2025会议
2. 2025年11月14日至11月15日,我组博士生刘新一等同学前往中国香港参加国际学术研讨会faisys 2025,会议期间就其研究成果进行学术报告。

图13. faisys 2025会议合影
2025年12月回顾
我组博士生张海林、硕士生季晓东等合作的研究成果“pqcache: product quantization-based kvcache for long context llm inference”,被美国伯克利大学skylab实验室所主导的skylight榜单()评估多项指标名列第一,验证了我组研究工作的有效性。
结 语

辞别2025的忙碌与收获,迎接2026的希望与好运。马踏新春福气到,家家户户纳福安。祝福新老朋友们,马年行大运,马到成功事事顺,骏马奔腾步步高,事业蒸蒸日益兴!新春快乐!
北京大学数据与智能实验室(data and intelligence research lab at peking univeristy,pku-dair实验室)由北京大学计算机学院崔斌教授领导,长期从事数据库系统、大数据管理与分析、人工智能等领域的前沿研究,在理论和技术创新以及系统研发上取得多项成果,已在国际顶级学术会议和期刊发表学术论文200余篇,发布多个开源项目。课题组同学曾数十次获得包括ccf优博、acm中国优博、北大优博、微软学者、苹果奖学金、谷歌奖学金等荣誉。pku-dair实验室持续与工业界展开卓有成效的合作,与腾讯、阿里巴巴、苹果、微软、百度、快手、中兴通讯等多家知名企业开展项目合作和前沿探索,解决实际问题,进行科研成果的转化落地。
评论 0