EuroSys 2026 论文综述

会议: 第 21 届欧洲计算机系统会议 (EuroSys '26)
地点: 英国爱丁堡,2026 年 4 月 27–30 日
论文集: ACM (DOI: 10.1145/3767295)

EuroSys 2026 共录用约 90 余篇论文,覆盖系统研究的完整栈。以下按主要研究方向分类综述,梳理关键趋势与代表性工作。


一、LLM 推理与服务(主导方向 — 约 15 篇)

这是 EuroSys 2026 中规模最大的论文簇,反映了工业界对高效 LLM 服务的迫切需求。

论文 核心思路
AdaServe 基于 SLO 定制的投机解码,加速多 SLO LLM 服务 (CMU)
FlexPipe 在碎片化 Serverless 集群中通过运行时流水线重构实现动态 LLM 服务 (中科院/UCSD)
TokenFlow 请求突发下通过抢占式调度实现响应式文本流式服务 (上交)
KunServe 面向参数的内存管理,高效处理 LLM 服务中的内存过载 (上交)
AdaGen 负载自适应的集群调度器,优化推理延迟 (UVA/HPE)
SkyWalker 面向跨地域 LLM 推理的局部性感知负载均衡器 (UC Berkeley)
MFS 模型家族服务系统——跨相关 LLM 共享参数 (港科大)
LLMFolder 将编译器常量折叠优化应用于 LLM 推理 (上交)
SAS 稀疏注意力合成器,提升推理效率 (Amazon)
TailorLLM 基于 LoRA 的端云协同推理 (北邮)
AIMS 混合云 - 边环境下的低成本 LLM Agent 部署 (UVA/Microsoft)
Taming MoE 细粒度专家卸载,平衡延迟与内存 (Stevens/Rice/Waterloo)
TZ-LLM 利用 ARM TrustZone 保护端侧 LLM (上交)
Scaling LLM Test-Time Compute 在手机 NPU 上扩展 LLM 测试时计算 (清华/Microsoft)

趋势: 社区正从追求原始吞吐转向差异化 SLO 保障、内存高效服务和边缘/移动端部署。跨地域推理和多模型共服务是新兴方向。


二、大规模模型训练(约 12 篇)

论文 核心思路
MegaScale-MoE 生产级通信高效 MoE 训练 (字节跳动/北大)
LoRAFusion 高效 LoRA 微调系统 (多伦多大学/NVIDIA)
STAlloc 时空规划的训练内存优化 (清华/无穹)
Zeppelin 数据并行中变长负载均衡 (北大/ETH)
Efficient Overlapping 通过信号和重排实现计算 - 通信重叠 (清华)
HARP 异构 GPU 集群自动并行训练编排 (复旦)
Crimson 流水线并行中的协作参数更新 (中山大学)
Suika 共享集群中 3D 并行作业的高质量重调度 (上交/TeleAI)
Handling Network Faults 分布式 AI 训练中的网络故障容错 (NUS/字节跳动)
Maya 基于 GPU 运行时仿真的训练优化 (Georgia Tech)
MinatoLoader 高效数据预处理流水线 (McGill)
SwiftFL 端侧联邦学习的投机训练 (中科院)
Federated Fine-Tuning 资源受限设备上的稀疏 MoE 联邦微调 (山大/西交)

趋势: 生产级 MoE 大规模训练、多节点训练的容错能力、异构集群调度是核心主题。计算与通信的重叠仍是被积极攻关的基础难题。


三、网络与通信(约 10 篇)

论文 核心思路
Learn-to-Probe 基于学习的拥塞控制中实现信号可区分性 (港科大)
REPS 回收熵包喷洒的自适应负载均衡与故障缓解 (ETH/Microsoft)
Multipath Collective GPU 云中超越 Scale-up 网络的多路径集合通信 (北大/腾讯)
Concord 学习网络配置契约 (Microsoft Research)
Canopy 属性驱动的学习型拥塞控制 (UT Austin)
PatternSketch 运行时可重配置的网络流量模式检测 (苏大)
Rearchitecting Programmable Networks 面向网内计算的可编程网络重构 (北大/华为)
Practical RDMA Sharing 面向 HPC 的可扩展 RDMA 连接共享 (北大/华为)
RLive 大规模直播流的鲁棒传输系统 (中科院计算所/字节跳动)
NutCracker 混合 DPU 架构的编译框架 (NUS/MPI-SWS)

趋势: 学习型拥塞控制和网络管理日趋成熟。受 AI 训练需求驱动,GPU 云通信基础设施(集合通信、RDMA、DPU)获得了大量关注。


四、Serverless 计算(约 7 篇)

论文 核心思路
iRoute 基于本地路由表的 Serverless 工作流管理 (天津大学)
DROPS Azure Functions 规模的 Serverless 资源池管理 (Waterloo/Microsoft)
Squeezy 面向 Serverless 函数的快速 VM 内存回收 (雅典工大)
Demystifying Serverless Costs 桥接计费、架构与 OS 调度的成本分析 (UBC)
Efficient Data Passing 面向 Serverless 推理工作流的 GPU 中心数据传递 (华科)
Serverless Replication 跨多厂商云的对象存储无服务器复制 (北大)
In-Production Characterization 开源 Serverless 平台生产环境画像及新扩缩策略 (UBC/IBM)

趋势: Serverless 正从 FaaS 向AI 推理服务演进。冷启动和资源管理仍然活跃,但成本建模和 GPU 集成是新前沿。


五、操作系统、虚拟化与容器(约 8 篇)

论文 核心思路
CofferOS 基于 Rust 加固的 OS 级虚拟化(隔离性 + 可定制性)
Pyramid 安全、资源高效的多租户 Kubernetes (清华/蚂蚁)
SKernel 分裂内核架构——大规模弹性安全容器 (清华/蚂蚁/上交)
NecoFuzz 通过 Fuzz-Harness 虚拟机模糊测试嵌套虚拟化 (东京大学)
PaCaR NUMA 系统上通过 Page Cache 复制改善缓冲 I/O 局部性 (亚琛工大)
VM Live Migration 异构处理器间的虚拟机热迁移 (格勒诺布尔大学)
Chimera 通过二进制重写实现透明异构计算 (中科院软件所)
Yield Not Thy Core 重新审视系统中的核心让渡机制 (UC Santa Cruz)

趋势: 大规模容器安全(分裂内核、Rust 加固隔离)和异构处理器虚拟化是突出方向。社区还在将模糊测试虚拟化层作为一等公民测试方法。


六、安全、隐私与模糊测试(约 6 篇)

论文 核心思路
TZ-LLM ARM TrustZone 保护端侧 LLM (上交)
Turnstile 面向 IoT 隐私的混合信息流控制框架 (UBC/Princeton)
Five Minutes of DDoS Brings down Tor 针对 Tor 目录协议的 DDoS 攻击及防御 (Purdue)
LifeFuzz 生命周期引导的 Windows 驱动跨处理函数漏洞模糊测试 (中科院)
Effective On-Hardware Fuzzing 在真实硬件上模糊测试嵌入式 OS (清华)
TAO 面向浮点神经网络的容差感知乐观验证 (Princeton)

趋势: 机密计算(TrustZone 保护 LLM)、协议级攻击(Tor)和系统级模糊测试(驱动、嵌套虚拟化、嵌入式 OS)是活跃领域。安全研究正从传统 OS 加固扩展到 AI 模型保护。


七、存储与文件系统(约 5 篇)

论文 核心思路
SwitchFS 基于网内协调的分布式文件系统异步元数据更新 (上交)
Omar 云块存储的主动 + 被动混合调度 (上交/阿里巴巴)
PASS 功率自适应存储服务器 (华盛顿大学)
Fast Crash Consistency 机会性顺序消除实现并行化崩溃一致性 (哈工大深圳)
FicusDB 可扩展的多版本认证归档存储 (Cornell)

趋势: 元数据的网内协调、功率感知存储和崩溃一致性依然重要。阿里巴巴生产规模的云块存储调度 (Omar) 体现了产学差距的缩小。


八、内存系统与硬件加速(约 7 篇)

论文 核心思路
TierScape 多级压缩内存层降低服务器 TCO (Intel Labs)
FUR 持久内存事务上的快速无限读 (INESC-ID)
MTTM 多租户云的动态快速内存分区与带宽优化 (KAIST)
BASK SmartNIC 卸载的 KSM(内核同页合并)(KAIST)
LightDSA 面向 Data Streaming Accelerator 的硬件感知透明优化 (人大/阿里巴巴)
Accelerating Transactions via PIM 基于存内计算加速事务执行 (INESC-ID)
RoPeerTo 数据中心级 GPU 与 FPGA 间的点对点 DMA (Polimi/ETH/AMD)

趋势: 分层内存(CXL/压缩)、SmartNIC 卸载(KSM)和异构 DMA 架构反映了解耦数据中心的发展方向。Intel DSA 和存内计算正获得系统级关注。


九、分布式系统与共识(约 6 篇)

论文 核心思路
OptiLog 拜占庭共识中的角色分配优化 (Stavanger)
DAG-based BFT 提升基于 DAG 的 BFT 状态机复制的吞吐量与可扩展性 (Supra/Purdue)
Avicenna 通过反事实评估掩盖复制状态机中的慢节点 (Princeton/Databricks)
Garen 基于原子状态调和的可靠集群管理 (FriendliAI)
AEP 通过原子执行保护实现 DSM 层次化容错 (华科)
Disaggregated Cache 面向复制存储系统的逻辑解耦缓存 (UIUC)

趋势: BFT 共识正在以 DAG 架构和角色优化进行重新设计。FriendliAI 的 Garen 等来自工业界的集群管理可靠性论文体现了对正确性的关注。


十、可靠性与生产系统(约 4 篇)

论文 核心思路
CSnake 通过因果拼接检测自维持级联故障 (Purdue)
Proactive Change Risk Detection 字节跳动生产环境的变更风险主动检测经验
Rose 分布式系统中外部故障引发的失败重现 (INESC-ID/Purdue)
Formal Methods at Huawei Cloud 华为云应用形式化方法的经验教训

趋势: 来自字节跳动和华为的生产经验论文标志着主动可靠性技术的成熟。级联故障检测和故障重现仍是难题。


十一、边缘/移动端 ML 与专用硬件(约 6 篇)

论文 核心思路
FlexiQ 自适应混合精度量化 (首尔国立大学)
viNPU 移动 NPU 上的 Vision Transformer 推理 (延世大学)
Neuro-C 受硬件限制塑造的神经推理 (乌普萨拉大学)
Efficient ML Model Updates 面向深度嵌入式微控制器的模型更新 (UC Berkeley)
PointShuffler GPU 上加速点云神经网络 (中南大学)
swKokkos 面向神威异构架构的 Kokkos 后端 (中科院)

十二、其他亮点论文

论文 核心思路
Ethane 基于紧凑 Trie 的区块链状态精简 (首尔国立大学)
Carbon-Aware Learning 碳感知的可持续实时 ML 分析 (成均馆大学)
E-Cube 面向无人机的事件增强高效视频流 (港大/清华)
No More Translation at Runtime LLM 赋能的静态二进制翻译 (港科大)
FlashPS 面向生成式图像编辑的掩码感知缓存与调度 (港科大/阿里巴巴)
Matrix-PIC 高性能粒子模拟 (中山大学)
Prediction-Informed Power Management 面向通用服务器的预测驱动功耗管理 (华盛顿大学)
Million-Scale Video Retrieval 超维计算方法的百万级视频检索 (DGIST)
GeDES GPU 驱动的离散事件网络仿真器 (电子科大)

核心观察与趋势总结

1. LLM 系统独占鳌头。 约 30% 的录用论文直接针对 LLM 训练或服务,是最大的单一类别。社区已从 " 能不能服务 LLM" 转向 " 如何高效、可靠、低成本地大规模服务"。

2. 生产规模成为新标杆。 字节跳动 (MegaScale-MoE、网络故障处理、变更风险检测)、阿里巴巴 (Omar、LightDSA)、Microsoft (DROPS、REPS、Concord)、蚂蚁集团 (SKernel、Pyramid) 的论文展示了真实的大规模部署实践。

3. 安全与 AI 融合。 TZ-LLM(TrustZone 保护 LLM)、TAO(神经网络验证)和 CofferOS(Rust 加固容器)标志着安全与 AI 系统的汇聚。

4. 异构与解耦硬件。 SmartNIC 卸载 (BASK)、DPU 编译 (NutCracker)、GPU-FPGA DMA (RoPeerTo)、DSA 优化 (LightDSA) 和分层内存 (TierScape/MTTM) 反映了行业向专用解耦硬件迁移的方向。

5. Serverless 走向成熟。 7 篇 Serverless 论文——从成本分析到 GPU 中心数据传递再到生产画像——表明该模型正被应用于 AI 推理负载。

6. 模糊测试成为系统方法论。 三篇 Fuzzing 论文 (NecoFuzz 嵌套虚拟化、LifeFuzz 驱动、On-Hardware Fuzzing 嵌入式 OS) 确认模糊测试已成为系统正确性的标准手段。

7. 亚洲(尤其中国)力量强势。 多数论文涉及中国高校 (上交、清华、北大、华科等) 或中国企业 (字节、阿里、腾讯、蚂蚁、华为),体现了该地区在系统研究上的巨大投入。


内核/虚拟化/安全方向重点推荐


数据来源: EuroSys 2026 Accepted Papers | ACM Proceedings