
清华大学智能产业研究院(AIR)与字节跳动等联合提出 Video-STR 图关系强化框架与 STV-205k 数据集,将多模态大模型的视频时空推理能力大幅提升,并在多项公开基准上取得领先表现。

清华大学智能产业研究院(AIR)与百度自动驾驶团队联合提出 CoopTrack 端到端协同 3D 多目标跟踪框架,在真实车路协同场景中显著提升感知精度与通信效率。

清华大学智能产业研究院(AIR)与比亚迪汽车新技术研究院围绕 Flow Planner 交互规划框架展开联合研究,将前沿生成式规划算法同量产级自动驾驶需求深度对接。

清华大学智能产业研究院(AIR)与联想集团联合提出 SparseWorld 稀疏 4D 占用世界模型,将前沿稀疏查询建模与联想在自动驾驶计算平台上的工程实践深度结合,面向真实车路场景优化规划与推理效率。

清华大学智能产业研究院(AIR)与快手科技联合提出 VRPSR 复压感知超分辨框架,把前沿扩散生成模型嵌入快手短视频与图片编解码流程,在不改比特流的前提下显著提升端上与服务端的主观画质。

清华大学智能产业研究院(AIR)与滴滴出行联合提出 Semore 视觉强化学习框架,用 VLM 常识能力增强语义与运动表示,面向真实出行场景提升自动驾驶智能体的决策质量与安全性。

清华大学智能产业研究院(AIR)与商汤科技联合提出“快速免训练感知图像压缩”方案,将前沿扩散生成模型与实际大规模编解码系统深度结合,在不改比特流的前提下显著提升视觉质量并降低解码时延。

清华大学智能产业研究院(AIR)与地平线机器人联合开展 CoopTrack 端到端协同 3D 多目标跟踪研究,在车路协同场景下探索高效、低带宽的智能感知新方案。

