Online video understanding: a comprehensive benchmark and memory-augmented method

2025年1月1日·

Zhenpeng Huang

,

Xinhao Li

,

Jiaqi Li

,

Jing Wang

,

Xiangyu Zeng

,

Cheng Liang

,

Tao Wu

,

Xi Chen

,

Liang Li

Limin Wang

Limin Wang

· 0 分钟阅读时长

引用 URL

类型

出版物

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition

最近更新于 2025年1月1日

Limin Wang

Authors

bv1946伟德官网

← Multiple object tracking as id prediction 2025年1月1日

Proving Olympiad Inequalities by Synergizing LLMs and Symbolic Reasoning 2025年1月1日 →