计算机视觉

计算机视觉是一门涉及计算机科学和人工智能的领域,其主要目标是使计算机系统能够理解、分析和解释图像和视频数据。它模仿人类视觉系统的工作方式,通过计算机算法和模型来实现对视觉信息的处理和理解

计图开源:清华和中科院计算所等单位合作提出人体运动识别的Motif图卷积网络

人体运动识别是计算机视觉研究中的经典问题,因其在人机交互、医疗监护和视频监控等场景的应用而受到广泛关注。基于图卷积网络自动提取骨架图序列的时空特征用于人体运动识别的方法,已经取得了很大进展。

ACM TOG:基于超体素卷积的在线三维语义分割

近期,清华大学图形学实验室的博士后黄石生、助理研究员穆太江等和香港城市大学傅红波教授合作,提出了一种基于超体素卷积的在线三维语义分割的方法,该方法在在线场景下的三维语义分割准确性、效率性两方面达到了当前最好的水平。

视觉图灵:从人机对抗看计算机视觉下一步发展

本文从视觉任务评估评测(评测数据集、评测指标、评估方式)出发,对计算机视觉的发展进行了总结,对现存的依赖大数据学习的计算机视觉发展问题进行了梳理和分析,从人机对抗智能评测提出了计算机视觉下一步发展方向:视觉图灵。最后对视觉图灵发展方向进行了思考和讨论,探讨了未来研究可能的方向。

计图发布Jrender 2.0,可微渲染再升级,NeRF应用两倍提速!

6月28日,清华大学计图(Jittor)团队发布了可微渲染库Jrender 2.0新版本,正式支持可微体渲染!近期学术界已有大量工作基于可微体渲染完成,其中备受关注的NeRF[1]应用,在Jrender的加速下训练、测试速度增幅可达2倍!

图像分类综述

什么是图像分类,核心是从给定的分类集合中给图像分配一个标签的任务。实际上,这意味着我们的任务是分析一个输入图像并返回一个将图像分类的标签。标签来自预定义的可能类别集。