计算机视觉

计算机视觉是一门涉及计算机科学和人工智能的领域,其主要目标是使计算机系统能够理解、分析和解释图像和视频数据。它模仿人类视觉系统的工作方式,通过计算机算法和模型来实现对视觉信息的处理和理解

ACM TOG:基于超体素卷积的在线三维语义分割

近期,清华大学图形学实验室的博士后黄石生、助理研究员穆太江等和香港城市大学傅红波教授合作,提出了一种基于超体素卷积的在线三维语义分割的方法,该方法在在线场景下的三维语义分割准确性、效率性两方面达到了当前最好的水平。

视觉图灵:从人机对抗看计算机视觉下一步发展

本文从视觉任务评估评测(评测数据集、评测指标、评估方式)出发,对计算机视觉的发展进行了总结,对现存的依赖大数据学习的计算机视觉发展问题进行了梳理和分析,从人机对抗智能评测提出了计算机视觉下一步发展方向:视觉图灵。最后对视觉图灵发展方向进行了思考和讨论,探讨了未来研究可能的方向。

计图发布Jrender 2.0,可微渲染再升级,NeRF应用两倍提速!

6月28日,清华大学计图(Jittor)团队发布了可微渲染库Jrender 2.0新版本,正式支持可微体渲染!近期学术界已有大量工作基于可微体渲染完成,其中备受关注的NeRF[1]应用,在Jrender的加速下训练、测试速度增幅可达2倍!

图像分类综述

什么是图像分类,核心是从给定的分类集合中给图像分配一个标签的任务。实际上,这意味着我们的任务是分析一个输入图像并返回一个将图像分类的标签。标签来自预定义的可能类别集。

人工智能的“眼睛”:计算机视觉究竟有多厉害?

计算机视觉是最强大和引人注目的AI之一,你几乎肯定会以各种方式体验过它,当时却不知道。今天我们来好好研究一下它,包括它的工作原理以及它如此出色的原因(而且只会变得越来越好)。