计算机视觉相关概念总结

demi 在周五, 03/12/2021 - 11:55 提交

01. AI API

一个应用程序编程接口（API），供用户访问人工智能工具和功能。通过提供第三方AI服务，AI API使开发人员不必在内部构建自己的AI。

02. AI演示

演示AI平台或一般人工智能的特性和功能。

03. AI模型

给定输入数据和设置（称为“超参数”），训练AI算法的结果。AI模型是一种简化的表示形式，它试图封装AI算法在训练过程中学习到的所有内容。AI模型可以共享并在新数据上重用，以用于实际环境中。

04. AI平台

供用户构建，部署和管理利用人工智能的应用程序的软件库或框架。与AI API相比，AI平台不那么静态，而且功能更广泛：尽管AI API返回第三方预先训练的模型的结果，但AI平台允许用户为不同的目的创建自己的AI模型。

05. AI训练

训练一个或多个AI模型的过程。在训练过程中，AI通过查看越来越多的输入数据来对“学习”进行建模。在对给定输入进行预测之后，AI模型会发现其预测是否正确；如果不正确，它将调整其参数以解决该错误。

06. 注释

为AI训练做准备而对输入数据进行标记的过程。在计算机视觉中，必须根据您希望AI模型执行的任务对输入的图像和视频进行批注。例如，如果您希望模型执行图像分割，则注释必须包括图像中每个对象的位置和形状。

07. 计算机视觉

计算机科学，人工智能和机器学习的子领域，旨在为计算机提供对图像和视频的快速，高级的理解，并像人类一样“观看”它们。近年来，得益于深度学习和神经网络，计算机视觉在准确性和速度方面取得了长足的进步。

08. 数据收集

积累大量信息以训练AI模型的过程。可以从专有资源（例如您自己的视频）或从公开可用的数据集（例如ImageNet数据库）中收集数据。收集后，必须对数据进行批注或标记以用于AI培训。

09. 深度学习

人工智能和机器学习的一个子领域，它使用具有多个“隐藏”（深度）层的神经网络。得益于算法的改进和技术的进步，近年来，深度学习已成功地用于训练可以执行许多类似于人类的高级任务（从识别语音到识别图像内容）的AI模型。

10. 密集分类

一种仅通过几个例子就可以训练深度神经网络的方法，该方法最初由Lifchitz等人在2019年学术论文《密集分类和植入以进行少量学习》中首次提出。广义上讲，密集分类鼓励网络查看其试图识别的对象的各个方面，而不是仅关注一些细节。

11. Edge AI

使用在边缘设备上运行的AI和机器学习算法来处理本地硬件上的数据，而不是将其上传到云中。Edge AI的最大好处也许是更快的速度（因为不必往返于云之间来回发送数据），从而可以进行实时决策。

12. 边缘设备

连接到Internet的硬件设备，是物联网（IoT）的一部分，并充当IoT网络中的网关：一方面，本地传感器和收集数据的设备；另一方面，物联网在云中的全部功能。为了获得最快的结果，许多边缘设备都能够在本地执行计算，而不是将这种责任转移到云上。

13. 集成学习

使用来自在相同输入（或相同输入的样本）上训练的多个AI模型的预测，以减少错误并提高准确性。由于训练阶段的自然可变性，给定相同的数据，不同的模型可能会返回不同的结果。集成学习结合了所有这些模型的预测（例如，通过多数表决），以提高性能为目标。

14. 面部认证

面部识别的一个子领域，通常出于安全目的，旨在验证一个人的身份。面部认证通常是在边缘设备上执行的，边缘设备足够强大，可以几乎立即并以很高的准确度识别对象。

15. 面部识别

通过检查各种面部特征（例如，眼睛，鼻子，嘴巴和che骨的距离和位置），将人脸用作生物特征。面部识别既可用于面部认证（识别征得其同意的个人），也可用于在公共场所捕获人们图像的视频监视系统。

16. GPU

“图形处理单元”的缩写，一种专门用于计算机，智能手机和嵌入式系统的专用硬件设备，最初用于实时计算机图形渲染。但是，GPU能够有效地并行处理许多输入的能力使它们可用于多种应用程序，包括训练AI模型。

17. 散列

数学函数（称为“散列函数”）的结果，该函数将任意数据转换为唯一（或几乎唯一）的数字输出。例如，在面部认证中，复杂的哈希函数对用户面部的识别特征进行编码，并返回数值结果。当用户尝试访问系统时，他们的面孔会被重新着色并与现有哈希进行比较以验证其身份。

18. 图像丰富

通过添加元数据（例如，图像的作者，创建日期或内容），使用AI和机器学习对图像和视频等视觉数据进行自动“丰富”。例如，在媒体行业，图像丰富化可用于快速准确地标记在线零售列表或新的代理商照片。

19. 图像质量控制

使用AI和机器学习对视觉数据（例如图像和视频）执行自动质量控制。例如，图像质量控制工具可以检测图像缺陷（例如模糊，裸露，伪造和禁止的内容），并纠正问题或从数据集中删除图像。

20. 图像识别

AI和计算机视觉的一个子领域，旨在通过高层次描述图像内容来识别图像内容。例如，训练有素的图像识别模型可能能够区分狗的图像和猫的图像。图像识别与图像分割形成对比，图像分割试图将图像分为多个部分（例如，背景和不同的对象）。

21. 物联网

广泛的，相互连接的设备和传感器网络，可通过互联网进行通信和交换信息。作为发展最快的技术趋势之一（估计每秒连接127个新设备），物联网具有改变制造业，能源，交通等行业的潜力。

22. 标签

分配标签的过程，该标签可为训练数据集中的每个输入或您希望AI模型在训练期间返回的“答案”提供正确的上下文。在计算机视觉中，标签有两种类型：注释和标签。标记可以在内部执行，也可以通过外包或众包服务执行。

23. 活体检测

面部认证系统的一种安全功能，可验证给定的图像或视频是否代表真实的真实人，而不是试图以欺诈手段绕过该系统（例如，戴上人像面具或显示睡眠状态）人的脸）。进行活动检测对于防范恶意行为者至关重要。

24. 机器学习

人工智能和计算机科学的一个子领域，研究可以通过获得更多经验或查看更多数据来随着时间的流逝而不断提高自己的算法。机器学习既包括监督学习（在监督学习中为算法提供了预期的结果或标签），也包括无监督学习（在该监督中算法必须在未标记的数据中找到模式）。

25. 机器视觉

人工智能和计算机视觉的一个子领域，结合了硬件和软件，使机器可以像人类一样在较高的水平上“看到”。机器视觉不同于计算机视觉：机器视觉系统既包括捕获图像和视频的机械“主体”，也包括解释这些输入的计算机视觉软件。

26. 元数据

描述并提供有关其他数据的信息的数据。对于图像和视频之类的视觉数据，元数据包括三类：技术性（例如摄像机类型和设置），描述性（例如作者，创建日期，标题，内容和关键字）和管理性（例如联系人信息和版权）。

27. 神经网络

一种AI和机器学习算法，旨在模仿人脑的高级结构。神经网络有许多相互连接的人工“神经元”，它们排列成多层，每个神经元都存储一个信号，该信号可以传输给其他神经元。大型神经网络具有许多隐藏层的使用被称为深度学习。

28. 对象识别

AI和计算机视觉的子领域，旨在识别图像中包含的一个或多个对象。对象识别与图像识别有关，但与图像识别不同。例如，给定足球比赛的图像，图像识别模型可能仅返回“足球比赛”，而对象识别模型将返回图像中的不同对象（例如“球员”，“足球”，“目标， ”等）。

29. 预先训练的模型

已经在一组输入训练数据上进行训练的AI模型。给定输入后，预先训练的模型可以快速返回对该输入的预测，而无需再次训练模型。预训练的模型也可以用于转移学习，即将知识应用于不同但相似的问题（例如，从认可汽车制造商到卡车制造商）。

30. 分割

AI和计算机视觉的子领域，旨在将图像或视频分为多个部分（例如，背景和不同的对象）。例如，一群人的图像可能被分割成每个人的轮廓以及图像的背景。图像分割被广泛用于诸如医疗保健之类的应用（例如，识别医学图像中的癌细胞）。

31. 情感检测

AI和计算机视觉的一个子领域，旨在了解给定文本的语气。这可以包括确定文本是否具有肯定，否定或中立的意见，或者是否包含某种情感状态（例如“悲伤”，“生气”或“快乐”）。

32. 标记

使用单个标签标记输入数据以准备进行AI训练的过程。标记与注释类似，但是对每条输入数据仅使用一个标签。例如，如果要对不同品种的狗执行图像识别，则标签可以是“金毛猎犬”，“斗牛犬”等。

33. 视频分析

使用AI和计算机视觉自动分析视频内容。这可以包括面部识别，运动检测和/或物体检测。视频分析广泛用于安全，建筑，零售和医疗保健等行业，其应用范围从预防损失到健康与安全。

声明：部分内容来源于网络，仅供读者学术交流之目的。文章版权归原作者所有。如有不妥，请联系删除。

计算机视觉

AMiner发布：2022年人工智能全球最具影响力学者榜单AI 2000	你需要知道的11个Torchvision计算机视觉数据集	一文看懂深度学习改变的五大计算机视觉技术
计算机视觉领域最全汇总（一）	计算机视觉中的半监督学习	Unity 发布最新机器人软件开发工具

最新文章

最新文章