人工智能与大数据会纠正我们的偏见,还是会更糟糕?
demi 在 周一, 08/20/2018 - 09:39 提交
人工智能与大数据能否纠正人类种族歧视?
人工智能与大数据能否纠正人类种族歧视?
人工智能技术在科技企业不断地深度学习和技术创新等方面的推动之下,也在不断地取得突破。金融、交通、医疗、教育、农业、制造业等场景的应用需求和切合确定场景的商业模式出现推动人工智能技术的快速发展。随着人工智能在移动互联网、智能家居等领域的发展,我国的人工智能产业也将持续性、高速地成长。预计到2022年,我国人工智能行业的市场规模将达到680亿元。
未来国内人工智能行业发展的五大趋势:
一、机器学习与场景应用将迎来下一轮爆发
根据VentureScanner的统计,截至2018年6月,全球人工智能领域获得投资的公司中,按照平均融资额度排名的五大业务依次是:机器学习(应用类)、智能机器人、计算机视觉(研发类)、机器学习(研发类)和视频内容识别等。
目前中国地区人工智能领域获得投资最多的五大细分领域是计算机视觉(研发类)、自然语言处理、私人虚拟助理、智能机器人和语音识别。从投资领域和趋势来看,未来国内人工智能行业的资本将主要涌向机器学习与场景应用两大方向。
【导读】本文是人工智能专家George Seif撰写的博文,介绍了在当前深度学习比较火热的情景下需要避免的三个坑。
作者 | George Seif
编译 | 专知
整理 | Mandy, Sanglei
深度学习在过去几年一直是人工智能领域最热门的话题。事实上,正是它激发了科学家、政府、大公司以及其他所有人对人工智能的极大新兴趣!这是一门很酷的科学,具有潜在的巨大的实用性和积极的应用。它正被用于金融、工程、娱乐、消费产品和服务等领域。
但是,所有应用都需要使用到深度学习吗?当我们开展一个新的项目时,我们需要不自觉地一开始就使用深度学习吗?
在有些情况下,使用深度学习是不合适的,我们需要选择一些别的方案。让我们来探讨一下这些情况吧。
(1)深度学习不适用于小数据集
为了获得高性能,深度网络需要非常大的数据集。标注的数据越多,模型的性能就越好。获得标注良好的数据既昂贵又耗时。雇佣人工手动收集图片并标记它们根本没有效率可言。在深度学习时代,数据无疑是最有价值的资源。
在讨伐算法导致的偏见和产生的作用时,更重要的问题是:与完全没有使用算法的情况相比是怎样的?
卷积神经网络( ConvNets或者CNNs)是神经网络的范畴。
应用领域:图像识别、语音识别、自然语言处理(如语句分类)。可以识别人脸、物体和交通信号,从而为机器人和自动驾驶汽车提供视力。也可以识别场景,提供相关的标签。
LeNets架构(1990s)
LeNets是最早的卷积神经网络。
经过多次成功迭代,1998年,Yann LeCun 把这项工作命名为LeNets5。该架构主要用于字符识别,如邮编,数字等。
卷积神经网络如下图所示:
主要有四个操作:
1. 卷积
2. 非线性处理(ReLU)
3. 池化或亚采样
4. 分类(全连接层)
本文主要参考中科院自动化研究所复杂系统与智能科学实验室王珏研究员《关于机器学习的讨论》,讨论机器学习的描述,理论基础,发展历史以及研究现状。
20世纪90年代初,当时的美国副总统提出了一个重要的计划——国家信息基本设施计划(NationalInformation Infrastructure,NII)。这个计划的技术含义包含了四个方面的内容:
(1)不分时间与地域,可以方便地获得信息。
(2)不分时间与地域,可以有效地利用信息。
(3)不分时间与地域,可以有效地利用软硬件资源。
(4)保证信息安全。
本文主要讨论解决“信息有效利用”问题,其本质是:如何根据用户的特定需求从海量数据中建立模型或发现有用的知识。对计算机科学来说,这就是机器学习。
在经历了蛮荒的PC互联网时代,混战的移动互联网时代,到现今最火的人工智能时代。大数据、云计算、机器学习的技术应用,已经使得IT从业者的门槛越来越高。套用一句樊登读书会的宣传口号“keep learning”,保持对新鲜技术的好奇心,保持对技术应用的责任心,持续关注、学习是每个IT从业者的必备技能。
一、什么是人工智能?
人工智能(Artificial Intelligence),英文缩写为AI。
它是一个融合计算机科学、统计学、脑神经学和社会科学的前沿综合学科。
它使得计算机像人一样拥有智能能力,可以代替人类实现识别、认知,分析和决策等多种功能。
比如当你说一句话时,机器能够识别成文字,并理解你话的意思,进行分析和对话等。
在OpenGL中创建 基础光照 ,主要的工作将模型中的法线信息和法线空间运算矩阵传入到shader中。另一方面,LightDir,ViewDir通常是在shader中从引擎参数获取的,为了简化光照模型的实现,这里我们可以在shader中写死。至于经典的 ambient+diffuse+specular 光照原理,不是本文的重点,就在shader中一笔带过了。
原理
通过函数
glm::mat4 normalMatrix = glm::inverseTranspose(s_shaderData.model);
可以获取当前模型的法线矩阵。用来将法线信息从模型坐标转换为世界坐标。这个矩阵是随着模型的Transform改变而改变的,因此需要在Render时动态计算。
实现
在 基础光照 中,数据传递没什么特殊的,将Normal信息作为attribute传递到shader,将NormalMatrix作为uniform传递到shader。
新能源汽车目前已经越来越普及,对于外界所提到的纯电动车、插电式混合动力、增程式混合动力等等类型的新能源车仍困惑不已,它们到底有何区别,各自有何优势或不足呢?
上面这张图如果您还没有完全看懂的话,别着急,下面的文章将进一步帮助我们扫盲!
1、电池动力汽车(BEV)
作者:红色石头
我们知道,神经网络模型中,各隐藏层、包括输出层都需要激活函数(Activation Function)。我们比较熟悉的、常用的激活函数也有 ReLU、Sigmoid 等等。但是,对于各个激活函数的选取方法、区别特点还有几点需要特别注意的地方。今天红色石头就和大家一起来总结一下常用激活函数 Sigmoid、tanh、ReLU、Leaky ReLU、ELU、Maxout 的关键知识点。
1、为什么需要激活函数
神经网络单个神经元的基本结构由线性输出 Z 和非线性输出 A 两部分组成。如下图所示: