joycha 的blog

人工智能与大数据会纠正我们的偏见,还是会更糟糕?

美国科学杂志nautil.us《鹦鹉螺》作者Aaron M. Bornstein近日发表了讨论人工智能与大数据能否纠正人类种族歧视的深度报道。尽管人工智能设计者和数据工程师可能没有类似种族歧视的偏见,但大数据从业者都明白,用于提供定制服务的大型数据集不可避免地包含丰富详细的信息,包括具有受保护属性的肤色、性别、性取向和政治取向等。算法在这些数据的基础上做出的决定可以隐蔽地打开这些属性,既令人难以察觉,又是不道德的。

“我们不知道顾客是什么样的,”亚马逊公司负责全球通讯公关的副总裁克雷格·伯曼在接受彭博新闻社采访时说道。伯曼是在回应有人对亚马逊的当日送达服务歧视有色人种的指控。从字面上看,伯曼的辩护是诚实的:亚马逊在选择当日送达的区域时是根据成本和收益因素,例如家庭收入和送达的可及性。但是,这些因素是通过邮政编码汇总起来的,因此会受到其他塑造了——并将继续塑造——文化地理学的因素的影响。查看当日送达的服务地图,很难让人不注意到其与肤色的对应关系。

机器学习综述——机器学习理论基础与发展脉络

本文主要参考中科院自动化研究所复杂系统与智能科学实验室王珏研究员《关于机器学习的讨论》,讨论机器学习的描述,理论基础,发展历史以及研究现状。

20世纪90年代初,当时的美国副总统提出了一个重要的计划——国家信息基本设施计划(NationalInformation Infrastructure,NII)。这个计划的技术含义包含了四个方面的内容:

(1)不分时间与地域,可以方便地获得信息。
(2)不分时间与地域,可以有效地利用信息。
(3)不分时间与地域,可以有效地利用软硬件资源。
(4)保证信息安全。

本文主要讨论解决“信息有效利用”问题,其本质是:如何根据用户的特定需求从海量数据中建立模型或发现有用的知识。对计算机科学来说,这就是机器学习。

深入了解云威胁以及保护措施

据有关报告显示,公共云、私有云和混合云的风险差异很大。在向云数据和服务迈进的过程中,许多公司都在重新思考他们的网络安全方法。他们需要云安全策略吗?云安全策略有什么不同?而最近的一些调查揭示了安全战略是如何变化的,更重要的一点是,它们应该如何改变。本文将讲述有关执行成功的云安全策略所需的工具、信息和组织结构的建议。

在云中放置更多IT基础架构在某些方面更安全一些。例如,您可以合理的确定系统正在运行补丁的最新版本。云服务提供商也在构建新的功能,例如使用机器语言进行异常检测。但是同时,它也带来了新的风险,其中一些是误解如何管理云安全的结果。

重要的是要了解公司的云IT战略——无论是混合型、私有托管型还是公共型,都影响其网络安全战略和战术的执行。

什么是云安全风险?

来自云安全提供商Alert Logic的数据显示了与本地数据中心相比,每种形式的云环境的风险性质和数量。在18个月的时间里,该公司分析了来自3,800多家客户的147 PB的数据,以对安全事件进行量化和分类。在此期间,它发现了超过220万个真正的安全事件。

主要发现包括:
  •   混合云环境中平均每个客户的安全事件数是977个,其次是托管私有云684个,本地数据中心612个和公共云405个。

改变世界的十位算法大师

算法是整个计算机科学的基石,是计算机处理信息的本质。 从开创算法分析这一领域的高德纳、Amazon的“首席算法官”乌迪·曼伯尔,到发明快速排序算法托尼.霍尔,本文介绍了对AI、以及整个计算领域影响深远的十位算法大师。

Don E.Knuth 高德纳

改变世界的十位算法大师

算法和程序设计技术的先驱者。Oh,God!一些国外网站这样评价他。一般说来,不知道此人的程序员是不可原谅的。其经典著作《计算机程序设计艺术》更是被誉为算法中“真正”的圣经,像KMP和LR(K)这样令人不可思议的算法,在此书比比皆是。难怪连 Bill Gates都说:“如果能做对书里所有的习题,就直接来微软上班吧!”

浅谈网络语音技术

当我们使用像Skype、QQ这样的工具和朋友流畅地进行语音视频聊天时,我们可曾想过其背后有哪些强大的技术在支撑?本文将对网络语音通话所使用到的技术做一些简单的介绍,算是管中窥豹吧。

一、概念模型

网络语音通话通常是双向的,就模型层面来说,这个双向是对称的。为了简单起见,我们讨论一个方向的通道就可以了。一方说话,另一方则听到声音。看似简单而迅捷,但是其背后的流程却是相当复杂的。我们将其经过的各个主要环节简化成下图所示的概念模型:

浅谈网络语音技术

这是一个最基础的模型,由五个重要的环节构成:采集、编码、传送、解码、播放。

1. 语音采集

语音采集指的是从麦克风采集音频数据,即声音样本转换成数字信号。其涉及到几个重要的参数:采样频率、采样位数、声道数。

高清语音技术(WBS)及其在手机和蓝牙耳机中的实现

高清语音也被称为宽带语音,是一种能为蜂窝网络、移动电话和无线耳机传输高清、自然语音质量的音频技术。与传统的窄带电话相比,高清语音很大程度上提高了语音质量,减少了听觉负担。

通信产业链上的所有网络和设备都需支持高清语音才能体现出该技术的优点。到2011年6月为止,18个国家运营的20种蜂窝网络,以及33家领先的手机品牌都已支持高清语音。通过部署自适应多速率宽带(AMR-WB)语音编码,GSM, WCDMA(UMTS)和LTE蜂窝网络中已经引入了高清语音。此外, 通过使用改良的子带编码(mSBC)语音编解码技术,无线蓝牙耳机也开始支持高清语音,将免提通话与高语音质量结合在了一起。

高清语音的优点同样可以在现有网络中体现出来。随着窄带网络和设备向高清语音过渡,一种名为带宽扩展(BWE)的语音处理技术可以用来在接收终端设备上模拟类似于高清语音的通话质量,为不支持高清语音的设备提供了一个折中的解决方案。

从窄带到高清语音

自然语言处理之卷积神经网络应用

卷积神经网络(CNN)最开始是用于计算机视觉中,然而现在也被广泛用于自然语言处理中,而且有着不亚于RNN(循环神经网络)的性能。

1、传统的自然语言处理模型

1)传统的词袋模型或者连续词袋模型(CBOW)都可以通过构建一个全连接的神经网络对句子进行情感标签的分类,但是这样存在一个问题,我们通过激活函数可以让某些结点激活(例如一个句子里”not”,”hate”这样的较强的特征词),但是由于在这样网络构建里,句子中词语的顺序被忽略,也许同样两个句子都出现了not和hate但是一个句子(I do not hate this movie)表示的是good的情感,另一个句子(I hate this movie and will not choose it)表示的是bad的情感。其实很重要的一点是在刚才上述模型中我们无法捕获像not hate这样由连续两个词所构成的关键特征的词的含义。

从神经网络到卷积神经网络(CNN)

那卷积神经网络跟神经网络是什么关系呢?其实卷积神经网络依旧是层级网络,只是层的功能和形式做了变化,可以说是传统神经网络的一个改进。

深度学习不是万能的,进化算法在游戏中表现更佳

编者按:深度学习的如日中天遮掩了进化算法的光芒,但进化算法也有望重归大众视野,毕竟在某些领域它可比深度学习领先得多。本文译自MIT Technology Review中原标题为"EVOLUTIONARY ALGORITHM OUTPERFORMS DEEP-LEARNING MACHINES AT VIDEO GAMES"的文章。

基于目前人类在神经网络算法和机器深度学习取得的成就,很容易让人产生计算机科学只包含这两部分的错觉。毕竟神经网络算法在人脸识别、棋类和各类街机游戏竞技中的表现已经开始超越人类了。

因为这些网络算法都是基于人类的思考模式进行的,好像没什么比这个更有潜力了。但事实果真如此吗?

答案是:不完全是。一种全新的算法甚至比深度学习和神经网络有更明显的优势:这种算法是基于创造人类大脑的方式——进化来进行的。

深度学习不是万能的,进化算法在游戏中表现更佳

换句话说,人类是在一系列迭代和择优中产生的,由此诞生了眼睛、耳朵、大脑等精密的工具,足以可见进化的力量。

5G的到来,将为物联网发展带来哪些新机遇?

谈到5G网络,相信很多人都没有很清晰的认知,因为目前5G网络在中国市场还没有真正应用,那么它和4G、2/3G网络有什么区别?最明显的区别就是速率,当4G网络在2010年左右开始占领市场的时候,我们会觉得速度变得很快,下载一部电影,传送一个视频、文件或者照片等,终于不用像2/3G网络那样苦苦等待了,不过,这些在5G网络面前都不算什么,那么,我们即将面世的5G网络到底有多快呢?据悉,它的峰值理论传输速度可达每秒数10Gb,可以说一部超高清画质电影可在1秒之内下载完成,5G作为第五代移动通信技术,将把移动市场推到一个全新的高度。

那5G什么时候能真正到来呢?目前,日本、韩国、美国和中国等国家以及欧洲都在积极研究5G技术,寻找关键技术的突破点。5G技术的关键技术多达6项,其中包括大规模天线阵列技术或新型多天线技术、超密集组网技术、新型多址技术、D2D通信技术、更加扁平化的新型网络架构和C-RAN研究、高频段需求潜在候选频段研究。如此艰巨的任务给各个国家都带来了挑战,而一些5G技术已经开始测试,如AT&T和Verizon正在测试家庭和企业5G宽带固定网络。

同步内容
--电子创新网--
粤ICP备12070055号