大数据

大数据新时代:物联网让生活更加智慧

物联网(IoT,Internet of Things)这一概念最早在1999年提出。美国麻省理工学院建立的“自动识别中心(Auto-ID)”,首次提出“万物皆可通过网络互联”,并阐明物联网的基本含义。早期的物联网仅是依托射频识别(RFID)技术实现物物相连的网络。随着技术和应用的发展,物联网的内涵已发生了较大变化。

物联网将彻底打通虚拟世界与现实世界之间的壁垒

现如今,物联网指的是通过二维码识读设备、射频识别装置、红外感应器、全球定位系统和激光扫描器等信息传感设备,按约定协议,把任何物品与互联网相连接,进行信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理的一种网络。

需要指出的是,物联网并非单独建立一张网络,而是在现有网络基础上的拓展和延伸。就像互联网和移动互联网通过PC、平板电脑、智能手机已经实现人与人之间的互联一样,未来将能实现一切硬件的互联。因此,简单地说,物联网是在原有网络基础上,对任何客观物体网络化和智能化的过程。

如果说第一代互联网技术实现的是计算机之间的互联并成功搭建了虚拟网上世界,第二代互联网技术是通过移动互联网实现了人与人之间的互联,那么未来的互联网技术要实现的是所有物品的互联,彻底打通虚拟世界与现实世界之间的壁垒。

人工智能和大数据的开发过程中需要注意这12点

人工智能是近年来科技发展的重要方向,在大数据时代,对数据采集、挖掘、应用的技术越来越受到瞩目。在人工智能和大数据的开发过程中,有哪些特别需要注意的要点?

人工智能领域的算法大师、华盛顿大学教授Pedro Domingos对此进行了深入思考。

在我们新近翻译的《智能Web算法》(第2版)中,对Pedro Domingos教授的观点进行了高度的概括,提炼出12个注意点,为行业开发实践提供了重要参考:

注意点1:你的数据未必可靠

在实际应用中,有很多各种各样的原因会导致你的数据是不可靠的。因此,当你将数据用于解决问题前,必须经常留心来检查数据是否值得信赖。如果基于糟糕的数据来挖掘,无论多么聪明的人也永远只会获得糟糕的结果。下面列举了一些常见的可导致数据可靠性问题的因素:

用于开发的数据,往往和实际情况下的数据分布不同。例如也许你想把用户按照身高划分为“高”、“中等”、“矮”三档,但如果系统开发时使用的数据集里最低用户的身高是6英尺(184cm),那么很有可能你开发出来的系统里会把一个“仅有6英尺”的用户称为“矮”用户

量子计算机将如何改变AI/机器学习/大数据?更快更强

据福布斯杂志报道,我们每天能产生2.5EB(约合10亿GB)数据,这相当于25万个美国国会图书馆或500万台笔记本电脑记录的内容。我们有32亿个全球互联网用户,他们每分钟在Pinterest上发布9722个Pin,在Twitter发布347222条消息,在Facebook上留下420万个“点赞”,我们还通过拍照和视频、保存文件、打开账户等行为产生其他大量数据。

我们正处于传统计算机数据处理能力的极限,而数据却依然在不断增长。虽然摩尔定律(Moore’s Law)预测集成电路上的晶体管数量每隔两年就会翻一番,但自1965年这个术语出现以来,事实证明它具有很强的弹性。随着技术的进步,这些晶体管现在的体积越来越小。正因为如此,业界领导者们展开了激烈竞争,看谁能首先要推出一款比现有计算机更强大的量子计算机,来处理我们每天产生的所有数据,并解决日益复杂的问题。

量子计算机能快速解决复杂问题

2017年全球大数据正在朝这七个趋势发展

2016年发生了许多事情。谷歌的阿尔法算法在围棋比赛中击败了李世石,区块链实现了快速发展,全球各地的政府都在大举投资智慧城市。和往年一样,我将为你提供未来一年的大数据趋势,之前我提供了2014年、2015年和2016年的大数据趋势。2017年有望成为大数据里程碑的一年。大数据的炒作终于结束了,因而我们总算终于可以着手于大数据。这就是为什么我将2017年称为智能年。那么,2017年的哪些大数据趋势会对你的组织产生影响? 让我们来看看2017年大数据的七大趋势。

1. 支持区块链的智能合约:区块链2.0

2017年全球大数据正在朝这七个趋势发展

”揭秘“10个大数据神话

如果数据有一点点就不错了,那么数据是海量的话就一定棒极了,对不对?这就好比说, 如果一个炎日夏日里的微风让你感觉凉爽,那么你会为一阵一阵的凉风感到欣喜若狂。以下为译文:

也许对大数据更好的一个类比是它就像一匹意气风发的冠军赛马: 通过适当的训练和天赋的骑师,良种赛马可以创造马场记录–但没有训练和骑手,这个强大的动物根本连起跑门都进不了。

为了确保你组织的大数据计划保持正轨,你需要消除以下10种常见的误解。

1. 大数据就是‘很多数据’

大数据从其核心来讲,它描述了结构化或非结构化数据如何结合社交媒体分析,物联网的数据和其他外部来源,来讲述一个”更大的故事”。该故事可能是一个组织运营的宏观描述,或者是无法用传统的分析方法捕获的大局观。从情报收集的角度来看,其所涉及的数据的大小是微不足道的。

2.大数据必须非常干净

在商业分析的世界里,没有“太快”之类的东西。相反,在IT世界里,没有“进垃圾,出金子”这样的东西,你的数据有多干净?一种方法是运行你的分析应用程序,它可以识别数据集中的弱点。一旦这些弱点得到解决,再次运行分析以突出 “清理过的” 区域。

你怎么存活于大数据和人工智能结合的时代?

【编者按】这篇文章最初以“Digitale Demokratie statt Datendiktatur”的名字出现在Spektrum der Wissenschaft(科学美国人的姊妹出版物)。作者是Dirk Helbing、Bruno S. Frey、Gerd Gigerenzer等9位著名教授(文后附作者介绍),主要论述了大数据与人工智能对未来社会经济、政治、安全、法律等相关问题的影响,讨论了数字革命和数字时代策略,并对成功实现数字社会给出具体的建议。

发展背景:大数据与人工智能

数字革命正如火如荼地进行着。每年我们产生的数据量都在翻倍,每分钟我们在Google搜索、在Facebook上发帖,不久我们周围的事物都将与互联网相连。据估计,在10年的时间内,将有1500亿个网络测量传感器,比人类总数多20倍,而且,数据量将每隔一段时间翻一番。许多公司已经在努力把“大数据”变成“大商机”。这将如何改变我们的世界?一切都将变得智能,我们将不仅拥有智能手机,还有智能家居,智能工厂和智能城市,甚至于出现智能国家和更智能的地球。

大数据+AI促进机器学习

AI和大数据都是目前炙手可热的新兴技术,如果把它们结合在一起,又会怎么样呢?目前,研究人员正在为这一方向而努力,让大数据与AI结合而更好地发展。随着科技的发展,人们逐渐意识到大数据和AI结合将会产生更为强大的能力。

大数据和AI结合的期望如何

AI在大数据上的应用是当下最重要的技术突破。它不仅重新定义了企业利用数据创造价值的方法,还促成了机器学习的空前发展。

企业通过访问大量资料组来学习,并获得惊人的成果。这样看,企业从一个基于假设的研究方法快速转向一个更加集中的“数据优先”战略也不足为怪。

大数据如何让AI获得突破性进展

现在,得益于科技的发展,企业皆可处理海量的数据。而在以前,他们不得不为此配备功能强大而昂贵的硬件和软件。数据的广泛使用正是促成这一行业创新变化的范式转变。

大量数据组的可用性能与机器学习的突破性进展相符合,这主要是因为出现了更好、更精细的AI算法。

这些突破性进展的最佳代表是“虚拟代理(通常被称为聊天机器人)”。以前,聊天机器人在识别某些特定的短语、地方口音、方言时有一定的困难,但是通过一段时间的发展,它现在已经获得了极大的进步。

深度 | 神奇的神经机器翻译:从发展脉络到未来前景

机器翻译(MT)是借机器之力「自动地将一种自然语言文本(源语言)翻译成另一种自然语言文本(目标语言)」。使用机器做翻译的思想最早由 Warren Weaver 于 1949 年提出。在很长一段时间里(20 世纪 50 年代到 80 年代),机器翻译都是通过研究源语言与目标语言的语言学信息来做的,也就是基于词典和语法生成翻译,这被称为基于规则的机器翻译(RBMT)。随着统计学的发展,研究者开始将统计模型应用于机器翻译,这种方法是基于对双语文本语料库的分析来生成翻译结果。这种方法被称为统计机器翻译(SMT),它的表现比 RBMT 更好,并且在 1980 年代到 2000 年代之间主宰了这一领域。1997 年,Ramon Neco 和 Mikel Forcada 提出了使用「编码器-解码器」结构做机器翻译的想法 。几年之后的 2003 年,蒙特利尔大学 Yoshua Bengio 领导的一个研究团队开发了一个基于神经网络的语言模型 ,改善了传统 SMT 模型的数据稀疏性问题。他们的研究工作为未来神经网络在机器翻译上的应用奠定了基础。

神经机器翻译的诞生

深度学习的高维度问题

作者:刘通

数据的高维度问题

深度学习的目标是基于某些给定信息对未知变量进行预测。需要预测的变量,一般是单个变量,若是需要预测多个变量,则也拆成多个深度学习模型处理,因此对每个模型还是输出单个变量。模型输出的单个变量称为标量,英文是Scalar,深度学习模型的输出一般不涉及高维问题。在模型进行预测时,需要基于一些输入的信息进行判断,这些输入信息往往不是单一变量,而是多个变量,因此深度学习中数据的高维问题往往是指模型输入变量的高维问题。

向量(Vector)

对深度学习模型来说,向量是最基本的输入数据的结构,每个维度上的数据可以表示一个进行预测的参考信息。一般的预测问题中,输入数据都可以用向量表示,向量中的各个值可类比于多元线性回归模型中的各个自变量的作用。

矩阵(Matrix)

物联网能否在5G技术下实现爆发?

Gartner最新报告指出,根据2017年第2季一份针对全球逾200位信息科技(IT)、商业领袖所做的调查,高达75%的受访者表示所属机构/企业愿意付高于4G的价码来使用5G移动功能。

这份调查显示,31%的受访者愿意为5G服务付出较4G高出1成的费用;22%受访者表示愿多付10-20%、14%受访者愿多付20-30%、8%可以接受30%或更高的溢价幅度。

Gartner研究主任Sylvain Fabre指出,电信业比制造业、服务业以及政府部门更愿意多花点钱抢先使用5G。调查显示,57%的受访者认为“物联网(IoT)通讯”是自家公司/机构使用5G的最主要原因。Fabre指出,不是所有的物联网使用情境都需要用到5G(高数据传输速度、非常低的延迟率),目前已有许多较为低廉的物联网连结替代方案(Wi-Fi、ZigBee或蓝牙)。

物联网能否在5G技术下实现爆发?

同步内容
--电子创新网--
粤ICP备12070055号