深度学习有哪些接地气又好玩的应用？

demi 在周三, 10/09/2019 - 09:27 提交

过去几年中，深度学习中的很多技术如计算机视觉、自然语言处理等被应用在很多实际问题中，而且相关成果也表明深度学习能让人们的工作效果比以前更好。

我们收集了一些深度学习方面的创意应用，虽然没有对每项应用进行详尽描述，但是希望你看过之后能对深度学习在生活中的应用潜力有更好的认识。

1、给黑白照片自动上色

为黑白照片添加颜色又叫做图像着色。很久以来，这项工作都是由人工完成，是一项颇为艰巨的任务。现在人们可以用深度学习技术利用物体及它们在照片里的环境来给图像着色，和人工完成的效果几无差别。

为了解决图像着色问题，要给 ImageNet（目前世界上图像识别最大的数据库）训练一个质量很高、规模很大的卷积神经网络。总的来说，就是采用了非常大的卷积神经网络和监督层（supervised layers），添上色彩，然后重建照片。

例如，芝加哥大学的技术人员去年4月份发表研究成果称，用深度学习技术和英伟达 GPU 实现了为黑白照片自动上色。

左为黑白照片，右为深度学习技术上色后的照片

问题来了，我们从哪里可以体验一下呢？从 Algorithmia 网站上就行，打开网站输入你要上色的照片，然后点击“Colorize it”，就OK了！

拿张黑白喵图举个栗子

2、自动机器翻译

这种应用也就是能把一种语言的词汇、短语和句子自动翻译成另一种语言。其实这种自动机器翻译技术很久前就应用了，但是深度学习可以在两个细分方面达到登峰造极的成果：
- 自动翻译文本
- 自动翻译图片

采用深度学习技术的文本翻译无需提前处理文字的序列，算法能够学习词汇和它们的映射之间的关系，然后翻译为另一种语言。大型 LSTM 循环神经网络中的堆叠网络（stacked networks）就可以用来完成这种翻译。

卷积神经网络也能用来识别有文字的照片，将照片中的文字转换为文本格式，然后翻译加工，最后照片会变为配有翻译后文字的照片。通常也被称为即时视觉转译。
谷歌翻译应用就采用了深度学习技术，能够实现27种语言的即时视觉转译。

3、对照片中物体进行分类和检测

就是将照片中的物体进行分类，归为人们已知的物体。利用大型卷积神经网络在这方面已经取得了瞩目的成就。例如，由神经网络专家 Alex Krizhevsky， Geoffrey Hinton 和 Ilya Sutskever 共同研发的 AlexNet 便是其中的佼佼者。

检测照片中的物体则要复杂一些，主要是具体识别出照片中一个或多个物体，用方框标出，而且能对它们进行描述。

斯坦福大学的 Andrej Karpathy 就训练了一个深度学习系统，能对照片中不同区域内元素进行识别，并用一句话来描述照片，叫做 Neural Talk。

4、自动书写生成（Handwriting Generation）

根据一些手写笔迹，利用深度学习技术就能用这些笔迹写出其他的词句。

某书法作品

当人们用笔写字的时候，笔在纸上滑动，好比留下一系列连贯的坐标点，而深度学习技术可以学习出笔的移动轨迹和文字之间的关系，然后生成新的一模一样的笔迹，而且能够模仿多种笔迹。

5、自动生成抓眼球的文章标题

生活中在看各种资讯的时候，会遇到各种吸引眼球的标题，让人忍不住点开查看，这些抓眼球的标题基本上都是由小编们绞尽脑汁想出来的，不过深度学习专家 Lars Eidnes 却采用了循环神经网络让电脑能自动生成抓眼球的标题。

我国08年的时候“标题党”已经初见雏形

恐怕是世界上第一个用循环神经网络生成标题的网站。

6、将素描转为照片

2016年荷兰内梅亨大学的几名学生利用深度神经网络将人物脸部素描转化为照片，他们将此项技术称为“卷积素描转换”（Convolutional Sketch Inversion）。

本文转自：CSDN学院，转载此文目的在于传递更多信息，版权归原作者所有。

深度学习的下一站：解锁人工智能的新边界	Hinton，Lecun和Bengio三巨头联手再发万字长文：深度学习的昨天、今天和明天	深度学习中的正则化（超详细分析）
一文看懂深度学习改变的五大计算机视觉技术	基于深度学习的类脑计算	PaddlePaddle核心架构深入解读

最新文章