demi的博客

特征怎么离散化?为什么需要离散化?

连续特征离散化的基本假设,是默认连续特征不同区间的取值对结果的贡献是不一样的。特征的连续值在不同的区间的重要性是不一样的,所以希望连续特征在不同的区间有不同的权重,实现的方法就是对特征进行划分区间,每个区间为一个新的特征。常用做法,就是先对特征进行排序,然后再按照等频离散化为N个区间。

人工智能的数据、算法和处理,三者缺一不可

一个人工智能项目中,最重要的究竟是数据、算法还是处理过程?有人认为,数据就宛如人工智能的汽油,重点应该是干净的数据、数据科学和对数据含义的深刻理解。有些人说,没有来龙去脉的数据是没有意义的,这些数据的来龙去脉可以是其他数据、模型/算法或处理流程。让我们以一种简洁的方式探究这些人工智能的要素,以发现每种视角的优点。

深度学习中的正则化(超详细分析)

过拟合是指学习时选择的模型所包含的参数过多,以至于出现这一模型对已知数据预测的很好,但对未知数据预测的很差的现象。过拟合的是由数据和模型两方面原因共同造成的,最直接防止过拟合的方法是无限增大训练集的大小,让训练集样本与真实数据分布尽可能接近,但这么做实在是不太现实......

机器学习中的方差、偏差和噪声

机器学习算法一般都会有训练和测试的过程,而且算法在不同训练集上学得的模型,测试的结果也很可能不同。一般来说,算法的方差衡量了训练集的变动导致的模型性能的变化,即多次训练的模型之间的性能差异性。偏差则是度量算法的期望输出与真实标记的区别,表达了学习算法对数据的拟合能力。而噪声则表示数据的真实标记与数据在数据集上标记的区别,表明算法在当前任务上能达到的测试误差的下界。

GPU硬件加速时系统如何运行呢?

硬件加速,简而言之,硬件加速就是利用硬件模块来替代软件算法以充分利用硬件所固有的快速特性。那么稍加变化就可以知道,GPU硬件加速就是指利用GPU强大的硬件图形处理能力,来代替CPU原本使用的软件模拟图形处理算法,从而充分利用GPU的特长为系统服务。

深度学习中的优化困难

在讲深度学习中优化算法之前,我想有必要对模型优化中常见的挑战有一个总览式的了解,这对于优化算法的理解还是有颇有裨益的。本篇博客是基于古德费洛的《Deep Learing》第8章和杨云的《深度学习实战》第五章总结归纳的。

展望未来,探索AI使能行业价值

在人工智能(AI)高速发展的几年间,AI技术已取得了明显的跃进和快速的迭代,演进路线也呈现出丰富多样化的趋势,如语音识别、语义识别、视觉处理等;但在与行业结合方面,AI却未能将价值较好地实现渗透和落地。因此,在企业纷纷拥抱AI的时候,市面上亦出现方向不明、战略不清、投入不够、执行不力等难题。

错误 | 电子创新网 Imgtec 社区

错误

网站遇到了不可预知的错误。请稍后再试。