龚克：人工智能，从深度学习到全面赋能

demi 在周五, 02/28/2025 - 09:23 提交

2025年2月26日，《人民日报》刊发信创海河实验室主任、中国新一代人工智能发展战略研究院执行院长龚克教授文章《人工智能，从深度学习到全面赋能》。

现转载如下，以飨读者。

近10年来，以深度学习为主要技术路线的人工智能（AI），从判别（如图像、文字、语音识别等）到生成（如文本、图像、视频、程序等）接连取得突破，DeepSeek、ChatGPT、Sora等应用展示多种技术可能。作为革命性通用技术，人工智能正加速融入人们的日常生活、生产工作和学习研究之中，推动人类经济社会信息化进程迈向智能化的新阶段。

发展新阶段：从判别到生成，从单模态到多模态，从专用到通用

人工智能作为近年来科技领域最热门的话题之一，其实并不是一项新技术。早在1956年，人工智能的概念就在美国达特茅斯学院召开的夏季研讨会上被提出。此后经历半个多世纪发展，都未能实现真正的实用化。2012年，加拿大多伦多大学教授杰弗里·欣顿和他的学生基于机器学习提出的深度学习神经网络模型，在图像识别挑战赛上取得重大突破，激发AI领域的又一次发展热潮，推动语音识别、图像识别以及自然语言处理等多个领域快速进步。　　

AI技术不断迭代升级。特别是2022年前后，生成式人工智能迎来全面爆发。2022年11月，美国OpenAI公司推出ChatGPT，以更大规模的模型实现了更强的内容生成（AIGC）功能。2024年2月，OpenAI公司推出的文生视频大模型Sora，推动生成式人工智能从只能理解单一形式信息（比如文字、图片、音频等）的单模态，迈向可以同时理解多种形式信息（比如图片和文字）的多模态。与此同时，全球的AI大模型竞相超越又各有特长，国外谷歌的双子座（Gemini）、安索皮克（Anthropic）的克劳德（Claude）、元公司（Meta）的Llama，中国的文心一言、智谱清言、豆包、书生·浦语、星火认知、360智脑、通义千问、混元、Kimi、零一万物等，形成百花竞放的局面。　　

2025年1月，我国人工智能企业深度求索（DeepSeek）推出新模型DeepSeek—R1，凭借技术创新和商业化潜力引发全球瞩目。这不仅是因为该模型在自然语言处理方面表现卓越，更为重要的是其在训练方法上实现了创新，成功降低了同类产品对算力资源的大量需求，显著降低了使用成本。得益于此，用户可将R1部署在个人本地设备，实现更为安全且个性化的服务。尤为重要的是，DeepSeek的开源模式为全球创新发展带来新机遇，并有可能带动全行业在未来形成以开源为主流的发展路线。　　

从判别到生成，从单模态到多模态，从专用到通用，是智能化发展新阶段的重要标志。人工智能以自然语言为基础的表达方式，正从方方面面渗透进大众生活。从手机应用、智能音箱等智能助手，到智能网联车和智能机器人等具身智能，再到能提供个性化服务的智能体以及更多的AI原生产品和服务，正加速向我们走来。

核心驱动力：计算机能够从数据中学习规律并做出预测或决策

机器学习是指通过数据训练模型，使计算机能够从数据中学习规律并做出预测或决策。作为当下AI发展的主流技术路线，这条路线让机器通过学习而不是靠预设规则来获得智能，体现了学习是智能形成和发展的本质。可以说，生物智能也好、机器智能也好，都离不开学习，所有的成功和突破都源自学习。“生而知之”毕竟是极少数天才的特质，“学而知之”才适用于大多数人。人类在发展人工智能时也采用了学习的路线。　　

机器学习主要通过神经网络实现。神经网络作为机器学习的一种具体模型，就是通过模拟人脑的结构和功能来处理数据。人类大脑是由神经元和突触构成，神经元通过突触传递信号，实现信息处理、学习和记忆等功能。人工神经网络模拟这一结构，利用集成电路芯片组成的电子计算系统，采用人工神经元和连接（即模型参数）代替生物神经元和突触，通过输入数据、调整权重来学习和预测，构成了AI的物质底座。　　

正如人脑层数越多，处理复杂信息的能力就越强，神经网络也同样需要更多的层数，这就需要借助深度神经网络。以深度神经网络构建的深度学习系统即为AI“模型”，这类模型的参数越多，就意味着模型越大，性能越强。例如，GPT—3模型实现了千亿量级参数，GPT—4模型参数甚至达万亿量级。　　

简而言之，机器学习是人工智能的核心驱动力，它通过从海量数据中提取有价值的信息，帮助人类做出预测、判断和生成所需的内容，从而提升任务处理效率，将人力从繁重、重复、低级和危险的劳动中解放出来。2024年的诺贝尔物理学奖颁给了约翰·霍普菲尔德和杰弗里·欣顿，以表彰他们通过人工神经网络实现机器学习的基础性发现和发明。展望未来，机器学习通过不断发展，必将为人类社会带来更大惊喜。

更广泛运用：AI智能体可望成为今年发展应用亮点

2025年将是AI走向更广和更深应用的关键之年，AI智能体（或称AI代理）可望成为今年AI发展应用的亮点。AI智能体可以说是人工智能技术的集大成者，具备自主性、感知能力、决策能力和行动能力等显著优势。它能够通过理解交办的任务、感知相应的执行环境，进而自主调用相应的智能模型功能、采取相应的行动，可以广泛应用于工业、医疗、交通、金融和家庭等领域。每个用户可能有多个AI智能体帮助解决各种需求，它们有的像是秘书，有的像是工匠，有的像是医护，有的像是采购员，有的像是清洁工。　　

例如，某公司计划设计一个活动邀请系统，在将活动时间、地点和主题等信息准确传达后，AI可自动生成一个智能体“小组长”，负责整体规划和调度。小组长可以召唤多个执行不同具体任务的智能体，1号智能体负责活动邀请函的策划，2号智能体负责设计邀请函中的图像及文字，3号智能体负责代码制作和部署网页，4号智能体负责检验差错，他们就像是一个“工作专班”，成为完成个性化工作的“群体智能”。　　

通过AI智能体，各种AI技术将会被更方便、更广泛、更有效地应用起来，将在多个领域引发根本性变革。同时，快速发展的“科研智能”正在形成科学发展的新范式，为科技这一第一生产力的发展赋能，意义深刻而长远。在这个日新月异的智能时代，学会应用AI技术也将成为多数人的必备技能，人们需要学会以有效而适当的方式运用AI助益工作和生活。　　

“两岸猿声啼不住，轻舟已过万重山。”随着AI在生命科学、物质科学、数学、工程技术等领域的应用日益广泛和深入，可以预见，正如历史上机械动力和电气技术极大拓展了人类的体力劳动能力一样，AI正在加速拓展人类的脑力劳动能力，推动生产力实现又一次质的飞跃，并对人类社会的发展进步产生全面而深远的影响。　　

在AI先进生产力驱动的社会智能化历史进程面前，人类要把握和主导自身的命运，就必须提升自身的智能化能力，学会驾驭AI。各方应努力让AI行驶在促进经济繁荣和环境保护、保护公共利益和个人隐私、遵守法律法规和伦理良俗、促进公平正义与包容和谐的轨道上，确保AI造福全人类的可持续发展。

来源 | 人民日报

从人类基因到AI算法：智能进化的未来	浅析三种主流深度神经网络	作为机器学习研究者，你需要了解的八种神经网络结构！
神经网络通过研究任意单个星系，揭示整个宇宙的组成	神经网络中数据集的三种类别	使用LIME解释CNN

龚克：人工智能，从深度学习到全面赋能

最新文章

最新文章