大语言模型已遭遇瓶颈,是时候重新定义智能了吗?
demi 在 周四, 10/09/2025 - 09:38 提交
大语言模型和生成式 AI 技术自诞生以来遭遇的种种问题表明,这可能不是通向智能社会转型的正确路径。
大语言模型通常指的是具有大量参数的深度学习语言模型。这些模型基于深度神经网络架构,通过对大规模文本数据进行训练,能够学习并生成自然语言的文本。这类模型在自然语言处理(NLP)任务中取得了显著的成就,如生成文本、文本理解、翻译等。

大语言模型和生成式 AI 技术自诞生以来遭遇的种种问题表明,这可能不是通向智能社会转型的正确路径。

本文介绍KG-LLM-Bench,这是一个可扩展的基准测试集,涵盖了五种知识图谱理解任务,用于分析 LLMs 如何处理上下文中的知识图谱。

2025年,预计人工智能将在众多领域扮演更加核心的角色,推动生产力提升和行业创新。除了智能体和高效语言模型的持续进步之外,本文五个人工智能产业的发展趋势将塑造整个行业格局。

人工智能的功耗问题已敲响警钟。我们如何应对:是创造更多清洁能源,还是通过某种方式降低能耗?跳出半导体的舒适区进行设计能否带来更好的结果,抑或会阻碍收益的实现速度?

通过10个关键趋势勾勒出2025人工智能发展的三大主题基础模型的跃迁、智能行动者的崛起以及AI走向物理世界,深入剖析了AI从“智能工具”迈向“共生伙伴”的关键跃迁。

本文将详细探讨AI提示工程的定义、应用领域、技术创新以及未来发展趋势……

开源生态系统中涌现出多个关键模型,它们在各类应用场景中展现出独特优势。

本文将深入讲解模型遗忘的成因及多种有效解决方案,助你在微调大模型时保持知识的连续性和稳定性。

微软重磅发布《大语言模型(LLM)上手指南》白皮书,从原理、发展现状、训练和微调、应用场景等不同方面概括介绍基于 GPT 的大语言模型

今天,我们要介绍的 GitHub 仓库——LLM Engineer Toolkit,或许能成为你的得力助手!