联合嵌入预测架构(JEPA):从理论构想到世界模型的实践之路
1. 引言与概述
2022年,图灵奖得主、Meta首席AI科学家Yann LeCun发表了一篇影响深远的立场论文《A Path Towards Autonomous Machine Intelligence》,在这篇论文中,他系统性地阐述了一种全新的机器学习范式——联合嵌入预测架构(Joint Embedding Predictive Architecture,简称JEPA)。这一架构的提出并非空中楼阁,而是基于LeCun对当前人工智能发展路径的深刻反思:他认为当前以自回归生成为核心的大型语言模型(LLM)并非通往人类级别智能的最优路径,真正的通用人工智能需要具备像人类一样构建世界内部模型、理解物理规律、进行因果推理的能力。
JEPA的核心思想源于认知科学中的预测编码理论(Predictive Coding Theory),该理论认为生物神经系统的学习本质上是通过预测感官输入来构建对世界的内部表征。与传统的生成式模型在像素或token空间进行重建不同,JEPA在抽象的表征空间中进行预测,这使得模型能够专注于捕捉数据中可预测的、具有语义意义的规律,同时忽略那些难以预测且与任务无关的低
By Ne0inhk
10 Feb 2026