所谓 大:模型结构大, 参数量大,训练数据量大
语言大模型综述
420B token的数据集让模型可以通过上下文学习来理解并执行下游任务,并且统一了图片/视频、有监督/无监督、合成/真实、2D/3D/4D等几乎所有的数据形式。
Sequential Modeling Enables Scalable Learning for Large Vision Models