法国初创公司Mistral AI的首席执行官Arthur Mensch在法国国家广播电台宣布,公司计划于2024年开源GPT-4级模型,引发了业界的关注。
最近,Mistral AI推出了基于MoE架构的8X7B模型,与GPT3.5和Llama270B等其他流行模型相媲美,并在大多数基准测试中以6倍更快的推理速度超越了Llama270B。该模型采用Apache2.0许可,为开发者提供更大的灵活性。
这一消息传播开后,引起了社交媒体上的热议。一位用户表示对Mistral AI未来盈利的担忧,尤其是在他们称之为“Mistral Tiny”的7B模型发布后。这也让人们对即将发布的“Mistral Medium”模型产生了好奇心。
Mistral AI为其模型分为三个类别:Mistral Tiny、Mistral Small和Mistral Medium。目前已发布的Mistral7B Instruct v0.2和Mixtral8x7B分别属于Mistral Tiny和Mistral Small。有趣的是,Mistral Medium模型尚未发布,但公司表示正在进行开发,并将在标准基准测试中位居前列。
该公司最近宣布获得4.15亿美元的融资,估值20亿美元,由Andreessen Horowitz(a16z)领导最新一轮融资,Lightspeed Venture Partners也加入了续投。为了应对开源大语言模型公司面临的商业可持续性问题,Mistral AI最近推出了“La Plateforme”,为其可用模型提供API端点。
此外,Mistral AI正致力于开发支持多语言的Mistral Medium模型,该模型在英语、法语、意大利语、德语、西班牙语和代码方面表现出色,在MT-Bench评分中达到8.6分,甚至超过了GPT3.5。
值得注意的是,与此同时,有关OpenAI可能在年底发布GPT-4.5的传言也在业界传播。这使得2024年对于开源大语言模型领域来说充满了期待和竞争。