微软发布Phi-3系列AI模型 包含三个版本
近日,微软研究院对外发布了一份技术报告,公布了他们的 Phi-3 系列 AI 模型,其中包括 mini、small 和 medium 三个版本。这些模型分别拥有 38 亿、70 亿和 140 亿参数。
据铋读网了解,微软的 phi-3-mini 模型在拥有 38 亿参数的情况下,通过对 3.3 万亿个 tokens 进行训练,其基准跑分性能已经超出了 Mixtral 8x7B 和 GPT-3.5。这表明即使在参数较小的情况下,Phi-3-mini 也展现出了出色的性能。
微软强调,Phi-3-mini 模型具有在手机等设备上部署的能力,这意味着用户可以在更多的场景下使用这一先进的 AI 技术。此外,Phi-3-mini 进一步整合了严格过滤的网络数据和合成数据,使其在语言理解和推理能力上能够与更大参数的 AI 模型相媲美。
然而,微软也承认,尽管 Phi-3-mini 在某些任务上表现出色,例如语言理解和推理,但在像 TriviaQA 等任务上,模型规模仍然存在一定的限制。除了 Phi-3-mini,微软还公布了 phi-3-small 和 phi-3-medium 两个模型,它们在 MMLU(Microsoft Machine Learning Utility)上的得分分别为 75.3 和 78.2。这表明即使是较小的模型也具有出色的性能表现。