微软发布Phi-3系列AI模型 包含三个版本

2024-04-23 14:52:15   |   唐薇   |   130

近日,微软研究院对外发布了一份技术报告,公布了他们的 Phi-3 系列 AI 模型,其中包括 mini、small 和 medium 三个版本。这些模型分别拥有 38 亿、70 亿和 140 亿参数。

据铋读网了解,微软的 phi-3-mini 模型在拥有 38 亿参数的情况下,通过对 3.3 万亿个 tokens 进行训练,其基准跑分性能已经超出了 Mixtral 8x7B 和 GPT-3.5。这表明即使在参数较小的情况下,Phi-3-mini 也展现出了出色的性能。

微软强调,Phi-3-mini 模型具有在手机等设备上部署的能力,这意味着用户可以在更多的场景下使用这一先进的 AI 技术。此外,Phi-3-mini 进一步整合了严格过滤的网络数据和合成数据,使其在语言理解和推理能力上能够与更大参数的 AI 模型相媲美。

然而,微软也承认,尽管 Phi-3-mini 在某些任务上表现出色,例如语言理解和推理,但在像 TriviaQA 等任务上,模型规模仍然存在一定的限制。除了 Phi-3-mini,微软还公布了 phi-3-small 和 phi-3-medium 两个模型,它们在 MMLU(Microsoft Machine Learning Utility)上的得分分别为 75.3 和 78.2。这表明即使是较小的模型也具有出色的性能表现。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

微软发布Phi-3系列AI模型 包含三个版本

2024-04-23 14:52:15 浏览量: 130 作者: 唐薇

近日,微软研究院对外发布了一份技术报告,公布了他们的 Phi-3 系列 AI 模型,其中包括 mini、small 和 medium 三个版本。这些模型分别拥有 38 亿、70 亿和 140 亿参数。

据铋读网了解,微软的 phi-3-mini 模型在拥有 38 亿参数的情况下,通过对 3.3 万亿个 tokens 进行训练,其基准跑分性能已经超出了 Mixtral 8x7B 和 GPT-3.5。这表明即使在参数较小的情况下,Phi-3-mini 也展现出了出色的性能。

微软强调,Phi-3-mini 模型具有在手机等设备上部署的能力,这意味着用户可以在更多的场景下使用这一先进的 AI 技术。此外,Phi-3-mini 进一步整合了严格过滤的网络数据和合成数据,使其在语言理解和推理能力上能够与更大参数的 AI 模型相媲美。

然而,微软也承认,尽管 Phi-3-mini 在某些任务上表现出色,例如语言理解和推理,但在像 TriviaQA 等任务上,模型规模仍然存在一定的限制。除了 Phi-3-mini,微软还公布了 phi-3-small 和 phi-3-medium 两个模型,它们在 MMLU(Microsoft Machine Learning Utility)上的得分分别为 75.3 和 78.2。这表明即使是较小的模型也具有出色的性能表现。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号