阿里开源Qwen3-Embedding系列模型：多语言文本检索能力行业领先

2025-06-06 10:35:18 | 文白不白 | 1466

6月6日，阿里正式开源Qwen3-Embedding系列模型，包含Embedding（文本表征）和Reranker（排序）两大模块，专为文本检索、语义匹配等任务优化。该系列基于Qwen3基础模型训练，在多项基准测试中表现卓越，尤其在多语言支持方面达到行业领先水平。

阿里官方数据显示，Qwen3-Embedding系列在多语言文本表征任务中表现突出：8B参数版本在权威评测MTEB（Massive Text Embedding Benchmark）多语言榜单中排名第一（得分70.58），超越多家商业API服务。Reranker排序模型在文本检索任务中显著提升结果相关性，适用于搜索、推荐等场景。提供0.6B、2B、8B三种参数规模，开发者可根据算力需求灵活选择。

此次开源延续了阿里通义千问（Qwen）系列的技术路线，降低企业部署AI检索能力的门槛。随着大模型竞争进入垂直化阶段，高效的Embedding与Reranker技术将成为搜索、知识库等场景的核心基础设施。

目前，模型代码及权重已公开，开发者可通过阿里官方GitHub仓库获取。业界预计，该系列将推动多语言检索技术的进一步普及。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。