微软在Build 2026宣布Edge浏览器AI能力升级:新增Aion-1.0-Instruct模型与翻译API
6月3日,在今日开幕的Build 2026开发者大会上,微软宣布在去年为Edge浏览器推出基于Phi-4-mini模型的写作辅助API基础上,进一步扩展了端侧AI能力。本次更新主要包括三项内容:Aion-1.0-Instruct小语言模型的开发者预览版、Edge 148版本中由端侧任务专用模型驱动的语言检测和翻译API,以及在Edge Canary和Dev通道中提供的实验性Web Speech API端侧语音识别功能。
微软表示,过去一年中Edge浏览器的写作辅助API一直基于Phi-4-mini模型(40亿参数),在文本理解、推理和指令遵循方面表现出色,但其硬件要求限制了在不同设备上的可用性。因此,微软即日起在Edge Canary和Dev通道中引入Aion-1.0-Instruct小语言模型的开发者预览版。该模型更小、更快、更高效,可扩展到更多设备——包括GPU性能较低的设备,以及通过CPU推理支持无GPU的设备,同时为广泛的Web使用场景提供良好的输出质量。该预览版允许开发者在真实Web场景中评估模型、测试API互操作性并提供反馈,计划于7月以开源形式发布到Hugging Face。
在Edge 148预览版中,全新的语言检测和翻译API已正式可用。这些API允许网站和浏览器扩展识别文本语言并在语言对之间进行翻译,基于端侧任务专用模型,支持145种以上语言,并针对Web翻译负载进行了优化。开发者可在网站或扩展中使用JavaScript调用这些API,相比云服务可获得更好的用户隐私、网络独立性以及零翻译成本。
在最新的Edge Canary和Dev通道中,微软还引入了处理语音的端侧任务专用模型,实现了Web Speech API的本地语音识别。该实现将语音转文字过程在用户设备上本地完成,可改善用户隐私、降低延迟,并支持低网络连接或无网络场景。开发者只需在现有Web Speech API代码中做少量修改(例如设置recognition.processLocally = true),即可启用端侧语音识别。微软表示,借助Aion-1.0-Instruct小语言模型、新的语言检测和翻译API以及端侧语音识别,开发者可以利用内置于浏览器的模型打造基于AI的Web体验,无需依赖专用硬件、云服务或特定领域专业知识。