DeepSeek开源大模型V3.1 128K上下文窗口创行业新纪录

2025-08-20 12:37:24   |   棠糖   |   1401

8月20日凌晨,国内人工智能企业深度求索(DeepSeek)在Hugging Face平台正式开源新一代大语言模型DeepSeek-V3.1-Base。这款拥有6850亿参数的巨型模型最引人注目的特性是其128K的超长上下文处理能力,标志着国产大模型在长文本理解领域取得重大突破。

据官方介绍,此次开源的Base版本与线上服务同步升级的V3.1版本保持核心能力一致。即日起用户可通过官方网页、移动应用及小程序体验增强后的长文本处理功能,API接口则保持原有调用方式无需调整。这种"开源即商用"的部署模式,既为开发者社区提供了研究基础,也确保了商业服务的连续性。

技术文档显示,128K的上下文长度相当于模型可一次性处理约10万汉字的内容,较此前主流模型的32K长度实现四倍提升。这项突破使得模型能够更好地理解长文档、进行跨段落推理以及维持长对话的连贯性,在金融分析、法律文书处理等专业场景具有显著应用价值。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

DeepSeek开源大模型V3.1 128K上下文窗口创行业新纪录

2025-08-20 12:37:24 浏览量: 1401 作者: 棠糖

8月20日凌晨,国内人工智能企业深度求索(DeepSeek)在Hugging Face平台正式开源新一代大语言模型DeepSeek-V3.1-Base。这款拥有6850亿参数的巨型模型最引人注目的特性是其128K的超长上下文处理能力,标志着国产大模型在长文本理解领域取得重大突破。

据官方介绍,此次开源的Base版本与线上服务同步升级的V3.1版本保持核心能力一致。即日起用户可通过官方网页、移动应用及小程序体验增强后的长文本处理功能,API接口则保持原有调用方式无需调整。这种"开源即商用"的部署模式,既为开发者社区提供了研究基础,也确保了商业服务的连续性。

技术文档显示,128K的上下文长度相当于模型可一次性处理约10万汉字的内容,较此前主流模型的32K长度实现四倍提升。这项突破使得模型能够更好地理解长文档、进行跨段落推理以及维持长对话的连贯性,在金融分析、法律文书处理等专业场景具有显著应用价值。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号