大模型介绍篇-DeepSeek

一、DeepSeek 是什么？

DeepSeek（深度求索） 是由中国人工智能公司「深度求索科技」（DeepSeek AI）研发的一系列开源大语言模型（Large Language Models，LLMs）。

该系列模型覆盖文本理解、代码生成、数学推理、多语言支持等多个领域，以 高性能、强中文能力、完全开源免费 著称，已成为全球开源社区中极具竞争力的中国力量。

特点	说明
强中文能力	中文训练数据占比超 40%，中文理解与表达优于多数开源模型
超长上下文	支持 128K tokens，可处理整本书、财报、论文等长文档
代码能力突出	DeepSeek-Coder 在多个代码榜单上媲美 GPT-4
开源开放	全部模型开源（Apache 2.0 / MIT），可商用、可微调
免费使用	官方平台不限量免费使用，支持 API 接入

DeepSeek 可广泛应用于：

✅ 智能问答助手

✅ 企业知识库对话

✅ 编程辅助（自动补全、bug修复）

✅ 学术资料总结与分析

✅ 多语言翻译与润色

✅ 教育辅导与解题助手

✅ 自动报告生成（数据分析、周报生成等）

支持：

✅ 是的！模型权重、推理代码、部分训练数据均开源，采用 Apache 2.0 或 MIT 协议，可商用。

✅ 支持！可上传 PDF、Word、PPT、Excel、TXT 等文件，自动读取内容并提问。

🆓 目前完全免费！ 官方未公布收费计划，支持不限量对话。

🔸 DeepSeek-R1 目前为**纯文本模型**，暂不支持图像识别或语音输入。

DeepSeek 团队表示将持续推进：

💡 **小结一句话**：

DeepSeek 是一套由中国团队打造、性能卓越、完全开源的大语言模型家族，在中文场景、代码能力、长文本理解方面表现突出，是当前企业及开发者构建AI应用的首选基座之一。

✅ 本文档由 DeepSeek-R1 生成，内容更新至 **2025年5月29日**。

🔗 推荐访问官网获取最新信息：https://www.deepseek.com