《人工智能资讯周报》探讨人工智能对公共政策、治理和政策建议的影响,探索人工智能对商业、政治和社会的影响,以确定潜在的研究领域,探讨可能的合作研究和机构伙伴关系。本刊着重提供中国人工智能发展动态和对人工智能的思考,同时关注全球范围内人工智能相关研究动态。本刊旨在通过可靠的研究,来帮助企业、研究机构和公民预测和适应技术引领的变化
中美人工智能公司Deepseek与OpenAI的盈利模式对比凸显了两类不同的AI公司发展路径。Deepseek凭借技术创新,以极低的成本实现高效盈利,其开源策略和产学研用合作模式不仅降低了AI技术门槛,还推动了全球协作创新。相比之下,OpenAI依赖强大的算力和基础设施,通过许可费用和灵活的订阅服务盈利,其商业模式更侧重于尖端技术的企业化应用。Deepseek通过技术创新和开源策略建立的发展模式,不仅正在挑战OpenAI的算力垄断,动摇其闭源技术霸权,更对当前美国技术封锁政策构成了实质性的挑战。
2025年3月,路透社、TechCrunch等外媒广泛报道:中国人工智能初创公司Deepseeek称 得益于先进的技术优化,其在线%的非凡利润率。Deepseek以其极低的训练成本及经济高效的模型正在颠覆全球AI行业,通过揭示其收入潜力的细节,Deepseek 不仅证明了自身业务的可行性,还推动了关于 AI初创公司不同盈利模式对于行业冲击的持续讨论。
2023年7月,杭州深度求索人工智能基础技术研究有限公司(Deepseek)由中国知名量化私募巨头幻方量化创立,并获得中国对冲基金High-Flyer的全资资助。High-Flyer专注于量化交易,利用人工智能算法分析金融市场并执行交易,所产生的利润为Deepseek的AI研发计划提供了充足的财务支持。Baiont Quant首席执行官Feng Ji表示,该公司通过机器学习实现无人工干预的交易,他认为“Deepseek是对那些仍然不相信AI力量的人的最后呼吁。”尽管Deepseek独立运营,其资金完全来自于梁文锋创立的量化对冲基金,这种独特的融资模式使其能够在没有外部投资者压力的情况下,专注于长期的人工智能研究与开发。据报道,该公司拥有大量GPU,最初用于交易和挖矿(利用计算机硬件进行加密货币的挖掘过程)目的。Jina AI CEO Han Xiao认为,Deepseek似乎是一个副项目,它充分利用了这些GPU资源,从而以远低于竞争对手的成本进行模型训练和运行。
Deepseek提供对其高级AI模型的API访问,通过有竞争力的定价吸引了广泛的用户群体,从而实现了一定的API订阅收益。该公司通过其API提供两种主要模型:Deepseek-V3和Deepseek-R1。前者是Deepseek-chat 模型的升级,是在海量文本(15 万亿个token)上训练的通用模型,后者专为高级推理、数学和编码任务设计,提供高级问题解决的能力。Deepseek采用基于token的定价结构,根据处理的输入和输出token数量收费,定价因使用的模型和是否使用上下文缓存而异。通用模型方面,Deepseek-V3 API服务定价为每百万输入tokens 0.5元(缓存命中)/ 2元(缓存未命中),每百万输出tokens 8元。推理模型方面,Deepseek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/ 4元(缓存未命中),每百万输出tokens 16元。
Deepseek的创新AI开发方法强调成本效益,以更低的开销运营。这种战略效率使Deepseek 能够有效地分配资源,支持其开源计划和创收服务。具体而言,该公司采用深度强化学习取代传统的监督微调方法,使模型能够通过试错学习和算法奖励进行自我改进,特别是在提升Deepseek-R1的推理能力方面效果显著。模型通过与环境互动获取反馈,模仿人类的经验学习,从而提升其复杂推理能力及对新情况的适应性。此外,Deepseek的专家混合架构(MoE)允许仅激活特定任务所需的参数,类似于只调动相关领域专家来解决具体问题。摩根士丹利的研究报告称,Deepseek模型中的MoE系统在任何给定时间的活动参数都低于6%,从而降低了能源需求,进而降低了总体成本并提升了模型性能。同时,Deepseek-V3引入的多头潜在注意力机制能够识别细微关系并处理多个输入,多个“注意力头”使模型能够专注于输入数据的不同部分,从而更全面地理解信息。最后,Deepseek还采用蒸馏技术,将大模型的知识和能力转移到更小、更高效的模型中,使得强大的AI解决方案能够被更广泛的用户和设备使用,提升了模型的灵活性和可达性。由此可见,Deepseek通过这些创新技术降低成本,无需收取高价的同时大规模地将模型货币化。
Deepseek将其模型和训练协议开源,一方面,开源策略降低了高级AI研究的准入门槛,使用户可依据自身需求进行定制开发。Omniscien Technologies 首席技术官Dion Wiggins提到,公开的Deepseek-V3和Deepseek-R1模型,允许任何拥有合适工具的人进行测试、验证并在此基础上进行开发。Deepseek 发布了从1.5B到685B大小不等的一系列模型,这些开放的基础提高了其工作的可访问性,各种模型大小确保了包括学术研究人员和行业从业者在内的不同受众均能轻松使用。另一方面, Deepseek通过维护清晰的沟通渠道和认可社区贡献,营造了一个协作的开源生态。在这个环境中,开源贡献直接推动了工具的演变,更多的开发者得以通过合作创新和共同改进,持续促进模型的迭代与优化。世界经济论坛的报告指出,Deepseek的开源特性将进一步促进协作环境的形成,并加速AI领域的创新。
Deepseek通过与学术机构、行业领军者和开源社区的合作,显著增强并扩大了其影响力。这些合作伙伴关系旨在解决机器学习、自然语言处理和 AI 系统优化方面的实际挑战。例如,在Deepseek与清华大学和北京大学等机构的一项联合研究中,研究人员致力于探索降低基于transformer模型计算开销的技术,从而为在资源受限的硬件上部署大型语言模型的开发者提供实用见解。此外,Deepseek与云服务提供商合作,通过技术服务费或授权费等分成收益,华为云、阿里云和腾讯云等多家云平台相继上线Deepseek的大模型,进一步推动了其市场扩展。除了正式的合作伙伴关系外,Deepseek积极贡献于开源项目和社区驱动的计划,发布了其对话式AI模型的轻量级版本,允许开发者对其进行微调以满足如代码生成或客户支持等特定应用需求。中国电信研究院虞苏妍认为,广泛的产业合作有利于双方在拓展市场和客户资源上的互利共赢,也对Deepseek用户增长和市场拓展带来了不小影响。
综上,Deepseek作为一家由量化私募公司全资资助的新兴AI公司,能够专注于长期的AI研发,同时通过提供API访问吸引用户群体付费。此外,Deepseek还强调效率变现,通过创新技术降低运营成本,提高模型的训练和运行效率。其商业模式则基于开源生态与战略合作,促进技术共享和协作创新,加速商业价值释放。
OpenAI成立于2015年,最初是一家非营利组织。在2019年,它采用了“上限盈利”模式来吸引大规模AI研究所需的投资,并转变为营利性组织。目前,OpenAI 产生的绝大部分收入来自对使用其模型或产品的客户收取的许可费。OpenAI通过按单位收费的方式对其提供的产品或服务进行盈利,例如Dall-E图像生成模型的单价为每张图像 0.016 USD 到 0.020 USD。其语言模型采用tokens进行定价, 根据 OpenAI 的数据,1000个tokens等于大约750个单词,每个模型都提供针对特定使用案例量身定制的独特功能。此外,客户还可以微调OpenAI的现有模型,但需要支付相当高的费用(Davinci 的微调模型费用为0.12美元,而标准模型为0.02美元)。
OpenAI的订阅服务已经成为其盈利模式的关键支柱之一,据Future Research的报告,ChatGPT Plus付费订阅服务占OpenAI总收入的55%。通过提供免费和付费套餐,OpenAI成功吸引了从个人用户到企业客户的广泛群体。2023年2月,OpenAI推出了名为ChatGPT Plus的高级版聊天机器人,每月收费20美元,该订阅服务为用户提供了对计算资源的优先访问权限,使得他们在需求高峰时也能顺畅使用。值得注意的是,虽然ChatGPT Plus对于付费用户提供了更快的响应时间和优先获取新更新的优势,但其核心产品ChatGPT基础版仍然可以免费访问,以吸引更多用户并收集反馈,从而不断优化语言模型的输出。这种灵活的收费策略不仅提升了用户体验,也为OpenAI持续发展和技术进步提供了资金支持。
OpenAI 财务战略的基石是与 Microsoft 的合作伙伴关系。早在2019年7月,Microsoft就向新成立的OpenAI LP投资了10亿美元,并为OpenAI提供必要的处理单元来训练其图像和语言模型。作为交换,这家科技巨头将能够将GPT整合到各种不同的产品中,尤其是Azure和Office365,其Azure OpenAI服务不仅托管 OpenAI 的模型,还通过企业级解决方案创造收入。这种合作强调了OpenAI的研究专业知识与Microsoft的云基础设施之间的共生关系,根据微软三季度财报,目前已有18000名客户通过Azure 购买OpenAI软件,企业客户代表了更深层次的消费潜力,基于他们的计算需求可以带来更高的利润。通过融入Microsoft现有的客户生态系统,OpenAI能够显著提高其模型的分发效率,并增加来自许可费的收入。除此之外,该公司在多轮融资中筹集了大量资金,知名投资者包括红杉资本、Tiger Global Management和Andreessen Horowitz。
OpenAI通过深度融合尖端人工智能研究与商业化应用,构建了一种以技术领先和普惠价值为核心的独特商业模式。该模式以持续的突破性创新为动力,开发了包括GPT-3、DALL-E和OpenAI Codex在内的多种先进技术和工具。其中,GPT-3作为拥有1750亿参数的语言模型,在自然语言处理领域展现了卓越的“少样本”和“零样本”学习能力,成为技术优势的典型代表。OpenAI通过将尖端模型和产品授权给企业,帮助其将最先进的AI技术整合到自身应用中,从而推动业务变革。例如,2024年4月,OpenAI与生物技术公司Moderna扩大合作,授予其员工访问ChatGPT Enterprise的权限,并共同开发定制化的GPT模型,增强数据分析和图像生成能力,旨在通过AI解决方案优化Moderna的人力资本管理。此外,2024年5月,OpenAI与开发者社区Stack Overflow合作推出生成式AI项目“Overflow AI”,整合语言模型以扩展规模并为用户创造更多AI产品;同年1月,OpenAI与亚利桑那州立大学签署协议,进一步扩大对最新ChatGPT Enterprise的访问权限,提供更高的安全性、隐私保护及更快的技术对接能力。通过这些合作,OpenAI不仅强化了自身技术生态,还为应对AGI相关挑战和风险贡献了集体智慧,确保其技术的负责任开发与部署。
综上,OpenAI的盈利模式主要依赖于许可费用和灵活的订阅收费,吸引广泛用户群体。该公司与微软等资本的战略合作为其提供了庞大的基础设施与算力支持,优化了模型分发效率。其商业模式融合尖端AI研究与商业应用,致力于企业版订阅解决方案,确保技术安全与有效部署。
在成本和定价方面,Deepseek通过技术创新实现效率最大化,使其能够以更具竞争力的价格迅速扩展市场,而OpenAI则依赖于基础设施和高端硬件的算力堆砌,导致其运营成本高昂。具体而言,Deepseek仅花费560万美元训练出V3大型语言模型,其性能基准与OpenAI的GPT-4相当,而后者的训练成本据报道则超过了1亿美元。此外,推理成本上,OpenAI o1每百万输入和百万输出token分别收取15美元和60美元,而Deepseek R1同样输入与输出的价格分别只要0.55美元和2.19美元,约为前者的3%。因此,Deepseek的高效率重新定义了AI采用的投资回报率,降低了企业和初创公司的门槛。
在可访问性和部署方面,Deepseek的开源模型提供了更多灵活性和创新空间,而OpenAI则因其相对封闭式的架构在定制化和本地部署能力上受到限制。具体而言,OpenAI的尖端模型o1及o1 Pro是闭源的,用户只能通过付费API或像Microsoft Azure这样的平台进行访问,并需依赖OpenAI的基础设施,其本地化相对能力有限。相反,Deepseek的开源模式允许开发者在本地或云中免费下载、修改和部署模型,并支持在标准硬件上运行的较小版本,使得基础设施成本显著降低,其社区驱动的开发方式开辟了新的定制和区域部署的可能性。
综上,Deepseek专注于成本效益的创新、领域专业化及开源可访问性使其开辟了一个针对重视定制解决方案而非“一刀切”AI系统的特定市场空间。相对而言,OpenAI的尖端模型(o1和o1 Pro)则维持了其作为多功能和通用巨头的地位,它们在处理创造性、多语言及复杂推理任务方面的卓越能力,使其能够满足需要广泛适用性的企业需求。
首先,Deepseek以技术创新降本增效的盈利模式直接挑战了OpenAI的算力垄断。长期以来,以OpenAI为例的科技巨头倡导的逻辑是,通过巨额的资金投入来推动AI基础设施建设,从而形成庞大的数据中心、尖端的硬件设施以及稳定的电力供应,进而改善训练环境并提升AI模型性能。例如,在特朗普政府的支持下,OpenAI与软银、甲骨文及主权基金MGX共同成立了合资公司星际之门,计划在美国建设多个大规模数据中心,OpenAI的目标是在未来几年内建立5至10个数据中心园区,每个园区将具备至少1吉瓦的计算能力。此外,2025年3月31日,OpenAI将在软银集团领投的新一轮融资中筹集高达400亿美元的资金,以推进人工智能研究、扩展计算基础设施,增强其算力。然而,Deepseek的高效率、高性能表明“唯算力论”或许并非绝对。卡内基国际和平基金会研究员Sam Winter-Levy认为,“Deepseek的效率和开放可用性表明,美国领先的科技巨头的地位可能没有市场想象的那么安全,我们可能正在目睹 AI 基础设施的过度建设。”
其次,Deepseek的开源共享商业模式正在瓦解OpenAI闭源体系的技术霸权。通过推出开源模型,Deepseek使全球研究人员、企业等能够更容易地参与到AI研发当中,促进技术的协作与进步。对于那些无法投入巨额资金进行专有AI开发的国家和公司而言,Deepseek提供了前所未有的全球竞争机会。据报道,Deepseek在1月累计获得了1.25亿用户,尤其在印度等新兴市场中获得了显著的反响,自推出以来印度贡献了15.6%的跨平台下载量。Deepseek的开源模式有助于形成一个更具协作性的全球科技生态系统,削弱了美国等科技巨头对全球的AI技术霸权。1月下旬,OpenAI首席执行官Sam Altman表示,该公司未能采用开源AI可能“站在历史错误的一边”,并在3月透露OpenAI计划“在未来几个月内”计划发布自 GPT-2以来的第一个开源人工智能模型。
最后,Deepseek的发展战略使得美国技术封锁政策面临挑战。在拜登政府执政期间,美国进一步强化了所谓的“小院高墙”战略,加大了对中国的先进芯片出口管制,试图阻滞其高科技发展步伐。在任期的最后阶段,拜登政府仍然积极出台了“先进人工智能技术负责任传播监管框架”以限制先进AI技术的传播。然而,Deepseek的创新开发方法和开源协作的模式显示出,技术封锁措施可能无法如预期那样有效地遏制创新,反而可能激励其创新能力的发展。正如美国外交关系协会研究员Kat Duffy指出,美国越是推动中国开发人员在高度受限的环境中进行建设,就越有可能将中国定位为开发具有成本效益、节能的 AI 方法的全球领导者。对此,OpenAI在2025年3月向美国政府提交的政策建议文件中提到,以Deepseek为代表的中国人工智能企业飞速发展使得美国的领先优势正在逐步缩小,并建议美国政府应进一步推动传播所谓的“民主化AI”战略,以维护美国在全球AI领域的领导地位。由此可见,Deepseek的创新发展模式不仅彰显了其卓越的技术实力,更预示着全球AI竞赛格局的深刻变革。
中国人工智能初创公司Deepseek以其低成本和高效能的盈利模式与美国AI公司OpenAI形成鲜明对比。Deepseek凭借量化交易利润推动技术研发,采用双模型的差异化定价策略,通过开源生态和产学研用合作加速商业价值释放。相较之下,OpenAI借助强大的算力和AI基础设施,依赖高额的许可证费用、灵活的订阅模式进行盈利,其商业模式聚焦于将尖端技术应用到企业级解决方案。二者的根本差异反映了Deepseek以技术创新为核心的盈利模式正直接挑战OpenAI的算力垄断,其开源战略进一步削弱了OpenAI的技术霸权,同时在一定程度上对美国的技术封锁政策构成挑战。
海国图智研究院(Intellisia Institute)是中国第一批独立的新型社会智库之一。海国图智专注于国际问题研究,并主要聚焦中美关系、中国外交、风险预测、新科技与国际关系等议题,致力于通过书目与报告的出版、学术与社会活动的组织、研究项目的承接和开展等形式为政府、企业、媒体、学界社会公众提供知识资源,以帮助其更好地“开眼看世界”,了解中国与世界的关系,为其对外事务提供战略见解和政策解决方案。