上周末,中国研发的一款名为DeepSeek的人工智能轰动科技界,导致英伟达、谷歌、Meta、微软等美国巨头股价暴跌超1万亿美元。了解它的工作原理以及它如何影响技术世界,特别是 OpenAI 的 ChatGPT。
什么是 DeepSeek

DeepSeek是一家中国人工智能公司,成立于2023年 梁文峰,中国企业家、量化对冲基金联合创始人 雄心勃勃。该基金以在股票投资中使用机器学习技术而闻名,也是该公司人工智能研究的当前资助者。
自2023年以来,该公司因其语言模型或LLM的快速发展而受到全球关注。
低成本开发

模型的主要优点是其开发成本。在最近发布的一篇文章中,该公司解释说,其语言模型 DeepSeek-V3 用过的 2 个 NVIDIA H800 卡,已经相对较老,用于培训 总成本5,5万美元.
相比之下,这只是训练 Meta 的 Llama 3.3 等模型的成本的一小部分,仅今年预计该模型的花费就超过 65% 十亿美元 在其改进中。相比之下,DeekpSeek 的成本最终甚至低于 Meta 公司部分高管的年薪。据分析师称,成本降低幅度令人印象深刻 95%.
这一成就结束了训练人工智能需要对数据中心基础设施和电力进行大量投资的模式,使 DeepSeek 成为一种不仅更便宜,而且在生态上更可持续的人工智能。
从理论上讲,DeepSeek 模型甚至可以在家用计算机上使用传统 GPU 进行训练,而不是使用专门的数据中心和为满足高 AI 需求而设计的非常昂贵的 GPU,这让像 NVIDIA 这样的公司感到惊讶和恐惧,因为 NVIDIA 如此充分地利用了 NVIDIA 的优势。最近,寻求在这个市场分一杯羹的公司纷纷建设数据中心。

出于这个原因,在后来被称为 “DeepSeek 恐慌日” ou “DeepSeek 恐慌日”, 简而言之,27 月 3,5 日,美国高科技公司股票交易所纳斯达克的股价下跌了 XNUMX 亿美元,跌幅达到总交易额的 XNUMX%。 ChatGPT 的竞争对手拥有成功的一切条件。
DeepSeek-V3 和 DeepSeek-R1

该公司的模型也是效率的一个例子。这 DeepSeek-V3例如,它在多个基准测试中都拥有令人印象深刻的性能,同时所需的资源比 Meta 的 Llama 3.3 等竞争对手少得多。还有 DeepSeek-R1于2025年1月推出,专注于推理任务,以其先进的功能挑战OpenAI的oXNUMX模型。
从本质上讲,这两种中国人工智能模型都通过与环境交互并接收行为反馈来学习,类似于人类通过经验学习的方式。这使他们能够发展 更复杂的推理能力 并更有效地适应新形势。这种方法也比竞争对手使用的“人类监督学习”更便宜。
中国人工智能的另一个优势是 节省资源。 DeepSeek 的模型没有使用模型的所有参数来回答查询,而是只为该主题选择一些“特定参数”或“专家”。这种选择性激活显着降低了计算成本并提高了模型效率。

用更简单的方式解释它,就像拥有一个庞大的专家团队可以执行所有类型的任务,但只调用最适合在特定情况下执行该任务的专家,从而保证服务的高效使用和专业知识。
O DeepSeek-V3 还雇用 蒸馏技术,这意味着它将知识和能力从较大的模型转移到更小、更高效的模型。这就像老师将知识传授给学生,让学生以相似的熟练程度执行任务,但经验或资源较少。
其结果是人工智能占用的空间和资源更少,并且可以在智能手机和笔记本电脑等较小设备上高效工作。为了使该应用程序可用于智能手机和网络版本,该公司使用 DeepSeek R1 作为基础,并将其转变为应用程序。
开源模式

除了结合效率和性能技术之外,这些模型还利用了设计项目固有的协作。 开码 (或开源,英文)。
在这里,与像 OpenAI 这样私下开发人工智能的公司不同,DeepSeek 的模型可以在网络上获取其代码,并且可以由全球开发者社区访问、测试甚至纠正,这也反映了更高的透明度和准确性。对所呈现的结果充满信心。
事实上,该公司希望鼓励任何人测试其模型,并为其专业人员发布许可证,以便其他公司更容易使用它们。
该战略还增强了竞争力,吸引人才并突出 DeepSeek 在免费营销中的领导地位。该公司并没有直接受益于此,但将利用该模型的大规模采用,能够通过技术支持或高级版本等补充服务获利,同时培育协作和创新的生态系统。
应用商店排名第一

对 DeepSeek 感到好奇的不仅仅是首席执行官和技术工程师。
R20于1月XNUMX日推出, 适用于 iPhone 的 DeepSeek 应用程序 和 Android 智能手机,似乎正在追随竞争对手 ChatGPT 的成功之路。它已经是美国苹果应用商店下载次数最多的应用程序,在巴西排名第二,仅次于 OpenAI 竞争对手。
Na Play 商店、Android 商店其成功也是不可否认的:在全球范围内,中国聊天机器人的安装量已超过一百万次。
OpenAI 创始人兼现任首席执行官 Sam Altman 谈到了 DeepSeek 的成功。他提到,他正在关注中国人工智能的能力,第一个模型令人印象深刻。请参阅下面的推文和翻译。

deepseek r1 是一款令人印象深刻的型号,尤其是考虑到其价格所能提供的功能。显然,我们将提供更好的模型,并且有一个新的竞争对手也令人耳目一新!我们将发布一些版本。
但最重要的是,我们很高兴能够继续实现我们的目标,并相信现在更多的计算对于成功完成我们的使命比以往任何时候都更加重要。
世界将希望使用大量人工智能,并且会对即将到来的下一代模型感到惊讶。我们期待为您带来 AGI 及其他领域的所有内容。
Sam Altman 谈中国人工智能 DeepSeek 的成功。
影响和政治偏见

但随着成功,质疑也随之而来。专家质疑用于训练 DeepSeek 模型的 GPU 总数是否被低估,其目的是隐藏最近因中美贸易战而被禁止在中国销售的 NVIDIA 硬件的使用情况。但该公司否认了这一事实,称即使使用低功耗 GPU,它也能成功训练其模型。
该工具也有审查的迹象,符合中国共产党的戒律或政治偏见。例如,当被问及 “1989年北京天安门广场大屠杀”数百名活动人士被中国军队打死或打伤,人工智能拒绝回答这个问题。
当人工智能被问及中国与台湾之间的冲突时,也会发生同样的情况。 DeepSeek 提到台湾是中国的一部分 “中国政府坚持一个中国原则,谋求国家和平统一.

下一步是什么?

以显着降低的基础设施成本拥有如此高效的人工智能模型的可能性正在使投资者重新考虑购买甚至出售专注于该领域的科技公司的股票。
传说之一 创投 美国 马克·安德森,将 DeepSeek 的出现视为 “人工智能的人造卫星时刻”, 1957年,历史性的第一颗卫星发射入轨,标志着苏联在太空技术领域暂时超越美国的时刻。
事实是,美国在人工智能领域的优势受到质疑。因此,美国政府很可能会宣布报复,或许会通过对中国公司的美国技术和芯片商业化实施更多制裁。
针对此案,新任总统唐纳德·特朗普称中国公司 DeepSeek 的崛起为美国科技行业敲响了“警钟”,这表明美国应该很快做出反应。
我们将密切关注该话题。在此期间,请告诉我们 评论: 您认为 DeepSeek 能胜任吗? ChatGPT 领导力?
看视频
参见
附资料: 雅虎 l 地面d 新闻 l 信息钱 l “福布斯” (1 e 2)
了解更多关于秀美科技
注册以通过电子邮件接收我们的最新消息。