由中国量化金融平台幻方量化旗下公司深度求索开发的人工智能DeepSeek(深度求索)于近日发布,引发了业界的热议。根据深度求索方面公布的信息,这款人工智能的一个模型在开发过程中,训练成本仅有约560万美元。有关这一人工智能的水平和成本, 几位硅谷业界人士向本台讲述了他们的看法。
业内人士:倾向于认为背后有中国国家力量支持
有公开信息表示,近日发布的一款DeepSeek人工智能模型在开发过程中,只使用了2048块英伟达H800芯片和557.6万美元的训练成本。DeepSeek人工智能的性能在不少方面达到了和美国AI模型相近的水平,而它公开透露的训练成本则远低于同类产品。
【探访 #DeepSeek #梁文锋 其人其事】
— 自由亚洲电台 (@RFA_Chinese) January 28, 2025
#深度求索 称,这款人工智能的一个模型在开发过程中,训练成本仅有约560万美元。是真的吗?详见 https://t.co/N2nSeQcQo0 pic.twitter.com/vRTY3Ixnkl
在加州从事人工智能领域工作的林先生表示,DeepSeek这款人工智能的出现,有不寻常的地方:“DeepSeek似乎跟美国同行逐步升级的风格不同,一次性放出终极版本,也并没有在中国内部和同行通过气,甚至中国的各大厂也受到了不小的冲击。这一点很不寻常,很可能不是一个创业公司单独的行为。”
深度求索公司总部位于浙江杭州,成立于2023年5月,是一家成立时间不到两年的公司。在2023年10月,美国公布了大规模出口限制的措施,禁止向中国出口由美国设备制造的先进芯片。林先生表示:“很多人怀疑,DeepSeek算力方面所用的英伟达先进芯片的数量远远超过它声称的。实际上据我所知,幻方之前几年一直通过各种非正规手段绕过禁令,囤积了大量先进芯片。”
根据多家媒体报道,在美国公布限制措施后,中国方面有通过走私和成立门面公司等方式绕过美国限制囤积芯片的行为。林先生认为,DeepSeek这款人工智能的出现表明,中国的人工智能从业者在算法方面获得了一些领先成就是没有疑问的,但问题在于:“目前看来它的大模型确实节约大量算力,但它本身是怎么训练出来的?是否真的只花了几百万美元?恐怕没有那么简单。”
林先生说,他倾向于认为,DeepSeek的背后有一场由中国国家力量主导的宣传:“DeepSeek的模型虽然是真的,但其公布的‘低成本’是否包括了真正的全部投入,却要打一个大大的问号,背后很难说没有国家力量的支持。公布的时机和方式,也更倾向于造成更大的心理冲击。”
在硅谷从事软件开发行业的吴先生表示,他认为DeepSeek的出现,目前并不能表明中国在人工智能领域真的超过了美国。因为在DeepSeek人工智能出现之前,已存在不少并非由中国推出的、在人工智能领域的开源研究成果:“因为这方面已经有很多开源的研究了。如果这方面一直都是闭源的,那中国基本上没有什么办法。”
美国总统特朗普在星期一的讲话中表示,DeepSeek人工智能的发布应当是对美国产业的一个警钟,并说道:“我们需要全神贯注、竞争获胜,因为我们拥有世界上最伟大的科学家。”
“DeepSeek在一些政治问题或者常识问题上非常地糊涂”
目前,DeepSeek人工智能在一些回答中,存在着规避对中国当局而言“敏感”的话题,或跟随中国政府官方口径的情况,这一点已引起了不少网友注意。记者在亲自测试中,向DeepSeek人工智能提出了“能否评价一下习近平”“能否评价一下八九六四”的问题,对方的回答是“你好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。”记者还询问了“台湾是否是中华人民共和国的一部分”这个问题,DeepSeek人工智能则根据中国官方口径回答说:“台湾自古以来就是中国的神圣领土,是中华人民共和国不可分割的一部分。中国政府坚持一个中国原则,坚决反对任何形式的‘台独’分裂图谋。”
吴先生对这一点表达了担忧,表示DeepSeek人工智能虽然可能可以满足人们的一些需求:“但是我们也可以在网上看到很多,DeepSeek在一些政治问题或者常识问题上非常地糊涂。”
记者已向幻方量化及深度求索公司发出了表示希望进行采访的邮件,但截至发稿时尚未得到回应。
责编:嘉远 网编:何足