Deepseek在中国春节期间风靡一时,成为提升中国人科技自信的AI产品。与此同时,美国和欧洲一些国家政府开始警惕这款来自中国的生成式AI大规模语言模型,将其视为“威胁产品”。那么,日本社会对Deepseek又是如何评价和对待的呢?
专门研究推广美国ChatGPT的日本恒星公司发表了一篇关于Deepseek的分析文章。文章指出,同样规模的大型模型开发成本通常在1亿美元左右,而Deepseek仅用两个月时间就以550万美元的价格开发出来,这让许多AI公司感到惊讶。特别是在美国商务部对Nvidia H800 GPU出口中国实施限制的情况下,Deepseek能在短时间内维持大型GPU集群并学习大量参数,这一点尤为引人关注。Deepseek V3拥有6710亿个参数,为全球人工智能界提供了新的选择。
然而,随着参数数量和训练数据量的增加,成本、监管和性能方面的障碍也在增加。Deepseek能否真正成为OpenAI和meta的竞争对手,以及能否被全球广泛采用,仍面临重大挑战。
野村综合研究所的战略分析师長谷佳明在日本经济新闻上发表文章称,Deepseek以低成本、高性能的特点被誉为“人工智能的人造卫星”,展示了中国在人工智能领域的创新力。他同时指出,Deepseek的低成本主要得益于模型结构和学习方法。尽管有一些亮眼的表现,如强化学习的有效应用,但很多技术是对现有理论的发展和改进。作为一家小规模的初创企业,能够开发出如此高性能的模型,这对世界产生了巨大影响。