《金融时报》:DeepSeek因华为芯片技术问题推迟R2模型(图)
本文转载自澳大利亚广播公司ABC中文,仅代表原出处和原作者观点,仅供参考阅读,不代表本网态度和立场。
据英国《金融时报》报道,由于在使用华为升腾(Ascend)芯片进行进行深度求索(DeepSeek) R2版人工智能模型训练时遇到持续技术问题, 该公司从今年5月开始一直延期发布这款新生成式AI模型。
深度求索DeepSeek尚未对此置评。 (AP: Andy Wong, File)
据三位知情人士透露,在今年1月DeepSeek发布了R1模型后,中国政府有关部门就鼓励该公司使用国产华为升腾芯片。
DeepSeek的困难显示,中国芯片在关键任务上仍落后于美国竞争对手,凸显了中国在追求技术自给自足过程中面临的挑战。
知情人士称,DeepSeek最终不得不选择用英伟达芯片完成训练,再用华为芯片执行推理任务,这导致该公司在竞争中落后。
据悉,华为曾派工程师团队驻扎在DeepSeek办公室,协助其使用升腾芯片开发R2模型,但即使有团队在场,DeepSeek也未能在升腾芯片上成功完成一次训练。
业内人士指出,中国芯片在稳定性、芯片间连接速度以及软件性能上都不如英伟达产品。
有美国专家认为,华为在用升腾进行训练时正经历“成长阵痛”,但预计这一中国高科技公司最终会适应。
DeepSeek和华为均未对《金融时报》的置评请求做出回复。
本周,北京要求科技巨头就采购英伟达芯片H20删减版芯片的国家安全问题进行说明。据介绍,北京以此推动高科技公司采用华为和寒武纪的替代产品。
本文转载自澳大利亚广播公司ABC中文,仅代表原出处和原作者观点,仅供参考阅读,不代表本网态度和立场。



+61
+86
+886
+852
+853
+64
