今年1月,深度求索(DeepSeek)公司发布通用大模型DeepSeek-R1,以其低成本、高性能的特征在全球引起巨大轰动。DeepSeek的出圈是我国AI发展的重要里程碑,为产业发展带来了一系列有益的启示。
DeepSeek通过并行线程执行(PTX)、混合专家模型(MoE)、多头潜在注意力(MLA)和多Token预测(MTP)四大创新技术,在算力资源远不及国际同行的情况下,实现模型性能的大幅追赶,并将训练成本压缩至行业标杆的10%。这一突破不仅有效降低了大模型部署门槛,也揭示了以算法优化弥补算力短板的可行性,为突破西方主导的“大力出奇迹”的AI发展模式,走出多元化发展路径提供了新方案。
同时,DeepSeek采取完全开源的策略,公开算法、模型权重及训练细节,使全球开发者能借鉴、改进和部署模型。开源生态有助于吸引更多开发者和用户参与,促进技术迭代,有望改变赢者通吃的竞争格局。
尽管DeepSeek取得重要突破,但也应看到,我国AI原始创新仍存短板。2023年在被引用次数最多的生成式AI研究机构前10名中,中国仅占1席。从AI专利数、深度学习模型、机器学习加速硬件等方面来看,我国与美国也仍存差距。
当前,我国数据基础制度建设仍处于起步阶段,数据获取和交换机制尚不健全,行业数据、公共数据获取和访问困难,大模型可使用的数据有限。同时,数据标注是高质量数据供给的基础,由于专业化标注人才短缺,我国数据标注质量仍有待提升,特别是在医疗、自动驾驶等发展需求迫切且对专业性要求高的领域,数据标注的供给规模和准确度难以满足发展需求。
从全球范围看,DeepSeek等国产大模型在全球技术生态中的影响力仍处于起步阶段。从国内看,我国AI发展从基础研究到技术创新,再到场景应用的全链条尚未完全打通。支撑大模型迭代发展的技术、资金、数据、人才等要素流动仍存在梗阻,尚未形成高效的生态闭环。
为此,应加强AI基础研究和技术创新。加快建设AI领域的国家战略科技力量,推动AI与数学、物理、脑科学等基础学科交叉融合,提升AI基础研究水平。鼓励AI技术开源开放,以开源项目为中心,促进开源贡献者、服务者、使用者、运营者等主体共同推动AI技术创新。
统筹大规模数据集建设。加快数据基础制度建设,以政府数据开放为牵引,融合企业和行业数据,推动公共数据集、专业应用数据集建设。针对不同应用场景,制定细化的数据标注规范,针对医疗、自动驾驶等垂直领域,开展专项知识培训,提升数据标注质量。
培育壮大AI初创企业。应发掘具有中国特色的AI初创企业估值模型和平台系统,强化AI初创企业早期估值发现,为政府、金融机构精准识别有潜力、高价值的AI初创企业提供科学参考,为国产AI技术发展壮大注入活力。
打造AI自主产业生态。充分发挥我国海量数据和丰富应用场景优势,组织科研机构、科技领军企业等优势力量,聚焦智能制造、自动驾驶等重点垂直细分领域,统筹布局大模型行业应用创新(工程)中心,依托自主技术,建设集数据、算法、算力于一体的行业通用大模型平台,形成标准化模块化的模型、中间件及应用软件,以开放接口、模型库等推动产业链上下游深度合作,在应用中持续健全迭代自主产业生态。
(本文来源:经济日报 作者:张凤 吴静 作者单位:中国科学院科技战略咨询研究院)
更多资讯或合作欢迎关注中国经济网官方微信(名称:中国经济网,id:ourcecn)