真正的AGI或将诞生于大语言模型外

2024-12-14 09:11 来源:文汇报

  原标题:今天的“非共识”探索可能会成为未来引领性技术  真正的AGI或将诞生于大语言模型外

  在惊喜与担忧之间,人们正学着接纳和拥抱人工智能(AI),惴惴不安地揣测着通用人工智能(AGI)何时到来。然而,在业内专家看来,作为本轮AI热潮的主角,大语言模型还只是一个探路者,离真正的AGI仍相距甚远,甚至根本不是通达AGI的正途。

  昨天开幕的首届浦江AI学术年会“非共识研究与创新”专题论坛上,专家表示,在大语言模型及其尺度定律(Scaling Law)之外,人工智能还有着广阔的发展空间。

  大模型能找到“自己的DNA”吗

  “如果在两年前,我会坚定地参加主流共识的论坛讨论,而我现在却更想探讨‘非共识’。”香港中文大学副教授、上海人工智能实验室领军科学家成宇提到,如今风生水起的机器学习、神经网络,在几十年前都属于非主流研究,今天的“非共识”探索,或许会成为未来一飞冲天的引领性技术。他相信,纯靠数据“喂养”,现今大模型的智能水平不可能再提升一个级别,“我们一定需要探索新的编码结构”。

  经济学中,菲利普斯曲线发现了通胀率和失业率之间的关联性,然而当它不断被修正后,反而不再被各国制定政策时参考采信。而生命科学中的孟德尔遗传定律,至今仍发挥着重要作用。

  同样源于大量数据,为何这两条“经验性”理论会走向截然不同的结局?上海财经大学助理教授滕佳烨认为,一个理论的形成要经历“从数据中来—普适性验证—完善理论—普适性实践”四步,上述两条理论正是在第三步分道扬镳——DNA的发现使孟德尔遗传定律找到了更根本而坚实的基础。

  目前,来源于神经网络模型的尺度定律,为大语言模型奠定了基础。“如果它能避开不断被修正、直到面目全非的陷阱,像孟德尔定律一样找到‘自己的DNA’,未来将可能在更多地方开枝散叶。”滕佳烨认为,目前尺度理论只是在Transformer模型上获得了成功,探讨其适用边界,即它在何时成立,也是一个极有意义的课题。

  下一代AI离不开“脑启发”

  能耗过高、推理不行、智力欠缺……尽管大语言模型展现了空前强大的机器智能,却仍被AI专家各种“鄙夷”,究其根本,是因为有人脑智能这种完美的存在。

  与人脑相比,目前AI的“性价比”实在欠佳。中国科学院自动化研究所研究员李国齐说,人脑中神经元也就千亿级别,功耗不过20瓦,而现在大语言模型的参数规模已经万倍于这个数量,耗能更是超出人脑,但其所实现的智能水平远不及人脑。“这说明,人脑一定有可借鉴之处。”

  例如,神经元虽然数量有限,但每个细胞内部却有丰富的动力学结构——如果用机器神经元模拟,需要用到几十个、上百个常微分方程。李国齐认为,目前大语言模型的每个单元都非常单一,“大模型的外部规模不可能无限扩大,或许增加每个单元的内生复杂性,将会是大幅提升AI性能、降低总体能耗的一条重要路径”。

  在清华大学计算机科学与技术系副教授崔鹏看来,目前的大语言模型只是在数据与算力上“摸天花板”,而AI智力的天花板在何处,尚未触及。“学术界应为AI探索更聪明的学习方式,比如机器智能是否有更强的举一反三能力,能否用更少的数据达到更高的智力水平。”崔鹏认为,人类对自身的智能产生过程还知之甚少,AI发展之路还相当漫长。

  北京大学人工智能研究院陈宝权教授则对机器智能抱有相当的敬畏之心。“人的生命有限,而机器寿命无限,这意味其知识可以不断积累”。同时,未来量子计算加持下的AI智能将如何发展,或许完全超出想象。

  多模态“解锁”具身智能复杂动作

  多模态与跨具身智能,同样是“非共识”前沿探讨的热门话题。

  “大模型也会有‘右利手’‘左撇子’,我们想通过平衡训练实现‘双手并用’,从而更充分地利用数据。”中国人民大学副教授胡迪发现,当同时训练不同模态的两个模型时,一个会越来越占优势,用到更多数据,而另一个则会偏弱。于是,他带领团队探索出一套平衡策略,让两个模型能够均衡发展,结果发现其合作的结果可使整体效能更强大。

  在此基础上,胡迪团队将这一成果用于多模态AI模型。例如,通过视觉、声音、触觉的多种模态智能模型的合作,让机械臂完成往杯子里注水的动作。他们惊喜地发现,机器人学会了在不同阶段调用不同模态信息,来控制动作。“用多模态控制复杂动作,过去在具身智能中并不受关注,但未来可能发挥重要作用。”胡迪说。

  “人形机器人虽然更容易复制人类行为,但其硬件成本高、电机力矩不足,很难完全模拟人手的功能。”即将赴新加坡国立大学任教的刘星昱正在研究如何通过跨具身形态的策略迁移,将人手与机械手在机械结构上尽可能实现统一。

  “人形机器人会后空翻,却从未演示过攀岩,这是因为受电机部件限制,它们的仿真手无法像真正的人手那样发力。”刘星昱通过一系列的微调策略,根据需要将人手“变形”到目标机械手,这样就能得到算法简洁、可扩展性强、适用于不同任务、不同机器人的仿真手,让机械人既方便制造与控制,又能实现更强功能。

  (本报记者 许琦敏 《文汇报》2024-12-14 )

更多资讯或合作欢迎关注中国经济网官方微信(名称:中国经济网,id:ourcecn)

查看余下全文
(责任编辑:李冬阳)