生成模型(Generative Model)是机器学习领域的重要课题和研究前沿,也被认为是通往人工智能的必由之路。历史上,物理学为生成型学习提供了很多新思路。比如,著名的玻尔兹曼机(Boltzmann Machine)就来自于统计物理中的伊辛模型及相关的反伊辛问题。最近,中国科学院物理研究所/北京凝聚态物理国家研究中心范桁研究员、王磊副研究员以及合作者从量子物理的玻恩诠释中获得启发,提出了一类新颖的概率生成模型—玻恩机(Born Machine)。玻恩机自然地将研究多体波函数的量子纠缠视角引入机器学习问题中,是量子机器学习领域的新方向。这项工作采用量子多体计算中的张量网络算法学习经典数据的生成概率。该工作于近期发表于Physical Review X杂志上。
生成模型的研究重点是如何从给定的数据集合中学习到数据的联合概率分布,以及如何依据学习到的概率分布高效地生成新的样本。研究团队提出利用量子波函数的概率幅模平方来编码经典数据的概率分布。进一步,他们提出在经典计算机上使用矩阵乘积态(Matrix Product States)来模拟学习波函数的过程。矩阵乘积态的参数可以通过类似于密度矩阵重正化群的算法进行学习,最终形成一个具有泛化能力的生成模型。基于矩阵乘积态的学习算法结合了不同领域各自的优点:它不仅可以利用图形处理器(Graphic Processing Unit)高效地学习到模型参数,还可以在学习过程中灵活动态地调节模型的表达能力。此外,与传统的基于统计物理的生成模型(例如玻尔兹曼机)相比,玻恩机可以直接抽样产生无统计关联的样本,从而高效地生成新的数据或对数据补全。
基于量子态的概率生成模型结合了量子物理与机器学习的思想,是一个崭新的研究领域。玻恩机借助量子态内禀的概率解释、强大的表达能力和相对应的高效学习算法,为机器学习的研究提供了新思路。展望将来,最令人兴奋的应用前景是在一台量子处理器(Quantum Processing Unit)上实现玻恩机,从而以全新的方法对自然图片和语言进行概率建模和学习。
研究团队还包括北京大学物理学院的本科生韩兆宇和王峻(共同一作),以及中科院理论物理研究所的张潘副研究员。此工作受到科技部(2016YFA0300603)和自然科学基金委(11774398)的资助。可参考王磊在2018年美国物理学会三月会议上的邀请报告https://meetings.aps.org/Meeting/MAR18/Session/E34.1 ,以及张潘编写的教学演示程序http://lib.itp.ac.cn/html/panzhang/mps/tutorial/了解更多关于此工作的背景和展望。
文章链接:https://journals.aps.org/prx/abstract/10.1103/PhysRevX.8.031012
矩阵乘积态学习手写数字图片的生成概率