从物理学到生成式 AI:用于高级模式生成的 AI 模型

从物理学到生成式 AI:用于高级模式生成的 AI 模型 小菜很菜 2023-09-28 09:47:44 1005

易百纳社区

研究人员推出了一系列新的物理启发生成模型,称为PFGM++,它统一了扩散模型和泊松流生成模型(PFGM),以实现更好的模式识别

目前正处于流行话语顶峰的生成型人工智能,预示着一个简单转变为复杂的世界——在这个世界里,简单的分布演变成复杂的图像、声音或文本模式,使人工智能变得惊人的真实。

想象力的领域不再仅仅是抽象的,因为麻省理工学院计算机科学和人工智能实验室(CSAIL)的研究人员已经将创新的人工智能模型带入了生活。他们的新技术整合了两种看似无关的物理定律,这两种定律支撑着迄今为止性能最好的生成模型:扩散(diffusion)和泊松流(Poisson Flow),前者通常描述了元素的随机运动,比如热量在房间里的渗透,或者气体在空间里的膨胀;后者借鉴了控制电荷活动的原理。

这种和谐的融合导致了产生新图像的优越性能,超过了现有的最先进的模型。自成立以来,“泊松流生成模型++”(PFGM++)已经在各个领域找到了潜在的应用,从抗体和RNA序列生成到音频制作和图形生成。该作品发表在arXiv预印本服务器上。

该模型可以生成复杂的模式,比如创建逼真的图像或模仿现实世界的过程。PFGM++建立在PFGM的基础上。PFGM从被称为“泊松”方程的数学方程背后的方法中获得灵感,然后将其应用于模型试图从中学习的数据。

为了做到这一点,研究小组使用了一个聪明的技巧:他们在模型的“空间”上增加了一个额外的维度,有点像从2D草图到3D模型。这个额外的维度为操作提供了更多的空间,将数据放在更大的环境中,并帮助人们在生成新样本时从各个方向处理数据。

麻省理工学院核科学实验室理论物理中心理论粒子物理学家、美国国家科学基金会人工智能与基本相互作用研究所(NSF AI IAIFI)主任杰西·塞勒(Jesse Thaler)表示:“PFGM++是物理学家和计算机科学家之间跨学科合作推动人工智能进步的一个例子。”

近年来,基于人工智能的生成模型产生了许多令人瞠目结舌的结果,从逼真的图像到清晰的文本流。值得注意的是,一些最强大的生成模型是建立在经过时间考验的物理学概念基础上的,比如对称性和热力学,”Jesse Thaler解释说。

PFGM++从基础物理学中提取了一个世纪前的想法——可能存在额外的时空维度——并将其转化为一个强大而强大的工具,以生成合成的但真实的数据集。

PFGM的潜在机制并不像听起来那么复杂。研究人员将这些数据点与维度扩展的世界中放置在平面上的微小电荷进行了比较。这些电荷产生了一个“电场”,电荷沿着电场线向上移动到一个额外的维度,从而在一个巨大的想象半球上形成一个均匀的分布。

生成过程就像卷录像带:从半球上均匀分布的一组电荷开始,沿着电力线追踪它们回到平面的旅程,它们对齐以匹配原始数据分布。这个有趣的过程允许神经模型学习电场,并生成反映原始数据的新数据。

PFGM++模型将PFGM中的电场扩展到一个复杂的高维框架。当你继续扩展这些维度时,意想不到的事情发生了——模型开始类似于另一类重要的模型——扩散模型。这项工作就是要找到适当的平衡。PFGM模型和扩散模型位于光谱的两端:一个模型很坚固,但处理起来很复杂,另一个模型更简单,但不那么坚固。

PFGM++模型提供了一个平衡点,在坚固性和易用性之间取得了平衡。这一创新为更高效的图像和模式生成铺平了道路,标志着技术向前迈出了重要一步。除了可调节的尺寸外,研究人员还提出了一种新的训练方法,可以更有效地学习电场。

为了使这一理论成为现实,研究小组解决了一对微分方程,详细描述了这些电荷在电场中的运动。他们使用Frechet Inception Distance (FID)评分来评估性能,这是一种被广泛接受的指标,用于评估模型生成的图像与真实图像的质量。PFGM++进一步展示了更高的抗误差和对微分方程步长的鲁棒性。

展望未来,他们的目标是改进模型的某些方面,特别是通过分析神经网络的估计误差行为,以系统的方式识别为特定数据、架构和任务量身定制的D的“最 佳点”值。他们还计划将PFGM++应用于现代大规模的文本到图像/文本到视频生成。

OpenAI的研究科学家 Yang Song表示:“扩散模型已成为生成式人工智能革命背后的关键驱动力。”PFGM++提供了一个强大的扩散模型的泛化,允许用户通过提高图像生成对扰动和学习错误的鲁棒性来生成更高质量的图像。此外,PFGM++揭示了静电学和扩散模型之间的惊人联系,为扩散模型研究提供了新的理论见解。”

NVIDIA高级研究科学家Karsten Kreis说:“Poisson Flow生成模型不仅依赖于基于静电学的优雅的物理学启发公式,而且还在实践中提供最先进的生成建模性能。”

“它们甚至超过了目前在文献中占主导地位的流行扩散模型。这使它们成为一个非常强大的生成建模工具,我设想它们在不同领域的应用,从数字内容创建到生成药物发现。更一般地说,我相信进一步探索受物理启发的生成建模框架对未来有很大的希望,泊松流生成模型只是一个开始,”Kreis补充道。


声明:本文内容由易百纳平台入驻作者撰写,文章观点仅代表作者本人,不代表易百纳立场。如有内容侵权或者其他问题,请联系本站进行删除。
红包 点赞 收藏 评论 打赏
评论
0个
内容存在敏感词
手气红包
    易百纳技术社区暂无数据
相关专栏
置顶时间设置
结束时间
删除原因
  • 广告/SPAM
  • 恶意灌水
  • 违规内容
  • 文不对题
  • 重复发帖
打赏作者
易百纳技术社区
小菜很菜
您的支持将鼓励我继续创作!
打赏金额:
¥1易百纳技术社区
¥5易百纳技术社区
¥10易百纳技术社区
¥50易百纳技术社区
¥100易百纳技术社区
支付方式:
微信支付
支付宝支付
易百纳技术社区微信支付
易百纳技术社区
打赏成功!

感谢您的打赏,如若您也想被打赏,可前往 发表专栏 哦~

举报反馈

举报类型

  • 内容涉黄/赌/毒
  • 内容侵权/抄袭
  • 政治相关
  • 涉嫌广告
  • 侮辱谩骂
  • 其他

详细说明

审核成功

发布时间设置
发布时间:
是否关联周任务-专栏模块

审核失败

失败原因
备注
拼手气红包 红包规则
祝福语
恭喜发财,大吉大利!
红包金额
红包最小金额不能低于5元
红包数量
红包数量范围10~50个
余额支付
当前余额:
可前往问答、专栏板块获取收益 去获取
取 消 确 定

小包子的红包

恭喜发财,大吉大利

已领取20/40,共1.6元 红包规则

    易百纳技术社区