符号回归之费曼数据集/AI-费曼算法

AI Feynman banner
费曼数据集是从费曼物理教材上找到的数百个方程采样生成的数据集,AI-费曼算法是一种结合物理数据属性和深度学习来进行规律重发现的方法。该数据集论文中还发现了一种新的损失/目标函数,优于符号回归的遗传算法

数据集 :Rethinking Symbolic Regression Datasets and Benchmarks for Scientific Discovery(2022)
算法:AI 费曼 (arxiv.org)

费曼数据集组成

代码:
1.用库

1
2
3
4
5
6
7
$ pip install aifeynman

$ python
>>> import aifeynman
>>> aifeynman.getdemos('example_data') # download examples from server
>>> aifeynman.launch("../example_data/", "example1.txt", 30,
"14ops.txt", polyfit_deg=3, NN_epochs=500)

2.github
AI Feynman — AI Feynman documentation (ai-feynman.readthedocs.io)

创新点:

  • 该算法利用对称性、平滑性、可分离性和组合性等属性来简化回归问题。

  • 该算法由尝试不同策略(如维度分析和多项式拟合)的模块组成,以解决回归问题。

  • 作者自动进行量纲分析,将问题转换为具有无量纲变量的更简单的问题。

  • 低阶多项式拟合模块使用线性方程组来查找最佳拟合多项式系数。

  • 使用暴力搜索+前馈神经网络

效果:

  • 该算法应用于费曼物理学讲座中的 100 个方程,并成功发现了所有方程,性能优于以前的软件;该算法还在更困难的基于物理的测试集上进行了测试,成功率为 90%,而之前最先进的成功率为 15%。

  • 作者提供了该算法的示意图,并举例说明了它如何发现与牛顿万有引力定律相关的神秘方程。