棋盘法是一个研究学习论文的利器,将研究的问题与方法分别作为行与列,将研究领域内的知识体系完整地表现了出来。具体来说,不同的问题,棋盘法展示了相同的解决方法,从而构建起了问题之间的联系,问题的顺序性也得到了体现,展现出问题的线性性。另一方面,对不同的方法,应用到了棋盘法中的同一个问题,从而构建起了方法间的联系,同时这些方法共同展现了该问题的一个全貌。对于有顺序性的问题,新增的方法体现了研究的进展及渐进性。
以目前我的研究方向为例,最近在调研神经过程这个方向的论文,最初的论文发表在ICML2018上,随后的论文中有许多拓广的思路,有用注意力机制做的,有向模型加入平移等变性(卷积)形质的,有加入序列性质(LSTM)的,有用图模型阐释变量间关系的。可以发现,这些方法全部都是曾经应用在其他研究方向的突破性方法。因此可以说,这些拓广性质的论文都是运用了棋盘法的横向看法,即用不同的方法解决同一个问题,而这些方法都是一些以前出现过的“锤子”。当然,这些曾经被创造的锤子都是“专用型”,需要被改造甚至只是抽取出其思想并重造可能才能应用于自己的课题。另外,比单纯地找方法更重要的是发现问题,也就是说,首先得发现一个坑,才有机会去填补。
另一方面,对于一个新掌握的知识和技能,可以运用棋盘法对研究方向进行一次扫荡,找到一个适合使用的方向。比如Wasserstein距离,其作为一种距离的度量,在某些方面优于KL散度,在17年的WGAN中,便应用了这个方法解决了GAN的训练不稳定的问题。除此之外,这个方法也在稳健型学习(19NIPS)、神经过程(Wasserstein Neural Processes)中均尝试了应用,这种联想推广的思想在研究初期十分重要,会不经意间迸发出全新的思想,但也很容易导致单纯的A+B的论文,但对于初入场者已是足够。
要成为行业的开拓者,必须在跟进研究的同时,不断学习全新的知识(比如数学中的测度论、实变函数、泛函分析),这样才能在一些偏僻的地方,发现某个问题的全新解决方法,或者找到一个方法的全新的、更高层面的解释,从而开辟一个世界。