同样是算法,不同领域的理解好像不是很一样。运筹优化背景人员有时混淆模型与算法的概念,机器学习可能也有同样的现象。目前笔者的理解是,以算法导论为依据,算法这个概念的定义是能接收输入,并且能通过明确定义的有限的一系列步骤得出期望的输出的过程。
然而,算法导论和一些介绍运筹优化算法的书籍覆盖的内容确有不同。主要原因可能是两个社区的最初关注点不同,例如计算机社区从图灵机,计算复杂度等计算理论发展过来,研究的更多是底层基础算法和数据结构,直接面向计算机。而运筹优化的发展可能更多是从实际生活生产问题过来的。首先关注对实际问题的建模,模型的求解过程才涉及到算法例如单纯形法。运筹的算法在进行具体实现时还是会用到基础的计算机算法和数据结构的。
另外一个角度就是计算机算法处理离散问题和组合优化问题比较多,可能因为计算模型和存储模型本身就是离散的(01)。而且更关注算法的复杂度。所以如果用运筹优化的体系去归类一些基础计算机算法,更多会放在离散优化和组合优化的部分。高德纳在具体数学一书中给了一个新定义:Concrete Mathematics,一方面与Abstract Math相对,另一方面也是CONtinuous与disCRETE的结合,他们称之为"Fundation of computer science".
关于机器学习社区,笔者觉得也是更注重模型而非算法。例如神经网络是一种处理数据的模型,而BP对网络的更新才是一种算法。机器学习中涉及到统计与概率的内容比较多,更多是对大数据的统计分析模型,具体的模型求解算法则一般来讲并不复杂。这可能也是为什么大家觉得转行机器学习比较容易吧,只要理解模型背后的统计概率逻辑,具体实现时候不用太费力,因为很多现有的包已经可以快速搭建应用。
总之区分“模型”和“算法”这两个概念还是很重要的。当然不同领域的算法也并没有明确的界限,笔者坚信所有的知识是一体的,跨学科的结合是大势所趋。