读书目标:【为了搞清楚如何应对机器学习、深度学习这一类黑箱模型到底应不应该使用?如果使用,我们又该如何控制它?能不能理解它,如何理解它?】
5.1 认识对象和黑箱
黑箱理论是控制论独特的认识论。将人们认识和改造的对象看做黑箱(与系统是等价概念)。
认识客体黑箱有两种不同的方法:1不打开黑箱的方法,2打开黑箱的方法。
随着人类观察手段和控制手段的进步,一个黑箱原来未能观察到的变量可能成为可观察变量,原来不能控制的变量也可能可以被控制了,我们预先提出的模型被证实或部分证实了,这时候我们说原来的那个黑箱被我们打开了或部分打开了。
从认识的角度来看,一方面打开黑箱标志着人的认识的深化;另一方面,打开黑箱正抢了人对黑箱的控制能力。
更精确地说,打开黑箱在任何场合只是打开了黑箱的某一个层次。客观事物的黑箱总是一层套一层的,永远不会完结。
根据黑箱外部输入、输出,而提出的关于黑箱内部的情况的假定,在控制论中称为模型。模型只是一种假设,它不一定表示黑箱内部的实际结构。这只是认识的一个阶段。
不打开黑箱的研究方法适用于:
1.某些内部结构非常复杂的系统。它的内部不但变量数目众多,而且相关关系也错综复杂,即使打开了还想,也往往只能从某一个局部来观察它们。采用不打开黑箱的方法反而更有利于人们从整体的角度、从综合全局的角度来考察问题。
2.至今为止人们所拥有的手段尚不能打开的黑箱。
3.人类在某一阶段掌握的某一类打开黑箱会严重干扰本身结构的系统。(举例:生物体)
评论:「
目前机器学习、深度学习模型对于我们来说就是黑箱。尤其是1-内部结构复杂,参数众多。2-迄今为止的手段尚不能打开。
那么,形成关于它的模型和假设,就需要采取“不打开黑箱“的方法来间接地通过可观察变量、可控制变量来分析。
aka 通过改变输入、接收输出,来对模型内部是如何工作的规律提出我们的假设。
」
5.2 认识论模式
不打开黑箱的方法==根据黑箱已知的输入输出建立模型,提出假设。
打开黑箱==证实模型、验证假设。
那么,模型是如何建立起来的呢?它优势怎样深化、改变的呢?==人们如何认识客观事物,如何认识客观真理。
毛泽东《实践论》:“实践—理论—实践”的反复循环。人不可能一下子认识客观规律,只能通过不断实践来修改我们的主观认识,使我们的认识不断逼近真理。
这正好相当于控制论的负反馈调节原理。
任何反馈调节系统要顺利地逼近目标都是有条件的。因此,只有具备了一定条件,人们的认识才能通过“实践—理论—实践”的过程来逼近真理
从5个方面来分析必需的条件:
1.可观察变量和可控制变量的限制
一定的历史时期内,客体的可观察变量和可控制变量受到人们生产水平(包括科学技术水平)和实践手段的限制。
而如果客体的可观察变量和可控制变量被限制在某一水平之内,无论进行多少次“实践-理论-实践”的循环,都不能使认识进一步逼近真理。
aka 人类对于世界的认识,总是和一定时期的生产力发展水平相适应。不会超出这个时代所决定的可观察变量与可控制变量的局限。因此整个认识系统仍停留在旧有的稳态结构当中。
因此,要想不断逼近真理,就要求人们的实践手段不断更新,使得可观察变量和可控制变量的数目和范围不断增大。
2.理论、模型本身具有清晰性
一种理论,只有具备了清晰性,才是可以被检验的。
如果理论无法判断真伪,即不具备可检验性。因而,就不通过“实践-理论-实践”的模式得到修正。
可证伪性:即与这一假说在逻辑上可能抵触的观察陈述是存在的。【证伪主义科学观—波普尔】
一是,具有一定的信息量:结论是可以用来缩小可能性范围的,即提供一个结论,可以用于与实践结果对照,来判断是否一致。
二是,【清晰性也包含了理论所规定的条件和某些统计的结果】理论只要明确指出,在什么条件下事物这样变化,什么条件下那样变化,指出事物变化的各种可能性是多大,理论就给出了一定的信息量。
「
思考:如何定义模型是可解释的?如何定义模型是公平的?如何定义模型是可靠的?
提出假设。
」
3.模型逼近客观真理的速度
“反馈调节的速度”跟不上客体变化速度造成的。即:不但要不断进行“实践-理论-实践”循环,而且规定这一循环要有一定的进行速度,至少不得小于客体变化速度。如果未能及时获知客观情况的变化,并根据这种变化来改变自己的决策,就要失败。
— 由于认识和控制的反馈速度太慢,总是落后于客观实际的变化,就往往由一个极端跳到另一个极端,不能与实际很好地符合。因此就发生认识过程中的振荡现象。【Bullwhip effect 长鞭效应】
— 为了适应快速处理信息的需求,电子计算机出现了。
— 加快“实践-理论-实践”循环的速度,可以大大提高实践活动的效率。【快速迭代、快速修正理论】:
---- 尤其是对于认识那些复杂对象
---- 一个认识过程拖得越久,在实践过程中碰到的干扰就越大
「
可信AI的实验中,如何加快循环的速度?
」
4.反馈过度
控制装置每次都做出了过头的调节,每次不是左偏就是右偏,总在目标左右摇摆,不能顺利地逼近目标。就形成了振荡。
(任何负反馈调节系统如果出现反馈过度,都会从给一个逐步逼近目标的稳定过程,转化为振荡过程。)
即,当我们修改理论时,作出反馈过度的反应,也就是说对理论作出过头的修正,就会发生认识过程的振荡现象。使我们的认识从一个极端走向另一个极端,从一种片面性走向另一种片面性。
对于个人的认识过程,反馈过度作为一种思想方法可能使振荡根本稳定不下来。人们常常因为振荡,而在错误中徘徊。
(大多数事物的认识过程都是先经过在错误中振荡,在波浪式的前进中慢慢接近真理的。)但是,分析出现波浪式振荡的原因,使以后得认识过程少走弯路,是非常重要的。认识过程之所以反馈过度或者不够准确,跟一种叫“可判定条件不成立”的现象有关。
5.可判定条件
循环成立的大前提:实践结果vs理论结果之间的误差,必需要能够反应理论vs客观真理的接近程度。这个误差越大,反映理论越不正确,误差越小,反映理论在逼近真理。(该前提称为:可判定条件。)
为什么可判定条件不一定会成立呢?
因为人们都是在一定生产力、一定科学技术条件下,进行认识自然规律的活动的。因此,可判定条件也只能根据人们所掌握的可观察量和可控制量。因此,认识过程的某些阶段出现可判定条件不成立的现象。
而当可判定条件不成立,就等于科学家失去了修改的标准。这种困难在科学研究中,尤其在那些艰苦的开创性工作中大量存在。使得负反馈机制变成了一个随机控制。
科学史上,不少有远见卓识的大科学家能够甩开可判定条件不成立设下的障碍,提出突破性的理论。
因为他们参考中间标准(与“范式”有关)。范式看做是一个时代一群科学家所共同遵守的一些准则,即一些中间路标,能够把对认识过程引向正确的道路。但目前科学哲学界对于范式的研究还不成熟。
To Summarize:科学与人
哲学家认为:规律=现象间的本质联系
黑箱理论认为:规律=变量间的约束。 有规律可循,就是变量间联系的可能性空间存在着缩小的可能。
一般规律vs特殊规律:成立所依赖的条件越少,这一规律越普遍。
1.黑箱理论指出:人类对规律普遍程度的认识,取决于其变革世界的能力。随着人类控制自然的能力增加,其认识规律的普遍性越大。只有改造世界的能力达到一定程度,才能发现自然界更深层次的不变量。
2.人类认识规律是一个逐步展开的过程,随着人类观察和改造客观世界的能力增强,人们原来发现的变量之间的约束关系随着科学的发展往往被发现是出于更多变量的约束之中。也就是说,一个普遍规律将越来越下降成为一个特殊规律。举例:
3.规律的普遍性下降现象说明:人类的认识过程是有方向性的,从低级向高级的顺序展开。也说明人类所认识的自然规律都是以人为中心向纵深延伸的。
4.人类一时无法控制,但又企图去控制的事物便会成为科学研究的第一批对象。人类一旦认识了那些不可控制的变量与我们可以控制的变量之间的联系,其控制权就扩大了。因此科学有一个中心,有一个出发点,那就是人类本身。
Conclusion:给我们什么启示呢?【控制论、科学方法论得出的最重要的结论】
1.一个时代人所认识的真理都是相对的,它直接依赖于人在自然界的位置和人控制自然的能力。
2.就科学本身来说,它永远是围绕着人为核心展开的。