模仿游戏+淘汰游戏
模仿游戏+淘汰游戏
原文:https://medium.com/hackernoon/imitation-game-elimination-game-14142f70b0dd


“模仿游戏”不仅仅是一部关于艾伦·图灵伟大而痛苦的天才的著名电影的名字。这是我们获取知识的第一把瑞士刀。
每个小宝宝(或者小猴子)都是这么学着做一件事的。也许在文明的黎明,很可能是这种情况向我们遥远的祖先展示了他们模仿的东西(当然没有他们的理解),并在生存之战中使用了这种东西,这种情况导致了我们今天的生活。
工具和迷因
一个模仿游戏创造了一个“工具”,它不仅仅是一个物理工具,而是一个写在我们大脑中的迷因。首先从身体和精神,然后只有精神,这是一系列的指令,让我们做一些事情。类似于一个小程序或一组与环境的交互。这是基因的曙光软件版本。
非常重要的是,一个工具可以在不了解其所有特性和功能的情况下使用;只有在那一刻,我们需要……我们可以用一个狒狒用 iphone 打破一个核桃的例子。
工具和理解
工具/模因的使用和理解并不是一开始就自动捆绑在一起的,这种关系可以有不同的层次。
只要狒狒周围的环境不再需要任何东西,我们的猿就会一直用 iphone 打破史蒂夫·乔布斯的平静。
相反的例子是,如果我们有一个不可思议的强大工具,它的形式是一根神奇的亨利·波特的魔杖,能够解决我们所有的疑问和问题,能够治愈所有的疾病,或者带我们进入太空,知道宇宙的所有秘密,我们就不会想去寻找一种不同的工具,我们也不会再非常关心它是如何做到的。我们就用它。
所以在早期阶段,使用比理解更重要,这才是最重要的。
所以关键是环境要求。
从坚果到广义相对论
我们的学习本身在一开始就是一个模仿游戏,从零开始,经常是通过例子..
每天我们都(成年人)学习许多技能,从摇头晃脑,或生理学原理,或医学等…
让我们通过写下列表片段来学习如何编程,使虚构的“hello world”出现在屏幕上。如果那允许我们写任何程序,我们就停在那里。
显然,然后我们通过添加新的编程规则继续学习。但是为什么呢?因为在那种环境下,在电脑屏幕上写下神奇的初学者短语,并不会让我们更加投入。因此,我们必须继续下去,直到我们可以建立和使用一些新的和原创的东西,让我们更多。
如果需要的话,多层次的理解会随后到来;就像我们知识的进化。
但是在基础阶段,总会有模仿游戏的第一步。对我们来说,这就足够了,直到环境告诉我们相反的情况。
使用工具是一个漫长而复杂的过程。而使用/理解/进化它们就更长了。
解释和题外话:起初,我们只是开始以一种我称之为被动和原始的方式使用某样东西,而不去担心那是如何做到的。我们就像“使用”飞机而不太关心空气动力学规则的飞行员,或者使用最基本和原始形式的库来格式化函数打印的程序员。
这类似于深度学习。我们将输入连接到输出,而不用担心机制内部是什么。
我们只能说,现在在深度学习中,例如,我们使用计算机的非人的蛮力来查看成千上万的例子,以了解比医生更多的组织是否是恶性的。但是现实中我们做了什么呢?我们只是利用了机器的一个特定部分,也就是说,它“吃掉”大量数据的非人能力,以获得一个似乎令人震惊的结果。所以我们只能观察到,一个人类医生需要较少的例子来训练他的技能,如果不太成功(?).如果我们想做一个比较,我们必须给医生几千年的训练时间。
深度学习似乎…很深…只是模仿游戏。当然,我们实际上无法知道这种方法是否是另一种低调的抽象智能方法。
所以从深度学习中习得的模因是非常微不足道的(从人类的角度来看)。模因与人类的模因极其不同,可能是原始的。它不能在其他环境中使用。它似乎不能进化并与其他记忆结合以走得更远。直到现在。
我们真的不知道。可能是一个很好的起点,但直到现在几乎没有真正的进化能力,它似乎类似于单细胞藻类的生物副本,保持原样长达 40 亿年。
题外话结束。我会写下对这个问题的一些想法。
差异
除了人工神经网络之外,人类大脑还能做更多的事情,目前人工神经网络还很少被人工神经网络模仿,尽管在正确的方向上有一些见解。
NB…..从某种角度来看,这个网络为两个相互竞争的模因构建了一个迷你环境:一个内部模拟空间。
但是让我们来谈谈我们的猿…..
我们离开了婴儿、猴子、我们的祖先(以及深度神经网络),例如,使用一根秸秆通过撞击来打开核桃。
但是奇迹发生了。不是所有的坚果都会碎,所以他们必须想办法解决这个问题。我们可能会说我们必须想象一些不同的东西,但是“想象”这个词已经有了进化和知识的味道。
再小心一点:不破的烂核桃是由写了一系列略有不同的故事的环境生成的。在理论世界里,所有的坚果都会破碎。但事实上这并没有发生。这是我们的因果报应,也是我们进化的动力。
因此,猿需要找到一个更大的分支,并把坚果放在岩石上,以防止滚动。也许是偶然的,然后更有意识地,随着时间的推移提高它对工具的理解,并进化。他必须这样做,因为他迄今为止使用的工具不是最合适的:是环境要求这样做。起初,猴子不想因为打破坚果或创造“坚果大统一理论”而获得诺贝尔奖。
现在发生了什么事?狒狒可能在不同背景下记忆的其他经验的空间中“挂钩”,混合和再混合(抽象地说)来自其他个体经验(也是集体经验)的各种记忆,例如改变它们的应用范围。
有什么简单的比如平庸的重组吗?当然不是,因为可能的解决方案的数量将很快超过它的处理能力。这里我们来看第二个奇迹,那就是淘汰赛。
在这里,孩子(或猴子)被一些经验学习的高等迷因和规则所引导(它们也是工具),或者更好的是,它们是元工具。最简单的是相似性,(不同的和部分相等的)可以被更成功地重组。然后学习最强大的精神武器,让他控制组合爆炸。
淘汰赛
称之为选择,姑且称之为迷因之死,称之为毁灭。然而,正是放弃以前的那些知识,然后放弃过去行不通的策略,帮助他推翻了解决方案的森林。
它就像一台自我改进的电脑。他学会了学习。选择和破坏引导我们走向知识。就像自然界的死亡一样,进化。我们模拟进化。
所以这些工具变成了元工具,或者更通用的工具。环境使他拥有了比以前强大得多的工具。总是应用这两条规则。变化和死亡。
在第一个例子中,飞行员现在以无限的方式知道更多一点的空气动力学知识,因此知道如果飞机出现故障或失去一个发动机该怎么办。
然后总结到目前为止已经说过的内容:
思维学习是一个不断增加的复杂和一般技能的连续规模,可以像乐高积木一样组装起来。
开始时,我们不加理解地使用,只是模仿。
理解是环境“要求”的。
在积累了一个离散的数字后,你可以使用一些工具来提升你以前的工具:我们可以在自我构建知识金字塔中定义更高层次的元工具。
第三点将这些工具与不同的策略结合起来,试图将它们保持在一个可计算的可选择的数量中,忘记或杀死那些无用的。
如果环境需要的话,我们会寻求能够在更深入和复杂的层面上建立和理解的成功组合。
在整个过程中,主角显然是环境和选择,以及动摇我们知识和未来的案例。
最终个人想法
一个战略问题。人工智能?我要说的是,尽管有惊人的兴趣和成就,但在工具的发展过程中还是落后了。这些结果更多地来自计算的蛮力,而不是仪器的改进。我们将来会做得更好吗?谁知道呢?
很难弄清楚深度学习网络是否会创造一个内部竞争和选择环境,除非它已经从外部编程中先验地实现了,这让我们离开了自我进化的假设。在我们的试管中,原始肉汤并没有导致任何有意义的事情,这与生物学中发生的情况有点相似。但是一切皆有可能。
但是是环境产生了我们的知识。如果我们以著名的“缸中大脑”为例,如果我们去除 DNA 中固有的东西,它是如何进化的?
另一个节点和我们的大脑必须如何被教育……以及网络需要如何被制作。