人工智能/AGI 如何工作
人工智能/AGI 如何工作
只是我模糊的想入非非的理论=)也许对专家来说是显而易见的,大概有瑕疵。但它对我来说似乎有意义,也许会给你一些启发。我很想听听你的想法/反馈!
消费投入
您需要的世界数据(如视频),以及我们想要优化的有用指标,如世界上回形针的数量。
做出预测并采取行动
就像深度学习一样。
人类的大脑是如何将结构转化为行动的?
也许像:
- 以当前世界的图片作为输入。
- 想出随机行动。
- “想象”会发生什么。 采用当前世界+动作,并通过 ANN 运行它。
- 输出是否增加了我们想要的指标?如果是——发出信号采取行动。如果不是——想出另一个随机动作并重复。
更新信念
世界的图景与我们想象的图景相符吗?这一行动是否增加了良好的衡量标准?世界上回形针的数量增加了吗?如果是的话——正强化。反向传播,加强重量。
重复。
获取世界的当前图片= >想象对其应用一个动作= >采取行动= >正/负强化以改进我们的模型= >重复直到我们想要的指标等于我们设定的目标。
意识
意识是神经元观察/识别其他神经元的模式。
当你看到“猫”这个词时——页面上的光子到达你的视网膜,并被转换成神经信号。一个细胞网络识别字母 C、A 和 t 的形状,然后一个更高层次、更抽象的网络识别这些字母一起形成了猫的概念。
你还可以识别来自你体内神经细胞的信号,比如当你戳脚趾时感到疼痛。
同样,大脑中的神经元识别来自大脑中其他神经元的信号。所以大脑自己“观察/感受/体验”自己。建立一个自己的模型,就像它建立一个世界地图一样,“镜像”自己(GEB)。
有情自强
因此,网络本身的结构作为其输入之一,与我们想要优化的视频和指标一起输入。它可以把自己视为它所预测的世界状态的一部分。这就是有感觉的意思。
然后它可以采取的一个可能的行动是修改它自己的结构。“想象”以某种方式修改结构,如果你预测这会导致更好的预测/结果——修改它。如果它确实导致了更多的回形针——加强重量来做更多的事情。所以它不断自我完善。
友好的
我们不希望这导致回形针的无限量,我们不知道如何量化我们作为人类所重视的东西。我们无法将世界上的“幸福数量”转化为具体的指标,而不会产生意想不到的后果(就像所有人类大脑都被连接到刺激我们快乐中心的电线上)。
这就是为什么我们没有试图将抽象的价值编码为最大化,而是将编码为非常具体的目标。
- 制作 100 个回形针(效用函数是“我做了 100 个回形针吗?”)
- 制造 1000 辆汽车
- 写一篇关于如何治愈癌症的论文
人类仍然负责,确定我们想要的目标,并让人工智能找出如何完成这些目标。仍有可能出错,但可能性较小。
(原载于我的主博客)。
黑客中午是黑客如何开始他们的下午。我们是 @AMI 家庭的一员。我们现在接受投稿并乐意讨论广告&赞助机会。
要了解更多信息,请阅读我们的“关于”页面、在脸书上给我们点赞/发消息,或者简单地说, tweet/DM @HackerNoon。