第19章：一心二用双世事_末世救亡计划

    此时所有人都不知道，眼前这个巨大机器人的人工智能，已经换成了天神本体，天神在这个时候操控着这个巨大的机器人，在这里找到自己的乐子。

    所以这也就是为什么大家在攻击的时候，这个机器人总能很好防护的原因，此时在这里的所有人，都是不知道，从叶轻尘不断跟自己意识抗争的时候，天神在这个时候也是来到了这里。

    同时天神的心神也是放在另一边，另一边的天启也是有了新的思考，天神现在做了一点小小的改动，让天启的思考网络，能够直接连接到自己的脑袋当中，所以在这个时候不仅可以看到眼前的好戏，同时也能获得一些新的思考。

    天启这时候思考的最大一个问题，就是人工智能首先需要突破的巨大难题是计算机的视觉问题。

    就在五年前，计算机识别物体还非常困难。那个时候人工智能仍然是一个雏形，想起自己诞生的时候，那个时候人工智能的发展还是仍然没有走进正轨，这个问题是人工智能绕不开的一个难题。

    而人类在这方面却有着压倒性的先天优势：人类可以迅速、准确地辨识出图片上的物体，并进一步对图片各区域进行分区域、分类识别。

    虽然计算机一瞬间可分析数百万个像素，但编写一个能将所有数据转化为有意义的信息的算法却相当困难。

    或许在理想国现在的这个时候来看并不怎么可能，但是实际上当时的人工智能的确蠢得要命。

    如何创建一个自上而下的算法来识别呢？天启觉得这个技术应该上升到识别人类意识的层面，不过人类地大脑的确是最好的计算机，这一点不能否认。

    虽然每幅图像中的像素构成是完不同的，但人类大脑具备惊人的能力，可迅速处理数据并输出答案。

    人类大脑识别图像的能力，曾经广泛应用在为支付等领域构建附加的安层验证码方面，不过这已经是好几十年前的事情了。

    以识别当前的交易对象是人类还是计算机程序，比如网上的抢票防作弊程序?。

    这其实就是一个反向的图灵测试，当看到一幅图像或一些特别的笔迹时，人类非常善于辨识出这幅图像或文字的特点，而计算机程序却不足以应对所有的变化。但是，机器学习使这一切发生了改变。

    天启觉得自己也是在这个时代，得到了不一样的进化，这样进化让自己更像是一个人类。

    通过由各种图像组成的数据库对算法进行训练，算法逐渐建立起一个问题层次结构，它可以向一幅具有高准确度的图像发问，并将其准确地识别为某种物体。

    这个算法与原来天启研究的略有不同，并且违反了人类所定义的构成一个好的算法，以及四个基本原则之一。

    算法在大部分时间都在工作，但达不到100%，所以关键是要让其尽可能达到“最”。

    对于业内人士来说，确定性算法到概率性算法的转变是一个重大的心理突破，类似于让数学家用工程师的思维方式去考虑问题，不过这对于天启来说也是不一样的感受。

    所以也利用在这个虚拟世界里面的能力，背后默默的推动了一场演唱会举办，自从演唱会由一个财团举办，实际上这个财团的资金提供，是由天启一手供给的。

    当在线购买最新的演唱会门票时，会被要求去识别一组图像以便进行人机区分呢，这个过程看起来非常的简单，实际上其中蕴含的道理可是相当的深刻。

    这个后面所蕴藏的道理，对于人工智能来说可能收获不少，从人类的视觉感官，以及人类的判断，这些数据都将成为人工智能，研究人类的一个很好的蓝本，还好创造出来了这个比真实世界还要真实的虚拟世界，也让天启可以获得不少数据。

    人类在购票的过程所做的选择，实际上是在帮助算法准备训练数据，这些数据随后会被载入算法，这样计算机就可以尝试学习人类毫不费力就能做的事情了。

    算法需要借助带有标签的数据才能得到训练，天启所做的则是真正在做的是训练视觉识别的算法。

    用这些训练数据作为最好的问题类型可以训练算法，以便其区分某物体和非某物体的图像。

    每当计算机本我的程序算法识别错误时，它将进行调整，以便下次能够正确识别。调整的过程通常需要更改当前算法的参数，这样就可以引入新的标签以求更准确地识别图像。

    这种更改不是通过计算机的硬件设施，预判是并自上而下实施的，而是由算法自身通过高频次的数据交互自下而上构建的。

    同时天启穿梭在各种各样的智能设备里，见识到了孩子们，在家里使用的X游戏机，是如何识别人在摄像机前的动作的，并深深地被这种强大的自下而上的学习能力震撼。

    天启作为一种软件，实际上并不清楚每个硬件的实际情况，所以在这个时候，也是在每个硬件的不同情况下被深深震撼。

    该算法可以很好地将人体的头、肘、手、脚区分开来，X配有一款深度感应摄像头，它可利用红外线技术，记录障碍物与摄像头的距离，如果人类站在客厅里的摄像头前，它会检测到它与人类身体的距离比后侧墙壁更近，并且还能确定人类身体的大致轮廓。

    但人有男女老少、高矮胖瘦，特别是在玩游戏时还可能会摆出一些奇形怪状的姿势，这个数据在沈教授研究所获得的，所以该算法需要对人体的各处特定部位进行定位和识别。

    苹果科技公司的算法，可以达到对静态图像的识别，动态图像识别需要更强大的分析处理能力，强行为会导致游戏卡顿、延迟，不过沈教授的研究所可是让这方面的研究得到了很好发展。

    可能很多人类还是想不到，算法是如何确定那些特定身体部位，所对应的图像中的像素点呢？

    事实上可通过一个简单的问题算法来实现，类似于“猜单词游戏”。第1个问题是：这个单词位于词典的前半部分还是后半部分？答案如果是“前半部分”，词典此时被一分为二。

    则开始第2个问题：这些字母位于“前半部分”的前半部还是后半部？此时词典被分为几个部分。

    依此类推逐渐缩小范围。当提问到第几个问题之后，词典将会被划分为几个不同的区域，总数达到100多万时，远超过牛津词典中收录的词汇数目约30万。

    如果我们想知道某一像素点属于身体的哪一部分，该怎样设计问题算法呢？

    在过去我们都是通过苦思冥想或突发的灵感去设计一系列巧妙的问题。

    那是否能够通过计算机编程的手段，通过大量的数据交互与训练，选择、甄别出更好、更高效的问题集合呢？答案是“能”，它就是“机器学习”。

    机器学习会从一些我们认为可能解决问题的候选问题开始，所以不算是零**学习。

    学习的过程就是将最初的想法逐渐优化，从而形成有效的解决方案。那么什么样的问题可以帮助大多数机械区分手臂和头。

    算法自己找到了最优的问题集合，但程序员并不真正清楚它是如何得到这样的结果的。

    他们可以查看决策树中任何一个结点及其前后结点上所询问的问题，但树中的问题超过百万个，每个问题又略有不同，所以很难采用逆向工程法得出算法具体是怎样解决问题的。

    试想一下，数量超过百万的问题如果靠人工编程实现，即使再厉害、再勇敢的程序员也会闻之色变、望而生畏，然后望风而逃。

    但计算机却擅长做这种工作，这种量化的工作也是人工智能的优势，编程团队需要有一些创造性的思维去相信通过对相邻像素点深度值的询问和比较，足以确定该点所在位置，而之后的创造则属于计算机了。

    机器学习所面临的挑战之一是“过度拟合”?。针对训练数据提出用以区别图片的问题相对容易，但设计一个不针对特定数据的通用程序却非常困难，它需要从数据中抽象出广泛适用的规则。

    假设给定1000个人的姓名和身份号码，让你去设计问题集合对每个人加以识别，你可能会这样提问：“你的护照号码是725487414吗？好的，那你一定就是王二狗。”

    天启尽量让自己的人工智能意志和硬件设施分开，这样就可以锻炼硬件的判断能力。

    由于缺乏外部刺，即人身体能够做出的所有动作基本都是固定的，所以这个算法没有进一步“进化”。

    事实上它也不需要进化，因为它正在有效地完成人类交给它的工作。而其他的一、书籍、音乐，等等。

    算法通过与用户之间的交互过程，获取用户的偏好信息，并从中学习进一步完善自身，发现其中的关联关系，以便为下一位用户提供推荐信息，这就是天启所思考的，要用人类的方式去做很多事情。一的，不可能再有其他人拥有该组数据中的护照号码。

    比如，根据给定的图表中的十个点，可得到一个方程，由该方程创建一条通过所有点的曲线。我们可以用一个十项式来表示这个方程，但这并不能很好地揭示数据中潜在的模式，而这，有必要减少方程的项数，以避免出现过度拟合的问题。

    过度拟合会误导你在建模时过分细数据呈趋势，然后产生不符合客观规律的预测结果。如图5-3所示，这是一幅包含美国20世纪初人口总量的12个数据点的二维图。其总体趋势用二次方程式描述是最合适的，但如果我们选取的方程中项的幂超过2时会出现什么情况如，方程式中项的幂是从0变化到11，尽管由这个方程式确定的曲线与历史样本数据完美拟合，但一旦扩展到未来，曲线会突然向下倾斜，而这预示未来美国的人口数量会急转直下并且到2028年10月中旬就彻底消亡。这多少有些荒谬，或许是数学知道了一些不得了的事情吧！

    在过去的五年里，计算机视觉识别的发展进步让可以驾驭或识别的不仅仅是人类的身体。视觉识别能力的不足，一直是计算机不能与人类智能相媲美的最大障碍。比如，数码相机对图像细节的捕捉能力过人类大脑，但在立的像素点，而不是一副完整、有内容、有故事的图片。人类大脑在图像识别程中是如何处理数据的今仍然是一个未解之谜，更何况是我们的这些“硅朋友”?了。

    接收递过来的信息后，人其当作一个整体看待的？例如，骰子的颜色（红色）和形状（立方体）在人类看来是相互关联的，大脑可以很好地将其合成一个统一的整体。复制这种融合能力，一直是计算机解释图像所面对挑战之一。按像素读取图像的方式，无法帮助计算机获得图息。为，再把纸覆盖在一小的人脸图片上。仅仅通过移动带洞的纸，通过洞去观察，几乎是不可能分辨出照片中的人脸的。

    五算法设计思路下，算法可以基于训练数据自主创建决策树，同时，网络上大量的训练数据——带标签的视觉数据（例如，Instagra带评论的照片），也会为人工智能在视觉识别领域的迅速发展提供基本的支撑条件。

    我们可以将图片上传至谷歌的视觉网站?来测试其算法的图像识别能。麻省理工学院LabSi团队?最新的研究试验表明，谷歌人工智能视觉识别系统对一只3D打印的海龟毫无辨识能力，无论以任何角度拿着这只海龟，甚至将它放置在大海等海龟应该在的环境里，其都会被识别为一支枪。这似乎点到了谷歌

    该团队的做法是，在海龟的表面添加一层在人眼看来极像是海龟龟壳和皮肤颜色的纹理图案。但实际上，这种纹理是很巧妙地用由不断变化的来复枪图。即便是在变形干扰的情况下，计算机还是能将来复枪的图案识别出来，而且其被识别的可能性百分比远龟。尽管此前也出现过机器将猫的图片错误地识别为鳄梨色拉酱，但将图片稍微倾斜后，结果就恢复正常了。LabSi的贡献在于，无论从哪个角度看这只海龟，算法始终都会确信它看到是一支步枪。

    个斜坡上滑雪的人，最终狗的图像在屏幕上完消失了，但机器仍然将其识别为狗。尽管不知道图像是如何被算法识别的（算法完像是一个“黑匣子”），但是他们还是设法去“欺骗”算法。

    谷歌的研究人员创造了一种更适合算法口味的图像——“神奇贴纸”，香蕉在机器的眼里就消失不见了。这种“贴纸”可以被标识为任意图像，比如一台烤面包机。无论算法正在识别的是什么图像，一旦“贴纸”进入机器的眼帘，它都会认为自己看是烤面包机。这有点像一条狗完被一只球分散了注意力，它的所见所想就只剩下了“球”，而其他的一切都从它的意识世界中消失不见了。先前的算法攻击测试绝大多数都需要事先获取被攻击对象（即被识别的图像）的大致内容，但这张“神奇贴纸”却什么都不用做——不管它试图干扰的图像里有什么，它都能正常工作。

    人类不会轻易被这些黑客手段蒙骗，但这并不意味着我们可以彻底的免疫。比如，魔术师们就可以利用人类大脑的潜意识行为倾向，分散我们的注意力。这里有一个典型的例子——著名的两队传球：如果要求观众计算其中一支球队的传球次数，他们的注意力就会完集中在球上，而看不到一个身穿着球衣的男子走到球员跟前，猛击他的胸部后离开了。可见，不仅算法存在视觉盲点，我们人类一样也有视觉盲点。

    无人驾驶汽车所使用的也是视觉识别算法，很明显，这些算法也可能受到类似的攻击。想象一下，一个停车标志上贴着一张“神奇贴纸”，一个安检系统把枪错认为一只海龟……将会发生什么？

    我尝试在摄像头前做一些奇怪的、扭曲身体的动作，以对Ki算法进行测试，看是否会对其识别结果产生影响。事实上，即便是训练数据中从未出现过的瑜伽动作，Ki算法也能高度准确地识别出我身体的各个部位。由于缺乏外部刺激，即人身体能够做出的所有动作基本都是固定的，所以这个算法没有进一步“进化”。事实上，它也不需要进化，因为它正在有效地完成人类交给它的工作。而其他的一些算法可能需要不断适应新的变化，例如，算法若要给我们推荐喜欢看的电影、想读的书、想听的音乐，那么它必须是灵活的，足以应对我们不断变化的审美品位，并要能启发人类的思维和智慧去生成创造性的新潮流。

    这就是算法能够不断学习、完善并适应新数据的力量所在。机器学习为其开辟了一个新篇章，即算法会像我们人类一样成长并走向成熟。