第 6 章 数据科学与人工智能

  数据科学导论是应用统计学、数据科学与大数据技术专业非常重要的一门专业必修课,力图帮助新生了解、认知专业,对涉及专业知识、专业技能,以及专业能力与素养等方面,进行比较全面的引导和指导性介绍,目的是为今后的大学和专业学习奠定最基本的基础。总而言之,本课程希望帮助刚刚进入大学,即将开始专业学习的学生:

启蒙大学,启迪专业!
跳出舒适区,摆脱迷茫,重塑自我,开启正确的大学生活和专业学习模式!

  数据科学导论采用模块化教学,设定如下六个内容模块:

  • [ ]课程概述
  • [ ]专业介绍
  • [ ]数据科学的计算机生态系统
  • [ ]数据科学与统计学
  • [ ]数据科学的思维
  • [x]数据科学与人工智能

构建自己的知识体系,全方位提升自己,用自己确定的能力,应对未来的不确定性!

  在这一个模块,我们讨论一下人工智能,但谈到人工智能,一定离不开数据科学。

6.1 关于人工智能

  人工智能利用计算机和机器模仿人类思维的问题解决和决策制定能力的技术。人工智能在感知、识别、决策等信息技术和大数据分析领域研究和产业上取得了巨大成功,成为了现代和未来科技和社会发展的一个主要驱动力,并广泛带动其它领域的科技创新。

  虽然在过去数十年中,人们不断试图给人工智能 (AI) 进行定义,但 John McCarthy 在 2004 年的论文中给出了以下定义:“这是制造智能机器,特别是智能计算机程序的科学和工程。 它与使用计算机了解人类智能的类似任务有关,但 AI 不必局限于生物可观察的方法”。

  然而,在这个定义出现之前数十年,人工智能对话的诞生要追溯到艾伦·图灵 (Alan Turing) 于 1950 年发表的开创性工作:“计算机械和智能”。在这篇论文中,通常被誉为“计算机科学之父”的图灵提出了以下问题:“机器能思考吗?”由此出发,他提出了著名的“图灵测试”,由人类审查员尝试区分计算机和人类的文本响应。 虽然该测试自发表之后经过了大量的审查,但它仍然是 AI 历史的重要组成部分,也是一种在哲学中不断发展的概念,因为它利用了有关语言学的想法。

  Stuart Russell 和 Peter Norvig 随后发表了“人工智能:现代方法”,成为 AI 研究的主要教科书之一。 在该书中,他们探讨了AI的四个潜在目标或定义,按照理性以及思维与行动将 AI 与计算机系统区分开来:

  • 人类方法:

    • 像人类一样思考的系统
    • 像人类一样行动的系统
  • 理想方法:

    • 理性思考的系统
    • 理性行动的系统

  艾伦·图灵的定义可归入“像人类一样行动的系统”类别。

  以最简单的形式而言,人工智能是结合了计算机科学和强大数据集的领域,能够实现问题解决。它还包括机器学习和深度学习等子领域,这些子领域经常与人工智能一起提及。这些学科由 AI 算法组成,这些算法旨在创建基于输入数据进行预测或分类的专家系统。

  机器学习和深度学习(深度学习实际上是机器学习的一个子领域)以及人工智能这些概念或领域确实有很多重叠之处,再加上充斥着媒体的炒作,导致人们很容易对他们产生混淆。但是它们之间是不可混淆的,至少大多数这些领域的专业人员都能够去直观地理解一些特定的工作是如何被归类为机器学习、深度学习或人工智能的,即使这很难用语言去表达。

  在从事这些领域的专业人员中,以下表述得到一定的认同,即

  • 数据科学产生洞见理论

  • 机器学习产生预测算法

  • 人工智能产生驱动行为

  深度学习和机器学习是数据科学的核心,这两个术语往往可互换使用,因此必须注两者之间的细微差别。深度学习往往特指由神经网络组成。深度学习中的“深度”是指由三层以上组成的神经网络(包括输入和输出),可被视为深度学习算法,这通常如下图表示。

神经网络

图 6.1: 神经网络

  深度学习和机器学习的不同之处在于每个算法如何学习。

  深度学习可以自动执行过程中的大部分特征提取,消除某些必需的人工干预,并能够使用更大的数据集。 可将深度学习视为“可扩展的机器学习”,正如 Lex Fridman 在同一 MIT 讲座中所指出的那样。 常规的机器学习,或叫做”非深度”机器学习,更依赖于人工干预进行学习。人类专家确定特征的层次结构,以了解数据输入之间的差异,通常需要更多结构化数据以用于学习。

  “深度”机器学习则可以利用标签化的数据集,也称为监督式学习,以确定算法,但不一定必须使用标签化的数据集。它可以原始格式(例如文本、图像)采集非结构化数据,并且可以自动确定区分不同类别数据的特征的层次结构。与机器学习不同,它不需要人工干预数据的处理,使我们能够以更有趣的方式扩展机器学习。

6.2 人工智能类型

  人工智能通常分为弱 AI 与强 AI。

  弱 AI 也称为狭义的AI或人工狭义智能(ANI),是经过训练的AI,专注于执行特定任务。目前我们周围的大部分 AI都属于弱AI;“范围窄”可能是此类AI更准确的描述,但它其实并不弱,实现了一些非常强大的应用,如Apple的Siri、Amazon的Alexa以及IBMWatson和大部分无人系统;弱人工智能的标志是基于数据的智能。

  强 AI 由人工常规智能(AGI)和人工超级智能(ASI)组成。人工常规智能(AGI)是AI的一种理论形式,机器拥有与人类等同的智能;它具有自我意识,能够解决问题、学习和规划未来。 人工超级智能 (ASI) 也称为超级智能,将超越人类大脑的智力和能力。虽然强AI仍完全处于理论阶段,还没有实际应用的例子,但这并不意味着AI研究人员不在探索它的发展。ASI的最佳例子可能来自科幻小说,如 HAL、超人以及《2001 太空漫游》电影中的无赖电脑助手。

6.3 人工智能应用

  目前,AI 系统存在大量的现实应用。

  • 语音识别

    也称为自动语音识别 (ASR)、计算机语音识别或语音到文本,能够使用自然语言处理(NLP),将人类语音处理为书面格式。许多移动设备将语音识别结合到系统中以进行语音搜索,例如:Siri,或提供有关文本的更多辅助功能。

  • 客户服务

    在线聊天机器人正逐步取代客户互动中的人工客服。他们回答各种主题的常见问题(FAQ),例如送货,或为用户提供个性化建议,交叉销售产品,提供用户尺寸建议,改变了我们对网站和社交媒体中客户互动的看法。 示例包括具有虚拟客服的电子商务站点上的聊天机器人、消息传递应用(例如 Slack 和 Facebook Messenger)以及虚拟助理和语音助手通常执行的任务。

  • 计算机视觉

    该 AI 技术使计算机和系统能够从数字图像、视频和其他可视输入中获取有意义的信息,并基于这些输入采取行动。 这种提供建议的能力将其与图像识别任务区分开来。计算机视觉由卷积神经网络提供支持,应用在社交媒体的照片标记、医疗保健中的放射成像以及汽车工业中的自动驾驶汽车等领域。

  • 推荐引擎

    AI 算法使用过去的消费行为数据,帮助发现可用于制定更有效的交叉销售策略的数据趋势。这用于在在线零售商的结帐流程中向客户提供相关的附加建议。

  • 自动股票交易

    旨在用于优化股票投资组合,AI驱动的高频交易平台每天可产生成千上万个甚至数以百万计的交易,无需人工干预。

6.4 人工智能发展历史——大事记

  “一台会思考的机器”这一构想最早可以追溯到古希腊时期。而自从电子计算技术问世以来(相对于本文中讨论的某些主题而言),人工智能进化过程中的重要事件和里程碑包括以下内容:

  • 1950:艾伦·图灵发表了论文“计算机械和智能”。图灵因为在二战期间破译纳粹德国的 ENIGMA 码而闻名于世。在这篇论文中,他提出了问题“机器是否可以思考?”并进行回答,推出了图灵测试,用于确定计算机是否能证明具有与人类相同的智能(或相同智能的结果)。自此之后,人们就图灵测试的价值一直争论不休。

  • 1956:John McCarthy 在达特茅斯学院举办的首届 AI 会议上创造了“人工智能”一词。(McCarthy 继续发明了 Lisp 语言。)同年晚些时候,Allen Newell、J.C.Shaw 和 Herbert Simon 创建了 Logic Theorist,这是有史以来第一个运行的 AI 软件程序。

  • 1967:Frank Rosenblatt构建了Mark 1 Perceptron,这是第一台基于神经网络的计算机,它可以通过试错法不断学习。 就在一年后,Marvin Minsky 和 Seymour Papert出版了一本名为《感知器》的书,这本书既成为神经网络领域的标志性作品,同时至少在一段时间内,成为反对未来神经网络研究项目的论据。

  • 1980 年代:使用反向传播算法训练自己的神经网络在 AI 应用中广泛使用。

  • 1997:IBM 的深蓝计算机在国际象棋比赛(和复赛)中击败国际象棋世界冠军 Garry Kasparov。

  • 2011:IBM Watson 在《危险边缘!》节目中战胜冠军 Ken Jennings 和 Brad Rutter。

  • 2015:百度的 Minwa 超级计算机使用一种称为卷积神经网络的特殊深度神经网络来识别图像并进行分类,其准确率高于一般的人类。

  • 2016:由深度神经网络支持的 DeepMind 的 AlphaGo 程序在五轮比赛中击败了围棋世界冠军 Lee Sodol。考虑到随着游戏的进行,可能的走法非常之多,这一胜利具有重要意义(仅走了四步之后走法就超过 14.5 万亿种!)。后来,谷歌以四亿美元的报价收购了 DeepMind。

6.5 拓展学习资源