这里是普通文章模块栏目内容页
方帆:华为EI—面向企业智能的创新和实践|V课堂第100期

第100期【智造+V课堂】邀请华为技术有限公司 华为云BU EI产品线人工智能首席系统架构师方帆深度聚焦《华为EI:面向企业智能的创新和实践》。方总从华为智能平台到通用服务到特定领域实践的服务,把从华为内部积累的能力、知识和方法全面、深度的进行全方位解读,以实际案例分享助力企业上云,让企业更智能。

云/人工智能

一、分享嘉宾

华为技术有限公司华为云BU EI产品线人工智能首席系统架构师   方帆

嘉宾简介

华为云BU EI产品线人工智能首席系统架构师;

拥有十多年IT系统研发工作经验,现负责华为EI产品线人工智能技术方向规划,产品架构设计等工作。

二、分享主题

《华为EI:面向企业智能的创新和实践》

三、分享内容

1. 企业向智慧化转型面临的挑战

2. 华为AI服务架构:智能物流服务、智能风控服务、个性化推荐服务、智能问答、图片识别、基于华为AI在线监测服务......

3、人工智能在不同场景下的效率提升

四、原文实录

原文实录context:

大家好我是来自华为云的方帆,很高兴今天给大家分享华为对AI的理解以及华为在人工智能领域的一些创新与实践,首先还是需要给大家介绍些基本概念:

1. 弱人工智能

弱人工智能(ArtificialNarrow Intelligence/ANI),只专注于完成某个特定的任务,例如语音识别、图像识别和翻译,是擅长于单个方面的人工智能。它们只是用于解决特定的具体类的任务问题而存在,大都是统计数据,以此从中归纳出模型。由于弱人工智能智能处理较为单一的问题,且发展程度并没有达到模拟人脑思维的程度,所以弱人工智能仍然属于“工具”的范畴,与传统的“产品”在本质上并无区别。包括近年来出现的IBM的Watson和谷歌的AlphaGo,它们是优秀的信息处理者,但都属于受到技术的限制的“弱人工智能”。比如,能战胜象棋世界冠军的人工智能AlphaGo,它只会下象棋,如果问它怎样更好地在硬盘上储存数据,它就无法回答。所以其实是使用弱人工智能制造出来的智能机器看起来像智能,但是并不真正拥有智能,也不会有自主的意识。

2. 强人工智能

强人工智能属于人类级别的智能,在各方面都能和人类比肩,人类能干的脑力活它都能胜任。它能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习和从经验中学习等操作,并且和人类一样得心应手,这样的叫强人工智能。“强人工智能”系统包括了学习、语言、认知、推理、创造和计划,目标是使人工智能在非监督学习的情况下处理前所未见的细节,并同时与人类开展交互式学习。在强人工智能阶段,由于已经可以比肩人类,同时也具备了具有“人格”的基本条件,机器可以像人类一样独立思考和决策。

从上面我们讲的有三个概念,弱人工智能、强人工智能、超人工智能。其实从人工智能发展到目前为止,最大的其实我们现在讲的人工智能基本上都是弱人工智能范畴。人工智能从开始概念提到现在走向繁荣,从1956年开始几个科学家相聚在达特茅斯会议里面,提出了人工智能的概念。当时刚刚出现了一些计算机,构建一些复杂和拥有与人类智慧相同本质的一些机器,其后人工智能就一直缠绕在人们的脑海之中,并在科研实验室中慢慢的孵化。之后的几十年人工智能一直在两级反转,或者被称为人类文明耀眼未来的预言,或者被当时技术疯子扔到垃圾堆里面。直到2012年之前,其实这两个声音还是同时存在的,2012年以后主要得益于数量的发展,和运营商力的提升,和机器学习的新方法提出来,包括深度学习的出现。

人工智能开始爆发式的增长,人工智能的研究领域则不断地扩大,包括一些专家系统,机器学习、净化计算、模拟逻辑、计算机视觉、自然语音和推荐系统等。但目前的一些科研工作都集中在弱人工智能这一部分,并很有希望的在近期取得了一些重大突破。其实定义里面描述的大半都是强人工智能,在现实里面都是没有办法真的实现的。所以强人工智能让机器获得自适应的能力,解决一些没有遇到的问题,其实都离我们很远。所以我下面重要介绍一下几个弱人工智能相关的东西和概念。

3. 机器学习

#p#分页标题#e#

机器学习是一种实现人工智能的方法,机器学习最主要的做法就是使用一些算法来解析数据,从学习然后从真实的事件做出决策和预测。如果大家对统计学比较清楚的话,其实这种机器学习就是统计学的基础来做的。以传统的为解决特定的任务来印编码的程序不同,机器学习是用大量的数据来训练,通过各种算法,从数据中学习如何完成任务。

举个例子,当我们浏览一些商城时,经常会出现商品推荐,这些商城根据你以往的一些购物记录或者收藏的清单,识别出哪些是你真正感兴趣的,并且愿意购买的产品。机器学习直接源于早期的人工智能,传统的算法包括一些决策数、聚类、贝叶斯分类、支持向量机等等,从学习方法来讲,机器学习可以分为一些监督学习、无监督学习、半监督集成学习等等。传统的机器学习算法其实在很多领域都可以用到,其实也是大家用的比较多的一个东西。

4. 深度学习

深度学习并不是独立的学习方式,其本身也会用到有监督和无监督的学习来训练神经网络。2006年把深度学习神经网络这个领域,他实现在反向传播里面梯度优化,做到可用以后,深度学习在神经网络发展里面发挥了很大的作用。

最初的一个深度学习是用神经网络解决一些特征表达的学习过程,深度神经网络本身不是一个全新的概念,可大致理解为包括多个隐含式的神经网络结构。为了提高审度学习的训练效果,人们对神经网络连接方法、激活函数等做出了相应的调整,早前也有过。但是由于当时的训练量不足,计算能力也落后。所以整个效果不行,但是深度学习目前为止因为随着我们的计算量和数据量提升以后,深度学习包括我们的神经网络改进完以后,深度学习目前越来越多的应用。证实了比传统的机器学习在认知领域获得的更大的成功。

就目前来说业界有一种错误的、较为普遍的意识,机器深度学习最终可能会淘汰所有的机器学习的算法。这种意识的产生是一个比较错误的,当下深度学习在计算机视觉、自然语言处理和语音这块是远远超过传统的机器学习,并且媒体对深度学习也是大肆夸大了一些报道。其实深度学习只在这几个领域突破比较好,所以在机器学习领域里面有很大的应用领域、空间的。

5. 强化学习

我们再讲一下最近比较热门的强化学习,强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。这个方法具有普适性,因此在其他许多领域都有研究,例如博弈论、控制论、运筹学、信息论、仿真优化、多主体系统学习、群体智能、统计学以及遗传算法。在运筹学和控制理论研究的语境下,强化学习被称作“近似动态规划”(approximate dynamic programming,ADP)。在最优控制理论中也有研究这个问题,虽然大部分的研究是关于最优解的存在和特性,并非是学习或者近似方面。在经济学和博弈论中,强化学习被用来解释在有限理性的条件下如何出现平衡其实强化学习目前业界用的也比较多了,包括一些高价值领域,包括金融,下围棋只是一个代表,包括一些控制论,节能方面都有很多领域比较好的应用范围出来。

我们都知道在最近的几年里面AI取得了前所未有的重大突破,产生了很多明星级的应用。为什么AI这个已经存在了几十年的学科在最近的几年会取得很大的突破?其中有两个很关键的因素,第一个是在机器学习领域,我们有了一些开源的机器学习库,如说Tensorflow、MXNet、Caffe、CNTK等,使得用户可以很容易地编写机器学习模型。但是编写了一个机器学习程序并不意味着你就能够训练到一个好模型,你需要大量高质量的数据来训练这个模型。处理大规模高质量的数据需要一个机器学习的平台,而且最好这个平台是基于云上的。业界基于云的机器学习平台大幅度的降低了AI技术的使用门槛。

AI目前的进展和数据与计算密不可分。首先,我们要获得好的机器学习模型,就必须要有大量高质量的数据。但是,在我们很多的企业AI应用里面缺乏大量高质量的数据,这是企业AI应用的一个重要的瓶颈。

如果我们大量的数据,我们可以训练一个深度模型,我们需要对数以百万计的参数进行调优,这需要巨大的计算资源。AI需要通用的计算资源,如CPU等,也需要一些专用的计算资源,如说PU、FPGA、TPU等。目前这些资源在体系结构上是排它的。一个子任务分给GPU去做了就会一直由GPU做。我认为,未来体系结构应该逐步走向融合,有灵活的调度。

#p#分页标题#e#

基于云的AI平台是处理AI所需要数据的关键中的关键。在企业环境当中有不同的机器学习的任务和应用,我们应该怎么样去选取这个模型呢?一个原则是模型的复杂度一定要与问题和数据的复杂度匹配起来,否则我们要么出现过拟合或欠拟合的问题。不同的应用场景会往往有不同的复杂度和不同的计算量。要使企业的AI应用成功,不能够只靠一个模型。我们需要一个丰富的平台,提供丰富的AI模型和服务。

基于这样一个考量,华为AI架设一个通向业务智能的桥。无论我们是做AI+或者是+AI,我们坚信业务的最终业务价值是AI的最终价值,一定要解决最终业务问题。AI只有使得业务产生价值,才能够最终对用户有真正的作用,否则的话,空谈AI没有任何的业务价值。企业的业务价值永远是需要端到端的解决方案。从算法到算法对大部分的实际应用没有意义, 需要把数据平台、集成商、领域专家和业务用户协同起来。在企业业务当中的AI是一个以技术和服务平台作为基础,连接数据、领域知识、应用和用户,使各方面浑然一体、紧密结合、相互互动的解决方案。

基于这个理念其实华为AI推出了一个使能的框架,它分为三层,第一层是它提供一个平台层,提供一个AI基础平台层。能帮助企业、用户如何做AI,做这些数据挖掘,做数据探索。第二层我们会基于平台智能服务层,运用流行机器学习、深度学习平台一样的强大计算能力,来做出来的一些领域智能API。这些API提供一些视觉、语音、自然语言等感知认知的功能。用户在这个层面上只需要调用这些API就可以了。

在这之上是我们的强项,领域和场景AI层,是我们理解行业、理解企业,提供行业领域的API,如我们面向智能、物流、风控、推荐问答、金融、制造等不同领域的API。对于一个行业来说,这层提供了一个Sandbox和一个工具集,可以用这些工具很容易搭建解决方案。另外,我们还提供解决方案的样本。这是我们华为把已有的成功经验拿出来跟业界分享。用户你可以根据这些蓝本很容易修改定制获得企业需要的解决方案。

另外我们还提供一些解决方案的样本,这是华为把已有的成就经验拿出来跟业界分享的。用户可以根据这些蓝本和荣誉修改和定制这些企业需要的解决方案,我们后续会沿着这些服务框架逐步开放大量的服务,欢迎大家去使用,以及欢迎合作方在这个平台上贡献他的服务,共建华为共有云AI的生态。

6. 用AI架构如何解决企业问题

接下来我主要讲一下用AI的架构如何解决一些企业的问题,包括我们拿的这些工具做的成功企业的实践和案例,包括一些创新,希望能给大家一些启发。

首先我介绍一下机器学习,刚刚说的机器学习是一个平台,你企业要做企业有大量的数据,想做一些类似于比方说你要做一些推荐、预测,包括制造领域的预测性维护。那就需要根据自己的数据来做一些数据业务的理解,做一些数据挖掘,包括首先他需要一个平台去承载,这个平台就需要一些集成。比方说数据探索的能力,包括预测很多的一些算法,包括分类、推荐、文本类的算法。根据你自己企业的数据做一些探索,探索完以后基于自己的数据来测试自己的模型是否建的很好。

这里面我就讲一个很有意思的案例,我们最早跟运营商做的比较多的案例,比如离网预测。大家经常用手机,最早的用手机的时候你会发现经常会收到一些短信,比方说经常不用手机的时候,经常会收到运营商的短信或者是电话回访,给你推荐一个充值包、流量包,给你一些东西。这里面其实用到大量的机器学习,前几年我们给运营商做的时候,根据你的行为分析包括你自己打电话的频率、打电话的次数,来给你做一个客户画像,来预测你下个月是否不再用这个运营商,或要更换运营商了。

通过这个分析完以后,运营商会知道你即将有可能会离网,比方说从移动到联通去了,根据你的通话记录慢慢变少了,根据你的关系网络,比方说你的亲戚朋友、家庭里面全是用的移动都到联通去了,你可能就有离网的风险,他会跟你推送一些套餐、优惠券,这就是典型的离网关怀预测分析的,它是通过一些机器学习来做的。

机器学习我们在制造领域用的比较多的,就是一些故障、预测,收集了很多传感器。你知道传感器信息来做一些统计,来预测哪些东西将会有一些故障。其实我们华为是制造企业,预测性维护这一系列我们是做的比较多的。这是机器学习大家可能理解比较多的事情,包括这里面还有一些我们给他做一些欺诈检测这些都做了,包括关系分析,这里面有。包括原来我们给太保做的机器学习的东西,太保里面就是一些车险反欺诈检测。凭借华为人工智能的能力,包括我们共有云图计算的能力,来及时的锁定可疑保安,并有效的串联相关的案例,来挖掘犯罪团伙举证,来做一些关系网络分析挖掘。

#p#分页标题#e#

在用机器学习还可以做一些精准营销,大家如果是用的华为手机你们可以发现,其实手机里面有一些我们内部的电商,包括我们在手机APP应用的推荐,这里面有很多推荐的东西,我们做了好多的推荐模型。包括里面的猜你好玩一些模型,包括首页、关联、广告、分类、新奇好玩、猜你喜欢、本地热门,这块第一步就是要做一些客户画像,目前因为我们华为终端的画像比较多,因为大家用的比较多。

这个画像可能就是维度就比较高了,可能有百亿维,然后基于这个画像做一些水平扩张,随着数据量大了以后。基于你的训练要做一些模板的定制,支持一些推荐的业务,也要做一些模型更新,支持分钟级和秒级的模型更新到你的手机、个人用户上面去。目前的话这个搜索推荐下载率可以提升很高,比以前推荐的很高,包括我们每天转化率也是很大的,这是终端很大的一个收入来源。

讲完机器学习的话,我们再讲一下深度学习能做什么,深度学习其实刚才说了,深度学习在哪几个领域应用的比较好?就是图像识别、语音、自然语言相关的,包括一些认知领域相关的,其实是用的比较好的。

我举个例子,华为在用深度学习做了一个什么呢?我们全球技术服务是很大,我们华为每年要给很多的人做一些全球技术服务、维护,验收。基站这类业务一般都是一些外包员工去做勘测与验收,但这个时候你很难要求外包员工保质保量的帮你做验收和勘测,会导致一个很大工程的浪费,他勘测的不准,我只有多做余量。

从前年开始我们就想能不能通过人工智能的方法,提升这种效率,所以我们当时就开始做用图像识别的方法,帮助外包员工做勘测的准确性。类似于他在上站之前,他要穿一些安全帽,拍个照片你就知道他有没有拍,要做审核。上站以后你发现光模块有没有擦好,线有没有连接,拍个照片就知道,有没有按照合规去做。

目前这块勘测的准确率就很高了,原来靠人为。我们统计完以后觉得原来靠人的话只有50%的准确率,现在全部拿手机去拍,这种审核效率挺高,包括勘测有多少是公开的,这些完全能够达到99%以上,所以整个的勘测效率至少提升了6-9倍,整个勘测的精度、误差就会小很多。这样的话我们省和很多的人力和物力和钱,这是一个用深度学习做图像识别的比较典型的例子。

还有一些企业用深度学习做什么呢?比方说做环保的,环保局用智能学习,搞个摄像头盯在那里,他希望能故障报警,排污排的冒黑烟了,不可能让人去看,这时候深度学习就会发挥很大的优势。深度学习把图片收集起来做一个分类就可以做的很好,一旦冒出来的烟变黑了,就可以快速产生报警提醒。这是深度学习用的比较多的场景,其实这一类场景最主要还是要贴近业务去思考,业务在看有没有方法这个领域里面有没有可能用一些基于深度学习来做的一个事情。

深度学习讲完以后我们介绍一下强化学习,强化学习其实大家知道最多的就是AlphaGo,能跟人下围棋。那个强化学习商业价值不大,现在强化学习用的比较多的,我们做了几个比较大的一个强化学习领域的探索和突破,包括我们现在给深圳交警做的信号灯控制。信号灯控制如果要做的好的话,大家可以想有一个交警站在那里指挥信号灯,那吞吐量是最高的。但现在的信号灯控制都是一些定时的,设定多少秒就是多少秒。

强化学习的方法就是他会感知这个环境的变化,来不断调整他的决策链,这就是强化学习最基本的理念。我们是通过摄像头和传感器收上来的车流信息,包括你等待空间有多少,不同地根据车流信息不同地调整,每10秒钟调整一次信号灯的相位,信号灯等待时长。这样的话就可以做到吞吐量提升,就类似于强化学习的训练出来的智能体就好比一个交警站在那里去指挥交通一样的。

但不同于交警,计算机的优势是在于它不只是看一个路口,他可以多路口协同调度,那这就是强化学习可以做到很好的调度。目前我们试点的深圳交警整个流量吞吐率至少提升30%,多路口协同调度率的话可以提升10%以上。

#p#分页标题#e#

还有一个强化学习大家可以理解的,就是高耗能领域里面做了一些,包括一些水污。类似你做污水治理的,每年在耗电量是全国的1%。他们现在的耗电量主要在鼓风机、搅拌池里面。如何根据环境因素自动的调节鼓风机或者含氧量去排放,来做到能耗最低。其实这是一个强化学习能发挥的最大领域,他会根据你目前的水质含量来自动调整他的进风口和鼓风机的转速,来降低它整个耗电量。目前我们基于已经在验证的情况下,我们可以把这个能耗直接节省10%,现在还在做测试。

这些收入是很可观的,这是强化学习自动控制领域比较大的。在数据中心里面也是比较多的,数据中心领域每个机架发电量不一样的,那如何调整整个空调的吹风和吹风方向和风速,来做到整个数据中心温度保持在一定范围?这样的话其实可以降低15-45%的电,因为数据中心里面耗电量是空调制冷耗电量是很大,所以这一块我们也跟数据中心在做类似的东西。 还有一些外界在做的一些,包括金融领域的交易,还有一些其他的领域。强化学习在人工智能里面最近一两年会是一个比较大的方向。

讲完平台以后我们再讲一下通用领域的AI,通用领域的AI大家可能都比较清楚了,包括一些文本识别。那文本识别就类似于你手上有很多的单据、文本,那怎么把这些文本快速录入到你的系统中,这里面就有一些难度,包括纯文本现在用的比较多的是你用的一些名片扫描、名片录入,这是很简单的,做的比较多了。但是有一些大量的表格文本就很麻烦了,现在基本上是不成熟的。

7. 华为的探索和实践

华为在这块我们也做了很多的探索和实践,我们目前在共有云上已经提供了一个单据识别的服务。为什么要做这个事情?是来源于华为内部的一些需求,华为在物流里面每年有很大量的单据量。每年在海关报关的时候,他有很大的量需要做一些单据识别,我们在这个里面做的时候,原来靠人工输入很复杂,也耗人力。当时物流部找到我们以后,希望我们通过人工智能能快的帮他录入。

现在我们已经针对它的场景,他有复杂的单据、表格。我们经过一两年的时间,我们基本上把这个功能都克服了,目前整个在一些推广,中英文的基本上都覆盖完了。每年十几万的单据都是通过一些自动录入来做的。目前华为共有云也提供类似的API的服务,这个是单据的识别,这个是文本类的识别。

还有一些内容审核的服务,内容审核服务包括业务上传,这是互联网里面比较要有的。还有一个清晰度检测,有些时候你会发现,举个很典型的例子,你出事故了,大家都会开车,初事故的时候交警会过来拍摄一下图片上传,你车出现的问题是什么,然后拍一些图片上传。

有些时候你会发现上传的质量不好怎么办呢?那就重拍,这就会导致很多的事情。这地方就需要做一些事情,如果他上传的过程中能够自动告诉你这个上传质量不好,上传内容对不对,就会减少后面的一些问题。所以我们在内容审核里面我们业提供清晰度检测的一些服务,包括我们现在给我们自己供应链也在做的,会有POD的单。收POD签收的时候,他会拍照。拍完以后第一步要检测它是否是这个POD,第二步他拍的清不清楚,第三个要把一些POD要旋转、拉正,然后再保存。基本上我们全自动化,有人工智能来做了。

这个在共有云上也有一个服务提供出来,这是图像类的,还有一些图像识别,以图收图、图片标签、图片分类。这个是我们现在给我们自己终端做的,类似于手机相册里面做分类,这个就是很简单的图片分类的模型。

还有一些人脸,人脸目前主要还是在做人脸识别,这个大家比我们都更清楚,因为网上宣传的比较多了。还有智能问答类的,问答其实分三类,一个是我一问一答,我有固定的问题对。还有一个任务型问答,我要做一次任务,比方说你要给我做一些自动控制,比方说你关空调、开空调,或者是关门、关窗,类似于这样的任务型问答,或者是你问他天气怎么样,这是类似于特殊任务型问答。还有一种是知识型问答,问什么他都能回答出来。

基于前面问答一问一答或者是任务型问答,这是在企业里面用的很多的。我们共有云上面我们也会提供任务型问答的东西,这里面会集成很多自然语言的一些东西进去,因为他要做一些语义意图理解。我们现在正在给华为内部的一些智能客服应用,包括共有云SRE问答等,等他们集成完以后验证通过以后在共有云上会开放出来。这是问答类的,就是语义、自然语言相关的。

#p#分页标题#e#

还有一些我们会在华为共有云上做一些行业的解决方案,包括做一些物流相关的,我们提供一些物流解决方案有很多,包括智能装车。物流解决方案源于哪个基础有积累呢?华为的物流是很大的,每年耗10亿美金在做物流,物流里面车都是承包商的。

这里面我们原来做了很多,帮他做一些优化,因为华为有很多箱子,一车货的时候,他有好多的物料要装。那怎么把车箱子的物料装的更满,这就减少很多的成本。这里面我们专门给我们的供应链做了一个优化的算法,这块在工业云上业提供了。就是说,我们支持多点提货,多个箱子、不同箱子多车的提货,然后多车的编排这都有。

另外还有一些路径的规划,我们给一个医药企业在做的,他会派送和收单的方式,比方说他在武汉他有一车货定单,要怎么送给各个药店,然后从又从各个药店进行收货,那这个车的路径规划,怎么做?怎么去编排,规划路径等。目前我们做的效果是提升15-30%的效率,所以目前他们已经在集成在使用了,这是路径规划。另外包括仓储的提货的、减货路径的规划,这都是围绕物流相关的,这都是有很多的实践。

另外我们还有一些其他领域应用也在做,这一块包括一些提保险、金融行业我们做一些交易风控平台,还包括一些推荐的平台,也会开放出来。 推荐平台会在共有云3月底开放给大家使用。基本上我们整个华为这些服务都会逐步的开放起来,我们后续会沿着这个服务框架会把这些发布大量的服务,欢迎大家使用,也欢迎合作方在这个平台上贡献他们的服务,共同来建设华为云企业智能应用生态。

最后我总结一下不同场景的企业怎么去选,人工智能在哪里领域可以发挥优势?其实在企业的话可能面向于几个方面思想,第一个是劳动密集型,比方说你在哪些领域是劳动力特别多的。第二个你在专家经验和数据比较复杂的。第三个自动控制方面的,你就想你在这些方面怎么做效率提升,可以从这些角度想。

戳这里,看该作者更多好文

【编辑推荐】

2017年国内恶意物联网IP分析

递归卷积神经网络在解析和实体识别中的应用

项目做完以后哪些东西可以加入自己简历成为“亮点”

外媒速递:Java程序员必须在新一年中掌握的九大要点

王万军:江苏省“企业上云”三年行动计划解读|V课堂第99期

收藏
0
有帮助
0
没帮助
0