蓝鲸TMT网-国内首家IT记者编辑工作平台 http://www.lanjingtmt.com zh_CN 2017-12-14 00:42:26 2017-12-14 00:42:26 RSS Generator By 蓝鲸TMT <![CDATA[Google替代、阿里协作,AI不只有乐观与悲观之争]]>

文|潇湘

来源|智能相对论(aixdlun)

身在轮椅,却心系宇宙和人类未来的霍金,几年前抛出的“人工智能的发展可能意味着人类的灭亡”言论,无疑把人工智能威胁这个讨论了几十年的老话题又搬上了台面。

大佬们也没闲着,比尔盖茨声称“人工智能将最终构成一个现实性的威胁”,马斯克很早就表露出人工智能是“人类生存的最大威胁”的态度,在波士顿动力公司推出能够后空翻的Atlas四足机器人时,又“大声疾呼”加强对人工智能的监管。

最近,在乌镇赚足眼球的互联网大会,除了大佬聚餐吃什么的花边新闻,关于人工智能的一系列谈话也成了舆论关注重点。

库克、马云等大佬都直白地表达出对人工智能的乐观态度。库克表示,并不担心机器人会像人一样思考,却担心人像机器一样思考,马云则认为“人类有灵魂、有信仰、要自信可以控制机器”。

看起来,这场乐观与悲观的争论仍然在加剧,各方都旗帜鲜明。

而事实上,老生常谈的乐观与悲观只是表象,多年争论、怀疑的背后,本质上是人工智能的两种发展路线之争:以Google、特斯拉为代表的“替代”阵营,其推出的技术大都是用AI去模仿人最终替代人;以苹果、阿里为代表的“协作”阵营,其技术侧重于让机器做人做不了的事,形成人与机器的“协作”关系。

看似都在人工智能的统一旗帜之下,发展路线却形成了截然不同的两个派别。

Google、特斯拉,极客理工男的“替代”关键词

极客们大多都对技术有着疯狂的执着,以此来形容“替代”阵营中的领头羊Google和特斯拉再好不过。

挑起这一波很可能持续一个年代的人工智能风潮的AlphaGo,从1.0到2.0到Zero不断爆发式进化,到Zero已经可以通过左右互搏而非吃棋谱成长,并以100:0碾压上一代。

如此创新、如此极致,很符合极客定位。但无论如何,Google打磨的AlphaGo也只是在“替代”人进行下围棋这个活动。

Google另外一个举世瞩目的人工智能项目当然是自动驾驶技术。谷歌旗下的自动驾驶项目——Waymo日前测试里程又创下了新的记录,其自动驾驶汽车的测试里程已超过400万英里(640万公里),这个里程普通美国人要开300年。在这之前,Waymo已经在虚拟系统中模拟行驶了25亿英里。

不止于此,这400万公里也分段体现了极客对技术追求的进化,每个100万公里,达成速度越来越快,分别是18个月、14个月、8个月、8个月。

Waymo说,公众很快就能用它的无人驾驶服务上班、上学、购物或去更多的地方。这句颇有些得意的话也反映一个现实:再厉害的自动驾驶,其AI技术所做的,也只是在模仿人的行为,“替代”人类司机开车。除了Google之外,还有更多从事无人驾驶的企业,产品思维莫不如是,用激进的方式去推动技术的发展。

比如马斯克,一边称要警惕人工智能,一边在特斯拉的自动驾驶方面层层加码,先是与Mobileye合作,出了几起车祸后移情Nvida,装配Drive PX2,后来Nvida在AI浪潮下春风得意股价暴涨,不愿意受制于人的特斯拉又在最近爆出要联合Nvida老对头AMD自主开发自动驾驶芯片。

显然,悲观的马斯克先生,在用人工智能替代人更好地驾驶这件事上比别人还要更上心。

离开自动驾驶,还有更多以“替代”为主题的技术:AI翻译替代人工翻译,AI助手替代手动操作,AI算法推荐替代人工推荐……不只是Google翻译、Google助手,在模仿人类思维、替代人类执行这条路上,聚集了大量的AI极客。

阿里、苹果,情怀文科男的“协作”世界观

都说苹果的AI发展有点落伍,不过,其一鸣惊人的ARKit却带有极强的深度学习烙印,为ARKit提供动力的主要技术SLAM(通俗地讲就是把摄像头放置入陌生环境,机器能够马上识别环境概况并模拟,从而决定AR如何成像)是典型的人工智能产物。

ARKit所做的,显然不是人能够完成的事,也不是在替代人的行为。另一个持乐观态度的公司阿里也是如此,ET城市大脑、ET工业大脑都是以“协作”为人工智能技术发展的理念基础,其成果都体现人与机器的合作而不是替代。

大概是因为老板马云的武侠情怀,阿里这种“协作”体现出某种文科男的情怀气质,用协作而非狂热的技术“替代”来实现人工智能改造世界的梦想。

本次互联网大会,阿里云ET大脑不出意外地从来自中国、美国、英国、德国、法国、瑞典、爱尔兰、芬兰、韩国等国家和地区近千项互联网领域创新成果中露出,获得世界互联网领先科技成果奖,成为那1/14,同等地位的还有颠覆传统计算机的光量子计算机、华为/高通5G成果、神威太湖超级计算机应用成果等划时代项目。

其实说来说去,这个玄乎的、创新地位颇高的阿里云ET大脑,本质上是一个协作式人工智能项目,是让机器去做人做不了的事情,更像一个人类合作伙伴而存在。

例如,ET大脑中的城市大脑做的就是原来仅靠人脑难以做到的实时交通路线规划问题,将道路监控、红绿灯等设施每天产生的海量数据统筹协同,计算出实时的交通优化方案,智能调节红绿灯,在萧山试点中,该技术让道路车辆通行速度平均提升了3%至5%,部分路段提升11%。

除了针对拥堵的智能红绿灯日常调节,在一些特殊的、对交通时效要求极高的场景,城市大脑的“协作”价值更为凸显。例如在获奖成果阐述过程中,CEO张勇现场展示了正在萧山发生的真实场景,ET城市大脑自动调配红绿灯为患者开出一条“绿色生命线”,让120到达现场的时间缩短一半。对于危重病患来说,这一半的时间可能不能简单用经济价值来衡量。

除了城市大脑,ET大脑还有另外一个脑子——工业大脑,其模式类似,运用数据驱动来提高企业运作效能,做人做不了事。例如在全球最大的光伏切片企业协鑫光伏案例中,ET工业大脑为其提升超过1%的良品率,在这光伏切片领域已经十分可观,带来的经济效益超亿元;在中国最大的轮胎生产企业中策橡胶案例中,使用ET工业大脑让良品率最高提升了5%。

区别于“替代”的极客思维,阿里云ET大脑这些表面的“成绩”,背后有一个共同的特征:只有AI、云计算、大数据能力与垂直领域知识结合,依托多维感知、全局洞察、实时决策、持续进化才能实现的复杂局面下快速最优决策,靠人类自身来做有点天方夜谭,唯一只有依托于智能机器的协作。毕竟,下棋、驾驶、翻译、内容推荐这些东西,没有机器,人同样可以干得不错。

正因为如此,带有某些理想主义色彩的阿里云ET大脑专挑那些人类无法完成的复杂全局问题,例如城市治理、工业制造、社会安全、医疗健康、环保、金融、航空、物流等垂直领域,对外宣称要寻找最优解决方案,要让个人、企业、城市共享技术红利。

由此,以Google、特斯拉为主的“替代”派,和以阿里、苹果为主的“协作”派,形成了泾渭分明的人工智能发展路线。

人工智能悲观乐观之争,不如说是替代与协作之争

过去几十年,人工智能的发展形势并不明朗,乐观也好悲观也罢,做做谈资也没什么。

如今,数据、计算力、算法三大人工智能要素的充足度已经不可同日而语,人工智能的发展大势已经不可避免,所谓乐观、悲观都只是在揣测,在不可改变技术革命面前,把讨论焦点转移到“如何让人工智能最终走向乐观”显得更有价值。

1、强弱之争错了,AI威胁与强弱无光

在人工智能威胁论调中,不少人认为在弱人工智能阶段(按设定逻辑推理、解决问题,但没有自主意识),我们要持乐观态度,只有在强人工智能或超人工智能阶段(智能自主解决问题,具备自主意识,甚至超越人类),我们才要持悲观态度。

其实,AI是否威胁,不在于其发展到哪个阶段、是否形成了对抗人的能力,而在于其和人类已有的秩序是否冲突。

就算是弱人工智能,有冲突存在也算是一种客观威胁,比如2013年牛津大学马丁学院的 Michael Osborne 和 Carl Frey发表了一篇题为《未来职业:工作有多容易被机器取代?》的论文列举了数十个领域上千份可能会被取代的工作,几乎整个社会都会被替代,这种社会结构的剧烈变革、对大多数阶层的冲击,对他们而言就是一种十足的威胁。

因此,也许我们更该聚焦于如何避免冲突的讨论上。对于“替代”阵营来说,一味地模仿人类行为、代替人类操作的技术极客之旅中,也必须配套思考如何让这种“替代”不产生冲突。

例如,特斯拉发布了无人驾驶卡车,Uber马上推出Uber Freight,配合无人驾驶卡车,可以实现简单、冗长的长途运输过程由无人驾驶完成,上路、下路的精细化运输过程则由目前的卡车司机完成,使得原本的“替代”式人工智能并不会产生冲突。替代式人工智能还需要更多这种“配套”技术与创新。

2、控制/失控之争错了,控制既无必要也无可能

相应的,在强人工智能或超人工智能阶段,人工智能威胁论无非认为人类会失去对人工智能的控制从而造成社会风险。这种想法从一开始就假定人和人工智能之间是冲突的、不相容的。

而既然威胁论本身就带有科幻色彩,不如就用科幻的逻辑来揣测人工智能。就像人寻找上帝是为了找寻自己的意义一样,倘若人工智能真的想要威胁,其目的也不过就是为了确认和证明自己的存在。因为一开始就被设置在与人协作、各自分工的位置上被尊重,而不是与人争利的冲突地位,就算有一天苹果ARKit、阿里云ET大脑变成了有自主意识的强人工智能,它们也没有任何理由要来挟制人类。人类依赖人工智能带来的交通疏导、产业运营效率提升,AI的存在自有意义,不需要再通过威胁的方式获得意义。

也即,在阿里云ET大脑这样的项目上,机器有智能,人类有智慧,机器做了人做不了的事情,没有冲突也就不会有威胁。只有那些本身就没有把AI放在平等的位置上,以统治阶级控制平民的思路来谈AI的人,才会感受到切实的威胁。

技术极客的“替代”思维很容易陷入AI和人类文明的冲突的境地,它们往往强调从对算法的绝对把握中获得安全感。在有多少人工就有多少智能的时候,这种控制还行得通,而引用自然科学中的名言:More is different(也是P W Anderson1972年发表于Science的论文标题),当人工智能普遍采用的、看似简单的神经网络模型的层数变多之后,例如10*10的神经网络就可以复杂到没人可以完全理解其深度学习过程,最终的人工智能必定是无法预知的。

所以,要让AI的未来走入乐观,首先要抛弃的恰恰就是那些对如何控制人工智进行各种研究的行为(它本身也不会成功),专注用协作、伙伴等平等态度来发展人工智能。

3、AI商业化没有优劣,只有短期长期之分

毫无疑问,直接对传统的、人所能做的事的进行替代,大都带有颠覆色彩,具有很强的震撼效果,容易博得市场价值。例如,富士康在位于昆山的工厂开始裁员接近6万人,将由超4万台人工智能机器人取代人力,未来富士康宣布将引进一百万台机器人,代替大陆雇佣的一百万工人,这种人工智能的变现十分可观又立等可取。

因此,尽管我们认为协作式人工智能更能契合“乐观未来”,但像阿里ET这种项目在变现的速度上仍然不及替代式人工智能(工业大脑会比城市大脑好些,但短期内也比不上大规模人力替代来得震撼)。

不过,既然这里讲的是未来,从更长远的角度,只是对人工的替代,本质上对社会财富的增长只是“量”的改变,那些人不能从事的领域还是空白。而协作式人工智能帮助解决人解决不了的难题,看似商业化慢热,最终解决的是人与AI分工共存的根本问题,对社会财富的增长将是“质”的改变,在这种情况下,商业价值也将会是自然而然的事。

例如,阿里云ET工业大脑目前已经同协鑫光伏、天合光能、固德威、中策橡胶等制造业大户合作,随着在工业领域的渗透,最终改变的可能是整个工业生产运营;城市大脑在短期体现的是交通疏导,未来可能让喊了几十年的智慧城市不再是一句空话。作为建设者,阿里云的商业化获益肯定不会比生产线机器人、交警机器人这些同领域的替代式人工智能少。

总之,就像马云在大会上说未来30年互联网将变得无处不在一样,作为互联网的下一代,人工智能的未来也必将成为整个社会的基础设施,协作式人工智能的发展路线似乎更能让人工智能有个乐观的未来,但更需要企业有长远的眼光。

智能相对论(微信id:aixdlun):2个前人工智能行业管理咨询老鸟+1个老媒体人组成的三人帮,深挖人工智能这口井,评出咸淡,讲出黑白,道出深浅。

]]>
<![CDATA[基于AI神经引擎的Face ID,让人放心吗]]> 离iphone X预售的时间越来越近,尽管iphone 8事故不断,但人们对iphone X的渴望却是有增无减,这原因之一就是iPhone X放弃了广泛采用的Touch ID指纹识别技术,采用基于AI神经引擎的Face ID实现手机解锁、支付认证。

不过关于Touch ID,今年央视“315”晚会爆出了人脸识别技术的漏洞,主持人演示利用自己的一张证件照,骗过人脸识别,从而成功登陆他人的账户。一时间引起人们对人脸识别技术应用的恐慌,从科幻电影走进现实的人脸识别技术,好像并没有显现出比传统密码更强的安全优势。

半年时间过去后,人脸识别技术从被权威媒体质疑到应用遍地开花,AI技术发展的速度令人目不暇接。人脸识别为何能够替代指纹识别,基于神经网络技术的Face ID到底有哪些独特优势,吸引科技巨头不遗余力地用它押宝未来,还会被央视“315”盯上吗?智能相对论(ID:aixdlun)对人脸识别和Face ID技术进行简要讲述和对比,为您勾勒出现代人脸识别技术的清晰画像。

人脸识别为何在安全认证的赛道后来居上?

本质上讲,人脸识别和指纹、掌纹、虹膜识别等生物识别技术一样,都具有普遍性、唯一性、持久性的属性。

指纹识别之所以能够得到广泛应用,得益于指纹和采集设备直接接触以及光电转换精度的提升,同时指纹面积较小、纹理较为清晰,也使得数据采集和识别过程相对容易实现。

相比其他类型生物识别技术,人脸识别“隔空”采集数据干扰多,处理难度大。但由于具有以下3个突出优势,应用越来越广泛,大有后来居上,成为安全认证主力的势头。

1、识别过程友好。利用指纹、掌纹以及虹膜方式识别需要身体直接接触检测仪器,人脸识别属于非接触识别,隔空自动采集图像,便于实施。

2、方便快捷。使用普通摄像机或者三维扫描仪就可以实现对数据的采集,通常在毫秒级别内即可实现识别。据统计,手机用户平均每天要解锁手机80次,有了人脸识别解锁功能后,解锁过程将被大大简化。

3、符合常识、交互性好。通过检测人脸进而识别身份,与人们的生活习惯与认知保持一致,可以更简单直观地看到识别结果,更具有普适性。

各种花哨识别技术的背后,无外乎二维或三维识别

现在的绝大部分人脸识别技术都是二维识别,采集的是人脸的平面图像,并依靠图像上的特征点来生成一组特征值,然后每一次识别时候将会与第一次录入特征值进行比对,到达一定的准确率就算是配对成功。

二维识别在光照、姿态、年龄等发生变化时,识别效果不理想。同时,安全性不高是它的先天不足,一张照片就欺骗过去的事情不在少数,即便是后期引入的多角度识别以及表情识别等,也只是稍微提升了下安全性,但并没有本质上的改变。

三维人脸数据比二维人脸数据可以更好的突显出人脸在空间中的特性,具有显式空间形状表征,信息量比二维数据丰富得多,这些特性在一定程度上可以简单有效的将不同的人脸区分开,识别更加立体、更加准确。

智能相对论(ID:aixdlun)统计,现有三维人脸识别方法主要有以下四种。

1、基于空域匹配。该类方法可通过输入点云数据的方式直接完成匹配操作,无需进行特征提取。比如,首先对面部受表情影响较小部位(如鼻子)进行提取,然后用算法对曲面进行三维人脸匹配。

2、基于局部特征匹配。从三维人脸曲面上提取到有效的局部几何特征,利用特征点将人脸深度数据对齐,再提取鼻尖区域、眼部区域、对称面区域三条曲线,合成全新的特征向量进行匹配识别。

3、基于整体特征匹配。把三维人脸看作一个整体,以整体为依据提取特征。利用深度图像是其中的一种方法,其可以通过将三维人脸数据正交投影,进而利用二维人脸识别中的各类方法进行操作。

4、基于双模态特征匹配。融合二维纹理与三维几何两种特征进行识别。因为融合后的信息更加丰富,所以更具有研究价值,但实现较为复杂。

强大的三维识别也有很多短板

三维人脸识别为机器自动识别人脸提供了崭新的角度,相对二维人脸识别具有较明显的优势,不过智能相对论(ID:aixdlun)提醒,它也面临着很多困难。

1、光照变化。摄像感应器设备对人脸图像进行采集时,会因为外部环境的光照变化、拍摄角度的问题等造成采集图像的差异。

2、表情因素。人们不同表情会造成脸部的一些器官和肌肉发生位置和纹理的变化,对识别造成困难。

3、姿态变化。各种姿态的面部图片,如侧脸、抬头、歪头、低头等,也是检测和识别的难点。

4、遮挡因素。口罩、墨镜、帽子、围巾等衣物遮挡脸部,或者胡须、化妆等其他因素影响,也会给检测和识别过程带来难度。

5、年龄因素。随着年龄的增长,脸部皮肤纹理、胖瘦、五官等等都会发生变化,造成样本库中的数据失效,给识别系统带来时效性问题。

6、计算能力要求高。对脸部的大量数据采集、建模和分析比对,对设备的并行计算能力要求较高,对集成在手持设备中的三维识别模块的计算能力要求更高。

Face ID三大法宝:红外、三维、AI芯

为了解决以上人脸三维识别6大技术难题,苹果公司给出了独门解决方案:提高数据采集建模能力,增加AI神经网络单元,提升智能识别和并行运算能力。

1、红外感应系统。对可见光的变化几乎无感,无论白天黑夜都能智能感应识别人脸,而且对温度敏感,没有体温的照片或面具很难骗过Face ID。iPhone X的“齐刘海”中的点阵投影器向外投射出3万个肉眼不可见的红外点光源,由红外镜头拍摄一张红外照片,根据照片上的位移变形情况,分析出人脸的景深信息。同时,距离传感器会探测在一定范围内,是否存在被探测物,以决定是否开启点阵投影器与红外镜头的工作。而在暗光、无光环境下,泛光感应元件会向外投射不可见的红外光源,以帮助Face ID更好地工作。

2、3D建模技术。目前三星、支付宝、vivo X20、小米Note 3等普遍使用“2D识别方案”,用普通照片比较容易破解。iPhone X投射3万个红外点光源作为特征点,结合面部的深度信息,构建3D立体脸部模型进行识别,大大提高了识别的准确性和安全性。仅仅靠二维照片,再也没有可能通过Face ID验证,即使做成逼真的3D脸模,也不能通过精密的数据比对和对眼睛附加检测的考验。

3、搭载AI单元的仿生芯片。人工智能是当下尖端科技的风口,苹果这一次又领先了。A11仿生芯片不仅较上一代芯片(A10)图像处理能力提升30%,而且集成神经网络引擎,成为苹果第一枚搭载AI神经网络单元的移动芯片。

AI神经网络单元每秒六亿次运算,主要用于胜任机器学习任务,识别人物、地点和物体,计算人脸不同部位的位置与距离,判定是否为使用者本人,同时能够学习到人脸图像中的一些隐性规律和规则,为Face ID提供强大的性能支持。

早期的人工智能学习算法识别成功率普遍不高,完全不能和人眼识别能力相提并论。卷积神经网络理论的提出,为人脸识别提供了强有力的技术支持。通过局部连接、权值共享和池化采样,大大减少神经网络的权值数量,降低网络模型的复杂度,实现了对庞大的3D人脸数据的快速化处理。同时对人脸图像的缩放、旋转、平移以及其它形变的识别鲁棒性更好。目前基于深度学习神经网络的人脸识别技术可以达到几乎100%的正确率,人类肉眼识别精度只有97.53%。

为了进一步提升安全水平,苹果使用了1,000,000,000张照片来训练这个神经网络系统,Face ID因此“认识”了足够多的面孔,确保以后不被照片或模具欺骗。利用AI单元,可以持续地学习用户脸部的长相和表情,在完成首次人脸信息的采集和录入后,随着时间的推移,即使你戴眼镜了、开始长了胡子等,Face ID仍然能继续认出你,并不断根据新的数据来校准识别模型,以保证识别率。

Face ID真的能够让人放心吗?

就在iPhone X正式发售倒计时时,坏消息也不断传来,有分析师指出,由于3D感应系统由结构化光系统,飞行时间系统和前置摄像头组成,结构过于复杂,良品率很低不足10%,首批100万部的生产要推迟到12月份才能完成。

除了良品率以外,用户对Face ID最关心的无外乎两个性能,识别速度和识别精度。苹果的Touch ID刚出现时,由于识别速度偏慢,在相当长一段时间并未被广泛接受。Face ID要处理的三维脸部数据量比起Touch ID自然是高出不少,不过得益于性能更强悍A11处理器以及其整合的AI神经网络单元生物引擎,还有基于神经网络的算法,从目前来看Face ID识别速度比起Touch ID应该有长足的提升,响应速度更快。

而Face ID的识别精准度则是iPhone X安全性的关键,以往二维识别技术在这方面显然无法与基于三维成像的Face ID相提并论。而与现在用户普遍接受的Touch ID指纹识别相比,从公开的数据来看,安全性应该是提升了不少,不过能不能让广大用户满意,会不会遭到投诉,我们还要拭目以待。

智能相对论(微信id:aixdlun):2个前人工智能行业管理咨询老鸟+1个老媒体人组成的三人帮,深挖人工智能这口井,评出咸淡,讲出黑白,道出深浅。

文|草原骑士

来源|智能相对论(aixdlun)

]]>
<![CDATA[AI干起了实时翻译,我们离跨越语言的鸿沟还有多远]]>

1954年,美国成功研制出了世界首个机器翻译系统,实现了俄英两种语言之间的简单转化。但由于人类语言本身的复杂性和多样性,半个多世纪以来,计算机系统对于人类语言的理解一直处于相对较低的阶段,投入实际应用的研究成果寥寥无几。

直到近10年,以“深度学习”为代表的人工智能技术在语音识别、自然语言处理等基础应用领域与产业结合的业务中取得了较大突破,能够识别语音的机器翻译逐渐从实验室走向普罗大众。

在AI机器翻译这条赛道上,互联网巨头都在虎视眈眈

自去年乌镇互联网大会上,百度、搜狗相继亮相人工智能同声传译技术之后,又一次引发机器翻译是否会取代同声传译的激烈争论。

尽管专业人工翻译公司依然看衰AI对翻译产业的颠覆性,但包括Google、Facebook、微软、百度、腾讯、搜狗在内的各大技术巨头却在不遗余力地推进深度学习在机器翻译领域的研发和应用。

2016年9月,Google发布谷歌神经机器翻译(GNMT: Google Neural Machine Translation)系统,声称该系统利用神经网络技术,模仿人脑的神经思考模式,产出媲美人工翻译的高质量译文,并将误差降低了55%-85%。谷歌公司己经将该技术应用于网页翻译与手机应用,译文质量明显提升。

腾讯、百度、阿里巴巴等国内互联网公司将深度学习理念应用到机器翻译,在智能翻译领域持续发力,推出多款基于神经网络技术的在线翻译和手机应用。甚至在手机浏览器的升级战争中,智能翻译也被当作重要功能革新,搜狗手机浏览器推出“智能翻译”,集合了语音对话翻译、AR实时翻译、拍照翻译等常用功能。

智能翻译架起了不同语种间人们便利沟通的桥梁,已经成为日常交流、出国旅游、外文学习等方面不可或缺的助手。笔者就简要梳理一下AI实现文字和口语翻译的基本原理、结合实例介绍智能口语翻译难点以及智能翻译有哪些需要解决的问题。

各种花哨的技术概念,核心仍然是AI处理人类语言的三种方法

实现让计算机处理人类自然语言是人工智能领域的一个重要课题,与句法分析、语义理解和自然语言生成等计算语言学核心理论密切相关。目前,AI主要有三种方法翻译人类自然语言。

1、基于规则的机器翻译方法。早期机器翻译的主流方法。基于规则的机器翻译系统依靠人工编纂的双语词典和专家总结的各种形式的翻译转化规则,但在通用领域中的应用性不强,往往被限制在了专有应用上,逐渐被新的方法取代。

2、基于实例的机器翻译方法。从已有的翻译经验知识出发,将源语言句子切分为翻译知识中见过的短语片段,通过对已有翻译资源进行自动总结,得出双语对照的实例库,并设计规则处理双语对照实例库中的歧义性等问题,实现对新的源语言句子进行翻译。

3、基于统计的翻译方法。统计机器翻译方法将任何目标语言句子都看成源语言句子的可能翻译候选,从语料自动学习翻译模型,然后基于此翻译模型,对输入源语言句子寻找一个评价分数最高的目标语言句子作为翻译结果。目前谷歌、搜狗等基本采用的是这种。

深度学习能够自动学习抽象特征表示、建立源语言与目标语言之间复杂的映射关系,给统计机器翻译的实现提供新途径,目前已经在词对齐、语言模型训练、解码等模块的优化应用方面取得较多成果。例如,2006年谷歌发布基于短语的机器学习(PBMT)系统,该系统将句子分解成词和短句,进行逐个翻译。它的弱点在于忽略了上下文,因此译文质量不佳。2016年谷歌发布的神经机器翻译GNMT,将句子视为基本单元,不再对词和短句逐个翻译,明显改善了译文质量。

作为智能翻译的“制高点”,AI口语翻译难在哪?

与普通文字翻译相比,AI口语翻译难度更大,原因有二:

一、想要“译得准”,首先要能“听得清”。AI要准确判断出指令发出者的语音、停顿,并在极短时间内进行“语音断句”,在涉及一些模糊音时能够根据“上下文”进行及时调整,这需要有深度学习的模型自动更换为一个语义通顺、更符合作者指令的句子,然后才能进行文字翻译处理。

二、想要“译得准”,还要包容口语的“4个任性”

基于神经网络技术的智能翻译系统越来越多,翻译质量确有较大提高,但是能不能很好地包容口语的各种任性,我们来做几项测试,检验一下人工智能翻译的水平。为便于说明,选取了具有代表性的谷歌翻译和搜狗手机浏览器自带的智能翻译进行比对。

1、日常口语具有不连贯的特性。在口语交谈中,经常会出现一些不连贯的成分,如:重复、次序颠倒、冗余和语句残缺。下文是一个典型的兼有语句残缺和发音重复的句子。

原文:那六楼呢?咱们……咱们,下午谈一谈吧?

谷歌翻译:The sixth floor?Let's talk about us in the afternoon?

搜狗手机浏览器智能翻译:What about the sixth floor? Let’s… Let’s talk this afternoon.

谷歌翻译在重复的处理上未真实体现原文,搜狗手机浏览器智能翻译如实还原。但是,两个翻译结果在表达上都不同程度地存在错误。

2、语法约束相对较弱。口语中很少会有严格符合语法约束的结构完整、正确的句子,而大量存在的是语法规则难以处理的现象。一方面是由于系统的语法知识对语言现象的覆盖程度不足;而更主要的则是口语本身的特性所决定的,例如口语中存在大量的代词,人类口语比较容易理解,但是AI不能结合上下文,缺乏背景知识,难以区分指代对象,导致翻译结果偏离原意。

原文:Look, man, you don’t got to do anything. This one means a lot to me.

谷歌翻译:看,男人,你什么都不做。这对我来说意义重大。

搜狗手机浏览器智能翻译:听着,伙计,你什么都不用做,这对我意义重大。

翻译的关键在于两个词:look和man。谷歌的翻译也对,而看起来,搜狗手机浏览器的翻译结果更符合生活实际。

3、没有明确的句子边界。口语中没有标点符号来标志句子,也基本没有传统意义上的句子,缺少了必要的声调和停顿,很容易造成句子的歧义。

例如:“这苹果不大好吃”。那么该句有两种不同的理解结果:这苹果不大/好吃(苹果不大,但是味道好),这苹果/不大好吃(苹果味道不好)。两家AI都未能分清句子结构发音上的差别,都默认翻译为“苹果味道不好”。

4、非正式语体材料多。中英口语中都存在较多随意性的口语或网络用语,生活化气息浓厚,多为非正式的语体材料,智能翻译需要庞大的基础词汇库支撑。

原文:近期我们注意到国际上有一种看法,认为中国已经成为世界上最大的经济体,一方面挑战了美国的领导地位,另一方面在很多国际事务上中国仍在搭便车。请问您怎么看待这样的看法?(总理记者会上中国日报记者的现场提问)

谷歌翻译:We have recently noticed that there is a view that China has become the world's largest economy, on the one hand challenges the leadership of the United States, on the other hand in many international affairs, China is still free. What do you think of this view?

搜狗手机浏览器智能翻译:Recently we have noticed an international view that China has become the world's largest economy. On the one hand, it challenges the leadership of the United States. On the other hand, the Chinese are hitchhiking in many international affairs. I would like to ask what you think of this view.

专家译文:Recently we have noticed that there is a view in the international community that China has become the world’s largest economy, on the one hand challenges the leadership of the United States,on the other hand in many international affairs in China is still a free ride, how do you think of this view?

可以说,两家AI对这段话的翻译,虽然都有些许瑕疵,但是总体都还是比较到位的,搜狗手机浏览器对于“搭便车”这个典型口语化词汇翻译相对更准确。

中国古诗英译一直是文化翻译的一个难题,甚至被认为是可译性最小的文学形式。我们来试验一下两家AI对王维《九月九日忆山东兄弟》的理解和翻译能力。

独在异乡为异客,每逢佳节倍思亲。遥知兄弟登高处,遍插茱萸少一人。

谷歌翻译:Alone in a foreign land for the stranger,every festive times.

Distinguished brother ascended the throne,who was full of cornelia.

搜狗手机浏览器智能翻译:Alone in a foreign land, I miss my relatives more than anything else during the holidays. I know my brother has climbed up to the top and planted dogwood everywhere, but one person is missing.

参考译文:Alone,a lonely stranger in a foreign land,I doubly pine for my kinsfolk on holiday. I know my brothers would, with dogwood spray in hand, Climbing up the mountain and miss me so far away.

翻译古诗词,确实非常难为两家AI。不过,翻译的结果很有趣,搜狗手机浏览器对前两句翻译尚可,后两句翻译成了我的兄弟在高处到处种植茱萸,谷歌对最后两句完全是进行了想象性的拓展。

要跨越语言不通的鸿沟,智能翻译还需往哪加油

智能翻译确实取得了令人惊喜的进展,拿着手机和老外进行日常交流已经基本没有问题。但是智能翻译还存在“短板”,会有“词不达意”的时候,AI要想更进一步发展,和有着数十年积淀的高水平翻译员进行竞争,可能还需要从以下几个方面进行努力。

1、大量补充口语化语料

智能翻译对于口语化文本处理能力还不强,一是由于翻译语料库口语化语料不足,二是针对口语词汇与口语表达多采取直译方式,因此出现较多误译。该问题的解决应该从扩大对应部分语料库入手,增加口语类文本语料库,包括常见口语化词汇、表达与生活用语。

2、提高语境理解能力

智能翻译对于中文复杂含义句式中的时态辨别能力还不够,往往需要充分理解整句话的意思才能准确把握时态。智能翻译并非基于理解,而是基于统计学与语料库,只能做到将这句话意思大致翻译准确,在识别感情色彩方面,还有欠缺。

将神经网络学习的抽象表示和传统符号语义方法结合,建立新的基于语义的机器翻译系统,或许可以大幅提高AI对组合语义、复杂的递归语言结构的处理能力。

但,我们依然满怀期待AI让我们摆脱语言鸿沟的那一天。

文 | 草原骑士

来源 | 智能相对论:2个前人工智能行业管理咨询老鸟+1个老媒体人组成的三人帮,深挖人工智能这口井,评出咸淡,讲出黑白,道出深浅。

]]>
<![CDATA[AI也能作曲,谁来定义AI的freestyle]]> 美国网红兼流行歌手 Taryn Southern 近日发表了一张名为 I AM AI 的新专辑,成为人类历史上第一支正式发行的AI歌曲。

主打单曲《Break Free》虽然达不到格莱美的标准,但是完全听不出是由应用程序编曲,和音乐人的作品没有太大差别,颠覆了普通人认为AI制作出来的歌曲会比较机械、情感空白的认识。

实际上人工智能巨头公司都在深入研究AI音乐,一些AI音乐作品已经达到“大师级”,甚至到了“以假乱真”的地步。去年2月,第一部由算法创作的音乐剧《Beyond the Fence》在伦敦上演,获得较高评价;6月,Google研发的机器学习项目Magenta通过神经学习网络创作出了一首时长90秒的钢琴曲;9月,索尼计算机科学实验室人工智能程序创作一首披头士音乐风格的歌曲《Daddy's Car》,广受好评;百度公司人工智能(AI)可以在分析画作之后,作出与之风格相对应的曲子。

人工智能在作曲领域取得了许多令人欣喜的成就,已经成为能与人类协同创作复杂艺术作品的得力助手。那么,AI实现作曲的原理和技术路径、有哪些优缺点和需要解决的问题,本文智能相对论简要通俗地讲讲。

AI作曲也在遵循“基本法”

音乐发展至今,所有的创新和突破都在竭尽所能地逼近人类极限,历代西方作曲大师无不在伟大作品中留下探索音乐与新技术融合之道的时代印记。

从基础理论设计与数学逻辑同构并进行符号化组织的角度来看,音乐虽然作为一门艺术,却有很强的可计算性,音乐模式背后蕴含着数学之美。常规的作曲技法,如:旋律的重复、模进、转调、模糊、音程或节奏压扩,和声与对位中的音高纵横向排列组合,配器中的音色组合,曲式中的并行、对置、对称、回旋、奏鸣等等,都可以被描述为单一或组合的算法。这从本质上决定了,AI技术可以较好地应用到音乐创作上。久负盛名的人工智能音乐作曲系统EMI,就是通过对作品进行分解,以新的排列来复用这些结构进行重组,获得不同风格的新音乐。

其实,早在上个世纪60年代,就已经有计算机与传统音乐之间结合的尝试,直到广泛研究智能算法的热潮兴起之后,许多基于机器学习神经网络的开源项目浮出水面,AI技术有了长足的进步,越来越多的人关注到这个科技与艺术奇妙结合的领域,计算机音乐与传统音乐的桥梁才逐渐架设起来。

虽然是freestyle,也有一些作曲技术模型

人工智能在作曲主要基于以下几种模型:分形音乐模型、马尔可夫链(Markov chain)模型、遗传算法(Genetic Algorithm)模型、人工神经网络(Artificial Neural Networks)模型和各种基于规则知识的改进或混合模型。

1、分形音乐。它表明音乐完全可以通过数学算法进行创作。分形音乐是几何学在作曲中的应用,但是只能创作一些较为简单的作品。

2、马尔科夫链。由于建模简单,可以即时产生新音乐,所以一直被广泛用于商业程序上,也大量出现在互动音乐艺术家的作品和即兴演出中。它基于随机过程、概率逻辑的有限控制方法,尤其是使用马尔科夫链结合一定约束规则,在统计的基础上对音乐的未来走向进行概率预测与风格边界限制。

3、遗传算法。将音符的排列组合进行编码,模拟物种繁殖过程,自动挑选出最优秀的作品。由于具有算法成熟和实现比较简单这两大优势,遗传算法得到广泛关注。但是,用遗传算法进行智能音乐生成,选取合适的评价函数是非常富于挑战性的工作,一定程度上限制了应用的快速发展。

4、人工神经网络。当前AI音乐研究的前沿技术,普遍采用具有深度学习能力的各种改进神经网络模型,来帮助人工智能模型学习样本音乐中的关键元素以及套路。模型充分学习一系列人类已经创作好的音乐,提取和存储音高、音长、音量、音色、音程、节奏、调式、和声等关键特征,即可按照要求大量输出有类似特征的新音乐。例如,Google Brain做的在线交互钢琴只需要识别当前任意类型的少量音乐,就可以根据音乐的相符度进行预测,实时输出自动弹奏出搭配音乐。

创造AI的freestyle,它的难点在哪?

目前AI作曲领域研究的方向主要在深层特征的提取与应用和混合系统的构造上,还面临以下几个难点。

1、音乐的表示问题。音乐组曲过程较为复杂,现有特征提取机制尚不能够精确掌握一部作品的全部信息,比如,作品中与乐句、调性等相关的音乐信息一般体现不出来。如何精准表示音乐的细部特征、提取音乐的深层逻辑、建立表层结构和深层逻辑的关系,是AI作曲亟待解决的基础性问题。

2、学习与创造的问题。通过大量学习而建立的作曲系统,能否“灵感一现”,合理地突破预置规则,尝试使用不同方式创造性地作出一些风格独特,更生动、更具吸引力音乐作品。如何进一步激发AI的创造性,实现从按照规则制作到突破规则创作的转变,是AI作曲面临的一个技术难题。

3、创作作品的质量评估问题。人类对音乐作品的评判往往比较感性,因此作曲系统中的质量评估机制是一个非常重要的部分,它往往会引导创作的方向,甚至最终决定作品的成败。把人类的审美观用机器能够理解的语言描述出来,建立有效的评判标准是研究人员首要面对的问题。

文 | 草原骑士

智能相对论(微信id:aixdlun):2个前人工智能行业管理咨询老鸟+1个老媒体人组成的三人帮,深挖人工智能这口井,评出咸淡,讲出黑白,道出深浅。

]]>
<![CDATA[在线少儿英语培训想AI+,恐怕没那么容易]]> 文 | 漠兮

来源 | 智能相对论(aixdlun)

如今人工智能大行其道,各行各业都想贴上AI的标签,在线教育也是,各大公司都在凹出不同造型来和人工智能挂上钩,以抢占市场先机,赢得口碑与利润。然而,理想很丰满,现实很骨感。作为人工智能+的应用行业,尽管人工智能在在线少儿英语培训领域已经被应用在个性化教学、智能师生匹配、情绪识别、智能互动课堂、智能语音识别等,但智能相对论仍然想提醒,这需要教育公司拥有强大的技术及研发实力的保障,然而这种实力并不是一蹴而就的,超高的门槛限制了教育公司引入人工智能的计划。

先天不足——英语培训相关大数据难获取

人工智能必须的养料——海量的、有效的数据难获取。教育公司得有足够的数据支撑人工智能深度学习的需要,包括英语知识大数据、语音数据、视频数据、学生行为数据等。数据采集后,通过清洗得到有效数据,然后根据教育公司学习系统要求,人工为图片、视频和语音内容打标签、做标记。标注好的数据才可以用来训练人工智能算法模型,然后应用到图像识别、语音识别、动作识别等不同的模块。数据越准确、数量越多,算法模型的效果就越好,产品的体验也会更近一步。

数据的规模和采集能力决定了人工智能在英语在线培训行业的发展速度。而在英语在线培训这个细分领域,21世纪初才开始出现,2010年以后才逐渐成熟,不过短短几年,且受限企业数据源相关设备影响,以及企业本身的对这类数据的关注度及科学技术的发展预见有限,原始数据积累本就不足,加之精细度不足,大规模的样本数据较难获取,更别谈数据的有效性和其标注的质量。

差强人意——用于评估学生英语水平的数据分类不合理

数据的分类与关联,关乎系统最终实现的效果。目前在线教育公司的分类,无论是个性化学习还是智能语音测评,都在粗分类的基础上实现的。如有教育公司采用CCSS教材(Common Core State Standards 简称CCSS,又叫美国共同核心州立教育标准,是由美国教育部以及哈佛、哥伦比亚大学等名校提出的,按照美国大学招生要求制定的教学大纲),它涵盖12年义务教育所有的学科内容,所以当使用人工智能技术评估学生的英语水平时,其分类也只是按各年级水平粗分为12类,且不说用语评估的题目是否精确,仅以此作为学生的实际水平去给其制定学习路径,未免有悖于千人千面的“个性化学习”的初衷。

数据挖掘和搜索算法对数据工厂中的知识库和信息库进行分类与关联的技术能力也是在线教育公司的一大痛点。数据存储在硬盘上,机器想要找到某个数据,必须一个个访问过去,机器没有分类的概念。如果需要机器理解用户的语言,这种搜索技术也依然要机器的大脑配合才能达到,对每一个词的定义应该是一个库,而这个库中的每一个词又都各自构成库,数据工厂所依托的搜索算法,就是在这么一个数据海洋中去为他们建立管理,然后去索引。数据工厂相当于人脑中的记忆关联过程:将某个词同时与其他词或是某个场景等等建立起动态关联的过程。这也是教育公司进入AI+领域的重要门槛。

力不从心——学生情绪识别所依赖的智能算法远不够智能

算法负责接收有关特定领域(例如学生掌握的所有英语单词)的信息,通过对输入的信息进行权衡做出有用的预测(此人的英语水平)。通过实现让“计算机自行学习的能力”,可以将优化方面的任务,交给算法负责。如对可用数据中的不同变量进行权衡,进而面向未来做出精确的预测。预测的准确性一方面取决于上文提到的有效数据样本量,另一方面取决于算法结构。

如个别教育公司将人工智能深度学习算法用于情绪识别,通过人脸识别技术,有效监测学生的接受程度、喜好、专注度、开心值等,通过大数据来全程追溯学生的学习过程,发现学生学习中的问题和喜好,进行有针对性的强化和补充,从而让学习效果更高效。情绪识别技术可以说是人工智能发展的最高水平,不论采用何种算法,目的都是让人工智能具有和人类一样的思维能力,可以分辨情感。

情感是人类神经系统对外界价值关系产生的主观反映。这种反馈由大脑首先发出指令,进而影响人的面部表情、声音高低和语速以及其他肢体语言,还会影响心脏、四肢等器官,也影响大脑本身。当然,人的内心状态又与先天因素和成长经历有关,所以面对同样的外部变化,不同的人会产生不同的情绪。 判断情绪、看出眉眼高低,对于人类来说,可能连不会说话的小孩都能做到。可是,这个能力却是目前人工智能的最高水平。也就是说,人工智能发展的水平还没有足够高,使机器人可以更像人。面对人类情感这个异常复杂且人类自身都没有完全弄懂的问题,人工智能还有很长的路要走。

所以在线教育公司提出的情绪识别,识别的精确度有待验证。而将这种不确定的预测结果应用于学生的个性化学习,为其制定独有学习路径或者提供任何的学习建议,难免会有人质疑:前提都不一定正确,结果会对吗?情绪识别只是教育公司AI应用的冰山一角,其他类似的应用都存在或大或小的问题。

一将难求——AI优质人才紧俏难得,教育公司鲜有优势

当前,人工智能领域的竞争,主要体现为人才之争。

只有投入更多的科研人员,不断加强基础研究,才会获得更多的智能技术。人工智能技术的开发与应用,不光需要依靠研发费用和研发人员规模上的持续投入,还应该加大基础学科的人才培养,尤其是算法和算力领域,而很多高校在很长时间内并没有人工智能专业。这也就造成了国内人工智能人才紧俏,各大互联网公司的人才抢夺战尤为突出。作为互联网的一个细小分支,在线教育公司如没有强大的综合实力,很难获得优质人才。

小结

人工智能技术在线英语培训领域的应用还有很长的路要走。在数据积累层面,未来,大数据时代来自全球的海量数据为人工智能在少儿英语在线培训的的应用提供了良好的条件,在不久的将来将不成问题;人工智能的灵魂——智能算法还得依赖于人工智能技术的持续发展继续优化得到适用于英语在线培训的最优算法;而人才,在线教育公司或许只有是行业领军企业才有资格加入人工智能人才抢夺战,后来者唯有高薪聘请或文化吸引,才可能有一席之地。

智能相对论(微信id:aixdlun):2个前人工智能行业管理咨询老鸟+1个老媒体人组成的三人帮,深挖人工智能这口井,评出咸淡,讲出黑白,道出深浅。



]]>
<![CDATA[离开人工智能谈共享汽车就是耍流氓]]> 文 | 漠兮

来源 | 智能相对论(aixdlun)

曾几何时,某电视节目女嘉宾说:宁愿坐在宝马车里哭,也不愿意坐在自行车后笑。如今,沈阳街头的共享宝马,让这类女嘉宾的梦想成真,且何其容易:现实与理想之间,只差一本驾照而已。

言归正传,北京CBD的奥迪A3,沈阳街头的宝马1系以及山城重庆的奔驰smart……共享汽车已然进入豪门争霸时代。然而,此时的共享汽车其实只能算是分时租赁,其价值远不及“共享经济”。要想成为真正的独角兽行业,共享汽车必须有人工智能的“辅佐”,因为只有当共享汽车具备了自动驾驶、智能交通、智能网联三重属性,才可能资源利用效率最大化的同时创造更多价值,而这恰是“共享经济”的核心。

一、只有自动驾驶,才能给共享汽车提供出行场景支持

目前的共享汽车,还需消费者必须持有驾照,而对于无驾照者(包括成年无驾照者、老年人、青少年、残疾人等),对不起,不能共享。而自动驾驶技术未来将为这类人群提供完美的解决方案,只需消费者掌握系统控制方法即可。按SAE International的标准,L3级以上就已具备高度自动驾驶能力,由系统实现加减速、转向操作及对周围环境的观察;L4级为超高度自动驾驶,除L3的所有功能外,实现了激烈驾驶的应对,但工况具有局限性。L5即为全自动驾驶,车辆的智能化,已经达到了人类驾驶的水平,可以处理所有工况。

除了驾照的限制,对于消费者的驾驶经验也是硬性要求。“马路杀手”多为缺乏经验的驾驶员。共享汽车对于这类人群同样无能为力不说,稍不留神还可能引发安全事故,造成一定的损失。且驾驶汽车作为一项有风险的交通行为,驾驶员行车时的心理、生理和行为特性对驾驶安全影响很大,包括驾驶员的视觉、听觉、反应、情绪、驾驶技能、感知判断能力、疲劳驾驶等,往往都决定着潜在事故是否有可能发生。而自动驾驶技术在未来不仅对驾驶经验没有要求,可完全改善了消费者的驾驶感受的同时,而且会显著减少因为驾驶员原因导致的交通拥堵及安全事故。

第三点关于效率。目前的共享汽车,需要消费者主动寻找车辆,并在结束用车后,停放到指定的地点或者停车位。这对于企业和消费者都是时间和资源的浪费,与“共享经济”的理念冲突。而自动驾驶犹如一个优秀的调度员。在共享开始前,消费者发起共享汽车需求,则距离消费者最近的汽车可通过自动驾驶在最短时间内到达指定地点;在共享结束后,即消费者到达目的地离开后,通过自动驾驶寻找停车位,若为电动车,还可以根据电量使用情况,自动寻找最近的充电场所进行充电。

二、只有智能交通才能为共享汽车的实现提供更具操作性的解决方案

目前企业对共享汽车的调度依赖于人工,且资源分配不均,大有“车到用时方恨远”之势,共享之说可谓心有余而力不足。而智能交通为共享汽车的实现提供了更具有操作性的解决方案。通过车辆管理系统,实现调度管理中心与共享汽车之间的双向通讯,提高企业运营效率。让互联网与汽车深入连接,用现有的车辆资源解决更多人的用车需求,从而减少交通负荷和环境污染,保证交通安全。

智能交通中的车辆控制系统可分析车辆行为,自动统计车流量信息,判断道路拥堵状况,为共享出行提供最优路径;同时该系统可以准确地判断车与障碍物之间的距离,遇紧急情况,能及时发出警报或自动刹车避让,并根据路况自己调节行车速度,保障共享汽车及人员的安全性。

三、只有智能网联,才能为共享汽车的应用创造场景

无论是共享宝马还是共享奔驰,汽车性能依然有待提高,安全性和驾驶体验均受掣肘。智能网联为共享汽车的应用创造更优场景。

首先是网联产品使用,包括设计及汽车性能方面,如远程控制应用程序、车道偏离预警系统等,以提升共享汽车的安全性能。

其次是驾驶体验,通过智能网联的应用,优化导航性能及移动端的服务,如卫星定位导航与车况子检测功能,或接入交通信息预报与娱乐系统,改善传统的驾驶体验。

第三是互联网接入,如车与车之间的联接、车与网络中心、智能交通系统等服务中心的联接,甚至是车与住宅、办公室以及一些公众基础设施的联接,也就是实现车内网络与外部网络之间的信息交换。

站在风口前的共享汽车,需警惕四重风险

凡事都有利就有弊。“共享汽车”的发展在国内尚处于萌芽和起步阶段,行业本身犹待不断探索和完善。在当前的风口下,共享汽车存在哪些风险问题呢?

首先,投资回报难。在共享汽车遍地开花的当下,企业很难实现投资回报,因为很难在出行业务中做到最出色,市场占有率领先难。相对比来说,成本较低共享单车企业已经逐一消失,而成本颇高的共享汽车企业又如何能尽快抢滩登陆呢?

其次,共享便捷性有待提升。目前一些汽车共享企业采用的是定点租还,消费者常常无法达到最终目的地,还需要借助地铁、共享单车等“接力出行”,非常影响用户体验。不仅如此,由于停车收费问题,不定点租还,难免会产生停车费,更让用车人难以接受。“随地还车”和“随地借车“并未真正实现。

第三,新能源汽车大行其道,发展势如破竹。如果使用新能源汽车来提供共享服务,对于消费者而言则是更佳的城市出行方法。而当电动车配备自动驾驶技术,特别是通过车辆共享模式实现规模化使用后,可以自动行驶去充电站完成充电,这将有效降低电动车对充电网点密集度的要求,并大幅度降低共享服务的费用,进而降低企业的运营成本和消费者的出行成本。那么燃油为主的共享汽车企业谁与争锋?

最后,技术层面切勿固步自封,仅做低端共享,需高度关注智能网联汽车。要么成为它,要么用更优的技术取代它。

综上,共享汽车要告别“伪共享”,需在自动驾驶、智能交通、智能网联三大人工智能应用领域布局,才能兼具高效率与高价值。否则,所谓的“共享”就是耍流氓。

智能相对论(微信id:aixdlun):2个前人工智能行业管理咨询老鸟+1个老媒体人组成的三人帮,深挖人工智能这口井,评出咸淡,讲出黑白,道出深浅。


]]>
<![CDATA[谁“杀死”了BOSS们,AI又能救李文星们吗]]>

文 | 漠兮

来源 | 智能相对论(aixdlun)

近日求职少年李文星蹊跷死亡,让BOSS直聘陷入舆论风暴之中,悲剧缘起一份本以为是上市公司敲门砖的Offer,经各类分析认为,这个当初在互联网招聘平台“BOSS直聘”上与李文星联系的北京科蓝公司,只不过是一家冒名招聘的“李鬼”公司。

李文星极有可能误入传销组织,其中BOSS直聘的责任难辞其咎。其CEO赵鹏于8月3日回应表示对招聘方的审核机制有漏洞,教训惨痛。

但众所周知,互联网招聘的问题还远远不止这点,过于销售导向,依赖卖简历或广告位盈利的生存方式,同行恶性竞争,缺乏核心能力、信息真假难辨等问题积重难返,李文星悲剧的发生恰是这畸形的互联网招聘生态的映射。找到好工作,甚至找工作中不被骗仍然是广大求职者的奢望,那怎样才能避免下一个“李文星式的悲剧”发生?

诚如Boss直聘在回应中谈到“不久,在目前材料审核的基础上,我们会采取如身份证、人脸识别等更为准确的审核认证措施”,这些AI相关的技术真的能救得了互联网招聘吗?

互联网招聘弊端显现,AI技术来救场

痛定思痛,互联网招聘平台在加强监管机制的同时,在人工智能发展浪潮下,不妨考虑如何将AI技术更好的应用到互联网招聘领域,减少甚至杜绝此类事件的再次发生。

除建立对招聘企业的真实性、招聘人员身份认证等基本的审核机制外,互联网招聘平台应用AI技术可从招聘端与求职端分别渗透,以杜绝“李鬼公司”进入招聘平台,损害求职者及招聘企业的利益:

在招聘端,利用AI技术对招聘人员进行三重的身份认证:身份证、人脸识别、企业内部信息问答。首先做到身份证与人脸的匹配;其次,利用AI技术图像识别算法,从海量数据中抓取该招聘人员的经常出入地点,最重要的就是是否在该企业周围及内部出现,保证该人员有迹可循,且为该企业相关人员;第三,作为该企业的招聘人员,对企业应相当了解,通过“聊天机器人”来验证人员身份的匹配性。经过招聘企业与招聘人员的三重身份验证,即可杜绝“李鬼公司”等别有用心之徒的非法行为,合理保障求职者权益。即便有漏网之鱼,亦有迹可循。

在求职端,互联网招聘平台亦可应用AI技术为求职者提供相关的分析与帮助,如对应聘企业进行综合评估,包括企业信息的真实性、行业影响力、薪酬水平、企业文化以及其他求职者重点关注信息,推送给求职者;在过程中,也可通过识别应聘企业的招聘状态(如同一岗位招聘数量异常)及其他应聘者后续的状态是否异常(如失联、死亡)等进行分析,确定职位信息的可靠性;抑或通过深度学习技术对求职者与若干应聘岗位做匹配分析,帮助求职者辅助决策,这一点与给企业做候选人匹配分析并辅助企业做最终决策异曲同工。如此,求职者从单纯的被动方转变为具有一定的主动选择权,并对招聘的企业和岗位有深层次的了解,在信息对等的条件下,“李文星事件”将大幅减少。

AI技术的这些应用并非妄谈,互联网招聘,这个已经相对成熟的行业,因为人工智能技术的兴起正在悄然生变。

AI技术的引入,能否改写互联网招聘的历史?

回顾过去,互联网招聘可归为三个阶段:在招聘1.0时代,各招聘网站在过去信息不对称的年代里充当了“搬运工”的角色,实现招聘企业和求职者的互推,从而赚取佣金。当移动互联网技术方兴未艾之时,移动招聘与垂直招聘顺应而生,推动招聘2.0时代的发展;到现阶段,AI技术的兴起,推动互联网招聘进入3.0时代,目前各主流招聘网站正在致力于AI技术的引入,积极探寻新的可能。

以往的互联网招聘模式以提供信息为主,如提供企业信息、岗位信息、应聘者简历。求职者检索目标岗位信息,向意向岗位投递简历,然后等待;HR在维护企业及岗位信息的同时,需不间断的筛选简历,确定候选人,并电话+邮件与候选人联系,进行简单的沟通了解,约定面试时间……而AI技术的应用将彻底改变这种对人类来说较为繁琐的模式。

首先,筛选简历,无须HR,智能简历筛选软件即可实现。

在今年3月由北美著名猎头公司SourceCon举办的一年一度的行业竞赛中,一个叫Brilent的机器(Brilent 是一个基于人工智能的给候选人进行排名和评估的系统),只花了3.2秒就把合适的候选人从5500份简历中筛选出来了。

AI技术的成熟和运用,为HR提供了完美的解决方案,通过AI技术找出简历与岗位匹配度最佳的求职者并排序,而HR则集中精力在面试和候选人的匹配上。除此之外,AI技术可通过前雇主的评价和社交平台的资料来丰富候选人的简历。

其次,初步沟通,无须HR,聊天机器人即可胜任。

聊天机器人目前正在开发为候选人提供实时互动解答,基于岗位要求对候选人进行提问、提供信息反馈和下一步的招聘建议。第一个运用在招聘网站首页的聊天机器人Mya ,可以进行候选人过滤、面试时间确定、常见问题回答和职位过期提醒。

第三,不久的将来,面试也无须HR,智能面试软件来帮忙。

在线面试软件已经问世一段时间了但人工智能正致力于通过分析候选人措辞、说话方式、面部表情乃至于瞳孔状态来评估他是否符合岗位需求。

最后,AI技术还可辅助招聘企业进行候选人决策。

AI技术可在现有的简历数据库学习成功的招聘案例,分析员工的表现 、任期和流动率来为招聘提供决策。

此外,在求职端,AI技术也大有可为。

在求职者端,除了提供招聘企业相关信息、职位信息及岗位匹配信息外,AI技术也可以发挥其基于大数据的优势,如根据求职者求职意向及过往工作经历、任职企业等信息,向求职者精准推荐匹配岗位信息;根据求职者的应聘记录及结果,分析各岗位的匹配度及潜在的职业发展路径;甚至于分析招聘企业的可靠度、招聘信息的真实性等。

AI技术这么牛,谁用了?

从2016年7月到2017年6月,AI的应用逐渐扩散到全球68个国家的招聘环节。

目前国内来说,AI技术的应用仅局限于简历筛选及岗位匹配阶段,如Ai招聘HR助手,是一款浏览器插件,可以汇集来自全网4家最大招聘平台的简历,为HR节约80%的简历搜算筛选时间,匹配度95%以上精确推荐,1秒刷新24小时监控,不漏掉任何一份优秀简历,还会自动显示候选人曾任职公司背景,高亮提示候选人频繁跳槽等重要信息;再如IPIN的人才多维分析,能对人才进行全方位分析评估并为企业找到与招聘岗位最匹配的候选人,只需要提供职位信息,便可拟人分析候选人与职位工作内容相关度、职能和职级相似度、公司和行业相似度、专业和技能的相似度,并能识别人才在同行中的优秀程度,从而精确滤出最匹配优质人才。

而在国外,AI技术已经成功的用于面试过程。如联合利华与数字人力资源服务机构Pymetrics和HireVue合作,利用Pymetrics平台的游戏对求职者进行风险评估测试,评估求职者是否适合这个岗位或者应该在什么领域发挥专长。当游戏这一关通过筛选,求职者要接受一场没有面试官的视频面试。问题是既定的,需要一部手机或者一个平板电脑来配合。这场视频面试同样是为智能分析提供素材,作答时的关键词、语音语调会被记录成数据,还包括你的表情举动也成了分析对象。经过以上两轮筛选,智能算法会把契合的候选人挑出来最终交给经理。这也是这场面试中唯一有人工介入的环节。

美国网络招聘公司HireVue开发的面试模型能够提取原始的音频数据、从对话中整理文本以及收集应聘者的微表情。该模型不仅可利用交叉评估来预测新数据,而且在评估不同应聘者能力上极具竞争力。

谷歌发布了一个名为“云工作(Cloud Jobs)”的新项目,像强生公司和联邦快递这样的巨头在他们的求职网站上使用该软件来更好的与求职者沟通。为了完善该软件,谷歌扫描了数百万个职位空缺以发现某些特性与工作效绩之间的联系,并将其应用于完善分析和机器学习模型。

大风起兮,AI技术在互联网招聘领域还需跨过哪些坎?

其一,AI技术的应用通常需要用大量数据集进行训练,样本数量从数千起步,甚至可高达数百万。虽然现在已经步入“第三波”数据时代,数据的创建速度和可用性也经历了指数形式的增长,通用数据已然富足,但是对于更加细分的招聘领域来说,专用的数据资源仍需进一步的积累。

其二,虽然AI的泛化能力和自主学习很强,但难以拥有像人类一样的情感和意识,招聘过程中一些至关重要的环节,AI技术受到制约,即AI暂不具有“社交”属性,所以人工智能难以取代HR,如与候选人进行更深层次的沟通,或识别候选人是否与公司的企业文化所匹配,以及说服候选人在众多选择中加入自己服务的企业。

在互联网招聘领域,以上两方面应是AI技术最大阻碍。大数据可通过日益膨胀的互联网传输逐步解决,但是“社交”属性,恐怕是人工智能永远的短板,这也就说明了人工智能永远不可能替代人类的某些特定活动。一旦人工智能具有了“社交”能力,那么《星球大战》、《终结者》、《2001》等或许就不再是科幻电影了。

结束语:正如亚马逊 CEO Jeff Bezos 写道:“未来 20 年里,人工智能对全社会产生的影响将大到难以想象。”新的技术会改变旧的行业,互联网招聘目前仍在不断地转型和探索。AI技术作为互联网招聘3.0时代的重要手段,将催生整个行业的颠覆性改变。

]]>