您好,欢迎访问闪电宝PLUS官网!
科大讯飞的擦边球:以人工假充“智能”把球打飞了
栏目:行业新闻 时间:2018-09-22 23:28:12 点击:

 科大讯飞的擦边球:以人工假充“智能”把球打飞了

 
  9月20日,用户名为“Bell Wang” 的王同学在某知识问答渠道上宣布《科大讯飞,你的AI同传操(qi)作(zha)能更风骚一点吗》一文,吐槽了自己“被 AI”的经历。
 
  这位王同学在担任某次国际会议同声传译的进程中,发现自己及火伴的翻译效果在不知情的情况下被科大讯飞以文字方式上传在屏幕上,还运用电子音播映翻译文本,在某渠道进行直播。
 
  王同学“忍不了”,发布了自己用手机录下的视频证据。事情敏捷发酵,科大讯飞于21日下午宣布回应:单个同传舌人关于科大讯飞存在误解,咱们以为仅仅是对会议效劳方面的分工沟通了解不清。
 
  有网友调侃:没被发现就是 AI,被发现了就是误解。
 
  科大讯飞是否存在片面“欺诈”难以判别,但细数一下,这些说不清道不明的“人工”假充“智能”事例,还真不少。
 
  误解仍是造假?
 
  科大讯飞可能自己也没想到,找的同声传译工作人员竟然在知乎上有个固定专栏。
 
  这让寻觅我国创客想起了几年前的一个段子,某互联网公司在招聘时清晰表明:有群众号的不要。
 
▲“Bell Wang”网帖截图。▲“Bell Wang”网帖截图。
 
  事情的通过是这样的。据王同学在网帖中描绘,9月20日,他来到2018立异与新兴产业开展国际会议(IEID)的高端配备技能与产业分会做现场同传。
 
  当看到会场大屏幕两侧写着“讯飞听见”四个字的时候,他就有点心烦:自己不会也要遇上“被 AI” 的事了吧?
 
  会议开端今后,现场屏幕上的实时字幕分为两部分,右边是对外文讲演嘉宾的英文实录,左面是中文翻译效果。
 
▲字幕分为英文、中文两部分。▲字幕分为英文、中文两部分。
 
  王同学发现,当日原籍嘉宾上台讲演时,其带有口音的英语并不能被机器很好辨认,右侧的屏幕上满是发音差不多但不能构成实践意义的单词。但在左边,屏幕上却是精确的中文翻译。
 
  为什么明明辨认错了英文原文,却能给出精确的中文答案?王同学越看越觉得,翻译部分是直接转译的自己火伴人工翻译的内容。
 
  特别当搭档在英译汉时说出“步态”一次,屏幕上却过错辨以为“不太”;王同学自己再汉译英时说了“Davos Forum”(达沃斯论坛),屏幕上却呈现发音差不多的“Devils Forum”(魔鬼的论坛)后,王同学越加坚信,现场大屏上的字幕并非科大讯飞机器翻译,而是在自己和火伴翻译内容的基础上,进行了“语音转文字”。
 
  当天下午的发现,让王同学愈加火大。
 
  他在一个名为“知领直播”的渠道上看到,该渠道宣称“引进科大讯飞智能语音技能”“智能翻译”,可是,对当天的会议进行同传直播的翻译文本是他和火伴的翻译效果,并且播映的语音是组成的机械音。
 
▲知领直播页面截图。▲知领直播页面截图。
 
  “所谓的智能翻译,就是按照文本读,并且是不管语义群切割的,文字显现也并不是语义群同时显现或确定的,那就很显然是在辨认语音,而不是从依据原文在翻译。”王同学在网文中称,这是“光秃秃的诈骗”。
 
  21日下午7时许,科大讯飞作出回应:考虑到专业技能布景及口音等原因,这次2018立异与新兴产业开展国际会议,科大讯飞只供给会议转写上屏效劳,并未供给翻译效劳。至于转写舌人翻译效果并在会场大屏呈现、在直播中组成辨认效果,皆是“应主办方要求”。
 
  科大讯飞表明,“单个同传舌人关于科大讯飞的误解,咱们以为仅仅是对会议效劳方面的分工沟通了解不清”。  
 
▲科大讯飞回应全文。▲科大讯飞回应全文。
 
  科大讯飞方面再次着重其提出的“人机耦合”概念:科大讯飞开展AI无意于代替任何工作和岗位,咱们也屡次着重“人机耦合”共同进步的立场和产品寻求。
 
  关于“人机耦合”概念,科大讯飞方面给出的解释是:由机器供给语音转写和翻译效果给同传参阅,辅佐同传下降工作强度并提高功率。
 
  “碰瓷”的AI公司
 
  科大讯飞故意造假?
 
  好像也不是。
 
  就在几天前的9月17日,科大讯飞董事长刘庆峰还在国际人工智能大会开幕式上特意着重:凡是我们看到翻译屏幕上两个语种同时呈现的,就是机器翻译的;翻译屏幕上只要一个语种的,就是人机耦合的。
 
  刘庆峰称:“国际机器人大会的十几个嘉宾讲演中,有人工同传的语音转写也有机器全自动转写。除了三个是由人工同传的语音转写,探究人机耦合形式的,其他的全部是机器全自动转写的。”
 
  知乎某网友将科大讯飞的情绪归纳为“三不”方针:不自动,不回绝,不担任。关于群众将精准的翻译效果误解为科大讯飞智能翻译所为,讯飞方面好像也是乐见其成的。究竟这种误解能够带来实践的好处。
 
  有智能语义范畴创业者通知寻觅我国创客,现在国内包含科大讯飞、搜狗、百度、腾讯在内的几大研讨智能语音翻译的公司,在技能水平方面并没有显着差异,这个时候,谁在群众眼中的精确度更高,谁就可能获得先机。
 
  科大讯飞技能上能够做到AI同传吗?
 
  好像也不可。
 
  就连科大讯飞董秘江涛也在这次回应中供认:“讯飞从没讲过AI同传的概念,一直着重是人机耦合的形式。”
 
  有认证为阿里云的技能人员在网上科普AI同传的几个技能环节:
 
  1.ASR(即自动语音辨认)辨认语音流(易呈现差错,依赖于方言/语种模型与其强化学习程度);
 
  2。同步进行NLP自然语言剖析(断句,分词等)形成文本(一般呈现差错);
 
  3。翻译文本(小可能呈现差错);
 
  4。翻译后的语音内容展现字幕或许TTS(Text To Speech,将文本转换成语音)进行语音播报(小可能呈现差错)。
 
  在此次事情中,科大讯飞做的只要最后一个环节:将翻译后的语音内容上传到屏幕,或许组成为电子音。尽管这一进程也涉及辨认同传人员的语音,但由于同传人员发音较为规范,这一进程误辨认的概率大大减小(但仍然呈现了,比方上文说到的将“步态”辨以为“不太”)。
 
  智能语音公司Rokid创始人Misa通知寻觅我国创客,人工智能在自然语言剖析、文本翻译、TTS 方面的问题并不大。
 
  但由于存在白话习气(比方多语言混合、语法省掉)、口音、现场环境、专业术语等问题,人工智能在语音辨认方面还存在一些差错,并且这一现状现在还难以解决,运用计算办法难以掩盖一切可能。“人机协作的概念是没错的,仅仅一开端要说清楚,别忽悠我们。”
 
  “人工”假充“智能”那些事
 
  细数起来,以“人工”假充“智能”的做法并不罕见。
 
  不知道还有多少人记得2015年横空出世的交通银行客服机器人“娇娇”。
 
  这台机器人凭仗软萌的声响、流通的反响、高度人性化的对答,让研讨人工智能和机器人的公司瞠目结舌,还呈现在当年的CES上。
 
  就连谷歌在2018 I/O大会上展现的能打电话预定理发的语音助手,跟其时的娇娇相比都略逊一筹。
 
▲交通银行客服机器人娇娇。▲交通银行客服机器人娇娇。
 
  娇娇的语音辨认、面部辨认和语音组成到底是用的哪家技能,竟然比谷歌还超前3年?
 
  通过一圈刨根问底,摄像头+变声器+人工客服操作,就是这台智能语音机器人的全部。
 
  如果你不记得娇娇,那你必定还记得被沙特阿拉伯颁发公民身份的机器人索菲亚。
 
  当索菲亚的发明者戴维·汉森问她:“你想消灭人类吗?”她答复:“我将会消灭人类。”
 
  在撩拨起人们对人工智能的惊惧后,索菲亚又语带嘲讽:“你是看了太多马斯克的话,仍是好莱坞电影?别忧虑,人不犯我,我不监犯。”
 
  凭仗机敏的答复和流通的反响,索菲亚登上许多闻名电视节目,包含《晨安英国》、美国脱口秀《吉米今夜秀》、CBS 新闻台《60 Minutes》乃至湖南卫视的《我是未来》。
 
  总算,人工智能界大牛YannLeCun忍不住开撕:索菲亚之于人工智能,就像戏法之于魔法。
 
▲机器人索菲亚。▲机器人索菲亚。
 
  2017年6月,在瑞士举行的“人工智能谋福全球人类峰会”上,央视记者和索菲亚也进行过几轮对话。
 
  在答复记者提早提交给大会的3个问题时,索菲亚的体现一如既往地优异,但当遇到记者现场随机提出的问题时,她的对话水平显着下降。工作人员清晰通知记者:关于特别问题,在现场答复前都现已提早进行了程序设置。
 
  业内人士也遍及觉得索菲亚违反知识。一个事实是,最先进的人机对话体系也无法到达索菲亚这样语带嘲讽又对答如流,这是NLP范畴研讨者的共识。而索菲亚展现出的自动引导论题的社交能力,被研讨者们认定为提早编写好的对话。
 
  除了在各种晚会、智力问答节目上呈现的各式抖机灵的机器人,就连自动驾驶范畴也有相似情况呈现。
 
  据相关业内人士泄漏,某些自动驾驶公司在进行试乘体会活动时,会提早依据试驾路段的路况编写好程序,而非让这辆依据传感器数据自主决议计划、操控。
 
  前述智能语义范畴创业者对这一情况现已习以为常:“科大讯飞最少仍是有真技能的,仅仅翻译效果未必十分精确。许多创业公司连相关技能都不掌握就做假demo,意图无非是 to VC(风险投资组织)、to 媒体或许to 政府。”
 
融创我国7.73亿元底价接盘乐视控股司法拍卖股权
 
  据《证券时报》报导,融创我国7.73亿元底价接盘乐视控股司法拍卖股权。
 
  人民法院诉讼财物网显现,到10:00,乐视控股持有的新乐视智家18.38%股权、乐视影业约21.81%股权均以底价成交。
 
  因为报名者仅有融创我国这一家,通过一轮出价后,终究融创我国以起拍价获得了三个拍卖标的。