Lin Yang @ GTI - Robin.ly AI Talk

Updated: Apr 16, 2019


Robin.ly AI Talk | Peer to Peer Conversations

Episode 4: Lin Yang 杨林

ALEX REN: 大家好,我是Alex Ren,是BoomingStar Ventures的管理合伙人,也是Robin.ly的创始人。今天我们是做的Robin.ly的第四讲,是关于AI芯片的一些创业和技术的发展。今天我们特别有请了GTI的联合创始人杨林教授。杨教授有丰富的经历,他曾经毕业于复旦,清华和UC Berkeley,获得了UC Berkeley的博士学位。也曾经在VLSI (Technology, Inc.),Redwood Design, Cadence 做高级设计经理这方面的职位。1999年他创立了一家半导体公司,叫Legend Silicon (凌讯科技),做数字电视方面的芯片。他同时也是北邮,清华和复旦的教授。2017年,和OmniVision 的founding member董琪一起创立了一家公司GTI,就是Gyrfalcon Technology这家公司,专门做AI芯片这方面的工作。杨教授在学术上也有很大的成就。他曾经在1988年发表了一篇文章,叫Cellular Neural Networks Theory and Application,这篇文章获得了IEEE的电路与系统最佳论文。自此之后呢,CNN,也就是Cellular Neural Networks就成为了一个热点的研究领域。那么杨教授创立了GTI这家公司,其实我第一次知道GTI这个公司之后,我看Gyrfalcon这个词还比较有意思。不知道杨教授能不能解释一下,这是什么意思?

杨林:是一个大鸟的意思。中国东北有一种鸟叫海东青。Falcon就是鹰的意思,gyr就是一个大鸟的意思。

ALEX REN: OK。好像是说飞行速度最快的一种鸟。

杨林:对,所以说中国的歼11战斗机叫猛禽,实际有人翻译成猛禽。这种鸟就是原始的海东青。

ALEX REN: 感觉就是,其实我相当于是见证了咱们GTI整个的创史过程。最早开始也跟董琪,跟其他几个founder也聊过。感觉GTI过去一年发展得很快,就像猛禽一样。不知道过去一年发生了什么事情,杨老师能不能给我们解释一下?

杨林:那好。神经网络大家都知道有过几次发展。那么我刚到Berkeley的时候是1985年,那个时候赶上了上一轮(发展浪潮)。上一轮的时候,那个时候因为PC才刚开始,通讯还在analog(阶段),就是模拟电话,所以当时神经网络作为当时的下一代的计算工具呢,也有很多人在研究,它的主要特点就是平行处理。那么这是当时我在Berkeley读博的时候做的一个叫做cellular neural networks。它里边呢,我当时是用analog实现的,analog电路,就是用电阻电容和运算放大器。当时也是主要是做的图像处理,是做的我们的汉字识别。当时用MOSIS,就是学校支持的电路工艺做的,在电路里头做出来的。那后来呢,神经网络由于其他方面,就是这个PC啊,通讯啊,都在发展,神经网络当时也有遇到一些困难的地方。实际上就是说怎么训练这个东西,怎么学习。因为当时我们在整个读PhD(期间),我也就是弄了几个特征,我们当时叫滤波器。现在大概如果要数的话那现在就是几百万个了。我们那时候能设计出来几个就不错了,甚至那个时候尤其是做图像处理的那些处理器的算法,比如说像边缘识别,或者角识别,好多都被用人名命名了,包括Berkeley的一个教授叫Canny,他(设计的)就是著名的边缘提取滤波器。现在呢——这都是人工做的——现在就是机器学习。

ALEX REN: OK。所以当这一波的人工智能再起来的时候,您是看到了什么机遇?我知道您创立GTI,应该是看到了一个很大的机遇,当时创立这个公司的初衷是什么?

杨林:当时创立这个公司的初衷呢,就是感觉到现在,PC/电脑都已经放到手机上了。第二是通讯都已经做到第五代通讯了,而且目标就是IoT,Internet of Things,物联网。那么下面呢,大家又重新在考虑智能。为什么叫Internet of Things呢?原来就叫internet,相对来讲就应该叫Internet of People,对不对?那People只要连起来,大家就可以交流。因为有这个语言文化,互相都懂。那你说,thing,这个东西连在一起,那很难交流。所以这个时候就需要赋予这个物体一定的感觉的能力,和判断的能力。这也就是所谓的人工智能要解决的问题。

ALEX REN: 所以您实际上是为了解决IoT的deployment里边的这个(问题 )?

杨林:对。主要是为了解决IoT下面的连接(问题)。IoT已经发展了多少年了,但主要就是为了连接。连接由于5G开发了以后,现在正在实施。现在急需的就是,连接就要产业化,就不是个科研项目了。那么在这个时候呢,人工智能就起到了非常关键的作用。这是第一。第二呢,人工智能,或者叫神经网络,前一段时间呢,虽然产业化没有发展,但是在研发方面还是有人在做。但是研发方面在做也受益于现在的计算机的能力,那么就开发了这种深度学习的概念。深度学习呢,它的技术方面的定义是叫多层卷积神经网络的机器学习,所以大概有这么三个意思。第一是卷积神经网络,第二是多层,第三个是用机器学习,不用人,不用编程。那么实际它本身的电路结构和算法很早以前就有了,至于为什么能够现在popular起来,一个是现在有这个需要,再一个就是现在的算力,就是计算机仿真的能力很强。这个我下面可能在谈到其他问题的时候会再展开讲。

ALEX REN: OK。那咱们创立这个公司一年,现在据说芯片已经出来了是吗?大概做到什么样的性能呢这个芯片?

杨林:我们这个芯片呢,当时瞄准的就是低成本,低功耗,高性能。因为高性能是必须的。因为这个要赋予智能,让它能够自己去学习的话,就需要算力,所以必须得是高性能。那么在高性能的情况下,怎么能够降低成本,降低功耗,这个是我们主要的一个工作,集中在这个里边。那么得益于原来我做的这个analog电路,它就是个device。它从架构来讲,和计算机是不一样的。所以从这里边呢,我们就达到了我们预期的目标。

ALEX REN: 这是个ASIC是吧?

杨林:ASIC呢,当然只要是application specific就叫ASIC,我们这就是一个。我应该叫它卷积神经网络加速器,它不是一个SoC,那么我们也觉得这个是当前急需的那么一个。因为现在市场还没有起来,如果将来市场起来了,根据真正的应用,我们会做不同的电路。但是现在呢,还是属于一个平台,就是我们叫做卷积神经网络加速器。

ALEX REN: 那主要性能是手机上面吗,在什么芯片/平台/终端上面?

杨林:手机只是一个应用。提到手机,我就顺便把我们最近做的这个东西拿出来看看。这个东西呢,是我们给电脑,laptop做的。它是个USB dango,我们这个芯片就在这里,它就是个加速器。那么现在的PC呢,里边基本什么都有了,就是说你没有GPU,反正只要是CPU,做训练都没问题,但是它速度慢。所以加了这个以后你就加速了。加速了以后呢,那就可以拿到——

ALEX REN: 举个例子,比如说我们这个视频结束之后我们要做渲染,video处理。那这个东西插到电脑上就可以加速我的渲染过程?

杨林:对!你比如说有些东西它是需要——时间要很快反应的,那我们的这个可以做到识别,每秒可以跑150帧。当然其他的也可以做,但就是很慢。那你做的汽车,比如你反应时间可能就比较慢,所以它为什么要加速呢,就是说不光要有这个功能,那它还要反应非常快。

ALEX REN: 那就是像安防这种识别,对吧?摄像头上边的识别,OK。

杨林:是。那这个也是用我们的芯片做的一个WiFi的小盒子。这个就跟手机一样,跟手机配合。像现在华为和苹果都做了SoC,就是single chip 的solution。但是这个东西呢,由于CNN/卷积神经网络的运算量是需要很大的,那么我们的就是专门做了这么一个,配合现有的手机,我们就直接把这个手机升级为AI手机了。就是这个东西可以直接把你现在的电脑升级为AI电脑,因为我们手机上已经有了照相机啊,有MPEG,就是这些video的decoder的啊,或者其他的,运算的东西它都有。唯一没有的,就是怎么做深度学习加速。所以我们主要就是做这个,脏活累活。

ALEX REN: 非常有意思。

杨林:所以这样的话也适合——我们也在想,展开一下就是,为什么我们做这件事,就是我看到了。我就是搞电路的,这是个device。但是所谓现在呢,叫CNN,convolutional neural network,我们原来叫celluar neural network。Celluar neural network就是一个电路,那么它其中有convolution作为一个算子,就像里边有乘法。但是它那里边就是convolution,所以我们在那个里边就有这个convolution,不光有convolution,我们还有feedback,就所谓现在的RNN。但是现在呢,我们重点主要是做CNN,因为这个feedback还有一些其他的问题。所以现在RNN只用在一维的信号处理方面,还没有真正用到图像。但是将来我认为是会去做这样的。

ALEX REN: 所以你们选择这个inference的原因,也是因为看到很多IoT在终端上面实现的大量机会。对吧,是不是这个意思?

杨林:对。我们先选择了inference的话呢,大家都在——很popular,就是说现在很流行的就是inference和learning,或者说training。实际上跟人一样,learning就是试错,就是千万次的inference,你猜一个数,试一试,行就是行了,所以实际上是一样的。真正的work就是inference,因为你要试验啊,就是实践认识,是吧?就是反复去做的一件事。那么实践是最重要的,所以inference就是实践。认识是说,你这次错了,下次怎么改。那现在有很多诀窍,就是说或者是不同的学习的方法。但是不同的学习方法最后你还是要时间去检验。那么我们为什么做这个东西呢,当时主要考虑的,现在我讲,指出来的一个现在一个局限性,但是这种局限性不是说故意的,人为的,而是说随着时代的发展。神经网络,或者叫机器学习,或者叫人工智能,在2014年,2015年之前,基本就是学校在做,而且是很少的人在做。为什么是这样呢,就是说,没有真正的应用嘛。还有就是说,其他应用也很popular,大家都围着这个PC和互联网在做这件事儿。那么这个东西呢,就变成了——神经网络本身按理说应该是一个物理器件,是一个device。那么后来就主要做的人都是computer science的,就是计算机的人在做。计算机的人在做什们呢,我们叫计算机仿真。计算机什么都能做,对不对?那么就像你CPU,GPU都能做,但是GPU为什么比CPU做得好,就是因为它有平行处理,它做得快。但是说能不能做这件事儿,都能做,你就拿个ARM,最简单的也能做,只是慢而已。那么这个我们搞电路的人都知道,就是搞集成电路设计呢,它要有computer simulation,就需要计算机仿真,仿真就是慢,然后还要有FPGA(Field-Programmable Gate Array),这叫emulation。对,就是prototype。就是,慢还不行,得实时。但是FPGA的问题就是说,我虽然可以实时,解决了computer simulation——computer simulation只是验证这个功能啊,性能够不够。那么emulation呢,就是说我要证明实时这个问题,但是它的cost是很大的,因为它的成本高。那么最后才做成芯片,这是必需的一个过程。所以现在业界也在说,神经网络有几种,有CPU,GPU,什么FPGA,还有ASIC,实际上最终就是ASIC,其他都是一个过程。

ALEX REN: 是的,OK。所以咱们在做这个training。因为我知道,现在我们做inference的话,因为有一个核心技术问题就是,比如说我们model,从training到inference中间有一个migration 的问题。你们怎么看这个问题?

杨林:我们看这个问题就是说,另外的一个刚才我再继续展开——由于集中在research,集中在university,那么唯一可用的平台就是CPU或者GPU。那相对来讲呢,GPU速度或者性能更好,而且Nvidia也支持这个,他们做的这个平台叫CUDA。那么大家就去集中用了这个平台。但是这个平台有好处,就是说下面有一些要调整的。就是做research,因为你就为了写一篇文章,或者为了证明一个概念,那你不计成本,是吧?所以那个时候呢,如果说你要考虑现在这个成本的话,两年前我在说要做quantization,说为什么做双精度,64个bit啊,5个bit,8个bit都可以,是吧?因为当时我们做analog,你说电子电容的精度是多少,能做到10%就已经不错了,10%也就是3个bit了。就是说那个时候从我个人经验来讲,知道这个东西都已经不在乎那个事儿了。但是你CPU,GPU你用的是library,你不去想那个东西,已经有了。你要说做一个3个bit的一个指令集,没有,你倒麻烦,所以你只能用浮点和定点。那这样的话所有现在训练出来的人,第一,都是学校出来的,第二,都用了Nvidia的平台,第三呢,根本没有问题说我一定要给它优化。那所以说才存在刚才你说的这个问题,因为我们的芯片的话呢,要进一步优化。一开始我们开发算法也好,开发模型也好,用CPU或者GPU开发包括Caffe啊,PyTorch这些东西呢,主要是证明能不能的问题。那么下面就要真正要用起来,产业化呢,就是要证明省不省的问题。你用不用得起的问题,所以我们这个东西是想人手一份儿,包括你可以,(任何人)都可以。就是说人工智能本身呢,现在每个人都有自己的定义。有的人觉得这个东西很可怕,将来就是超人。这个和我30年前描述计算机都是这样,计算机就是被认为要毁灭人类的。但实际上我们觉得计算机(让我们)得到了很多好处,是吧?当我在上学的时候,30年前的时候,那真就是做计算机的人用计算机,用计算机的人做计算机,其他老百姓就是,就像现在人工智能就是高发展嘛。但是现在不都是人手一份手机嘛,都是这个。

ALEX REN: 我们现在讲叫民主化对吧。人工智能民主化。就是您说的,普及化实际上最终是ASIC,对吧?ASIC本身是要考虑经济效益,考虑成本,对吧?所以这个是我学习到的东西。那现在您做的这个GTI的这些工作,我也看到了说是借鉴了很多您以前的一些工作,包括CNN啊,那具体的关联是什么?您刚刚讲的电路本身啊,就是里边也用了一些您当初做的一些东西,应该是(存在)这样的一些关联性吗?是哪些东西有(关联)?

杨林:那这个就牵扯到刚才我说的,电路,神经网络和计算机的区分是什么。所以大家现在有个常用词叫异构。异构的意思就是我和计算机不一样,但是怎么个不一样法,是吧?第一呢,我个人认为,就是说神经网络呢,它因为是一个电路,尤其是当时我们做的,它是记忆元器件。记忆的和运算的是一体的。那么现在标准的计算机的架构,就是处理器,存储器,中间还有个I/O,叫接口,有这三个,是吧?我们现在做的这个东西是都放在一起的。正是因为这样,我们才降低了功耗。因为现在呢,你可以把里边的处理器,包括你的存储器,都用最新的,比如说是,7纳米,10纳米的来实现。但是你中间连接接口的那个pad,就是我们叫芯片的管脚,不变,对不对?那个东西就是大量的传输高速,功耗都在那儿。所以这是一个。另外就是人也是啊,人的智能实际上是记忆和处理在一起的。不是说你想干什么,到哪儿去,充一下电,然后再去存取——它是一体的,这个也是不同。但是作为computer simulation来讲,原来架构就是这样,你何苦去改呢。所以这也是说,我们认为将来的发展呢,实际上就是这种专用的结构。另外一个呢,由于有计算机的话,大家现在也在比,说是看谁做得最好。我看现在好多startup在做的芯片呢,都在比这些东西。那么还是计算机的概念。计算机有几个特点,第一呢,一定要有指令集,就是说我这个东西是专用指令集,指令集简化,没必要,因为这个东西不需要指令。因为顾名思义,深度学习,机器学习嘛,机器学习就是不用人来编程序,不用人来编程序,还要什么指令集呀,对不对?实际上我们真正用数据来训练里边的参数,训练完了以后呢,人工智能和人类智能相比有好处,就是它可以copy,训练完了可以移植,它不像人,对不对?我们学完了以后,我们的下一辈还得重学。

ALEX REN: 我觉得您讲的这个实际上就是逻辑上的,认识上的一些不同,对吧?就是说思维上的一些变化。您讲的这个指令集的变化,讲的非常好。那么您是非常有经验的,而且时间很长了,在半导体行业做这个研究啊,技术,产品啊。您看到AI时代来了之后,您觉得对整个半导体产业带来些什么样的变革。是不是感觉半导体行业又赢来了一个第二春啊,感觉好像我们又重新有人关注半导体。尤其是中国,开始有更多投资人开始投资芯片,这件事情意味着什么?

杨林:很大的一个变化,但是我认为这个是时代的发展造成的。刚才你提到这个第二春,对我来讲,这就是一个——或者叫三十年河东,三十年河西。我当年在Berkeley读书的时候,Berkeley EE和Computer Science在一起的叫EECS,对不对?当时CS的人都是hardware的。我去年还是前年——因为清华跟Berkeley有一个joint venture在深圳,我回去,结果发现EE根本没有人学了。你只要做出个A to D (Analog to Digital),剩下的就是digital的事儿了。那么这一点呢,将来也会对软件的人——现在大家都在学软件,实际上机器学习将来就是会代替这些人。我想,刚才听您介绍,您也是从硬件学习出发。为什么改行呢,两个事儿。我是一直跟着走的。第一件事儿就是EDA (Electronic Design Automation)。最早我们来的时候还是画电路的。那个时候就是——后来画不动了,因为太多了,所以才有EDA,就是electronic automatic的design嘛,我中间两个公司也是在(做)这个事儿。

ALEX REN: Cadence 和 Synopsys 都是从伯克利出来的是吧?

杨林:对。这个东西顾名思义,就有点类似机器学习,就是用机器代替人来设计。这是第一波。那这个呢,就已经说是很junior的,就是很初级的design work已经没了。剩下的就是architecture,就涉及整个应用,所以就是ASIC的定义和应用,然后剩下的都是Synopsys,Cadence Tools自动生成了。至于加法器乘法器怎么来的,谁都不知道怎么回事,机器知道就行了,就描述的就行,描述功能。这还好,但还有一部分人在设计这个architecture,设计架构。10年——刚才我说的是20年前——10年前,由于所有的应用都是有limited requirement。你比如说我当时做数字电视,Intel当时也在做数字电视,我们在Santa Clara还立个电视台。但是那个时候它的算力不够,那个时候可能是65纳米,或者130纳米。我跟他说,现在你必须得用专用集成电路做。十年后你可能(就不需要了)。所以呢,当时比如说 MPEG decoder, 比如说demodulator,比如说手机——Qualcomm一开始都是做电路的,10年前都被ARM通吃了,所以变成没有hardware design engineer了。所以这也是为什么有的人说,现在你就算是做芯片,也就是个集成。就是现在需要System-on-Chip,SoC,实际上就是几个core,或者几个interface放在一起集成起来,剩下的功能都是软件设计。所以说hardward design的人一点都没有了,基本连学校都不train了,都没有人去学习了。所以(针对)刚才你说的,这就是为什么我说是三十年河东,三十年河西。下面三十年呢,实际上又给hardware的人(新的机会),就是我们还要着重去做hardware。为什么呢,因为这个我刚才也提到了,它不是一个计算机,它是一个device。它不一定去竞争,就像苹果手机似的。苹果今年出了手机,我就换个新的,去年的虽然打电话还可以用,但是大家就都换,是吧?我现在恨不得都变成,干脆叫lease,就是钱都转到那儿了,算起来就是一个35块钱,就基本就这个。为什么呢,就是计算机——因为它是通用的东西,通用的东西(大家都)老比谁最好,因为可比。那以后的人工智能的应用呢,很广泛的,有的东西不需要一年一换。比如说你们家的garage door opener,那个东西你老换它干什么呢,没必要换。包括智能锁啊,好多这些东西。

ALEX REN: 就是有很多sensor,对吧?

杨林:对,所以它不需要换。就像你说安防,或者小区放个安防,不可能说明年出了新的我再换,那不可能。因为它的功能是不变的,所以你就用那个东西就行。所以将来会有很多的,不是说做一个计算机就行了。所以这是为什么现在做hardware的就是Intel,Nvidia,还有ARM,就这么这几家嘛,其他都是集成。所以这个也是说,对于不光是学hardware的人,将来可能好多学software的人也许又转去学hardware了,做系统。

ALEX REN: 对。就像您之前说的,确实我认识一些人,他们做比如说AI infrastructure的人,最后的这个performance提升,很多时候就需要看硬件架构是什么,硬件底层实现怎么回事儿,这个时候可能优化性能可能更多都是software,hardware,code design这些。OK。那您也是长期在中国和美国的半导体行业工作,您怎么看中国的半导体行业。因为现在您知道最近一年这也是个热点话题,我们确实有差距,对吧?您怎么看,问题在什么地方,我们应该做些什么事情,可能会把行业的差距缩小?

杨林:大的方面刚才我已经说了,本身硬件由于EDA这个tool,由于每个applicaiton是有一定限度的,后来都被general processor给替代了,所以这个需求就很少,这是第一。第二呢,我感觉到前面这30年,过去的这30年,实际上中国还是处于一个学习和跟踪阶段。尤其做企业的人呢,我听了好几个比较有名的老板说不要吃第一个螃蟹。那不要吃第一个螃蟹你怎么创新呢?但是为什么,这是适合当时中国国情的,因为你没有那个财力,也没有那个需求,你犯不上去做这些事儿。那么比较稳的就是先把现在这个基本的事情做好。但是现在不一样了,现在中国能做的也都做了,跟别人都已经差不多一样了,你要想抄别人的呢,或者说学习别人的,还没出来呢,那就干脆自己去做这个事儿。

ALEX REN: 对。创新这方面您认为是一个突破点对吧?现在应该是个时机了。可以做更多的创新,新的领域。您之前创立了Legend Silicon,现在又做这家新的公司,GTI,我不知道您从前面的经验,学习到哪些方面觉得是可以把GTI做得更好,这一点,您是怎么样的一个 thinking process?

杨林:上次做那件事儿呢,有几点。第一呢,就是数字电视进入了产业化阶段,因为数字电视一开始也是科研项目,最早是在日本搞出来的。那么没有标准化是不可能产业化的。现在AI也就是这个问题——没有标准化,大家都想标新立异,每个人想说我明天能不能再研究出来一个不同的,就是为了不同而去做事儿。那这个就不是产业化了,产业化是说尽量相同。而且也不一定说我做完这个事儿,就永远不再做了,已经全解决完了,这不是。你看通讯就告诉你了这个标准——第一代通讯,就是模拟电话;然后有2G,第二代,就是GSM(Global System for Mobile communications),CDMA(Code-Division Multiple Access);3G,然后4G,5G。实际上在做第二代第三代的时候,5G的技术也存在了,研发上也有人讨论。但是大家说没必要了。标准化呢,它可以给你定义一个,大家都follow同样的东西,而且做现在最急需的东西。现在我认为大家还是在科研的这种状态。

ALEX REN: 所以当时您的 Legend Silicon 也参与了很多标准化的过程吗?

杨林:我回清华大学,当时的国家标准里边的——我还要展开说第二件事儿。因为第一,产业化的时候呢,当时因为已经有了三个数字电视标准了。一个是美国的ATSC(Advanced Television Systems Committee),一个是欧洲的DVB-T(Digital Video Broadcasting — Terrestrial),一个是日本的ISDB-T(Integrated Services Digital Broadcasting — Terrestrial)。在这个时候,正好是2000年左右,吴仪副总理到美国来,然后能见了小布什。布什当时就问她说,你为什么用欧洲的GSM,不用我们的CDMA。当时吴仪傻眼了,不知道说的是啥,后来一问,哦,是通讯标准。感觉好像是说我们在政治上,或者在其他方面有取向似的,(其实)她就随便选了一个。做数字电视的时候,当时是朱镕基当总理,他就说了,如果是全世界一个标准,因为产业化必须标准化,那我们就follow。如果超过两个标准,我们只能做自己的了,要不然政治上都没法说,就敏感了。所以当时已经有了三个。但是做标准就存在知识产权(的问题)。因为那时候我正好在Cadence,实际上我在帮助日本做ISDB-T,帮助Fujisu做美国的ATSC,DVB-T我都参与过,而且都是做的芯片。当时就是要做芯片,我说做标准必须得有知识产权。所以中国的电视标准,实际上是有我们叫完整自主的什么什么知识产权。为什么呢,当时虽然我是美国公民了,但是我回清华当教授,还代表中国政府在日内瓦去申请这个标准,其他人当然要去challenge你嘛。那么中国当时说的呢,因为美国当时的ATSC标准是高清,但是是固定接收。欧洲的呢,DVB-T是移动,但是是标清的。日本基本跟欧洲是一样的,而且他们也没有什么特别的,主要当时就是美国和欧洲。我说中国定的实际上叫高清移动,因为当时说要办奥运会什么的,那时候就瞄准2008年奥运会,一定要看高清的,而且还是要移动的,因为中国人多,各个公共的(平台都需要)。那这个东西如果做出来肯定就是有自己的知识产权嘛,所以当时就是做了这个。实际上不光是对电视行业解决了知识产权的问题,使中国开始能够在信息产业有一些知识产权吧,而且对后来的第四代,第五代通讯的标准都有很大的影响。你看以前的标准,都有叫什么Qualcomm,CDMA的标准,都有各国,各个公司的标准。到了第四代通讯叫LTE(Long-Term Evolution)。第一代是模拟,第二代就是电话。第三代是把text,pager都放里边了,叫GPRS或者什么。第四代就是video,中国基本就把电视的知识产权(拿到了),基本上也都是这些方面。就是说那就算了,也没有什么公司了,所以就叫LTE。所以你再听到第四代,第五代标准,没有任何国家,就是一个国际电联的组织。

ALEX REN: OK。那这个标准化过程,您觉得现在在GTI的创业过程中,也可以用这样的流程吗?我感觉AI是一个更加开放性的,当然他们现在也是面临产业化的挑战,对吧?所以这个您觉得也会像通讯,会像数字电视这样,会有一些标准出来吗?

杨林:会,每一个行业都有。你比如说安防的AI,就有安防的标准。智能家居的,肯定有智能家居的标准。每个都有,否则的话,老百姓说,你弄个智能锁,每个人训练都不一样。因为这个东西就像洗照片一样。你想想,刚出来照相机的时候,照照片的人,洗照片的人,用照片的人都是专家。老百姓根本不知道怎么回事儿,(还得找专门的)那叫摄影师。后来变成什么呢,卖照相机的人就是卖照相机,卖胶卷的人就卖胶卷,老百姓照相,玩儿,然后到店里边去洗。一定得变成这样的,这就是一个标准化。你想想胶卷都有标准呢。

ALEX REN: 对,胶卷有不同公司的胶卷,相机有不同公司的相机,但是都可以用。

杨林:都可以用。但是呢,为了老百姓方便。

ALEX REN: OK。这个还是比较新颖的观点,对我来讲。这个确实是比较有意思。那后面的AI商业化也许真的会出现这样的变化,对吧?

杨林:一定的。因为现在AI的商业化一定得要产业化,产业化必须得标准化。

ALEX REN: 因为GTI作为一家初创公司,现在应该也还算是处于一个早期阶段,对吧?芯片这个行业,您知道,都是一些大公司,Intel,Nvidia这种,Qualcomm这些大公司吧。您怎么看待GTI怎么跟这些大公司竞争呢?

杨林:我在硅谷呆了30多年了嘛,这是最重要的,你要做硬件是最重要的,尤其是电路。当然刚才我已经谈到了,标准是知识产权的问题。软件的人现在都讲究open source,尤其是AI,都等不及(发)在专用paper上,赶快先放在网上大家先看。

ALEX REN: 是,Archive上面。

杨林:硬件没有,硬件全是专利。那么硬件因为有专利,下来以后你看有几家?没有几家。咱们现在看,除了Intel,Nvidia,这是在GPU,X86就是CPU。原来的那些都很少了。ARM实际上是一个很老的公司,最早我在VLSI Technology的时候,当时就是ARM,Apple/苹果,那在1991年,1990年左右,和VLSI Technology三家做的这个ARM的architecture。英国那家公司只是说写指令集,VLSI Technology是做芯片,苹果是做应用。但是后来因为其他原因,就不了了之了。但是它那个指令集的知识产权在那儿,所以它现在才能够反过来。Intel跟它没法叫板,因为是同时发生的。所以现在难呢,现在AI公司很多,你光简化指令没有意义,你说我没用减法,who cares,反正你用加法了。所以因为现在AI呢,只是一个——现在(对)好多搞芯片的人(来说),通用的CPU或者GPU可能专用做AI有些 redundance,比如说我想把其他的都去掉,专做这个,但是这个东西绕不过去知识产权。你还没做成呢,等做成了就有人来找你了。我们现在是个结构性的不一样,刚才我说过了。我没有那三个什么外存内存,处理器,I/O的,都在一起的。基本上我们为什么有这个信心呢,首先我没有抄别人的,这就是我30年前自己搞的。但是因为30年前在Berkeley申请了专利,而且那个时候申请专利呢,就保证了没有人去侵犯它这个专利,就没有人再去接着申请。2012年,那是1992年,(过了)20年那算专利失效。2012年的时候,我们赶快接着申请。那个失效了以后,第一,你首先要说你不是抄别人的,因为有人跟你打官司啊,你得能证明这是我的。第二呢,你还得有一定的特点,才能保护住。所以在GTI,我们现在已经有5个核心基本专利,很快的。当时我们这个专利去defense的时候,去申请专利的时候主要就是Intel的人在评论。他们认为他们的是(应该获得专利),但最后下来,没用,还是(我们的)这个是完全是新的东西。所以呢,做芯片必须得有专利。没有专利趁早别做。

ALEX REN: OK。那咱们讲了很多技术方面的东西和研究方面的东西。咱们GTI的一个商业发展的策略是什么呢。您觉得我们作为一个初创公司,做芯片本身就不容易。面临这么多竞争,即使我们有基础,接下来我们在商业发展上会采取什么样的路径?

杨林:商业发展现在正好是一个拐点,就是从R&D,Research到产业化,还缺两样东西。第一就是平台,因为我们现在没有产业化平台,都是GPU。你不可能说买个GPU挂在门上当智能锁,那不可能啊。

ALEX REN: 对,GPU现在也越来越贵是吧?

杨林:对啊,是。GPU有它们算的什么服务重心,它有它的市场。现在的人大家也都是希望,因为算力比较大嘛。还有就是培养的人,因为只有这一个平台,所以大家只会用这个东西。所以真正说老百姓要干什么,不知道,他也不想干让他干的这个事儿。你说你给我家弄个智能锁——我学个PhD得5年呢,做那些东西——master都拿不到。没有意义,没有平台。所以我们第一件事就是做一个平台,做一个非常低成本,低功耗,但是还有AI的性能。这就很难。让每一个人,我认为产业化,让大家都先能玩起来。大家都能玩,人才的问题就解决了。就像现在大家都玩计算机,那你不愁找懂计算机编程的。都玩手机,你不愁找手机app的developer。我们的做法就是这个,产业化嘛。现在的计算机和30年前的计算机完全不一样,现在的手机和以前的大哥大也完全不一样。它不是一个办公用品,它也不是一个business的用品,它就是一个家用(电子设备),就是个玩儿。所以我们现在——你看这个东西做的就像让大家玩一样。我也不想拿你去开发什么自动驾驶,智能医疗,不用。你就能用这个识别出来一些很简单的东西,猫啊,狗啊,这些。

ALEX REN: 对,这个普及化确实是需要细分的领域,细分的应用,对吧?针对他自己想关注的问题怎么解决。

杨林:对,所以我们第一个在推这个。但是这个比较长,因为需要一个生态系统。那么我们先是把芯片做出来,成本因为很低,能放到这里边呢,那就肯定是很低的。Intel那个还有散热片呢。我们这个就是这样,从低功耗的角度来讲。再就是我们配合(现状),每个人都有手机,每个人都有电脑。我们让你先熟悉什么叫AI。那么第二个呢,也不是做mission critical的。你说让你去做AI,做自动驾驶,撞死人的事儿,谁负责还没搞清楚呢。你说让他去做智能医疗,治好了行,治死人了,打官司怎么办?咱们不搞那个事儿。

ALEX REN: 对,您说很多应用呢,它其实需要一个不管是法规啊,或者是政策,或者甚至是有些伦理道德方面的,对吧?这些东西还有很大的障碍,您看像无人车的产业化,安全性啊,整个的法律规范,保险,这些都影响到很多东西,对吧?而我们所侧重的这种普及化,它可能更加容易实现一些,是不是这个道理?

杨林:比如说,可以给你举个例子。现在有很多小玩具可以说话,但那都是云端的。云端有几个问题,一个就是说它有一个隐私的问题。你每天说什么话,可能也不敢说太多。

ALEX REN: 需要把这些隐私信息存在本地。

杨林:对,存在本地。第二还有技术问题,实际上在云端处理识别的这个功能更复杂。你比如现在科大讯飞不也有人说它不行。是,那个问题太难了。因为那个东西叫什么,叫非特定人识别。因为语言这个东西是人为定义的。它和图像不一样,图像是自然发生的,语言是人为定义的,还有口音。

ALEX REN: 所以您说的就是个性化。比如我的手机上其实都是我的口音,那应该train起来更容易一点,对吧?您说放在云端了变成几百万,几亿人的(口音),那这个train起来更不容易了。

杨林:对啊。不同的语言,不同的语法,不同的语气,不同的语调,还有不同的兴趣。实际上你放在自己这儿,训练的就是你感兴趣的事儿。可能你家人感兴趣的事儿跟你还不一样,你的孩子更不一样。这个就把一个很复杂的问题变成很简单的问题了。就像我当年到美国来的时候就学了英语900句,在这儿我也没感觉到我有什么难的。因为我也不去跟别人去讨论什么很复杂的事儿,关键词抓到了就行。就是一个你要什么需求,你有什么问题,这东西非常好训练,而且非常有隐私。这就是我们现在要做的这个事儿。你就自己做,训练这个东西就行。你自己就能开发一个他们那样的(应用)。

ALEX REN: 所以你们也提供工具包之类的是吧?

杨林:对,我们提供。这东西就像刚才我说的,没有指令集。实际上机器学习这个事儿呢,让现在人工智能有好多人把它复杂化了。实际上老百姓还是没有真正切入到这一点。真正讲呢,它就是一个大数据,通过整理数据,让机器能够执行一些简单的功能,用我的话讲,就是像教小孩儿的幼儿园老师。你把它看成是一个小孩儿,教给它,这是苹果。再拿个梨,问这是什么,它说这是苹果,不对,梨,啊,梨,下回就是梨。你又弄个橘子,它说又是梨,不对,苹果,不对,什么,橘子。就这样一遍一遍地教。那这些东西就整理成——就是说行行业业的专家去训练你自己要的东西。随便举个例子,现在中国退休的人很多,有钱了都去到处旅游。智能旅游是什么呢,就是现在大家说,到此一游,照个照片。你也不知道这个东西到底怎么回事儿。将来AR就连上了,你一照照片,一开始有的人可以去,他就讲一段,这是谁,这是怎么回事儿。下回呢,你说你要到哪儿玩,比如说,你说你要到清华。清华我一回去,这一个楼,那一个楼,我也不知道怎么回事儿。反正到那儿大家都合影嘛,4月份校庆回去。那后来他们就训练了一个东西,你一照照片,它就告诉你说这个楼什么时候建的,为什么,怎么回事儿。这不就涨知识了吗?现在都是用二维码(扫信息),这不用。而且将来的社区都是交换这个,就是开发的app不用写什么软件C++,基本上你对这个东西感兴趣就行。比如说你到北海,你看那里有个半月桥。你到那个地方照个相,觉得挺美的,为什么叫半月桥?我经常去北海,我也不知道。后来看《国宝档案》才知道,那是乾隆写的“半月桥”,是纪晓岚还是谁告诉他,说你看那个大白天的太阳在里边就是半个月亮。你说这种涨知识的事儿,谁也不知道啊。

ALEX REN: 对,确实看见了AI能做的事情。

杨林:所以智能旅游是我们要做的一个事儿,智能教育,智能旅游,就是这些东西。像什么自动驾驶,智能交通,什么智能医疗,那是国家的事儿,这些是社区的事儿。

ALEX REN: 所以GTI这个策略就是说,我们做一个普及化的平台,可以让大家去做一些像您说的这个智能旅游,这些细枝末节的一些应用,对吧?让一些开发人员,让这些人才很容易掌握这些工具,做这些开发,针对他所关心的一些问题做出些解决(方案)。

杨林:就是这个意思。因为我今年4月份回国的时候曾经说过,我说要把AI玩起来。我们这个东西上面写的叫“plai”,音译好像就是玩嘛(play)。但是它的直接意思就是People Learn AI,就是玩的意思。一旦大家都了解了,都玩起来了,你人才也不会缺了,行行业业都是专家。因为AI并不是要解决一个高大上的就这么一个事儿,AI是要方方面面的解决很简单的事儿。我们最近也在跟一家做baby monitor(的公司合作)。小孩儿一哭——小孩儿嘛,总得有人看着——或者他刚要哭的时候,你马上把当妈的这个声音录在那儿了,起码给他distracts一下,就不哭了。这就是很简单的一个事儿啊,也不需要什么云,这个那个的,这个东西就可以做,你自己训练。

ALEX REN: 其实我自己也一直想,因为天天接触AI的问题。我想到的问题,比如识别出我们家后院的松鼠,后院的水果都被松鼠吃掉了,这些东西都是很类似的。家用的,普通的,普通人所接触到的一些产品,怎么样可以解决。而不是说很多看起来非常非常复杂的,需要举国之力去解决的这样一个问题。OK。您看到这里有两个以前可能相对来讲隔离比较深的领域,一个是AI领域,一个是芯片领域。现在有很多AI工程师,也有很多芯片工程师。这两个领域随着商业化会越来越merge,您对这两个领域的工程师,对他们的职业发展有什么建议?他们应该关注什么?对AI工程师(来说)应该怎么样去更了解硬件,还是对硬件工程师(建议)怎么去更了解AI吗?大概您是怎么给他们建议的?包括您也有学生嘛,您对您的学生是怎么教育他们的?

杨林:因为我觉得,因为现在是个拐点,拐点变化是很快的,当前的需要就是产业化的问题。刚才我说了产业化,标准化,让大家都能够用起来。很短的这段时间我很难预测,那么等AI基本上普及了以后——就像手机这种——非常普及了以后呢,我觉得搞软件的人已经没用了。因为都是什么呢——

ALEX REN: 这是很shock的事情。

杨林:你要让一个农民说哪个苹果长虫子了,哪个没长虫子。你怎么教,你说你还要学Caffe,让人吓一跳。那他只能告诉你,你拿这个东西照几个相,然后你告诉我,什么是有虫子的,什么是没虫子的,没虫子的喷什么药。比如说你们家扫地机,现在都是瞎眼的。只是它很尽力去天天给你扫,现在所谓的智能就是没电了知道走回去充个电。但是真正的扫地机呢,是干净的地方就不扫了,就不擦,脏了再擦。有根头发捡起来,有了可乐(渍)喷点东西,这才是(智能)。但就这么几类,没那么复杂。但是这种东西用不着让很专业的人去训练,基本上将来大家训练AI,就需要各种级别的导师,而且越低级别的老师需要越多。就像人的智慧一定要有程度的,所以才有一个小学毕业,中学毕业,大学毕业,博士,教授什么的,越往上(学历)高的人学的时间越长。学的时间越长,就是cost越高,但是大部分的人,(对)我们真正需要的(来说)呢,基本就够了。就像刚才我说的,baby monitor,你找一个安徽小保姆不照样给你看着么?

ALEX REN: 是。所以您刚才提出的是软件工程师这块。那还有硬件工程师,他们这些软硬件工程师该怎么办呢?如果说未来——我知道您的这个意思,以某种程度来说也是应该有AutoML的含义,是不是?也有从某种程度上讲,说AI本身的普及化之后,可能让普通人就可以教会AI怎么去做,就是train AI,对吧?那您说那些过去热门的这些软件工程师怎么办呢?

杨林:这一点呢,这是一个很热门的(大家都在)讨论的问题,是不是会抢了(这些人的)job。我个人觉得,他们不会,会活得更有意义。但是不一定做现在做的这个工作。所以我想,什么时候发生我不知道,但是最终发生的时候,应该是大家都变成老师了,都去教机器去做人的事儿。

ALEX REN: 就好像我们以前教计算机去做事儿,现在转变成去教AI去做事儿。

杨林:对。教计算机做事儿呢,你得自己学本领。

ALEX REN: 你要会它的语言,对吧?

杨林:对。机器学习呢,是你只要整理数据就行了。那么实际上你这么想吧,中国几千年文化,大学,清华才100年,100多年。这就是因为工业革命造成的。那么美国的大学200多年,欧洲的大学400多年,都是工业革命造成的。也是随着时间不同才有。实际上大学就是为了让人去操纵机器,需要一些专业。所以那个时候清华叫什么,我们要甘当螺丝钉嘛。就是把人先变成机器人,就是学校。以后不是,以后学校就是培养老师,把机器变成机器人,不是把人变成机器了。教育是要很大的改变的,教育一改变了,人就可以学别的。你可以教机器去作曲啊,不是还有教机器跳舞的吗?多了,是吧?各种方向,就是说现在你可能都想象不到。就像当年马车司机老觉得自己没job了,最后不都当taxi司机了,也不错嘛。当然不是同一代人啦。

ALEX REN: 这个非常有道理啊!那您说现在做硬件的工程师,他们应该做什么呢?

杨林:最近这几年——将来我说的那个时候就没有软件硬件这个概念了——最近这几年呢,我觉得硬件工程师做这个系统,不是做一样的,只是CPU,GPU,大家比那个,只有几家大公司做,所以会有很多startup。你别看有很多startup,他们不是在竞争。就像开饭馆似的,每个人有自己的风味,每个人都有自己的(特点),只要你自己能够想一个你做的东西有需求,就有business。这是做硬件的。那做软件的人呢,因为有硬件配套么,那就是生态系统,可能是要做这个。

ALEX REN: 做application。

杨林:对。你看我在silicon valley——一开始到处都是卖PC的,谁都能攒个PC去卖,做硬件的人很多,后来没有了。然后去做芯片,芯片也没有了,现在哪有做芯片的了,就几家大公司。然后做软件,现在连软件也没有了,就几家大公司。可能将来我又感觉到,这个又会回来。就是为什么说三十年河东,三十年河西呢,因为这是个新的领域,原来的东西呢,很难适应做这个事儿。所以它就需要人去有更多的灵活性和创新能力。而且更服务于方方面面的需求。

ALEX REN: OK。那非常好,就是说您做了这么多年研究和工程,包括现在创业,您觉得未来几年——这是最后一个问题。未来几年,比如3到5年,您自己的目标是什么。还有就是您觉得GTI未来3到5年的发展会是什么样子?

杨林:我们最近的这两三年,就是要做一个普及的平台。把这个事儿普及起来,这是我们现在(的目标)。普及这件事儿呢,我们认为是个平台效应,是horizontal的,就是说我拿这个东西,你放在PC上可以自己去开发自己的应用。然后可能三五年以后呢,我们会觉得行业应用的人越来越清楚自己要干什么了,因为他先是拿这个平台。这个平台很小,也很物美价廉,但是还是不够专用,那进一步优化怎么办呢?就是要做ASIC,就是在做专用电路。然后我们就开始做vertical的。针对某一个,比如说安防,那以后安防标准化了,大家都做一样的了。所以方方面面,包括汽车,包括智能医疗变成说你看病是可以用那个,但是家里边有一个personal doctor,起码早上起来,看你一照镜子发现今天没睡醒,提醒你一下。那么这种东西我觉得都是比较专用的东西,就像冰箱,电视啊这些东西。那么如果有量,我们的hardware engineer,或者是做芯片的,就会根据这个量(进行开发)。原来都被通吃了,原来大家都不同,叫device。前一段时间开了一个(会)叫Hardware Summit,我当时说什么叫hardware,大家现在就认为就是computer。但是实际上hardware以前不是computer。Hardware就是能具体干事儿的一个东西。那这个随着人工智能方方面面(的应用)多了,各各方面都有,不一定我就需要最好的,

ALEX REN: 那您个人呢?这个过程中,我的理解您是在做整个AI的普及化,对不对?这是不是您的个人目标?

杨林:我的个人目标现在,所以我现在实际上在填补空白嘛。因为刚才咱们不说了吗,没有Hardware design engineer了,所以我干脆先启动一下。然后在这个时候由于我们的公司增长也很快,以后就要招很多人嘛,培养一些新的人,把这些事儿慢慢做起来以后呢,我也就退休了。

ALEX REN: 所以您是还在提携后辈,很多新的工程师。所以今天其实也是受益匪浅啊,杨老师讲了很多他对于整个30年来,包括从上一次的人工智能(浪潮)开始,整个的发展,不管是通讯,半导体,计算机,以及现在人工智能。那通过以前的这种计算机通讯这方面的发展,看到说我们现在AI普及化所面临的一些机遇。所以杨老师创立的这个GTI也是为了瞄准这个机会来的,对吧?同时也会希望能够利用我们所积累的这些经验,用一些新的架构,新的一些方法去为这个普及化而做出努力。所以非常感谢杨老师的分享,(让)我个人是非常非常的受益匪浅。所以今天就是我们Robin.ly的第四期节目,谢谢大家。

杨林:好,谢谢让我有这个机会能跟大家分享!

ALEX REN: 谢谢!

Leadership, entrepreneurship, and AI insights

  • LinkedIn Social Icon
  • YouTube Social  Icon
  • Twitter Social Icon
  • Facebook Social Icon
  • Instagram Social Icon
  • SoundCloud Social Icon
  • Spotify Social Icon

© 2018 by Robin.ly. Provided by CrossCircles Inc.