百度飞桨的智能化生长

在这个父亲节,一段只有短短29秒的视频登上了微博热搜。

“父亲因为工作繁忙,没有见到爷爷的最后一面,所以这个父亲节,我用飞桨的技术复现了爷爷的照片,不但从黑白变成了彩色,还可以眨眼睛……我想,这可能是我能给我父亲最好的父亲节礼物吧”。

从画面中的房间的简单陈设看的出来,这是一个非常普通的家庭,用的也是非常普通的手机和电脑,然而,就是凭这些简单的设备,一个孩子完成了对父亲最好的馈赠。

“AI复原爷爷照片引父亲泪崩”话题登上微博热搜
“AI复原爷爷照片引父亲泪崩”话题登上微博热搜

也有很多人关心,飞桨是什么,它为什么能让一个普通人做到这些?说到这里,就要谈谈飞桨这个中国人自主研发的产业级深度学习框架的飞速崛起,以及它的成长背后,中国AI的领头羊企业的智能化组织变革。

越简单的事,就一定有越艰难的背后故事。

飞桨,生而不同

飞桨,是百度打造的全球TOP3的产业级深度学习框架的名字。而本文的重点,并不是介绍飞桨技术,而是解读飞桨诞生背后,百度的组织力和智能组织架构是如何支持这个奇迹诞生的。

当然,为了讲清这件事,我们还是要约略介绍一下飞桨和深度学习。

你可能直接接触不到飞桨,但是,无论是近期屡屡引发轰动的百度Apollo自动驾驶技术,还是支持你每天使用智能搜索的百度文心ERNIE、抑或是你每天都在对话的小度助手、甚至是这个父亲节也很火的、为了方便中老年人使用的百度大字版,它们的身后都有一个坚实的支撑,那就是飞桨。

百度APP大字版”帮助老年人跨越阅读障碍,更好地服务老年人
百度APP大字版”帮助老年人跨越阅读障碍,更好地服务老年人

2006年深度学习大师杰弗里.辛顿用一篇名为《一种深度置信网络的快速学习算法》宣告了深度学习浪潮的掀起,2010年后,随着算法、算力以及广泛的实践,深度学习被认为是目前实现人工智能的最主要的路径之一。

在深度学习的早期,使用者大都是真正的高级研究人员,他们可以自己直接编写深度学习模型。然而,尽管如此,这些聪明人仍然发现,每个深度学习模型的编写,都需要做大量的重复性工作,写无数重复的代码。

因此,这些研究者为了提高工作效率,就把编写深度学习模型的几个必要过程,逐个提炼出来,渐渐产生了一个相对稳定、通用程度相对高的“最优组合”,这就是我们所说的“深度学习框架”。

就像那段视频里展现的一样,由于深度学习框架极大的降低了人们使用AI的门槛,一个普通人也可以使用AI技术来服务于自己的生活——比如,给父亲送上一份特殊的节日礼物。

正是因为如此,如今全球有超过80%的AI工作者依赖开源的深度学习框架来创造各种各样的人工智能应用,深度学习框架也因为被成为“智能时代的操作系统”。

框架虽然是开源的,但就像那句名言说的那样:“科学是无国界的,但科学家是有祖国的”,在未来波云诡谲的国际产业竞争中,如果生长出庞大AI生态的“根技术”不掌握在自己手中,因为“缺芯少魂”而被卡脖子的事件,未尝不会重演。

正因为如此,2016年,百度飞桨宣布开源,成为中国人工智能领域的头号新闻。

其实,打造飞桨并开源,并不是一件容易的事情。

首先,深度学习技术的大本营在美国,人才最集中的也在美国;

其次,研发产业级的开源框架需要投入的资源是近乎无限的,而全球另两个和飞桨同级的框架,背后分别站着谷歌和Facebook,它们无论从金钱、资源还是人才上,都远远超过当下的百度;

最后,在飞桨诞生前,谷歌和Facebook研发的框架已经完全占领了中国市场,飞桨要做的不是占领无人区,而是在红海中杀出一条血路。

然而,百度人相信自己能做到,因为百度有三个最关键的组织力支点,一个是百度的崇尚技术的创新文化,一个是硬核的工程师能力,一个是敢打硬仗“向死而生”的精神。

百度崇尚技术、鼓励创新,这个过去我们已经谈过很多,用百度创始人兼董事长李彦宏的话说就是:“很多时候大家已经习惯了的东西、习惯了的做法,不一定是对的……我们每一个人都要有这个态度,敢于去重新审视我们现在约定俗成的一些做法,这样我们才能找到新的机会,才有创新的空间,才能够比以前做的更好。”

另一个重要的支点,是硬核的工程师能力。百度集团高级副总裁崔珊珊认为对工程师要“高标准、严要求”。她强调,百度强调“简单可依赖”,但不能片面的把“简单”理解为松松垮垮、放任自由。她认为,真正完整的解读,是“做人很简单,做事很厉害”,而体现在工程师的能力上,就是百度认为技术人才最宝贵的能力,就是工程能力,也就是把某种技术变成实际可用的产品的全栈能力。

第三个组织力支点是敢于“向死而生”,李彦宏很喜欢这个说法,他曾对全体百度人说:“‘向死而生’的精神,应该作用于今天百度所有的部门。每个部门都面临着非常大的压力,我们面临的是全世界最激烈的竞争,中国市场上任何一个有机会的地方,都有一堆人冲上去玩命地打。如果你能在最激烈的竞争当中跑出来,你就是那个竞争力最强的选手。”

为什么说这三个能力成就了飞桨呢?

首先,飞桨一出道,就以差异化的定位杀开了一片自己的空间。而在飞桨出道之前,百度就研究过对手的定位——Facebook的Pytorch强调的是“为研究者服务”,实验室气质十分浓厚;谷歌的TensorFlow则打出“任何人都可以用”的旗号,意图一统天下。

飞桨必须有一个充分差异化的定位,经过反复的思考,这个定位被放在“产业级”上,飞桨的研发者敏锐的意识到,作为全球GDP排名第二,制造业第一,服务业蓬勃发展的国家,飞桨的价值点一定要定位在能够便捷的为千行百业赋能,能够让各行各业的人便捷的把AI用于产业革命上,所以飞桨一定要在便利于产业落地上打开自己的差异化能力。

正是因为强调差异化创新,强调人工智能和产业的融合,飞桨已经聚集了320万开发者,服务了12万企业,创建了36万模型,覆盖到了工业、能源、金融、医疗、农业、城市管理、交通、信息技术等各种各样的行业和场景。

虽然我们已经谈到了创新、工程能力和人才培养,但并不是说百度只要崇尚、提倡这种价值观,这个组织就自动获得这些能力。特别是第二点的工程能力和第三点的打硬仗的精神,这些能力必须依附于具体的组织形态之中,才能发挥作用,这也就是本文要研究的重点——百度到底创造了一种什么样的智能化组织。

百度的智能组织是怎么诞生的?

在写这篇文章之前,笔者曾经研究过各种智能组织的理念,笔者的结论是,目前,绝大多数的“智能化组织”还停留在理论探索的阶段,其提法和设想虽然不乏吉光片羽的智慧火花,但却没有经过实践的考验。

而经历过实践,可能是百度的“智能化组织”最大的不同之处。

一位西方哲人曾经说过,人与自己欣赏的事物之间,存在广泛样态上的同构关系。

而作为智能经济、智能社会种种设想的提出者,百度的智能化组织的理念,可以认为——是百度自身对智能世界运转规律理解的一种具象化。

说起来,其实百度的智能化组织的概念非常容易理解,我们可以解释为,这是一种AI时代的典型思维,也就是由算法、算力和数据三个维度驱动的组织。

首先,百度智能组织的“算法”,就是价值观。

AI意义上的算法(Algorithm)的标准定义,指的是一套完整的解决问题的清晰指令。与之相对应的,百度的智能组织的算法(价值观),指的也是一套完整的,用系统的方法描述和解决问题的策略机制。

在一份名为《2019-2020年穿透对齐90条》的内部文件上可以看到,百度至少有90个(还在不断增加)的价值点,它们的覆盖甚广,既有“激活攀登者”、“改变肌肉记忆”、“愿景使命驱动”这样战略层面的,也有“生而不同”、“终局思维”、“直呼其名”这些文化、管理维度的,还有 “反肌肉记忆”这些思维探讨层面的,甚至包括“每个人都要捡起地上的垃圾”的细节。

这套算法就是驱动百度的根本价值观机制,也是百度智慧组织运作的“操作系统”。这个世界上绝不存在没有价值观做底层支撑的智能组织,就像没有人可以使用一台没有安装操作系统的电脑一样。

接下来,百度智能组织的“算力”,就是百度的人才和人才建设-考核-任用机制。

算力,可以约略理解为执行算法的能力(计算机输出函数的能力),换言之,如果只有算法(价值观),但没有一套不断优化的算力(人才和人才建设-考核-任用机制),那算法就成了空中楼阁。

最后,百度智能组织的“数据”,就是百度多年以来积累的行业know-how和以数据形态沉淀下来的知识财富,也包括百度十年千亿投资积淀下来的技术护城河和技术存量。

写到这里你就会明白,百度正是用AI时代的典型思维构建了智能组织的三个层面,但必须强调的是,只有同样以智能的方式去执行,这才是真正的“智能组织的行为法则”,否则,它就和任何普通的企业组织观念没有本质上的区别了。

那么,百度是如何智能的驱动这套智能组织的呢?也很简单,通过三个体系,百度就做到了。

百度智能组织是怎么运作的?

百度智能组织的核心算法,也就是百度的价值观,是以OKR工作法作为驱动工具而发挥效用的。

OKR(Objectives and Key Results)即目标与关键成果法,是一套明确和跟踪目标及其完成情况的管理工具和方法,由英特尔公司创始人安迪·葛洛夫(AndyGrove)发明。

在百度,OKR和组织力是智能适配、相互嵌套的,也就是李彦宏说的:“组织能力决定战略路径。大家看到,我们自从实行OKR制度以来,从我到每一个总监,都要求其中有一个O是关于组织能力的。没有相应的组织能力,我们就不能够制定正确的战略路径”。

在OKR实行了一年多以后,李彦宏再次复盘OKR对百度的组织能力的作用时,谈了很多。

他说:“我管的幅度很宽,有些重要的事情和不重要的事情混在一起了,怎么去辨别哪个事情重要、哪个事情不重要呢?一旦我自己有点confuse的时候,我还是要回去看我的OKR是什么,我的N-1的OKR是什么,这是一个很好的对齐和系统思考的工具。与此同时,当我对某些业务的进展有怀疑和不满意时候,我也会去看OKR。也许在我的OKR里没写那么具体,那我就再往下看一层、甚至看两层,看他们的OKR里到底写的是什么样子的,现在进展又如何”。

百度运用OKR,还引入了“开源”的理念,李彦宏说:“OKR的开放,也会增加一些peer pressure。如果你的OKR写得不好,也许人家没有跑过来跟你直接说,但是人家会看不上你,想说这人就是在那儿瞎糊弄。所以我觉得更多的开放,也会促进我们OKR质量的提升”。

李彦宏甚至还强调,OKR是可以像AI一样,随着环境和认知而不断调整的,他说:“可能很多人没有意识到,OKR中间还可以改。如果你季度初制定的东西,市场环境变了,或者说认知升级了,你还是可以去改的。所以我认为这个工具是有很多能够帮助我们把工作做好的feature的”。

而对于百度智能组织的第二个层面,即算力的打磨,也就是人才机制,飞桨可以说是最好的例证。

这些年,百度的业务起起伏伏,也遭到了不少的非议,但没有一个人说百度的人才机制有问题,面对飞桨这样的新项目,百度从来没有闹过人才荒;面对方方面面的企业从百度挖人,百度甘心做业界的“黄埔军校”,这里面始终体现着一种对人才重视、尊重、培养的态度。

百度在人才方面的一个核心理念,就是人才是可以引进的,但即使引进不了,百度也能从实践中培养出合适的人才。

还是拿深度学习来举例,百度在深度学习上引入人才可谓不遗余力,从深度学习研究院,再到升级为百度研究院并下设深度学习实验室,再到建立美国研究中心,走过一条漫长的引入国际精英人才的路线。但我们同样可以发现,今天飞桨的核心人才,基本都是百度体系内生和自我培养的。

百度二次上市现场高管合照
百度二次上市现场高管合照

比如百度的CTO王海峰,毕业于哈工大,是自然语言处理领域世界上最具影响力的国际学术组织ACL50多年历史上首位华人主席,但他也是在百度体系内成长起来的。他加入百度的11年岁月里,从基础技术首席科学家做起,从理论研究色彩浓重的定位转岗至搜索业务群组任副总经理,从事非常具体的业务工作,最终实现了将原AI技术平台体系、原基础技术体系和百度智能云事业群组,整体整合为人工智能体系(AIG),从技术路线到组织路线彻底完成了百度的AI路径建设并成为集大成者,这个过程完全是在百度内部摸爬滚打出来的。

又比如百度集团副总裁吴甜,毕业于浙江大学,2006年加入百度,是百度有记载的第一个把人工智能技术用于具体业务的工程师,百度是她第一份也是目前唯一一份工作经历,她也历经了整整15年的打磨,最后成为飞桨的主理人,并成为财富杂志全球40岁以下40岁商界精英,她也是完全在百度体系内成长的。

再比如百度飞桨总架构师于佃海,毕业于北京大学,作为百度深度学习技术最早一批研究人员,他开创了深度学习语义计算等技术方向并在广泛业务应用发挥重要影响,他也是几乎一毕业就加入百度的。

百度特别是飞桨的三个灵魂人物的共同特点,就是都是毕业于本土院校并且基本上在百度体系内,先跟随而后推动了深度学习在产业实践中得到重视并用于工业界的全过程(从2010年开始),这一定不是一个偶然事件。

当然,笔者并不是说海归或者有国际企业经历的人在百度就会不适应,比如李彦宏本人就是海归+外企出身,百度集团副总裁、小度科技CEO景鲲和小度科技CTO朱凯华分别来自微软和谷歌,有海外背景的人在百度一样多如过江之鲫。

而是笔者想说,如果百度没有建立一套既能吸收国际最新的科学成果,又能扎根于本土产业化需求的人才机制,是无法解释为什么百度能够主要依靠内生的人才机制,培养出整整一代中国AI事业的领军人物群体,且使百度成为全球AI四强并使飞桨跻身于世界TOP3框架的。

某种程度上,说明百度对创新人才的成长,也就是智能组织中“算力”的成长,有着非常清楚的路径设计。李彦宏对于创新人才的看法是,创新主要是top-down(自上而下)的,需要战略定力和深度思考。

对于许多公司动辄发动群众运动式的创新,李彦宏的看法很犀利,他认为作为一个领导者,自己不去思考创新、不去推动创新,把创新的责任推给下属、团队,本身就是一种偷懒的做法、是一种不负责任的表现。

他尖锐地说:“有种肌肉记忆,就是一提创新,就立刻想到全民创新、基层动员、创新土壤培育、创新项目赛马、创新奖项激励这些词儿。以上种种,不是说完全没有成功概率,但成功是小概率、是靠运气。百度的做法是关键岗位上的人自身能力提升,把业务的战略创新想出来,做出来”。

在今天,百度内部有75个人被组织定义为“领军人物”,组织对他们提出了更高的要求,即更需要“攀登者精神”。以创新能力为例,百度认为创新更应该是自上而下的,这75个人首先需要增强自己的创新能力,思考怎么和自己的业务结合做创新,而不是让下面的人去干。

笔者认为,创新机制和攀登者制度,就是百度人才“算力”的驱动程序。

写到这里,我们不免还要探讨,百度的整个智能组织是如何协同的,算法和算力又是如何依靠数据驱动的呢,这里就要讲到一个更具体的工具——如流,百度自研的办公协同工具。

笔者曾经采访过钉钉的创始人陈航,他的一个观点很吸引我——任何一个协同工具,首先是先有思想,后有工具。

从这个角度来看,百度的如流,就是百度智能组织的驱动程序,它的思想核心,用李彦宏的话说就是“AI时代的创新流水线”。

如流构建AI时代工作“流水线”,图片来源埃森哲《企业职能工作白皮书》
如流构建AI时代工作“流水线”,图片来源埃森哲《企业职能工作白皮书》

很多人把如流混同于同类的协同工具,但笔者认为,如流的一大特点,就是强调智能组织三驱动中的“数据”的管理,也就是企业内部的知识管理。

李彦宏曾经非常自信的说:“百度是一个二十年历史的公司,从诞生第一天起就是一个高科技的、知识密集型的公司。这么多年,我们积累了很多经验、教训、知识信息,这些东西如果能够高效流动起来,一定会让我们创新的速度有大幅度的提升”。

他在百度内部呼吁“现在的我们,更多应该考虑的是怎么让我们的知识更加高效地去流动;企业内部的知识要feed化,知识的管理,具体是以feed的形式为载体的,要有非常优秀的推荐算法,让工程师在明天需要干活之前,就给他先推荐一些他需要掌握的技能”。

现在看来,如流很好的承载了这样的机能。如流的主要优势之一,就是知识管理,结合AI和知识相关技术,如流形成了具备差异优势的知识生产、加工与应用能力,可以实现知识的生产与沉淀、组织梳理、应用赋能和全流程的知识管理。

如流定位是新一代智能工作平台,图片来源如流官网
如流定位是新一代智能工作平台,图片来源如流官网

举例来说,如流上有一个“知识广场”,点开后会发现有课程、讲座、课件、文档,在此之上,基于百度强大的搜索和推荐能力,如流可提供统一搜索和推荐功能,员工搜索关键词,即可找到内含关键字的文章 甚是聊天记录的截图,以及组织内的每一个有用信息。

但“如流”的智能属性远远不至于“搜索知识”那么简单,否则也称不上智能工具,它的智能在于可以“搜索人才”,这就很恐怖了。

李彦宏非常重视年轻人才,他说:“现在技术创新非常快,市场变化非常快。这种情况下,我们必须要有年轻干部顶上来。从机制上,我们必须有一个能够发现、培养出优秀的年轻干部的机制。其实各个有竞争力的组织都是有意识地在做这件事情。我们也有一些相应的计划,会把系统地发现和培养年轻人才提到比较高的优先级”。

而“如流”某种程度上正在实现李彦宏的想法,“如流”不但可以搜索知识,还可以形成员工专属标签,使得企业内部轻松实现更便捷的以事找人、以事荐人,既可以帮助员工找到具备某种特定知识的同事,助力每一位企业员工更有效的协同工作,甚至使标签足够优秀的人才能够脱颖而出——这种对员工能力水准能够数据化,且既可被搜索、又可被推荐的机制,是笔者从未在任何一个其它协同工具中找到的。

可以说,如果算法也就是价值观决定了百度是如何做整体策略和行为规范,算力也就是人才机制决定了百度做事的效率和成果,那么如流就真正起到了对于企业数据的深度利用——根据权威机构统计,实现了数字化的企业,每年的内部数据量会翻一番,但仅有2%-4%的数据能被利用。虽然我无法计算出“如流”让百度对企业数据的利用度提升到了某个具体的指标,但仅仅从利用的方式和层次来看,就不难得出,这才是智能组织的运作形态和未来方向。

而对于这一切,虽然还没有见诸于宏观的体系论,但也可以在不少专家学者关于智能化组织的研究中找到对应的表述。比如中国人民大学商学院MBA中心主任周禹就强调:“现在是中国企业穿越大周期的分化期,艰难时期里,通过组织系统的全盘更新才能穿越周期,走向未来。通过架构、协同、考核与激励提升组织制度力,并积极拥抱数字化提升科技算力,才能培养出可以承载未来战略的组织”。

北京大学光华管理学院组织与战略管理系教授、行为科学研究中心主任张志学也强调:培养人的创造力,是这一轮科技革命下企业变革的重中之重,而人才培养中,数据的价值如何应用是一个关键。

所以,百度的智能化组织,虽然前面已经颇多论述,笔者想强调的,在三维驱动的核心里,始终是一个大写的“人”字。