Image 2 Image 3 Image 3 Image 3

百度举办AI开发者大会,有哪些信息值得关注?这些前沿的人工智能技术什么时候才能规模化落地应用?

频道:行业资讯 日期: 浏览:1037

看过了刚刚结束的百度Create AI开发者大会,时常大概俩小时,我在这里给大家分享下我的收获与感想。AI是我的研究方向,自然也会主要关注AI领域的最近进展,这里有两个地方我会着重说,完备和扎实。 给我有两个感觉,一个是「完备」,另一个是「扎实」。

完备是基本上AI的前沿领域百度都所有涉猎,并且都做的非常不错,比如AIGC,自动驾驶和智能出行,AI+领域都成果不菲。毕竟我听说,百度过去十年投入在研发的成本达到1000亿。近几年研发强度能占营收的20%以上,在民营企业五百强里连续几年都是第一。花这么多钱、人力搞技术研发,才能收获这些成果。

同时在AI基础技术的发展上也相当的扎实,基本上从硬件到软件,从基础平台到应用层都有自己拿手的绝活技术。

其中大会讲述人提到的一个名词引起了我很大的兴趣,那就是「全栈布局」,一般来说全栈这个词多用在全栈工程师上面。

根据百度百科的定义,全栈工程师是指掌握多种技能,胜任前端与后端,能利用多种技能独立完成产品的人。

百度举办AI开发者大会,有哪些信息值得关注?这些前沿的人工智能技术什么时候才能规模化落地应用?

基本上就是一个产品所需要的绝大多数技术都有所涉猎,并且可以融会贯通并最后能做出产品的人。

这对于一个个体来说挑战很大,因为对于学习能力,时间,精力等等要求很多,毕竟很多人就算是其中的一个或者几个技术的学习都已经很有难度了。

那么对于百度的全栈布局来说,也是类似的定义。那就是从AI的角度来说,百度的AI技术栈包含了:芯片层、框架层、模型层和应用层四层。这几本书层把AI开发的全流程和核心这个技术全部包含了。

从芯片层来说,虽然说互联网企业造芯已经不算事新鲜事,但是从全球范围内仍然只是少数派,毕竟芯片这东西很难带来短期的直接效益,唯有长期主义者才会选择押宝在芯片上。

百度举办AI开发者大会,有哪些信息值得关注?这些前沿的人工智能技术什么时候才能规模化落地应用?

其实这也表现了百度对于AI行业的长期乐观态度,芯片是算力的直接来源,如同电力的普及奠定了工业社会发展的基石一样,算力将成为智能社会的基石,是未来社会发展的生产力,而芯片则是算力的来源。百度自主研发的AI芯片“昆仑芯”目前已经落地应用两万片,覆盖了50多个外部客户。这个量级在国内属于非常领先的。

在第二层的框架层中,百度有飞桨深度学习框架,这个很多没有涉猎过深度学习的同学可能不是很了解。其实就是一个用来方便用户做深度学习实验或者部署的框架,国外的同类项框架有TensorFlow或PyTorch,百度有飞桨Paddle,其丰富以及详尽的手册,在数百万的开发者努力下,以及有60多万个模型被创造了出来。从前年开始,飞桨刚刚在中国综合市场打破了国外两家的垄断,成为了综合市场份额第一,算是给国产框架争了口气。

就拿2022年火热的stable diffusion图像生成技术来说,在paddle也很快的上线了类似的功能。

百度举办AI开发者大会,有哪些信息值得关注?这些前沿的人工智能技术什么时候才能规模化落地应用?

并且在paddle运行也有好处,第一算力免费,每个人都有足够的免费算力进行试玩;同时容易访问,毕竟不是所有人都可以轻松的访问这些需要一定计算机背景知识的功能。

接下来一层就是模型层,对于刚刚过去的2022年来说,可以称之为AIGC技术的元年。所谓的AIGC技术,全称叫AI-Generated Content,翻译过来就是人工智能生成的内容,这个内容包括但不限于,文本,图像,音视频等等。

百度举办AI开发者大会,有哪些信息值得关注?这些前沿的人工智能技术什么时候才能规模化落地应用?

在AIGC 前面,还有几种内容生产模式,比如

OGC - Occupationally-generated Content,职业生产内容,特点是通过具有一定知识和专业背景的行业人士生产内容,并且这些人会领取相应的报酬

PGC- Professionally-generated Content,专业生产内容,生产创作主体是由专业精英构成

UGC - User-Generated Content,用户生产内容

随时大模型的出现,内容生成这门以前需要一定门槛的事情一下子变得人人可以做了,甚至可以说,可以让普通用户生产出职业级别的内容。

这就是大模型的魅力,百度的文心大模型就是一个典型的大模型,比如下图生成的这种手绘风格的动漫人物,这就是文本生成图像的典型应用。

百度举办AI开发者大会,有哪些信息值得关注?这些前沿的人工智能技术什么时候才能规模化落地应用?

对于我这种连字都写的很难看的人来说,画画更是难上加难,但是我照样可以利用这种工具做出让人惊艳的作品。

而百度也将大模型的能力应用到实际的产业生产制造中,

其实,文字转图像只是这个大模型的一个子集,它包含的内容其实远比这些内容要多。

百度举办AI开发者大会,有哪些信息值得关注?这些前沿的人工智能技术什么时候才能规模化落地应用?

你可以看到,大模型有很几个,NLP,CV,生物计算和包含了图像生成的生物计算大模型。

不知道你们发现了没,基本上都对应了去年的AI火热领域,NLP对应了ChatGPT,CV对应了自动驾驶,跨模态对应了stablediffusion,生物计算对应了alphafold。

可以说,这就是我理解的「全栈」的魅力,一旦自己掌握了基本上所有的技术栈,那就可以去尝试实现自己所有的想法,并且自主自研的技术也更加适配自己的平台,可以说是事半功倍。

最后我很愿意用长期主义和短期主义结束这篇文章,短期比较好理解,比如一个公司为了解决一个问题,从别的公司引进人才,直接把当下的难题解决掉,特点就是直接上手,快速解决,注重速成。而长期主义更依赖于日积月累的累积效应,去投入到那些基础底层的事情上面,不断累积之后会必然获得不错的反馈。

跟深度学习的大模型一样,数据越多,模型越趋于完善,模型越完善,使用者各行各业的使用就越多,使用的越多,反馈就越多,然后可以改进的地方就越多,在这种长期的正向循环中,进步可能远比直线还要快,就跟技术爆炸似的,更趋近于指数级,未来也将更大范围的应用在千行百业的智能化转型上,用技术助力中国实体经济的发展。

0 留言

评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
验证码