随着ChatGPT的爆火,国内人工智能领域也风起云涌,互联网科技公司展开了AI大模型的军备竞赛,个人创业者也纷纷入局。AI人才随之开始了新一轮的流动,消息称原阿里AI大将杨红霞加入字节,著名AI科学家、阿里副总裁贾扬清则选择离职创业。
此外,阿里达摩院昨日低调上线一款“文本生成视频大模型”,阿里在AI领域的布局正在逐渐揭开面纱。
3月22日,据36氪报道,阿里M6大模型的前带头人杨红霞已加入字节跳动AI Lab(人工智能实验室),参与语言生成大模型的研发,并在语言生成大模型团队中处于领导地位,直接向字节跳动副总裁杨震原汇报。
观察者网就上述消息向字节跳动方面求证,截至发稿前暂未收到回复。
ChatGPT没有开源,意味着市面上暂时找不到可以轻松平替的大模型算法,各家想要在不依赖OpenAI和微软的情况下开发相关产品,除了依靠自身的技术能力外没有捷径。比如不久前百度推出的“文心一言”的“基座”,便是百度自身的文心大模型ERNIE。
除已经推出文心一言的百度外,腾讯、阿里、京东、小米、网易等等大大小小的公司都宣称将在该领域有所动作。此前,亦有字节AI Lab要开展类ChatGPT和AIGC的相关研发,未来或为PICO提供技术支持的消息传出,不过字节跳动并未对此做出回应。彼时,PICO相关人士对观察者网否认了这一说法。
不过,字节AI Lab此前便有机器学习、自然语言等相关研究,也有媒体报道,其正在大模型方面布局、在语言与图像模态方面发力。再结合技术大牛杨红霞加入的消息,看起来字节跳动也并未放弃大模型的研发。
杨红霞发表顶级会议、期刊文章超过100篇,美国和中国专利超过30项,2022年9月初,杨红霞因个人家庭原因从阿里巴巴达摩院离职。
杨红霞 图/阿里云开发者社区
超大规模多模态预训练模型 M6 (
MultiModality-to-MultiModality Multitask Mega-transformer)是杨红霞在阿里期间的突出成就。2021年3月,达摩院发布了国内首个千亿参数多模态大模型M6,引发业界关注。OpenAI前政策主管杰克·克拉克(Jack Clark)曾公开点评道:“这个模型的规模和设计都非常惊人。这看起来像是众多中国的 AI 研究组织逐渐发展壮大的一种表现。”
2021年11月,阿里M6宣布升级至万亿参数,并在全球范围内首次大幅降低了万亿参数超大模型训练能耗,更加符合业界对低碳、高效训练AI大模型的需求。
据悉,通过一系列突破性的技术创新,达摩院团队仅使用480卡V100 32G GPU,即训练出了规模达人类神经元10倍的万亿参数多模态大模型M6,与英伟达、谷歌等海外公司实现万亿参数规模相比,能耗降低超八成、效率提升约11倍。
针对此次升级,杨红霞曾表示,“接下来,M6团队将继续把低碳AI做到极致,推进应用进一步落地,并探索对通用大模型的理论研究。”
有志在人工智能领域有所作为的企业招兵买马之际,另有一批人也一头扎进了这股创业浪潮之中。
前京东集团副总裁、京东集团技术委员会主席周伯文,以及美团联合创始人王慧文和创新工场董事长李开复、原搜狗CEO王小川等人纷纷投身人工智能相关的创新项目。如今,又一位技术大牛也要自己创业了。阿里巴巴集团副总裁贾扬清宣布告别阿里,自己将于近期离职,“计划走向职业生涯的下一个挑战”。据悉,他的创业方向将聚焦于人工智能架构领域。
昨日(3月21日),贾扬清在朋友圈发文正式宣布将离开阿里的消息:
阿里这段旅程,最吸引我的是云计算给社会带来的独特贡献:Al,Big data, Compute,Developer,and Ecosystem。有幸能够带领计算平台事业部,一起建设大数据和AI的平台,建设从技术到产品到解决方案的团队,把大数据和AI业务做到行业领先的位置,为云上的客户创造价值。
白驹过隙,我也计划走向职业生涯的下一个挑战。祝愿团队的兄弟姐妹们再创辉煌,祝愿阿里云能够越走越好。
昨天,我和团队宣布了毕业的消息。3月20号是冬天的最后一天,借用加缪的一句话:每个冬天的句号都是春暖花开。祝福大家一切都好,春暖花开!
贾扬清被称为AI架构领域最强的华人科学家。
贾扬清本科和研究生阶段就读于清华大学自动化专业,后赴加州大学伯克利分校攻读计算机科学博士。他在博士期间就创造了AI领域的世界级成果,开发并开源深度学习框架Caffe,被称为“Caffe之父”。在TensorFlow出现之前,这个框架一直是深度学习领域GitHub star 最多的项目。
后来主流的两大机器学习框架的开发也都有贾扬清的身影。在谷歌大脑(Google Brain)工作期间,贾扬清是TensorFlow的主要开发者之一。后加入Facebook(META)任Facebook AI架构总监,2018年,Facebook正式公布PyTorch 1.0,贾扬清担任PyTorch 1.0项目的共同负责人。这些研究为后来的AlphaGo提供了底层支撑。
2019年3月,贾扬清加盟阿里担任副总裁,引起业界关注和期待。
观察者网了解到,贾扬清领导阿里云智能计算平台事业部,负责大数据以及AI方向的技术、产品和业务。据悉,他团队规模在几百人级别,在杭州、北京和硅谷等地打造阿里的自研大数据和AI平台,并与阿里云销售团队紧密合作。他还参与阿里巴巴达摩院AI和系统方向的技术建设,为阿里巴巴集团各业务线提供AI技术支持。
贾扬清当时的一大任务是将大数据和人工智能两大平台打通,对此贾扬清曾说:“这样的融合很具有前瞻性,阿里是全球少数的几个把大数据和人工智能放在一起的部门。未来大数据和人工智能未来的结合将越来越紧密。”
贾扬清发文中并未明确提到自己的下一步动向,只说“计划走向职业生涯的下一个挑战”。不过有媒体报道,与贾扬清相关的一家新的AI公司正在酝酿当中,瞄准AI架构领域方向,并且已经顺利得到了首轮融资意向。
人工智能技术正加速向通用人工智能前进,ChatGPT的火爆象征着AI正迎来又一个阶段性爆发。
3月21日,阿里达摩院已在AI模型社区“魔搭”ModelScope上线了“文本生成视频大模型”。根据介绍,整体模型参数约17亿,目前只支持英文输入。
今年2月,阿里发布财报后的电话会议上,阿里巴巴集团董事会主席兼CEO、阿里云新一任总裁张勇便谈到,目前云计算和人工智能的结合正处于技术突破和发展的关键时期,生成式AI正在发生颠覆性突破,阿里巴巴将全力构建好自己的AI预训练大模型,并为市场上的模型和应用提供好算力的支撑。
随着近年来的发展,人工智能逐渐褪去了身上的神秘感,距离普罗大众越来越近,真正能潜心发展的大公司与人才的涌入,势必又会加速这一进程。继2016年AlphaGo击败围棋世界冠军李世石后,人工智能领域再一次风起云涌。
本文系观察者网独家稿件,未经授权,不得转载。
0 留言