本报(chinatimes.net.cn)记者卢晓 北京报道
“最近一段时间,很多朋友问我,‘为什么是今天,你们真的ready了吗’。”3月16日,百度CEO李彦宏在发布文心一言时这样说。
当天,李彦宏对外展示了使用文心一言续写小说、推演鸡兔同笼问题,创作海报并生成视频等功能。他同时也坦承,大语言模型还远未到发展完善的阶段,不少场景下细究起来还有明显的bug(错误)。不过他认为,AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。
3月16日午后,百度股价在港股大幅跳水,跌幅接近10%,当日报收于125.1港元,降6.36%。
一场视频演示
看起来文心一言还没有完全做好准备,便被推到了舞台中央接受检阅。
李彦宏当天演示了五个场景的视频Demo,包括文学创作、商业文案创作、数理推算、中文理解、多模态生成。其中,“多模态生成”功能可以生成文本、图片、音频和视频等。不过,李彦宏表示,生成视频功能因为成本比较高,还没有对所有用户开放。
对于百度为何选择播放视频Demo而不是现场演示,有AI业内人士对《华夏时报》记者表示,文心一言直接用产品演示交互效果肯定体验更佳,但它选择视频Demo方式,就意味着产品的实际效果肯定不及视频Demo,甚至说有可能一些能力还不太具备。他认为,百度更大的顾虑是担心“翻车”,而“Demo一般都是安全的。”
百度是在今年2月7日,宣布其类似ChatGPT的项目名字确定为“文心一言”,英文名ERNIE Bot,并将在三月份完成内测,面向公众开放。据记者了解,文心一言项目组由百度CTO王海峰挂帅,集合了百度集团副总裁吴甜、百度技术委员会主席吴华等核心成员。
虽然只给出了一个多月的倒计时,但李彦宏在3月16日的演讲中表示,2019年百度就推出了文心大模型ERNIE 1.0,“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”
不过百度今年2月在这一领域的突然加速度,与ChatGPT自去年年底掀起的持续火热不无关系。瑞银集团的一份报告显示,在ChatGPT推出仅两个月后,它在2023年1月末的月活用户已经突破了1亿,成为史上用户增长速度最快的消费级应用程序。还需要提及的是,就在文心一言对外亮相的前一天,OpenAI公司推出了新一代多模态模型GPT-4。
深度科技研究院院长张孝荣对《华夏时报》记者表示,文心一言目前对标的是GPT-3.5大模型,还达不到GPT-4 生成内容的质量和水准。有观点估算GPT-4的数据量在三四千亿量级,比GPT-3.5多2-3倍。
为何在此时
事实上,李彦宏当天谈及文心一言时也表示,“不能说我们完全ready了,我自己测试感觉还是有很多不完美的地方。”
那为何百度要加速推出这一项目呢?有业内人士在跟记者交流时认为,百度是为了抢到对标ChatGPT的“独一份”来助推资本市场,并获得更多用户训练文心一言大模型。就在百度官宣文心一言名称的2月7日,其在港股盘中出现了166.3港元的52周最高价,最终收于162.5港元,涨15.33%。
ChatGPT对百度所在的搜索战场,以及它背后的互联网广告市场的潜在冲击也不容小觑。
公开资料显示,为应对ChatGPT的冲击,今年2月谷歌对内发布了一份“红色代码”预警,要求旗下用户超10亿的产品尽快接入生成式AI。
互联网广告收入占据大头的百度也面临着这一变局。去年Q4百度核心收入257亿元,同比下降1%。其中,以搜索和百度APP为主的在线营销收入181亿元,虽同比减少6%,但占据百度核心收入的七成。
据悉,文心一言的能力也将全面嵌入到百度现有业务中。李彦宏在3月16日还表示,推出文心一言是因为市场有需求。他认为,对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济。“真正的机会是,基于通用大语言模型,抢先开发重要的应用服务。”
事实上,看起来成本也是文心一言加速推出并全面嵌入百度现有业务的原因之一。
李彦宏当天表示,大模型训练堪称暴力美学,需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。记者看到的一份资料显示,有百度内部人士透露,文心一言的成本中目前算力占50%以上,人力成本有20%出头,数据成本占15- 20%,剩下的是算法成本。该人士还表示,百度50-60%的研发投入和文心大模型相关。
上述AI业内人士也告诉《华夏时报》记者,对于通用性AI模型,算力资源是一个很大的制约,“毕竟是成本问题,不是谁都可以玩的起。”另外,他认为高质量的数据也同样重要。张孝荣还对记者表示,简体中文语料环境相比英文环境更为复杂,社会规范也大不相同,“中文聊天机器人每走一步,可能要付出两倍的力气。”
文心一言的对外亮相,只是一个起点。百度面临的是一场AI耐力赛。
责任编辑:黄兴利 主编:寒丰
0 留言