文心一言真实测评来了，超乎预期！

频道：行业资讯日期：2023-03-21 14:28:37 浏览：1269

3月16日，百度召开了文心一言的新闻发布会，作为国内企业自主研发并首先发布的大语言模型，文心一言获得万众瞩目，其中也不乏调侃吐槽，将其与ChatGPT对比。虽然ChatGPT很强，但由于众所周知的原因，ChatGPT国内的应用者并不广泛。少数尝鲜者为其惊叹，但好用是一方面，能不能直接用到才更为关键。

笔者一拿到邀请码就迫不及待尝试起来，相信很多人跟笔者一样，对于它的中文语义识别格外感兴趣，毕竟汉语博大精深，很多毫不相干的词语也可以在汉语浩瀚的语境里产生微妙的联系，也正是这些微妙的联系让人感慨汉语的神奇。那么文心一言到底强不强？笔者给它准备了一场考试，从初级到高级，力求做到全方位的知识拷打。

说到汉语，那么首先绕不开的就是对于成语的理解，其背后的典故和含义一直是构筑汉语文化的基石。笔者选了几个成语与文心一言和ChatGPT对话，看看他们是否能够准确识别并理解成语。

考完这些，笔者发现文心一言的表现远超预期，而ChatGPT则有很多事实错误，一本正经的胡说八道。

接下来，笔者升级难度，增加了一些网络热梗，这些内容不属于固有知识的范畴，不仅要对现有知识懂得衍生和引用，同时一些亚文化也将成为考题重点。

从这里可以看出，除了对于一些固有的基础知识文心一言能够掌握以外，对于汉语中出现的谐音昵称也可以做到精准识别。ChatGPT能够回答，但能感觉到有一种向外地人问本地路的突兀感——能走到那儿去，但多少得走点弯路。

最后，笔者又尝试出了一些开放式命题，这部分不仅仅局限于对于知识的了解，更多的是能够“学以致用”所以考察的重点是文心一言的创造性。

可以看出文心一言的道歉信还略显清纯，但是框架是对的，从承认错误到阐述理由，逻辑清晰，调教后语气用词更是有很大提升，有点意思。

最后，文心一言的多模态生成能力更是ChatGPT不具备的，而且画面质感很好，确实有点惊喜。

一番体验下来，文心一言真是超预期。ChatGPT可能是中文语料训练不足，虽然什么都可以回答，但是答案需要做好甄别，而文心一言对汉语的独特理解能力真的很赞。如果大家没用过，就不要踩它了。百度的一小步，AI的一大步，中国需要文心一言这样的产品，而且除了百度还有谁能跟OpenAI PK？

上一篇：文心一言，一言难尽

下一篇：文心一言只是“ChatPPT”？我们和它深度聊了聊

0 留言

评论

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。