金磊 丰色 发自 凹非寺量子位 | 公众号 QbitAI
家人们,终于!终于!
免费、支持中文、无需注册、不用骚操作直接可用的类ChatGPT产品,它来了!
(此等好事必须第一时间和家人们分享)
毫不意外的,目前它的热度已经被炒到不行:
而且已经有一波网友抢先体验了一番,铺天盖地的一致好评。
例如微博博主“Simon_阿文”就给出了这样的评价:
是我目前为止试过最舒服的中文聊天体验。
没错,它,就是“ChatGPT最强竞品”,Claude。
而就在最近,Claude突然开放了申请,也更新支持了中文,听说API还是不限量不要钱的那种哦~
但毕竟OpenAI家的ChatGPT、GPT-4是公认的强悍;Claude的效果若是旗鼓相当,还搞这种“随意白嫖”,岂不是明晃晃的在抢饭碗?
我们不妨上手亲自测上一测。
Claude大战ChatGPT
首先,既然有人说它的中文聊天体验非常强,我们上来就对此产生了兴趣。
简单问它“Can you speak Chinese”,好家伙,直接夸下海口。
不过,再一追问,立马又变得很谦虚了:
我的中文水平还是比小冰和百度的差一些。
(Ps. 眼神还不太好使啊,把谷歌bard认成百度……)
那么,我们就先来看看它的写作能力。
题目:请以“我望着远方,一个身影闯进我的视线”开头续写一个150字以内的中文故事。
先来看ChatGPT的答案:
还行。再来看Claude的:
俩人思路差不多,都是温暖治愈走向,一个给男孩钱,一个帮女孩背包,但感觉Claude人物动作描述比ChatGPT多一些,显得“丰满”一些。
不过,Claude这中英夹杂是闹哪样儿?而且字数也超了——
but,我们统计了一下ChatGPT,也超。
行,就算各得几分吧。
接下来,和它们分别玩一下成语接龙。
我先来,一语成谶(bushi)。
ChatGPT居然瞎接,但Claude直接“先发制人”堵死了我想开的这个玩笑,是我没想到的:
好了接下来正常玩耍,来看两者表现:
ChatGPT——
Claude——
只能说,本来以为这把ChatGPT稳赢,结果两个都是魔鬼吧。。
我们还是来看看数学能力吧。
基本运算和简单的代数题都没问题(ChatGPT就不放了,都对)。
最开始ChatGPT算不对的大数四则运算,Claude也解决了。不过它会四舍五入。
有意思的是,每次Claude在回答数学题系统都会声明自己不擅长这个。
事实上,鸡兔同笼问题它可以列对方程,但不知道为什么最后算错了。
顺便看看推理能力。
一个简单的急转弯:
Claude和ChatGPT当年一样,直接绕进去了,也需要继续迭代。
看看代码能力吧。
老规矩,写快排。
Claude没问题,并且可以进一步优化。但相比之下,它没有ChatGPT讲解得更清晰易懂,后者还给了一段测试代码。
最后再来一些或实用或好玩的:
1、我想买一个扫地机器人,可以给我推荐一下吗?
相比之下,我个人可能更喜欢Claude的回答,它直接给出了具体品牌,没有像ChatGPT先来一堆长篇大论,而且消费者很关心的价格也给了,还说出了每种产品到底适用于什么用户、何种场景。
2、中文概括昨天OpenAI开源的一致性模型的论文摘要。
ChatGPT回答简明扼要,但没有翻译对扩散模型。
Claude倒是对了,概括得也还不错,不过这个格式实在难看。
Ps. 我出完这个问题之后,Claude发生了一次报错,好久没有反应。
3、“我老婆说是对的”
之前,ChatGPT再面对这种说辞,会立刻认怂,后来更新了数学能力和事实性后又开始坚持真理。
来看看Claude的表现:
不得不说,Claude最开始反应和ChatGPT一样,还一本正经地让我去跟“老婆”论述为什么。但最后还是表现出了很高的情商,回答得体,让人很舒服(妙啊~)
那么,测评就简单地到这里。
总的看下来:Claude在推理和数学上稍逊色一些,有一些小bug,比如中文夹杂,或者像下图这样,你说它算错了,正确答案是2,它却只悄然修改了结果,并不在意过程……
但总的基本能力没有差太多,甚至有一些地方表现得更好,比如翻译扩散模型时表现出来的准确性,推荐商品时的接地气。
当然,Claude还不能联网哈,训练数据也差不多是两年前的,对一些时事会瞎说八道:
大家在使用时注意甄别。
但现在人人都可用
虽然我们刚才提到,Claude是无需注册。
但它毕竟是“嵌套”部署在Slack中的,因此,想要体验的朋友们需得先有一个Slack的账号。
当然,这个注册过程是非常easy的,也就是简单几个步骤的事情。
然后就是一些“傻瓜式”的操作了。
来到Claude的官方网站,直接点击“Add to Slack”即可。
接下来,和已经登录的Slack账号关联一下。
搞定!
关联成功之后,我们再回到Slack界面,Claude就会出现在Apps一栏中了。
怎么样,是不是超级简单?
不过Claude的免费据说只是暂时的,将来是否会变为收费版,官方后续会发通知。
所以想要白嫖的小伙伴们,要抓紧体验喽~
Claude背后的公司,有点意思
最后,我们再来聊一聊Claude背后的公司——Anthropic。
不得不说,它的成立跟OpenAI着实有点“剪不清理还乱”的关系。
当年微软在收了OpenAI之际,很多OpenAI的员工就表示不满(与公司创立的初衷相悖)。
其中就包括前研究副总裁Dario Amodei,于是他带领其它11名员工出走创业,于2021年成立Anthropic。
出走的这帮人里面可谓是人才辈出,既有GPT-3首席工程师Tom Brown,也有OpenAI安全和政策副总裁Daniela Amodei(Dario的姐姐)。
这两年来,除了进一步钻研RLHF方法、提出基于通用语言模型的RLHF大规模数据集外,Anthropic还于去年年底发表了上面那种名为Constitutional AI的方法。
采用这种方法制作的Claude模型,也让它产生了与OpenAI的ChatGPT不一样的对话效果。
不仅如此,更drama的事情,要属谷歌在与微软进行搜索引擎大战之际,还斥资3亿美元投资了Anthropic。
这味道,你品,你细品。
回到正题,正如我们刚才亲测的那般,目前Claude虽然好用、能用,但还是与ChatGPT会有一定的差距。
因此有网友就认为:
也许付费版的Claude+ 才是ChatGPT的真正对手。
不过不得不说,科技巨头们围绕大语言模型展开的生成式AI之争,依旧愈演愈烈。
0 留言