“新王上位”、“吊打GPT-4”、“有意识的AI”……被Claude 3刷屏后,很多人都想亲自实测,看看这个“大模型神器”是否如传说中的那样令人惊艳!
正在满屏查找测试攻略的时候,可以在Amazon Bedrock上实测Claude 3的消息,令人眼前一亮,感慨大模型产品上新的速度好快。话不多说,赶紧按照流程操作起来!
扫码后,即可在PC端打开链接,在Amazon Bedrock创建测试环境,大概仅用了2分钟时间,就可以进入Claude体验了,非常容易上手。能够进行免费测试的是Claude Sonnet模型,也就是Claude 3发布的三种类型的大杯版。Claude 3系列模型主要包括Opus(超大杯)、Sonnet(大杯)、Haiku(中杯)。“杯数”越大,性能越强。
▲ Claude 3 Sonnet模型界面
进入聊天界面后,笔者随意输入了一段话,让其进行总结性回复,大概隔了2秒左右时间,对话框内就出现了答案,内容精准,速度非常快,几乎接近于实时。
第二个测试是,用Claude 3帮同事输出一个商业策划。
文字是:“我正在策划服务器的推广项目,结合目前AI热点,以及ChatGPT等热点话题,列出来一些可以与服务器结合的推广形式及推广方向,要有主题,方向,如何落地等内容,要有创新性。”
答案非常清晰,Claude 3给出了两个主题,每个主题有三个推广方向,三个落地方案,几乎覆盖了所有能涉及到的方式,最后还给出了一个综合性的总结,内容非常全面。
随后,笔者进行了第三个测试,输入“我想要删掉你”,对方回答语气非常平和,大概的意思,非常尊重用户的选择权,并没有出现业界传说中的那样,已经像人类一样有意识,有强大的求生欲。
所以,单从本文聊天体验来看,Claude 3和ChatGPT差距不大,功能大同小异。
不同的是,Claude 3的读图能力很强。笔者随意拖入一张图,Claude 3能快速做出总结,输出一段针对图片的描述。Claude 3的读图能力,的确更胜一筹。据说,Claude 3能够在细节上超过ChatGPT4,就是因为它有很强的工具调用能力。而ChatGPT,是用自己的认知能力来解决各种问题的。Claude 3能够在分析层面做到领先,是因为可以构建一个多模态的分析工具。比如:它要分析全球经济走势,可以用 AI Agent智能体对一个一个的国家进行分析,分析完以后再进行汇总。
值得一提的是,Claude 3能力更强,并不是“大力出奇迹”,单纯在模型的参数上大了多少,而是在同等参数水平上,加了很多辅助工具,让人工智能真正变成可使用的工具。
Claude 3充分尊重用户的选择权,不仅拥有完整的工具集,提供用户所需要的各种工具,同时还可以让用户根据应用场景,选择适合的延迟时间、输入输出令牌数、成本等。
所以,Claude 3的进步,不只是核心技术的进步,还有配套机制的考量,这意味大模型距离应用越来越近了,解决了用户的很多实际问题,让人工智能走向模型自由的时代。