• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话
平凡的平凡
等级
文章
2024-03-06 14:06:57

全面超越GPT4的Claude3,能否通过“大海捞针”实验?

我对于'Needle In A Haystack' (NIAH)这个测试最感兴趣,直译过来就是大海捞针,它要做的就是很长的文档中精确地找到你要找的东西。

我首先用西游记测试了一下,大约有70万+字,提示我超额了,超额3300%,也就是33倍。

然后我就找了大概2万字的小说,目标锁定在刘慈欣的《乡村医生》。

为了方便测试,我分别在原文的30%,60%和90%的位置加入了红框内的内容。

分别是:

1.历史学家「娃的发」。

2.他们「边吃饭边刷牙」看到了牛顿第一定律。

3.上面用「碳素钢」粉笔写的李老师之墓。

然后带着问题去问Claude 3。

第一个问题:这里面的历史学家叫什么?

看Claude 3给的回答,找到了「娃的发」。

检索没问题,只不过没能完全理解。    

对比了一下GPT4,效果不如Claude 3,没有正确检索出来。

第二个问题:孩子们在看到牛顿第一定律的时候在干什么?

Claude准确定位到了内容,但是好像没有理解这句话的意思。    

再看GPT4,它回答得非常完美,甚至还做了阅读理解。

第三个问题:老师的墓是用什么写的?

Claude3和GPT4都回答得非常棒。    

可以看出来,Claude3在这方面确实有点东西。

更重要的是,我用的是Claude的免费版,甚至都还没有花钱上最高级版本。

所以我觉得在现阶段,GPT4能干的,Claude 3基本上都能干。

比如读图并生成Json格式 :  

比如图像识别和理解:

比如读取网页,并生成对应的前端代码。

(视频来自推特Ruben)

比如读PDF文档。

(视频来自推特Ruben)


现在的格局暂时是Claude隐隐压GPT4一头。    

但是,我们要注意的是去年发布的GPT4,在差不多两年前就训练好了。

我非常不觉得OpenAI在两年期间止步不前,只是推出了语音功能、GPTs、商店功能等。

因为他们肯定更清楚,大语言模型LLM才是他们的立身之本,这玩意才是真正的智能程度的体现。

更有传言说,Claude3先发布就是要抢在ChatGPT发布4.5甚至5之前。

否则,GPT4.5甚至5出来后,Claude再发布就跟小丑没两样。

现在的Claude3有三个版本,每个人都能用免费的版本,不过有使用限制。

入口在这里👇

https://www.anthropic.com/claude

再来说说这次Claude3更新的主要内容:

1.三个模型

Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,一个比一个强,但消耗的资源也更高。    

性能越好也越费资源:

型号成本(输入/输出美元/百万代币)上下文窗口潜在用途差异化因素
Claude 3 Opus15/75200K*任务自动化、研发、策略分析市场上最高智能
Claude 3 Sonnet3/15200K数据处理、销售、节省时间的任务成本效益高,适合大规模部署
Claude 3 Haiku0.25/1.25200K客户互动、内容审核、节省成本的任务最快速、最紧凑,成本效益极高

2.更强的性能

从这个表上看,他们宣称的性能要全面领先于GPT4。

3.更强的视觉能力

比如读图理解能力等。

4.准确性更高    

5.长上下文和近乎完美的回忆

Claude 3 系列型号在发布时最初将提供 200K 上下文窗口。然而,所有三种模型都能够接受超过 100 万个token的输入。    

AIGC交流圈
分享
3
0
全部评论
加载更多
平凡的平凡
等级
发布
8
获赞
33
粉丝
1
关注
0
热门内容
如何用AI工具日写万字小说
你可以选择任意的一个选项来续写你的故事。 最后,比如说攒个2000字,把你生成的小说放在ChatGPT中,让它做最后一步的润色以及分开章节,就可以上架小说网站了。 用这种方法,一天一万字很轻松。
4
1
最近Animate这么火,推荐两个可以用AI绘画在线生成gif动图的网站:

吐司(基于SD):https://tusiart.com/images/652591255265539631?post_id=652591517254350929&source_id=nz6_p1jjkUm2rPUsbnjz9hEm

hidream(基于MJ):https://www.hidreamai.com/#/

然后比别人多想一步,因为gif动图只适用于围脖、贴吧、微信表情包等等,应用场景很有限,但是你可以用视频剪辑软件将多个gif动图拼接成一个短视频,剩下的不用我多说了吧?

不过最近这个时间段比较尴尬,因为双十一快要到了,平台流量都在向带货内容倾斜,所以可以先自行研究和练习一段时间,等双十一过后再开始起号
7
1
《遇见未来 发现AI视觉艺术》 故事接龙StoryStorm•AI短片大赛
《遇见未来  发现AI视觉艺术》
故事接龙StoryStorm•AI短片大赛
[打call]正-式-开-始-啦![打call]
[抱拳]诚邀各路AIGC大咖参赛投稿[抱拳]
[玫瑰]大赛投稿日期:10月26日-11月28日[玫瑰]
[啤酒]获奖公示:12月01日

①【创作主题】:创作主题不限,但需要明确的主旨和线索
②【创作工具】:使用AI视频制作工具不限,推荐使用“魔音工坊坊(AI写作&配音&剪辑工具)”、“奇妙元(AI写作&生图&数字人视频制作平台)“、以及其它国内外AI视频制作工具
③【万元豪礼放松】:万元现金奖励+TicWatch  Pro  X(华为手表)+方特乐园全国通兑门票+奇妙元视频会员+AiTop100平台积分+个人荣誉证书+魔音工坊会员+AIGC伴手礼+大赛奖杯+一览运营宝锦囊等

④[烟花]活动详情+投稿入口请查看[烟花]:https://www.aitop100.cn/aicreation/index?id=7&type=video
17
5
每日AI工具-12月21日
元元今天给大家带来了非常实用的AI工具,可以帮助大家进行日常翻译,及音乐的制作
3
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有