LiblibAI接入阿里大模型,10秒短视频随手生成!
家人们,AI图像创作界的大新闻来啦!LiblibAI这个国内AI图像创作领域的扛把子,最近接入了阿里通义大模型,实力那是蹭蹭往上涨,给咱创作者带来了超给力的新工具。
接入之后,基于万相最新开源模型,LiblibAI推出了文生视频和图生视频功能。你就随便输入点文本提示词,或者上传张图片,10秒短视频立马搞定。不管是做短视频、搞创意展示,还是其他啥场景,视频制作门槛一下子降了好多。
支撑这些新功能的通义万相2.1(Wan2.1)模型可牛了,在Hugging Face和魔搭社区,总下载量突破200万,GitHub上Star数超8.7k,深受开发者和用户喜欢。
除了视频生成,LiblibAI还借助阿里大模型Qwen - turbo打造了提示词优化窗口。它能帮咱优化输入内容,还能把中文提示词自动翻译成英文,让AI创作效率大大提升。
LiblibAI可是国内首家通过国家备案的AI平台,实力杠杠的。现在已经有超2000万创作者,原创模型超10万个。它还构建了完整的生态链,好多知名企业和机构都选它当合作伙伴。过去一年,它还连续完成四轮融资,这次接入阿里大模型,肯定能在AI创作领域继续大放异彩。

别再花冤枉钱!豆包AI网页版免费搞定抖音视频转文案
做自媒体的朋友,是不是都有提取视频文案的需求?效果好点的工具,不是按月收费,就是按提取次数计费,一年下来也是一笔不小的开支。
不过,我发现豆包AI网页版能免费提取文案。只要在豆包网页版输入抖音视频链接,点击提取,几秒钟,完整的视频文案就整理好了,准确率还特别高。
我试了好几个视频,不管是长视频还是短视频,文案都能完整、准确地提取出来,连英文拼写都没错。而且它的识别准确率比剪映识别歌词还高。
有了豆包网页版,咱再也不用花冤枉钱用那些收费的小程序了。这么好用的工具,大家赶紧去试试,能省不少钱呢!

视觉语言AI大突破!伯克利TULIP模型性能超厉害
加州大学伯克利分校的研究团队搞出了个大成果——TULIP模型,这模型在视觉语言预训练方面有了新突破。
以前那些对比学习模型,像CLIP,在处理需要高保真理解的视觉中心任务时,就有点力不从心。但TULIP模型不一样,它集成了生成式数据增强、增强的对比学习以及重构正则化等创新技术,让视觉和语言之间的对齐能力大大提升。
在多个基准测试中,TULIP都取得了最先进的性能,为零样本分类和视觉语言推理树立了新标杆。它能让模型在未经过特定类别训练的情况下准确分类图像,还能更精确地区分细微差别的物体,在多模态推理任务中表现也更出色。
TULIP模型的这些优势,让它在视觉语言AI领域有了很大的发展潜力,以后肯定能给咱带来更多惊喜。

文章百度秒哒全量上线,零代码开发不是梦!
家人们,百度放大招了!国内首个对话式应用开发平台“秒哒”全量上线啦!
这个平台可太牛了,你直接用自然语言描述需求,它就能自动生成具备完整功能的应用代码,零代码开发不再是梦。
去年11月百度世界大会上,秒哒就首次亮相,还提出了“多智能体协同”的创新理念。现在,它不仅有无代码编程的便捷,还融入了多智能体协作及多工具调用的功能。你只需用语音指令,就能轻松构建各种应用程序。
百度创始人李彦宏说,无代码编程技术依托大模型直接生成代码,颠覆了传统编程模式,任何人都能快速上手。多智能体协作功能能智能调度和编排不同的智能体,完成复杂任务。多工具调用功能还能接入多种实用工具。
秒哒的推出,让个人凭借创意就能驱动多个智能体协同作业,创造经济价值。这为广大开发者和用户开辟了一条前所未有的创新之路,大家赶紧去体验体验!

蚂蚁集团发布两款大模型,训练成本大降!
最近,蚂蚁集团的Ling团队在预印版Arxiv平台上发布了技术论文,介绍了他们研发的两款新型大语言模型——百灵轻量版(Ling - Lite)和百灵增强版(Ling - Plus)。
这两款模型可不简单,设计上采用了多项创新,能在低性能硬件上高效训练,大大降低了成本。百灵轻量版参数规模168亿,增强版基座模型参数高达2900亿。它们的性能都达到了行业领先水平,尤其是增强版,在国产GPU低性能设备上训练,表现和高端英伟达芯片模型相当。
以前,MoE模型训练依赖昂贵的高性能GPU,成本高还受芯片短缺限制。蚂蚁集团Ling团队提出了新目标,通过动态参数分配、混合精度调度等创新训练策略,缩短了中断响应时间,优化了模型评估流程,压缩了验证周期。
实验结果显示,采用蚂蚁的优化方法,低规格硬件训练成本大幅降低。这一技术成果要是广泛应用,能为国产大模型提供经济高效的解决方案,减少对英伟达芯片的依赖,推动人工智能发展。

美团砸数十亿搞AI,大模型LongCat超厉害!
家人们,美团最近公布了2024年财报,营收增长挺可观。在业绩发布会上,美团首席执行官王兴透露了美团在AI领域的战略规划。
王兴说,美团过去一年把确保GPU资源供应当首要工作,投入巨额资金搞AI基础设施建设,2025年还要加大投资。
美团在AI领域有三大战略方向:AI at work、AI in products和Building LLM。在AI at work方面,要把AI技术用到员工工作流程和公司运营中,提升工作效率和体验。在AI in products层面,要用AI技术改造升级现有产品和服务,推出全新AI原生产品。同时,完善自研基座模型能力,推动Building LLM战略实施。
值得一提的是,美团已经研发出大模型“Longcat”,在提升员工工作效率方面成效显著。在客服、销售、研发等领域,Longcat都发挥了重要作用。而且,美团在自动配送领域也进展惊人,自动配送车和无人机配送任务完成量可观,还在迪拜和香港开启了新业务。
美团在AI领域的这些布局和成果,未来肯定能带来更多惊喜。

PiT框架超神奇,图像碎片变完整杰作!
家人们,今天给大家介绍一个超酷的图像生成框架——PiT,它就像一个超级厉害的图像魔法师,能把零碎的图像变成完整又惊艳的作品。
PiT是一个基于视觉零件的图像生成框架,你给它随机输入几个图像“部分”,它就能自动“脑补”并生成一个完整、连贯、符合语义和风格的新图像。和很多依赖文字提示生成图像的模型不同,PiT直接用图片碎片做输入。
PiT训练了一个专门模型,能让图片碎片“有意义地拼起来”。它会分析碎片之间的关系,生成合理的新图像。而且,PiT还能控制生成图像的风格,你输入简单草图,它也能理解并生成图像。
PiT背后的技术原理也很厉害,它采用IP - Prior架构,通过一系列操作,在IP + 空间中改进重建、保留语义操作能力,还能进行语义操控和风格化生成。
实验表明,PiT生成效果很棒。无论是设计师寻找灵感,还是普通人想创造独特图像,PiT都能满足需求。大家赶紧去体验这个神奇的PiT框架吧!









