字节StoryMem开源:分镜脚本秒变1分钟连贯视频,解决AI角色变脸问题
近日,字节跳动联合南洋理工大学开源的StoryMem框架,让AI长视频生成更接地气。这个框架靠“视觉记忆”机制,能把单镜头视频模型升级成多镜头叙事工具,输入分镜脚本就能自动生成1分钟以上、镜头切换自然的连贯视频,角色和场景不会出现跳变。
其核心是“记忆到视频”设计,会建一个动态记忆库存关键帧,首镜头生成后,后续镜头都能调用记忆信息,确保一致性。而且不用海量长视频训练,只需轻量微调就行。实验显示,它的跨镜头一致性比现有方法提升29%,还配套了300个多镜头故事提示的基准数据集。
不管是营销广告做动态分镜测试、影视剧组可视化故事板,还是短视频创作,都能用。目前社区已在ComfyUI上做出初步工作流,本地就能运行,门槛更低了。
模型地址: https://github.com/Kevin-thu/StoryMem

千问APP独家冠名B站跨年晚会,AI互动送红包庆新年
12月29日,2025哔哩哔哩跨年晚会官宣,千问APP成为独家总冠名商,AI创作能力将全面融入节目和线上互动。
晚会期间,观众能通过多种AI互动玩法参与节目,千问APP还同步上线“用AI为新年干杯”活动。用户在APP内用视频生成模型,就能制作专属干杯视频,和家人、朋友甚至虚拟历史人物同框送祝福。
活动规则很简单,从现在到2026年1月3日,制作相关AI视频就能领现金红包,最高888元,收集瓜分卡还能参与现金奖池瓜分。这次合作让AI创作工具和大型娱乐活动深度结合,给跨年晚会的互动形式和用户体验带来了新可能,也让普通用户能直观感受到AI的趣味应用。
工具地址:通义千问官网

Windsurf Wave13发布:SWE - 1.5编程模型限时免费,多智能体并行提升效率
知名AI编程工具Windsurf推出Wave13版本,代号“Shipmas”,重点升级了模型能力、多智能体协同和终端体验,进一步巩固了智能体IDE的定位。
新版本默认使用“SWE - 1.5”模型,性能达到专业级别,能处理复杂的代码推理和生成任务。为回馈开发者,未来三个月SWE - 1.5普通版本对所有用户免费开放。
针对多任务协同难题,新增并行智能体支持,通过Git Worktree集成,多个AI智能体可在同一仓库不同工作树并行工作,比如同步做Bug修复、文档编写和测试生成,减少代码冲突,提升大型项目效率。
交互上也有优化,新增并排视图能同时管理多个窗格,推出支持zsh的专用终端测试版,还有上下文窗口指示器实时显示Token使用情况,方便用户掌控对话历史。
详情查看: https://www.aitop100.cn/infomation/details/33020.html

腾讯AI Lab副主任俞栋离职,混元团队新老交替,资源整合谋发展
近日,多个独立信源证实,腾讯AI Lab副主任俞栋因个人发展原因离职。俞栋2017年加入腾讯,曾任杰出科学家、优图实验室首席科学家,离职前负责语音处理、自然语言处理和数字人技术研发,在深度学习和语音识别领域有深厚积累,曾在微软工作近20年,发表300多篇学术文章、获100多项专利。
他带领的混元团队横跨多个部门,专注多模态生成等研究。虽然俞栋离职带来震动,但腾讯正加速新人引入,2025下半年前OpenAI科学家姚顺雨加盟,还吸引了字节、阿里等核心人才。
同时腾讯在技术工程事业群成立AI Infra部、AI Data部等,整合分散的研发资源。腾讯集团总裁刘炽平表示,当前AI基础模型领域无绝对领先者,后续调整将影响腾讯在AI领域的发展轨迹。

OpenAI探索ChatGPT广告模式,免费用户或成收入新来源,2030年目标15亿美元
面对持续的商业化压力,OpenAI官方回应正研究在ChatGPT中引入广告。此前因Gemini用户量激增暂缓推进,如今营收压力凸显,广告战略重回议程。
OpenAI强调,广告设计会以维护用户信任为核心,不插入干扰性广告破坏体验。目前讨论的形式包括优先展示赞助商内容、侧边栏嵌相关广告、商业意图查询时触发广告,以及点击生成链接后展示广告等。
当前OpenAI收入主要来自会员订阅、API调用和企业解决方案,但2025年超100亿美元营收仍亏损,预计2028年运营亏损达740亿美元,亟需新收入。内部测算显示,每位免费用户年贡献约2美元广告收入,若维持数亿免费用户规模,2030年广告收入有望达15亿美元,成为第三大收入支柱。
不过,ChatGPT掌握用户大量私密上下文信息,广告定向精准度可能超谷歌,如何界定敏感内容、实现数据隔离,引发用户和监管担忧。
模型地址:ChatGPT网页版官网(海外网站需要科学上午)

阶跃星辰开源Step-DeepResearch模型:320亿参数,成本仅传统模型1/10
近日,阶跃星辰正式开源深度研究模型Step - DeepResearch,320亿参数的它,深度研究能力接近OpenAI o3 - mini、Gemini2.0Flash等顶级商业模型,部署成本却只有传统模型的十分之一,单次调用成本不到0.5元。
这款模型设计理念独特,把复杂研究任务拆成规划、信息检索、反思、交叉验证等可训练的“原子能力”,实现闭环反思和动态校正,提升了复杂环境自适应能力和泛化性能。
训练流程经过精心设计,涵盖智能体中期训练、监督式微调及强化学习,保障实际应用表现。测试中,它在Scale AI Research Rubrics获61.4%高分,和多款大规模模型相当;ADR - Bench专家评估中,Elo评分显著高于多数竞争对手。
模型采用ReAct范式单智能体架构,内置专有工具集,能高效完成批量网页搜索、文件管理等任务,为研究人员提供便利。
模型地址: https://github.com/stepfun-ai/StepDeepResearch

火山引擎成2026春晚独家AI云合作伙伴,AI技术赋能直播与互动
今日,火山引擎宣布成为2026年中央广播电视总台春晚独家AI云合作伙伴,将深度参与节目制作、线上互动和视频直播,为全球华人带来科技感满满的新春体验。
作为字节跳动旗下云与AI服务平台,火山引擎从2018年就为抖音春晚提供技术支撑,2021年成功保障703亿次红包互动,并发承载能力和稳定性备受认可。
如今,依托领先的大模型和云计算架构,火山引擎已成为中国公有云大模型市场领军者,旗下豆包大模型日均调用量突破63万亿Tokens,服务覆盖汽车、券商、银行、教育等多个行业,支撑数百万企业和开发者。
2026春晚期间,除了保障直播红包互动流畅,火山引擎还将引入虚拟主持人、智能场景生成等技术,让春晚兼具文化底蕴和科技感,推动数字科技与传统文化深度融合。
详情查看: https://www.aitop100.cn/infomation/details/33018.html

想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:










