每日AI资讯-05月09日-AITOP100,AI资讯

字节跳动开源“神器”DeerFlow，AI研究效率飙升！

嘿，各位AI圈的小伙伴们，有个大新闻！字节跳动最近可是搞了个大动作，他们开源了一个超厉害的深度研究框架——DeerFlow。这玩意儿一出来，AI研究领域可就炸锅了，大家都纷纷围观。

DeerFlow是基于LangChain和LangGraph框架搭建的，就像是个智能研究小助手。它把语言模型和网络搜索、爬虫、Python代码执行这些工具都整合到了一起，让自动化研究和内容创作变得轻轻松松。

这DeerFlow的核心功能可不少，它强调“人在回路”的理念，就是说研究过程中用户可以随时插手调整。比如它的动态任务迭代功能，能根据研究需求自动生成和优化任务计划，让研究过程又快又灵活。还有多工具集成，网络搜索、学术资源检索、爬虫、Python代码执行，样样都行，科研工作者们搜集和分析文献可就方便多了。更厉害的是，它还能生成深度研究报告、播客脚本、PPT这些多样化内容，满足各种场景需求。

开发者们反馈说，DeerFlow的Arxiv搜索功能特别好用，能快速找到高质量的学术资源，给科研人员省了不少时间。而且它的人机协作设计也很贴心，用户可以在AI生成初步结果后进行精细化调整，确保输出符合预期。

字节跳动这次开源DeerFlow，可是展现了他们在AI领域的开放态度和技术自信。他们希望通过社区驱动的开发模式，让全球开发者一起参与优化和扩展这个框架，让它的应用场景更加丰富。不得不说，这一开源项目不仅展示了字节跳动的技术实力，也给全球AI研究者提供了一个高效、灵活的工具平台。

OpenAI o4-mini上线，AI定制化时代来啦！

嘿，朋友们，AI领域又出大新闻了！5月8号，OpenAI的o4-mini带着强化微调技术正式亮相，这可是要彻底改变AI专业化的成本结构和技术门槛啊！

强化微调技术是这次发布的重头戏，它标志着OpenAI在定制化模型领域取得了重大突破。跟传统的监督式微调不一样，强化微调技术（RFT）是基于强化学习算法的，通过奖励驱动的训练循环来优化模型表现。开发者不用再提供固定的目标输出，而是用评分器来评估模型回答质量，引导AI学习复杂任务的推理模式。

最让人惊喜的是，RFT只需要几十个示例数据就能把o4-mini变成特定领域的专家模型。比如说，通过简单的微调过程，o4-mini就能变成一个能精准处理合同分析和法规解读的法律专家系统。技术社区的评价显示，RFT在思维链推理和任务评分方面表现特别突出，给AI定制化应用开辟了新路径。

o4-mini本身也是个轻量级的推理模型，结合RFT后性能和成本平衡得特别好。它在编程、数学和视觉任务等领域都表现出色，还支持图像理解和多种工具调用能力。RFT的引入还进一步强化了模型的指令遵循能力，让它能更精准地适应复杂专业领域的需求。

强化微调技术的推出给好多行业都带来了转型的机会。在法律领域，o4-mini能快速分析法律文件并提供专业建议；在医疗领域，它能辅助临床诊断和整理研究文献；在金融领域，它能优化风险评估模型和市场分析工具。

不过呢，技术社区也指出，RFT的计算成本，特别是在训练初期阶段，可能会限制它在资源受限环境中的广泛应用。未来如何优化训练效率、降低计算资源消耗，就成了这一技术进一步普及的关键因素。

OpenAI o4-mini上线

扣子空间开放测试，AI协作新体验来啦！

嘿，各位小伙伴们，有个好消息要告诉大家！扣子空间（Coze Space）正式开放测试啦，而且不用邀请码，直接登录官网就能用。这创新的AI协作平台，自测试启动以来，内测用户已经搞出了好多优质案例，展示了它在不同领域的应用潜力。

扣子空间可不只是个通用的AI助手，它还上线了三个专家Agent，分别是用户研究专家、华泰A股观察助手和舆情分析专家。用户研究专家能帮你做调研问卷的深度分析、访谈提纲的生成以及用研报告的分析。华泰A股观察助手能给你提供每日股票早报定制、个股基本面和技术面分析。舆情分析专家则专注于舆情日报、热点事件总结以及竞品对比分析。

这扣子空间的开发团队也是挺用心的，他们说会继续优化平台功能，提升用户体验，还欢迎更多用户来参与测试和反馈。有了这扣子空间，不同行业的用户都能找到适合自己的AI助手，工作起来肯定更高效。

比如说，你要是做市场调研的，有了用户研究专家这个Agent，就能更轻松地分析调研数据，生成专业的用研报告。要是你对股市感兴趣，华泰A股观察助手就能给你提供最新的股票信息和专业的分析建议。要是你从事公关或者媒体行业，舆情分析专家就能帮你及时了解舆情动态，总结热点事件，还能对比竞品情况。

扣子空间的开放测试，无疑给AI协作领域带来了新的活力。它不仅提供了实用的专家Agent，还注重用户体验和功能优化。相信在未来，扣子空间会不断完善和发展，为更多用户带来便捷和高效的AI协作体验。大家不妨去官网试试，说不定会有意想不到的收获呢！

扣子空间

阿里ZeroSearch技术：AI告别“外包助手”，自给自足新时代！

嘿，朋友们，你们能想象AI不再依赖谷歌搜索、Bing搜索这些“外包助手”，而是自带“搜索引擎大脑”自我检索、自我学习吗？听起来是不是挺科幻的？但阿里真的做到了！

以前训练一个需要频繁搜索外部信息的大语言模型（LLM），那费用可高了去了，光是搜索费用就能让初创公司吃不消。每一条搜索请求都在烧钱，有时候得调用几十万次，最后账单都能把程序员吓跑。

于是，阿里巴巴的研究团队就做了个大胆的决定：不用搜索引擎了！他们打造了一种名为ZeroSearch的新型强化学习训练框架。这框架的核心思路就是让LLM自己假装是搜索引擎，自己生成“相关”和“无关”的文档来学习。听起来挺奇怪的，但效果却惊人！不仅省下了88%的训练成本，训练出的模型性能还超过了用真实搜索引擎训练的模型。

这ZeroSearch的核心秘密在于，大语言模型在大规模预训练的时候，已经吞下了互联网上的海量文本，也就是说它脑海里已经有一个“世界知识图谱”了。只是以前没人告诉它怎么用这个图谱来检索。ZeroSearch所做的，就是通过一点点“监督微调”，教它如何根据问题“模拟”出一批可能相关的文档，然后自己再判断哪些靠谱、哪些不靠谱。

这技术一出来，那好处可多了去了。彻底消除了搜索API成本，训练过程更可控，性能还更强。实验证明，在多个问答数据集上，ZeroSearch训练出的模型性能已经超过使用真实搜索引擎训练的模型。这意味着什么呢？意味着AI不再是“有钱人的游戏”，小型团队也可以自己训练高水平的AI模型，门槛被极大地拉低了。

不过呢，ZeroSearch也不是完美无缺的。模拟搜索引擎的LLM依然需要GPU支撑，得花点钱租服务器。但和动辄几千美元的API费用比起来，这已经算是白菜价了。

阿里ZeroSearch技术

腾讯混元开源HunyuanCustom：视频音频同步，深度伪造新突破！

嘿，朋友们，腾讯混元又搞了个大动作！他们开源了一个一致性视频生成工具——HunyuanCustom。这玩意儿可厉害了，不仅能生成生动的视频内容，还能实现音频与口型的同步，这可是深度伪造视频领域的一次重要进步啊！

HunyuanCustom的最大亮点就是用户只需提供一张图像，就能创造出深度伪造风格的视频。以前视频制作可麻烦了，得准备好多张图片当参考，现在好了，一张图片就搞定，大大简化了视频制作流程。而且这模型可不只是能生成简单视频，它还能处理多种场景，像单一角色的模拟和虚拟试穿这些都不在话下。以后游戏开发、虚拟试衣这些领域可有新玩法了。

再说说这音频同步功能，HunyuanCustom用了复杂的LatentSync系统，让音频和口型精准同步。这样一来，视频里的角色说话时，嘴部动作和发出的声音就完美匹配了，观众的沉浸感和真实性一下子就提升了。虽然目前还没英文示例，但已有的展示效果看着挺不错的，以后说不定在更多语言里都能用。

还有这视频编辑功能，也是相当强大。通过视频到视频（V2V）编辑，用户能智能地替换现有视频里的部分内容，一张参考图像就搞定了。演示里能看到，系统用遮罩技术，只对目标对象进行替换，周围环境都不受影响，整合效果特别好。这功能一出来，创作者们可有更多创意空间了，视频编辑过程也变得更简便高效。

腾讯这次开源HunyuanCustom，给深度伪造技术的应用开辟了新视野。虽然有些地方还有提升空间，但它的独特功能和应用潜力肯定能推动视频制作的创新。以后啊，咱们在创意产业里说不定能看到更多精彩作品，就等着瞧好吧！

ICEdit重大更新：LoRA尺度修改，AI图像编辑精细控制来啦！

嘿，各位搞图像编辑的小伙伴们，有个好消息要告诉你们！备受瞩目的AI图像编辑工具ICEdit迎来重大更新了，它的Hugging Face演示空间正式上线了LoRA尺度修改功能。这功能可不得了，能让全球创作者对图像编辑强度和效果进行灵活掌控，创作自由度大大提升。

ICEdit的核心魅力就在于它高效的指令式编辑能力。它基于Flux.1扩散模型，结合LoRA（Low-Rank Adaptation）低秩适应技术，只需要调用原始模型0.1%的训练数据和1%的参数，就能实现高质量的图像编辑。用户只要输入简单的自然语言指令，像“把她的头发改成深绿色，衣服改成格子图案”，就能轻松得到个性化图像。

这ICEdit在人物ID保持和指令遵循方面表现特别优异，甚至超过了GPT-4o等商业模型。而且它对硬件要求也不高，4GB显存就能流畅运行，普通用户也能轻松体验AI图像编辑的魅力。社交媒体上，用户对ICEdit的9秒快速处理能力和精准编辑效果赞不绝口，尤其是它能在保持原始图像质量的同时实现复杂编辑指令，太让人惊喜了。

ICEdit的技术亮点也不少。它采用上下文生成（In-Context Generation）框架，结合大型扩散变换器和视觉语言模型（VLM），通过自然语言指令就能精准图像编辑。新上线的LoRA尺度修改功能更是锦上添花，用户通过简单调节权重参数，就能精确控制编辑效果的强度与风格，创意表达的空间更大了。

ICEdit的开源代码库已经迅速积累了800个Star，Hugging Face演示空间在周榜和总榜都跃升至第二位，仅次于Qwen3，平台上同时运行的进程高达12个，用户活跃度和使用黏性都很高。而且它还支持ComfyUI工作流，用户可以通过社区提供的nunchaku插件在低显存设备上流畅运行，工具的可访问性大大提升。

ICEdit这次更新，在AI图像编辑领域可是引起了不小的轰动。它不仅提升了图像编辑的精准度和效率，还降低了使用门槛，让更多人能参与到AI图像编辑中来。相信在未来，ICEdit会不断创新，给创作者们带来更多惊喜。

ICEdit

夸克Quark“深度搜索Pro”即将上线，专业领域难题迎刃而解！

嘿，朋友们，在信息爆炸的时代，咱们在专业领域里遇到复杂任务时，常常觉得找资料、分析问题特别费劲。不过，好消息来啦！夸克Quark升级了AI超级框，全新发布了“深度搜索”产品，而且马上还要推出“深度搜索Pro”，这能力据说能比肩全球顶尖的DeepResearch产品呢！

现在国外的DeepResearch产品大多都是付费订阅的，国内也几乎没有同类产品，好多用户都没办法享受到AI带来的效率提升。但夸克Quark就不一样了，他们即将推出的“深度搜索Pro”，通过“思考、搜索、验证、再思考”的产品设计，拥有更强大的分析能力、搜索策略和权威数据。它能把多次搜索结果整合起来，几分钟内就能提供完整专业的解决方案和专家级研究报告。

“深度搜索Pro”在学术、商业、科学、人文、法律、计算机、医学等多个领域都达到了专家级水平。比如说在学术领域，它能帮你快速找到相关的学术资料，还能进行深入分析；在商业领域，它能帮你分析市场趋势，制定营销策略；在法律领域，它能帮你解读法律法规，分析案例。

夸克的“深度搜索”能回答生活中的复杂问题，而“深度搜索Pro”则能更好地解决复杂任务。这两款产品在不同的场景中，都能提供更强的自主思考、智能检索和精准回答能力，就像24小时待命的AI全能助手一样，能帮咱们更好地解决各类实际问题。

以后咱们在专业领域里遇到难题，就不用再愁眉苦脸地到处找资料、分析数据了。有了夸克的“深度搜索Pro”，咱们就能更高效地获取信息、解决问题，把更多的时间和精力放在更有价值的事情上。让我们一起期待“深度搜索Pro”的正式上线吧！

夸克Quark

更多AI行业最新资讯新闻信息（ai界最新新闻）请关注AI 人工智能网站--AITOP100平台--AI资讯