• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

每日AI资讯-05月22日

每日AI资讯-05月22日
AI TOP100
2025-05-22 18:06:27

商汤元萝卜五合一机器人:京东合作,儿童棋类学习新伙伴

商汤科技旗下的家用机器人品牌“元萝卜 SenseRobot”最近可是火了一把,他们和京东联手推出了元萝卜AI下棋机器人五合一版。这款机器人专为3到12岁的孩子设计,能教孩子下象棋、围棋、国际象棋、国际跳棋和五子棋五种棋类,简直是孩子的棋类启蒙神器。

这款机器人不仅能教棋,还能通过京东的对话智能体和孩子互动,激发他们对人工智能的兴趣。从科学到历史,机器人都能讲得头头是道,还能辅导孩子全科学习,解答各种难题,成了孩子的在线学习好伙伴。

功能上,元萝卜AI下棋机器人也是全面升级,新增了国际跳棋,实现了“一机五用”。还有专业的启蒙课程,让孩子更快掌握棋类技巧。更厉害的是,它还有英语语伴功能,孩子在家就能练口语,和AI对话,学习兴趣和语言能力都提高了。

这次合作可是商汤和京东的深度融合,展现了双方在技术和创新上的实力,也给家庭用户带来了更多AI应用场景。元萝卜表示,未来还会继续技术创新,把更多AI技术引入家庭,让科技给生活带来更多便利和乐趣。

现在,元萝卜AI下棋机器人五合一版在京东独家发售,零售价3299元,预售期间直降300元,到手价只要2999元。想让孩子学棋类、提高学习兴趣的家长们,可别错过了!

京东joy Inside

3DTown:一张照片变3D城市,AI黑科技太牛了!

最近,普林斯顿大学、哥伦比亚大学和Cyberever AI公司联手推出了一款黑科技——3DTown框架,它能仅凭一张俯视图就生成逼真的3D城镇场景,而且还是免训练的,直接就能用!

以前搞3D建模,那可是大公司、大团队才能玩得起的“烧钱游戏”,设备贵、数据多、人工建模累成狗。但现在,3DTown来了,它用“化整为零”的策略,把输入的俯视图分解成重叠的区域,然后对每个区域单独进行3D生成,提升了分辨率和细节,还改善了图像到3D的对齐。

还有更厉害的,3DTown采用了空间感知3D修复技术,能根据输入的图片估算出粗略的3D结构,然后填充缺失的几何结构,保持整体结构的连续性。这样,独立生成的区域就能完美拼接成一个连贯、没有缝隙的整体。

实验结果也证明了3DTown的强大实力,它在几何质量、布局连贯性、纹理保真度等方面都全面碾压了目前最先进的Image-to-3D生成模型。无论是雪镇、沙漠小镇还是荷兰风格小镇,3DTown都能完美驾驭。

虽然3DTown目前还有一些小限制,但这些都是未来可以优化的方向。它的出现,无疑是3D内容生成领域的一个里程碑,为我们打开了从2D到3D快速构建复杂场景的大门。未来,或许我们每个人都能成为3D世界的“创世神”!

3DTown

微软Magentic-UI:网页任务好帮手,智能协作新体验

微软研究院最近开源了一款AI智能体研究原型——Magentic-UI,它专门设计用于解决复杂的网页任务,让用户在网页浏览器上就能实时完成各种任务。

Magentic-UI和那些追求完全自主的AI工具可不一样,它把用户放在了任务执行的核心位置,强调透明性和可控性。用户可以通过计划编辑器或文本反馈直接修改AI的执行计划,在任务开始前就能明确每一步操作。这种协作规划机制让用户能够清晰了解AI的行动意图,避免了传统AI工具“黑箱”操作的不确定性。

而且,Magentic-UI还引入了行为防护功能,敏感操作需经用户明确批准,用户还能自定义审批频率,确保安全性和灵活性。系统采用Docker沙箱技术隔离运行环境,有效防止对主机环境的意外影响,并通过网站白名单机制限制AI的访问范围,进一步提升安全性。

Magentic-UI的核心在于其多智能体架构,由四个专业智能体组成,各自承担特定任务,通过内外双循环机制协同工作,确保高效完成复杂工作流。无论是自动化网页表单填写、深度网站导航还是结合网页数据生成分析图表,Magentic-UI都能轻松搞定。

微软表示,Magentic-UI的设计遵循以人为中心的方法论,通过试点用户反馈不断优化,确保用户体验直观高效。这种开源模式不仅推动了人机协作技术的研究,还为开发者提供了模块化、可扩展的框架,助力构建更智能的AI应用。


谷歌Lyria2:AI音乐生成新突破,实时创作更自由

谷歌DeepMind最近发布了其最新音乐生成模型Lyria2,这可是人工智能在音乐创作领域的又一重大突破。Lyria2以其高保真音质、实时交互功能和多风格适配性,为音乐家、制作人和内容创作者提供了前所未有的创作工具。

Lyria2在音质表现上可是下足了功夫,能够生成48kHz立体声音频,达到专业级水准。无论是古典音乐的优雅旋律,还是电子音乐的动态节奏,Lyria2都能精准捕捉不同乐器和演奏风格的细微差别。音乐家只需通过简单的文本提示,就能生成符合需求的音乐片段,大大降低了创作门槛和成本。

更厉害的是,Lyria2还引入了创新的Lyria RealTime功能,允许用户实时操控音乐的生成过程。创作者可以即时调整音乐风格、节奏、情绪,甚至混合不同流派,创造出独特的音景。这种动态交互特性尤其适合现场演出或快速原型设计,为音乐创作带来前所未有的灵活性。

此外,Lyria2还深度整合到谷歌的Music AI Sandbox工具集中,为音乐家和内容创作者提供了全面的创作支持。从文本或歌词生成全新音乐、延长现有音频片段到转换音乐的情绪或风格,Lyria2都能轻松搞定。

谷歌DeepMind在Lyria2的开发中注重伦理与安全性,采用SynthID数字水印技术确保内容可追溯且不影响聆听体验。目前,Lyria2仅对部分受信任的测试者开放,但未来有望扩展语言和流派覆盖范围,为音乐创作带来更多可能性。

谷歌Lyria2

OpenAI联手Jony Ive,打造AI“伴侣”设备,颠覆智能手机市场

OpenAI最近可是搞了个大动作,他们以65亿美元全股收购了由苹果前首席设计师Jony Ive创立的AI硬件初创公司io,并计划推出一款革命性的AI“伴侣”设备。这款设备旨在成为继MacBook Pro和iPhone之后的“第三核心设备”,完全感知用户环境,融入日常生活。

据OpenAI首席执行官Sam Altman透露,这款设备将超越传统智能手机,提供更直观、自然的交互体验。它可能配备摄像头、麦克风和触控界面,支持实时环境分析和个性化响应,成为用户办公桌上的“第三核心设备”。

io项目的核心在于Jony Ive的设计团队与OpenAI Grok模型的结合。顶级设计加上Grok驱动的多模态AI,让这款设备在外观和智能方面都达到了新的高度。设备内置基于Grok3的多模态AI,支持语音交互、图像识别和上下文推理,响应时间低至50毫秒,确保流畅体验。

OpenAI计划以“比任何公司更快”的速度推出1亿台AI“伴侣”设备,首批产品预计于2026年亮相。这一目标显示了OpenAI对硬件市场的雄心,也直接挑战了苹果和三星在智能手机领域的霸主地位。

虽然1亿台的发货目标面临供应链和生产挑战,但OpenAI与Jony Ive的合作无疑为AI硬件市场带来了新的活力。这款设备能否真正取代智能手机,还需时间来验证,但无疑已经引起了业界的广泛关注。

OpenAI

硅基流动升级推理模型API,长上下文支持更给力

硅基流动(SiliconCloud)最近可是给开发者们带来了个好消息,他们对DeepSeek-R1等推理模型API进行了一次重要升级,支持128K上下文长度,让模型在思考时更加充分,输出内容也更为完整。

这次升级中,多个知名模型如Qwen3、QWQ、GLM-Z1等都支持128K的最大上下文长度,而DeepSeek-R1则支持96K。这一提升为复杂推理任务如代码生成和智能体的应用提供了强有力的支持。

更值得一提的是,硅基流动还引入了独立控制“思维链”和“回复内容”长度的功能。开发者可以根据实际任务的复杂程度,灵活调整模型的思考深度和输出长度。这样的设计让开发者能够更加高效地利用模型的推理能力。

以SiliconCloud平台的Qwen3-14B为例,用户可以通过设置thinking_budget和max_tokens来分别控制模型的最大思维链长度和最大回复长度。在推理过程中,若思考阶段生成的Token数达到thinking_budget,模型会强制停止思维链推理。这样的设计让开发者在处理复杂任务时更加得心应手。

随着硅基流动的不断创新,用户体验将持续提升,更多功能也将相继推出。对于开发者来说,这无疑是个好消息,他们将能够利用更强大的模型API来开发出更加智能的应用。

硅基流动

谷歌SynthID Detector:识别AI生成内容,内容透明度再提升

谷歌最近在其Google I/O活动上宣布了一款新工具——SynthID Detector,旨在帮助用户检查内容是否由其AI工具生成。这款工具可以快速有效地识别使用谷歌AI制作的内容,并突出显示哪些部分更可能带有SynthID水印。

SynthID水印适用于通过谷歌的多个AI模型生成的图像、文本、音频和视频,包括Gemini、Imagen、Lyria和Veo等模型。用户只需上传一张图片、一个音频文件、一段视频或一篇文本,系统将自动扫描这些媒体以寻找SynthID水印。如果检测到水印,系统会突出显示内容中最可能带有水印的特定部分。

目前,谷歌正在将这一工具推向“早期测试者”,并计划逐步向注册候补名单的用户开放。谷歌希望通过专业用户的反馈,进一步优化工具,推动更广泛的内容透明度。

虽然SynthID Detector还在测试阶段,但它的出现无疑为内容识别和版权保护提供了新的手段。当这款工具广泛可用时,用户们将能够更加方便地识别AI生成的内容,保护自己的权益。同时,这也将促使内容创作者更加注重原创性和版权保护,推动整个内容行业的健康发展。

谷歌SynthID Detector

更多AI行业最新资讯新闻信息(ai界最新新闻)请关注AI人工智能网站--AITOP100平台--AI资讯

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 谷歌Gemini
  • ChatGPT
  • 硅基流动
相关资讯
  • 每日AI资讯-2025年09月02日

  • 每日AI资讯-2025年09月01日

  • 每日AI资讯-2025年08月29日

  • 每日AI资讯-2025年08月28日

  • 每日AI资讯-2025年08月27日

热点资讯

谷歌放大招!AI视频工具Google Vids免费开放,普通用户也能玩转专业剪辑

6天前
谷歌放大招!AI视频工具Google Vids免费开放,普通用户也能玩转专业剪辑

Nano Banana AI深度实测教程:Google神秘武器如何重新定义图像编辑标准

8天前
Nano Banana AI深度实测教程:Google神秘武器如何重新定义图像编辑标准

重磅更新!AITOP100平台接入Google Gemini 2.5 Flash Image模型,可免费体验Nano Banana!

4天前
重磅更新!AITOP100平台接入Google Gemini 2.5 Flash Image模型,可免费体验Nano Banana!

Anthropic推出Claude Code网页版,降低使用门槛并与OpenAI Codex形成竞争

6天前
Anthropic推出Claude Code网页版,降低使用门槛并与OpenAI Codex形成竞争

阶跃星辰发布端到端语音大模型Step-Audio2mini:重新定义“听得懂、会思考、能表达”的AI语音交互

2天前
阶跃星辰发布端到端语音大模型Step-Audio2mini:重新定义“听得懂、会思考、能表达”的AI语音交互
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有