文章
2024-05-27 10:29:28
每日AI资讯--5月27日
中国电信发布首个支持30种方言混说语音大模型
来源:36氪
近日,中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模型。目前,星辰语音大模型已在福建、江西、广西、北京、内蒙等地的中国电信万号智能客服试点应用。(财联社)
苹果的WWDC可能包括 AI 生成的emoji和OpenAI合作伙伴关系
来源:站长之家
苹果将于 WWDC2024上首次分享自己的人工智能故事,预计推出包括与 OpenAI 的合作伙伴关系在内的基本人工智能功能。据彭博社的马克・古尔曼在 Power On 时事通讯中透露,这些功能可能包括 AI 生成的表情符号和语音备忘录的自动生成转录等。此外,有传言称苹果将允许聊天机器人更深入地整合到其操作系统中,而 OpenAI 似乎将成为首个与苹果合作的公司。此外,苹果还在与谷歌和 Anthropic 就类似合作进行协商。
Suno将推出全新功能 可将任何声音转换为音乐作品
来源:站长之家
即将推出一项全新的功能,可以将任何声音创作成歌曲。这项新功能能够将日常生活中的各种声音转化为音乐,为音乐创作带来了全新的可能性。用户只需敲击出节奏,Suno 会自动捕捉并与之“和弦”,将这些声音转换为音乐作品。首个示例便是将敲击浇水壶的声音转化为迷幻摇滚音乐,展示了这项技术的强大和创意潜力。
日前,音乐 AI 初创公司 Suno 宣布,他们在最新一轮融资中筹集了1.25亿美元,进一步巩固了其在 AI 音乐革命中的先驱地位。这笔巨额投资有望彻底改变音乐的创作、传播和变现方式,而 Suno 将引领这一变革。
AI视频编辑方法ReVideo:可局部修改视频内容和运动轨迹
来源:站长之家
研究人员提出了一种名为 ReVideo 的视频编辑方法,该方法通过指定内容和运动来实现精确的视频编辑。与现有方法不同的是,ReVideo 可以在特定区域进行精确的视频编辑,既可以修改视频内容,也可以修改运动轨迹。
为了实现这种精确的视频编辑,研究人员提出了一个三阶段的训练策略。首先,他们通过修改第一帧来实现内容编辑。然后,他们通过基于轨迹的运动控制来实现运动编辑,这为用户提供了直观的交互体验。最后,他们提出了一个时空自适应融合模块,用于将内容和运动控制集成在各种采样步骤和空间位置上。为了实现这种精确的视频编辑,研究人员提出了一个三阶段的训练策略。首先,他们通过修改第一帧来实现内容编辑。然后,他们通过基于轨迹的运动控制来实现运动编辑,这为用户提供了直观的交互体验。最后,他们提出了一个时空自适应融合模块,用于将内容和运动控制集成在各种采样步骤和空间位置上。
苹果已与OpenAI正式达成协议 iOS18将用上ChatGPT
来源:站长之家
近日,彭博社记者马克・古尔曼(Mark Gurman)透露,苹果公司已经与OpenAI达成了一项重要协议,计划为即将发布的iOS18系统带来一系列前沿的生成式AI功能。这不仅标志着苹果在人工智能领域的又一重大突破,也预示着iOS系统将迎来前所未有的智能化升级。
据悉,苹果公司并不满足于与单一合作伙伴的合作,他们还在与谷歌进行深入的谈判,试图将Gemini作为一种备选的AI解决方案整合到iOS系统中。这种多元化的策略旨在确保苹果在AI领域的领先地位,同时为用户提供更多样化、更个性化的智能体验
ChatGPT等生成式AI,在旅游行业非常受欢迎
来源:站长之家
5月25日,知名国际管理咨询公司Oliver Wyman在官网发布了一份,关于ChatGPT、Gemini等生成式AI在旅游行业的应用调查报告。
Oliver主要对美国和加拿大的2100名消费者进行了调查,查看他们是如何在旅行过程中使用生成式AI以及满意度。
结果显示,41%的人正通过生成式AI获取旅行灵感或行程规划,这一比2023年8月的34%提升了7%,并且82%使用过的生成式AI用户会再次通过它来进行旅游方面的应用
京东健康发布大模型产品“聊愈小宇宙”
来源:阿杰与AI
京东健康发布了基于心理垂类大模型的AI心理陪伴师产品“聊愈小宇宙”。京东健康心理服务中心还推出了基于大模型的多模态辅助诊断工具和数字管理工具,并发布了线上心理健康标准化诊疗路径。京东健康心理服务中心自2023年升级以来,提供“医生+药物+心理咨询”三位一体的多学科诊疗模式,满足不同阶段和场景的用户需求。情绪、压力类心理健康用户可通过心理评估匹配专业心理咨询师进行咨询,抑郁症、双相情感性障碍等精神心理疾病患者则可获得个性化服务。目前,京东健康心理服务中心已有超过6000位精神专科医生和1000多位专业心理咨询师入驻。此次发布的“聊愈小宇宙”基于“京医千询”大模型,具备更符合人类逻辑的思考能力、语言表达能力和共情能力。此外,京东健康推出的多模态辅助诊断工具和“睡眠监测数据处理软件”有助于提升心理咨询和线上诊疗的质量和效率。
元象大模型亮相文博会 展示数字人和元宇宙技术
来源:阿杰与AI
深圳元象信息科技有限公司在文博会粤港澳大湾区文化产业创新展区展示了其最新的大模型技术、文博数字人、元宇宙等解决方案。作为国内领先的AI+3D技术公司,元象利用大模型、元宇宙、VR/AR等前沿科技,为文化、旅游、娱乐等行业注入新动能。元象已服务于QQ音乐、南京报恩寺、虎牙直播等多家龙头客户,提供智能导览、虚拟IP、互动教育等创新用户体验。其大模型是国内最早开源的650亿参数模型之一,并通过国家备案。元象文博数字人可定制外观和风格,用于虚拟导览、智能问答等场景。元象开发的AI小游戏将大模型技术融入互动游戏,提升用户的趣味体验。
分享
0
0
全部评论
加载更多
热门内容