北京市发布“人工智能+”行动计划
来源:36氪
36氪获悉,据北京发布官微,《北京市推动“人工智能+”行动计划(2024—2025年)》正式发布。北京将依托首都优势行业资源和科技研发能力,围绕机器人、教育、医疗、文化、交通等五大领域,组织实施一批综合型、标杆性工程,形成大模型行业应用新生态。
苹果即将推出的AI功能将晚于iOS 18的首次发布推出
来源:36氪
苹果公司即将推出的人工智能功能将晚于预期,错过即将推出的iPhone和iPad软件更新的初步发布,但给了该公司更多时间来修复漏洞。据知情人士透露,作为10月前软件更新的一部分,苹果公司原本计划开始向客户推出Apple Intelligence。苹果公司计划在十月将Apple Intelligence作为软件更新的一部分向用户推出。知情人士表示,这意味着AI功能将在原定于9月发布的iOS 18和iPadOS 18发布后几周推出。(新浪财经)
“Haivivi”发布首款基于AIGC技术的对话互动式玩具
来源:36氪
36氪获悉,AI玩具公司“Haivivi”推出首款基于AIGC技术的对话互动式玩具BubblePal。BubblePal提供了百科知识问答、趣味游戏、共创故事、多语言交流等服务,可以通过自主创建的方式自定义专属玩偶人设。目前BubblePal已在天猫、微信商城、小红书、抖音等平台的Haivivi官方渠道开启预售,首发价399元。
Google Gemini重大更新 Gemini 1.5 Flash可免费使用
来源:站长之家
Google 近日宣布了其 AI 助手 Gemini 的一系列重大更新,旨在提高用户体验并扩大其应用范围。此次更新涵盖了性能提升、新功能引入以及用户群体的扩展。
更新的核心是引入了 Gemini1.5Flash,这是对免费版 Gemini 的一次全面升级。1.5Flash 版本在响应速度、推理能力和图像理解方面都有显著提升。特别值得注意的是,Gemini 的上下文窗口从之前的8K 扩展到了32K 令牌,这意味着用户可以进行更长时间、更复杂的对话,而无需额外付费。
确认!ChatGPT高级语音模式将于下周对ChatGPT Plus订阅用户开放
来源:站长之家
OpenAI 的旗舰模型 GPT-4o("o" 代表 "omni")在五月份发布时,其音频理解能力备受瞩目。GPT-4o 模型能够以平均320毫秒的速度回应音频输入,这与人类在典型对话中的反应时间相似。
OpenAI 还宣布,ChatGPT 的语音模式功能将利用 GPT-4o 模型的音频能力,为用户提供无缝的语音对话体验。
关于 GPT-4o 的语音能力,OpenAI 团队写道:
"通过 GPT-4o,我们训练了一个全新的模型,将文本、视觉和音频三种模态进行端到端的训练,也就是说,所有的输入和都由同一个神经网络处理。由于 GPT-4o 我们首个结合所有这些模态的模型,我们仍然只是初步探索了模型的潜力和限制。"
AI涌入巴黎奥运,颠覆观赛的黑科技大起底
来源:站长之家
两届奥运会,世事大变迁,但「技术」始终是主角——1924年,巴黎举办第八届夏季奥运会。这届奥运会首次应用广播直播,极大扩大了赛事的观众范围。2024年,收音机已是“时代的眼泪”,但我们又在见证:技术变革如何让经典体育盛会焕发新活力。
早在开幕式前,社交媒体就在流传各种“AI唤醒奥运历史名场面”的视频;沙滩排球、网球和橄榄球等赛事应用的AI技术增强转播技术,能将精彩画面变成慢动作定格回放,宛如《黑客帝国》中出现的“子弹时间”;“芯片足球”也被用到了比赛中,辅助判断运动员是否有手球、越位等行为。
咪咕视频的“AI智能解说”会在足球比赛中为用户精准解读赛场风云。利用“AI球星点亮”功能,用户还可在足球、篮球比赛中一键追踪赛场运动员动态,以“人”为线索准确理解比赛走向。如果用户想听到更熟悉有趣的解说语音,“AI明星分声”即可带来明星现场解说般的体验。
除了AI解说,看过咪咕直播的观众,肯定会对“咪咕的解说员实时分析赛况”印象深刻。在技术上,这是个颇有挑战的过程(咪咕收到前方直播流后,在演播室制作自制解说直播流,再将信号传输给屏幕前的观众,在这个过程中平台需尽力降低时延,确保观众体验)。观众之所以体验到“丝滑解说”直播体验,咪咕“瞬至视界 低时延直播”技术的支撑是关键。
在“AI视频增强”技术的加持下,通过AVS3编码能力和HDR Vivid技术,咪咕呈现的奥运画面真实且沉浸,用户可以捕捉运动员的微表情变化,感知比赛氛围起伏;利用“AIGC内容生产”,咪咕会智能检测捕捉赛事精彩片段,生产AI竖屏战报或是带有运动员及球体残影轨迹的AI智能封面短视频。用户即使没有紧密跟进赛事,也不会错过比赛的精彩细节和高光时刻。
华为Pura 70 Pro发布鸿蒙OS 4.2 172版更新:支持AI扩图 一键拯救废片!
来源:站长之家
日前,华为Pura 70 Pro推送鸿蒙OS 4.2.0.172(SP2C00E170R4P7)版本更新,新增AI扩图功能。
更新后,图库的AI修图新增AI扩图功能,可基于AI构图算法与图像生成式技术,理解图片内容的细节和结构,分析推荐合适的扩图区域与扩图比例。
并根据这些信息预测和生成缺失的部分,智能填补图像中的空白区域,将照片进行扩展延伸,呈现出更大的画面范围和更广阔的视野。
简单来说,华为AI扩图功能主要是用来美化图片,拯救废片,如将构图不合理的图片进行扩图美化。
智谱 AI 推出视频生成模型CogVideoX
来源:ITSoul
智谱 AI 宣布对视频生成模型全新升级,推出新一代产品 CogVideoX,已在智谱清言多端上线,C 端用户可免费体验。CogVideoX 具有降低训练成本和难度、增强可控性、创新融合架构等核心技术特点,其应用“清影”具备快速生成、高效遵循指令、内容连贯、画面调度灵活等特点,智谱大模型开放平台也部署了“清影”,企业和开发者可通过 API 调用使用其功能。
官网地址:点击此处立即体验
360:AI弹窗过滤器每月30元
来源:ITSoul
360 推出 AI 弹窗过滤器,能屏蔽包括自家软件在内的弹窗广告,但用户需每月支付 30 元成为 360AI 大会员才能使用,会员还能使用其他 AI 功能。该过滤器能智能识别拦截弹窗广告,已成功拦截 360 软件管家弹出的广告,宣称有六项升级功能,但开通会员后能否彻底拦截 360 所有软件弹窗尚不明确。
想了解更多AI行业资讯信息请关注AITOP100平台AI资讯专区:https://www.aitop100.cn/infomation/index.html