OpenAI向ChatGPT付费用户推出高级语音助手功能
来源:36氪
在首次公开发布四个月后,OpenAI向ChatGPT的所有付费用户推出了备受期待的类人高级人工智能(AI)语音助手功能。OpenAI周二宣布,已经开始向订阅OpenAI ChatGPT Plus和Team计划的用户推出新的ChatGPT高级语音模式Advanced Voice。该公司补充称,该功能将从下周开始向OpenAI Edu和Enterprise计划的订阅者开放。(智通财经)

字节跳动豆包视频生成模型正式发布 支持多镜头视频一致性生成
来源:站长之家
豆包·视频生成模日发布!火山引擎总裁谭待表示,豆包视频生成模型在视频生成方面具有多项先进性能,包括精准的语义理解、多动作多主体交互、强大的动态效果和一致性多镜头生成能力。
豆包视频生成模型使用地址:【点击登录】

中国科学技术大学出品!AI人像视频编辑工具PortraitGen:风格化、换衣、修改光照通通搞定
来源:站长之家
中国科学技术大学的研究团队推出了名为PortraitGen的创新视频编辑工具,可实现多模态的人像编辑,编辑速度快,编辑效果流畅。特别的面部意识编辑模块提升表情质量,保留个性化特征,展现强大潜力。

强的离谱!Leonardo AI推出图片高清放大神器
来源:站长之家
Leonardo AI推出的高清放大功能速度更快更便宜,效果惊人。通过X博主James Yeung和另一位博主Dogan Ural的分享视频,展示了夜景下建筑和家具的清晰放大效果,甚至可以看到沙发上抱枕的纹路。值得一试!

OpenAI 重磅发布多语言 AI 数据集,推动全球语言平等
来源:站长之家
OpenAI 最近推出了名为“多语言大规模多任务语言理解”(MMMLU)数据集,旨在评估人工智能在14种语言中的表现。该举措填补了AI研究中对低资源语言的关注空白,为全球用户提供更好的AI互动体验。同时,OpenAI还推出了OpenAI Academy项目,支持低收入国家AI开发者的成长和发展。

PDF一键转播客!PDF2Audio让文档开口说话
来源:站长之家
在信息爆炸的时代,PDF2Audio是一款开源工具,利用人工智能技术将PDF文档转换为多种音频形式,如播客、讲座或摘要,为用户提供全新的信息获取方式。工具设计考虑用户需求,支持批量处理文档,提供多种内容模板,个性化选择GPT模型和语音风格,提供草稿编辑和反馈迭代功能。采用Gradio接口,降低使用门槛,让更多用户享受AI便利。

日本东京政府推出人工智能相亲系统
来源:ITSoul
日本东京政府推出官方背书的人工智能相亲系统“东京结缘”,该系统于 2024 年 9 月 20 日正式推出,面向在东京生活、学习或工作的 18 岁以上未婚人士。据 2021 年东京政府调查,很多东京居民希望结婚但未迈出寻找伴侣第一步。用户需支付 1.1 万日元购买两年使用资格,且要经过多种认证、提供收入证明并接受面试,收费是为服务真正想寻找稳定关系的人。成功登入后,用户接受价值观评估,由人工智能系统匹配相容性高的人选,还可获得全方位专业咨询服务以解决从约会到婚后可能遇到的问题。

想了解更多AI行业资讯信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html








