鸿蒙NEXT首次将AI能力融入系统
来源:36氪
36氪获悉,华为开发者大会(HDC 2024)上,华为发布鸿蒙原生智能应用,鸿蒙NEXT首次将AI能力融入系统,带来AIGC图像生成、AIGC声音修复、AI图像识别等体验。由于盘古大模型5.0加持,小艺能力全新升级,小艺智能体与导航条融为一体,无论在任何应用界面,都可以随时召唤。只需将文字、图片、文档“投喂”小艺,即可便捷高效处理文字、识别图像、分析文档。
华为音乐与科大讯飞达成全面深度合作
来源:阿杰与AI
2024年6月22日,在华为开发者大会2024(HDC 2024)期间,华为音乐与科大讯飞在东莞签署了全面深度合作协议。双方将基于HarmonyOS发展全场景时代的新生态,在音乐内容发行、艺人合作、手机铃音AI创作等方面展开深入合作,提升鸿蒙生态的娱乐能力,为用户提供更加智能、便捷的视听体验。华为互动媒体军团CEO吴昊表示,双方将利用HarmonyOS的元服务能力和华为软硬件协同优势,共同创作空间音频作品。科大讯飞AI文娱业务群副总裁郭嘉指出,双方将通过音乐版权合作和多领域IP搭载鸿蒙生态进行创新活动,并通过线下演绎活动让内容走近华为用户。华为音乐将继续与全球唱片公司合作,提供丰富的高品质音乐服务,覆盖HarmonyOS多终端全场景。
GPT-5一年半后拥有“博士级智能”,Claude 3.5首超人类博士
来源:阿杰与AI
OpenAI CTO Murati表示,GPT-5将在一年半后发布,达到博士水平智能;而Claude 3.5 Sonnet已经在测试分数上超过最聪明的人类博士。GPT-3相当于幼儿智能,GPT-4相当于聪明的高中生,GPT-5将在18个月后发布,具备博士级智能。Claude 3.5在研究生级推理、本科级知识和编码能力测试中刷新纪录,首次突破GPQA 65%的分数,超过最聪明的人类博士。随着AI发展,Murati预测未来AI会像人类一样合作,AGI可能在2027年实现,逐步走向超级智能(ASI)。ASI可能被视为“新神”,在人类社会中获得类似神的权威和影响力。论文指出,ASI的崇拜现象可能导致技术神权,削弱人类的批判性思维。作者提醒,应保持批判性思维,避免完全依赖AI决策。
苹果Siri接入GPT,华为小艺靠盘古大模型迎战
来源:阿杰与AI
在华为开发者大会2024上,华为介绍了智能语音助手小艺接入盘古大模型后的表现,可进行更自然的语音交互和应用协作,类似即将更新的苹果Siri。苹果在WWDC开发者大会上推出Apple Intelligence套件,深度整合AI功能,并与OpenAI合作,允许用户免费使用ChatGPT。华为发布盘古大模型5.0,支持小艺在多任务场景下应用。小艺功能包括识别处理文字和图片、一键生成表格、创建日程等,并可在不同应用间协作。苹果Siri新功能也包括多模态能力和应用间协作。两者通过大模型支持端侧AI应用,避免数据上传至外部服务器的隐私泄露隐患。目前手机厂商还在探索端侧AI应用。vivo发布蓝心大模型,荣耀搭载70亿参数的“魔法大模型”,小米的大语言模型MiLM逐步应用于多领域。据Canalys预测,今年AI手机出货量占全球智能手机出货量的16%,2028年将达到54%。
快手可灵大模型新功能升级
来源:阿杰与AI
6月21日,快手可灵大模型推出图生视频和视频续写两项新功能。图生视频可将静态图像转化为5秒动态视频,并支持添加提示词控制图像运动。例如,上传蒙娜丽莎图像,可灵能让她戴上墨镜并进行眼神交流。视频续写功能则允许对已生成的视频进行一键续写,每次续写生成约5秒内容,通过多次续写可达3分钟。新功能的亮点是集成了文本控制机制,用户可通过自定义提示词扩展视频内容。官方举例称,可控制古堡视频片段的日夜变换及灯光效果。
复旦开源项目Hallo已适配ComfyUI插件
来源:站长之家
复旦开源的项目Hallo,一个根据音频和图片生成说话视频的项目,已经适配了ComfyUI插件。虽然安装过程中需要的依赖较多,门槛相对较高,但这一开源生态的出现,为后续的转绘和其他流程提供了更多的可能性和乐趣。
Hallo项目通过输入音频,可以让面部照片开始说话,并且伴随着相应的表情,效果看起来非常自然。这个项目采用了端到端的扩散范式,引入了分层的音频驱动视觉合成模块,以提高音频输入与视觉输出之间的对齐精度,包括唇部、表情和姿势的运动。
这种分层音频驱动的视觉合成模块,提供了对表情和姿势多样性的自适应控制,更有效地实现了针对不同身份的个性化定制。这意味着,无论是谁的面部照片,都可以通过Hallo项目生成说话的视频,而且效果自然,仿佛真人在说话一般。
腾讯元宝发布全新版本 接入微信搜索,可处理长达千万字文本
来源:站长之家
腾讯元宝近期发布了全新版本,此次更新主要提升了对超长文本的处理能力及AI搜索和解析功能,同时增加了微信搜索的接入,为用户带来更加高效和便捷的使用体验。
主要亮点:
超长文档处理:能够处理长达1000万字的单文档文本,适用于长篇小说、企业报告、学术论文集合等大规模文档。
多文件解析:一次性解析多达50个文件,支持多种文件格式,包括pdf、doc、txt、xlsx、pptx等。
图表生成:基于解析内容,元宝可以自动生成柱状图、折线图、饼状图等多种数据图表,帮助用户进行数据可视化。
图片解析:支持多种图片格式的识别和解析,能够从图片中提取文字、数据等信息。
URL解析和对比分析:能够解析并分析不同的URL和链接内容,提供总结与对比分析。
增强搜索功能:集成了微信搜索、搜狗搜索等搜索引擎,提供智能搜索结果,覆盖更广泛的内容源。
地址:https://www.aitop100.cn/tools/detail/1899.html AITOP100平台资讯专区:https://www.aitop100.cn/infomation/index.html