Kimi 开放平台将启动 Context Caching上下文缓存 内测
来源:站长之家
Kimi 开放平台近日宣布,备受期待的Context Caching功能即将启动内测。这一创新功能将支持长文本大模型,并通过高效的上下文缓存机制,为用户提供前所未有的体验。Context Caching是一项前沿技术,通过缓存重复的Tokens内容,大幅度降低用户在请求相同内容时的成本。
百度文库:AI产品“橙篇”已支持10万字长文生成
来源:站长之家
百度文库最新推出的AI产品“橙篇”在长文生成和多模态编辑方面取得重大突破,为用户提供全面的创作和编辑功能。产品基于强大的AI技术支持,让用户能够轻松访问专业学术资源、创作超长图文内容,并实现一站式的多格式编辑和调整。
网址:https://cp.baidu.com/
首个AI高考全卷评测结果发布:最高分303,数学全不及格
来源:阿杰与AI
上海人工智能实验室旗下的司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷测试,发布了首个大模型高考全卷评测结果。阿里通义千问2-72B以303分获得最高分,OpenAI的GPT-4o以296分紧随其后,上海人工智能实验室的书生·浦语2.0位列第三。这些模型的得分率均超过70%,展现了强大的实力。然而,来自法国大模型初创公司Mistral的模型排名垫底。此次评测的模型包括阿里巴巴、零一万物、智谱AI、上海人工智能实验室、法国Mistral的开源模型,以及OpenAI的闭源模型GPT-4o。为确保公平,评测中特别将GPT-4o作为参考,并未纳入商用闭源模型。结果显示,大模型在语文和英语方面表现良好,但在数学方面则普遍不及格,最高分仅为75分,由书生·浦语2.0获得,紧随其后的是GPT-4o的73分。语文方面,通义千问表现出色,英语则由GPT-4o领跑。数学成绩的不理想凸显了大模型在复杂推理能力方面的不足,这是大模型未来发展的重要方向,尤其在金融、工业等需要可靠场景落地的领域。
可以在Confyui中用英伟达的Lumina-T2X图像生成了
来源:站长之家
英伟达的 Lumina-T2X 图像生成模型可以在Confyui中用英伟达的Lumina-T2X图像生成了,作为一个开源模型,它在美学表现和图像质量上与业界领先的MJ V6 相差无几,这一成就在开源领域尤为难能可贵。
AI设计工具Kittl:输入文字提示即可生成图标、剪贴画等
来源:站长之家
Kittl是一款AI驱动的设计平台,利用先进算法和机器学习,用户可通过简单文本提示创建高质量设计元素,无需复杂技能和软件操作。提供矢量标志图标、令人惊叹的图像和剪贴画,高级文本编辑,魔法着色,即用型模板。用户可访问插图、字体、照片、图标、纹理等无限内容,轻松拖放并自定义。
中国气象局发布“风清”、“风雷”、“风顺”
来源:ITSOUL
中国气象局发布了“风清”、“风雷”、“风顺”三种 AI 气象大模型系统。其中,“风清”大模型具有大气强物理融入和可解释性,全球可用预报天数达到10.5天,在较长预报时效方面具有优势;“风雷”大模型将数据驱动与物理驱动紧密结合,提高了公里尺度下0至3小时雷达回波的预报能力,构建了全流程短临预报系统;“风顺”大模型引入集合扰动智能生成技术,纳入海气相互作用关键过程,对全球降水的预测技巧有一定优势。这些大模型的发布,展示了中国气象局在气象预报领域的创新成果,也为气象服务的提升提供了新的技术支持。
《代码大模型安全风险防范能力要求及评估方法》规范正式定稿
来源:ITSOUL
中国信息通信研究院成立中国人工智能产业发展联盟(AIIA),联合业内近 30 家单位,共同编制《代码大模型安全风险防范能力要求及评估方法》规范(简称“规范”),聚焦代码大模型的安全能力,从基础功能出发,评估代码大模型的基础能力和安全风险防范能力。规范的制定旨在全面评估代码大模型在安全风险防范方面的能力,通过分析和测试,确保模型在各个关键环节的安全性能。本规范的评估不仅包括代码大模型的核心功能,还有多个相关的细分领域,如数据集、算法、模型、网络以及服务等。根据评估结果,规范将确定代码大模型的安全能力级别,为模型的进一步优化和安全加固提供指导,同时也为用户从安全性角度提供选型依据。
B站:开源轻量级 Index-1.9B 系列模型,支持角色扮演
来源:ITSOUL
B站开源轻量级 Index-1.9B 系列模型,包含基座模型、对照组、对话模型、角色扮演模型等多个版本。
l Index-1.9B base :基座模型,具有 19 亿非词嵌入参数量,在 2.8T 中英文为主的语料上预训练,多个评测基准上与同级别模型比处于领先。
l Index-1.9B pure :基座模型的对照组,与 base 具有相同的参数和训练策略,不同之处在于严格过滤了该版本语料中所有指令相关的数据,以此来验证指令对 benchmark 的影响。
l Index-1.9B chat :基于 index-1.9B base 通过 SFT 和 DPO 对齐后的对话模型,由于预训练中引入了较多互联网社区语料,聊天的趣味性明显更强。
l Index-1.9B character :在 SFT 和 DPO 的基础上引入了 RAG 来实现 fewshots 角色扮演定制。
该模型使用 2.8T 规模的数据,中英比例为 4:5,代码占比 6%。目前,角色扮演模型内置了角色“三三”,用户也可以按需创建自己的角色。
开源地址:
https://github.com/bilibili AITOP100平台资讯专区:https://www.aitop100.cn/infomation/index.html