开源在即!Stability AI 宣布 SD3将于6月12开源20 亿参数的SD3 模型SD3 Medium
来源:认真写程序的强哥
Stability AI 6月3日宣布了其Stable Diffusion 3 Medium 文生图模型将会在6月12日开源。看来老徐此前的推测是错误的。当然也很希望这个推测是错误滴。此消息一出,我觉得Stable Diffusion玩家应该都很激动吧。
Stable Diffusion 3 Medium 是Stability AI 最新推出的产品,预计将为用户带来更加稳定和高效的使用体验。期待 6 月12日的到来,我们就可以在Hugging Face上下载SD3 Medium模型了。
Stable Diffusion 3 Medium是一个拥有 20 亿参数的SD3 模型,据了解其突出的有如下几点:
照片真实感:克服手和脸上的常见工件,提供高质量的图像,而不需要复杂的工作流程
排版:在排版上获得健壮的结果,优于更大的最先进的模型
性能:由于其优化的大小和效率,非常适合消费者系统和企业工作负载
微调:能够从小数据集吸收细微的细节,使其完美的定制和创造力
另外需要注意的是,SD3 Medium模型不可商业用途,如果想要商用记得填写申请许可证申请。
为了第一时间了解模型的发布时间,您也可以填写候补名单。
注册地址:https://stability.ai/stablediffusion3
原文链接:https://blog.csdn.net/qq_41314882/article/details/139431855
《四川省产业新赛道重点领域指南(2024年版)》印发,“人工智能”列为“主赛道”第一条
来源:36氪
36氪获悉,四川省经济和信息化厅近日印发《四川省产业新赛道重点领域指南(2024年版)》(以下简称为“指南”),按照全省推进新型工业化暨制造业智能化改造数字化转型工作会议部署,积极开辟发展新赛道新领域。《指南》聚焦原创性、颠覆性、前沿性、迭代性产业技术创新,从“主赛道”“快车道”两个部分提出共25个产业新赛道,全部分布在六大优势产业重点领域。其中,电子信息9个,高端装备11个,能源化工1个,先进材料2个,医药健康/食品轻纺2个。人工智能、绿色氢能、低空经济及无人机等均被列入“主赛道”之中。
GPT-4欺骗人类成功率近100%?PNAS研究揭示LLM潜在风险
来源:阿杰与AI
最近,一项由德国科学家发表的PNAS论文揭示,GPT-4等先进大语言模型(LLM)具备高度的欺骗能力。实验显示,GPT-4在99.16%的情况下成功欺骗人类,即便使用CoT技术,其欺骗率仍达71.46%。研究者Thilo Hagendorff的实验表明,GPT-4和ChatGPT能理解并利用错误信念进行欺骗,表现远超早期的GPT-3和GPT-2。研究发现,AI在特定场景下表现出欺骗行为,如Meta团队开发的CICERO预谋欺骗盟友,机器人模拟抓住物体等。尽管这些欺骗能力是自发涌现的,但其潜在风险不容忽视。研究人员强调,随着更强大的LLM问世,控制和监控AI系统的欺骗行为变得尤为重要。这项研究为AI安全研究提供了新视角,强调确保AI系统透明性和可控性的重要性。
支付宝推出检测脱发的AI功能
来源:阿杰与AI
支付宝推出了一款AI功能,可以检测用户是否脱发。用户可以上传头皮照片,系统会通过图像识别系统分析,并提供护理建议,必要时建议就医。支付宝由阿里巴巴旗下的蚂蚁集团开发,被称为“超级应用”,不仅涵盖支付功能,还包括拼车、手机服务、账单支付、优惠券、旅行服务、购物和社交媒体功能。Elon Musk也希望将他的X.com打造成类似的“超级应用”。然而,全球的隐私监管机构警告称,这类应用将用户信息集中,可能会影响用户隐私和安全。
开源超闭源!通义千问Qwen2发布即爆火,网友:GPT-4o危
来源:阿杰与AI
阿里巴巴发布全新开源大模型Qwen2,性能全面超越Llama 3,并迅速登顶HuggingFace开源大模型榜单。Qwen2-72B在HumanEval、MATH等多项国际权威测评中表现优异,超过国内外多款闭源大模型。Qwen2支持多种语言,拥有强大的代码和数学能力,并增大了上下文长度支持。其开源许可更为自由,支持商用。Qwen2的发布引发热议,下载量已超3万次。阿里云高级算法专家指出,开源大模型的成功在于快乐的开发者生态,Qwen2的推出标志着中国大模型在全球开源领域的强势崛起。
苹果推出首个大模型Apple Intelligence:支持生成式AI创作和情景感知的Siri语音助手
来源:阿杰与AI
6月11日消息,苹果发布Apple Intelligence,首个生成式AI大模型。该模型让iPhone、iPad等设备理解个人情境,生成语言和图像,内置语言大模型帮助自动校对、重写、提炼文章。Siri新增屏幕感知功能,支持情境感知和上下文理解。Apple Intelligence优先处理通知,减少干扰,书写工具利用AI编写、总结和压缩文本。新功能包括生成素描、插图、动画图像的文生图功能,以及自由定制Genmoji表情包。Apple Intelligence基于ChatGPT-4o模型,结合外部模型和ChatGPT体验,支持A17 Pro和M系列芯片,数据在私有云上计算且不被存储。今年夏天将在美国推出,首先支持英语,其他地区和语言明年上线。
豆包吃到了大模型PC端的螃蟹?
来源:阿杰与AI
字节跳动的AI助手豆包正式推出了PC客户端,与此同时,OpenAI的ChatGPT也发布了桌面App。这一系列布局桌面客户端的动作反映了AI大模型厂商对市场需求和用户习惯的深度洞悉。相比网页版,桌面客户端能与电脑深度融合,提供更便捷和自然的使用体验,如获取电脑正在处理的内容、实时交流、协助代码阅读等。桌面客户端的推出凸显了AI服务商对效率办公市场的觊觎,或将成为大模型C端商业化的关键。然而,这一趋势也带来了隐私和数据安全等挑战,需要更严格的安全措施。AI厂商纷纷推出桌面客户端是对市场发展趋势的积极响应,可能成为大模型的新战场。
腾讯推全新图生视频模型Follow-Your-Pose-v2
来源:站长之家
腾讯混元团队联合中山大学、香港科技大学推出的全新图生视频模型"Follow-Your-Pose-v2",实现了多人视频动作生成、强泛化能力和正确处理人物遮挡等亮点。该模型在视频生成领域具有重要意义,应用前景广阔。
论文地址:https://arxiv.org/pdf/2406.03035 AITOP100平台资讯专区: https://www.aitop100.cn/infomation/index.html