通义千问推出 Qwen2 - VL,实现动态分辨率支持
来源:ITSoul
通义千问推出 Qwen2 - VL,该模型有两项关键架构改进。一是实现动态分辨率支持,可处理任意分辨率图像无需分割成块,更接近人类视觉感知;二是采用 Multimodal Rotary Position Embedding(M - ROPE),使语言模型能同时捕获和集成文本、视觉和视频位置信息,充当多模态处理器和推理器。在 7B 规模下,Qwen2 - VL - 7B 保留对图像、多图像和视频输入的支持,以更具成本效益的模型大小提供“具有竞争力”的性能;Qwen2 - VL - 2B 模型针对潜在的移动部署进行了优化,参数量为 2B 但在图像、视频和多语言理解方面表现出色。
晋江文学城痛批“部分博主偷取多部知名小说喂 AI”:无耻嚣张的侵权行为
来源:ITSoul
晋江文学城官方微博发布长文痛批部分博主使用该平台小说训练 AI、生成文字内容的行为。晋江法务发现小红书平台有博主宣传用晋江作者作品内容生成 AI 文字内容的方法,广泛传播训练 AI 和生成文字内容的演示过程,晋江法务迅速向小红书平台发函维权,网帖已被删除。晋江坚决抵制用 AI 拼凑文字内容的行为,将持续维护作者合法权益。此次并非网文平台首次出现 AI 相关争议,7 月曾有网文作者称番茄小说签约协议中有“AI 训练补充协议”,后番茄小说上线解除相关条款功能入口。
谷歌:Gemini AI 支持更多类型文件
来源:ITSoul
谷歌发布博文称旗下 Gemini AI 支持更多类型文件。拥有 Gemini Business、Enterprise、Education 或 Education Premium 许可证的 Google Workspace 用户,可从 Google Drive 或本地设备上传多种文件到 Gemini(gemini.google.com),包括电子表格(如 CSV、XLSX 和 ODS 格式,可分析数字数据、跟踪趋势、生成洞察力)、演示文稿(如 PPTX、PDF 和 KEY 格式,可提取要点、总结内容、识别视觉元素)、图像(如 JPEG、PNG 和 GIF 格式,可提取文本、识别对象、提供上下文)、音频(如 MP3、WAV 和 FLAC 格式,可转录语音、识别发言人、总结要点)和视频(如 MP4、MOV 和 AVI 格式,可提取脚本、识别场景、总结关键事件),通过分析、摘录、洞察文档内容为用户提供更优质的 AI 服务。
通义网页版:上线“PPT 创作”功能
来源:ITSoul
通义 AI 官微消息,通义网页版上线“PPT 创作”功能,该功能基于通义大模型打造,由通义实验室全链路自研,用户可免费使用。通义网页版中,音视频转文字产品“通义听悟”升级为“实时记录”,长文档阅读助手“通义智文”升级为“阅读助手”,与“PPT 创作”功能共同合并为“通义效率”。用户可从通义网页版“效率”板块进入“PPT 创作”页面,输入一句话或上传文档后,工具能自动生成大纲和展开内容,还支持文生图、图片素材库搜索匹配功能,基于通义万相视觉大模型实现,首批上线的模版能满足不同场景需求。
通义千问体验地址:【点击登录】
2024(首届)中国数字人大会将于9月23日至24日在京举办
来源:ITSoul
2024(首届)中国数字人大会将于 9 月 23 日至 24 日在北京中关村国家自主创新示范区展示交易中心举办。大会以“数字人应用与未来”为主题,对数字人发展的战略、技术、应用、安全、人才等问题进行系统研究,组织了开幕大会、多场专题论坛、两场行业赛事、多场产业生态活动等精品内容,汇聚政府部门领导、院士专家、产业领军企业代表、研究机构、终端厂商、数字人应用单位、人工智能企业、安全企业、高校等产业链上下游,分享数字人领域成果、经验和观点,为数字人未来创新方向提供思路及借鉴。
美警:使用 ChatGPT工具辅助文书,8 秒生成犯罪现场报告,记录更准确
来源:ITSoul
美国警察开始使用由 GPT-4 支持、微软提供云服务的人工智能工具 Draft One 辅助文书工作,它能转录执法记录仪音频并自动转变为警务报告。该工具受到警务人员欢迎,可减少撰写报告时间和工作量,如在科罗拉多州柯林斯堡警察局的测试中撰写报告时间减少了 82%。在俄克拉荷马城警察局的实际应用中,它能在 8 秒内生成犯罪现场报告且比人脑回忆还准确,但一些检察官、警察监管机构和法律学者担心其作为刑事司法系统中的证据时的准确性,以及大语言模型可能存在的偏见、“幻觉”等问题。Axon 进行了测试并采取关闭工具自我创造力等方式减少偏见和错误,警官也会口头转述案件内容。Axon 建议警方不要在严重刑事案件中使用该工具,但无法控制各警察部门的使用情况,目前除 Axon 外还有其他初创公司推出类似产品,Axon 因与警务部门有深厚合作关系成为其购买 AI 工具的首选之一。
AI求职神器横空出世:24小时内自动投1000份简历,50场面试在握
来源:AIbase基地
在当今竞争激烈的就业市场中,一款名为LinkedIn_AIHawk的革命性AI求职工具正引起广泛关注。这款开源工具声称能在短短24小时内自动申请1000个工作岗位,并获得50个面试机会,其惊人的效率让许多求职者为之心动。
LinkedIn_AIHawk是一款集多功能于一体的智能求职助手。它能自动扫描符合用户条件的职位空缺,利用LinkedIn的"轻松申请"功能快速提交申请,还可以生成量身定制的简历。更令人惊叹的是,该工具运用大型语言模型(LLM)来个性化回答雇主问题,同时具备批量处理申请的能力,在保证效率的同时不失质量。
项目地址:https://github.com/feder-cr/linkedIn_auto_jobs_applier_with_AI
突发!Runway偷偷删库跑路 Stable Diffusion v1.5没了
来源:AIbase基地
近日,Runway突然从Hugging Face平台上偷偷删除了其代码库,包括备受瞩目的Stable Diffusion v1.5项目,这一举动在科技圈引起了不小的震动。
Runway的这一行为不仅没有留下任何痕迹,也未对Hugging Face或任何社区成员做出任何通知。更令人震惊的是,连GitHub上的页面也变得空空如也。这一突如其来的变故,无疑给依赖这些资源的开发者和研究者带来了困扰。
https://huggingface.co/runwayml
Runway曾是Stable Diffusion研究的参与者,并在相关论文中占有一席之地。他们曾自信地在HuggingFace上开源了Stable Diffusion1.5版本。然而,这一行为却因版权问题引发了争议,并最终导致该版本被要求下架。
https://huggingface.co/runwayml/stable-diffusion-v1-5
想了解更多AI行业资讯信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html