
2024-05-20 10:25:37
每日AI资讯--5月20日
百度文心大模型落地线下“AI智慧门诊”
来源:阿杰与AI
百度宣布其文心大模型已扩展至线下医疗领域,与武汉协和医院合作推出“AI智慧门诊”。这是湖北省内首个落地的AI智慧门诊,也是百度大健康线下的首个此类项目。百度大健康事业群医疗业务总经理张延东表示,大规模推广“AI智慧门诊”面临三大挑战:一是医院需要改变传统观念,接受新技术;二是明确数据边界,保护患者隐私;三是为不同类型的医院提供定制化解决方案。
GPT-4o手写板书以假乱真惊呆网友,代码建模无所不能
来源:阿杰与AI
生成手写体文字 OpenAI联合创始人Greg Brockman展示了GPT-4o生成的手写体板书图片,达到了以假乱真的程度,引发网友热议。 快速生成视频游戏 网友上传了一张Breakout游戏的截图,GPT-4o在一分钟内生成了无错误的Python代码,完美复刻了该游戏。 用文字提示进行3D建模 用户仅通过文字提示,GPT-4o就能创建STL文件并生成3D模型,实现了从零开始的快速建模。 实时翻译功能 GPT-4o展示了英语和意大利语之间的无缝翻译,显示出强大的实时翻译能力,有望替代谷歌翻译。 挑战谷歌搜索 OpenAI推出了新的ChatGPT桌面应用程序,可访问用户屏幕,实现实时语音交互,标志着一种新的计算机和网络使用方式的到来,可能彻底改变当前的互联网生态。 普通用户免费但有限制 虽然GPT-4o普通用户可免费使用,但每天限制在24小时内只能使用10次。
院士谭建荣:生成式AI、元宇宙、拟人化机器人交叉融合将产生 “人类2.0”
来源:36氪
36氪获悉,中国工程院院士谭建荣在2024搜狐科技年度论坛上表示,学界预测生成式AI、元宇宙数字空间、拟人化机器人三项技术交叉融合,将会产生“人类2.0”版本。“一旦控制失效,故障将是灾难性的。”但其亦认为人类可“驯服”机器人:一是通过安全规范和法规进行人工智能风险防范;二是通过大样本训练使机器人服从人的指挥;三是划出一些安全警戒线,使机器人在外源时空条件下防范其“做坏事”。
索尼向700多家公司发出警告,禁止使用其音乐数据训练AI模型
来源:站长之家
这一警告涉及到700多家公司,索尼明确表示未经许可不得使用其音乐数据进行文本挖掘、网络爬取以及其他形式的数据搜集,包括录音、音乐作品、封面艺术作品和元数据等。这是因为 AI 模型厂商必须尊重歌曲作者和唱片艺术家的知识产权,未经其授权使用数据将影响知识产权的合法性和公平性。
微博已接入阿里云通义大模型 覆盖AI评论、明星陪聊等功能
来源:站长之家
据阿里云官方消息,微博宣布已成功将阿里云的大模型技术融入其核心业务,开启了一个全新的智能互动时代。这一融合不仅覆盖了AI评论、AI明星陪聊、虚拟角色帐号、星座大模型,更在信息流广告创意生成等领域展现出了显著成效。
李彦宏:百度搜索已有11%结果由AI生成
来源:站长之家
在百度2024年第一季度财报电话会上,百度创始人李彦宏深入探讨了公司的业务表现和未来发展方向,强调人工智能技术对用户体验的推动和创新。尽管面临宏观经济挑战,百度仍致力于发展人工智能领域,取得成果并对未来充满信心。
谷歌发布开源视觉语言模型PaliGemma
来源:站长之家
谷歌推出了开源视觉语言模型PaliGemma,结合图像处理和语言理解能力,支持多种视觉语言任务。该模型具有多任务支持、30亿参数规模和SigLiP视觉编码器与Gemma语言模型结合的特点。谷歌的贡献推动了AI领域发展,为研究人员和开发者提供强大工具。PaliGemma的开源特性意味着可以被广泛使用、改进和集成到各种产品和服务中。
腾讯混元大模型支持生成16s视频 并推出AI智能体平台腾讯元器
来源:站长之家
我对腾讯在生成式AI领域的最新成果——腾讯元器以及混元大模型的展示感到印象深刻。腾讯元器是一站式的AI智能体创作与分发平台,为企业提供了全新的解决方案,极大地扩展了智能体的应用范围和影响力。腾讯混元大模型在视频生成和3D生成领域展现出强大的实力,为未来的AI应用开辟了新的可能性。
Google Photos将推出Ask Photos功能 动动嘴就能搜索照片和视频
来源:站长之家
Google Photos即将推出名为Ask Photos的实验性功能,利用AI模型Gemini,用户可以通过自然语言搜索查找照片和视频,辅助完成相关任务。这将进一步增强Google Photos的搜索能力,让用户更便捷地管理他们的珍贵回忆,享受个性化体验。功能预计将在未来几周内推出。
分享
0
0

全部评论
加载更多
热门内容