商汤的AI大转型:视觉老炮儿的新玩法
这两年,AI圈子里最火的就是大模型了。要说商汤科技,这公司成立时间不长,才不到十年,但人家底子厚啊!之前一直深耕计算机视觉领域,技术积累杠杠的。现在风向变了,商汤也赶紧跟着转型,搭上了大模型的快车。
想当年,商汤主要玩的是视觉模型。但是自从DeepSeek R1一出来,大家伙的目光都聚焦到自然语言处理和超大参数模型上了。商汤也明白,不能再抱着老一套了,赶紧调整战略!
“日日新”横空出世:多模态才是王道!
这不,4月10号,商汤就放了个大招,推出了全新的6000亿参数多模态大模型,名字也挺接地气,叫“商汤日日新Sense Nova V6”。这玩意儿可不是盖的,综合实力那是杠杠的,据说跟国际大牌GPT-4.5和Gemini 2.0 Pro比起来,也不落下风!
之前商汤在文本模型方面可能稍微逊色一点,但现在,人家不但把这个差距补上了,还在多模态领域憋了个大招!这下可好,商汤在国内大模型市场上的地位那是越来越重要了。
“思维链”是啥?商汤的独门秘籍!
说到这个“商汤日日新”V6,它厉害的地方可不止参数多。人家在构建多模态模型的时候,用了一种叫做“思维链”的独特方法。简单来说,就是把文本、图像、语音和视频这些数据融合在一起,让它们在同一个上下文中进行推理,达到1+1>2的效果!
这种创新可不简单,它不仅提升了模型的理解和生成能力,还让不同模态之间能够更好地协同工作。你想想,让AI既能看懂图片,又能听懂语音,还能理解文字的含义,这得多智能啊!
未来AI竞争:多模态才是关键!
现在市面上多模态模型也不少,但真正能同时处理多种数据模态的产品,那真是屈指可数。商汤的“日日新”V6,凭借着在多模态数据融合方面的成功,已经逐渐展现出它在未来人工智能竞争中的强大潜力!未来的AI世界,多模态才是王道!