淘宝新推RecGPT大模型,"猜你喜欢"变聪明了
7月1日的"硬核少年技术节4.0"上,淘天集团甩出了个大招——自家研发的百亿参数推荐大模型RecGPT正式上线,淘宝首页的"猜你喜欢"这下彻底不一样了。
这背后全靠生成式推荐技术(AIGR),让推荐精准度飙升。官方说,用了RecGPT后,用户点击量涨了两位数,加购和页面停留时间也多了5%以上,看来大家确实更爱逛了。
RecGPT是在淘宝星辰大模型基础上搞出来的,通过分析用户十年的消费记录,再结合数亿商品的图片文字信息,甚至外面的知识库,就能摸透你的心思。比如你买了婴儿用品,它能顺着猜:宝宝快一岁了?那学步车、适龄奶粉安排上;到了购物节,还会照着你常买的牌子,挑出打折的组合。
最有意思的是,它还会给每件推荐商品写"专属文案"。热门玩具旁标着"新晋顶流不来看看吗?",给杭州用户推除湿机时,直接说"梅雨季防潮神器",这下连地域特点都考虑到了,互动感拉满。
这其实是淘天AIGX技术体系的成果,现在淘宝、天猫好多业务都在用,从商品索引到促销创意都覆盖了。用大模型改推荐算法,不光商家卖得好,咱们买东西也更省心,说不定整个电商行业都会跟着变样呢。
体验地址:无具体体验地址,该模型已融入到淘宝首页的“猜你喜欢”功能中去了

PerMAXity:AI当你的专属分析师,财务报告自动搞定
最近Perplexity新出了个PerMAXity功能,不用请分析师,就能自动生成投资组合的财务报告,效率高得有点吓人。
简单说,PerMAXity能帮你把投资里的股票、债券啥的,从头到尾分析一遍。它会实时抓市场数据、查历史表现、看财务报表,连行业趋势都能揉进去,最后给你一份清清楚楚的报告。以前人工分析要花半天,现在分分钟搞定,还能避免人为出错。
最方便的是能设"计划任务"。比如你想每天早上看特定资产的情况,它就会准时发报告,里面有最新股价、盈利预测,甚至分析师怎么看的都写得明明白白。数据来源也靠谱,连SEC备案这种官方信息都能扒来用,放心得很。
不管是个人炒股,还是财务顾问、基金经理,都能用得上。它还能生成图表、表格,甚至交互式仪表盘,数据看得明明白白。评估并购机会、盯着竞争对手,或者看政策对投资的影响,它都能给定制化方案。
以前搞财务分析,要么花钱买服务,要么请专业团队,小散户根本玩不起。现在PerMAXity把门槛降下来了,普通人也能轻松搞懂投资。据说Perplexity还和Cerebras Systems合作提速,以后可能会更厉害,说不定投资圈要变天了。
体验地址:Perplexity官人入口

字节XVerse:想让图片里多个人?单独控制,想咋改咋改
字节最近放出个叫XVerse的图像合成技术,厉害之处在于:一张图里有好几个人,能单独调每个人的样子和动作,不会影响整体画面,玩创意简直太方便了。
它的核心是一种叫DiT调制的方法,能把参考图转成文字指令的偏移量,你随便输几句描述,就能生成高清图片。比如想让左边的人笑一点,右边的人换件衣服,直接说就行,不用操心整体画面会不会乱。
用起来也不算复杂,先整个Python3.10.16的conda环境,装些依赖,再下载检查点和人脸识别模型。它还有个Gradio演示界面,上传图片、输描述,能实时看效果,参数还能调,直到满意为止。
界面设计得挺友好,能设图片尺寸,还能"检测与分割"——上传图后自动识别人脸、裁剪,再生成描述,让生成的图更贴你的想法。
这技术对做广告、搞艺术创作的人来说,简直是神器。以后数字内容创作说不定会更灵活,说不定XVerse能成行业标杆,让更多奇思妙想落地。
github地址:https://github.com/bytedance/XVerse

Cursor出手机版了!编程随时搞,开发者终于能"移动办公"
AI编程工具Cursor最近更新了,能在网页和手机上用了,程序员不用死守电脑,随时随地都能写代码,这波操作太懂打工人了。
以前Cursor只能在电脑上用,现在用手机浏览器,或者把网页存到主屏幕,就跟用APP一样方便。对经常出差、或者想趁碎片时间改代码的人来说,简直是救星。
手机版功能虽然比电脑版简重点,但核心的都有:能同时弄好几个编程任务,换项目、换AI模型也方便;还能看任务列表,跟踪进度;跟GitHub联动也没落下,能创建PR(拉取请求),用Bugbot查代码问题。最关键的是,它能记住上下文,就算不是程序员,用Obsidian这类工具写东西也能用上。
不过手机版主要靠"Background Agent"模式,得绑GitHub仓库才能全功能用,更适合简单任务和远程合作。
这步棋可能会逼得VS Code、JetBrains这些工具也搞移动版。用网页技术做跨平台应用,以后工具可能会越来越灵活。说不定以后程序员真能躺着改代码了,想想还挺爽。
体验地址:Cursor网页版入口
Meta可能要放弃自家Llama AI,转头找竞争对手合作
最近Meta有点纠结,据说可能要放弃自己研发的Llama AI模型,改用OpenAI、Anthropic这些对手的技术,看来自家模型表现不太如意。
转折点在4月的Llama 4发布会上,当时开发者反应平平,Meta估计是急了。现在他们砸了143亿美元投资Scale AI,还让Scale的CEO Alexandr Wang带队搞个"超级智能"团队,想赶紧补上技术短板。
为了挖人,Meta甚至给OpenAI的研究员开1亿美元签约奖金,还在谈收购PlayAI、Perplexity AI这些初创公司,看来是铁了心要变强。
虽然内部有点乱,但华尔街分析师还挺看好Meta,给了"强力买入"评级,目标价定在716.48美元,觉得现在股价差不多到合理位置了。
科技圈竞争太激烈,Meta这步棋能不能走对,还得看后续。要是真换成别家的AI,说不定能打个翻身仗,但也可能丢了自己的技术根基,不好说啊。

特斯拉玩了把狠的:新车自己开到车主家,全程没人管
特斯拉刚在奥斯汀搞了几天自动驾驶出租车,转头就秀了波操作:一辆Model Y从工厂出发,自己开了15英里到新车主公寓,马斯克说这是首次"自动驾驶交付",全程没人,也没远程操控。
这辆车装的软件,跟奥斯汀出租车的差不多,但交付时调成了市售的"全自动驾驶(监督)"版本,按规定驾驶员得随时准备接手,不过这次据说真没人管。
timing也挺巧,特斯拉马上要发二季度的交付数据和财报。之前2024年销量下滑,马斯克掺和特朗普的事又败了些路人缘,这次数据压力不小。消息一出,特斯拉股价先涨后跌,看来市场也在观望。
这段30分钟的路程(特斯拉放了3.5分钟精华版)挺复杂,要上高速变道、红灯右转、过环岛,还有无保护左转,这些对自动驾驶来说都是难题,一次性搞定确实有点东西。
不过业内也有质疑。比如2016年特斯拉发过一段"自动驾驶"视频,后来被爆是提前画好路线、试了好多次,还有安全员盯着。这次交付前,车到底做了多少准备?有人看到奥斯汀的测试车装了激光雷达,是不是也用在这次交付上了?
关键是,这路线能安全重复几十、几百次吗?一次成功不算啥,能一直靠谱才是真本事。

ManimML火了!Transformer模型咋工作的?动画给你演明白
现在AI越来越火,Transformer这种复杂模型成了香饽饽,但讲明白它咋工作的,真挺难。还好有个叫ManimML的AI动画库,能把这些抽象的东西变成直观的动画,最近圈里都在传。
ManimML是用Python写的开源工具,专门给机器学习概念做动画。它基于Manim社区版改的,不管是Transformer还是卷积神经网络(CNN),都能画出来。老师能用来做教学视频,研究员能展示算法过程,就算是新手,也能看动画学明白。
最牛的是简单易上手。不用学复杂的动画软件,语法跟PyTorch这些深度学习框架差不多,几行代码就能定义神经网络,它自动生成动画。比如想看看Transformer的"前向传播"是咋回事,用它分分钟做出动态演示。实在不会,把GitHub地址给大模型,说清楚想法,AI都能帮你生成。
现在ManimML在GitHub上有1300多个星标,PyPi下载量超2.3万次,演示视频在社交平台上几十万人看,还拿了IEEE VIS2023的最佳海报奖,认可度挺高。
以后不管是上课、做分享,还是写论文,用它来可视化,肯定能让听众秒懂。说不定以后学AI,就跟看动画片一样简单了。
github地址: https://github.com/helblazer811/ManimML

想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:









