作为一款上过2024年央视春晚的国民级内容社交平台,小红书在AI上的动作一直不大。与之有关的最新消息是,今年4月,小红书内测了自研大模型“小地瓜”。而现在小红书在AI上又有了新的进展。这些天,小红书终于上线了自己从去年7月就开始内测的AI助手达芬奇,可不是那个出名的视频调色软件。
小红书AI走到哪儿了?我对这个问题很好奇。要知道,小红书拥有着国内仅次于微信的高质量内容生态。公众号内容对元宝的加持显而易见,小红书又是否会给姗姗来迟的达芬奇带来一些不同的体验呢?
01 生活经验更具体,匹配度有待加强
“文艺复兴时期最完美的代表”达·芬奇思想深邃、学识渊博,对什么都有兴趣,他精通绘画、建筑、发明、人体解剖等领域,小红书的这位达芬奇同样思维活跃、涉猎广泛,它依靠小红书的强大语料和知识库来回答。
种种迹象表明,官方对待达芬奇非常谨慎。达芬奇(Davinci)早在去年7月就已经有了,当时只有少部分人被内测到了。在今(21)日之前,达芬奇都隐藏得很深,需要在名为“达芬奇”的用户中寻找,现在你可以在检索的置顶推荐里找到了。
▲达芬奇入口前后区别
从功能上来看,达芬奇与“对家”知乎-知海图等AI并没有什么区别,依然是对话界面+各种智能体,并推送相关笔记提供延展阅读,在安卓or苹果上的使用效果基本没差。
简单测试了下,有一定实用价值,特别是攻略类的回答,独一份的事无巨细。就“北京一日游”这样的旅游攻略类问题,达芬奇的回答是不是还挺地道的?对比其他AI助手,具体又贴地气。
▲提问“暑假去北京旅游,帮我安排一天行程,一定要地道”,达芬奇/元宝/豆包作答
小红书的笔记从购物/旅游/美食/学习/考试/求职攻略等,到使用体验、硬核干货、软件教程、读书笔记、职场心得,甚至到求医问药,应有尽有,所以达芬奇对于攻略类的问题算是手到擒来。
不过,引导问题做得不太仔细,“推荐约会餐厅”是推荐全国范围的,“Citywalk路线”默认回答上海的位置。达芬奇也还不能识别提问者的IP地址,以此作为回答前提。
但如果是面对“茶百道的哪一款奶茶最好”这样的产品细化问题,在一众AI助手中,小红书-达芬奇就没有明显优势了,而抖音-豆包的回答看上去最为专业。
▲提问“茶百道的哪一款奶茶最好”,达芬奇/豆包/Kimi作答
另外,达芬奇对“最好的***”等问题比较谨慎,引用笔记偏向于“端水”,无一例外是多个产品/店家的合集笔记,没有单条赞助内容,似乎是为了避免明显地引流。有时回答不会按照指令来,比如推荐静音键盘时,达芬奇跟我唠起了小红书上讨论度更高的静音轴体类别。可能是因为达芬奇照搬了下方推荐笔记的文案,而没有很好地理解提问的语义。
▲提问“2024最好看的一部电影”、“最好用的一把静音键盘”、“家用3D打印机可以买吗”等问题
我又突发奇想,想考验一下小达如何处理“人情世故”。我问“花西子眉笔贵吗”,达芬奇的回答出现了明显错误和偏向。花西子眉笔的淘宝价格是40~100元/支,但达芬奇回答是6.9元/支,这出入太大了,达芬奇还引用了冷门并答非所问的笔记。重新生成之后,才给出没有错误的答案。
小红书是花西子近年重点合作营销的平台,看来达芬奇对小红书合作品牌是开了后门的,回答有偏向。达芬奇自述是“内容偏向正面”,也有可能是这方面原因。
▲达芬奇对于“花西子眉笔贵吗”的回答,引用笔记中的7.5元/支眉笔是花西子山寨品牌,某一篇提到所购眉笔“可能不是正品”;还有一篇没有提到该眉笔的价格
当然,我不能老是问达芬奇一些它本来就很擅长的领域,当我问“历史上有没有完美犯罪”时,达芬奇的回答就比较潦草、空泛,没有举例。对于“姜萍事件”的问题,达芬奇没有简述新闻并明晰观点。而微信-元宝对于上面两个问题的回答会系统很多,也有对“完美犯罪”进行多个举例。
▲提问“如何评价姜萍事件”,达芬奇和元宝分别作答
最最翻车的是,对于“给我一首**的德国诗歌”这样小红书上存在大量优质笔记的问题,我分别提问了优美/悲伤/快乐的风格,达芬奇给我的3个回答都是同一首诗?!达芬奇太偷懒了!
▲提问给“我一首优美/悲伤/快乐的德国诗歌”
总体来说,小红书AI的最大优势就在于它的经验是具体的,这在众多AI助手中是独一份的,但回答匹配度不太稳定。
02 内容沉淀好≠AI助手好,模型能力待提高
AI大模型的竞争打到了互联网的各个角落,与别家做AI不同,小红书做AI一直是“淡淡的”。其实小红书还是暗暗下功夫,其AI功能除了大模型“小地瓜”,以及这几天新上线的达芬奇,还有AI宠物、群聊AI智能体、AI生图,搜搜薯(AI搜索)。
拥有好的内容沉淀永远是王道,它可以为社区内容平台的AI带来强大的语料库和知识库。小红书的模式类似于腾讯元宝和知乎知海图,充分在整合站内UGC(用户生成内容)的基础上,生成提炼答案。
遗憾的是,小红书的好内容却没有能赋能给达芬奇。达芬奇有时回答能力比较差,似乎是只做了RAG(检索增强生成)且做得不太好,没有做Agent(智能体)。
很多人没意识到的是,小红书也已经是一个非常深入的搜索引擎,无论关键词多烂都能匹配到正确的内容,但这依旧没能在达芬奇身上得到体现。无论你关键词描述的多精准,达芬奇时常找到不匹配的笔记。达芬奇自述是通过学习权重高的帖子生成回答,实际体验时,低赞藏笔记也能进入推荐位。
此外,从目前来看,类似违禁词替代词、奇怪的缩写……这样的垃圾数据问题也是达芬奇需要担心的。由于回答不准确,达芬奇的生成结果还不能直接被复制形成笔记,甚至进行二创。另外,由于小红书的内容本身夹杂着许多软广,达芬奇的数据还可能面临着被稀释的问题,可能有更多商家为了笔记推荐位而在小红书上打广告。
03 结语:小红书做AI,潜力很大
与其他大模型相比,达芬奇在小红书原生用户中更具优势。而如何能结合AI赋能内容社区,而不会破坏社区本身现有的内容生态,是摆在小红书面前的一道难题。
小红书上的图片和视频内容,都可以作为很好的数据融入AI大模型。
目前,小红书是以美图和视频为主的内容平台,而达芬奇仅能识别笔记文案,对于携带大量信息的图片和视频内容还不能理解,没有能开发完全图片与视频内容产品的潜力,可能是因为地瓜大模型还没有加入OCR(光学字符识别)、ACR (自动内容识别)技术。
有了公众号内容的加持,腾讯元宝成了很多用户的心头好。小红书坐拥小红书大量优质短笔记内容,我们也期待随着地瓜大模型进一步升级,能带来体验更成熟的达芬奇。
本文来自微信公众号“乌鸦智能说”(ID:wuyazhinengshuo),作者:智能乌鸦,36氪经授权发布。
发表评论