V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
tt67wq
V2EX  ›  问与答

推荐算法求指导

  •  
  •   tt67wq · 2018-09-10 11:34:10 +08:00 · 2261 次点击
    这是一个创建于 2266 天前的主题,其中的信息可能已经有所发展或是发生改变。

    公司在业务上一致像头条和拼多多看齐,

    现在我所在的产品线准备全面借(chao)鉴(xi)头条的应用

    boss 让我写个推荐算法,跟抖音一样能根据用户行为进行推荐(MB 的一个中年老男人玩什么的抖音???)

    TMD 我一个写写 CRUD 的沙雕怎么会那个?冒泡排序已经是我算法造诣的巅峰了

    有没有头条的爹能贡献点文档,或者有没有相关的博客能看看

    13 条回复    2018-09-11 11:01:45 +08:00
    murmur
        1
    murmur  
       2018-09-10 11:37:19 +08:00
    你得先归类啊
    然后就是最弱智的推荐了
    他只要看几次一个分类往后就无脑给他推这个分类就可以了
    别看论文吹的好
    国内的推荐都是这个吊样 尤其是某些音乐网站 你点一个收藏胜过你听 10 首歌
    所以难点就落到你怎么给你的内容分类了
    JeffKing
        2
    JeffKing  
       2018-09-10 11:44:31 +08:00 via iPhone
    简单点的是给每个数据人工标注,然后根据用户日常行为统计不同 label 的权重,再进行推送。 进一步的话,用无监督学习比如聚类啥的对数据进行归类,后续步骤相同,好处是不需要专家特征,并且能够挖掘出隐藏特征,推送更玄学一些。 另外还能根据业务需求定义特殊权重规则,举个栗子:据传闻加拿大某最大视频网站是根据用户浏览完某视频后关闭整个网站,给该视频赋予最大权重。手动狗头。
    zhusimaji
        3
    zhusimaji  
       2018-09-10 11:50:19 +08:00 via iPhone
    Baseline 算法可以参考 user based cf 深入的就要结合用户画像和推荐的物品关联组合一起推荐
    coderluan
        4
    coderluan  
       2018-09-10 11:52:08 +08:00
    专业基础还行的话,找本机器学习的书(《机器学习实战》?),看两章你就有思路了,先随便找个属性做下监督学习就行了。
    zhzer
        5
    zhzer  
       2018-09-10 11:55:11 +08:00 via Android
    最好还是让发布用户自己打 flag,然后作品热度推荐+浏览用户偏好推荐
    lg201
        6
    lg201  
       2018-09-10 13:01:33 +08:00 via Android
    LZ 请了解一下 k 最临近分类算法
    bucuoo
        7
    bucuoo  
       2018-09-10 14:00:04 +08:00
    1.通过"商品属性"对"商品"进行归类;
    2.通用户行为去划分用户群体;
    3.用力推。
    了解下基础的 K-means + Slope one
    Vespa
        8
    Vespa  
       2018-09-10 14:25:50 +08:00
    可以去看《推荐系统实践》这本书,入门还行。

    如果冷启动问题你们可以解决的话。。前期可以直接上最简单的 user-CF 或者 item-CF。。
    shoumu
        9
    shoumu  
       2018-09-10 14:35:20 +08:00
    https://36kr.com/p/5114077.html

    可以看看,但是估计比这个复杂得多
    MoonWander
        10
    MoonWander  
       2018-09-10 14:48:35 +08:00
    协同过滤是 baseline,这个能弄上线了效果就不会差多少了,之后的效果提升基本就是几个点几个点这样往上提升了
    thedog
        11
    thedog  
       2018-09-10 16:40:34 +08:00 via Android
    cf knn 搜这个关键词,作为 baseline
    Geraltt
        12
    Geraltt  
       2018-09-10 18:17:33 +08:00 via iPhone
    @JeffKing 某 pxxhub 手动滑稽。
    zzj0311
        13
    zzj0311  
       2018-09-11 11:01:45 +08:00 via Android
    算法都有现成的啊,调调库随便融合一下就足够交差了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2826 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 08:42 · PVG 16:42 · LAX 00:42 · JFK 03:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.