V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
bobobo80
V2EX  ›  程序员

不同源商品名匹配应该如何处理?

  •  
  •   bobobo80 · 2018-08-08 21:55:46 +08:00 · 1460 次点击
    这是一个创建于 2059 天前的主题,其中的信息可能已经有所发展或是发生改变。

    问题:

    假设同一类商品,在 A 网站叫 XXX-abc-123,在 B 网站叫 XXX-123-abcd,叫法上有微小差别,从 A 和 B 抓取到的数据汇总到一起,怎么把对应一致的商品匹配起来呢?

    举例:

    • 比如同一款笔记本电脑,在 A 网站叫'Apple MacBook Pro 13.3 英寸笔记本电脑 银色 配备 Touch Bar 2018 新款(四核八代 i5 8G 256G 固态硬盘)',在 B 网站叫'Apple/苹果 13 英寸 2018 MacBook Pro 触控栏和触控 ID 2.3GHz 处理器 256GB 存储容量'
    • 或者同一款冰箱,在 A 网站叫'海尔( Haier ) 452 升风冷无霜对开门冰箱 90 度开门 66.5cm 纤薄机身 低温净味 双温双控 BCD-452WDPF',在 B 网站叫'海尔 风冷无霜-对开门冰箱 452 升 BCD-452'
    • 或者同一款车,在 A 网站叫'大众 宝来 2019 款 1.5L 自动舒适型',在 B 网站叫'一汽大众 宝来 1.5L AT 舒适型 2019 款'

    像这种不同来源,同一种商品,但是名字中的组成、顺序、包含关系、个别细节有所不同的情况,一般是使用什么算法把对应关系进行匹配的?求指点。

    4 条回复    2018-08-13 09:39:54 +08:00
    yunye
        1
    yunye  
       2018-08-09 04:03:19 +08:00 via Android
    品牌型号不知道吗
    ryd994
        2
    ryd994  
       2018-08-09 06:50:26 +08:00 via Android
    没有太好的办法
    Google shopping 也没完全解决这个问题
    coeo91
        3
    coeo91  
       2018-08-09 10:44:37 +08:00 via Android
    专门类的一个一个指定?京东第三方就是全展示。
    bobobo80
        4
    bobobo80  
    OP
       2018-08-13 09:39:54 +08:00
    @coeo91 手工一个个指定吗?那工作量好大吧。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2874 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 1042ms · UTC 13:46 · PVG 21:46 · LAX 06:46 · JFK 09:46
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.