V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
ddup
V2EX  ›  奇思妙想

打算做一个免费的站内搜索 SAAS 服务 供各站长,静态博客免费使用

  •  
  •   ddup · 2019-07-30 13:40:45 +08:00 · 4658 次点击
    这是一个创建于 1925 天前的主题,其中的信息可能已经有所发展或是发生改变。

    网站自带的基于数据库的站内搜索不论效果还是效率都不如意,所以大战都自建搜索。

    中小网站没有资源或能力自建搜索,所以打算开发一个 SAAS 模式的站内搜索,只需输入一个网址即可创建自己的搜索引擎。

    百度其实也有站内搜索,不过我们后续还会提供一个自动标签云页面,自动从文章提取专有名词等形成标签云,提升网站内链。

    暂时想到这么多。

    各位有什么看法吗?

    15 条回复    2019-08-01 19:15:15 +08:00
    mayne95
        1
    mayne95  
       2019-07-30 14:13:15 +08:00 via iPad   ❤️ 1
    ddup
        2
    ddup  
    OP
       2019-07-30 19:44:24 +08:00
    @mayne95 #1 ELK 有一个被收购的 https://swiftype.com/ 也是做站内搜索,收费。
    zhshch
        3
    zhshch  
       2019-07-30 20:09:07 +08:00
    我前两天也想过类似的站内搜索服务,正好关注一下。没记错的话,swiftype 的中文支持一般。
    ddup
        4
    ddup  
    OP
       2019-07-30 20:14:05 +08:00
    @zhshch #3 swiftype 试了下用是能用,不过收费 $79/月 挺贵的。
    zhshch
        5
    zhshch  
       2019-07-30 20:22:31 +08:00
    面向个人的静态博客的话,79 刀基本就不可接受了。但是静态博客的搜索需求有多大?那么这个服务的目标群体是谁呢?
    hyyou2010
        6
    hyyou2010  
       2019-07-30 21:03:35 +08:00
    用过一点 elasticsearch,真是太麻烦了,对网站本身影响太大,如果有这样的服务应该很不错。
    ddup
        7
    ddup  
    OP
       2019-07-30 21:13:28 +08:00
    @zhshch #5 所有基于数据库搜索的网站、论坛的用户,都用这种需求,比如 Deepin 深度系统论坛,你在里面搜“ surface4 驱动”,搜不到,但是搜“ surface 4 驱动”则能搜到。



    ddup
        8
    ddup  
    OP
       2019-07-30 21:21:27 +08:00
    @hyyou2010 #6 ES 对技术和服务器配置是有要求的,所以有一定门槛,部分站长只能将就用现有的搜索。

    不过百度站内搜索也可以全站收录,所以也可以选择用百度站内搜索。

    所以如果要做,就除了搜索还要有其它亮点出来,目前想到了自动生成标签云。
    kopisee
        9
    kopisee  
       2019-07-30 21:35:58 +08:00 via Android   ❤️ 1
    以前 Swiftype 还有免费版的时候用过,可以自己在标签加入指定属性声明需要被抓取(即能被搜到)的部分。而不需要网站提交数据或引入插件。当然提交数据也可以,提交数据也不用改网页。

    百度站内搜索就是一整页抓取了,全站通用的顶部、底部部分都能被搜到,跟理想的搜索结果不太符合。站内搜索希望主要就是搜标题、内容。
    iambin
        10
    iambin  
       2019-07-30 21:51:23 +08:00
    可以参考一下阿里云开放搜索.真要弄的话要弄 api 哟 ,不然就成玩具了
    ddup
        11
    ddup  
    OP
       2019-07-30 23:30:40 +08:00 via Android
    @kopisee 大体上和 swifttype 一样,不过网页内容是可以过滤掉头尾。
    ddup
        12
    ddup  
    OP
       2019-07-30 23:34:49 +08:00 via Android
    @iambin 嗯,阿里那个也是对个人来说贵,默认傻瓜化输入网址就可以了,api 后续考虑,能免得就尽量免费,然后靠搜索页面的广告收入可持续化发展。
    iambin
        13
    iambin  
       2019-07-31 19:26:52 +08:00
    个人站长? 小网站没有这种需求吧 还有广告 还不如用百度站内搜索,有需求的不是买就是自己弄了。你给我接口 不是太贵的话 我能玩出花来
    ddup
        14
    ddup  
    OP
       2019-07-31 21:31:32 +08:00
    @iambin #13 百度站内搜索已经做的不错了,所以要差异化,做百度站内搜索不太会做的事情。

    目前想到两个:

    # **从网站使用者角度考虑**
    我会制作一个 Chrome 插件,按照这个插件后,浏览某个网站,比如深度论坛,发现搜索不好用,点击 Chrome 插件一键提交,系统自动索引这个网站,索引完成后通过 Chrome 插件替换掉这个网站原来的搜索。
    此时好事情来了,别的用户再到深度论坛搜索时,就会通过我们的系统进行搜索了,这样这个插件就具有实用性,越来越多的用户会安装这个 Chrome 插件,我们的搜索也越来越多的人用,甚至我们自动全网收录流量比较大的网站。

    那用户为什么要装我们的插件不直接用百度?
    1.那你为什么要在这个网站上做站内搜索?
    2.我们和百度、谷歌的区别是,我们是站内搜索,这个网站所有内容照单全收,这个网站上存在的内容都能搜到


    # **SEO 方面**
    自动从正文生成标签云,利于站内收录,后续可能还会自动生成聚合页面
    nicoljiang
        15
    nicoljiang  
       2019-08-01 19:15:15 +08:00
    哈哈,不谋而合。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1423 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 23:45 · PVG 07:45 · LAX 15:45 · JFK 18:45
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.