前端、后端小白
现状:
做了个谷歌插件,功能是爬取购物网站的数据,自动化处理批量重复任务; 目前是在用户自己电脑上爬数据,有些不能使用 cookie 权限的浏览器只能新开一个标签页进行爬取,用的全是 DOM 操作,感觉这种做法很 low ,数据存储在浏览器 IndexedDB 中
疑问:
- 购物网站的数据存在时效性,超过一天数据可能就没用了,是否有必要做成服务端爬取?看竞品好像都是服务端爬取的,前端只是给用户一个 web 界面进行操作,号称几十万速度,是怎么做到的?
- 存储的话,大量数据是如何做存储的?
- 我可以有什么方案进行优化?
感激不尽!