V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  laminux29  ›  全部回复第 3 页 / 共 98 页
回复总数  1945
1  2  3  4  5  6  7  8  9  10 ... 98  
@sockpuppet9527

倒排索引不是用来解决楼主这个需求的。建议仔细看一下倒排索引的说明,然后找几个物流单号,用这种方法试试,你就明白了。
@iseki

分词与近似策略是无法精确处理这类需求的。所以我在开始就说了,这类需求,就没办法用索引。

recheck 只能解决假阳性,解决不了假阴性。

你说你们这边线上在用,没什么大问题,那是因为你们没发现问题,而且用户也没汇报。不仅如此,就连大电商平台,比如淘宝京东的历史订单号的搜索,因为他们采用分词搜索,所以他们也没办法实现这个需求。
@sockpuppet9527

这玩意也是分词机制,你仔细看看你发的链接。分词与近似策略是无法精确处理这类需求的。所以我在开始就说了,这类需求,就没办法用索引。

业内目前应对这部分问题,第一是不处理。很多电商平台通过关键字搜索历史订单时,会发生这种情况,搜不出来;然后是通过剪枝需求去做的,比如银行只允许搜最近 3 个月的交易记录。
@alansfinal

那篇文档的意思是,pg_trgm 这玩意本质上是类似于全文搜索的,需要预先对自然语言的词汇进行处理,所以无法处理非词汇的结果,也就是纯数字是处理不了的。

而且这还是一种近似搜索,会有错误的结果,并不是 LIKE %keyString% 这种精确搜索。
@iseki

它后面写了 non-alphanumerics
@skinny

OP 是希望用纯数字字符串当成子串来进行搜索,或者更严谨来说,是匹配,而且还不限定位置。这种匹配,在算法与数据结构的层面,是没办法加索引的,只能蛮干,这也是为什么这类业务很少见,而且搜索引擎对这种搜索也没办法做到高精准度。
@lmshl

如果你看不懂 10 楼发的英文,可以试试翻译软件。
1.防止爬虫。

2.手机上有你的个人信息,更容易做信息收集与广告推荐。
另外,是否考虑修改需求,比如淘宝业务,用户的查询范围只是自己的订单,菜鸟驿站老板查询的范围只是他的驿站范围,那么可以通过剪枝 + 数据冗余的方法,空间换时间,能控制到一个比较理想的性能范围。

然后查询接口,再按时间进行分区:最近 3 个月内是默认查询,如果要查询所有时间范围,就让他们排队查询,或查询结果异步通知。
这种需求,是没办法用索引的,所以无论什么数据库,包括 ES 、Click House 、Redis 、PG 甚至 Oracle ,都不好使,只能用硬件去硬抗。2 楼老哥说对了。

可以使用基于区域或散列,进行分片,用很多物理机去扛,每台物理机扛一个分片。简单一些可以用 MongoDB ,天生分布式 + 分片。需要高性能那就用 Redis 集群,大内存,数据提前加载到内存里。

话说回来,这种需求,虽然提高了用户体验,但真的烧钱。公司没钱的话,不建议这么做。
@lmshl 笑死,你发的东西,你都不看一下嘛?

pg_trgm ignores non-word characters (non-alphanumerics) when extracting trigrams from a string.
生产力有多屏电脑,大屏影音娱乐有平板,出差有轻薄本,一直不明白折叠手机有何意义,而且这玩意还会降低续航、增加重量、增加操作麻烦程度。

我身边倒是很多中产女第一时间买了这玩意。
os.chmod('/usr/local/test', 0o644) 时,执行这行命令的用户是?

应用程序中通过 wget 下载文件时,执行 wget 的用户是?
54 天前
回复了 fqzz 创建的主题 NAS 求助一个 Qnap 交换机的网络问题
去 0daydown 下载一个 Cisco Packet Tracer ,把你家里的 PC 、交换机、路由器,搭建出来。这软件有调试模式,能以可视化跟踪数据包,数据包断在哪里一目了然。

一般来说,要不就是 vlan-id 不对,或者 trunk 口忘了允许相关 vlan-id ,或者是没用高级自动化路由协议的情况下,忘了写路由规则。
想体验苹果系统,在虚拟机上安装就行了。没有刚需,跟风上 Mini M4 是纯纯的智商税。

你想打游戏,应该买 7945HX ,板 U 一套只要 2500 元,但总跑分是 M4 的 1 倍,而且最大能上 64GB 内存,有 2 个 nvme 插槽。
55 天前
回复了 laminux29 创建的主题 宽带症候群 Cisco Packet Tracer 这玩意毛病有点多
@07212423 EVE-NG 、PNetLab 不能给第三方镜像的设备存档,这太坑了,每次加载存档,所有第三方镜像的设备,都要重做一次配置。
56 天前
回复了 wkj89 创建的主题 Apple 3580 拿下 Mac Mini M4
@ProvinceV

楼上那些人,有几个人会去查跑分、查功耗、查最大内存、查 nvme 接口数量的,有几个人在购买前会先去 B 站与油管搜测评的。

并不是众人皆醉我独醒,而是精英数量就是少。
56 天前
回复了 wkj89 创建的主题 Apple 3580 拿下 Mac Mini M4
5 万总跑分的地表最强移动 U 7945hx ,板 U 2500 元不去抢,花 3 千 5 去买跑分只有一半的 M4...而且楼上还有一群人眼馋的。

想不明白这帮人的脑回路。现代信息牢笼?
J4105 与 rk3399 ,性能都很差,半斤八两:

https://www.cpubenchmark.net/compare/3159vs6239/Intel-Celeron-J4105-vs-rk3399

但 J4105 是正规 x86 CPU ,有各种硬件加速指令集加持,体验当然比 ARM 好一点点,但不多。

你想要性能,至少搞台 11 代 i7 的工控机来当软路由吧。
国内这种人多着去了。隔壁帖子还有一堆人用家宽跑 PCDN 的,这种行为需要全体家宽为其买单。
1  2  3  4  5  6  7  8  9  10 ... 98  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2792 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 39ms · UTC 13:37 · PVG 21:37 · LAX 05:37 · JFK 08:37
Developed with CodeLauncher
♥ Do have faith in what you're doing.