V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  iseki  ›  全部回复第 1 页 / 共 46 页
回复总数  920
1  2  3  4  5  6  7  8  9  10 ... 46  
5 小时 28 分钟前
回复了 zyxcompany 创建的主题 职场话题 不知道为什么国内招聘第一眼看的是学历不是能力
@mrzou007 错了,这桌子可不是我自己要上的。至于再开台,让别人适应下不一样的秩序,我非常有兴趣。
看想不想去,上班不是赌气🥰
13 小时 17 分钟前
回复了 zyxcompany 创建的主题 职场话题 不知道为什么国内招聘第一眼看的是学历不是能力
@FranzKafka95 这就是你不懂了,楼主说的是市场的事实,也是短期来看无可改变的事实。凭什么要我付出成本嘛🥰🥰🥰
22 小时 31 分钟前
回复了 zyxcompany 创建的主题 职场话题 不知道为什么国内招聘第一眼看的是学历不是能力
所以不要再纠结怎么办了,我觉得献才是解决方案
以后比的一定是献力
没有用,事实就是,学历已经足够卡掉一切了,所以,献,才是唯一解决方案🥰
4 天前
回复了 54qyc 创建的主题 职场话题 互联网还有出路吗?
@sagaxu 40 岁前攒 300 万太困难了,基本只有互联网大厂的人能做到,小厂每月领着一万多块钱的工资,扣除硬性成本一年十万块都攒不到的
首先,不严谨地说,东西只要在客户端就可以被破解。其次,Java 这边你要想尽量提高逆向工程难度,看看 GraalVM Native Image 吧
@xuanbg

1. 已经发出去的 token 怎么办
2. 改动内容多半比开始就用 JWT 要大
@laminux29 pg 的实际做法,可以看做(我没读代码,只说等效结果),按 3gram 输出的所有条目去查 gin 索引,对结果 recheck 。这种做法不可能出现漏掉数据的情况。
@dejavuwind 对的,similarity 就是明确的模糊查询,这个 case 显然要求的是精确查询
@laminux29 …你要不自己下载个 pg 试一下
我这个例子只是告诉你 k-gram 是个啥东西,不是说 pg 只会从这几个值里挑一个去找索引。
@dejavuwind 你用的是相似度,我说的是 LIKE '%keyword%',咱俩说的不是一个东西啊
@laminux29
```
select show_trgm('12345');
show_trgm
---------------------------------
{" 1"," 12",123,234,345,"45 "}
(1 row)
```
这个东西的分词是 "12345" -> "123", "234", "345" 这种策略的,不会有你说的那种问题

@laminux29 存在类似风险时(比如输入长度小于 3 或者因为字符编码等问题没法搞),PG 会直接回退,放弃这个索引
@laminux29 PG 的这个 trigram + GIN 很粗暴,不会有假阴性问题,缺点就是读放大有点大。
这个需求最大的问题是,如果不加其他限定条件,那就必须考虑当输入的 keyword 很短时,召回特别大量数据以至于几乎无法使用的现实问题。
@lambdaq PostgreSQL 有个日本人写的扩展,bigm ,2gram
@laminux29 不会有错误结果,现实中都是使用 like %keyword% 搜索,数据库会在使用基于 k-gram 分词的 GIN 索引基础上再做一次 recheck 。
trigram 就是分词,索引是 GIN 或者 GiST 。我们这边线上在用,没什么大问题。
@sagaxu pg 一般这种场景直接用 like ,系统会自动加一个 recheck 解决假阳性
1  2  3  4  5  6  7  8  9  10 ... 46  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2777 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 23ms · UTC 15:11 · PVG 23:11 · LAX 07:11 · JFK 10:11
Developed with CodeLauncher
♥ Do have faith in what you're doing.