V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  chenY520  ›  全部回复第 1 页 / 共 5 页
回复总数  90
1  2  3  4  5  
求码
170 天前
回复了 jqtmviyu 创建的主题 macOS 请问有用 macos todesk 的吗
todesk 经常 tm 卡死,真垃圾
@chiu 这不是 bob 嘛
生日快乐老铁!
支持一下!!!!
求个 lifetime ,op 。 emVzcWFxQGdtYWlsLmNvbQ
感觉 ios 计算器一点也不好用
253 天前
回复了 ShikiSuen 创建的主题 iDev 中文分词时该怎样定义被误拆的专有词?
253 天前
回复了 ShikiSuen 创建的主题 iDev 中文分词时该怎样定义被误拆的专有词?
@ShikiSuen #4

import Foundation

// 创建自定义词典,将需要保留的词汇映射到一个数组,以便后续检查
let customDictionary: [String: [String]] = [
"白术": ["白术"],
"大夫": ["大夫"],
"七七": ["七七"]
]

func tokenize(sentence: String) -> [String] {
var tokens: [String] = []
let tagger = NSLinguisticTagger(tagSchemes: [.tokenType], options: 0)
tagger.string = sentence
let range = NSMakeRange(0, sentence.utf16.count)
let options: NSLinguisticTagger.Options = [.omitWhitespace, .omitPunctuation]

tagger.enumerateTags(in: range, unit: .word, scheme: .tokenType, options: options) { (tag, tokenRange, stop) in
let word = (sentence as NSString).substring(with: tokenRange)
if let specialCases = customDictionary[word] {
tokens.append(contentsOf: specialCases)
} else {
tokens.append(word)
}
}
return tokens
}

let texts: [String] = ["有個大夫叫白朮,他有個徒弟叫七七。"]
for text in texts {
let tokens = tokenize(sentence: text)
print("\(text) --> \(tokens)")
}
253 天前
回复了 ShikiSuen 创建的主题 iDev 中文分词时该怎样定义被误拆的专有词?
自定义词典吧
这就是你要贪便宜的后果啊,但是咸鱼也肯定有责任的
感觉和 pandora 类似
op ,这个能耗和 cup 占用率比较高了,看看能不能优化
280 天前
回复了 zetaochen 创建的主题 程序员 求推荐个实用的密码管理器
小白一个,Bitwarden 自建是在服务器上还是可以弄到本地
大佬真牛啊
又来当个分母
296 天前
回复了 nododo 创建的主题 分享创造 电视投屏 APP:《轻松投屏》 送码
emVzcWFxQGdtYWlsLmNvbQ
emVzcWFxQGdtYWlsLmNvbQ
1  2  3  4  5  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2429 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 35ms · UTC 14:44 · PVG 22:44 · LAX 07:44 · JFK 10:44
Developed with CodeLauncher
♥ Do have faith in what you're doing.