spaCy 是一个用于自然语言处理(NLP)的开源库,主要面向 Python,提供分词、词性标注、依存句法分析、命名实体识别等功能,常用于构建实际应用中的文本处理流水线。(在一般英语里 spacy 也可作形容词,意为“恍惚的、飘飘然的”,但此处多指 NLP 工具 spaCy。)
/ˈspeɪsi/
I used spaCy to tokenize the text.
我用 spaCy 对文本进行了分词。
SpaCy makes it easier to build an NLP pipeline that extracts entities and relationships from large collections of documents.
spaCy 让构建 NLP 流水线更容易,可以从大量文档中抽取实体和关系。
spaCy 是一个产品/项目命名(专有名词)。其拼写风格(中间大写 C)常被解释为强调其实现背景(Python 生态与性能优化组件,如 Cython),整体读音通常按英语单词 “spacey/spacy” 来读(/ˈspeɪsi/)。