similarity matrix(相似度矩阵):一种用矩阵形式表示“对象两两之间相似程度”的数据结构。矩阵中的第 (i,j) 个元素通常表示第 (i) 个对象与第 (j) 个对象的相似度(常见于信息检索、机器学习、聚类、推荐系统、自然语言处理等)。很多情况下该矩阵是对称的,且对角线元素常为最大值(例如 1)。
/ˌsɪməˈlærɪti ˈmeɪtrɪks/
The system builds a similarity matrix for all users.
系统为所有用户构建一个相似度矩阵。
After embedding the documents, we computed a cosine-based similarity matrix and used it to cluster articles by topic.
在对文档做向量嵌入后,我们计算了基于余弦的相似度矩阵,并用它按主题对文章进行聚类。
similarity 来自拉丁语 similis(“相像的、类似的”),表示“相似性”。matrix 源于拉丁语 matrix(与 mater“母亲”同源),原义与“母体/孕育之物”相关,后来在数学中引申为“承载与组织数据/关系的表格结构”,因此 similarity matrix 字面可理解为“承载相似关系的矩阵”。