论文部分内容阅读
文件语义在优化大规模证明了有效分布式的文件系统。作为在上面的层应用程序和文件系统之间的精致、富有的 I/O 接口的后果,文件系统能提供有用、深刻的信息关于语义。因此,文件语义采矿在工程和研究社区成为了一个日益重要的惯例。不幸地,利用文件是挑战语义知识因为许多因素能影响这信息探索,处理。甚至更坏,挑战由于在这些因素之间的复杂互相依赖被加重,并且使充分在各种各样的语义知识之中利用潜在地重要的关联困难。在文件在向量以内被当作一个 multivariate 向量空格,和每个项目的地方,这篇文章建议文件存取关联 m