【摘 要】
:
在复杂网络的分布式环境中,精准全面地采集海量用户在浏览网站过程中的行为数据和网站过程数据并高效存储是用户行为分析的前提和基础.为了解决数据类型的多样性和存储的差异
【机 构】
:
北京航空航天大学 计算机学院,北京,100083
论文部分内容阅读
在复杂网络的分布式环境中,精准全面地采集海量用户在浏览网站过程中的行为数据和网站过程数据并高效存储是用户行为分析的前提和基础.为了解决数据类型的多样性和存储的差异性问题,提高数据的检索效率,为企业的个性化需求做用户行为的分析提供支持,设计了白盒模式的用户痕迹采集存储系统.用户访问Web服务器过程中会产生交互/交易数据以及用户操作,浏览网站过程中会产生图片、视频、商品描述等多种类型的文件,这些界面和数据称为用户浏览痕迹,操作序列则作为用户行为的实际动作顺序记录.对用户数据和操作序列分析,能精确反映用户特征.采集模型通过界面窗口树来建模,提供统一数据存取接口,根据数据类型的不同,分别存储于不同的位置,完整采集用户痕迹,应用程序传递参数指定存储位置创建数据库文件,通过存取接口可以分类型、按要求存取用户数据,解决了面向互联网的用户交互痕迹捕获、存储和检索的问题,具有良好的精确性和完整性.
其他文献
为研制稳定的 6%多杀霉素·苏云金杆菌悬浮剂,采用流点法对悬浮剂的润湿分散剂进行了初筛,利用黏度法和粒径法确定了润湿分散剂的最佳用量.6%多杀霉素·苏云金杆菌悬浮剂的最佳
讨论了铝型材厂污泥脱水效果达不到预期的原因,阐述了国内外污泥常用的物理、化学脱水调理技术,并对污泥联合脱水调理技术进行了展望.
北京法海寺因其国宝级壁画而闻名,壁画所在的大雄宝殿在经历了580年历史巨变后其结构状况不容乐观.对大雄宝殿的结构进行解析,指出其主要结构外观缺陷,对木构架变形检测结果
针对飞行器控制电路在生产制造过程中可能引入金属线头等微小多余物,从而留下短路等安全隐患的问题,提出了一种基于微粒碰撞噪声检测(PIND)的飞行器多余物材质识别方法.首先,
针对飞机燃油系统方案设计阶段截面连续变化的飞机油箱,提出了具有截面自适应性的燃油质量特性计算方法.首先根据飞行姿态和过载计算油面法向量,确定最低油面位置;然后根据等
小型菱形翼无人机起飞滑跑面临着简陋跑道条件带来的干扰和自身非线性因素影响的问题,现有控制方法对无人机起飞滑跑的滚转控制重视不足.针对该问题,以某型菱形翼无人机的起
为了数值求解二维Euler方程,以间断有限元方法作为空间离散、向后差分公式(BDF)作为时间离散.针对采用牛顿法求解源于隐式时间积分的非线性方程组,构造了相应的Jacobi矩阵,其
为了提高滑翔再入飞行器响应动态任务的能力并提高其制导系统的鲁棒性,建立了高超声速滑翔再入轨迹规划问题的一种在线求解算法.该算法以一列凸子问题来逼近原问题.通过选择