论文部分内容阅读
随着机器学习和人工智能的快速发展,越来越多的开发者开始投入到该领域的学习和开发中来,很多传统行业也开始将数据科学引入到日常的运营生产活动中。然而并不是所有人都具备快速上手机器学习的能力,很多传统行业的工程师缺乏相应的基础,难以从数据中提取有效的价值。为了解决机器学习领域的入门难度大的问题,已有许多厂家推出基于公有云计算服务的机器学习托管平台,例如阿里的PAI平台、亚马逊的SageMaker等。但这些平台均需要上传数据,对于一些数据敏感型企业,将数据放在公有云平台不利于数据的安全保存,且运算资源昂贵,流量开销极大,不利于工程化的模型部署。基于私有云平台的快速机器学习模型开发平台成为了解决工程化痛点的途径。天数机器学习一体机系统是一个针对特定学校或企业的机器学习平台。封装了底层skydiscovery的核心功能并且为用户提供了完备的管理功能。整个系统分为流云平台、应用管理、文件管理、用户管理、资源管理、ide管理、镜像管理7个模块。可以帮助开发人员快速轻松地构建、训练和部署任何规模的机器学习模型,并且为管理员提供群组用户管理和总体资源管理的功能。整个系统采用B/S的架构风格,前端部分是基于vue构建的单页面应用,采用了组件化的开发方式,并且引入了 vuex来管理前端数据流。后端利用Flask构建简单的web服务器提供相应的接口。本文首先阐述了一体机系统开发的背景,描述了论文的主要工作。然后介绍了开发过程中使用到的主要技术。接着针对每个模块进行了详细的需求分析。然后从前端架构和组件角度对系统进行了总体设计,并且由需求分析的结果对重点模块进行了详细设计。基于设计方案,结合代码和运行界面描述了总体和模块的实现关键点。最后,针对一体机系统的现状做出了总结和展望。