PackOne致力于简化大数据软件在各类云上的弹性部署流程。通过对云API和Apache Ambari API的联合调用,完成Hadoop、Spark、NiFi、PiFlow、Kylin、MangoDB、Neo4J、Redis等流行的大数据管理/处理软件在云端的一键快速部署和一键伸缩。PackOne目前已支持OpenStack、H3CloudOS、EVCloud等私有云系统,以及公有云中国科技云(CSTCloud)。 主要特性包括:
- 以一致的方式在同一个界面上对来自不同云的虚拟机、存储卷、镜像、模版等进行CURD操作。
- 支持在空白虚拟机上完成大数据处理集群的全自动部署。
- 通过将模版集群物化为系统镜像,实现新集群的分钟级快速部署。
- 通过Apache Ambari对已部署的大数据软件进行状态监控、配置管理。
- 通过集群节点的全自动增删,实现各类大数据软件的分钟级弹性伸缩。
PackOne的长期目标是实现serverless式云端大数据处理,即在用户不直接管理云主机实例的前提下,实现大数据软件集群的自动部署和弹性伸缩(集群层)、多源异构数据资源的自动汇聚与自动入库(数据层)、数据库实例的函数式交互分析与流水线分析(space层)。
- Python 3.6, postgresql 10;
- 创建一个postgresql数据库实例,并准备好该实例的以下信息:db_user、db_passwd、db_host、db_port、db_name。 然后运行:
pip3.6 install pk1
pip3.6 install -U pip setuptools
pk1 setup --database $db_user:$db_passwd:$db_host:$db_port:$db_name
($db_*替换为实际值)
docker-compose up
docker exec -it pk1-app /bin/bash
pk1 setup --database pk1:pk1:pk1-pg:5432:pk1
pk1 start [--listening 127.0.0.1:11001]
访问 http://127.0.0.1:11001/clouds/cloud/add/, 填写Openstack相关账户信息,如下图:
访问 http://127.0.0.1:11001/engines/cluster/add/, 选择集群的规格(Scale),如下图所示:
访问 http://127.0.0.1:11001/engines/cluster/, 选择目标集群,在下拉操作列表中选择materialize.../scale... 链接,如下图所示:
与 Step 2 类似, 访问 http://127.0.0.1:11001/clouds/cloud/add/。区别在于,此处选择的规格(scale)名字不带'boostrap'。
pk1 stop
pk1 uninstall
国家重点研发计划: 科学大数据管理系统(No.2016YFB1000600)