用于执行数据科学的大数据分析虚拟机。它为那些使用Data Science的大数据分析方面的人提供了巨大的启动。从本质上讲,该项目可以自动在虚拟机(VM)上创建大数据科学家的工具箱。几分钟后,您就可以开始使用完全配置的数据科学实验室,而不是执行正常运行的开发环境所需的复杂安装和配置。 Data Scientist的VM预装了R,Git,Python,Cloudera,Hadoop,YARN,MRv2,Mahout,MongoDB,Spark,Neo4j等。使用Vagrant DevOps工具和VMware Fusion的Chef-shell脚本,可以在单个CentOS VM上自动为您构建Data Scientist的Toolbox VM。