kubernetes(1.8.3)系列之搭建EFK(Fluentd+Elasticsearch+Kibana)

Posted on 2018-02-07(星期三) 15:54 in Data • Tagged with 大数据, 容器编排, efk, Fluentd, kubernetes, kibana

docker会将stdout和stderr输出本机的一个目录下,一般是/var/lib/docker/contianers(也可能是/opt/docker/containers/,根据安装方式不同而不同), kubernetes 默认会将容器的stdout和stderr录入node(minion)的/var/log/containers目录下(最后还是链接到docker的日志路径下),而kubernetes 组件的日志默认放置在/var/log目录下。


Continue reading

kubernetes(1.8.3)系列之calico集成

Posted on 2018-01-04(星期四) 14:50 in Data • Tagged with 深度学习, calico, docker, kubernetes

目前工作试错环境为 k8s(1.8.3)管理下的 tensorflow-1.4.1-compile-py36 docker镜像深度学习集群,说是集群,但平时的工作任务依然是依靠单台跑脚本运行的,GPU的利用率比较低,经过研究,最后决定通过 openmpi-2.1.2 + nccl2 + nccl_2.1.2-1+cuda8.0_x86_64 的技术方案实现GPU的并行计算。但将环境部署到K8S集群时碰到一个问题——在同一个节点中启动的pod可以成功执行,但不同节点间的pods无法成功执行,报错如下:


Continue reading

Kubernetes(1.8.3)系列之GPU配置

Posted on 2017-12-20(星期三) 10:15 in Data • Tagged with 深度学习, docker, kubernetes


Continue reading

tensorflow-gpu-docker镜像安装及部署文档

Posted on 2017-12-15(星期五) 18:01 in Data • Tagged with 深度学习, docker, tensorflow, kubernetes

制作包含有nvidia cuda、cudnn环境的tensorflow-gpu镜像包,并通过portainer手动单点配置及kubernetes集群管理两种方式进行部署。


Continue reading