Contrail 是一个简单易用的服务器资源和计算平台监控工具。它旨在提供一个高效、直观的监控界面,帮助用户了解各个系统的实时和历史状态。
Note
TODO: 需要更新截图的版本,以及补充新添加的页面截图
点击展开图像
[!NOTE] TODO
点击展开图像
[!NOTE] TODO
根据需要运行的监控项目安装对应的依赖:
pip install -e .[ai4s,web]然后将 config/host_config.json.template 复制为 config/host_config.json,并根据需要修改其中的相关信息。
复制 config/ai4s_config.json.template 为 config/ai4s_config.json,并根据需要修改其中的相关信息。
获取 cookies:
python -m contrail.ai4s.ai4s_login然后在 screenshots/login.png 下查看验证码和动态口令二维码
与浏览器对应的 chromedriver 可以在配置文件中手动指定,或者使用 pip install webdriver-manager 自动下载。
复制 resource/*_usernames.csv.template 为 resource/*_usernames.csv,并根据需要修改其中的相关信息以实现用户名映射功能。其中:
ai4s_usernames.csv用于映射 AI4S 平台中的用户名users_usernames.csv用于映射各个服务器节点的用户名
仅需安装基本的依赖:
pip install -e .同时复制 config/sender_config.json.template 为 config/sender_config.json,并配置相关信息。
仅需安装基本的依赖:
pip install -e .可以通过输入 contrail log 命令观察是否能够得到 json 格式输出以确认安装状态。
在主设备的 config/host_config.json 中添加对应的 ssh 设备信息。可能需要手动激活环境、导入 PYTHONPATH 等,请根据实际情况修改。
启动 web 应用:
streamlit run webapp.py --server.port 3333启动监控:
contrail monitor在运行过程中:
list # 列出所有被监控的设备
remove <device_name> # 移除被监控的设备
reload # 重新加载配置文件
exit # 退出监控例如,若需要更新已有设备的配置,可以直接修改 config/host_config.json 中的相关信息,然后运行:
remove <device_name>
reload运行监控:
python -m contrail.ai4s在主设备开始监听之后,启动 sender:
contrail sender