
个人中心模块的作用在于管理用户个人相关的信息及资源。 主要包括:我的资源、我的消息、我的分享和团队管理。
鼠标悬停在顶部导航栏的用户名上, 点击弹出的下拉框中的 【个人中心】
即可进入。
如果是从Sophon Data数据探索、Sophon Discover编程式建模、Sophon VLab可视化建模或者Sophon MLOps进入个人中心,个人中心前会标注该产品的名称,比如“数据探索/个人中心” |

我的分享
“我的分享”模块覆盖了数据集、实验、代码和模型的分享。每个部分都包括“我已分享”和“与我分享”两类。

我的资源
这个功能模块帮助用户实时了解自己的各类资源的使用情况(包括使用量和上限),以此帮助用户更好的管理自己的资源。
Spark资源
展示用户可以使用的资源池(会受限于该用户所属用户组的资源池使用上限)。

存储资源
帮助用户了解自己的存储资源使用情况和资源上限(如下图所示)。

GPU监控(仅当TCOS≥3.0时)
如果TCOS版本≥3.0,那么个人中心的我的资源模块提供GPU监控功能,用于监控当前用户有权限使用的GPU资源。
页面最顶部是筛选栏,支持选择节点、GPU和时间区间,这里的筛选条件会应用于整个页面。

GPU监控页主要由三个部分组成:GPU算力监控、GPU内存监控和Pod列表(所有使用了GPU的Pod)
-
GPU算力监控
GPU算力监控包含:
-
GPU算力平均使用率:
GPU算力平均使用率=正在使用的算力/总算力,这个值会实时更新。
如果值在60%~80%间,则进度显示为黄色,如果值在80%以上,则进度显示为红色,提示有GPU算力不足的风险; -
GPU算力概览:
此处展示GPU算力在各个时刻的使用量; -
GPU算力使用详情:
此处展示筛选栏选中的各个GPU的实时算力,包括正在使用的GPU算力、已分配出去的GPU算力和GPU算力总量。
-
-
GPU内存监控
GPU内存监控包含:
-
GPU内存平均使用率:
GPU内存平均使用率=正在使用的GPU内存/GPU内存总量,这个值会实时更新。
如果值在60%~80%间,则进度显示为黄色,如果值在80%以上,则进度显示为红色,提示有GPU内存不足的风险; -
GPU内存概览:
此处展示GPU内存在各个时刻的使用量以及总量; -
GPU内存使用详情:
此处展示筛选栏选中的各个GPU的实时内存,包括正在使用的GPU内存、已分配出去的GPU内存和GPU内存总量。
-
-
Pod列表
Pod列表处展示筛选栏选中的各个GPU上的所有Pod,并且展示各个pod的算力和显存使用情况。其中,其他用户的Pod求和展示,仅展示算力和显存使用情况,不展示详细信息。
点击“详情”按钮,可以进一步监控各个Pod的GPU使用情况。
Pod详情页支持选择时间区间,并且展示该Pod实时的算力和内存使用情况,以及最近一段时间的算力和内存使用情况。
如果Pod的启动时间小于时间区间长度,则右侧折线图只会显示从Pod启动到现在的情况。比如选择了展示“最近7天”,但是Pod实际上只启动了5分钟,那么折线图只会展示最近5分钟的变化情况。
GPU资源管理(仅当TCOS≥3.0时)
如果TCOS版本≥3.0,那么个人中心-我的资源模块提供GPU资源管理功能,用于查看当前用户有权限使用的GPU组。

点击任一GPU的“详情”按钮,可以查看当前用户在该GPU上的Pod信息。

只有管理员可以新建GPU组,并把GPU组分配给用户组。对应的页面是管理中心-集群资源管理-GPU资源管理。 |
如果TCOS版本≥3.3.1,则列表中会展示GPU是否开启了“无限额共享”功能。开启了“无限额共享”的GPU,允许用户不设置GPU算力和显存,直接共享GPU资源。

Notebook实例
支持查看集群及其对应的Notebook实例,并支持停止实例。

我的消息
“我的消息”模块主要展示用户各方通知消息,目前仅支持模型服务上下线等审批消息以及系统更新消息等。我的消息包含未读消息、已读消息两部分。

1.未读消息
所有用户接受到的未读消息均展示在该页面,支持查看、删除、批量删除以及全部标记已读操作。

点击列表 【查看】
操作,即进入消息详情页面。

点击 【全部标记已读】
操作,即默认读取消息,此时未读消息界面为空,用户可至已读消息界面去查询。
2.已读消息
已读消息支持查看、删除及批量删除操作。删除之后的消息无法复原。

团队管理
“团队管理”模块主要为项目协作功能做辅助,当发起项目协作之前,需要先创建好将要协作的团队,加入相应的团队成员。支持创建者解散团队群组,也支持成员退出群组。
