February 28, 2024

Yennefer Cluster c1.8.1

안녕하세요. Mondrian AI입니다. 이번 c1.8.1 업데이트는 지난번 업데이트 된 대시보드에 대한 고도화를 진행하고 더불어 사용자 상세페이지, 프로젝트 상세페이지 등의 상세정보에 대한 업데이트를 진행하였습니다.

Admin 대시보드 GPU 활용 데이터 다운로드 추가

기존에 업데이트 된 대시보드에서 자원 활용에 대한 데이터를 다운 받을 수 있었지만 GPU 활용에 대한 데이터 다운로드는 제공하지 않았습니다. 이번 업데이트를 통해 플랫폼에 설치된 전체 GPU에 대한 할당량, VRAM 활용량을 조회할 수 있을 뿐 아니라 GPU 하나하나의 VRAM 활용량 데이터까지 다운로드 할 수 있도록 기능을 업데이트하였습니다. 이를 통해 관리자는 어떤 GPU가 현재 사용되고 있고 자원을 어느정도 활용하고 있는지 더 자세하게 확인할 수 있게 되었습니다. [그림 1]

<그림 1 - GPU VRAM 활용 추이 엑셀 다운로드 기능>

엑셀 다운로드 버튼을 클릭하여 조회하고자 하는 날짜를 선택하면 엑셀 데이터 파일이 다운로드 됩니다. 어떤 페이지에서 엑셀 파일을 다운로드 받았는지에 따라 데이터 내용이 바뀌게 되는데, 프로젝트에 대한 데이터를 다운받는다면 프로젝트에 할당된 모든 자원(CPU, Memory, GPU)의 할당량, 활용량 데이터가 출력되고, GPU에 대한 데이터를 다운받는다면 해당 GPU의 VRAM 활용량 데이터만 출력되게 됩니다. [그림 2]


<그림 2 -엑셀 다운로드 데이터 예시>

사용자 상세페이지 및 프로젝트 상세페이지 고도화

기존 Yennefer Admin에서 사용자 조회와 프로젝트 조회간의 상관 관계가 모호했습니다. 한 사용자가 생성한 프로젝트를 조회하는 기능이 존재했지만 그로 인해 도출할 수 있는 인사이트가 부족했고 특히 어떤 사용자가 자원을 많이 사용하고 있는지 확인하기가 어려워 관리자가 플랫폼을 관리하는데에 어려움이 존재했습니다. 이를 개선하고자 사용자 상세페이지를 추가하였습니다. [그림 3]


<그림 3 - 사용자 상세페이지>

Admin - 사용자 목록에서 사용자를 선택하면 사용자 상세페이지로 접근할 수 있습니다. 사용자 상세페이지에서는 해당 사용자의 계정 정보와 자원 그룹, 권한을 조회할 수 있고 해당 사용자가 생성한 프로젝트를 한번에 조회할 수 있습니다. 이를 통해 해당 사용자가 플랫폼내에서 사용중인 자원량을 조회할 수 있어 관리자는 한결 수월하게 자원을 관리할 수 있습니다. 또한 해당 사용자의 자원 활용 추이를 조회하고 다운로드하는 기능도 제공하여 더 심도있게 데이터를 조회할 수 있습니다.


<그림 4 -프로젝트 상세페이지 대시보드 고도화>

프로젝트 상세페이지에서는 기존에 출력되던 Grafana 대시보드를 이번에 업데이트 된 대시보드로 변경하여 디자인 통일성을 갖추고 자원 활용 추이 및 데이터를 다운받을 수 있도록 기능을 추가하였습니다. [그림 4]

Studio 모니터링 및 시스템 로그 추가

기존 Studio의 개선 사항으로 지목된 것 중 하나가 사용자가 현재 어느정도의 자원을 사용하고 있는지 본인이 알 수 없다는 점이었습니다. 사용자에게 할당된 자원은 정해져 있는데 어떤 프로젝트에서 자원을 많이 사용하고 있는지 알 수 없어 프로젝트를 활성화하고 실행하는데 불편함을 겪는 사용자가 존재하였습니다. 이를 해결하기 위해 프로젝트 상세페이지에 모니터링 탭을 추가하여 해당 프로젝트가 사용중인 자원량을 조회할 수 있도록 기능을 추가하였습니다. [그림 5]


<그림 5 - Studio 상세페이지 - 모니터링 탭>

또한 프로젝트의 활성화/비활성화에 대한 성공/실패 로그를 확인할 수 있도록 시스템 로그 탭을 추가하였습니다. 간혹 프로젝트 활성화 단계에서 예기치 못한 에러로 인해 정상적으로 서비스를 사용하지 못하는 경우가 발생하였는데 사용자들에게 어떤 문제로 인해 활성화 되지 않는지, 또 언제 활성화 됐고 언제 비활성화가 되었는지 기록을 확인할 수 없었습니다. 이를 해결하기 위해 시스템 로그 탭에서 프로젝트 활성화/비활성화 요청에 대한 기록을 남기고 성공/실패 결과를 보여주어 언제 활성화/비활성화 되었는지 확인할 수 있게 하며 요청에 실패한 경우 그 이유를 기록하여 사용자들이 관리자의 개입 없이도 자체적으로 조치를 취할 수 있도록 로그 페이지를 추가하였습니다. [그림 6]


<그림 6 - Studio 상세페이지 - 시스템 로그 탭>

우리는 디지털 전환을 넘어, 인공지능 전환을 가속화하여 산업환경에서의 혁신을 주도합니다.
효율적인 프로세스를 통해 복잡한 데이터 속에서 의미를 발견하고 이를 효과적으로 분석 및 표현하여 데이터의 가치를 극대화 합니다.
인공지능 플랫폼 Yennefer(예니퍼)로 비즈니스적 가치를 실현함으로써 고객을 만족시키는 Mondrian AI가 되기 위해 오늘도 힘차게 달려가고 있습니다.

더 나은 미래를 위해 발전해 나가는 Mondrian AI에 많은 기대 부탁드립니다!

Beyond Digital Transformation
We Accelate AI Transformation