Microsoft 에서 오픈소스와 함께 제공하는 서비스인 LIDA에 대해 설명하고 사용법에 대해 알아보겠습니다.
https://github.com/microsoft/lida
Microsoft LIDA github의 README.md에 나와있는 소개글입니다.
의역을 하자면 다음과 같습니다.
LIDA는 데이터 시각화 및 데이터-충실도 인포그래픽을 생성하기 위한 라이브러리입니다.
LIDA는 문법과 무관하게 어떤 프로그래밍 언어 및 시각화 라이브러리(e.g. matplotlib, seaborn, d3 등)와도 작동하며, 여러 대규모언어모델 제공업체(OpenAI, PaLM, Cohere, Huggingface)와 함께 작동합니다.
한마디로 LIDA란 "LLM기반의 데이터 시각화 자동 처리 프로세스 서비스"이다. 정도로 보시면 될 것 같습니다.
이용법
이용법은 아래와 같습니다.
README.md에서 제공하고 있는 가이드라인을 실제 예시와 함께 보여드리며 따라가보겠습니다.
다음 부분은 OS에 따라 사용법이 다를 수 있으니 참고바랍니다.
작성자는 Unix 계열인 MacOS를 사용했습니다.
terminal을 통해 흐름이 진행됩니다.
1. 우선 pip를 통해 해당 라이브러리를 설치합니다.
pip install lida
2. 설치 완료 이후 환경변수를 설정해줍니다.
export OPENAI_API_KEY=<your key>
OPENAI_API_KEY의 경우 공식 문서에서는 https://github.com/victordibia/llmx를 참고하라고 나와있지만, 사용 편의성을 위해 그냥 OPENAI에서 API KEY를 받아옵니다.
https://platform.openai.com/account/api-keys
3. 환경변수 등록이 잘 되었는지 다음 명령어를 통해 확인합니다.
env
OPENAI_API_KEY={YOUR_API_KEY}
가 env 명령어를 작성했을 때 보여야합니다.
4. 이제 원하시는 task에 따라 해당 라이브러리를 이용하시면 됩니다.
더욱 자세한 내용은 공식 문서를 참조바랍니다.
billing에 따라 서비스가 제한됩니다 참고하세요!
실행 데모 및 예시:
https://microsoft.github.io/lida/
'MACHINE LEARNING > Artificial Neural Network' 카테고리의 다른 글
NMT with attention / Neural Machine Translation 설명 (0) | 2023.05.18 |
---|---|
Time Series Transformer 의미 및 모델 (0) | 2023.05.09 |
Neural Radiance Fields (NeRF) Tutorial in 100 lines of PyTorch code 주석 및 해석 (0) | 2023.04.30 |
Autoencoder VS Seq2Seq 차이 비교 (0) | 2023.04.13 |
TSC / Time series classification 시계열 분류 정리 (0) | 2023.03.10 |