전체 글 57

SaaS 에서의 RAG vs. Fine-Tuning 비교!

유용한 AI SaaS Application을 구축하려면 모델이 사용자의 외부 데이터에 액세스할 수 있어야 합니다.  그렇다면, RAG(Retreival Augemented Generation) vs. Fine-Tuning 중 어느것을 사용해야 할까요? 이번 글에서는 SaaS Application 관점에서 두 가지 접근 방식을 비교하고자 합니다.  🤣단순 비교만 원하시는 분은 마지막 Conclusion의 표를 확인하시면 됩니다🤣Introduction Multi-Tenant (클라우드의 하나의 자원을 쪼개서 서비스 사용자에게 제공; 마치 하나의 집을 쪼개서 빌려주는 개념) AI SaaS Application을 구축하려는 경우, Prompt Engineering(프롬프트 엔지니어링)에만 의존하는 한계를 경..

MACHINE LEARNING 2024.06.02

구글 Gemma 사용법

Gemma란? DeepMind, Google이 최근 Gemma를 공개했습니다. 이는 그 이전의 모델들과는 달리 open-weight architecture를 특징으로 하는 최신 대규모 언어 모델(LLM)입니다. https://ai.google.dev/gemma Gemma - Google의 경량형 첨단 개방형 모델 제품군 | Google AI for Developers 오픈소스 경량 언어 모델 제품군인 Gemma를 소개합니다. 빠른 시작 가이드, 벤치마크, Google Cloud에서 학습 및 배포를 살펴보고 커뮤니티에 참여하여 AI 연구를 발전시키세요. ai.google.dev 사용법 Google에서 공개한 LLM 답게 JAX를 사용하여 Gemma를 사용하실 수 있습니다. 물론, Pytorch 혹은 C++..

카테고리 없음 2024.02.25

IOPaint: 딥러닝 기반 이미지 인페인팅 오픈소스 툴 사용법

디지털 아트와 사진의 빠르게 발전하는 세계에서, 완벽한 이미지 편집 도구를 찾는 탐색은 끝이 없습니다. IOPaint는 이미지 편집 소프트웨어의 붐비는 공간에서 눈에 띄는 혁신적인 솔루션으로 등장했습니다. IOPaint란 무엇인가요? IOPaint는 간단한 수정부터 복잡한 이미지 조작에 이르기까지 다양한 요구 사항을 충족시키기 위해 설계된 무료, 오픈 소스, 완전 자체 호스팅 이미지 편집 플랫폼입니다. CPU, GPU, 심지어 Apple Silicon까지 지원하여, 어떤 하드웨어를 사용하든 AI의 전력을 활용하여 이미지를 변형할 수 있습니다. Windows 1-Click Installer를 통해 IOPaint 설정이 간편해져, 모든 사람이 고급 이미지 편집에 접근할 수 있게 되었습니다. 주요 기능: - ..

카테고리 없음 2024.02.18

완전한 오픈소스와 언어모델 / OLMo: Open Language Model

최근 AI2는 Huggingface와 Github을 통해 대규모 언어 모델을 훈련하고 실험할 수 있는 프레임워크를 공개하며 첫번째 오픈 언어 모델(OLMo)를 출시했습니다. 아래 링크는 관련 논문 및 사이트입니다. Github: https://github.com/allenai/OLMo GitHub - allenai/OLMo: Modeling, training, eval, and inference code for OLMo Modeling, training, eval, and inference code for OLMo - GitHub - allenai/OLMo: Modeling, training, eval, and inference code for OLMo github.com 공개 블로그: https://b..

MACHINE LEARNING 2024.02.11

대화형 에이전트(Conversational Agent)란?

대화형 에이전트(Conversational Agent)란? 대화형 에이전트, 종종 챗봇(Chatbot)이라고 불리는 것은 자연어를 통해 사용자와 대화를 시뮬레이션할 수 있는 인공지능(AI) 소프트웨어의 일종입니다. 이러한 에이전트는 메시징 애플리케이션, 웹사이트, 모바일 앱 또는 전화를 통해 사용자와 자연스러운 대화를 나눌 수 있습니다. 대화형 에이전트는 고객 서비스, 요청 라우팅, 정보 수집 및 의료 및 금융 부문에서 증상 확인, 온라인 거래와 같은 작업을 위해 점점 더 많이 사용되고 있습니다. 대화형 에이전트(Conversational Agent)의 유형 대화형 에이전트는 크게 두 가지 범주로 분류될 수 있습니다: - 규칙 기반 에이전트(Rule-Based Agents): 이러한 에이전트는 사전 정의..

카테고리 없음 2024.02.03

논문 리뷰 / RAG VS FINE-TUNING: PIPELINES, TRADEOFFS, AND A CASESTUDY ON AGRICULTURE

Original Paper: https://arxiv.org/abs/2401.08406 RAG vs Fine-tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture There are two common ways in which developers are incorporating proprietary and domain-specific data when building applications of Large Language Models (LLMs): Retrieval-Augmented Generation (RAG) and Fine-Tuning. RAG augments the prompt with the external arxiv.org 본 포스트는 매..

MACHINE LEARNING 2024.01.28

OpenAI Assistant API 활용 예제 (Python Code) / ChatGPT

지난 11월 06일 OpenAI는 DevDay를 통해 새로운 Assistant API를 공개하였습니다. Assistant는 "Code Interpreter, Retrieval, Function calling" 과 같은 다양한 도구를 활용할 수 있습니다. 현재 베타 버전으로, 특정 Instruction과 model selection을 통해 사용자 정의 assistant를 생성할 수 있습니다. Assistant를 활용하는 것은 다음과 같은 절차에 의해 구성됩니다. 1. 어시스턴트 생성 - 어시스턴트에 대한 사용자 정의 지침 정의. - 모델 선택 및 Code Interpreter, Retrieval, Function calling과 같은 도구 활성화 여부 선택. 2. 대화 플로우 - 사용자가 대화를 시작하면 ..

MACHINE LEARNING 2023.11.12

Google, 더욱 강력해진 Bard (19, Sep, 2023)

KEY TAKEAWAYS: Bard Extensions의 도입 "Google it" 버튼 도입 Bard 와의 대화 공유 및 확장 기능 추가 PaLM 2 - 최신 강화학습 기술 적용 https://bard.google.com/updates https://bard.google.com/updates bard.google.com 본문 최근 Google Bard가 업데이트를 했다는 소식이 알려졌다. 이번 업데이트에는 사용자의 편의성을 높이고 기능을 개선하는 다양한 내용이 포함되어 있다. 주요 내용은 다음과 같다. Bard Extensions: 사용자가 Bard의 기능을 사용자 지정하고 확장할 수 있는 기능이 추가되었다. "Google it" 버튼: 사용자가 Bard에게 Google 검색을 수행하도록 요청할 수 있..

카테고리 없음 2023.09.24

Microsoft LIDA 사용법

Microsoft 에서 오픈소스와 함께 제공하는 서비스인 LIDA에 대해 설명하고 사용법에 대해 알아보겠습니다. https://github.com/microsoft/lida GitHub - microsoft/lida: Automatic Generation of Visualizations and Infographics using Large Language Models Automatic Generation of Visualizations and Infographics using Large Language Models - GitHub - microsoft/lida: Automatic Generation of Visualizations and Infographics using Large Language Mode..

NMT with attention / Neural Machine Translation 설명

정의 Neural Machine Translation with attention 을 의역하면 다음과 같다. Sequence(input)에서 어디에 집중하여 인공신경망을 이용한 번역을 할 것인지의 관점에서 구현된 구조 Seq2Seq Architecture 간단히 Seq2Seq 구조에 대해 정리하자. 기존에 정리해놓았던 글을 인용해왔다. Seq2Seq은 시퀀스(sequence) 데이터를 다루는데 주로 사용된다. 가령, machine translation같은 작업에서 주로 사용되는데 영어를 불어로 바꾼다는 등의 task를 수행하기도 한다. 이를 위해 모델은 입력과 출력 간의 sequence mapping을 학습한다. 이 때 위에서 간단히 언급한 바와 같이 모델은 시간적인 의존성(Temporal dependen..