반응형

분류 전체보기 60

ML / Metric 종류 및 특징 정리

Metric 종류 및 특징 일반적으로 ML(Machine Learning)에서는 모델의 category에 따라 Metric을 각각 다르게 정의합니다. 말 그대로 하는 일들이 다르기 때문에 평가 기준의 역할을 하는 Metric이 달라집니다. 대표적으로 사용되는 Metric 몇가지를 각 cateogory별로 정리하겠습니다. ML의 대표적인 task는 다음과 같이 정의됩니다. Classification Regression Ranking Statistical CV (Computer Vision) NLP (Natural Language Processing) Deep learning related etc... 해당 포스트에서 언급하지 않은 Metric도 다수 존재합니다. 모든 평가기준을 다룰 수는 없으니 대표적인 ..

CS / 정규표현식 정리

정규표현식 : REGEX (REGular EXpression) 거의 대부분의 프로그래밍 언어에서 지원하는 정규표현식은 custom하게 원하는 string의 정보를 추출하는 데 탁월한 능력을 보입니다. 정규 표현식에서 사용하는 Meta characters에는 다음과 같은 것들이 있습니다. . ^ $ * + ? { } [ ] \ | ( ) 정규표현식은 이런저런 정리를 보는 것보다 Cheatsheet를 보고 직접 예제를 작성해가며 배우는 것이 효과적이라고 생각합니다. (일단 복잡해지면 뭔 소린지 이해가 어려움, 사람마다 문제를 접근하는 방식이 다 다르기 때문) 정규표현식을 직접 실험해 볼 수 있는 사이트가 있습니다. Expression Flag를 지정할 수 있으며, References도 잘 나와있기 때문에 해..

COMPUTER SCIENCE 2022.09.02

NLP / Matching the Blanks: Distributional Similarity for Relation Learning 논문 요약

Matching the Blanks: Distributional Similarity for Relation Learning 논문 원문 : https://arxiv.org/pdf/1906.03158.pdf prerequirement transformer neural network architecture에 대한 기본 지식이 있어야합니다! - entity pair의 관계를 encoding하는 부분..! Abstract 기존의 일반적인 General purpose relation extractors 는 Information extraction(이하 IE)의 주요한 목표였습니다. 다만 generalize 능력의 한계가 있어왔습니다. 해당 논문에서는 관계에 대한 extensions of Harris’ distrib..

MACHINE LEARNING 2022.08.28

NLP / BERT vs GPT 모델 비교

GPT 와 Bert 두 모델 모두 Transformer를 기반으로 pretraining 기법이 사용된 모델이라고 볼 수 있습니다. Transformer ➡️ 아주 유명한 논문이 있습니다. (22.08.09 기준 약 48000회의 인용수를 보여주고 있음....) https://arxiv.org/pdf/1706.03762.pdf - Attention Is All You Need Transformer에 대한 사전 이해가 있어야 합니다. BERT(Bidirectional Encoder Representations from Transformers) BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding ➡️ https://..

Telegram / 텔레그램 봇으로 웹 상 변화감지 알람 만들기 (Python)

Theme Python telegram 모듈을 사용해 웹 상 변화 감지 알람을 만들어 보겠습니다. pre-requirement #telegram #pip $pip install python-telegram-bot #conda $conda install -c conda-forge python-telegram-bot #bs4 #pip $pip install beautifulsoup4 #conda $conda install -c anaconda beautifulsoup4 #requests #pip $pip install requests #conda $conda install -c anaconda requests Component telebot logs : 변화 기록 scrapper : 해당 페이지 클래스 모듈..

PYTHON/ETC 2022.08.08

Container 개념 및 Docker

Container(컨테이너) : 어떤 환경에서나 실행하기 위해 필요한 모든 요소를 포함하는 소프트웨어 패키지 컨테이너는 운영체제를 가상화하여 프라이빗 데이터 센터에서 퍼블릭 클라우드 또는 개발자 로컬 환경에 이르기 까지 어디서나 실행됩니다. 컨테이너화를 통해 신속한 작업, 효율적인 소프트웨어 배포가 가능합니다. 좀 더 깊게 개념적으로 접근하면, 컨테이너는 운영체제 수준에서 CPU, 메모리, 스토리지, 네트워크 리소스를 쉽게 공유할 수 있게 해주며 컨테이너가 실제로 실행되는 환경에서 애플리케이션을 추상화할 수 있는 논리 패키징 메커니즘을 제공합니다. 이점 책임 분리 개발자는 로직과 항목 종속에만 집중할 수 있고, 운영팀은 특정 소프트웨어 세부 요소 대신 배포 및 관리에에 집중할 수 있습니다. 워크로드 이동..

COMPUTER SCIENCE 2022.08.08

CS / 객체지향(Object Oriented)의 특징 4가지

객체지향언어 : Object Oriented Language (OOL) 객체 지향 프로그래밍은 컴퓨터 프로그래밍의 패러다임 중 하나입니다. "객체" 들의 모임으로 프로그램을 파악하고자 하는 관점인데, 이 때 각각의 객체는 메세지를 주고받고 데이터를 처리합니다. 객체 지향 프로그래밍의 특징으로는 프로그램을 유연하게 만들 수 있다. 변경을 쉽게 만들 수 있다. 개발과 보수가 간편하다 직관적인 코드 분석이 가능하다 등이 있습니다. 소프트웨어 공학의 관점에서 볼 때 소프트웨어의 질을 향상하기 위해선 강한 응집력(Strong Cohesion)과 약한 결합력(Weak Coupling)을 지향해야합니다. 객체 지향 프로그래밍(OOP)의 경우 하나의 문제 해결을 위한 데이터를 클래스에 모아 놓은 데이터형을 사용함으로써..

COMPUTER SCIENCE 2022.08.07

BIDAF / Bidirectional Attention Flow for Machine Comprehension 논문 요약

논문링크: https://arxiv.org/abs/1611.01603 Bidirectional Attention Flow for Machine Comprehension Machine comprehension (MC), answering a query about a given context paragraph, requires modeling complex interactions between the context and the query. Recently, attention mechanisms have been successfully extended to MC. Typically these methods use atten arxiv.org Abstract Machine Comprehension(이하 MC)..

GITHUB License / open source repository 라이센스 차이

오픈소스의 사용 목적 및 용도에 따라 라이센스를 확인하고 사용할 필요가 있습니다. 오픈소스에 해당하는 라이센스의 최소한의 정의를 위해 OSD(Open Source Definition)을 정해두고 이에 따라 인증, 관리를 하고 있다고 합니다. 우리가 주로 접하게 될 라이센스의 종류에는 무엇이 있고 어떤 특징과 차이점이 있는지 알아보겠습니다. GNU General Public License(GPL) 2.0 GPL 이라고 불리는 해당 라이센스는 가장 많은 오픈소스가 채택하고 있는 라이센스입니다. 지켜야 할 의무사항이 다른 라이센스와 비교했을 때 비교적 엄격한 편에 속합니다. 소프트웨어를 해당 라이센스를 사용해서 배포할 경우 GPL에 의해 배포된다고 명시해야합니다. 소프트웨어를 수정하거나 새로운 소프트웨어를 병..

COMPUTER SCIENCE 2022.08.07
반응형