반응형

분류 전체보기 60

Sequence Modeling : Recurrent & Recursive Nets as introduction

Keyword Parameter sharing Sequence Back-propagation through time (BPTT) * this post is based on "Deep Learning" by Ian goodfellow with my own opinion. Intro a recurrent nueral network is a neural network that is speialized for processing a seqeunce of values x(1),x(2)...x(i). Parameter sharing makes it possible to extend and apply the model to examples of different forms(different lengths..) and..

Attention / 어텐션이란 무엇인가? (분량 주의)

선행 지식 (Pre-requirement) RNN https://wikidocs.net/22886 - (딥러닝을 이용한 자연어 처리 입문) https://arxiv.org/abs/1808.03314 - (RNN paper) LSTM https://wikidocs.net/22888 - (딥러닝을 이용한 자연어 처리 입문) http://www.bioinf.jku.at/publications/older/2604.pdf - (LSTM paper) seq2seq model https://wikidocs.net/24996 - (딥러닝을 이용한 자연어 처리 입문) https://arxiv.org/abs/1409.3215 - (seq2seq paper) "딥러닝을 이용한 자연어 처리 입문" 이라는 매우 좋은 책에 접근..

알고리즘 문제풀이 TIP / ios::sync_with_stdio, cin.tie

알고리즘 문제는 대부분 시간 제한이 있습니다. 온라인 저지 시스템에서 시간 제한은 특정한 조건(최악의 수)에서 특정한 시간(제한 시간)내로 알고리즘이 동작하는 가를 판단하기 위해 존재합니다. 사용하는 언어에 따라서도 시간이 차이가 납니다. (해당 포스트는 c++을 기준으로 작성되었습니다.) 시간복잡도에 관한 아티클은 매우 많으니 해당 글을 참고해주시면 감사하겠습니다. 추천: https://stackoverflow.com/questions/11032015/how-can-i-find-the-time-complexity-of-an-algorithm How can I find the time complexity of an algorithm? I have gone through Google and Stack Ov..

ALGORITHM 2023.01.04

Word2Vec 개념 정리

기존에 존재하던 one hot vector 형식의 matrix는 word vector간의 유의미한 유사도를 구하는 것이 제한되었다. (Sparse representation) 따라서 다음과 같은 개념이 등장하게 된다. 단어의 의미를 다차원 벡터 공간에 띄우는 개념 : 분산표현 (distributed representation) 분산 표현을 통한 단어 간 의미적 유사성을 벡터화 : 워드 임베딩 (word embedding) -> 임베딩 벡터 (embedding vector) 분산 표현 (distributed representation) 분산 가설(distributional hypothesis) 아래에서 정의된 해당 표현 방식은 분산 가설을 통해 텍스트의 의미를 학습하며, 단어의 의미를 벡터에 여러 차원에 ..

MACHINE LEARNING 2022.12.30

Few-Shot Learning? 관련 논문을 중심으로 이해해보자!

Few-Shot Learning에 대해 매우 함축적으로 간결히 잘 정리된 문구가 있어서 소개하고 시작하겠다. Few Shot Learning : example of meta-learning, where is trained on several related task, during the meta-training phase, so that it can generalize well to unseen (but related) tasks with just few examples, during the meta-testing phase. An effective approach to the Few-Shot Learning problem is to learn a commmon representation for vario..

BART 논문 리뷰 / BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension

BART 논문 리뷰 paper source : https://arxiv.org/abs/1910.13461 BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension We present BART, a denoising autoencoder for pretraining sequence-to-sequence models. BART is trained by (1) corrupting text with an arbitrary noising function, and (2) learning a model to reconstruct the original text. It us..

Node.js / 간단 정리

전역 변수 전역 변수 : 모든 곳에서 사용할 수 있는 변수 문자열 자료형의 전역 변수 __filename : 현재 실행 중인 코드의 파일 경로 __dirname : 현재 실행 중인 코드의 폴더 경로 process 객체의 속성과 이벤트 process 객체 : 현재 실행 중인 노드 프로세스에 대한 정보를 담고 있는 객체 노드 : 이벤트 기반의 비동기 I/O를 가진 자바스크립트 런타임 process 객체의 속성 속성 설명 process.env 컴퓨터 환경 정보를 나타냄 process.version Node.js 버전 process.versions Node.js와 종속된 프로그램 버전 process.arch 프로세서의 아키텍처를 나타냄 process.platform 플랫폼을 나타냄 process.connect..

JAVASCRIPT/NODE JS 2022.10.10

JS / Hoisting 호이스팅 개념 정리

Hoisting : 호이스팅 Interpreter(javascript engine)가 변수와 함수의 메모리 공간을 선언 전에 미리 할당하는 것 많은 사람들이 호이스팅을 "코드를 실행하기 전 변수 및 함수 선언을 해당 스코프의 최상단으로 끌어올리는 것" 이라고 알고 있지만 해당 문장은 잘못된 이해이다. 정확히 하자면 다음과 같다. "코드를 실행하기 전 변수 및 함수 선언을 해당 스코프의 최상단으로 끌어올리는 것처럼 보이는 것" 위에서 정의한 것 처럼 메모리 공간을 선언 전에 '미리' 할당하기 때문에 해당 스코프의 최상단으로 끌어올리는 것 처럼 보인다. 자바스크립트의 모든 선언에는 호이스팅이 발생하는데, 다음을 이용한 선언문은 호이스팅이 일어나지 않은 것 처럼 보인다. let const class 예를 들어..

JAVASCRIPT/BASIC 2022.09.22

ML / 3가지 주요 원칙

ML 3가지 주요 원칙 Machine Learning을 이용해 데이터를 학습시킬 때엔 아무렇게나 막 하면 안되겠죠.. 그래서 우리가 지켜야 할 가이드라인을 크게 3가지로 분류합니다. Occam's Razor : 오캄의 면도날 Sampling Bias : 표본 편향 Data Snooping Bias : 데이터 스누핑 편향 Occam's Razor 일반적으로 오캄의 면도날이라고 불리는 해당 원칙은 흔히들 lex parsimoniae, 검약의 원리라고도 부르곤 합니다. 말이 참 어려운데.. Occam의 저서에 나온 문구를 통해 쉽게 이해해보겠습니다. Pluralitas non est ponenda sine neccesitate. 해당 문구는 라틴어로, "많은 것들을 필요없이 가정해서는 안된다"는 의미를 지닙니..

MACHINE LEARNING 2022.09.16
반응형