2020/12 14

포트폴리오 및 주요 경력 정리글

※ 대회 활동 ※ ▶ DACON 대회 : Competition Bronze ▶ DACON_대회_현재랭킹 : 7,650 of 39,097 ▶ DACON_대회_최고랭킹 : 6,255 ▶ DACON 코드공유 : Code Share Gold ▶ DACON_코드공유_현재랭킹 : 26 of 700 ▶ DACON_코드공유_최고랭킹 : 21 ▶ 원자력발전소 상태 판단 경진대회 DACON_School 참가 후 BEST TUTEE AWARD(From 2020.11.02 to 2020.11.30)수상 ▶ POSTECH_머신러닝을 위한 파이썬 기초 수강(From 2020.05.25 to 2020.08.31) ▶ 한양대 챗봇 이름 공모전에서 최우수상을 받은 '궁금하냥'을 제출했지만 알고보니 선착순이였다..아쉽다..ㅜ ▶ 한양대..

1. 변수(3)

1. 산술연산자 + : 더하기 - : 빼기 * : 곱하기 ** 또는 ^ : 제곱 / : 나누기 (실수부분까지 계산) %/% : 나누어 정수 부분의 몫만 취함 %% : 나눗셈의 나머지 > x = 5L > y = 4L > > print(x+y) [1] 9 > print(x-y) [1] 1 > print(x*y) [1] 20 > print(x**y) [1] 625 > print(x^y) [1] 625 > print(x/y) [1] 1.25 > print(x%/%y) [1] 1 > print(x%%y) [1] 1 2. 비교연산자 == : 같다 != : 다르다 = : 이상 > x y print(x==y) [1] FALSE > print(x!=y) [1] TRUE > print(x print..

R 2020.12.23

1. 변수(2)

1. 숫자형 실수(double)형태 정수를 대입하더라도 실수 형식으로 식별함 > num1 num1 [1] 123 > print(typeof(num1)) [1] "double" 소수점을 갖는 실수형 > num2 num2 [1] 3.14 > print(typeof(num2)) [1] "double" 정수(integer)형 > num3 num3 [1] 123 > print(typeof(num3)) [1] "integer" 2. 논리형(logical) 참(TRUE), 거짓(FALSE), 영어 대문자만 사용해야 함 > is is [1] TRUE > print(typeof(is)) [1] "logical" 3. 특수한 형태의 값 NULL(결정되지 않은 값) 데이터의 값이 아직 존재하지 않는다는 의미 > k k NU..

R 2020.12.23

1. 변수(1)

오늘은 R언어를 정리하는 첫번째 시간이다. 먼저 가장 기본인 '변수'에 대해 알아보자. 1. 변수(Variable) 다양한 값을 가지는 하나의 속성으로 데이터 분석의 대상이다. 숫자형 : 기본적으로 실수 형식, 정수로 표현하기 위해서는 숫자값 뒤에 L을 표시해야 함 논리형 : 참(TRUE), 거짓(FALSE) 중 하나를 갖는 값 문자열 : 쌍따옴표나 홑따옴표로 감싼 문장 변수를 만들 때는 왼쪽을 향한 화살표 기호

R 2020.12.23

나의 취향 노래(No.2)

John Denver - Take Me Home, Country Roads ( cover by J.Fla ) 이 노래를 어디선가 들어봤었는데 J.Fla님이 cover하신 버전을 우연히 듣게 되었다. 그래서 다시 그 기억이 새록새록 되살아났다. ^^ 뭔가 외출하고 집에 들어갈 때 들으면 2배로 행복해지는 그런 노래입니다! ㅋㅋ www.youtube.com/watch?v=rMI9xmWlk1s&list=LL&index=22 친남매가 기타 한대로 들려주는 '크리스마스 메들리(Pop + Kpop)'ㅣSiblings Singing Christmas Medley [Harryan & Yoonsoan] 이분들은 유튜브 알고리즘이 나에게 소개시켜주었다. 두분의 환상적인 콜라보가 돋보이고 음색이 너무 좋다,,!! 점점 크리..

음악 2020.12.21

나의 취향 노래(NO.1)

붓소핸섭-ButsoHandsUp & 이다은 Testify to Love(사랑을 증거하리) Covered by 조셉 붓소(Joseph Butso) : 개인적으로 최근에 감동받은 찬양이다.! 정말 주님의 사랑을 널리 알리고 증거해야겠다는 마음이 샘솟는다.! 최고의 공급자 (Greatest Provider) Covered by 조셉 붓소(Joseph Butso) X 이다은 : '이다은'이라는 분이 작곡하신 자작곡이다. 정말 은혜롭고 가사가 완전 내 스타일이다!!ㅎㅎ 이외에도 붓소핸섭 채널에는 감동적이고 은혜로운 찬양이 흘러 넘친다. 이분의 찬양을 통해 삶의 예배를 회복하는 계기가 되었으면 좋겠습니당..! 행복의 비결-이다은 : 이 노래는 처음에 어디서 많이 들어본듯한 멜로디가 들렸다. 뭔지 뭔지 하다가 결국 ..

음악 2020.12.19

Generalization and Overfitting(No.2)

- Test set은 주로 전체 데이터의 10~30%정도로 설정한다. - Training data를 가지고 error를 확인하고 Validation set을 가지고 오류를 검증한다. - 회귀(Regression)해결 방법 회귀란? Real Number로 결과값을 예측하는 것 방법1 : 데이터 전 처리 - Normalize 실제 결과값을 Normalize하는 것이다. 예를 들어, 실제 결과값의 범위가 [0~100]이라 하면 전처리(Normalize)했을 때 [0~1]로 결과값의 범위를 바꿀 수 있다. 이제 [0~1]의 범위로 바뀌었으므로 Sigmoid함수에 넣어서 출력할 수 있다! 방법2 : 출력층(Output layers)의 선형으로 출력 선형으로 출력한다는 것은 활성화함수에 값을 통과시키지 않고 (입력..

ML&DL 2020.12.19

Generalization and Overfitting(No.1)

딥러닝에서의 'Generalization and Overfitting'에 관한 내용입니다.! - 학습을 시키는 이유 1. data를 잘 기억하기 위해 2. unknown data에 대한 예측을 위해 - 많은 양의 학습데이터 사용은 현실적으로 힘들다. - unknown data를 잘 예측하기 위해서는 이미 주어진 training data의 패턴을 잘 학습해서 일반화된 모델을 만드는 Generalization을 잘해야 한다. - iteration : 반복횟수 - iteration이 1751부터 3501사이에서 Error값이 급격히 감소한다. - 7000번 정도에서 학습을 멈추는 것이 좋다. - 10000번까지 가면 noise가 포함된 데이터들까지 학습시키게 되므로 예측값도 이상해질 수 있다. 즉, overf..

ML&DL 2020.12.18

AI를 위한 기초수학!

오늘은 훌륭한 AI 개발자가 되려면 필요하고 DL/ML을 잘 이해하려면 필수적인 수학지식에 대해 이야기 합니다! 먼저 대학교 1학년 수준의 미분적분학 개념이 필요하고 선형대수와 통계 이 세가지 정도는 필수입니다! 아래 표는 위에서 말한 수학 지식을 혼자 공부하기 막막한 분들을 위한 추천 강의와 자료들입니다! 종류 site 수강 방법 기초 확률 및 통계 https://www.youtube.com/playlist?list=PLSN_PltQeOyjmRIsC7VNirXOBqWoypd4V 사이트 접속 후 1장부터 순차적으로 수강 미분적분학 https://www.khanacademy.org/math/multivariable-calculus 사이트 접속 -> Multivariable Calculus 내 Cousre ..

ML&DL 2020.12.18

통계학 개론(Tips + 잘못된 통계학 지식 바로잡기)

이 글이 데이터 분석을 할 때 필요한 지식이라 생각된다. 데이터 분석 후 결과해석을 할 때 잘못된 해석을 방지하기 위해 미리 통계학을 제대로 알자!! (혹시 저의 지식에 잘못된 부분이 있다면 댓글 부탁드립니다~) 평균 vs 중앙값 -> 많이 다르면 분포가 치우친다. 데이터 분석하기전에 미리 두가지 값을 구해서 비교해보자. 사분위수 : 프로그래밍 언어에 따라 다르다.(R, Python, ...). 연속형에서는 사분위수가 문제가 되지 않는다. 하지만 이산형의 경우 사분위수안에 포함된 데이터 수가 달라질 수 있기 때문에 좋은 지표가 되지는 못한다. 표본분산을 (n-1)로 나누는 이유 : n으로 나눌때보다 (n-1)로 나눌때 통계적으로 더 좋은 성질을 가진다. n으로 나누면 표본분산 ≠ 모집단 분산 (Bcs 표..

Statistics 2020.12.06