목록분류 전체보기 (20)
IT Dictionary
라즈베리파이 영상 전송 저번주까지 라즈베리파이를 활용하여 영상을 촬영하고 이를 mp4로 변환하는 과정을 완료하였습니다. 이제 이 mp4영상을 로컬 데스크탑으로 옮겨주면 되기 때문에 samba라는 프로그램을 사용해보겠습니다. Samba 리눅스, 유닉스, OpenVMS, OS/2 등 다양한 운영 체계에 설치되는 공통 인터넷 파일 시스템 클라이언트/서버 프로그램 먼저, ip가 유동적으로 할당되지 않기 위해 고정 ip를 설정한다. blog.dalso.org/raspberry-pi/raspberry-pi-4/7496 라즈베리파이4 고정 IP 할당하기(GUI, CLI) - 달소씨의 하루 기본적으로 라즈베리파이4에 랜선 or wifi에 연결하게되면 dhcp를 통해 IP를 자동으로 할당받게된다. 그래서 원하는 ip를 ..
정규화 일반적으로 선형회귀를 구현해보면 과소적합(underfit) 과 과적합(overfit)을 마주칠 수 있다. 과소적합은 분산이 낮고 편향이 높아 가설함수가 너무 간단해 데이터를 설명하기 부족한 경우, 과적합은 분산이 높고 편향이 낮아 가설함수가 너무 복잡해 test data에서의 일관성이 없는 경우이다. 과소적합은 다항회귀등과 같이 복잡한 모델을 써서 방지할 수 있고 과적합은 정규화를 사용해 줄 수 있다. # 다항회귀에서 항변환을 하면서 헷갈렸던 점을 적어보면 속성이 6개라고 6차항 변환을 해주는 게 아니고 차수는 우리가 정해줄 수 있다. 여기서 정규화는 L1 (Lasso) L2 (Ridge) 모델이 있고 세타값을 가설함수에 추가한 형태이다. L1 regularization L1 은 절대값을 취해준 ..
로컬과 리모트 repository 관련 커맨드 git fetch - git pull은 자동 머지이기 때문에 fetch를 사용한다면 가져오기만 하고 파일을 확인할 수 있다. 이 때 diff 등으로 차이점을 확인하고 merge를 사용할 수 있다. git blame 파일 - 커밋의 정보들을 확인 git show 커밋아이디 - 해당 커밋의 상세정보 git revert - 이미 리모트에 올라간 커밋의 경우, revert를 통해 바로 이전으로 돌아간 새로운 커밋이 생성된다. 로컬에서만 작업했다면 git reset 사용 git revert 아이디..아이디 - 앞에 아이디 제외하고 다음범위부터 뒤에 아이디까지 커밋을 취소한 형태로 돌아간다.
분류 지도학습 중 분류는 회귀 모델과 달리 비연속적인 값으로 예측하는 방법이다. 선형회귀를 통해서도 분류가 가능하지만 이상치에 대해 민감하기 때문에 분류에는 적합하지 않다. 로지스틱 회귀 따라서 이때 로지스틱 회귀를 사용하는데 이 때 시그모이드 함수를 이용한다. 시그모이드 함수는 함수값이 0 과 1 사이로 리턴되는 함수 이 때 값이 0과 1사이의 연속적인 값이므로 회귀이지만 분류에 사용된다. 가설함수 선형회귀에서의 가설함수를 행렬로 표현한 식을 확장하면 로지스틱 회귀의 가설함수가 된다. 로지스틱 회귀 또한 세타값을 조절하여 데이터에 잘 맞는 함수를 찾는 것이기 때문에 시그모이드 함수에 선형회귀 가설함수를 input한 형태가 가설함수가 된다.
정규방정식 최소 제곱법에 의해 추정값을 얻기 위한 연립방정식 -국어사전- 우리는 단순선형회귀 또는 다중선형회귀에서 경사하강을 통해 최적값을 찾아낼 수 있었다. 하지만 선형회귀에서는 정규방정식이라는 다른 방법이 존재한다. 간단하게 말하면 미분값이 0인 지점을 바로 찾는 방법이다. 이러한 정규방정식의 해는 행렬로 아래 공식이 유도된다. 일반적으로 정규방정식은 데이터가 많아지면 연산이 많아지기 때문에 각자의 장단점을 파악하여 데이터가 많으면 경사하강을 사용하는 것이 좋다. Convex 함수 선형회귀는 손실함수가 아래로 볼록한 Convex 함수였기 때문에 경사하강과 정규방정식이 가능할 수 있었다.
Git branch branch 란 나무의 '가지'라는 의미로 우리가 깃을 사용하여 형상관리 하는 것을 하나의 나무로 생각해볼 수 있다. 버전마다 달라지는 코드를 브랜치를 활용하여 효과적으로 관리가 가능하다. 브랜치 관련 git 명령어 생성 및 이동 git branch test -> test 라는 브랜치 생성 git checkout test -> test 브랜치로 이동 git checkout -b test -> test브랜치 생성 후 바로 이동 git branch -d test -> test 브랜치 삭제 브랜치 확인 git branch 브랜치 merge 우리가 만약 브랜치를 사용한다면 한 번 작성한 내용을 merge 를 사용하면 자동으로 동기화 시킬 수 있다. git merge test -> 현재 브랜치..
선형 회귀 지도학습 알고리즘으로 데이터를 통해 최적선을 찾아내는 방법이라고 할 수 있다. 맞추려고 하는 값 - 목표변수(target) 사용하는 값 - 입력변수(input) 가설함수 최적선을 찾기 위해 시도해보는 함수라고 할 수 있고 이 가설함수가 좋은지를 판단하기 위해 MSE가 사용될 수 있다. MSE(Mean Squared Error) MSE는 추정회귀선과 실제값과의 차이인 오차의 제곱 평균이다. 제곱을 하는 이유는 오차가 양수 또는 음수로 나타나기 때문에 오차가 클 수록 부각되기 때문에 -> MSE 가 클수록 오차가 크다고 할 수 있다. 손실함수 설정한 가설함수를 평가하는 함수라고 할 수 있고 손실함수의 아웃풋이 작을수록 가설함수의 손실이 적다. 따라서, 더 좋은 가설함수라고 할 수 있게 된다. 보통..
머신러닝이란 일반 프로그램과 달리 작업을 하는데 있어 경험을 통해 성능이 향상된다. 여기서 경험은 데이터를 통해 이루어진다. 따라서, 데이터의 수가 기하급수적으로 늘어나는 2010년대부터 머신러닝이 활용되기 시작했다. 빅데이터,머신러닝,딥러닝,인공지능은 모두 연관되어 있어 비슷하다고 할 수 있다. 학습유형 지도학습(supervised learning) 답 이 있고 이 답을 맞추는 게 목적 - 분류(classfication) 와 회귀(regression) 비지도학습(unsupervised learning) 답 이 없고 이 답을 맞추는 게 목적 머신러닝에서의 수학 선형대수학 데이터를 저장하고 계산하는 행렬을 이용 미적분학 알고리즘의 성능 최적화 확률과 통계 데이터의 흐름과 정보 파악을 통해 예측하고 가능성을..