일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 빅데이터를 지탱하는 기술
- Hortonworks Sandbox
- leetcode 819
- leetcode 5
- MapReduce 실습
- Python
- 데이터레이크와 데이터웨어하우스
- airflow docker
- 컴퓨터구조
- webcrawler
- 블로그 이전했어요
- leetcode125
- ctf-d
- leetcode 234
- leetcode 937
- Hadoop
- leetcode 344
- 문자열 조작
- docker로 airflow 설치하기
- 스파크 완벽 가이드
- 배열
- leetcode
- 머신러닝
- leetcode 15
- leetcode 561
- wargame.kr
- leetcode 238
- leetcode 121
- leetcode 49
- 올바른 변수명 짓기
- Today
- Total
목록Study (61)
HyeM
06_1 신경망 알고리즘을 백터화하여 한 번에 전체 샘플을 사용합니다 사이킷런의 예제 데이터 세트는 2차원 배열로 저장되어 있다. 2차원 배열은 행을 햄플, 열을 특성으로 생각하면 행렬로 이해할 수 있다. 이번에는 행렬 개념을 신경망 알고리즘에 도입해 본다. 백터화 된 연산은 알고리즘의 성능을 올린다. 행렬 연산을 백터화 연산이라고 하는데, 백터화 된 연산은 알고리즘의 성능을 높일 수 있다. 배치 경사 하강법을 SingleLayer 클래스에 적용하면 백터화된 연산을 사용할 수 있다. 이전까지의 실습에서는 경사 하강법 알고리즘들이 알고지름을 1번 반복할 때 1개의 샘플을 사용하는 '확률적 경사 하강법'을 이용했다. 이는 손실 함수의 전역 최솟값을 불안정하게 찾는다. 하지만 배치 경사 하강법은 가중치를 1번..
05-3. 규제 방법을 배우고 단일층 신경망에 적용합니다 규제 : 과대적합을 해결하기 위한 대표적인 방법 - 가중치를 규제하면 모델의 일반화 성능이 올라감 - 가중치를 제한하면 모델이 몇 개의 데이터에 집착하지 않아 일반화 성능을 높일 수 있음 - 대표적인 규제 기법에는 L1 규제와 L2 규제가 있음 - L2 규제가 더 효과가 좋아 널리 사용됨 L1 규제 : 라쏘 모델 w_grad += alpha * np.sign(w) L2 규제 : 릿지 모델 w_grad += alpha * w 대표적인 규제기법인 L1규제와 L2 규제를 살펴보고, SingleLayer 클래스에 적용시켜보자. class SingleLayer: ''' 그레이디언트 업데이트 수식에 패널티 항 반영하기 : L1, l2 규제의 강도를 조절하는 ..
CH 05-1 검증 세트를 나누고 전처리 과정을 배웁니다. 1. 테스트 세트로 모델을 튜닝하기 from sklearn.datasets import load_breast_cancer from sklearn.model_selection import train_test_split from sklearn.linear_model import SGDClassifier import numpy as np #1. cancer 데이터 읽어들여 훈련 세트와 테스트 세트로 나누기 cancer = load_breast_cancer() x = cancer.data y = cancer.target x_train_all, x_test, y_train_all, y_test = train_test_split(x, y, stratify=..
네트워크 계층 전송 단위 : 패킷 패킷 단위를 처리하는 대표적인 장치 : 라우터 네트워크 계층에서 나타나는 공격 : 랜드 공격, 티얼드롭 공격, ICMP 플러딩, ICMP 스머핑 등 * IP 스푸핑 : 출발지 IP 주소를 조작해 자신을 은폐하는 공격 랜드 공격 : - IP 스푸핑 공격을 변형한 기법, - 출발지 IP 주소를 목적지 IP주소와 동일하게 설정하여 공격 대상자에게 전송함. 이는 공격 대상자는 ICMP 패킷을 자신에게 보내게 됨. - 이는 인위적인 과부화를 유발케 하는 플러딩 공격에 해당됨 - 현재 OS에서는 출발지 IP 주소와 목적지 IP주소가 동일할 경우에는 해당 패킷을 커널차원에서 차단해 방어함 티얼드롭 공격: - 패킷 분할 속성을 이용한 기법으로, 플러딩 공격의 일종임 - 공격자가 아래와..
04_4 분류용 데이터 세트 준비 유방암 데이터 세트 준비 1. load_breast_cancer() 함수 호출 from sklearn.datasets import load_breast_cancer cancer = load_breast_cancer() 2. 입력데이터 확인하기 입력데이터 data와 target 살펴보기 print(cancer.data.shape, cancer.target.shape) 569개 샘플과 30개 특성이 있음 특성이 30개 이므로, 산점도로는 표현하기 어려우니, 박스 플롯으로 각 특성의 사분위를 나타내보기 3. 박스 플롯으로 특성의 사분위 관찰하기 4, 14, 24번째 특성이 다른 값에 비해 분포가 더 큼 4. 눈에 띄는 특성 살펴보기 5. 타깃 데이터 확인하기 타깃데이터는 음성..
04-1 | 초기 인공지능 알고리즘과 로지스틱 회귀를 알아봅니다 . #1. 퍼셉트론 1957년 이진 분류 문제에서 최적의 가중치를 학습하는 퍼셉트론 알고리즘 발표 * 이진 분류 : 임의의 샘플 데이터를 True나 False로 구분하는 문제 직선 방정식을 사용해 선형 회귀와 유사한 구조를 띈다. 하지만 마지막 단계에서 샘플을 이진 분류하기 위해 계단 함수를 사용하고, 계단 함수를 통과한 값을 다시 가중치와 절편으로 업데이트(학습)하는데 사용함. 계단함수는 x가 0보다 크거나 같으면 1로, 0보다 작으면 -1로 분류한다, 즉, 퍼셉트론은 선형함수를 통과한 값 z를 계단 함수로 보내 0보다 큰지 작은지 검사하여 1과 -1로 분류하는 아주 간단한 알고리즘이다. 만약 여러개의 특성 n개를 사용한다면, 선형함수를 ..
지난 단원 복습 - 훈련 데이터 x[n]에 대한 w의 변화율(w_rate)은 x[n]이다. - 가중치 w를 업데이트 하는 방법은 w + w_rate이다. - 절편 b를 업데이트 하기 위해서는 b + 1이다. - 오차 역전파는 y와 y^의 오차(err)를 이용해 가중치와(w)와 절편(b)를 업데이트하는 방법이다. 3-3 | 손실 함수와 경사 하강법의 관계를 알아봅니다. # 손실함수와 경사하강법 손실 함수 예상한 값과 실제 타깃값의 차이를 함수로 정의한 것 경사 하강법 어떤 손실 함수가 정의되었을때, 손실 함수의 최소가 되는 지점을 찾아가는 방법 + 앞에서 '오차를 변화율에 곱하여 가중치와 절편 업데이트하기'는 '제곱 오차'라는 손실 함수를 미분한 것과 같음 # 제곱 오차 제곱 오차를 수식으로 나타내면 다음..
1장. TCP/IP 방식의 계층적 구조 01 | 배경 전송과 제어라는 통신의 기본 내용을 인터넷 공간에서 구현하기 위한 구조로 등장한 개념이 TCP/IP 프로토콜*이다. *프로토콜(protocol) : 호스트와 호스트 사이에서 사용하는 일종의 언어와 같은 개념. 수신자와 송신자가 동일하게 설정해야 통신 가능함. ISO 기구에서 프로토콜을 통합하기 위해 OSI 프로토콜 만들었다. 02 | TCP/IP 계층* ▶ TCP/IP 계층 * 계층 : 비음성 통신에서 데이터를 전송하기 위한 일련의 과정이나 단계, 해당 프로토콜에 따라 데이터 전송 시, 모든 단계를 거친다. TCP/IP는 총 4개의 계층으로 구성되고, 응용 계층(상위계층) ---> 물리계층 (하위계층) 으로 내려갈수록 물리적이고 구체적이다. 또한 일련..