일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- airflow docker
- 머신러닝
- 올바른 변수명 짓기
- leetcode 5
- docker로 airflow 설치하기
- Python
- webcrawler
- leetcode
- 빅데이터를 지탱하는 기술
- leetcode 238
- leetcode 937
- leetcode 344
- leetcode 121
- leetcode 234
- Hortonworks Sandbox
- ctf-d
- leetcode 49
- 블로그 이전했어요
- 스파크 완벽 가이드
- 배열
- wargame.kr
- leetcode 561
- leetcode125
- Hadoop
- leetcode 15
- MapReduce 실습
- 컴퓨터구조
- 문자열 조작
- 데이터레이크와 데이터웨어하우스
- leetcode 819
- Today
- Total
목록Study (61)
HyeM
서포트 벡터 머신 알고리즘 : 데이터 분포를 나누는 지도학습의 분류 지금까지도 보편적으로 사용하는, 분류를 위한 머신러닝 모델이다. 라벨이 달린 이진 분류 문제에 주로 사용된다. 01.서포트 벡터 머신 알고리즘 이해하기 각 데이터 항목을 다차원의 벡터 공간에 점으로 표시한다. 만약 2차원 공간에 있는 두 개의 그룹을 분류한다는 가정해보면. 두 그룹을 잘 구분하는 직선을 찾는 것이 서포트 벡터 머신의 핵심이다. => 서포트 벡터 머신은 데이터를 선형 또는 비선형으로 분리하는 최적의 경계를 찾는 알고리즘이다. 단계 1. 직선을 그려 그룹을 나눈다. 단계 2. 마진을 최대화하여 균형있게 나눈다. 직선을 한쪽에 치우치지 않게 양쪽 그룹 모두 균형있게 나누기 위해서, 직선식을 사이에 두고 가능하면 최대한 멀리 떨..
2부에서는 머신러닝의 기술의 유형의 특징과 차이점을 살펴보고, 지도학습과 비지도 학습의 대표적인 알고리즘을 다룬다. 이번 3장에서는 파이썬으로 의사결정나무와 서포트 벡터 머신 알고리즘을 직접 구현해보며 머신러닝 알고리즘을 이용하는 방법을 알아본다. [실무가 훤히 보이는 머신러닝&딥러닝_마창수,최재철 지음] 을 읽고 정리한 글입니다. 01. 머신러닝의 유형 머신러닝에는 지도학습, 비지도학습, 강화학습 총 3가지 유형이 있다. 각각 기술적 구현의 차이도 있고, 경우에 따라 활용하는 기술이 다르다. 지도학습 : 훈련 데이터 정답(Label)이 있어 주어진 정답에 맞게 특징이 학습되기를 기대하는 경우에 사용 비지도학습 : 훈련 데이터에 정답이 없고 주어진 특징내에서 분류간 서로 구분이 잘 되도록 나누기 원하는 ..
1장 : 인공지능이란 무엇인가 1.1 발전 - 1956년 미국의 다트머스 컨퍼런스에서 인공지능 용어 첫 등장 인간처럼 생각할 수 있는 기계 = '인공지능' - 1959년 아서 사무엘 '컴퓨터에게 배울 수 있는 능력, 즉 코드로 정의하지 않는 동작을 실행하는 능력에 대한 연구분야' = '머신러닝' 딥러닝 : 인간의 뇌 구조에서 영감을 얻은 기술로, 인간의 뇌세포와 유사한 방식으로 인공적으로 신경망을 구성하고 그 안에서 데이터를 처리함. 즉, 많은 양의 데이터를 신경망으로 유입시켜, 데이터를 정확하게 구분하도록 반복적 학습시킴. - 1957년 단순한 신경망 모델 '퍼셉트론' 개발됨. 초반에는 신경망 기반의 연구가 활발 했지만, 낮은 컴퓨팅 성능과 적은 양의 데이터로 침체기였음. 최근들어 인터넷이 보급되며 데..
MIPS 시스템 MIPS(Microprocessor without Interlocked Pipeline Stages) : 밉스 테크놀로지에서 개발한 RISC ISA(명령어 집합구조)이다. 디자인 설계 원리 규칙적인 것이 간단성을 위해 좋음 많이 발생되는 사항을 빨리 처리함 적을 수록 빠름 좋은 설계는 좋은 절충안을 요구함 각 설계 원칙을 하나씩 자세히 살펴보자. 설계원칙#1. 규칙적인 것이 간단성을 위해 좋음 " 일관성 있는 명령어 형태 같은 수의 피연산자 _ source 2개, destination 1개 " 하드웨어로 구현 쉬움 명령어 addition(+)과 subtraction(-) ex ) add a, b, c ; b와 c를 더하여 a에 저장 첫번째 오퍼랜드(a) : destination 두번째 오..
캐시기억장치 캐시기억장치 : 주기억장치(RAM) 저장된 명령어 or 데이터 일부를 임시적으로 복사해서 저장하는 장치 (임시적으로 복사 = 자주 사용하는 명령어 저장했다가 cpu에 제공) 특징 : - 주기억장치 보다 빠름 _ 명령어or 데이터 저장&인출 속도 UP - 자주 사용되는 명령어들을 캐시에 저장해두어, CPU에 빠르게 제공 - 고속완충제역할을 하는 기억장치 _ 느린 주기억장치와 빠른 중앙처리장치(CPU)사이에서 속도 차이 줄여줌 캐시 기억장치는 왜 필요할까 ?? # 만약에 없다면 ? 동작 과정 : cpu가 주기억 장치에 접근 → 주기억장치에서 정보 획득 → cpu의 명령어 레지스터 등에 저장 => SLOW 느림! (cpu -> 주기억장치 -> cpu) ~~~>비효율적임. 매번 cpu가 주기억장치에..
분기 명령어 분기 : 다른곳으로 이동하는 것 형태 : BRZ(branch if zero) 211 : 조건분기; 조건코드가 0이면 211로 분기하라는 명령어 BR 202 : 무조건분기; 무조건 202번지로 분기하라는 명령어 BRE(branch if equal) R1, R2,235 : 조건분기; 레지스터R1과 레지스터 R2이 내용이 같다면 235번지로 분기하라는 명령 명령어가 저장되어 있는 부분은 메모리의 코드 영역이다. 202 : SUB X, Y ; 203 : BRZ 211 ; 202번지의 x-y가 0이면(x와 y가 같다면), 203번지의 BRZ 211에서 분기를 할 것이다. 210 : BR 202 ; 무조건 202번지로 분기해야 된다. 225 : BRE R1, R2, 235 ; 레지스터 R1과 레지스터 ..
메모리 구조 프로그램이 운영체제로부터 할당받는 대표적인 메모리공간(RAM)의 구조 코드 영역(Code ; 택스트영역) 실행할 프로그램의 코드가 저장되는 영역 CPU는 코드영역에 저장된 명령어를 하나씩 가져가서 처리한다. - 프로그램 시작하고 끝날때 까지 메모리에 있음 - 기계어로 저장되어 있음 데이터 영역(Data) 프로그램의 전역변수와 정적변수, 문자열 상수가 저장되는 영역 - 데이터 영역은 프로그램의 시작과 함께 할당되고, 프로그램 종료시 소멸된다. - 데이터 영역은 다시 네 개의 data segment로 나뉘는데, 각각 현재 모듈의 data structure, 상위 레벨로부터 받아들이는 데이터 모듈, 동적 생성 데이터, 다른 프로그램과 공유하는 공유데이터 부분이다. 힙영역(Heap) 사용자에 의해 ..
명령어를 효과적으로 실행하기 위한 기법 주소 지정 방식 명령어 파이프라인 인터럽트 위의 3가지 방식을 하나하나 자세히 살펴보자. --- 지난 시간 --- ' [컴퓨터구조] 2주차(2)_어셈블리 프로그램 예제 中 명령어 형식 ' 에 추가 연산코드 : 함수 연산 기능, 전달 기능, 제어기능, 입출력기능 모드 : 직접번지 인지 간접번지인지 나타냄 (1bit) 오퍼랜드 : 연산을 수행하는데 필요한 데이터 혹은 데이터의 주소 (컴퓨터 마다 명령어 형식에 차이가 있음) 주소 지정방식 주소지정방식 주소 : 주기억장치에서 데이터가 저장된 위치. 주소 지정 방식 (addressing mode) : 주소를 지정하는 방식. 유효주소 : 데이터가 저장된 기억장치의 실제 주소 + 주기억장치에는 프로그램 저장되어 있음. 프로그램..