일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 블로그 이전했어요
- docker로 airflow 설치하기
- webcrawler
- leetcode 5
- Hadoop
- airflow docker
- 올바른 변수명 짓기
- leetcode 121
- leetcode 561
- ctf-d
- 머신러닝
- leetcode 238
- 데이터레이크와 데이터웨어하우스
- leetcode 937
- leetcode
- Hortonworks Sandbox
- 배열
- leetcode 344
- MapReduce 실습
- 스파크 완벽 가이드
- wargame.kr
- leetcode 15
- leetcode125
- 문자열 조작
- leetcode 49
- Python
- leetcode 819
- 빅데이터를 지탱하는 기술
- 컴퓨터구조
- leetcode 234
Archives
- Today
- Total
목록파이썬문장유사도 (1)
HyeM
6부_5장 N-gram으로 문장유사도 분석하기
01. 문장의 유사도 분석 어떤 두 문장(또는 단어)이 비슷한지, 서로 관련있는 문장인지 분석해본다. 방법 : 레벤슈타인 거리 계산, n-gram 사용 02. 레벤슈타인 거리 레벤슈타인 거리 (편집거리): 두 개의 문자열이 어느 정도 다른지 나타내는 것 예시_ "가나다라"와 "가마바라"는 얼마나 유사할까? -> "가나다라"를 가마바라"로 편집할 때 몇 번의 문자열 조작이 필요할지로 단어의 거리를 구한다. 횟수 편집 조작 결과 0 - 가나다라 1 "나"를 "마"로 변환 가마다라 2 "다"를 "바"로 변환 가마바라 문자열 조작을 나타낸 표에 따라, 문자열을 조작하기 위해선 2번의 조작이 필요하다. => 편집비용(조작횟수)는 2이고, 2는 레벤슈타인 거리이다. [실습1]_ 파이썬으로 레벤슈타인 거리를 계산하는..
Study/AI&DeepLearning
2020. 8. 4. 02:06